“大数据智能-调研考察”版本间的差异
来自iCenter Wiki
(→考察内容:) |
|||
第17行: | 第17行: | ||
1,语音识别 | 1,语音识别 | ||
− | + | 从2016年3月份至今,开发小不点产品。从2016年8月至今,采用Deepspeech2的方案完成的中文识别系统。 | |
decoding采用beam search + pruning。 | decoding采用beam search + pruning。 | ||
第29行: | 第29行: | ||
2,深度学习 | 2,深度学习 | ||
− | KTQueue, deep learning job在GPU | + | KTQueue, deep learning job在GPU server上调度系统。 |
采用Pascal 系列GPU server。Pascal卡成本1200$. | 采用Pascal 系列GPU server。Pascal卡成本1200$. | ||
第42行: | 第42行: | ||
3,自然语言处理 | 3,自然语言处理 | ||
− | |||
==联系人:== | ==联系人:== |
2017年4月18日 (二) 13:21的版本
奇点机智
地点:
鼎好A座3楼太库孵化器
时间:
4月18日周二下午1点15分左右从清华出发,一同去奇点机智调研。
考察内容:
公司理念:手机操作人人平等
1,语音识别
从2016年3月份至今,开发小不点产品。从2016年8月至今,采用Deepspeech2的方案完成的中文识别系统。
decoding采用beam search + pruning。
语音识别可以YouTube的音频字幕数据。训练用2千多小时的数据,5~7层网络,训练一周时间。
与Deepspeech2相比,汉字2万多字,常用7000字,用softmax代价还是太高。因此采用400 pinyin输出。
语音识别是一个难的问题:Rich diversity + ambiguity。
2,深度学习
KTQueue, deep learning job在GPU server上调度系统。
采用Pascal 系列GPU server。Pascal卡成本1200$.
Inference侧强调latency和power;
Train侧强调throughput和performance。
TPU是给市场inject balance。
协处理器成功的只有两个DSP和Video卡。做硬件是需要一个生态外围的。
3,自然语言处理
联系人:
刘家骅: 15120003855