“大数据智能-调研考察”版本间的差异
来自iCenter Wiki
第12行: | 第12行: | ||
==考察内容:== | ==考察内容:== | ||
+ | |||
+ | 公司理念:手机操作人人平等 | ||
+ | |||
1,语音识别 | 1,语音识别 | ||
+ | 从去年3月份至今,采用Deepspeech2的方案完成的中文识别系统。 | ||
+ | |||
+ | decoding采用beam search + pruning。 | ||
+ | |||
+ | 语音识别可以YouTube的音频字幕数据。训练用2千多小时的数据,5~7层网络,训练一周时间。 | ||
+ | |||
+ | 与Deepspeech2相比,汉字2万多字,常用7000字,用softmax代价还是太高。因此采用400 pinyin输出。 | ||
+ | |||
+ | 语音识别是一个难的问题:Rich diversity + ambiguity。 | ||
2,深度学习 | 2,深度学习 | ||
+ | |||
+ | KTQueue, deep learning job在GPU server上调度系统 | ||
+ | |||
+ | 采用Pascal 系列GPU server。Pascal卡成本1200$. | ||
+ | |||
+ | Inference侧强调latency和power; | ||
+ | |||
+ | Train侧强调throughput和performance。 | ||
+ | |||
+ | TPU是给市场inject balance。 | ||
+ | |||
+ | 协处理器成功的只有两个DSP和Video卡。做硬件是需要一个生态外围的。 | ||
3,自然语言处理 | 3,自然语言处理 | ||
+ | |||
==联系人:== | ==联系人:== | ||
刘家骅: 15120003855 | 刘家骅: 15120003855 | ||
+ | |||
+ | =驭光科技= | ||
+ | |||
+ | ==地点== | ||
+ | |||
+ | ==时间== | ||
+ | |||
+ | ==考察内容== |
2017年4月18日 (二) 13:20的版本
奇点机智
地点:
鼎好A座3楼太库孵化器
时间:
4月18日周二下午1点15分左右从清华出发,一同去奇点机智调研。
考察内容:
公司理念:手机操作人人平等
1,语音识别
从去年3月份至今,采用Deepspeech2的方案完成的中文识别系统。
decoding采用beam search + pruning。
语音识别可以YouTube的音频字幕数据。训练用2千多小时的数据,5~7层网络,训练一周时间。
与Deepspeech2相比,汉字2万多字,常用7000字,用softmax代价还是太高。因此采用400 pinyin输出。
语音识别是一个难的问题:Rich diversity + ambiguity。
2,深度学习
KTQueue, deep learning job在GPU server上调度系统
采用Pascal 系列GPU server。Pascal卡成本1200$.
Inference侧强调latency和power;
Train侧强调throughput和performance。
TPU是给市场inject balance。
协处理器成功的只有两个DSP和Video卡。做硬件是需要一个生态外围的。
3,自然语言处理
联系人:
刘家骅: 15120003855