“大数据智能-调研考察”版本间的差异

来自iCenter Wiki
跳转至: 导航搜索
第12行: 第12行:
  
 
==考察内容:==
 
==考察内容:==
 +
 +
公司理念:手机操作人人平等
 +
  
 
1,语音识别
 
1,语音识别
 +
从去年3月份至今,采用Deepspeech2的方案完成的中文识别系统。
 +
 +
decoding采用beam search + pruning。
 +
 +
语音识别可以YouTube的音频字幕数据。训练用2千多小时的数据,5~7层网络,训练一周时间。
 +
 +
与Deepspeech2相比,汉字2万多字,常用7000字,用softmax代价还是太高。因此采用400 pinyin输出。
 +
 +
语音识别是一个难的问题:Rich diversity + ambiguity。
  
 
2,深度学习
 
2,深度学习
 +
 +
KTQueue, deep learning job在GPU server上调度系统
 +
 +
采用Pascal 系列GPU server。Pascal卡成本1200$.
 +
 +
Inference侧强调latency和power;
 +
 +
Train侧强调throughput和performance。
 +
 +
TPU是给市场inject balance。
 +
 +
协处理器成功的只有两个DSP和Video卡。做硬件是需要一个生态外围的。
  
 
3,自然语言处理
 
3,自然语言处理
 +
  
 
==联系人:==
 
==联系人:==
  
 
刘家骅: 15120003855
 
刘家骅: 15120003855
 +
 +
=驭光科技=
 +
 +
==地点==
 +
 +
==时间==
 +
 +
==考察内容==

2017年4月18日 (二) 13:20的版本

奇点机智

http://naturali.io

地点:

鼎好A座3楼太库孵化器

时间:

4月18日周二下午1点15分左右从清华出发,一同去奇点机智调研。

考察内容:

公司理念:手机操作人人平等


1,语音识别 从去年3月份至今,采用Deepspeech2的方案完成的中文识别系统。

decoding采用beam search + pruning。

语音识别可以YouTube的音频字幕数据。训练用2千多小时的数据,5~7层网络,训练一周时间。

与Deepspeech2相比,汉字2万多字,常用7000字,用softmax代价还是太高。因此采用400 pinyin输出。

语音识别是一个难的问题:Rich diversity + ambiguity。

2,深度学习

KTQueue, deep learning job在GPU server上调度系统

采用Pascal 系列GPU server。Pascal卡成本1200$.

Inference侧强调latency和power;

Train侧强调throughput和performance。

TPU是给市场inject balance。

协处理器成功的只有两个DSP和Video卡。做硬件是需要一个生态外围的。

3,自然语言处理


联系人:

刘家骅: 15120003855

驭光科技

地点

时间

考察内容