智能硬件-语音识别

2016年11月30日 (三) 15:48Zhenchen讨论 | 贡献的版本

ASR-实验1

声控智能硬件-语音指令录音

通过给手机语音指令,手机APP自动识别指令种类,进行相应的控制。

智能硬件-语音指令集

存放目录:\\101.6.160.42\智能硬件录音

以学号建立文件夹,限定使用*.wav格式。

每位同学提交24条语音,要求高质量保证。

时间:10月7日中午12点之前

ASR-实验2

声控智能硬件-频谱图生成

将24条语音文件生成对应的频谱图(Spectrogram),频谱图文件名称为*.spec

熟悉TensorFlow环境,使用TensorFlow搭建3层全连接的神经网络(24个softmax输出)。

时间:2016年10月14日中午12点之前

ASR-实验3(选做)

Kaldi语音识别

Kaldi Speech Recognition Toolkit kaldi

要求:安装Kaldi,运行一个实例。

时间:2016年11月22日中午12时之前

参考资料

  1. Spectrogram, https://en.wikipedia.org/wiki/Spectrogram
  2. TensorFlow, https://www.tensorflow.org
最后修改于2016年11月30日 (星期三) 15:48