“智能硬件-语音识别”版本间的差异
来自iCenter Wiki
(→ASR-实验1) |
|||
(某位用户的一个中间修订版本未显示) | |||
第1行: | 第1行: | ||
− | =ASR-实验1= | + | == ASR-实验1 == |
− | 声控智能硬件-语音指令录音 | + | 声控智能硬件-语音指令录音 |
通过给手机语音指令,手机APP自动识别指令种类,进行相应的控制。 | 通过给手机语音指令,手机APP自动识别指令种类,进行相应的控制。 | ||
第7行: | 第7行: | ||
[[智能硬件-语音指令集]] | [[智能硬件-语音指令集]] | ||
− | 存放目录:\\101.6.160.42\ | + | 存放目录:\\101.6.160.42\saturn\Audio\ |
以学号建立文件夹,限定使用*.wav格式。 | 以学号建立文件夹,限定使用*.wav格式。 | ||
第13行: | 第13行: | ||
每位同学提交24条语音,要求高质量保证。 | 每位同学提交24条语音,要求高质量保证。 | ||
− | + | 时间:2016年10月7日中午12点之前 | |
− | =ASR-实验2= | + | == ASR-实验2 == |
声控智能硬件-频谱图生成 | 声控智能硬件-频谱图生成 | ||
− | |||
− | |||
− | + | 将24条语音文件生成对应的频谱图([https://en.wikipedia.org/wiki/Spectrogram Spectrogram]),频谱图文件名称为*.spec | |
+ | |||
+ | 熟悉[https://www.tensorflow.org TensorFlow]环境,使用TensorFlow搭建3层全连接的神经网络(24个softmax输出)。 | ||
时间:2016年10月14日中午12点之前 | 时间:2016年10月14日中午12点之前 | ||
− | =ASR-实验3(选做)= | + | == ASR-实验3(选做) == |
+ | |||
Kaldi语音识别 | Kaldi语音识别 | ||
− | + | [https://github.com/kaldi-asr/kaldi Kaldi Speech Recognition Toolkit] | |
− | [https://github.com/kaldi-asr/kaldi | + | |
− | + | 安装Kaldi,运行一个实例。 | |
时间:2016年11月22日中午12时之前 | 时间:2016年11月22日中午12时之前 | ||
− | |||
− | |||
− | |||
− |
2017年5月31日 (三) 08:50的最后版本
ASR-实验1
声控智能硬件-语音指令录音
通过给手机语音指令,手机APP自动识别指令种类,进行相应的控制。
存放目录:\\101.6.160.42\saturn\Audio\
以学号建立文件夹,限定使用*.wav格式。
每位同学提交24条语音,要求高质量保证。
时间:2016年10月7日中午12点之前
ASR-实验2
声控智能硬件-频谱图生成
将24条语音文件生成对应的频谱图(Spectrogram),频谱图文件名称为*.spec
熟悉TensorFlow环境,使用TensorFlow搭建3层全连接的神经网络(24个softmax输出)。
时间:2016年10月14日中午12点之前
ASR-实验3(选做)
Kaldi语音识别
Kaldi Speech Recognition Toolkit
安装Kaldi,运行一个实例。
时间:2016年11月22日中午12时之前