“智能硬件-语音识别”版本间的差异

来自iCenter Wiki
跳转至: 导航搜索
ASR-实验1
 
(2位用户的3个中间修订版本未显示)
第1行: 第1行:
===ASR-实验1===
+
== ASR-实验1 ==
  
声控智能硬件-语音指令录音  
+
声控智能硬件-语音指令录音
  
 
通过给手机语音指令,手机APP自动识别指令种类,进行相应的控制。
 
通过给手机语音指令,手机APP自动识别指令种类,进行相应的控制。
第7行: 第7行:
 
[[智能硬件-语音指令集]]
 
[[智能硬件-语音指令集]]
  
存放目录:\\101.6.160.42\智能硬件录音
+
存放目录:\\101.6.160.42\saturn\Audio\
  
 
以学号建立文件夹,限定使用*.wav格式。
 
以学号建立文件夹,限定使用*.wav格式。
第13行: 第13行:
 
每位同学提交24条语音,要求高质量保证。
 
每位同学提交24条语音,要求高质量保证。
  
时间:10月7日中午12点之前
+
时间:2016年10月7日中午12点之前
  
===ASR-实验2===
+
== ASR-实验2 ==
  
 
声控智能硬件-频谱图生成
 
声控智能硬件-频谱图生成
 
将24条语音文件生成对应的频谱图(Spectrogram),频谱图文件名称为*.spec
 
  
熟悉TensorFlow环境,使用TensorFlow搭建3层全连接的神经网络(24个softmax输出)。
+
将24条语音文件生成对应的频谱图([https://en.wikipedia.org/wiki/Spectrogram Spectrogram]),频谱图文件名称为*.spec
 +
 
 +
熟悉[https://www.tensorflow.org TensorFlow]环境,使用TensorFlow搭建3层全连接的神经网络(24个softmax输出)。
  
 
时间:2016年10月14日中午12点之前
 
时间:2016年10月14日中午12点之前
  
===ASR-实验3===
+
== ASR-实验3(选做) ==
Kaldi语音识别(选做)
+
 
 +
Kaldi语音识别
  
Kaldi Speech Recognition Toolkit
+
[https://github.com/kaldi-asr/kaldi Kaldi Speech Recognition Toolkit]
[https://github.com/kaldi-asr/kaldi kaldi]
+
  
要求:安装Kaldi,运行一个实例。
+
安装Kaldi,运行一个实例。
  
 
时间:2016年11月22日中午12时之前
 
时间:2016年11月22日中午12时之前

2017年5月31日 (三) 08:50的最后版本

ASR-实验1

声控智能硬件-语音指令录音

通过给手机语音指令,手机APP自动识别指令种类,进行相应的控制。

智能硬件-语音指令集

存放目录:\\101.6.160.42\saturn\Audio\

以学号建立文件夹,限定使用*.wav格式。

每位同学提交24条语音,要求高质量保证。

时间:2016年10月7日中午12点之前

ASR-实验2

声控智能硬件-频谱图生成

将24条语音文件生成对应的频谱图(Spectrogram),频谱图文件名称为*.spec

熟悉TensorFlow环境,使用TensorFlow搭建3层全连接的神经网络(24个softmax输出)。

时间:2016年10月14日中午12点之前

ASR-实验3(选做)

Kaldi语音识别

Kaldi Speech Recognition Toolkit

安装Kaldi,运行一个实例。

时间:2016年11月22日中午12时之前