“2019春-智能硬件-第七次课-教学计划”版本间的差异

来自iCenter Wiki
跳转至: 导航搜索
4
 
(2位用户的15个中间修订版本未显示)
第1行: 第1行:
 
2019-04-09
 
2019-04-09
 +
=1=
  
智能音箱的技术概要
+
[[智能音箱]]的技术概要
  
语音交互-智能硬件:[[语音识别]]功能与[[语音合成]]
+
[[深度学习]]/
 +
[[卷积神经网络]]CNN/[[循环神经网络]]RNN
  
模型训练:audioNet : http://gitlab.icenter.tsinghua.edu.cn/saturnlab/audioPlot 
+
#Alex Krizhevsky, Ilya Sutskever and Geoffrey E. Hinton, ImageNet Classification with Deep Convolutional Neural Networks, NIPS 2012.
 +
 
 +
=2=
 +
 
 +
Introduction to Keras, https://www.tensorflow.org/guide/keras
 +
 
 +
MNIST数据集识别:Keras实现卷积网络
 +
 
 +
http://gitlab.icenter.tsinghua.edu.cn/zhenchen/STIS-2019.git
 +
 
 +
=3=
 +
 
 +
循环神经网络
 +
 
 +
https://keras.io/layers/recurrent/
 +
 
 +
https://karpathy.github.io/2015/05/21/rnn-effectiveness/
 +
 
 +
=4=
 +
 
 +
语音交互-[[智能硬件]]:[[唤醒词检测]]、[[语音识别]]与[[语音合成]]功能;
 +
 
 +
模型训练:audioNet : http://gitlab.icenter.tsinghua.edu.cn/saturnlab/audioNet
 +
# 创建GPU帐号,请注意务必在“开放端口”处添加9000端口(在线预测网站端口),名称任意
 +
# 进入audioNet文件夹
 +
# 安装依赖库 bash install.sh
 +
# 数据下载: wget https://cloud.tsinghua.edu.cn/f/17407ad83bb4495b86d3/?dl=1 -O raw_data.zip
 +
# 数据解压: unzip raw_data.zip
 +
# 数据转换: python convert_file.py audio_data
 +
# 模型训练:python train.py
 +
 
 +
我们提供预训练好的模型,进入models文件夹,输入命令 wget https://cloud.tsinghua.edu.cn/f/98e2272c4df54e0d9cbf/?dl=1 -O save_17.h5
  
 
客户端实现:Android : http://gitlab.icenter.tsinghua.edu.cn/saturnlab/androidAudioRecg
 
客户端实现:Android : http://gitlab.icenter.tsinghua.edu.cn/saturnlab/androidAudioRecg
 +
 +
=5=
 +
 +
GPU User Guide,
 +
 +
http://wiki.icenter.tsinghua.edu.cn/icenterwiki/index.php/AI云

2019年4月9日 (二) 06:31的最后版本

2019-04-09

目录

1

智能音箱的技术概要

深度学习/ 卷积神经网络CNN/循环神经网络RNN

  1. Alex Krizhevsky, Ilya Sutskever and Geoffrey E. Hinton, ImageNet Classification with Deep Convolutional Neural Networks, NIPS 2012.

2

Introduction to Keras, https://www.tensorflow.org/guide/keras

MNIST数据集识别:Keras实现卷积网络

http://gitlab.icenter.tsinghua.edu.cn/zhenchen/STIS-2019.git

3

循环神经网络

https://keras.io/layers/recurrent/

https://karpathy.github.io/2015/05/21/rnn-effectiveness/

4

语音交互-智能硬件唤醒词检测语音识别语音合成功能;

模型训练:audioNet : http://gitlab.icenter.tsinghua.edu.cn/saturnlab/audioNet

  1. 创建GPU帐号,请注意务必在“开放端口”处添加9000端口(在线预测网站端口),名称任意
  2. 进入audioNet文件夹
  3. 安装依赖库 bash install.sh
  4. 数据下载: wget https://cloud.tsinghua.edu.cn/f/17407ad83bb4495b86d3/?dl=1 -O raw_data.zip
  5. 数据解压: unzip raw_data.zip
  6. 数据转换: python convert_file.py audio_data
  7. 模型训练:python train.py

我们提供预训练好的模型,进入models文件夹,输入命令 wget https://cloud.tsinghua.edu.cn/f/98e2272c4df54e0d9cbf/?dl=1 -O save_17.h5

客户端实现:Android : http://gitlab.icenter.tsinghua.edu.cn/saturnlab/androidAudioRecg

5

GPU User Guide,

http://wiki.icenter.tsinghua.edu.cn/icenterwiki/index.php/AI云