2019-04-09
=1=
智能音箱的技术概要[[智能音箱]]的技术概要
语音交互-智能硬件:[[语音识别深度学习]]功能;/[[卷积神经网络]]CNN/[[循环神经网络]]RNN
#Alex Krizhevsky, Ilya Sutskever and Geoffrey E. Hinton, ImageNet Classification with Deep Convolutional Neural Networks, NIPS 2012. =2= Introduction to Keras, https://www.tensorflow.org/guide/keras MNIST数据集识别:Keras实现卷积网络 http://gitlab.icenter.tsinghua.edu.cn/zhenchen/STIS-2019.git =3= 循环神经网络 https://keras.io/layers/recurrent/ https://karpathy.github.io/2015/05/21/rnn-effectiveness/ =4= 语音交互-[[智能硬件]]:[[唤醒词检测]]、[[语音识别]]与[[语音合成]]功能; 模型训练:audioNet : http://gitlab.icenter.tsinghua.edu.cn/saturnlab/audioPlot audioNet # 创建GPU帐号,请注意务必在“开放端口”处添加9000端口(在线预测网站端口),名称任意# 进入audioNet文件夹# 安装依赖库 bash install.sh# 数据下载: wget https://cloud.tsinghua.edu.cn/f/17407ad83bb4495b86d3/?dl=1 -O raw_data.zip# 数据解压: unzip raw_data.zip# 数据转换: python convert_file.py audio_data# 模型训练:python train.py 我们提供预训练好的模型,进入models文件夹,输入命令 wget https://cloud.tsinghua.edu.cn/f/98e2272c4df54e0d9cbf/?dl=1 -O save_17.h5
客户端实现:Android : http://gitlab.icenter.tsinghua.edu.cn/saturnlab/androidAudioRecg
=5=
GPU User Guide,
http://wiki.icenter.tsinghua.edu.cn/icenterwiki/index.php/AI云