更改
==2017年7月2日==
*了解神经网络概念
*训练语音识别网络
今天上午正式开始神经网络的内容,这也是我们这次挑战性课程的主题。首先老师讲了神经网络的发展历史,分类,一些典型代表,包括谷歌的CLDNN,CTC模型还有LSTM等等,我们的网络主要就有CLDNN和LSTM还有一些其他部分构成。用到的函数库是keras,这是一个TensorFlow的封装版,使用更加方便,更加傻瓜化。
操作上的主要内容就是训练网络了。首先到git上找到并下载一个项目,将其中两个脚本涉及到地址的内容改成当前所用地址,然后跑这两个脚本,开始训练。样本来自我们前几天自己录的音,不同的是被老师加上了很多背景白噪声,大幅度增加了样本量,实现了“增强学习”。将样本分割成两部分,分别放在两个不同的文件夹里,一部分用作训练,另一部分用作测试。在工作站上运行之后出现了很多问题,最主要的是10054和10061错误,都是和计算机连接有关的,通过关闭防火墙和提升权限都得到了解决,正常开始训练,不过速度奇慢,因为是用到cpu版本的TensorFlow。笔记本上也遇到了同样的10054和10061问题,但是用相同的办法却没办法解决,最后不得不先搁置起来。
下午除了等训练结果之外没有其他进展。网络正确率已经从早上开始时候的0.1提高到了0.6,相信经过一个晚上就可以达到0.9甚至0.99。