更改

2017-智能硬件-挑战

删除2,842字节2017年7月23日 (日) 06:16
=第五组日志=
[[第五组日志]]
组长:周辉
 
组员:龙红、龚健勇、陈堃、李英姿、贾宇
 
分工
 
录音语音指令:李英姿
 
格式转换:贾宇
 
TensorFlow实践:周辉
 
AudioNet安卓应用开发:龙红
 
记录:龚健勇、陈堃
 
1、2017年7月22日上午由录音员李英姿录制24条语音指令,进行音频文件制作并转换。
 
2、2017年7月22下午把转换的音频文件转频谱图,操作步骤如下:
 
(1)将wavReader.py和ffmpeg、sox两个文件夹放置在同一目录下;打开IPython软件,输入import os和os.path.realpath('.')两个命令,确定工作路径正确。
 
(2)把24个音频拷贝到同一路径下,使用ffmepg工具进行格式转换并注意文件名的修改。
 
(3)输入读取语音波形命令组,分别修改音频名称,生成并修改相应的波形图名称。
 
(4)用同样方法输入频谱图生成命令组,修改相应的波形图名称及频谱图名称并保存。
 
通过此次练习,我们发现在生成波形图时,前两条指令只需输入一次,通过修改第三条指令中的文件名即可连续生成不同波形图;做频谱图时可用同样的方法,前三条指令只需输入一次,通过修改第四条指令中的文件名即可连续生成不同的频谱图,这样在没有学习批量指令前,可加快文件处理速度。
 
3、2017年7月22日晚 训练并测试数据操作步骤如下:
 
第一步:准备工作(确定各文件路径的正确)
 
1、安装Anaconda3软件到c:盘;
 
2、audioNet文件夹放置在桌面;
 
3、在audioNet下新建文件夹raw,把960个音频文件复制到raw文件夹中;
 
4、确认ffmpeg和sox文件夹中有相应文件:
 
5、用记事本打开audioNet文件夹中train.py文件,修改速度参数;
 
第二步:Tensorflow安装
 
1、在运行处输入cmd,打开管理员提示窗口,再打开程序菜单所有程序命令组Anaconda3(64-bit)下的Anaconda Prompt程序:
 
2、在Anaconda Prompt-python窗口中,输入python,回车。
 
3、输入quit(),回车。
 
4、输入pip install tensorflow,回车,此时开始安装,等待安装结束。
 
5、 输入python,回车,再输入import tensorflow as tf,回车,确认运行正常。
 
第三步:批量生成音频
 
1、输入cd desktop回车,再输入cd audioNet回车。
 
2、输入python convert_file.py ./raw,回车,自动在audioNet\data\train下转换成.wav 文件格式,复制其中的100个文件到audioNet\data\test文件夹下。
 
第四步:安装keras
 
1、在Anaconda Prompt-python窗口中,输入python,回车。
 
2、输入quit(),回车。
 
3、输入pip install keras,回车,此时开始安装,等待安装结束。
 
第五步:测试
 
输入python train.py 回车,开始测试,请关掉所有防护软件和防火墙。
=第六组日志=
39
个编辑