“第五组日志”版本间的差异
(以“组长:周辉 组员:龙红、龚健勇、陈堃、李英姿、贾宇 分工 录音语音指令:李英姿 格式转换:贾宇 TensorFlow实践:周辉...”为内容创建页面) |
(没有差异)
|
2017年7月23日 (日) 08:15的版本
组长:周辉 组员:龙红、龚健勇、陈堃、李英姿、贾宇 分工 录音语音指令:李英姿 格式转换:贾宇 TensorFlow实践:周辉 AudioNet安卓应用开发:龙红 记录:龚健勇、陈堃 1、2017年7月22日上午由录音员李英姿录制24条语音指令,进行音频文件制作并转换。 2、2017年7月22下午把转换的音频文件转频谱图,操作步骤如下: (1)将wavReader.py和ffmpeg、sox两个文件夹放置在同一目录下;打开IPython软件,输入import os和os.path.realpath('.')两个命令,确定工作路径正确。 (2)把24个音频拷贝到同一路径下,使用ffmepg工具进行格式转换并注意文件名的修改。 (3)输入读取语音波形命令组,分别修改音频名称,生成并修改相应的波形图名称。 (4)用同样方法输入频谱图生成命令组,修改相应的波形图名称及频谱图名称并保存。
通过此次练习,我们发现在生成波形图时,前两条指令只需输入一次,通过修改第三条指令中的文件名即可连续生成不同波形图;做频谱图时可用同样的方法,前三条指令只需输入一次,通过修改第四条指令中的文件名即可连续生成不同的频谱图,这样在没有学习批量指令前,可加快文件处理速度。
3、2017年7月22日晚 训练并测试数据操作步骤如下: 第一步:准备工作(确定各文件路径的正确) 1、安装Anaconda3软件到c:盘; 2、audioNet文件夹放置在桌面; 3、在audioNet下新建文件夹raw,把960个音频文件复制到raw文件夹中; 4、确认ffmpeg和sox文件夹中有相应文件: 5、用记事本打开audioNet文件夹中train.py文件,修改速度参数; 第二步:Tensorflow安装 1、在运行处输入cmd,打开管理员提示窗口,再打开程序菜单所有程序命令组Anaconda3(64-bit)下的Anaconda Prompt程序: 2、在Anaconda Prompt-python窗口中,输入python,回车。 3、输入quit(),回车。 4、输入pip install tensorflow,回车,此时开始安装,等待安装结束。 5、 输入python,回车,再输入import tensorflow as tf,回车,确认运行正常。 第三步:批量生成音频 1、输入cd desktop回车,再输入cd audioNet回车。 2、输入python convert_file.py ./raw,回车,自动在audioNet\data\train下转换成.wav 文件格式,复制其中的100个文件到audioNet\data\test文件夹下。 第四步:安装keras 1、在Anaconda Prompt-python窗口中,输入python,回车。 2、输入quit(),回车。 3、输入pip install keras,回车,此时开始安装,等待安装结束。 第五步:测试 输入python train.py 回车,开始测试,请关掉所有防护软件和防火墙。