“2017-智能硬件-挑战”版本间的差异

来自iCenter Wiki
跳转至: 导航搜索
第一组日志
第35行: 第35行:
  
 
=第一组日志=
 
=第一组日志=
[[第一组日志]]
+
[[组名:卓越国防]]
  
 +
组长:何之舟
 +
 +
组员:王鸿、李鹏、郭佼瑞、 杨丽艳、蔺相飞、赵凌
 +
 +
 +
第一天 2017年7月22日
 +
 +
上午:
 +
1、陈 老 师:智能声控硬件实践的理论学习,讲解重难点,对每项任务的实施进行划分和方法指导;
 +
2、组    员:组织商量任务的具体分工,职责到人;
 +
具体流程:
 +
  a. 日志创建:赵凌记录任务完成过程,创建本组任务日志页面和过程记录;
 +
  b. 录制音频:杨丽艳组织全组成员,按要求每人录制24条语音指令,进行音频文件制作;
 +
  c. 收集音频:王鸿、蔺相飞收集、整理了全组成员的音频文件;
 +
  d. 整理上交:何之舟负责完成了统筹、汇总、更名和上交。
 +
 +
 +
 +
下午:
 +
1、陈 老 师: 回顾上午的所学,并对下一步的任务进行布置和讲解;
 +
2、组    员:何之舟、蔺相飞拷贝和安装好WavReader.py文件和WavReader.txt文档;
 +
3、陈 老 师:讲解WavReader.py文件操作方法(格式转化、读取语音波形、频谱图生成),并对每一步的操作进行演示;
 +
4、组    员:选取了何之舟和李鹏两位组员的音频文件,按照步骤完成音频文件的格式转化,读取语音波形和频谱图生成;
 +
5、陈 老 师:就实际操作过程中出现的困难和问题,进行面对面解答和指导;全组成员在合作和探究中,发现问题,提出问题并解决问题;
 +
具体流程:
 +
    a.准备工作: 安装Ipython软件,在“我的文档”下存放ffmpeg、sox软件及录制好的音频文件
 +
    b.制作步骤: 查看IPython工作路径,打开IPython软件
 +
      运行脚本: import os os.path.realpath('.')
 +
    c.调用ffmpeg.exe软件: 将24个音频全部转换成wav文件
 +
      运行脚本: os.system('.\\ffmpeg\\bin\\ffmpeg.exe -i .\\a.m4a -ac 1 -acodec pcm_f32le -ar 44100 .\\a.wav -v 1')
 +
    d.读取波形图: 调用matplotlab.pyplot将24个wav音频文件生成波形图,并另存为*.png文件;
 +
      运行脚本: import matplotlib.pyplot as plt from wavReader import readWav rate, data =readWav('./a.wav') plt.plot(data) plt.show()
 +
    e.生成频谱图: 调用sox.exe交互软件,增加音频效果,依据波形图生成频谱图,并另存为*out.png文件;
 +
      运行脚本: import os from matplotlib import image, pyplot os.path.exists('.\\sox\\sox.exe') os.system('.\\sox\\sox.exe .\\a.wav-nrate 4kspectrogram -o aout.png') img = image.imread('.\\aout.png') pyplot.imshow(img) pyplot.axis('off') pyplot.show() 
 +
6、陈老师:讲解图像识别使用卷积网络、语音识别使用循环网络、深度学习硬件与软件栈、深度学习框架、端到端的训练、神经网络模型(核心)等知识
 +
 +
 +
晚上:
 +
一、准备工作:
 +
1、安装Anaconda3软件到c盘;
 +
2、audionet文件夹放置在桌面;
 +
3、在audioNet下新建文件夹raw,把960个音频(其中899个可用)文件复制到raw文件夹中;
 +
4、确认ffmpeg和sox文件夹中有相应文件;
 +
5、用记事本打开audioNet文件夹中train.py文件,修改速度参数。
 +
二、TensorFlow安装:
 +
1、在运行处输入cmd,打开管理员提示窗口,再打开程序菜单所有程序命令组Anaconda3(64-bit)下的Anaconda Prompt程序;
 +
2、在Anaconda Prompt-python窗口中,输入python,回车;
 +
3、输入quit(),回车;
 +
4、输入pip install tensorflow,回车,此时开始安装,等待安装结束;
 +
5、输入python,回车,再输入import tensorflow as tf,回车,确认运行正常。
 +
三、批量生成音频:
 +
1、输入cd desktop回车,再输入cd audioNet回车;
 +
2、输入python convert_file.py ./raw,回车,自动在audioNet\data\train下转换成.wav 文件格式,复制其中的100个文件到audioNet\data\test文件夹下。
 +
四、安装keras:
 +
1、在Anaconda Prompt-python窗口中,输入python,回车;
 +
2、输入quit(),回车;
 +
3、输入pip install keras,回车,此时开始安装,等待安装结束。
 +
五、测试:
 +
1、输入python train.py 回车,开始测试,请关掉所有防护软件和防火墙。
  
 
=第二组日志=
 
=第二组日志=

2017年7月23日 (日) 07:58的版本


时间地点

时间:7月22日-7月24日

地点:B634房间

准备

智能硬件-挑战单元-明细

机器六台; 电源

时间地点

时间:7月22日-7月24日

地点:B634房间

准备

智能硬件-挑战单元-明细

机器六台; 电源

分组

6个组,每组6-7人。

每组人员分工:

1人负责记录过程:最终形成所有的报告,过程汇报。

1人波形文件录音,整理24句录音的波形图;频谱图;

4人分别对应四个过程。


第一组日志

组名:卓越国防

组长:何之舟

组员:王鸿、李鹏、郭佼瑞、 杨丽艳、蔺相飞、赵凌


第一天 2017年7月22日 

上午:

1、陈 老 师:智能声控硬件实践的理论学习,讲解重难点,对每项任务的实施进行划分和方法指导;
2、组    员:组织商量任务的具体分工,职责到人;
具体流程:
  a. 日志创建:赵凌记录任务完成过程,创建本组任务日志页面和过程记录;
  b. 录制音频:杨丽艳组织全组成员,按要求每人录制24条语音指令,进行音频文件制作;
  c. 收集音频:王鸿、蔺相飞收集、整理了全组成员的音频文件;
  d. 整理上交:何之舟负责完成了统筹、汇总、更名和上交。


下午:

1、陈 老 师: 回顾上午的所学,并对下一步的任务进行布置和讲解;
2、组    员:何之舟、蔺相飞拷贝和安装好WavReader.py文件和WavReader.txt文档;
3、陈 老 师:讲解WavReader.py文件操作方法(格式转化、读取语音波形、频谱图生成),并对每一步的操作进行演示;
4、组    员:选取了何之舟和李鹏两位组员的音频文件,按照步骤完成音频文件的格式转化,读取语音波形和频谱图生成;
5、陈 老 师:就实际操作过程中出现的困难和问题,进行面对面解答和指导;全组成员在合作和探究中,发现问题,提出问题并解决问题;
具体流程:
   a.准备工作: 安装Ipython软件,在“我的文档”下存放ffmpeg、sox软件及录制好的音频文件
   b.制作步骤: 查看IPython工作路径,打开IPython软件
     运行脚本: import os os.path.realpath('.') 
   c.调用ffmpeg.exe软件: 将24个音频全部转换成wav文件
     运行脚本: os.system('.\\ffmpeg\\bin\\ffmpeg.exe -i .\\a.m4a -ac 1 -acodec pcm_f32le -ar 44100 .\\a.wav -v 1') 
   d.读取波形图: 调用matplotlab.pyplot将24个wav音频文件生成波形图,并另存为*.png文件;
     运行脚本: import matplotlib.pyplot as plt from wavReader import readWav rate, data =readWav('./a.wav') plt.plot(data) plt.show() 
   e.生成频谱图: 调用sox.exe交互软件,增加音频效果,依据波形图生成频谱图,并另存为*out.png文件;
     运行脚本: import os from matplotlib import image, pyplot os.path.exists('.\\sox\\sox.exe') os.system('.\\sox\\sox.exe .\\a.wav-nrate 4kspectrogram -o aout.png') img = image.imread('.\\aout.png') pyplot.imshow(img) pyplot.axis('off') pyplot.show()  
6、陈老师:讲解图像识别使用卷积网络、语音识别使用循环网络、深度学习硬件与软件栈、深度学习框架、端到端的训练、神经网络模型(核心)等知识


晚上:

一、准备工作:
1、安装Anaconda3软件到c盘; 
2、audionet文件夹放置在桌面; 
3、在audioNet下新建文件夹raw,把960个音频(其中899个可用)文件复制到raw文件夹中; 
4、确认ffmpeg和sox文件夹中有相应文件; 
5、用记事本打开audioNet文件夹中train.py文件,修改速度参数。 
二、TensorFlow安装:
1、在运行处输入cmd,打开管理员提示窗口,再打开程序菜单所有程序命令组Anaconda3(64-bit)下的Anaconda Prompt程序; 
2、在Anaconda Prompt-python窗口中,输入python,回车; 
3、输入quit(),回车; 
4、输入pip install tensorflow,回车,此时开始安装,等待安装结束; 
5、输入python,回车,再输入import tensorflow as tf,回车,确认运行正常。 
三、批量生成音频:
1、输入cd desktop回车,再输入cd audioNet回车; 
2、输入python convert_file.py ./raw,回车,自动在audioNet\data\train下转换成.wav 文件格式,复制其中的100个文件到audioNet\data\test文件夹下。 
四、安装keras:
1、在Anaconda Prompt-python窗口中,输入python,回车; 
2、输入quit(),回车; 
3、输入pip install keras,回车,此时开始安装,等待安装结束。 
五、测试:
1、输入python train.py 回车,开始测试,请关掉所有防护软件和防火墙。

第二组日志

第二组日志

第三组日志

第三组日志

第四组日志

第四组日志


第五组日志

第五组日志


第六组日志

第六组日志


队名:挑战--2017

2017年7月22日

地点:李兆基科技楼634

组长:吴臣

学员:吴臣、袁晴春、刘雯婧、江华、周益兰、阳娟娟

分工:

   1、录音语音指令 -- 负责人:周益兰
   2、格式转换 ------ 负责人:刘雯婧
   3、TensorFlow ---  负责人:吴臣
   4、AudioNet -----  负责人:袁晴春
   5、任务过程记录 -- 负责人:阳娟娟
   6、任务总结 ------ 负责人:江华

Day1 上午:

1、智能硬件理论学习,讲授人陈震老师。

2、小组成员分别录音。

3、刘雯婧负责收集及转换录音,吴臣协助。


Day1 下午

第一阶段:

1、将“频谱图”,ffmpeg、sox软件及录制好的音频文件放到“我的文档”下存放。

2、吴臣负责查看iPython工作路径。

3、将录音文件资料格式转换成标准格式。刘雯婧负责格式转换,吴臣和袁晴春协助,江华和周益兰负责审核。

4、读取语音波形文件,音频文件全部改好,吴臣、江华、刘雯婧负责。

5、吴臣正在负责改和生成频谱图,袁晴春在旁边协助解决问题,刘雯婧,江华和周益兰自行摸索学习。

6、运营sox声音交互软件,增加音频效果,秀频谱图,运行sox声音交互软件。

Chuan.png

第二阶段 主题:神经网络训练

第一步:理论学习。

陈震老师讲授理论知识:损失函数、神经元、随机梯度下降法、神经网络训练-反向传播、神经网络训练过程、TensorFlow(不断地设计结构调参数,TF示例演示-神经网络训练过程 谷歌开发)、卷积网络、循环网络-RNN(处理语音的。思路:权重共享)、长短时记忆网络、门控循环单元-GRU、深度学习硬件与软件栈、深度学习框架、语音识别原理、语音指令设计知识回顾、神经网络模型、计算平台使用。

第二步:讲授完,各组组长到陈震老师那儿拷贝文件ODO.NET(语音识别软件)。本组组长吴臣负责拷贝文件。

Day 2

时间:2017.7.23.

地点:李兆基科技楼634

上午:

1、陈老师带领各组回顾昨天的内容,对今天上午的任务进行说明。

2、请陈震老师到组内进行指导,9:15开始组长吴臣开始进行数据测试,袁晴春从旁协助。

3、组长负责电脑上安装安卓开发软件androidAudioRecg12,编辑程序,进行数据模拟测试,并检测,袁晴春协助,另外组员探讨摸索。

学习.jpg

4、组长吴臣和袁晴春负责安装Android Studio Setup,并测试,安装成功。

学习2.jpg