2017年7月23日 (日) 08:48的最后版本

时间地点

时间：7月22日-7月24日

地点：B634房间

准备

智能硬件-挑战单元-明细

机器六台；电源

时间地点

时间：7月22日-7月24日

地点：B634房间

准备

智能硬件-挑战单元-明细

机器六台；电源

分组

6个组，每组6-7人。

每组人员分工：

1人负责记录过程：最终形成所有的报告，过程汇报。

1人波形文件录音，整理24句录音的波形图；频谱图；

4人分别对应四个过程。

第一组日志

第二组日志

第三组日志

第四组日志

第五组日志

第六组日志

@@ 第35行： / 第35行： @@
 =第一组日志=
-[[组名：卓越国防]]
+[[第一组日志]]
-组长：何之舟
-组员：王鸿、李鹏、郭佼瑞、 杨丽艳、蔺相飞、赵凌
- 第一天 2017年7月22日
-上午：
-、陈 老 师：智能声控硬件实践的理论学习，讲解重难点，对每项任务的实施进行划分和方法指导；
-、组    员：组织商量任务的具体分工，职责到人；
- 具体流程：
-   a. 日志创建：赵凌记录任务完成过程，创建本组任务日志页面和过程记录；
-   b. 录制音频：杨丽艳组织全组成员，按要求每人录制24条语音指令，进行音频文件制作；
-   c. 收集音频：王鸿、蔺相飞收集、整理了全组成员的音频文件；
-   d. 整理上交：何之舟负责完成了统筹、汇总、更名和上交。
-下午：
-、陈 老 师: 回顾上午的所学，并对下一步的任务进行布置和讲解；
-、组    员：何之舟、蔺相飞拷贝和安装好WavReader.py文件和WavReader.txt文档；
-、陈 老 师：讲解WavReader.py文件操作方法（格式转化、读取语音波形、频谱图生成），并对每一步的操作进行演示；
-、组    员：选取了何之舟和李鹏两位组员的音频文件，按照步骤完成音频文件的格式转化，读取语音波形和频谱图生成；
-、陈 老 师：就实际操作过程中出现的困难和问题，进行面对面解答和指导；全组成员在合作和探究中，发现问题，提出问题并解决问题；
- 具体流程：
-    a.准备工作: 安装Ipython软件，在“我的文档”下存放ffmpeg、sox软件及录制好的音频文件
-    b.制作步骤: 查看IPython工作路径,打开IPython软件
-      运行脚本： import os os.path.realpath('.')
-    c.调用ffmpeg.exe软件: 将24个音频全部转换成wav文件
-      运行脚本： os.system('.\\ffmpeg\\bin\\ffmpeg.exe -i .\\a.m4a -ac 1 -acodec pcm_f32le -ar 44100 .\\a.wav -v 1')
-    d.读取波形图: 调用matplotlab.pyplot将24个wav音频文件生成波形图，并另存为*.png文件;
-      运行脚本： import matplotlib.pyplot as plt from wavReader import readWav rate, data =readWav('./a.wav') plt.plot(data) plt.show()
-    e.生成频谱图: 调用sox.exe交互软件,增加音频效果，依据波形图生成频谱图，并另存为*out.png文件;
-      运行脚本： import os from matplotlib import image, pyplot os.path.exists('.\\sox\\sox.exe') os.system('.\\sox\\sox.exe .\\a.wav-nrate 4kspectrogram -o aout.png') img = image.imread('.\\aout.png') pyplot.imshow(img) pyplot.axis('off') pyplot.show()
-、陈老师：讲解图像识别使用卷积网络、语音识别使用循环网络、深度学习硬件与软件栈、深度学习框架、端到端的训练、神经网络模型（核心）等知识
-晚上：
- 一、准备工作：
-、安装Anaconda3软件到c盘；
-、audionet文件夹放置在桌面；
-、在audioNet下新建文件夹raw，把960个音频（其中899个可用）文件复制到raw文件夹中；
-、确认ffmpeg和sox文件夹中有相应文件；
-、用记事本打开audioNet文件夹中train.py文件，修改速度参数。
- 二、TensorFlow安装：
-、在运行处输入cmd，打开管理员提示窗口，再打开程序菜单所有程序命令组Anaconda3(64-bit)下的Anaconda Prompt程序；
-、在Anaconda Prompt-python窗口中，输入python，回车；
-、输入quit()，回车；
-、输入pip install tensorflow,回车，此时开始安装，等待安装结束；
-、输入python，回车，再输入import tensorflow as tf，回车，确认运行正常。
- 三、批量生成音频：
-、输入cd desktop回车，再输入cd audioNet回车；
-、输入python convert_file.py ./raw，回车，自动在audioNet\data\train下转换成.wav 文件格式，复制其中的100个文件到audioNet\data\test文件夹下。
- 四、安装keras：
-、在Anaconda Prompt-python窗口中，输入python，回车；
-、输入quit()，回车；
-、输入pip install keras,回车，此时开始安装，等待安装结束。
- 五、测试：
-、输入python train.py 回车，开始测试，请关掉所有防护软件和防火墙。
 =第二组日志=
@@ 第105行： / 第45行： @@
 =第四组日志=
 [[第四组日志]]
 =第五组日志=
 [[第五组日志]]
 =第六组日志=
 [[第六组日志]]
-队名：挑战--2017
-年7月22日
-地点：李兆基科技楼634
-组长：吴臣
-学员：吴臣、袁晴春、刘雯婧、江华、周益兰、阳娟娟
-分工：
-、录音语音指令 -- 负责人：周益兰
-、格式转换 ------ 负责人：刘雯婧
-、TensorFlow ---  负责人：吴臣
-、AudioNet -----  负责人：袁晴春
-、任务过程记录 -- 负责人：阳娟娟
-、任务总结 ------ 负责人：江华
-Day1 上午:
-、智能硬件理论学习，讲授人陈震老师。
-、小组成员分别录音。
-、刘雯婧负责收集及转换录音，吴臣协助。
-Day1 下午
-第一阶段：
-、将“频谱图”，ffmpeg、sox软件及录制好的音频文件放到“我的文档”下存放。
-、吴臣负责查看iPython工作路径。
-、将录音文件资料格式转换成标准格式。刘雯婧负责格式转换，吴臣和袁晴春协助，江华和周益兰负责审核。
-、读取语音波形文件，音频文件全部改好，吴臣、江华、刘雯婧负责。
-、吴臣正在负责改和生成频谱图，袁晴春在旁边协助解决问题，刘雯婧，江华和周益兰自行摸索学习。
-、运营sox声音交互软件，增加音频效果，秀频谱图，运行sox声音交互软件。
-[[文件:Chuan.png|缩略图|居中]]
-第二阶段  主题：神经网络训练
-第一步：理论学习。
-陈震老师讲授理论知识：损失函数、神经元、随机梯度下降法、神经网络训练-反向传播、神经网络训练过程、TensorFlow（不断地设计结构调参数，TF示例演示-神经网络训练过程 谷歌开发）、卷积网络、循环网络-RNN（处理语音的。思路：权重共享）、长短时记忆网络、门控循环单元-GRU、深度学习硬件与软件栈、深度学习框架、语音识别原理、语音指令设计知识回顾、神经网络模型、计算平台使用。
-第二步：讲授完，各组组长到陈震老师那儿拷贝文件ODO.NET（语音识别软件）。本组组长吴臣负责拷贝文件。
-==Day 2==
-时间：2017.7.23.
-地点：李兆基科技楼634
-上午：
-、陈老师带领各组回顾昨天的内容，对今天上午的任务进行说明。
-、请陈震老师到组内进行指导，9：15开始组长吴臣开始进行数据测试，袁晴春从旁协助。
-、组长负责电脑上安装安卓开发软件androidAudioRecg12，编辑程序，进行数据模拟测试,并检测，袁晴春协助，另外组员探讨摸索。
-[[文件:学习.jpg|缩略图|居中]]
-、组长吴臣和袁晴春负责安装Android Studio Setup，并测试，安装成功。
-[[文件:学习2.jpg|缩略图|居中]]

“2017-智能硬件-挑战”版本间的差异

2017年7月23日 (日) 08:48的最后版本

目录

时间地点

准备

时间地点

准备

分组

第一组日志

第二组日志

第三组日志

第四组日志

第五组日志

第六组日志

导航菜单

个人工具

名字空间

变种

查看

操作

搜索

导航

工具