查看“2017-智能硬件-挑战”的源代码
←
2017-智能硬件-挑战
跳转至:
导航
、
搜索
因为以下原因,你没有权限编辑本页:
您刚才请求的操作只对以下1个用户组开放:
用户
。
您可以查看并复制此页面的源代码:
=时间地点= 时间:7月22日-7月24日 地点:B634房间 =准备= [[智能硬件-挑战单元-明细]] 机器六台; 电源 =时间地点= 时间:7月22日-7月24日 地点:B634房间 =准备= [[智能硬件-挑战单元-明细]] 机器六台; 电源 =分组= 6个组,每组6-7人。 每组人员分工: 1人负责记录过程:最终形成所有的报告,过程汇报。 1人波形文件录音,整理24句录音的波形图;频谱图; 4人分别对应四个过程。 =第一组日志= [[组名:卓越国防]] 组长:何之舟 组员:王鸿、李鹏、郭佼瑞、 杨丽艳、蔺相飞、赵凌 第一天 2017年7月22日 上午: 1、陈 老 师:智能声控硬件实践的理论学习,讲解重难点,对每项任务的实施进行划分和方法指导; 2、组 员:组织商量任务的具体分工,职责到人; 具体流程: a. 日志创建:赵凌记录任务完成过程,创建本组任务日志页面和过程记录; b. 录制音频:杨丽艳组织全组成员,按要求每人录制24条语音指令,进行音频文件制作; c. 收集音频:王鸿、蔺相飞收集、整理了全组成员的音频文件; d. 整理上交:何之舟负责完成了统筹、汇总、更名和上交。 下午: 1、陈 老 师: 回顾上午的所学,并对下一步的任务进行布置和讲解; 2、组 员:何之舟、蔺相飞拷贝和安装好WavReader.py文件和WavReader.txt文档; 3、陈 老 师:讲解WavReader.py文件操作方法(格式转化、读取语音波形、频谱图生成),并对每一步的操作进行演示; 4、组 员:选取了何之舟和李鹏两位组员的音频文件,按照步骤完成音频文件的格式转化,读取语音波形和频谱图生成; 5、陈 老 师:就实际操作过程中出现的困难和问题,进行面对面解答和指导;全组成员在合作和探究中,发现问题,提出问题并解决问题; 具体流程: a.准备工作: 安装Ipython软件,在“我的文档”下存放ffmpeg、sox软件及录制好的音频文件 b.制作步骤: 查看IPython工作路径,打开IPython软件 运行脚本: import os os.path.realpath('.') c.调用ffmpeg.exe软件: 将24个音频全部转换成wav文件 运行脚本: os.system('.\\ffmpeg\\bin\\ffmpeg.exe -i .\\a.m4a -ac 1 -acodec pcm_f32le -ar 44100 .\\a.wav -v 1') d.读取波形图: 调用matplotlab.pyplot将24个wav音频文件生成波形图,并另存为*.png文件; 运行脚本: import matplotlib.pyplot as plt from wavReader import readWav rate, data =readWav('./a.wav') plt.plot(data) plt.show() e.生成频谱图: 调用sox.exe交互软件,增加音频效果,依据波形图生成频谱图,并另存为*out.png文件; 运行脚本: import os from matplotlib import image, pyplot os.path.exists('.\\sox\\sox.exe') os.system('.\\sox\\sox.exe .\\a.wav-nrate 4kspectrogram -o aout.png') img = image.imread('.\\aout.png') pyplot.imshow(img) pyplot.axis('off') pyplot.show() 6、陈老师:讲解图像识别使用卷积网络、语音识别使用循环网络、深度学习硬件与软件栈、深度学习框架、端到端的训练、神经网络模型(核心)等知识 晚上: 一、准备工作: 1、安装Anaconda3软件到c盘; 2、audionet文件夹放置在桌面; 3、在audioNet下新建文件夹raw,把960个音频(其中899个可用)文件复制到raw文件夹中; 4、确认ffmpeg和sox文件夹中有相应文件; 5、用记事本打开audioNet文件夹中train.py文件,修改速度参数。 二、TensorFlow安装: 1、在运行处输入cmd,打开管理员提示窗口,再打开程序菜单所有程序命令组Anaconda3(64-bit)下的Anaconda Prompt程序; 2、在Anaconda Prompt-python窗口中,输入python,回车; 3、输入quit(),回车; 4、输入pip install tensorflow,回车,此时开始安装,等待安装结束; 5、输入python,回车,再输入import tensorflow as tf,回车,确认运行正常。 三、批量生成音频: 1、输入cd desktop回车,再输入cd audioNet回车; 2、输入python convert_file.py ./raw,回车,自动在audioNet\data\train下转换成.wav 文件格式,复制其中的100个文件到audioNet\data\test文件夹下。 四、安装keras: 1、在Anaconda Prompt-python窗口中,输入python,回车; 2、输入quit(),回车; 3、输入pip install keras,回车,此时开始安装,等待安装结束。 五、测试: 1、输入python train.py 回车,开始测试,请关掉所有防护软件和防火墙。 =第二组日志= [[第二组日志]] =第三组日志= [[第三组日志]] =第四组日志= [[第四组日志]] =第五组日志= [[第五组日志]] =第六组日志= [[第六组日志]] 队名:挑战--2017 2017年7月22日 地点:李兆基科技楼634 组长:吴臣 学员:吴臣、袁晴春、刘雯婧、江华、周益兰、阳娟娟 分工: 1、录音语音指令 -- 负责人:周益兰 2、格式转换 ------ 负责人:刘雯婧 3、TensorFlow --- 负责人:吴臣 4、AudioNet ----- 负责人:袁晴春 5、任务过程记录 -- 负责人:阳娟娟 6、任务总结 ------ 负责人:江华 Day1 上午: 1、智能硬件理论学习,讲授人陈震老师。 2、小组成员分别录音。 3、刘雯婧负责收集及转换录音,吴臣协助。 Day1 下午 第一阶段: 1、将“频谱图”,ffmpeg、sox软件及录制好的音频文件放到“我的文档”下存放。 2、吴臣负责查看iPython工作路径。 3、将录音文件资料格式转换成标准格式。刘雯婧负责格式转换,吴臣和袁晴春协助,江华和周益兰负责审核。 4、读取语音波形文件,音频文件全部改好,吴臣、江华、刘雯婧负责。 5、吴臣正在负责改和生成频谱图,袁晴春在旁边协助解决问题,刘雯婧,江华和周益兰自行摸索学习。 6、运营sox声音交互软件,增加音频效果,秀频谱图,运行sox声音交互软件。 [[文件:Chuan.png|缩略图|居中]] 第二阶段 主题:神经网络训练 第一步:理论学习。 陈震老师讲授理论知识:损失函数、神经元、随机梯度下降法、神经网络训练-反向传播、神经网络训练过程、TensorFlow(不断地设计结构调参数,TF示例演示-神经网络训练过程 谷歌开发)、卷积网络、循环网络-RNN(处理语音的。思路:权重共享)、长短时记忆网络、门控循环单元-GRU、深度学习硬件与软件栈、深度学习框架、语音识别原理、语音指令设计知识回顾、神经网络模型、计算平台使用。 第二步:讲授完,各组组长到陈震老师那儿拷贝文件ODO.NET(语音识别软件)。本组组长吴臣负责拷贝文件。 ==Day 2== 时间:2017.7.23. 地点:李兆基科技楼634 上午: 1、陈老师带领各组回顾昨天的内容,对今天上午的任务进行说明。 2、请陈震老师到组内进行指导,9:15开始组长吴臣开始进行数据测试,袁晴春从旁协助。 3、组长负责电脑上安装安卓开发软件androidAudioRecg12,编辑程序,进行数据模拟测试,并检测,袁晴春协助,另外组员探讨摸索。 [[文件:学习.jpg|缩略图|居中]] 4、组长吴臣和袁晴春负责安装Android Studio Setup,并测试,安装成功。 [[文件:学习2.jpg|缩略图|居中]]
返回
2017-智能硬件-挑战
。
导航菜单
个人工具
创建账户
登录
名字空间
页面
讨论
变种
查看
阅读
查看源代码
查看历史
操作
搜索
导航
首页
实践教学
个性化3D设计与实现
人工智能实践教学
区块链技术及应用
虚拟现实技术与内容制作
超越学科界限的认知基础课程
电子工艺实习
Nand2Tetris Engine Curriculum
TULLL Creative Learning Group
Wiki上手说明
Wiki账户创建
最近更改
工具
链入页面
相关更改
特殊页面
页面信息