2017-智能硬件-挑战

2017年7月22日 (六) 09:19挑战4组讨论 | 贡献的版本


时间地点

时间:7月22日-7月24日

地点:B634房间

准备

智能硬件-挑战单元-明细

机器六台; 电源

时间地点

时间:7月22日-7月24日

地点:B634房间

准备

智能硬件-挑战单元-明细

机器六台; 电源

分组

6个组,每组6-7人。

每组人员分工:

1人负责记录过程:最终形成所有的报告,过程汇报。

1人波形文件录音,整理24句录音的波形图;频谱图;

4人分别对应四个过w程。


第一组日志

[[国防职院-智能硬件挑战-第1组]]

2017年7月22日

地点:李兆基科技楼634

主讲:陈 震 副研究员 清华大学 基础工业训练中心 互联网+实验室 主任

组长:何之舟

组员:王鸿、李鹏、郭佼瑞、杨丽艳、蔺相飞、赵凌

分工:

    1、录音语音指令 --- 负责人:杨丽艳  
    2、格式转换 --- 负责人:李鹏
    3、TensorFlow ---  负责人:郭佼瑞
    4、AudioNet ---  负责人:王鸿
    5、安卓应用开发 --- 负责人:蔺相飞
    6、任务过程记录 --- 负责人:赵凌
    7、任务总结 --- 负责人:何之舟

操作:

第二组日志

队名:王者荣耀

day 1 #2017.07.22

组员基本安排表

组员 组员分工 主要职责
谭佳宇 总结汇报、TensorFlow实践 audioNet、组织协调、协调小组各个环节、分工、汇总、汇报总结
李顺娟 安卓应用开发 电脑编程、制作研发手机APP、小程序
曾莹莹 TensorFlow实践 audioNet
任洁敏 网络记录 记录小组制作过程、记录问题情况、解决问题、资料的汇总
尹繁荣 录音指令 录音汇总、拷贝
曹科 格式转化 将各小组录音进行转换、整理录音波形图、频谱图

上午

1. 地点:李兆基科技楼634

2. 时间及任务规划:

      8:30-10:00   陈震教师讲解有关人工智能的相关知识,对每项任务进行分配与规划;
     10:00-11:30  各小组分别进行相关人员分配;
                  任洁敏创建小组日志,记录各项过程的实施;
                  小组成员各自进行录音,由曾莹莹拷贝成员录音;
                  谭佳宇负责汇总和整合


下午

  1. 地点:李兆基科技楼634
  2. 时间及任务规划:
      13:30-14:00  陈震教师讲解有关音频转换的相关知识(Ipython),对每一个具体步骤进行相关的讲解,组员查看iPython工作路径;
      14:00-15:30  由尹繁荣提供音频材料(编号25)
                   曹科负责拷贝音频转换的相关软件(sox.exe/ffmpeg.exe),记录程序转化的相关步骤;
                   谭佳宇实时操空电脑,读取语音波形文件,生成频谱图 ;
                   李顺娟、曾莹莹对谭佳宇给予协助,并解决相关问题;
                   小组各成员上机实施操作,体验音频转换、波形图及频谱图的产生; 
                   


 3. 
发现问题 解决方式
音频转化出现路径问题 李顺娟找出解决音频路径相关问题,成功编写运行命令,将音频格式进行转换
波形图、频谱图的运行命令出现bug 曾莹莹协助谭佳宇编写波形图、频谱图的运行命令
小组其他问题 曹科从其他小组学习经验并找到解决办法
单独一条音频转换过程略为繁琐 集合小组力量,集体分工,一起解决音频、波形图、频谱图相关的转换

第三组日志

组名:大白科技

组长:杨述

组员:易跃洋、张曼丽、刘茹、唐晓双、张玲梓、周利群


组员基本安排表

组员 组员分工 主要职责
张曼丽 录音指令 录音汇总、拷贝
唐晓双 格式转化 将各小组录音进行转换
杨述 TensorFlow实践 整理录音波形图、频谱图、audioNet
刘茹 AudioNet
张玲梓 网络记录 记录小组制作过程、记录问题情况、解决问题、资料的汇总
易跃洋 安卓应用开发 电脑编程、制作研发手机APP、小程序
周利群 总结汇报、TensorFlow实践 audioNet、组织协调、协调小组各个环节、分工、汇总、汇报总结


时间:2017.7.22. Day 1

地点:李兆基科技楼634

时间及任务规划:

上午08:30——10:00 智能硬件学习,陈震老师讲解

上午10:10——11:20 各小组成员自主录音,全体组员

上午11:20——11:40 收集本组成员录音,张曼丽、刘茹收集小组录音

下午13:00——14:00 查看iPython工作路径,周利群查看路径

下午14:00——14:20 声音格式转换(由M4A格式→WAV格式),唐晓双转换并统一文件

下午14:40——15:30 读取语音波形文件,频谱图生成,杨述组长指导组员一起处理文件

Zhidaoliuru.jpg


下午15:10——16:00 运行SOX处理音频文件,增加音频效果,易跃洋处理文件

第四组日志

1、团队介绍

队名:英雄大联盟H&L

组长:尹倩

学员:杨厚平、谌丽容、徐玉娟、曾丽霞、尹倩、刘伟

分工:

    1、录音语音指令 -- 负责人:谌丽容
    2、格式转换 ------ 负责人:杨厚平
    3、TensorFlow ---  负责人:尹倩
    4、AudioNet -----  负责人:刘伟
    5、安卓应用开发 -- 负责人:曾丽霞
    6、任务过程记录 -- 负责人:徐玉娟
    7、任务总结 ------ 负责人:尹倩

2、7月22日

2.1 上 午

学习内容:

一、智能声控硬件实践的理论学习

二、团队建设及具体分工安排

三、按要求录制音频文件

2.2 下 午

一、学习内容:频谱图制作

二、准备工作:安装Ipython软件,在“我的文档”下存放ffmpeg、sox软件及录制好的音频文件。

图片1.png

三、制作步骤:

1、查看IPython工作路径:

打开IPython软件,运行脚本: import os os.path.realpath('.')

2、调用ffmepg软件将音频格式转换成a.m4a文件:

运行脚本: os.system('.\\ffmpeg\\bin\\ffmpeg.exe -i .\\a.m4a -ac 1 -acodec pcm_f32le -ar 44100 .\\a.wav -v 1')

3、读取语音波形

运行脚本: import matplotlib.pyplot as plt from wavReader import readWav rate, data =readWav('./a.wav') plt.plot(data) plt.show()

4、调用sox软件生成频谱图:

运行脚本: import os from matplotlib import image, pyplot os.path.exists('.\\sox\\sox.exe') os.system('.\\sox\\sox.exe .\\a.wav -n rate 4k spectrogram -o aout.png') img = image.imread('.\\aout.png') pyplot.imshow(img) pyplot.axis('off') pyplot.show()

四、团队阶段性成果

第五组日志

running five

组长:周辉

组员:龙红、龚健勇、陈堃、李英姿、贾宇

分工

录音语音指令:李英姿

格式转换:贾宇

TensorFlow实践:周辉

AudioNet安卓应用开发:龙红

记录:龚健勇、陈堃

1、2017年7月22日上午由录音员李英姿录制24条语音指令,进行音频文件制作并转换。
2、2017年7月22下午把转换的音频文件转频谱图,操作步骤如下:

(1)将wavReader.py和ffmpeg、sox两个文件夹放置在同一目录下;打开IPython软件,输入import os和os.path.realpath('.')两个命令,确定工作路径正确。

(2)把24个音频拷贝到同一路径下,使用ffmepg工具进行格式转换并注意文件名的修改。

(3)输入读取语音波形命令组,分别修改音频名称,生成并修改相应的波形图名称。

(4)用同样方法输入频谱图生成命令组,修改相应的波形图名称及频谱图名称并保存。

   通过此次练习,我们发现在生成波形图时,前两条指令只需输入一次,通过修改第三条指令中的文件名即可连续生成不同波形图;做频谱图时可用同样的方法,前三条指令只需输入一次,通过修改第四条指令中的文件名即可连续生成不同的频谱图,这样在没有学习批量指令前,可加快文件处理速度。

第六组日志

队名:尽情挑战--2017

2017年7月22日

组长:吴臣

学员:吴臣、袁晴春、刘雯婧、江华、周益兰、阳娟娟

分工:

   1、录音语音指令 -- 负责人:周益兰
   2、格式转换 ------ 负责人:刘雯婧
   3、TensorFlow ---  负责人:吴臣
   4、AudioNet -----  负责人:袁晴春
   5、任务过程记录 -- 负责人:阳娟娟
   6、任务总结 ------ 负责人:江华

Day1:

地点:李兆基科技楼634

上午:

1、智能硬件理论学习,讲授人陈震老师。

2、小组成员分别录音。

3、刘雯婧负责收集及转换录音,吴臣协助。

下午:

1、将“频谱图”,ffmpeg、sox软件及录制好的音频文件放到“我的文档”下存放。

2、吴臣负责查看iPython工作路径。

3、将录音文件资料格式转换成标准格式。刘雯婧负责格式转换,吴臣和袁晴春协助,江华和周益兰负责审核。

4、读取语音波形文件,音频文件全部改好,吴臣、江华、刘雯婧负责。

5、吴臣正在负责改和生成频谱图,袁晴春在旁边协助解决问题,刘雯婧,江华和周益兰自行摸索学习。

5、运营sox声音交互软件,增加音频效果,秀频谱图,运行sox声音交互软件。

最后修改于2017年7月22日 (星期六) 09:19