查看“RSI-王亦安”的源代码
←
RSI-王亦安
跳转至:
导航
、
搜索
因为以下原因,你没有权限编辑本页:
您刚才请求的操作只对以下1个用户组开放:
用户
。
您可以查看并复制此页面的源代码:
=2017-7-14 = 安装windows10 操作系统 安装Python, Anaconda, Notepad等软件 尝试解决数字识别问题。中途因为各种原因失败了很多次,后来在老师的帮助下重新安装了Python,最终成功了,虽然还不是很清楚原理。 继续探索。 =2017-7-15= 学习了关于机器识别的一些原理性知识。 录制了24条语音指令。通过convent_file文件将原来的m4a格式转换成了wav格式。然后通过ipython及相应的代码做出音频文件相应的波形图。如下图所示。 [[文件:1971-1副本.png|缩略图]] 从gitlab上下载了audioNet文件,开始训练语音识别。一开始没有发现data中有很多(编号大于10000的)无效文件,后来经指点后发现,删除了它们。运行.py文件时要注意一定要在相应的目录下运行。 “cd” change director “cd \ ” 返回根目录 “cd..” 返回上一级目录 “↑ ” 复制粘贴上一次的命令 修改Python文件后,control S 可保存修改。 =2017-7-16= 经过晚上和上午的运行,成功训练了40个epoch,训练准确率已经达到99%,测试准确率达到95%。之后通过Android Studio在安卓系统的平板上安装了App。 具体步骤如下:在Gitlab中下载androidAudioRecg,在Android Studio中打开AudioSpeechRecognition.java,先生成.apk文件,然后run,就可以在平板上安装了。(注意,要将平板调成开发者模式,具体为:设置-关于平板电脑-版本号点击多次,然后在开发人员选项中打开USB调试)。 安装后进行测试,发现测试效果不是很好,“关机”“开机”“上”“下”等经常识别不清。后来经学长提醒,发现忘记用自己做出的model生成pb文件,系统自动用了以前的,所以之前生成的APP并不是自己做的。后来纠正了错误,重新生成了APP,识别准确率相当不错。 晚上上图。
返回
RSI-王亦安
。
导航菜单
个人工具
创建账户
登录
名字空间
页面
讨论
变种
查看
阅读
查看源代码
查看历史
操作
搜索
导航
首页
实践教学
个性化3D设计与实现
人工智能实践教学
区块链技术及应用
虚拟现实技术与内容制作
超越学科界限的认知基础课程
电子工艺实习
Nand2Tetris Engine Curriculum
TULLL Creative Learning Group
Wiki上手说明
Wiki账户创建
最近更改
工具
链入页面
相关更改
特殊页面
页面信息