=课程项目=
==学生准备== 携带笔记本,智能手机 (Bring your own laptop computers and camera-ready smart phones) ==课程项目-语音识别== ===ASR-实验1=== 声控智能硬件-语音指令录音 通过给手机语音指令,手机APP自动识别指令种类,进行相应的控制。 [[智能硬件-语音指令集]] 存放目录:\\101.6.160.42\智能硬件录音 以学号建立文件夹,限定使用*.wav格式。 每位同学提交24条语音,要求高质量保证。 时间:10月7日中午12点之前 ===ASR-实验2=== 声控智能硬件-频谱图生成 # 将24条语音文件生成对应的频谱图(Spectrogram)[5],频谱图文件名称为*.spec# 熟悉TensorFlow环境[6],使用TensorFlow搭建3层全连接的神经网络(24个softmax输出)。 时间:2016年10月14日中午12点之前 ==课程项目-人脸识别== [[智能硬件-人脸识别]] ==课程项目-云+端整合== [[智能硬件-云端整合]] ==课程项目-深度学习== ===基本任务:手写数字识别=== 利用附件提供的Matlab Deep Learning Toolbox中的卷积神经网络(CNN),在MNIST手写数字样本集上,利用训练集样本进行训练,并对测试集样本进行测试。 建议阅读附件中的背景知识和工具箱中的CNN源代码,在了解算法原理和技术实现细节基础上,参照示例程序'''''CNN/test_example_CNN.m''''',自行调整算法中至少一种关键参数或设置,例如调整CNN的卷积层及下采样层的层数、或模板大小等参数;在至少一种与原始程序不同的参数或设置下分别进行训练,做出测试集识别率(或错误率)随参数或设置变化的对照图或对照表,并标出最高识别率对应的参数或设置。 ===提高任务:物体检测=== 请参考工具箱中'''''tests/test_example_SAE.m'''''示例文件,利用STL-10数据集中的无标注图片训练一个自动编码器,再用自动编码器隐含层的参数初始化一个神经网络分类器,并使用训练集中有标注的图片进行训练,最后使用神经网络分类器在测试集上进行测试。测试阶段,调用nntest的返回值“er”为测试集上的识别错误率。 在训练过程中,尝试调整算法中至少一种关键参数或设置,例如自动编码器隐含层的节点个数;在至少一种与原始程序不同的参数或设置下进行实验,做出测试结果随参数或设置变化的对照图或对照表。 在'''''test_example_SAE.m'''''中,建议修改第16行和第28行的'''''opts.numepochs'''''数值,比如将原来的1改为3;如果改变自动编码器隐含层节点数目进行实验比较,需要注意::第12行:sae = saesetup([784 <font color="#FF0000">'''100'''</font>]);:第22行:nn = nnsetup([784 <font color="#FF0000">'''100'''</font> 10]);中红色标注的参数要修改一致。 ===报告要求=== 报告应包含以下内容: # 在MNIST手写数字样本测试集上,识别率(或错误率)随参数或设置变化的对照图或对照表。# ''(选做)''在STL-10 测试集上,识别率(或错误率)随参数或设置变化的对照图或对照表。# 总结收获和体会。 提交报告时,请一并提交自己编写或修改过的源代码。 ===附件=== 更多帮助,请阅读实验指导书。 实验指导书和工具箱下载: http://166.111.6.122/RegionDownloadService/1511/0A6A33E76DFD6DFCD75E20F7C1226B7E3.html (助教:王晗 wang-han13@mails.tsinghua.edu.cn) ==课程项目-智能医药问答== (常嘉辉)
=致谢=