更改 - iCenter Wiki

智能硬件与智能系统

删除8,581字节、2020年5月8日 (五) 03:05

/* 教学团队 */

=版权申明=~~CC BY-NC-SA~~

~~=教学团队=互联网+实验室~~ CC [~~http~~https://~~net~~creativecommons.~~icenter.tsinghua.edu~~org/licenses/by-nc-nd/3.0/cn ~~iNetLab~~/ BY-NC-ND]

~~[https://net.icenter.tsinghua.edu.cn 陈震]~~ ~~[http://wiki.icenter.tsinghua.edu.cn/maxd 马晓东] 章屹松王蓓蓓高英~~= 课程信息 =

~~助教：郑文勋王晗~~课号：01510202

~~=教学背景=~~英文：Smart Things and Intelligent Systems

随着计算机应用的日益普及和计算机网络的快速发展，互联网+的社会经济浪潮日益显现，以互联网连接的物理硬件系统和以大数据云计算为基础的信息系统，使得具有智能的机器人、自动驾驶的无人机等等智能系统成为新的技术发展浪潮，并催生了“智能硬件”的新生态。简写：STIS

~~=课程内容=~~教学目标：[[智能硬件与智能系统-教学目标]]

== ~~云＋端~~ 教学团队 ==

~~===智能端===~~[[互联网+实验室|智能系统实验室]] ： [[陈震]][[马晓东]] [[章屹松]] [[郭敏]] [[高英]] [[王浩宇]]

~~移动设备：Android/iOS~~助教：[[刘昊天]] [[刘桥]]

~~嵌入式设备：Raspberry Pi 2 /Arduino~~== 教学资源 ==

~~可穿戴式硬件：手环~~ ~~Apple Watch~~<big>'''由清华iCenter [[基础工业训练中心-智能硬件库|智能硬件库]]、[[基础工业训练中心-智能机器人库|智能机器人库]]和[[基础工业训练中心-人工智能平台|人工智能平台]]保障支持'''。

=~~==嵌入式开发平台==~~课程教学 =

==~~==NVIDIA JETSON TK1==~~教学计划 ==

[~~http://www.nvidia.cn/object/jetson-tk1-embedded-dev-kit-cn.html jetson~~[智能硬件与智能系统-~~tk1~~教学计划]]

~~====Raspberry Pi====~~ 以往教学： [[智能硬件与智能系统-以往教学]]

~~[https://www.raspberrypi.org Raspberry Pi]~~== 教学管理 ==

~~===云计算与大数据===~~ [[智能硬件与智能系统-学生分组]]

=~~===数据中心===~~参考资料 =

~~Google 公司拥有分布全球的十几个数据中心，上百万台机器的集群计算，具体数目是保密数字~~[[智能硬件-参考文献 | 参考文献]]

~~#L.A. Barroso, J. Clidaras, and U. Holzle, The Datacenter as a Computer: An Introduction to the Design of Warehouse~~[[智能硬件-~~Scale Machines, 2nd ed., 2013.~~参考课程 | 参考课程]]

=~~===云计算平台===~~致谢 =

~~#Fox, Armando, et al. "Above the clouds: A Berkeley view of cloud computing." Dept. Electrical Eng. and Comput. Sciences, University of California, Berkeley, Rep. UCB/EECS 28 (2009): 13.~~[[致谢-微软公司]]

[[致谢-声智科技]]

~~iCenter-Cloud~~ [~~http://cloud.icenter.tsinghua.edu.cn iCenter-Cloud]~~ ~~Azure云~~[~~http://portal.azure.com Azure]~~ ~~====大数据平台====~~ ~~#Jeffrey Dean and Sanjay Ghemawat, MapReduce: Simplified Data Processing on Large Clusters, OSDI 2004.#Chang F, Dean J, Ghemawat S, et al. Bigtable: A distributed storage system for structured data. OSDI 2006.~~ ~~#Yang, Fangjin, et al. "Druid: a real~~致谢-~~time analytical data store." ACM sigmod, 2014.~~ ~~====机器学习====#Jeffrey Dean et al. "Large scale distributed deep networks." Advances in Neural Information Processing Systems. 2012.~~ ~~==智能系统=====人工智能定义===人工智能，是指计算机系统具备从听说读写到搜索、推理、决策和回答问题等类人智能的能力~~ ~~感知、理解、决策~~ ~~===人工智能历史===~~ ~~过去经历了2次高潮与2次低谷~~ ~~网络和云计算所支持的计算能力~~ ~~基于大数据的机器学习的算法进步~~ ~~===深度神经网络===~~ ~~Deep Learning~~ ~~====谷歌====~~ ~~[http://download.tensorflow.org/paper/whitepaper2015.pdf Google_TensorFlow~~Momenta] ~~====百度====~~ ~~[https://github.com/dmlc/mxnet dmlc_mxnet~~] ~~===机器感知===语音识别~~ ~~计算机视觉~~ ~~自然语言理解~~ ~~===智能问答===[[实验室探究课-智能问答与智能系统]]~~ ~~=项目分组===第一组==组长：~~许越 ~~组员：吴俣帅杨应人~~ ~~==第二组==组长：王亦凡~~ ~~组员：刘梦旸~~张力 ~~==第三组==组长：刘晓明~~ ~~组员：常昊男全光林朱泽宇~~ ~~==第四组==组长：郑钰琦~~ ~~组员：郑安然郑钰琦高一川~~ ~~=论文研读=~~ ~~==第一次==~~ ~~===Group1===Convolutional, long short-term memory, fully connected deep neural networks, ICASSP 2015.~~ ~~Context dependent phone models for LSTM RNN acoustic modelling, ICASSP 2015.~~ ~~===Group2===Listen, attend and spell: A neural network for large vocabulary conversational speech recognition, ICASSP 2015.~~ ~~===Group3===Audio augmentation for speech recognition~~ ~~===Group4===Deep Speech 2 End-to-End Speech Recognition in English and Mandarin, JMLR 2016.~~ ~~==第二次==~~ ~~#Parallel training of DNNs with natural gradient and parameter averaging, ICLR Workshop 2015. [http://www.danielpovey.com Dan Povey]#Long short term memory-neural computation, Neural computation 9 (8), 1735-1780, 1997. [http://ieeexplore.ieee.org/document/6795963 LSTM]~~#Karpagavalli, S., and E. Chandra. "A Review on Automatic Speech Recognition Architecture and Approaches." International Journal of Signal Processing, Image Processing and Pattern Recognition 9, no. 4 (2016): 393-404.~~#EESEN_ End-to-End Speech Recognition using Deep RNN Models and WFST-based Decoding, ASRU 2015.#Learning the Speech Front-end With Raw Waveform CLDNNs, InterSpeech 2015.~~ ~~=课程项目=~~ ~~==学生准备==携带笔记本，智能手机(Bring your own laptop computers and camera-ready smart phones)~~ ~~==课程项目-语音识别==~~ ~~===ASR-实验1===声控智能硬件-语音指令录音~~ ~~通过给手机语音指令，手机APP自动识别指令种类，进行相应的控制。~~ ~~语音指令录音~~ ~~a蓝牙开机~~ ~~b蓝牙拨打电话／bb蓝牙打电话~~ ~~c蓝牙接听电话／cc蓝牙接电话~~ ~~d蓝牙拒接~~ ~~e蓝牙播放音乐／ee蓝牙开始音乐~~ ~~f蓝牙暂停音乐／ff蓝牙停止音乐~~ ~~g蓝牙上一首／gg蓝牙上一曲~~ ~~h蓝牙下一首／hh蓝牙下一曲~~ ~~i蓝牙音量增大／ii蓝牙声音增大／iii蓝牙音量增加／iiii蓝牙声音增加~~ ~~j蓝牙音量减小／jj蓝牙声音减小~~ ~~k蓝牙关机~~ ~~l蓝牙电量提醒／ll蓝牙还剩多少电／lll蓝牙还剩多少电量~~ ~~存放目录：\\166.111.134.110\team-saturn\智能硬件录音~~ ~~以学号建立文件夹，限定使用*.wav格式。~~ ~~每位同学提交24条语音，要求高质量保证。~~ ~~时间：10月7日中午12点之前~~ ~~===ASR-实验2===声控智能硬件-频谱图生成~~ ~~(1)将24条语音文件生成对应的频谱图（spectrogram）[5]，频谱图文件名称为*.spec~~ ~~(2)熟悉TensorFlow环境[6]，使用TensorFlow搭建3层全连接的神经网络（24个softmax输出）。~~ ~~时间：2016年10月14日中午12点之前~~ ~~==人脸识别==~~ ~~===系统要求===Ubuntu 1504以上~~ ~~安装 opencv3~~ ~~$ workon cv3-python27~~ ~~$ git clone https://github.com/bytefish/facerec.git~~ ~~$ cd facerec/~~ ~~$ cd py/~~ ~~$ cd apps/~~ ~~$ cd videofacerec/~~ ~~$ python simple_videofacerec.py mymodel.pkl~~ ~~===介绍===~~ ~~[http://www.bytefish.de/blog/fisherfaces/ fisherface]~~ ~~==课程项目-云+端整合==~~ ~~===Thrift协议===~~ ~~===client端===~~ ~~调用API录音调用Thrift接口~~ ~~===server端===接收录音文件~~ ~~调用服务端程序~~ ~~参考：[https://developer.android.com/index.html Android开发入门]~~ ~~==课程项目-深度学习==~~ ~~===基本任务：手写数字识别===利用附件提供的Matlab Deep Learning Toolbox中的卷积神经网络（CNN），在MNIST手写数字样本集上，利用训练集样本进行训练，并对测试集样本进行测试。~~ 建议阅读附件中的背景知识和工具箱中的CNN源代码，在了解算法原理和技术实现细节基础上，参照示例程序'''''CNN/test_example_CNN.m'''''，自行调整算法中至少一种关键参数或设置，例如调整CNN的卷积层及下采样层的层数、或模板大小等参数；在至少一种与原始程序不同的参数或设置下分别进行训练，做出测试集识别率（或错误率）随参数或设置变化的对照图或对照表，并标出最高识别率对应的参数或设置。 ~~===提高任务：物体检测===~~请参考工具箱中'''''tests/test_example_SAE.m'''''示例文件，利用STL-10数据集中的无标注图片训练一个自动编码器，再用自动编码器隐含层的参数初始化一个神经网络分类器，并使用训练集中有标注的图片进行训练，最后使用神经网络分类器在测试集上进行测试。测试阶段，调用nntest的返回值“er”为测试集上的识别错误率。在训练过程中，尝试调整算法中至少一种关键参数或设置，例如自动编码器隐含层的节点个数；在至少一种与原始程序不同的参数或设置下进行实验，做出测试结果随参数或设置变化的对照图或对照表。在'''''test_example_SAE.m'''''中，建议修改第16行和第28行的'''''opts.numepochs'''''数值，比如将原来的1改为3；如果改变自动编码器隐含层节点数目进行实验比较，需要注意：~~:第12行：sae = saesetup([784 <font color="#FF0000">'''100'''</font>]);:第22行：nn = nnsetup([784 <font color="#FF0000">'''100'''</font> 10]);中红色标注的参数要修改一致。~~ ~~===报告要求===报告应包含以下内容：# 在MNIST手写数字样本测试集上，识别率（或错误率）随参数或设置变化的对照图或对照表。#''（选做）''在STL-10 测试集上，识别率（或错误率）随参数或设置变化的对照图或对照表。# 总结收获和体会。~~ ~~提交报告时，请一并提交自己编写或修改过的源代码。~~ ~~===附件===更多帮助，请阅读实验指导书。~~ ~~实验指导书和工具箱下载：~~ ~~http://166.111.6.122/RegionDownloadService/1511/0A6A33E76DFD6DFCD75E20F7C1226B7E3.html~~ ~~（助教：王晗 wang-han13@mails.tsinghua.edu.cn）~~ ~~==课程项目-智能医药问答==（常嘉辉）~~ ~~=致谢=本课程获得微软Azure云计算与机器学习捐赠支持。~~ ~~感谢微软公司杨滔经理，章艳经理，刘士君工程师，闫伟工程师。~~ ~~=参考文献=1. Stuart Russell and Peter Norvig, Artificial Intelligence: A modern approach. Prentice-Hall, 2005.~~ ~~2. Ferrucci, David A. "Introduction to “this is watson”." IBM Journal of Research and Development 56.3.4 (2012): 1-1.~~ ~~3. Bradski, Gary, and Adrian Kaehler. Learning OpenCV: Computer vision with the OpenCV library. O'Reilly Media, Inc., 2008.~~ ~~4. Hauswald, Johann, et al. "Sirius: An open end-to-end voice and vision personal assistant and its implications for future warehouse scale computers." ASPLOS, ACM, 2015.~~ ~~5. Spectrogram, https://en.wikipedia.org/wiki/Spectrogram~~ ~~6. TensorFlow, https://www.tensorflow.org~~

用户名

个编辑