大数据智能-课程项目
目录
课程准备
课程项目目标
构建可以实用化的人工智能云服务。
平台:云平台/工作站
学生准备
携带笔记本,智能手机
(Bring your own laptop computers and camera-ready smart phones)
Azure云平台使用
Flask-Web服务器搭建
项目1-大数据
描述
任务:基于位图索引的概念和原理,用C++实现一个位图索引数据库。
检验:完成对一段网流数据的索引建立,查询。在虚拟机上运行成功,得到正确结果。
网流数据:\\166.111.134.110\team-saturn\网流数据
代码托管:http://gitlab.icenter.tsinghua.edu.cn
时间:10月7日中午12点之前(特殊情况,推迟一周)(校历第四周)
组织:以组为单位,要求要看到所有同学的贡献。
作业提交
[[Group1]] | [[Group2]] | [[Group3]] | [[Group4]] |
[[Group5]] | [[Group6]] | [[Group7]] | [[Group8]] |
项目2-Lucida使用
Lucida安装
每个组在清华工业云平台上安装Lucida软件
- 清华工业云 iCenter-Cloud
- 下载地址 Lucida-AI
时间:10月26日下周三中午12点之前。(校历第七周)
每组工作
每组熟悉了解Lucida的7种AI服务的实现原理
项目3-TensorFlow/Keras实践
作业1_TensorFlow
- 阅读深度学习DeepLearning教程
- 安装Google TensorFlow
- 完成TensorFlow网站上Get Started.
- 测试实验
时间:2016年11月2日中午12点(校历第八周)
作业2_Keras
- 安装Keras
- Keras: Deep Learning library for Theano and TensorFlow
- 测试实验
http://gitlab.icenter.tsinghua.edu.cn/tuna/elixir.git
时间:2016年11月23日晚上24点(校历第十一周)
项目4-云+端整合
时间:2016年11月9日中午12点(校历第九周)(特殊情况,延长一周)
Thrift协议
Client端
调用摄像头拍照
调用Thrift接口
Server端
接收图片文件
调用服务端程序
参考
项目5-机器智能
描述
完成一个可展示的人工智能系统
步骤:
- 设置Azure虚拟机
- 架构Flask-Web服务
- 建立AI服务(Google Tensorflow)
- lucida.ai
- 智能端开发(移动平台、嵌入式硬件) + Thrift协议联调
参考: Lucida-AI
作业提交
[[Group1]] | [[Group2]] | [[Group3]] |
[[Group4]] | [[Group5]] | [[Group6]] |
项目6-ChatBot开发
基于微软BotFramework和Luis自然语音理解API,设计并实现具有实用场景的智能机器人对话服务。
- 实验参考文档 Hackathon_code
动手实验
根据微软提供的文档,一步一步搭建一个简单的对话机器人,并将Code上传Azure, 或者直接将微软提供的Sample Code上传Azure,发布成Web App,并和Skype或者Web结合(时间1.5小时)
设计
自己的智能对话机器人应用场景和功能,并设想可能的解决方案,并做报告(时间1.5小时)
实现
设计的Bot的核心功能和主要场景(时间5小时) (微软会提供两个版本的Sample Code,分别是C#和NodeJS版本,选手可以根据此Code修改为自己设计的智能对话机器人,或者重新创建设计新的智能对话机器人)
报告
展示自己设计实现的智能对话机器人(时间10分钟)
- 建议使用Visual Studio 2015 Community开发微软智能对话机器人
- 微软云Azure Web服务:
项目7-NeuralArt实践
神经网络艺术
研读论文
- A Learned Representation For Artistic Style Google_art_style
- A Neural Algorithm of Artistic Style neural-style
- Image Style Transfer Using Convolutional Neural Networks_CVPR_2016 neural-art-transfer
Google Art and Machine Intelligence(AMI)
Magenta TensorFlow_Magenta
AMI google_AMI
创业公司
作业完成
第1组、第2组、第3组、第5组
第4组和第6组(缺)
项目8-机器学习和大数据分析(Azure云)
实验参考网址 ML_BD_code
- 按照实验指导,一步步完成两个随堂作业。
机器学习
(1) 手写字体分类;
- Exercise 1: Create a Machine Learning experiment
- Exercise 2: Upload a dataset
- Exercise 3: Train a classification model
- Exercise 4: Score the model
- Exercise 5: Deploy the model as a Web service
实验1 过程说明 Machine_Learning
大数据分析
(2)spark集群实验;
- Exercise 1: Create a Spark cluster on HDInsight
- Exercise 2: Upload Jupyter notebooks to the cluster
- Exercise 3: Work with Jupyter notebooks
- Exercise 4: Interactively explore data in Spark
- Exercise 5: Use Jupyter to develop a machine-learning model
- Exercise 6: Remove the HDInsight Spark cluster
实验2 过程说明 HDInsight
项目9-增强学习实验
Value Iteration Networks VIN
Value Iteration Networks in TensorFlow https://github.com/TheAbhiKumar/tensorflow-value-iteration-networks