“大数据与机器智能”版本间的差异
来自iCenter Wiki
(→课程准备) |
(→大数据系统) |
||
第49行: | 第49行: | ||
== 大数据系统 == | == 大数据系统 == | ||
− | + | 数据科学用于对不同领域的数据进行解析,分析与知识发现。数据科学(Data Science)是一种跨学科的知识体系,是领域专家知识、数学与统计和计算机科学的交集。 | |
+ | |||
+ | 大数据系统是实现数据管理和数据分析用途而设计的分布式的多计算机系统。 | ||
[[分布式系统]] | [[分布式系统]] |
2017年6月3日 (六) 12:07的版本
目录
版权申明
CC BY-NC-SA
课程信息
课程课号
01510243
教学目标
- 宏观
通过各项技术的讲授和实践,为学生理清产业发展方向,拓展对产业的认识视野。
- 介观
学习计算机系统的基本原理,实验操作计算机系统实验。
- 微观
- 学习大数据系统的原理与技术,在实践中运用大数据技术。
- 学习机器智能的理论,了解大数据系统与机器智能的相辅相成的关系,在实践中运用机器智能技术。
教学团队
助教:郑文勋 常嘉辉
教学资源
代码托管:iCenter-GitLab
课程内容
课程准备
计算机系统是完成通用信息处理的最基本单元,涉及计算机硬件与软件两部分。计算机硬件的核心是处理器。
大数据系统
数据科学用于对不同领域的数据进行解析,分析与知识发现。数据科学(Data Science)是一种跨学科的知识体系,是领域专家知识、数学与统计和计算机科学的交集。
大数据系统是实现数据管理和数据分析用途而设计的分布式的多计算机系统。
机器智能
机器智能,是指计算机系统体现的智能的能力,如听说读写到搜索、推理、决策和回答问题等。同时也是指如何设计实现计算机系统和软件,使其具有智能的行为。
科技创新
教学管理
教学计划
课程分组
课程研究
课程项目
2016年秋季-课程项目
项目1-大数据-位图索引
- 任务:基于位图索引的概念和原理,用C++实现一个位图索引数据库。
检验:完成对一段网流数据的索引建立,查询。在虚拟机上运行成功,得到正确结果。
网流数据:\\166.111.134.110\team-saturn\网流数据
代码托管:GitLab
时间:10月7日中午12点之前(特殊情况,推迟一周)(校历第四周)
组织:以组为单位,要求看到所有同学的贡献。
- 作业提交
[[Group1]] | [[Group2]] | [[Group3]] | [[Group4]] |
[[Group5]] | [[Group6]] | [[Group7]] | [[Group8]] |
2017年春季-课程项目
项目1-大数据-位图索引(1)
- 任务:基于位图索引的概念和原理,使用Piloas软件,创建Roaring的位图索引,实现数据查找与计数功能,并记录运行时间。
- 数据:\\101.6.160.42\saturn\网流数据
- 代码托管:GitLab
- 时间:5月27日下午17点之前 (校历第十四周)
- 检验:
- 完成对一段数据(不限网流数据)的索引建立,查询。
- 在虚拟机上运行成功,得到正确结果。
- 提交2页1千字的实验报告。(设计和实现)
- 组织:以个人为单位。
项目2-大数据-位图索引(2)
- 任务:基于位图索引的概念和原理,使用Imply软件(imply),创建Roaring的位图索引,实现数据查找与计数功能,并记录运行时间。
- 数据:\\101.6.160.42\saturn\网流数据
- 代码托管:GitLab
- 时间:6月6日下午17点之前 (校历第十六周)
- 检验:
- 完成对一段数据(不限网流数据)的索引建立,查询。
- 在虚拟机上运行成功,得到正确结果。
- 提交2页1千字的实验报告。(设计和实现)
- 组织:以个人为单位。
参考资料
致谢
本课程获得微软Azure云计算与机器学习捐赠支持。
感谢微软公司 杨滔经理,章艳经理,刘士君工程师,闫伟工程师。