大数据-位图索引-实验
来自iCenter Wiki
目录
2016年秋季
项目1-大数据-位图索引
- 任务:基于位图索引的概念和原理,用C++实现一个位图索引数据库。
检验:完成对一段网流数据的索引建立,查询。在虚拟机上运行成功,得到正确结果。
网流数据:\\166.111.134.110\team-saturn\网流数据
代码托管:GitLab
时间:10月7日中午12点之前(特殊情况,推迟一周)(校历第四周)
组织:以组为单位,要求看到所有同学的贡献。
- 作业提交
[[Group1]] | [[Group2]] | [[Group3]] | [[Group4]] |
[[Group5]] | [[Group6]] | [[Group7]] | [[Group8]] |
2017年春季
项目1-大数据-位图索引(1)
- 任务:基于位图索引的概念和原理,使用Piloas软件,创建Roaring的位图索引,实现数据查找与计数功能,并记录运行时间。
- 数据:\\101.6.160.42\saturn\网流数据
- 代码托管:GitLab
- 时间:5月27日下午17点之前 (校历第十四周)
- 检验:
- 完成对一段数据(不限网流数据)的索引建立,查询。
- 在虚拟机上运行成功,得到正确结果。
- 提交2页1千字的实验报告。(设计和实现)
- 组织:以个人为单位。
项目2-大数据-位图索引(2)
- 任务:基于位图索引的概念和原理,使用Imply软件(imply),创建Roaring的位图索引,实现数据查找与计数功能,并记录运行时间。
- 数据:\\101.6.160.42\saturn\网流数据
- 代码托管:GitLab
- 时间:6月6日下午17点之前 (校历第十六周)
- 检验:
- 完成对一段数据(不限网流数据)的索引建立,查询。
- 在虚拟机上运行成功,得到正确结果。
- 提交2页1千字的实验报告。(设计和实现)
- 组织:以个人为单位。
2017年秋季
项目1-大数据-位图索引(1)
- 任务: 用位图索引加快算法效率。
- 数据集(待定)。
- pyRoaringBitMap
https://github.com/Ezibenroc/PyRoaringBitMap
from pyroaring import BitMap bm1 = BitMap() bm1.add(3) bm1.add(18) bm2 = BitMap([3, 27, 42]) print("bm1 = %s" % bm1) print("bm2 = %s" % bm2) print("bm1 & bm2 = %s" % (bm1&bm2)) print("bm1 | bm2 = %s" % (bm1|bm2))