大数据-位图索引-实验

2017年9月30日 (六) 00:42Zhenchen讨论 | 贡献的版本

(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)

2016年秋季

项目1-大数据-位图索引

  • 任务:基于位图索引的概念和原理,用C++实现一个位图索引数据库。

检验:完成对一段网流数据的索引建立,查询。在虚拟机上运行成功,得到正确结果。

网流数据:\\166.111.134.110\team-saturn\网流数据

代码托管:GitLab

时间:10月7日中午12点之前(特殊情况,推迟一周)(校历第四周)

组织:以组为单位,要求看到所有同学的贡献。

  • 作业提交
[[Group1]] [[Group2]] [[Group3]] [[Group4]]
[[Group5]] [[Group6]] [[Group7]] [[Group8]]


2017年春季

项目1-大数据-位图索引(1)

  • 任务:基于位图索引的概念和原理,使用Piloas软件,创建Roaring的位图索引,实现数据查找与计数功能,并记录运行时间。
  • 数据:\\101.6.160.42\saturn\网流数据
  • 代码托管:GitLab
  • 时间:5月27日下午17点之前 (校历第十四周)
  • 检验:
  1. 完成对一段数据(不限网流数据)的索引建立,查询。
  2. 在虚拟机上运行成功,得到正确结果。
  3. 提交2页1千字的实验报告。(设计和实现)
  • 组织:以个人为单位。

项目2-大数据-位图索引(2)

  • 任务:基于位图索引的概念和原理,使用Imply软件(imply),创建Roaring的位图索引,实现数据查找与计数功能,并记录运行时间。
  • 数据:\\101.6.160.42\saturn\网流数据
  • 代码托管:GitLab
  • 时间:6月6日下午17点之前 (校历第十六周)
  • 检验:
  1. 完成对一段数据(不限网流数据)的索引建立,查询。
  2. 在虚拟机上运行成功,得到正确结果。
  3. 提交2页1千字的实验报告。(设计和实现)
  • 组织:以个人为单位。

2017年秋季

项目1-大数据-位图索引(1)

  • 任务: 用位图索引加快算法效率。
  • 数据集(待定)。
  • pyRoaringBitMap

https://github.com/Ezibenroc/PyRoaringBitMap

from pyroaring import BitMap
bm1 = BitMap()
bm1.add(3)
bm1.add(18)
bm2 = BitMap([3, 27, 42])
print("bm1       = %s" % bm1)
print("bm2       = %s" % bm2)
print("bm1 & bm2 = %s" % (bm1&bm2))
print("bm1 | bm2 = %s" % (bm1|bm2))

最后修改于2017年9月30日 (星期六) 00:42