“大数据算法”版本间的差异
来自iCenter Wiki
(以“=大数据算法= ===数据解析=== 数据解析(Data Analytic),是指对数据集的属性值进行SUM,TopN,Rank操作。一般要求实时响应。 *...”为内容创建页面) |
|||
第1行: | 第1行: | ||
− | + | === 数据解析 === | |
− | + | ||
− | ===数据解析=== | + | |
数据解析(Data Analytic),是指对数据集的属性值进行SUM,TopN,Rank操作。一般要求实时响应。 | 数据解析(Data Analytic),是指对数据集的属性值进行SUM,TopN,Rank操作。一般要求实时响应。 | ||
第15行: | 第13行: | ||
# Vigna, Sebastiano. "Broadword implementation of rank/select queries." In International Workshop on Experimental and Efficient Algorithms, pp. 154-168. Springer Berlin Heidelberg, 2008. | # Vigna, Sebastiano. "Broadword implementation of rank/select queries." In International Workshop on Experimental and Efficient Algorithms, pp. 154-168. Springer Berlin Heidelberg, 2008. | ||
− | ===基数估计=== | + | === 基数估计 === |
− | 基数估计(Cardinality | + | 基数估计(Cardinality Estimation),评估一个集合中不同数据项的个数。比如,访问一个网站的独立IP个数。 |
* [https://github.com/Microsoft/CardinalityEstimation Cardinality Estimation Algorithm] | * [https://github.com/Microsoft/CardinalityEstimation Cardinality Estimation Algorithm] |
2017年1月25日 (三) 18:15的版本
数据解析
数据解析(Data Analytic),是指对数据集的属性值进行SUM,TopN,Rank操作。一般要求实时响应。
大数据解析平台,是实现数据解析的分布式软件系统。
- Navarro, Gonzalo, and Eliana Providel. "Fast, small, simple rank/select on bitmaps." In International Symposium on Experimental Algorithms, pp. 295-306. Springer Berlin Heidelberg, 2012.
- Vigna, Sebastiano. "Broadword implementation of rank/select queries." In International Workshop on Experimental and Efficient Algorithms, pp. 154-168. Springer Berlin Heidelberg, 2008.
基数估计
基数估计(Cardinality Estimation),评估一个集合中不同数据项的个数。比如,访问一个网站的独立IP个数。
- Flajolet, Philippe, Éric Fusy, Olivier Gandouet, and Frédéric Meunier. "Hyperloglog: the analysis of a near-optimal cardinality estimation algorithm." DMTCS Proceedings 1 (2008).
- Heule, Stefan, Marc Nunkesser, and Alexander Hall. "HyperLogLog in practice: algorithmic engineering of a state of the art cardinality estimation algorithm." In Proceedings of the 16th International Conference on Extending Database Technology, pp. 683-692. ACM, 2013.