更改

大数据系统

添加551字节2020年1月10日 (五) 01:45
=数据管理的目标与任务=
 
问题: 人的大脑不善于记忆的特点。
 
解决方法:人发明的索引,对数据建立索引,发明了数据库软件。
 
=大数据系统的定义=
[[大数据算法]]设计是数据分析中的重要内容。
 
 
= 大数据的存储/管理/处理现状 =
= Spark =
==*BDAS (Berkeley Data Analytics Stack)==
BDAS 是加州大学伯克利分校推出的大数据处理框架。BDAS以Spark软件为核心,结合其他处理软件,组成一套解决方案。
== *RADS(Real-time Analytics Data Stack)==
RADS以Druid为核心,构建大数据实时解析系统。
# Leskovec, Jure, Anand Rajaraman, and Jeffrey David Ullman. Mining of massive datasets. Cambridge University Press, 2014. [http://www.mmds.org/ MMDS_book]
# Redmond, Eric, and Jim R. Wilson. Seven databases in seven weeks: a guide to modern databases and the NoSQL movement. Pragmatic Bookshelf, 2012.
 
 
=数据库-相关书籍=
 
*参考书:
 
M. Tamer Ozsu and Patrick Valduriez., Principles of Distributed Database Systems (third Edition), Springer, 2011.
 
Jeffrey D. Ullman/Jennifer Widom, 《A First Course in Database Systems》,机械工业出版社.2011
 
Avi Silberschatz, Henry F. Korth, S. Sudarshan, Database System Concepts Sixth Edition, McGraw-Hill ISBN 0-07-352332-1
行政员管理员
6,105
个编辑