大数据框架:现阶段用的最多的就hadoop、spark、flinnk。三者都是apache软件基金会的顶级开源项目。
Hadoop: Apache Hadoop 软件库是一个允许在计算机集群上通过分布式运算使用简单编程模式处理大型的数据集合
Spark: Apache Spark 是一个为海量数据处理的统一分析引擎。
Flink: Apache Flinnk 是一个分布式,高效且使终可用的开源流处理框架和精确的数据流应用程序。
大数据技术框架见附件:
数据处理:
参考:
http://hadoop.apache.org
http://spark.apache.org
http://flink.apache.org
链接: