基础:
1.SQL功底
2.linux基础命令
3.JavaSE
第一阶段:Hadoop 2.x (HDFS、MapReduce、YARN)
第二阶段:大数据仓库Hive
第三阶段:大数据协作框架(sqoop、Flume、Oozie、Hue)
第四阶段:分布式数据库Hbase
第五阶段:流计算Storm
第六阶段:内存计算框架Spark
第七阶段:企业大数据平台 ( Cloudera Manager )
大数据应用分析:
1. 统计
2. 推荐
3. 机器学习
4. 人工智能,预测(算法)
SQL-on-Hadoop
1. Hive
2. Prestore
3. Impala
4. Phoneix (基于HBase)
5. Spark-SQL