---恢复内容开始---
Hadoop 两大核心:集群 分布式存储 分布式处理
Spark基于内存计算 MapReduce基于磁盘的计算
hive数据仓库--sql语句 pig流数据处理---sql语句(轻量级的)
Oozie作业流调度系统
Hadoop安装
---恢复内容结束---