海量数据的存取 hdfs (hadoop distributed file system 分布式文件系统)
海量数据的分析 mapReduce (并行计算框架)
Yarn (yet another resource negotiator 资源管理调度系统)
Hadoop处理离线数据
Storm实时的流处理(如实时推荐)
解决海量数据计算 1+2+3+4+5+6+7+8+9
Map: 1+2+3 4+5+6 7+8+9
Reduce: 6+15+24
Hadoop集群物理结构
单节点物理结构
Master: 可能是运行了nameNode secondary nameNode jobTracker
Slave: TaskTracker nataNode