hadoop 一个开源的,稳定的,可扩展的,分布式的计算框架
实现单一的服务器到成千上万机器之间共同处理数据的一个可扩展性框架
Hadoop 项目主要包含以下四个模块
Hadoop Common:为其他Hadoop 模块提供基础性设施
Hadoop Distributed System(HDFS):一个高可靠,高吞吐量的分布式文件系统
Hadoop MapReduce:分布式离线并行计算框架
Hadoop YARN:一个新的mapReduce框架,任务调度和资源管理