Hadoop是谷歌的集群系统的开源实现: -google集群系统:GFS、MapReduce、BigTable -Hadoop主要由HDFS(hadoop distrubuted file system)、MapReduce和HBase组成。 -hadoop的初衷是为解决Nutch的海量数据爬取和存储的需要 -hadoop于2005年秋作为Lucene的子项目Nutch的一部分正式引入Apache基金会
Hadoop子项目:
官网:http://hadoop.apache.org/