1.Hadoop是什么?
答:Hadoop是开源的分布式存储和分布式计算平台。
2.Hadoop的组成是什么?
答:Hadoop由HDFS和MapReduce这两个核心部分组成。
HDFS(Hadoop Distribute File System)即Hadoop分布式文件系统,用于存储海量的数据。
MapReduce即并行处理框架,实现任务分离和调度。
3.Hadoop可以用来做什么?
答:Hadoop可以用来搭建大型数据仓库,PB级数据存储,处理,分析和统计等业务。常用的应用场景如图1所示。
4.Hadoop的优势是什么?
答:可扩展性,低成本,成熟的生态圈
5.Hadoop的人才需求?
答:第一类是开发类人才,利用Hadoop去开发并行程序,分布式程序。
第二类是运维人才,运维一个大规模的Hadoop集群。