大致学习路线:
Linux入门 常用基本命令 系统管理 Linux操作增强 Linux shell编程 Hadoop生态 分布式系统概述
Hadoop入门 Hadoop伪分布式 Hadoop全分布式 HDFS基本概念 HDFS的应用开发 HDFS的IO流操作 NameNode工作机制
DataNode工作机制 Zookeeper入门 Zookeeper详解 HA框架原理 Hadoop-HA集群配置 MapReduce框架原理 Shuffle机制
Mapreduce Hive入门 Hive DDL数据定义 Hive分区表 Hive分桶表 Hive查询 Hive的高级查询Join与排序
Hive的函数 Hive DML数据管理 Hive文件存储 Flume详解 Sqoop详解 Hbase概念 Hbase的操作
Hbase整合