zoukankan      html  css  js  c++  java
  • Hadoop入门学习路线

    走上大数据的自学之路....,Hadoop是走上大数据开发学习之路的第一个门槛。

    Hadoop,是Apache的一个开源项目,开发人员可以在不了解分布式底层细节,开发分布式程序,充分利用集群进行高速运算和存储海量数据。

    核心:分布式存储系统HDFS(Hadoop Distributed File System) 和 MapReduce

    HDFS为海量数据提供存储,MapReduce为海量数据提供分布式计算

    Hadoop的学习路线

     1、Hadoop环境的搭建(单机、伪分布式、集群、HA高可用集群)

     2、Hadoop分布式系统HDFS

     3、MapReduce(经典MapReduce1 和 基于YARN系统的MapReduce2的区别)

     4、Hadoop I/O (了解MapReduce程序参数)(Avor 数据序列化系统)

     5、Yarn系统(MapReduce 2中核心系统)

     6、做一个简单的Hadoop案例(开发MapReduce程序)

     7、Hbase、Zookeeper

     8、Hive

     9、Flume

     10、Sqoop

     11、Mahout

     12、Spark、SparkSQL

     13、Kafka、Storm

    个人参考这篇博客:https://blog.csdn.net/jiangzhexi/article/details/56037170

  • 相关阅读:
    英语语法
    elk笔记2.0
    zabbix4.0-centos6 报错坑,是因为有3.0的包
    jenkins 用户授权
    python随记
    jenkins
    zabbix3.0、4.0 agent安装配置
    常用
    document.createElement()方法
    581. Shortest Unsorted Continuous Subarray(LeetCode)
  • 原文地址:https://www.cnblogs.com/xiaojianfeng/p/9648152.html
Copyright © 2011-2022 走看看