zoukankan      html  css  js  c++  java
  • Hadoop架构——云计算的具体实现

    Hadoop是IT行业一个新的热点,是云计算的一个具体实现、Hadoop本身具有很高的技术含量,是IT工程师学习的首选!下面我们来详细讲讲什么是Hadoop。

    Hadoop是IT行业一个新的热点,是云计算的一个具体实现、Hadoop本身具有很高的技术含量,是IT工程师学习的首选!下面我们来详细讲讲什么是Hadoop。

    完整hadoop讲解视频教程下载地址:

    1、http://kuai.xunlei.com/d/CLCBYHQKJQNT

    2、http://kuai.xunlei.com/d/CSMFERCHAGEE

    Hadoop是什么:

    Hadoop = The Hadoop projects

    Common, Avro, MapReduce, HDFS, Pig, Hive, Hbase, ZooKeeper, Sqoop, Oozie

    Hadoop要解决的两个问题:

    1、海量数据的存储 -- HDFS

    2、海量数据的分析 -- MapReduce

    Hadoop发展的历史:

    始于2002年的apache项目Nutch

    2003年Google发表了关于GFS的论文

    2004年Nutch的开发者开发了NDFS

    2004年Google发表了关于MapReduce的论文

    2005年MapR被引入了NDFS

    2006年改名为Hadoop,NDFS的创始人加入Yahoo,Yahoo成立了一个专门的小组发展Hadoop

    HDFS设计目标:

    1、Very large files

    2、Streaming data access

    write-once, read-many-times

    3、Commodity hardware

    HDFS架构:

    在Hadoop中,一个文件被划分成大小固定的多个文件块,分布的存储在集群中的节点中


    Block:一个文件分块,默认64M

    NameNode:保存整个文件系统的目录信息,文件信息以及文件相应的分块信息。

    DataNode:用于存储Blocks

    HDFS的HA策略:NameNode一旦宕机,整个文件系统将无法工作。

    如果NameNode中的数据丢失,整个文件系统也就丢失了。

    2.x开始,HDFS支持NameNode的active-standy模式。

    转自:http://hechuanzhen.iteye.com/blog/1748102


    微信公众号: 猿人谷
    如果您认为阅读这篇博客让您有些收获,不妨点击一下右下角的【推荐】
    如果您希望与我交流互动,欢迎关注微信公众号
    本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接。

  • 相关阅读:
    多态
    封装
    继承
    面向对象
    2.机器学习相关数学基础
    作业1 机器学习概述
    作业15 语法制导的语义翻译
    作业14 算符优先分析
    作业13 自下而上语法分析
    作业12 实验二 递归下降语法分析
  • 原文地址:https://www.cnblogs.com/heyonggang/p/2827833.html
Copyright © 2011-2022 走看看