zoukankan      html  css  js  c++  java
  • hadoop中NameNode、DataNode和Client三者之间协作关系及通信方式介绍


    1)NameNode、DataNode和Client

    NameNode能够看作是分布式文件系统中的管理者。主要负责管理文件系统的命名空间、集群配置信息和存储块的复制等。

    NameNode会将文件系统的Meta-data存储在内存中,这些信息主要包含了文件信息、每个文件相应的文件块的信息和每个文件块在DataNode的信息等。

    DataNode是文件存储的基本单元。它将Block存储在本地文件系统中,保存了Block的Meta-data,同一时候周期性地将全部存在的Block信息发送给NameNode。

    Client就是须要获取分布式文件系统文件的应用程序。

    2)文件写入

    Client向NameNode发起文件写入的请求。

    NameNode依据文件大小和文件块配置情况,返回给Client它所管理部分DataNode的信息。

    Client将文件划分为多个Block,依据DataNode的地址信息,按顺序写入到每个DataNode块中。

    3)文件读取

    Client向NameNode发起文件读取的请求。

    NameNode返回文件存储的DataNode的信息。

    Client读取文件信息。

    ----------------------------------------------------------------------------------------------------------------------------------------------------------------

    通信方式介绍:

    在hadoop系统中,master/slaves/client的相应关系是:

    master---namenode。

    slaves---datanode;

    client---dfsclient。

    那到底是通过什么样的方式进行通信的呢,在这里从大体介绍一下:

    简单地讲:

    client和namenode之间是通过rpc通信;

    datanode和namenode之间是通过rpc通信;

    client和datanode之间是通过简单的socket通信。

    随便拔一下DFSClient的代码。能够看到它有一个成员变量public final ClientProtocolnamenode;

    而再拔一下DataNode的代码。能够看到它也有一个成员变量public DatanodeProtocolnamenode

  • 相关阅读:
    字节对齐的问题
    Combination Sum 和Combination Sum II
    Combinations
    算法导论 第六章 思考题6-3 Young氏矩阵
    算法导论 第六章 思考题 6-3 d叉堆
    算法导论 第六章 思考题 6-1 用插入的方法建堆
    Binary Tree Maximum Path Sum
    leetcode candy
    《程序设计与算法(二)算法基础》《第五周 分治》快速排序
    【Tesla】特斯拉Autopilot核心传感器解读之毫米波雷达篇
  • 原文地址:https://www.cnblogs.com/slgkaifa/p/7324692.html
Copyright © 2011-2022 走看看