HDFS读写流程 - 走看看

zoukankan html css js c++ java

HDFS读写流程

读程图：

1、客户端发送请求，调用DistributedFileSystem API的open方法发送请求到Namenode，获得block的位置信息，因为真正的block是存在Datanode节点上的，而namenode里存放了block位置信息的元数据。

2、Namenode返回所有block的位置信息，并将这些信息返回给客户端。

3、客户端拿到block的位置信息后调用FSDataInputStream API的read方法并行的读取block信息，图中4和5流程是并发的，block默认有3个副本，所以每一个block只需要从一个副本读取就可以。

4、datanode返回给客户端。

写流程：

1、客户端发送请求，调用DistributedFileSystem API的create方法去请求namenode，并告诉namenode上传文件的文件名、文件大小、文件拥有者。

2、namenode根据以上信息算出文件需要切成多少块block，以及block要存放在哪个datanode上，并将这些信息返回给客户端。

3、客户端调用FSDataInputStream API的write方法首先将其中一个block写在datanode上，每一个block默认都有3个副本，并不是由客户端分别往3个datanode上写3份，而是由

已经上传了block的datanode产生新的线程，由这个namenode按照放置副本规则往其它datanode写副本，这样的优势就是快。

4、写完后返回给客户端一个信息，然后客户端在将信息反馈给namenode。

5、需要注意的是上传文件的拥有者就是客户端上传文件的用户名，举个例子用windows客户端上传文件，那么这个文件的拥有者就是administrator，和linux上的系统用户名不是一样的。

查看全文

相关阅读:
相册垂直居中; 水平居中. 1)宽度大于高度, 宽度 100%; 2) 高度大于宽度 , 高度100%; getimagesize , list --->line-height , text-align, vertical-align, max-height, max-width
PHPexcel 导入import 数据到 mysql: mysql 查询数据是否存在, 如果存在返回id, 不存在, 插入返回id. 2) mysql_query , mysql_connect, mysql_select_db, mysql_error, mysql_num_rows,mysql_close
css 利用border 绘制三角形. triangle
css 1) calc() 函数的使用. 2)box-sizing:border-box
css 实现省略号. text-overflow: ellipsis; 同时设置四个属性才可以.
table 表头固定 thead固定. 1) 使用jquery.freezeheader.js
MapReduce的Shuffle机制
 MapReduce的ReduceTask执行机制
 MapReduce的MapTask执行机制
 MapReduce逻辑切片规则

原文地址：https://www.cnblogs.com/fssqblogsit/p/6938999.html