Hadoop_10_HDFS 的 DataNode工作机制

zoukankan html css js c++ java

Hadoop_10_HDFS 的 DataNode工作机制
1.DataNode的工作机制:

　　1、DataNode工作职责：存储管理用户的文件块数据

　　　　　　　　　　　　 定期向namenode汇报自身所持有的block信息（通过心跳信息上报）

　　（这点很重要，因为，当集群中发生某些block副本失效时，集群如何恢复block初始副本数量的问题）

　　 2.配置文件:
<property> <name>dfs.blockreport.intervalMsec</name> <value>3600000</value> <description>Determines block reporting interval in milliseconds.</description> </property>
2.DataNode掉线判定时限:

　　datanode进程死亡或者网络故障造成datanode无法与namenode通信，namenode不会立即把该节点判定为

死亡，要经过一段时间，这段时间暂称作超时时长。HDFS默认的超时时长为10分钟+30秒。如果定义超时时间

为timeout，则超时时长的计算公式为：

　　timeout = 2 * heartbeat.recheck.interval + 10 * dfs.heartbeat.interval　

　　而默认的heartbeat.recheck.interval 大小为5分钟，dfs.heartbeat.interval默认为3秒

　　需要注意的是hdfs-site.xml 配置文件中的heartbeat.recheck.interval的单位为毫秒，dfs.heartbeat.

interval的单位为秒

　　举例，如果heartbeat.recheck.interval设置为5000（毫秒），dfs.heartbeat.interval设置为3（秒，默认）

，则总的超时时间为40秒
<property> <name>heartbeat.recheck.interval</name> <value>2000</value> </property> <property> <name>dfs.heartbeat.interval</name> <value>1</value> </property>
3.总结：

　　datanode不是一下线就会被namenode认定为下线的，有一个超时时间
查看全文

相关阅读:
C# 使用 Microsoft.Feeds 组件获取 RSS 全文
 使用 Jquery 做类似搜索引擎效果
 ASP.NET MVC 利用 IHttpModule 实现路由调试
 Python 爬虫类库 Selenium 的常用方法介绍
 C# 中 New 关键词的几种用法
 ASP.NET 使用 IIS URL Rewrite 模块实现伪静态
 Java 源码分析之 HashTable
Java 类中代码块和构造方法的执行顺序
 C# 中使用 FFmpeg.NET
C# 项目中使用 ServiceStack.Redis 操作 Redis

原文地址：https://www.cnblogs.com/yaboya/p/9195845.html