zoukankan      html  css  js  c++  java
  • HDFS参数调优总结

                  HDFS参数调优总结

                                            作者:尹正杰

    版权声明:原创作品,谢绝转载!否则将追究法律责任。

    一.DataNode参数调优

    1>.dfs.blockreport.incremental.intervalMsec

     

      如上图所示,官方的默认值是0,意思是当datanode新写一个块时,会立即汇报给namenode。
       
      博主推荐设置为500毫秒,就是当datanode新写一个块,不是立即汇报给namenode,而是要等待500毫秒,在此时间段内新写的块一次性汇报给namenode。该值不宜过大,如果你晚上报数据库,NameNode以为你是没有数据块的,在这个期间NameNode可能会让别的节点创建一个你现在已经有的数据块哟。

    2>.dfs.datanode.data.dir

      如上图所示,如果没有配置数据节点的目录,则数据节点的默认存储位置在本地的"file://{hadoop.tmp.dir}/dfs/data"路径。

      生产环境中建议大家配置数据多目录,多个目录挂载到不同的磁盘上,以增加DataNode并发读写能力。比如生产环境中我们会将每块10T数据盘单独作成Raid 0,然后将多个不同磁盘挂载带不同的目录中。

    3>.dfs.datanode.balance.bandwidthPerSec

      

      如上图所示,官方默认值是10M,根据每秒字节数指定每个数据节点可用于平衡目的的最大带宽量。

      博主推荐设置为100M,如果是都是交换机也是万兆接口的话可以适当调大该值,只要它的带宽不影响到咱们运行任务即可。

    4>.

    5>.

    二.NameNode的参数调优

    1>.

    2>.

    3>.

  • 相关阅读:
    单元测试笔记
    centos7安装rabbitmq
    spring cache之redis使用示例
    ObjectMapper序列化时间
    安装alertmanager
    prometheus安装
    Ribbon配置随访问策略
    优化if..else代码的两种方式
    spring bean的生命周期
    idea热部署
  • 原文地址:https://www.cnblogs.com/yinzhengjie2020/p/12483698.html
Copyright © 2011-2022 走看看