zoukankan      html  css  js  c++  java
  • HBase调优案例(三)——Spark访问HBase慢

    负载信息:RegionServer:3个

                      Region:5400多个

    现象:在使用Spark对HBase进行scan操作时发现有些task执行比较慢

    原因分析:查看Spark应用的executor日志,发现查询慢的都是027节点请求的。

         获取此节点的regionServer日志,发现scan的时候有responseTooSlow的打印。

            查询日志发现这段时间在regionServer上出现很多次GC pause的打印,说明当前内存不足。

    综上,当前regionServer内存的配置不足以应付高并发状态下的RPC请求。由于实际节点上的业务量/数据量/请求个数存在略微差异,使027节点处理请求时GC出现了延迟。当Spark多并发task执行的时候,GC的pause不能及时地处理查询请求,从而影响整个查询的时间。

    解决:

      调整HMaster的内存及Handler相关配置

      1.调整HMaster和RegionServer的GC_OPTS(垃圾回收参数)

      RegionServer调整为:

      Xms 6G——>16G

      -Xmx 6G——>16G

      NewSize 64M——>512M

      Max NewSize 128M——>512M

      Max DirectMemorySize 128M——>1024M

      HMaster调整为:

      Xms 1G——2G

      -Xmx 1G——>2G

      NewSize 64M——>256M

      Max NewSize 128M——>512M

      Max DirectMemorySize 128M——>512M

      2.调整RPC Handler(regionServer上处理RPC请求的线程实例数)

      hbase.regionserver.handler.count 100——>300

      hbase.regionserver.metahandler.count 10——>100

  • 相关阅读:
    laravel 服务容器,容器概念
    初识swoole
    一个小demo---递归计算子类下的某个值的总和
    微信支付の退款申请
    Box/Spout处理excel和csv
    mysql 获取指定日期的周/月开始 和 周/月结束
    时间字段规定模式获取
    异步服务器之心跳检测
    larave -- leftJoin IFNULL 链表查询
    Mac版Navicat破解
  • 原文地址:https://www.cnblogs.com/lingluo2017/p/8727942.html
Copyright © 2011-2022 走看看