zoukankan      html  css  js  c++  java
  • hbase读写流程

    HBase读数据流程

    1) HRegionServer保存着meta表以及表数据,要访问表数据,首先Client先去访问zookeeper,从zookeeper里面获取meta表所在的位置信息,即找到这个meta表在哪个HRegionServer上保存着

    2) 接着Client通过刚才获取到的HRegionServerIP来访问Meta表所在的HRegionServer,从而读取到Meta,进而获取到Meta表中存放的元数据。

    3) Client通过元数据中存储的信息,访问对应的HRegionServer,然后扫描所在HRegionServerMemstoreStorefile来查询数据。

    4) 最后HRegionServer把查询到的数据响应给Client

    2.3.2HBase写数据流程

    1) Client也是先访问zookeeper,找到Meta表,并获取Meta信息

    2) 确定当前将要写入的数据所对应的RegionServer服务器Region

    3) Client向该RegionServer服务器发起写入数据请求,然后RegionServer收到请求并响应。

    4) Client先把数据写入到HLog,以防止数据丢失。

    5) 然后将数据写入到Memstore

    6) 如果HlogMemstore均写入成功,则这条数据写入成功。在此过程中,如果Memstore达到阈值,会把Memstore中的数据flushStoreFile中。

    7) Storefile越来越多,会触发Compact合并操作,把过多的Storefile合并成一个大的Storefile。当Storefile越来越大,Region也会越来越大,达到阈值后,会触发Split操作,将Region一分为二。

    尖叫提示:因为内存空间是有限的,所以说溢写过程必定伴随着大量的小文件产生。

    本文参考自:尽际

  • 相关阅读:
    LeetCode18. 四数之和
    15. 三数之和
    LeetCode202. 快乐数
    LeetCode1. 两数之和
    LeetCode349. 两个数组的交集
    LeetCode242. 有效的字母异位词
    VSCode运行时弹出powershell
    关于cin, cin.get(), getchar(),getline()的字符问题
    剑指 Offer 27. 二叉树的镜像
    BFS zoj 1649
  • 原文地址:https://www.cnblogs.com/wzlbigdata/p/8408731.html
Copyright © 2011-2022 走看看