hbase读写流程

zoukankan html css js c++ java

hbase读写流程

HBase读数据流程

1) HRegionServer保存着meta表以及表数据，要访问表数据，首先Client先去访问zookeeper，从zookeeper里面获取meta表所在的位置信息，即找到这个meta表在哪个HRegionServer上保存着。

2) 接着Client通过刚才获取到的HRegionServer的IP来访问Meta表所在的HRegionServer，从而读取到Meta，进而获取到Meta表中存放的元数据。

3) Client通过元数据中存储的信息，访问对应的HRegionServer，然后扫描所在HRegionServer的Memstore和Storefile来查询数据。

4) 最后HRegionServer把查询到的数据响应给Client。

2.3.2、HBase写数据流程

1) Client也是先访问zookeeper，找到Meta表，并获取Meta表信息。

2) 确定当前将要写入的数据所对应的RegionServer服务器和Region。

3) Client向该RegionServer服务器发起写入数据请求，然后RegionServer收到请求并响应。

4) Client先把数据写入到HLog，以防止数据丢失。

5) 然后将数据写入到Memstore。

6) 如果Hlog和Memstore均写入成功，则这条数据写入成功。在此过程中，如果Memstore达到阈值，会把Memstore中的数据flush到StoreFile中。

7) 当Storefile越来越多，会触发Compact合并操作，把过多的Storefile合并成一个大的Storefile。当Storefile越来越大，Region也会越来越大，达到阈值后，会触发Split操作，将Region一分为二。

尖叫提示：因为内存空间是有限的，所以说溢写过程必定伴随着大量的小文件产生。

本文参考自:尽际

查看全文

相关阅读:
Codeforces 552E Vanya and Brackets（枚举 + 表达式计算）
matlab 文件打开设置
 boot and loader
centos6安装bochs
Python list, dict, set, tuple
Python 字符串
 Visual Studio 使用
 汇编语言版本的HelloWorld
用汇编实现add函数
 使用nasm和clang

原文地址：https://www.cnblogs.com/wzlbigdata/p/8408731.html

最新文章
Hadoop -YARN ResourceManager 剖析
 计算机网络
 MySQL
MySQL
计算机网络
 操作系统OS
操作系统OS
操作系统OS
操作系统OS
Linux

HBase读数据流程

2.3.2、HBase写数据流程