HBase 学习（五） Hbase原理解析

zoukankan html css js c++ java

HBase 学习（五） Hbase原理解析
一，HBase系统架构

二，HBase的Region详解

　　2.1 region的实例解析

　　2.2 Region的寻址

三，HBase的写逻辑

　　3.1 Hbase的写入逻辑

　　3.2 MemStore刷盘

　　3.3 Hlog

　　　　3.3.1 Hlog简介

　　　　3.3.2 Hlog结构

　　　　3.3.3 Hlog的生命周期

　　

　

正文

原文地址：https://www.cnblogs.com/qcloud1001/p/7615526.html

一，HBase系统架构

　　如下图所示：Hbase的系统架构

　　

　　从上图得出：Hbase是由Client、Zookeeper、Master、HRegionServer、HDFS等几个组建组成。

　　　　Client：Client包含了访问Hbase的接口，另外Client还维护了对应的cache来加速Hbase的访问，比如cache的.META.元数据的信息。

　　　　Zookeeper在HBase的作用：

　　　　Hbase通过Zookeeper来做master的高可用、RegionServer的监控、元数据的入口以及集群配置的维护等工作。

　　　　通过Zoopkeeper来保证集群中只有1个master在运行，如果master异常，会通过竞争机制产生新的master提供服务

　　　　通过Zoopkeeper来监控RegionServer的状态，当RegionSevrer有异常的时候，通过回调的形式通知Master RegionServer上下限的信息

　　　　通过Zoopkeeper存储元数据的统一入口地址

　　　　Hmaster：

　　　　为RegionServer分配Region
　　　　维护整个集群的负载均衡
　　　　维护集群的元数据信息
　　　　发现失效的Region，并将失效的Region分配到正常的RegionServer上
　　　　当RegionSever失效的时候，协调对应Hlog的拆分

　　　　HregionServer：

　　　　HregionServer直接对接用户的读写请求，是真正的“干活”的节点。它的功能概括如下：
　　　　管理master为其分配的Region
　　　　处理来自客户端的读写请求
　　　　负责和底层HDFS的交互，存储数据到HDFS
　　　　负责Region变大以后的拆分
　　　　负责Storefile的合并工作

　　　　HDFS在Hbase的作用：

　　　　HDFS为Hbase提供最终的底层数据存储服务，同时为Hbase提供高可用（Hlog存储在HDFS）的支持，具体功能概括如下：
　　　　提供元数据和表数据的底层分布式存储服务
　　　　数据多副本，保证的高可靠和高可用性

二，HBase的Region详解

　　前面已经介绍了Region类似于数据库的分片和分区的概念，每个Region负责一小部分Rowkey范围的数据的读写和维护，Region包含了对应的起始行到结束行的所有信息。master将对应的region分配给不同的RergionServer，由RegionSever来提供Region的读写服务和相关的管理工作。这部分主要介绍Region实例以及Rgeion的寻找路径。

　　2.1 region的实例解析

　　

　　

　　上图模拟了一个Hbase的表是如何拆分成region，以及分配到不同的RegionServer中去。上面是1个Userinfo表，里面有7条记录，其中rowkey为0001到0002的记录被分配到了Region1上，Rowkey为0003到0004的记录被分配到了Region2上，而rowkey为0005、0006和0007的记录则被分配到了Region3上。region1和region2被master分配给了RegionServer1（RS1），Region3被master配分给了RegionServer2（RS2）

　　备注：这里只是为了更容易的说明拆分的规则，其实真实的场景并不会几条记录拆分到不通的Region上，而是到一定的数据量才会拆分，具体的在Region的拆分那部分再具体的介绍。

　　2.2 Region的寻址

　　既然读写都在RegionServer上发生，我们前面有讲到，每个RegionSever为一定数量的region服务，那么client要对某一行数据做读写的时候如何能知道具体要去访问哪个RegionServer呢？那就是接下来我们要讨论的问题。

　　

　　如上图所示，访问路径有3步：

　　第1步：Client请求ZK获取.META.所在的RegionServer的地址。

　　第2步：Client请求.META.所在的RegionServer获取访问数据所在的RegionServer地址，client会将.META.的相关信息cache下来，以便下一次快速访问。

　　第3步：Client请求数据所在的RegionServer，获取所需要的数据。

　　这里还有一个问题需要说明，那就是Client会缓存.META.的数据，用来加快访问，既然有缓存，那它什么时候更新？如果.META.更新了，比如Region1不在RerverServer2上了，被转移到了RerverServer3上。client的缓存没有更新会有什么情况？
　　其实，Client的元数据缓存不更新，当.META.的数据发生更新。如上面的例子，由于Region1的位置发生了变化，Client再次根据缓存去访问的时候，会出现错误，当出现异常达到重试次数后就会去.META.所在的RegionServer获取最新的数据，如果.META.所在的RegionServer也变了，Client就会去ZK上获取.META.所在的RegionServer的最新地址

三，HBase的写逻辑

　　Hbase的写逻辑涉及到写内存、写log、刷盘等操作，看起来简单，其实里面又有很多的逻辑，下面就来做详细的介绍

　　3.1 Hbase的写入逻辑

　　下面是写流程图：

　　

　　从上图可以看出氛围3步骤：

　　第1步：Client获取数据写入的Region所在的RegionServer
　　第2步：请求写Hlog
　　第3步：请求写MemStore

　　只有当写Hlog和写MemStore都成功了才算请求写入完成。MemStore后续会逐渐刷到HDFS中。

　　备注：Hlog存储在HDFS，当RegionServer出现异常，需要使用Hlog来恢复数据。

　　3.2 MemStore刷盘

　　为了提高Hbase的写入性能，当写请求写入MemStore后，不会立即刷盘。而是会等到一定的时候进行刷盘的操作。具体是哪些场景会触发刷盘的操作呢？总结成如下的几个场景：

　　1、全局内存控制

　　这个全局的参数是控制内存整体的使用情况，当所有memstore占整个heap的最大比例的时候，会触发刷盘的操作。这个参数是hbase.regionserver.global.memstore.upperLimit，默认为整个heap内存的40%。但这并不意味着全局内存触发的刷盘操作会将所有的MemStore都进行输盘，而是通过另外一个参数hbase.regionserver.global.memstore.lowerLimit来控制，默认是整个heap内存的35%。当flush到所有memstore占整个heap内存的比率为35%的时候，就停止刷盘。这么做主要是为了减少刷盘对业务带来的影响，实现平滑系统负载的目的。

　　2、MemStore达到上限

　　当MemStore的大小达到hbase.hregion.memstore.flush.size大小的时候会触发刷盘，默认128M大小

　　3、RegionServer的Hlog数量达到上限

　　前面说到Hlog为了保证Hbase数据的一致性，那么如果Hlog太多的话，会导致故障恢复的时间太长，因此Hbase会对Hlog的最大个数做限制。当达到Hlog的最大个数的时候，会强制刷盘。这个参数是hase.regionserver.max.logs，默认是32个。

　　4、手工触发

　　可以通过hbase shell或者java api手工触发flush的操作。

　　5、关闭RegionServer触发

　　在正常关闭RegionServer会触发刷盘的操作，全部数据刷盘后就不需要再使用Hlog恢复数据。

　　6、Region使用HLOG恢复完数据后触发

　　当RegionServer出现故障的时候，其上面的Region会迁移到其他正常的RegionServer上，在恢复完Region的数据后，会触发刷盘，当刷盘完成后才会提供给业务访问

　　3.3 Hlog

　　　　3.3.1 Hlog简介

　　Hlog是Hbase实现WAL（Write ahead log）方式产生的日志信息，内部是一个简单的顺序日志。每个RegionServer对应1个Hlog(备注：1.x版本的可以开启MultiWAL功能，允许多个Hlog)，所有对于该RegionServer的写入都被记录到Hlog中。Hlog实现的功能就是我们前面讲到的保证数据安全。当RegionServer出现问题的时候，能跟进Hlog来做数据恢复。此外为了保证恢复的效率，Hbase会限制最大保存的Hlog数量，如果达到Hlog的最大个数（hase.regionserver.max.logs参数控制）的时候，就会触发强制刷盘操作。对于已经刷盘的数据，其对应的Hlog会有一个过期的概念，Hlog过期后，会被监控线程移动到 .oldlogs，然后会被自动删除掉。

　　Hbase是如何判断Hlog过期的呢？要找到这个答案，我们就必须了解Hlog的详细结构。

　　　　3.3.2 Hlog结构

　　下图是Hlog的详细结构：

　　

　　

　　从上图我们可以看出都个Region共享一个Hlog文件，单个Region在Hlog中是按照时间顺序存储的，但是多个Region可能并不是完全按照时间顺序。

　　每个Hlog最小单元由Hlogkey和WALEdit两部分组成。Hlogky由sequenceid、timestamp、cluster ids、regionname以及tablename等组成，WALEdit是由一系列的KeyValue组成，对一行上所有列（即所有KeyValue）的更新操作，都包含在同一个WALEdit对象中，这主要是为了实现写入一行多个列时的原子性。

　　注意，图中有个sequenceid的东东。sequenceid是一个store级别的自增序列号，这东东非常重要，region的数据恢复和Hlog过期清除都要依赖这个东东。下面就来简单描述一下sequenceid的相关逻辑。
- Memstore在达到一定的条件会触发刷盘的操作，刷盘的时候会获取刷新到最新的一个sequenceid的下一个sequenceid，并将新的sequenceid赋给oldestUnflushedSequenceId，并刷到Ffile中。有点绕，举个例子来说明：比如对于某一个store，开始的时候oldestUnflushedSequenceId为NULL，此时，如果触发flush的操作，假设初始刷盘到sequenceid为10，那么hbase会在10的基础上append一个空的Entry到HLog，最新的sequenceid为11，然后将sequenceid为11的号赋给oldestUnflushedSequenceId，并将oldestUnflushedSequenceId的值刷到Hfile文件中进行持久化。
- Hlog文件对应所有Region的store中最大的sequenceid如果已经刷盘，就认为Hlog文件已经过期，就会移动到.oldlogs，等待被移除。
- 当RegionServer出现故障的时候，需要对Hlog进行回放来恢复数据。回放的时候会读取Hfile的oldestUnflushedSequenceId中的sequenceid和Hlog中的sequenceid进行比较，小于sequenceid的就直接忽略，但与或者等于的就进行重做。回放完成后，就完成了数据的恢复工作。
　　　　3.3.3 Hlog的生命周期

　　Hlog从产生到最后删除需要经历如下几个过程：
查看全文

相关阅读:
Django+xadmin打造在线教育平台（八）
Django+xadmin打造在线教育平台（七）
Django+xadmin打造在线教育平台（六）
Django+xadmin打造在线教育平台（五）
Django+xadmin打造在线教育平台（四）
Django+xadmin打造在线教育平台（三）
Django+xadmin打造在线教育平台（二）
Django+xadmin打造在线教育平台（一）
Linux环境部署（一）
centOS的联网问题

原文地址：https://www.cnblogs.com/tashanzhishi/p/10918903.html

HBase 学习（五） Hbase原理解析

正文

原文地址：https://www.cnblogs.com/qcloud1001/p/7615526.html

一，HBase系统架构

二，HBase的Region详解

2.1 region的实例解析

2.2 Region的寻址

三，HBase的写逻辑

3.1 Hbase的写入逻辑

3.2 MemStore刷盘

3.3 Hlog

3.3.1 Hlog简介

3.3.2 Hlog结构

3.3.3 Hlog的生命周期

　　2.1 region的实例解析

　　2.2 Region的寻址

　　3.1 Hbase的写入逻辑

　　3.2 MemStore刷盘

　　3.3 Hlog

　　　　3.3.1 Hlog简介

　　　　3.3.2 Hlog结构

　　　　3.3.3 Hlog的生命周期