1、HBase数据模型:逻辑数据模型和物理数据存储,其中逻辑数据模型是用户从数据库所看到的模型,直接与HBase数据建模相关;物理数据模型是面向计算机物理表示的模型,描述了HBase数据在存储介质(包括内存和磁盘)上的组织结构。
2、HBase基本架构
为了将数据表分布到集群中以提供并行读写服务,HBase按照rowkey将数据划分成多个固定大小的有序分区,每个分区被称为一个“region”,这些region会被均衡地存放在不同节点上。HBase是构建在HDFS之上的,所有的region均会以文件的形式保存到HDFS上,以保证这些数据的高可靠存储
HBase采用经典的master/slave架构,与HDFS不同的是,它的master与slave不直接互连,而是通过Zookeeper让两类服务解耦。
3、HBase访问方式
HBase shell、HBase API、数据收集组件、上层算框架以及Apache Phoenix(是一种SQL On HBase的实现方案,它基于HBase构建了一个分布式关系型数据库,能够将SQL转化成一系列HBase scan操作,并以JDBC结果集的方式将结果返回给用户。)