为什么学习HBase?
1. 需要实时随机访问超大规模数据集的场景
2. 针对分布式计算而设计的NoSql数据库
3. 与Hadoop紧密结合
特点:
1. 基于Google的BigTable论文的理论基础
2. 基于列存储的NoSql数据库
3. 基于HDFS的分布式存储
本质只有插入操作
高可靠性,可扩展性
1. HBase体系结构
Hbase是根据主从服务器而设定的
HMaster服务器+多个HRegionServer服务器组成
HMaster:告诉每个HRegionServer需要维护那些HRegion
HRegionServer:维护HRegion,响应用户I/O请求,读写HDFS中的数据
HRegion:对表的加分,保存表中一段连续的数据,其中每个Sotre保存一个列族
Zookeeper:监控各个机器的状态,协调各服务器运行
2. HBase数据模型
概念视图:
物理视图:
传统数据库和HBase的比较