zoukankan      html  css  js  c++  java
  • HBase基础知识

    HBase基础知识
        HBase - Hadoop Database,是一个高可靠,高性能,面向列*,可伸缩的分布式存储系统。
        利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
        HBase利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据。
        HBase利用ZooKeeper作为协调工具。
        1. HBase(NoSQL)的数据模型
        1.1 表(table),是存储管理数据的。
        1.2 行键(row key),类似于MYSql中的主键。是HBase表天然自带的。
        1.3 列族(column family),列的集合。
            HBase中列族是需要在定义表时指定的,列是在插入记录时动态增加的。
            HBase表中的数据,每个列族单独一个文件。
        1.4 时间戳(timestamp),是列(也称作标签,修饰符)的一个属性。
            行键和列确定的单元格,可以存储多个数据,每个数据含有时间戳属性(Map结构),数据具有版本特性。
            如果不指定时间戳或者版本,默认取最新的数据。
            
        1.5 HBase存储的数据都是字节数组。
        1.6 HBase表中的数据是按照行键的顺序物理存储的。
        
        2. HBase的物理模型(区别于HDFS,MapReduce,有自己一套物理模型)
            HBase是存储大数据的,可以进行秒级查询的。
        2.1 HBase是适合海量数据(20PB)的秒级简单查询的数据库。
        2.2 HBase表中的记录,按照行键进行拆分,拆分成一个个的region.
            许多个region存储在region server(单独的物理机器)中的。
            这样,对表的操作转化为对多台region server的并行查询。
            每个region大小通过:hbase.hregion.max.filesize设置,默认10G
        3. HBase的体系结构
        3.1 HBase是主从式结构,HMaster(允许多个),HRegionServer
       

  • 相关阅读:
    HDU 2433 Travel (最短路,BFS,变形)
    HDU 2544 最短路 (最短路,spfa)
    HDU 2063 过山车 (最大匹配,匈牙利算法)
    HDU 1150 Machine Schedule (最小覆盖,匈牙利算法)
    290 Word Pattern 单词模式
    289 Game of Life 生命的游戏
    287 Find the Duplicate Number 寻找重复数
    283 Move Zeroes 移动零
    282 Expression Add Operators 给表达式添加运算符
    279 Perfect Squares 完美平方数
  • 原文地址:https://www.cnblogs.com/hnxubin/p/4449111.html
Copyright © 2011-2022 走看看