zoukankan      html  css  js  c++  java
  • Mac下安装HBase及详解

    Mac下安装HBase及详解

    1. 千篇一律的HBase简介


    HBase是Hadoop的数据库, 而Hive数据库的管理工具, HBase具有分布式, 可扩展及面向列存储的特点(基于谷歌BigTable). HBase可以使用本地文件系统和HDFS文件存储系统, 存储的是松散的数据(key-value的映射关系).

    HBase位于HDFS的上层, 向下提供存储, 向上提供运算

    2. HBase安装


    HBase有单机, 伪分布式, 全分布式运行模式

    依赖:

    • 匹配HBase的Hadoop版本
    • Java JDK 1.6+
    • SSH

    安装

    $ brew install hbase
    # 安装在/usr/local/Cellar/hbase/1.0.0

    配置HBase

    conf/hbase-env.sh设置JAVA_HOME

    $ cd /usr/local/Cellar/hbase/1.0.0/libexec/conf
    $ vim hbase-env.sh
    
    export JAVA_HOME="/usr/bin/java"

    conf/hbase-site.xml设置HBase的核心配置

    $ vim hbase-site.xml
    
    <configuration>
      <property>
        <name>hbase.rootdir</name>
        //这里设置让HBase存储文件的地方
        <value>file:///Users/andrew_liu/Downloads/hbase</value>
      </property>
      <property>
        <name>hbase.zookeeper.property.dataDir</name>
        //这里设置让HBase存储内建zookeeper文件的地方
        <value>/Users/andrew_liu/Downloads/zookeeper</value>
      </property>
    </configuration>

    /usr/local/Cellar/hbase/1.0.0/bin/start-hbase.sh提供HBase的启动

    $ ./start-hbase.sh                                          
    starting master, logging to /usr/local/Cellar/hbase/1.0.0/libexec/bin/../logs/hbase-andrew_liu-master-Andrew-liudeMacBook-Pro.local.out

    验证是否安装成功

    $ jps
    
    3440 Jps
    3362 HMaster # 有HMaster则说明安装成功
    1885

    启动HBase Shell

    $ ./bin/hbase shell
    
    HBase Shell; enter 'help<RETURN>' for list of supported commands.
    Type "exit<RETURN>" to leave the HBase Shell
    Version 1.0.0, r6c98bff7b719efdb16f71606f3b7d8229445eb81, Sat Feb 14 19:49:22 PST 2015
    
    1.8.7-p357 :001 >
    1.8.7-p357 :001 > exit  #退出shell

    停止HBase运行

    $ ./bin/stop-hbase.sh
    stopping hbase....................

    3. 伪分布式模式

    必须关闭HBase

    修改hbase-env.sh

    HBASE_MANAGE_XK = true

    修改hbase-site.xml, 设置HBase使用分布式模式运行

    <configuration>
      <property>
        <name>hbase.rootdir</name>
        //Here you have to set the path where you want HBase to store its files.
        <value>hdfs://localhost:8020/hbase</value>
      </property>
      <property>
        <name>hbase.cluster.distributed</name>
      <value>true</value>
    </property>
    </configuration>

    hbase.rootdir路径一定要跟hadoop中core-site.xml中fs.default.name相同

    change the hbase.rootdir from the local filesystem to the address of your HDFS instance ---offical quick start

    如何两处设置不同会引起ERROR: Can't get master address from ZooKeeper; znode data == null错误错误

    在启动HBase之前, 请先启动Hadoop, 使之运行

    启动HBase

    $ ./start-hbase.sh
    $ jps  #验证是否启动成功, 包含HMaster和HRegionServer说明启动成功
    
    6400 DataNode
    7872 Jps
    7702 HMaster  
    7624 HQuorumPeer
    6315 NameNode
    6508 SecondaryNameNode
    6716 NodeManager
    7804 HRegionServerHBase 
    6623 ResourceManager

    如果在启动HBase后, 提示如下

    regionserver running as process 4667. Stop it first.
    #请执行以下操作
    $ kill -9 4667  #这里4667是要杀掉的进程号

    启动成功HBase会在HDFS下创建/hbase目录

    $ hdfs dfs -ls /hbase

    4. HBase Shell


    $ hbase shell  #启动HBase Shell
    
    #创建表
    > create 'student', 'description', 'course'  #创建表名为student的表, 指明两个列名, 分别为description和course
    
    #信息明细
    > list 'student'  #列出list表信息
    
    #插入数据
    > put 'student', 'row1', 'description:age', '18'  #意思为在student表row1处插入description:age的数据为18
    > put 'student', 'row1', 'description:name', 'liu'
    put 'student', 'row1', 'course:chinese', '100'
    
    #一次扫描所有数据
    > scan 'student
    
    #使表失效 / 有效
    > disable 'student'
    > enable 'student'
    
    #删除表(要先disable)
    >  drop 'student'
    
    #退出shell
    > quit

    5. HBase与HDFS


    HBase是一个稀疏的长期存储的, 多维度的, 排序的映射表, 通过行键, 行键 + 时间戳 或 行键 + 列(列族: 列修饰符)就可以定位特殊的数据

    5.1. HBase体系结构

    HBase的服务器体系遵从简单的主从服务器架构, 由HRegion服务器群HBase服务器构成, Master服务器负责管理所有的HRegion服务器, 而HBase中所有的服务器通过ZooKeeper来进行协调并处理HBase服务器运行期间可能遇到的错误.

    HBase逻辑上的表可能会被划分为多个HRegion, 然后存储在HRegion服务器上.

    • HBase不涉及数据的直接删除和更新, 当Store中的Storefile数量超出阈值会触发合并操作
    • HMaster的主要任务是告诉每个HRegion服务器它要维护那些HRegion
    • ZooKeeper存储的是HBase中ROOT表和META表的位置, ZooKeeper还负责监控各个机器的状态

    元数据子表采用三级索引结构: 根子表->用户表的元数据表->用户表

    5.2. Java API

    • HBaseConfiguration, 通过此类对HBase进行配置
    • HBaseAdmin, 提供一个接口来管理HBase数据库的表信息, 提供创建, 删除表, 列出表项, 使表有效或无效, 以及添加或删除列族成员
    • HTableDescriptor, 包含了表的名字及对应表的列族
    • HColumnDescriptor, 维护关于列族的信息
    • HTable, 用来与HBase表进行通信
    • Put, 用来对单个行执行添加操作
    • Get, 用来获取单个行的相关信息
    • Result, 存储Get或者Scan操作后获取的表的单行值

    6. 参考链接


  • 相关阅读:
    [OpenGL ES 071]光照原理
    [OpenGL ES 03]3D变换:模型,视图,投影与Viewport
    [日志]当今最流行的网络生僻字,很火
    [日志]关于茶的基础知识
    [健康]快速除牙痛的八个小验方
    [日志]我们生活中的潜规则
    [日志]做事要方,做人要圆
    [日志]家居装修花钱看你怎么省
    [日志]非常宝贵的工作经验
    [日志]你用的着的一些家装尺寸数据
  • 原文地址:https://www.cnblogs.com/timssd/p/5876258.html
Copyright © 2011-2022 走看看