zoukankan      html  css  js  c++  java
  • Hbase 安装配置

    1. 下载安装包 hbase-0.98.6-cdh5.3.6.tar.gz    解压,

    链接:https://pan.baidu.com/s/1vsz2Cqh2cp0n99sHS_xBzg 
    提取码:4abh

    2. 进入 conf 中 配置  hbase-env.sh, 配置 JAVA_HOME, 配置 是否使用 hbase 自带的 zookeeper,

    export JAVA_HOME=/home/cmcc/server/jdk1.8.0_181
    export HBASE_MANAGES_ZK=false

    3. hbase-site.xml  (hdfs 中创建   /hbase 目录)

    1》nameNode 节点名称(如下是单节点的)
    <property>
        <name>hbase.rootdir</name>
        <value>hdfs://hadoop1:9000/hbase</value>
    </property>
    2》是否让 hbase 支持分布式

     <property>
          <name>hbase.cluster.distributed</name>
          <value>true</value>
     </property>

    3》配置 hbase 端口号
      (1) 第一种方式, 只写端口号, 因为Hmaster 会用到高可用

        <property>
            <name>hbase.master.port</name>
            <value>600000</value>
        </property>

      (2) 第二种方式是指定某台固定的机器

        <property>
            <name>hbase.master.port</name>
            <value>hadoop1:600000</value>
        </property>

    4》配置 zookeeper ,zookeeper必须是奇数个,如果是多台>1台,  配置成:<value>hadoop1:2181,hadoop2:2181,hadoop3:2181</value>
      <property>

          <name>hbase.zookeeper.quorum</name>
          <value>hadoop1:2181</value>
      </property>

      5》配置 zookeeper data 目录

      <property>
        <name>hbase.zookeeper.property.dataDir</name>
        <value>/home/cmcc/server/zookeeper/data</value>
      </property>

      6》配置 zookeeper 端口

      <property>
          <name>hbase.zookeeper.property.clientPort</name>
          <value>2181</value>
       </property>

      7》使用本地文件系统设置为false,使用hdfs设置为true
       <property>
           <name>hbase.unsafe.stream.capability.enforce</name>
          <value>true</value>
      </property>

    4. 编辑 regionservers,  相当于 slave 文件

      如果是单机,  添加: hadoop1

      如果是多台, 添加:

        hadoop1

        hadoop2

        hadoop3

    5. 将 lib 中 所有 hadoop 开头的jar包删除,  再到 hadoop中将如下对应的jar包拷贝到lib目录下,  zookeeper 的jar包到zookeeper 中拷贝

      首先进入到 hadoop 目录下,  搜索出一个jar包,  拷贝到指定目录

      find -name hadoop-annotations /home/cmcc/server/t1/     最后将所有jar包拷贝到lib目录中  (如果是集群,  不要忘记到其他机器上做)

    hadoop-annotations-2.5.0.jar
    hadoop-auth-2.5.0-cdh5.3.6.jar
    hadoop-client-2.5.0-cdh5.3.6.jar
    hadoop-common-2.5.0-cdh5.3.6.jar
    hadoop-hdfs-2.5.0-cdh5.3.6.jar
    hadoop-mapreduce-client-app-2.5.0-cdh5.3.6.jar
    hadoop-mapreduce-client-common-2.5.0-cdh5.3.6.jar
    hadoop-mapreduce-client-core-2.5.0-cdh5.3.6.jar
    hadoop-mapreduce-client-hs-2.5.0-cdh5.3.6.jar
    hadoop-mapreduce-client-hs-plugins-2.5.0-cdh5.3.6.jar
    hadoop-mapreduce-client-jobclient-2.5.0-cdh5.3.6.jar
    hadoop-mapreduce-client-jobclient-2.5.0-cdh5.3.6-tests.jar
    hadoop-mapreduce-client-shuffle-2.5.0-cdh5.3.6.jar
    hadoop-yarn-api-2.5.0-cdh5.3.6.jar
    hadoop-yarn-applications-distributedshell-2.5.0-cdh5.3.6.jar
    hadoop-yarn-applications-unmanaged-am-launcher-2.5.0-cdh5.3.6.jar
    hadoop-yarn-client-2.5.0-cdh5.3.6.jar
    hadoop-yarn-common-2.5.0-cdh5.3.6.jar
    hadoop-yarn-server-applicationhistoryservice-2.5.0-cdh5.3.6.jar
    hadoop-yarn-server-common-2.5.0-cdh5.3.6.jar
    hadoop-yarn-server-nodemanager-2.5.0-cdh5.3.6.jar
    hadoop-yarn-server-resourcemanager-2.5.0-cdh5.3.6.jar
    hadoop-yarn-server-tests-2.5.0-cdh5.3.6.jar
    hadoop-yarn-server-web-proxy-2.5.0-cdh5.3.6.jar
    htrace-core-3.1.0-incubating.jar
    aws-java-sdk-1.7.4.jar
    zookeeper
    -3.4.5-cdh5.3.6.jar

    6. 将 hbase+hadoop_repository.tar.gz   CDH_HadoopJar.tar.gz   拷贝到 lib 目录中, 到 1 中的 网盘中下载  (如果是集群,  不要忘记到其他机器上做)

    7. 将 hadoop 中的 core-site.xml,  hdfs-site.xml  拷贝到 hbase中的 conf 中  (如果是集群,  不要忘记到其他机器上做)

    8. 启动服务

    bin/start-hbase.sh

    9. hbase 简单操作

    1》 进入 shell 命令行  (在 shell 中要删除输入的内容需要按下 Ctrl 键)
      bin/hbase shell   

    2》 查看有哪些表
      list

    3》创建一张表 student 表 下有一个 info 列族
      create 'student','info'

    4》向表中放入数据
         表名    rowKey 列族名:列名 值
      put 'student','1001','info:name','Thomas' 类似于 map中:
      Map<String, String> map = new HashMap();
      map.put("student_1001_info:name", "Thomas")

    5》查看表中全部数据  (慎用
      scan 'student'

    6》只查看某个 rowKey 范围的数据
      scan 'student', {STARTROW => '1001', STOPROW => '1003'}

    7》查看表结构
      describe 'student'

    8》更新数据,直接使用添加数据的 put 覆盖就可以了

    9》查看某一张表某个 rowKey 的数据
      get 'student','1001'

    10》查看具体表中列族中的数据
      get 'student','1001','info'

    11》查看具体表中列族中的数据
      get 'student','1001','info:name'

    12》删除某个 rowKey 全部的数据
      deleteall 'student','1003'

    13》删除掉摸个 rowKey 中某一列的数据
      deleteall 'student','1003','info:sex'

    14》清空数据表
      truncate 'student'

    15》删除表, 首先需要将 表 变成 disable 状态,然后执行 drop 命令
      disable 'student'
      drop 'studnet'

    16》查询有多少行, 也就是有多少 rowKey
      count 'student'
      
  • 相关阅读:
    HRBUST 1377 金明的预算【DP】
    POJ 1745 Divisibility【DP】
    HRBUST 1476 教主们毕业设计排版==算法导论上的思考题整齐打印
    HRBUST 1220 过河【DP+状态】
    HRBUST 1478 最长公共子序列的最小字典序
    HRBUST 1162 魔女【DP】
    HDU 1561The more, The Better【DP】
    HRBUST 1376 能量项链【DP】
    POJ 1934 Trip【最长公共子序列输出】
    上传图片代码总结
  • 原文地址:https://www.cnblogs.com/redhat0019/p/11842035.html
Copyright © 2011-2022 走看看