zoukankan      html  css  js  c++  java
  • HBase 的安装与配置

    安装之前 - 检查必要条件

    (1) Java (需要安装1.6.x及其以上版本)

    在终端输入 java -version 来查看你机子上的 Java 版本;

    说明: 图片描述信息

    (2) Hadoop

    需要注意的是伪分布模式下,HBase 的版本需要和 Hadoop版本 匹配 ,不然很可能容易出错。你可以在HBaselib目录下看到对应的HadoopJar文件版本。

    在这里,我们使用了Hadoop V2.4.1版本以及HBase V0.98.11版本。

    (3) SSH

    SSH的安装。SSH用来管理远程HadoopHBase守护进程。

    本实验环境下,为了大家的方便,我们已经为大家准备好了这些必要条件,你只需要专注于HBase的安装配置即可。


    三、安装进行时 - 安装和配置HBase

    确认上面的条件我们都准备好了之后,就可以开始安装HBase了。实验开始前,你应该切换到 hadoop 用户:

    $ su hadoop

    HBase的安装通常分为3种模式:

    1. 单机模式 安装

    1)下载和解压

    单机模式的安装非常简单,几乎不用对安装文件做什么修改就可以使用。单机模式下,HBase并不使用HDFS,因此将安装文件解压后就几乎可以直接运行。输入命令下载HBase

    $ wget http://labfile.oss.aliyuncs.com/hbase-0.98.11-hadoop2-bin.tar.gz

    再将其压缩包解压:

    $ tar zxvf hbase-0.98.11-hadoop2-bin.tar.gz

    由于解压出来的文件名可能很长,建议修改为较短文件名,例如:

    $ mv hbase-0.98.11-hadoop2 hbase

    2)配置 hbase-site.xml

    在运行之前,我们需要对HBase进行相关配置。建议大家修改 ${HBase-Dir}/conf/hbase-site.xml 文件,因为即使你修改了hbase-default.xml文件,也会被hbase-site.xml中的配置所覆盖。也就是说,最终是以 hbase-site.xml 中的配置为准的。我们做如下修改:

    <configuration>
        <property>
            <name>hbase.rootdir</name>
            <value>file:///tmp/hbase-${user.name}/hbase</value>
        </property>
    </configuration>

    注意:修改 ${user.name}为你自己的 hadoop 用户名

    2. 伪分布模式 安装

    伪分布模式是一个运行在单台机器上的分布式模式。此模式下,HBase所有的守护进程将运行在同一个节点之上,而且需要依赖HDFS,因此在此之前必须保证HDFS已经成功运行,确认无误后,我们就可以开始配置HBase的参数了。

    1)配置 hbase-site.xml 文件

    <configuration>
        <property>
            <name>hbase.rootdir</name>
            <value>hdfs://localhost:9000/hbase</value>
        </property>
        <property>
            <name>hbase.cluster.distributed</name>
            <value>true</value>
        </property>
    </configuration>

    hbase.rootdir:该参数制定了HReion服务器的位置,即数据存放的位置。主要端口号要和Hadoop相应配置一致。hbase.cluster.distributedHBase的运行模式。false是单机模式,true是分布式模式。若为false, HBaseZookeeper会运行在同一个JVM里面。默认为false.

    2)设置环境变量

    另外,我们需要设置一些环境变量。修改HBase下的conf目录中的hbase-env.sh文件(你的jdk路径可能不一样):

    export JAVA_HOME=/usr/local/jdk1.7.0_67
    export HBASE_MANAGES_ZK=true

    export HBASE_MANAGES_ZK=true 此配置信息,表示设置由hbase自己管理zookeeper,不需要单独的zookeeper, 本文搭建的 Hbase 用的是自带的 zookeeper,故设置为true.

    最后修改添加PATH, 则输入:

    $ sudo vim /etc/profile

    来修改 /etc/profile 文件:

    # set hbase path
    export PATH=$PATH:/usr/local/hadoop/hbase/bin

    3. 完全分布模式 安装

    由于完全分布模式需要多台机器,在这里我们就不给出演示了。


    四、安装之后 - 运行和停止 HBase

    正如上面我们提到的,HBase安装分为3个模式,因此HBase的运行自然也分为同样的3个模式。

    1. 单机模式 运行

    1)启动

    单机模式下不需要HDFS,因此不需要事先启动Hadoop,直接启动HBase即可。终端下输入命令:./start-hbase.sh

    说明: 图片描述信息

    注意:路径要正确,应为:$HBASE_HOME/bin 目录,否则会找不到 start-hbase.sh 这个文件,就会出现错误

    2)查看进程

    我们可以通过 jps 来查看当前 HBase 的进程:

    说明: 图片描述信息

    3)停止 HBase 服务

    输入 ./stop-hbase.sh

    说明: 图片描述信息

    2. 伪分布模式 运行

    1)启动和查看进程

    前面我们提到过,伪分布模式下,必须先确保 HDFS 已经启动。因此,我们先启动 HDFS,输入命令: ./start-all.sh

    说明: 图片描述信息

    使用 jps 查看目前 Hadoop 的进程:

    说明: 图片描述信息

    HDFS 成功启动之后,我们再启动 HBase,这里和单机模式下启动 HBase 的方法一样,输入命令: ./start-hbase.sh

    说明: 图片描述信息

    此时再使用 jps查看,可以看到多了HBase的相关进程:

    说明: 图片描述信息

    2)进入 HBase Shell

    通过HBase Shell用户可以方便地创建、删除以及修改表,还可以向表中添加数据、列出表中的相关相信等。

    说明: 图片描述信息

    输入 help 来查看其所支持的命令,可以根据自己的需要选择。

    说明: 图片描述信息

    3)停止 HBase

    根据依赖关系,我们需要先关闭HBase, ./stop-hbase.sh

    说明: 图片描述信息

    通过 jps 可以看到,HBase相关的进程没有了:

    说明: 图片描述信息

    再关闭HDFS, ./stop-all.sh.

    说明: 图片描述信息

    最后,再通过 jps 发现 HDFS 的进程也没有了:

    说明: 图片描述信息

     

  • 相关阅读:
    ubuntu下python的错误
    Zookeeper(二) zookeeper集群搭建 与使用
    Zookeeper(一) zookeeper基础使用
    MapReduce(五) mapreduce的shuffle机制 与 Yarn
    MapReduce(四) 典型编程场景(二)
    Mysql(一) 基本操作
    MapReduce(三) 典型场景(一)
    MapReduce(二)常用三大组件
    MapReduce(一) mapreduce基础入门
    Hive(六)hive执行过程实例分析与hive优化策略
  • 原文地址:https://www.cnblogs.com/charlist/p/7121574.html
Copyright © 2011-2022 走看看