HBase是依赖Hadoop的数据存储系统,可以实现大数据(过亿条记录)的存储,进行并行化处理。在特定的场景下HBase有自己的用武之地。
下面讲述如何进行伪分布模式安装
1.设置环境变量
我使用的HBase版本是hbase-0.94.7-security.tar.gz,安装在机器hadoop0的/usr/local目录下。首先解压缩、重命名、设置环境变量HBASE_HOME.
tar -xzvf hbase-0.94.7-security.tar.gz mv hbase-0.94.7-security hbase vi /etc/profile
这都是基本步骤。
2.修改配置文件
默认的配置信息不是供伪分布使用的,我们修改一下。
2.1修改文件${HBASE_HOME}/conf/hbase_env.sh,修改两处
一是修改JAVA_HOME的值,去掉前面的“#”,修改为自己环境的jdk安装路径
export JAVA_HOME=/usr/local/jdk/
二是修改最后一行,去掉前面的“#”即可
export HBASE_MANAGES_ZK=true
最后一句的含义是使用HBase托管的ZooKeeper。
2.2修改文件${HBASE_HOME}/conf/hbase-site.xml
在标记<configuration>中增加以下内容
<property> <name>hbase.rootdir</name> <value>hdfs://hadoop0:9000/hbase</value> </property> <property> <name>hbase.cluster.distributed</name> <value>true</value> </property> <property> <name>hbase.zookeeper.quorum</name> <value>hadoop0</value> </property> <property> <name>dfs.replication</name> <value>1</value> </property>
在这里,hbase.rootdir的值一定要与hadoop的配置文件core-site.xml中fs.default.name的值相同。hbase.zookeeper.quorum的值一定是启动hbase所在的机器主机名。
3.启动HBase
先确保hadoop已经启动。
执行命令start-hbase.sh。
4.验证
执行命令jps,可以看到新增了三个java进程,分别是HBase、HRegionserver、HQuorumpeer。
还有一个办法,在浏览器查看地址http://hadoop0:60010 也可以看到hbase的管理界面。