分布式的hbase依赖于Zookeeper集群
所有正常工作节点都必须能够访问zookeeper;
用户可以通过启动和关闭脚本就可以把zookeeper当做hbase的一部分来启动和关闭进程;
当然,用户也可以不依赖于hbase管理zookeeper集群,只需要为hbase支出需要使用的集群即可
#配置zookeeper作为hbase的一部分启动
export HBASE_MANAGES_ZK=true
#hbase完全分布式配置
#配置数据存储目录和启用完全分布式设置
#vim vim /usr/hbase/hbase-1.2.4/conf/hbase-site.xml
<configuration>
<property>
<name>hbase.rootdir</name>
<value>hdfs://namenode.foo.com:9000</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
</configuration>
#zookeeper作为hbase一部分启动,即通过hbase管理zookeeper时;zookeeper可以直接使用本地zoo.cfg文件
作为依赖的配置文件,或者直接使用conf/hbase_site.xml中的zookeeper配置;zookeeper的相关配置可以在
hbase-site.xml中通过XML格式设置,属性以hbase.zookeeper.propery为前缀.
例如,clientPort可以设置为hbase.zookeeper.propery.clentPort.
在hbase中这些参数都有默认值;笔者强烈推荐通过hbase-site.xml配置zookeeper相关参数
使用hbase-site.xml配置zookeeper,首先需要设置的是hbase.zookeeper.quorum属性
,用于设置服务器列表
<configuration>
<property>
<name>hbase.rootdir</name>
<value>hdfs://namenode.foo.com:9000</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.zookeeper.clientPort</name>
<value>2181</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>rs1.foo.com,rs2.foo.com,rs3.foo.com</value>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/var/zookeeper</value>
</property>
</configuration>
#配置region服务器
#vim /usr/hbase/hbase-1.2.4/conf/regionservers
localhost
spark02
spark03
#将hbase的堆设置为4G以上
#vim /usr/hbase/hbase-1.2.4/conf/hbase-env.sh
export HBASE_MANAGES_ZK=true
export HBASE_HEAPSIZE=4096
然后使用rsync将配置同步到其它机器