文章来自于:http://mmicky.blog.163.com/blog/static/150290154201392893623943/
1:解压
官网zookeeper.apache.org下载安装包,然后解压缩到hadoop1的/app/hadoop/zookeeper345目录,目录属于hadoop:hadoop。计划安装在hadoop2.2.0集群的5台虚拟机上,用hadoop:hadoop身份安装,虚拟机的配置:
hadoop1 192.168.100.171
hadoop2 192.168.100.172
hadoop3 192.168.100.173
hadoop4 192.168.100.174
hadoop5 192.168.100.175
2:配置
[root@hadoop1 conf]# su - hadoop
[hadoop@hadoop1 ~]$ cd /app/hadoop/zookeeper345/conf
[hadoop@hadoop1 conf]$ vi zoo.cfg
dataDir=/app/hadoop/zookeeper345/data
dataLogDir=/app/hadoop/zookeeper345/datalog
server.1=hadoop1:2888:3888
server.2=hadoop2:2888:3888
server.3=hadoop3:2888:3888
server.4=hadoop4:2888:3888
server.5=hadoop5:2888:3888
[hadoop@hadoop1 conf]$ cd ..
[hadoop@hadoop1 zookeeper345]$ mkdir data
[hadoop@hadoop1 zookeeper345]$ mkdir datalog
[hadoop@hadoop1 zookeeper345]$ echo 1 > data/myid
说明
*******************************************************************************************
tickTime:这个时间是作为 Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳。
initLimit:这个配置项是用来配置 Zookeeper 接受客户端(这里所说的客户端不是用户连接Zookeeper 服务器的客户端,而是 Zookeeper 服务器集群中连接到 Leader 的 Follower 服务器)初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过initLimit个心跳的时间(也就是tickTime)长度后 Zookeeper 服务器还没有收到客户端的返回信息,那么表明这个客户端连接失败。总的时间长度就是 initLimit*tickTime 毫秒。
syncLimit:这个配置项标识 Leader 与 Follower 之间发送消息、请求和应答时间长度,最长不能超过多少个 tickTime 的时间长度,总的时间长度就是 syncLimit*tickTime 毫秒。
dataDir:顾名思义就是 Zookeeper 保存数据的目录,默认情况下Zookeeper 将写数据的日志文件也保存在这个目录里。
clientPort:这个端口就是客户端连接 Zookeeper 服务器的端口,Zookeeper 会监听这个端口,接受客户端的访问请求。
server.A=B:C:D:其中 A 是一个数字,表示这个是第几号服务器;B 是这个服务器的 ip 地址;C表示的是这个服务器与集群中的 Leader 服务器交换信息的端口;D 表示的是万一集群中的Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的 Leader,而这个端口就是用来执行选举时服务器相互通信的端口。如果是伪集群的配置方式,由于 B 都是一样,所以不同的Zookeeper 实例通信端口号不能一样,所以要给它们分配不同的端口号。
除了修改 zoo.cfg 配置文件,集群模式下还要配置一个文件 myid,这个文件在 dataDir 目录下,这个文件里面就有一个数据就是 A 的值,Zookeeper 启动时会读取这个文件,拿到里面的数据与zoo.cfg 里面的配置信息比较从而判断到底是那个 server。
*******************************************************************************************
3:分发软件包并修改myid
[hadoop@hadoop1 zookeeper345]$ cd ..
[hadoop@hadoop1 hadoop]$ scp -r zookeeper345 hadoop@hadoop2:/app/hadoop/
[hadoop@hadoop1 hadoop]$ scp -r zookeeper345 hadoop@hadoop3:/app/hadoop/
[hadoop@hadoop1 hadoop]$ scp -r zookeeper345 hadoop@hadoop4:/app/hadoop/
[hadoop@hadoop1 hadoop]$ scp -r zookeeper345 hadoop@hadoop5:/app/hadoop/
[hadoop@hadoop1 zookeeper345]$ ssh hadoop2
[hadoop@hadoop2 ~]$ echo 2 >/app/hadoop/zookeeper345/data/myid
[hadoop@hadoop2 ~]$ exit
[hadoop@hadoop1 zookeeper345]$ ssh hadoop3
[hadoop@hadoop3 ~]$ echo 3 >/app/hadoop/zookeeper345/data/myid
[hadoop@hadoop3 ~]$ exit
[hadoop@hadoop1 zookeeper345]$ ssh hadoop4
[hadoop@hadoop4 ~]$ echo 4 >/app/hadoop/zookeeper345/data/myid
[hadoop@hadoop4 ~]$ exit
[hadoop@hadoop1 zookeeper345]$ ssh hadoop5
[hadoop@hadoop5 ~]$ echo 5 >/app/hadoop/zookeeper345/data/myid
[hadoop@hadoop5 ~]$ exit
4:启动zookeeper
[hadoop@hadoop1 zookeeper345]$ bin/zkServer.sh start
[hadoop@hadoop2 zookeeper345]$ bin/zkServer.sh start
[hadoop@hadoop3 zookeeper345]$ bin/zkServer.sh start
[hadoop@hadoop4 zookeeper345]$ bin/zkServer.sh start
[hadoop@hadoop5 zookeeper345]$ bin/zkServer.sh start
5:检查和测试
[hadoop@hadoop5 zookeeper345]$ jps
[hadoop@hadoop5 zookeeper345]$ bin/zkCli.sh -server hadoop1:2181
6:小挫折
在配置conf/zoo.cfg的时候不小心将server.4=hadoop4:2888:3888写成了server.4=hadoop4.2888:3888,结果每台服务器启动后又自动挂了,最后在查根目录下的zookeeper.out文件,才发现是节点hadoop4的问题,但查了好几次都没发现错误,最后才发现原来是将:写成.,近视眼啊,真杯具。。。
官网zookeeper.apache.org下载安装包,然后解压缩到hadoop1的/app/hadoop/zookeeper345目录,目录属于hadoop:hadoop。计划安装在hadoop2.2.0集群的5台虚拟机上,用hadoop:hadoop身份安装,虚拟机的配置:
hadoop1 192.168.100.171
hadoop2 192.168.100.172
hadoop3 192.168.100.173
hadoop4 192.168.100.174
hadoop5 192.168.100.175
2:配置
[root@hadoop1 conf]# su - hadoop
[hadoop@hadoop1 ~]$ cd /app/hadoop/zookeeper345/conf
[hadoop@hadoop1 conf]$ vi zoo.cfg
dataDir=/app/hadoop/zookeeper345/data
dataLogDir=/app/hadoop/zookeeper345/datalog
server.1=hadoop1:2888:3888
server.2=hadoop2:2888:3888
server.3=hadoop3:2888:3888
server.4=hadoop4:2888:3888
server.5=hadoop5:2888:3888
[hadoop@hadoop1 conf]$ cd ..
[hadoop@hadoop1 zookeeper345]$ mkdir data
[hadoop@hadoop1 zookeeper345]$ mkdir datalog
[hadoop@hadoop1 zookeeper345]$ echo 1 > data/myid
说明
*******************************************************************************************
tickTime:这个时间是作为 Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳。
initLimit:这个配置项是用来配置 Zookeeper 接受客户端(这里所说的客户端不是用户连接Zookeeper 服务器的客户端,而是 Zookeeper 服务器集群中连接到 Leader 的 Follower 服务器)初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过initLimit个心跳的时间(也就是tickTime)长度后 Zookeeper 服务器还没有收到客户端的返回信息,那么表明这个客户端连接失败。总的时间长度就是 initLimit*tickTime 毫秒。
syncLimit:这个配置项标识 Leader 与 Follower 之间发送消息、请求和应答时间长度,最长不能超过多少个 tickTime 的时间长度,总的时间长度就是 syncLimit*tickTime 毫秒。
dataDir:顾名思义就是 Zookeeper 保存数据的目录,默认情况下Zookeeper 将写数据的日志文件也保存在这个目录里。
clientPort:这个端口就是客户端连接 Zookeeper 服务器的端口,Zookeeper 会监听这个端口,接受客户端的访问请求。
server.A=B:C:D:其中 A 是一个数字,表示这个是第几号服务器;B 是这个服务器的 ip 地址;C表示的是这个服务器与集群中的 Leader 服务器交换信息的端口;D 表示的是万一集群中的Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的 Leader,而这个端口就是用来执行选举时服务器相互通信的端口。如果是伪集群的配置方式,由于 B 都是一样,所以不同的Zookeeper 实例通信端口号不能一样,所以要给它们分配不同的端口号。
除了修改 zoo.cfg 配置文件,集群模式下还要配置一个文件 myid,这个文件在 dataDir 目录下,这个文件里面就有一个数据就是 A 的值,Zookeeper 启动时会读取这个文件,拿到里面的数据与zoo.cfg 里面的配置信息比较从而判断到底是那个 server。
*******************************************************************************************
3:分发软件包并修改myid
[hadoop@hadoop1 zookeeper345]$ cd ..
[hadoop@hadoop1 hadoop]$ scp -r zookeeper345 hadoop@hadoop2:/app/hadoop/
[hadoop@hadoop1 hadoop]$ scp -r zookeeper345 hadoop@hadoop3:/app/hadoop/
[hadoop@hadoop1 hadoop]$ scp -r zookeeper345 hadoop@hadoop4:/app/hadoop/
[hadoop@hadoop1 hadoop]$ scp -r zookeeper345 hadoop@hadoop5:/app/hadoop/
[hadoop@hadoop1 zookeeper345]$ ssh hadoop2
[hadoop@hadoop2 ~]$ echo 2 >/app/hadoop/zookeeper345/data/myid
[hadoop@hadoop2 ~]$ exit
[hadoop@hadoop1 zookeeper345]$ ssh hadoop3
[hadoop@hadoop3 ~]$ echo 3 >/app/hadoop/zookeeper345/data/myid
[hadoop@hadoop3 ~]$ exit
[hadoop@hadoop1 zookeeper345]$ ssh hadoop4
[hadoop@hadoop4 ~]$ echo 4 >/app/hadoop/zookeeper345/data/myid
[hadoop@hadoop4 ~]$ exit
[hadoop@hadoop1 zookeeper345]$ ssh hadoop5
[hadoop@hadoop5 ~]$ echo 5 >/app/hadoop/zookeeper345/data/myid
[hadoop@hadoop5 ~]$ exit
4:启动zookeeper
[hadoop@hadoop1 zookeeper345]$ bin/zkServer.sh start
[hadoop@hadoop2 zookeeper345]$ bin/zkServer.sh start
[hadoop@hadoop3 zookeeper345]$ bin/zkServer.sh start
[hadoop@hadoop4 zookeeper345]$ bin/zkServer.sh start
[hadoop@hadoop5 zookeeper345]$ bin/zkServer.sh start
5:检查和测试
[hadoop@hadoop5 zookeeper345]$ jps
[hadoop@hadoop5 zookeeper345]$ bin/zkCli.sh -server hadoop1:2181
6:小挫折
在配置conf/zoo.cfg的时候不小心将server.4=hadoop4:2888:3888写成了server.4=hadoop4.2888:3888,结果每台服务器启动后又自动挂了,最后在查根目录下的zookeeper.out文件,才发现是节点hadoop4的问题,但查了好几次都没发现错误,最后才发现原来是将:写成.,近视眼啊,真杯具。。。