今天修改了和journalNode通信的zookeeper配置,原来没有打开zookeeper动态清理快照的功能。
所以3台zookeeper节点,每台修改完配置后,然后重启了下zookeeper服务。
然后就发现hadoop集群发生脑裂了,并且两台namenode节点都是standby状态。
经过半小时的激烈斗争,终于解决了。
以下是解决方案:
1. 停止3个journalNode,停止3台zookeeper服务。(这里会导致由于namenode与journalNode无法正常通信,而中断服务)
2. 重启3台zookeeper服务,重启3个journalNode服务。
3. 由于1的操作导致namenode服务停止,所以还需要手工启动namenode服务。
最后问题是解决了,但是这不是最好的方法,
在namenode服务停止后,任何连接的程序都将无法进行操作。