研究了一段时间Consul,想写个攻略来着,但太赖了而且表达能力非正常人。。。今天发现HashiCorp果然接纳大众意见改了点东西。。
场景是:
假如Consul集群内有三个Server Node 时,当一个节点突然挂掉了,想要重连怎么办。
在之前的版本中方案有两种:
1.部署完集群后将consul-data aftpeers.json内的文件先备份,等到有节点挂掉后将peers.json文件替换成之前备份的文件然后通过-rejoin 如:consul agent -server -config-file=./conf -rejoin(peers.json内保存的就是ip节点的字符串数组,当一个节点挂掉后,其他节点会更新本地的peers.json文件移除挂掉的节点IP)
2.删除consul-data内的所有内容 然后以新的服务身份假如节点(当然会发生数据丢失,所以不推荐)
最近发现0.6.3版本的Consul有节点挂掉后,其他节点的peers.json没变化,好处是再也不用纠结的保存peers.json了况且还要挨个Server节点粘贴
但同样 当一个Server节点我不想用了,死了就死了吧,或者我要换新的了!这时候consul内部有健康监测,会持续的对死掉的节点报警,peers里毕竟还多着一个没用的ip呢。
解决方案是,需要关掉所有的consul server节点然后挨个服务器删除peers下这个没用的ip然后再重新启动每个consul服务。。