请注意,此篇文章并不是介绍Zookeeper集群内部Leader的选举机制,而是应用程序使用Zookeeper作为选举。
使用Zookeeper进行选举,主要用到了Znode的两个性质:
- 临时节点(EPHEMERAL)
- 序列化节点(SEQUENCE)
每一个临时的序列化节点代表着一个客户端(client),也就是选民。主要的设计思路如下:
首先,创建一个选举的节点,我们叫做/election。 然后,每有一个客户端加入,就创建一个子节点/election/n_xxx,这个节点是EPHEMERAL并且SEQUENCE,xxx就是序列化产生的单调递增的数字。 在所有子节点中,序列数字做小的被选举成Leader。
上面的并不是重点,重点是Leader失败的检测,Leader失败后,一个新的客户端(client)将被选举成Leader。实现这个过程的一个最简单的方式是 所有的客户端(client)都监听Leader节点,一旦Leader节点消失,将通知所有的客户端(client)执行Leader选举过程,序列数字最小的将被选举成Leader。 这样实现看似没有问题,但是当客户端(client)数量非常庞大时,所有客户端(client)都将在/election节点执行getChildren(),这对Zookeeper 的压力是非常大的。为了避免这种“惊群效应”,我们可以让客户端只监听它前一个节点(所有序列数字比当前节点小,并且是其中最大的那个节点)。 这样,Leader节点消失后,哪个节点收到了通知,哪个节点就变成Leader,因为所有节点中,没有比它序列更小的节点了。
具体步骤如下:
- 使用EPHEMERAL和SEQUENCE创建节点/election/n_xxx,我们叫做z。
- C为/election的子节点集合,i是z的序列数字。
- 监听/election/n_j,j是C中小于i的最大数字。
接收到节点消失的事件后:
- C为新的/election的子节点集合
- 如果z是集合中最小的节点,则z被选举成Leader
- 如果z不是最小节点,则继续监听/election/n_j,j是C中小于i的最大数字。
具体代码如下:
public class Candidate implements Runnable, Watcher { //zk private ZooKeeper zk; //临时节点前缀 private String perfix = "n_"; //当前节点 private String currentNode; //前一个最大节点 private String lastNode; /** * 构造函数 * @param address zk地址 */ public Candidate(String address) { try { this.zk = new ZooKeeper(address, 3000, this); } catch (IOException e) { e.printStackTrace(); } } /** * 加入选举 */ @Override public void run() { try { //创建临时节点 currentNode = zk.create("/zookeeper/election/" + perfix, Thread.currentThread().getName().getBytes(), ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL_SEQUENTIAL); //选举 election(); } catch (KeeperException e) { e.printStackTrace(); } catch (InterruptedException e) { e.printStackTrace(); } } /** * 从小到大排序临时节点 * @param children * @return */ private List<String> getSortedNode(List<String> children) { return children.stream().sorted(((o1, o2) -> { String sequence1 = o1.split(perfix)[1]; String sequence2 = o2.split(perfix)[1]; BigDecimal decimal1 = new BigDecimal(sequence1); BigDecimal decimal2 = new BigDecimal(sequence2); int result = decimal1.compareTo(decimal2); return result; })).collect(toList()); } /** * 选举过程 */ private void election(){ try{ while (true){ //获取/election节点中的所有子节点 List<String> children = zk.getChildren("/zookeeper/election", false); //所有子节点排序(从小到大) List<String> sortedNodes = getSortedNode(children); //获取最小节点 String smallestNode = sortedNodes.get(0); //当前节点就是最小节点,被选举成Leader if (currentNode.equals("/zookeeper/election/"+smallestNode)) { System.out.println(currentNode + "被选举成Leader。"); Thread.sleep(5000); //模拟Leader节点死去 System.out.println(currentNode+"已离去"); zk.close(); break; } //当前节点不是最小节点,监听前一个最大节点 else { //前一个最大节点 lastNode = smallestNode; //找到前一个最大节点,并监听 for (int i = 1; i < sortedNodes.size(); i++) { String z = sortedNodes.get(i); //找到前一个最大节点,并监听 if (currentNode.equals("/zookeeper/election/"+z)) { zk.exists("/zookeeper/election/" + lastNode, true); System.out.println(currentNode+"监听"+lastNode); //等待被唤起执行Leader选举 synchronized (this){ wait(); } break; } lastNode = z; } } } }catch (Exception e) { e.printStackTrace(); } } /** * 观察器通知 * @param event */ @Override public void process(WatchedEvent event) { //监听节点删除事件 if (event.getType().equals(Event.EventType.NodeDeleted)) { //被删除的节点是前一个最大节点,唤起线程执行选举 if (event.getPath().equals("/zookeeper/election/" + lastNode)) { System.out.println(currentNode+"被唤起"); synchronized (this){ notify(); } } } } }
我们将启动5个线程作为参选者,模拟每一个Leader死去,并重新选举的过程。启动程序如下:
public class Application { private static final String ADDRESS = "149.28.37.147:2181"; public static void main(String[] args) throws InterruptedException { setLog(); ExecutorService es = Executors.newFixedThreadPool(5); for (int i=0;i<5;i++){ es.execute(new Candidate(ADDRESS)); } es.shutdown(); } /** * 设置log级别为Error */ public static void setLog(){ //1.logback LoggerContext loggerContext = (LoggerContext) LoggerFactory.getILoggerFactory(); //获取应用中的所有logger实例 List<Logger> loggerList = loggerContext.getLoggerList(); //遍历更改每个logger实例的级别,可以通过http请求传递参数进行动态配置 for (ch.qos.logback.classic.Logger logger:loggerList){ logger.setLevel(Level.toLevel("ERROR")); } } }
运行结果如下:
/zookeeper/election/n_0000000133被选举成Leader。 /zookeeper/election/n_0000000134监听n_0000000133 /zookeeper/election/n_0000000137监听n_0000000136 /zookeeper/election/n_0000000135监听n_0000000134 /zookeeper/election/n_0000000136监听n_0000000135 /zookeeper/election/n_0000000133已离去 /zookeeper/election/n_0000000134被唤起 /zookeeper/election/n_0000000134被选举成Leader。 /zookeeper/election/n_0000000134已离去 /zookeeper/election/n_0000000135被唤起 /zookeeper/election/n_0000000135被选举成Leader。 /zookeeper/election/n_0000000135已离去 /zookeeper/election/n_0000000136被唤起 /zookeeper/election/n_0000000136被选举成Leader。 /zookeeper/election/n_0000000136已离去 /zookeeper/election/n_0000000137被唤起 /zookeeper/election/n_0000000137被选举成Leader。 /zookeeper/election/n_0000000137已离去
Zookeeper作为选举的应用就介绍完了,项目示例请参考:https://github.com/liubo-tech/zookeeper-application。