ResourceManager 高可用机制架构
在Hadoop2.4 中添加了Active/Standby ResourceManager 的方式来解决ResourceManager 的单点故障问题。
Active ResourceManager 会将状态信息写入到ZooKeeper 集群之中,如果Active ResourceManager 挂了,那么可以将Standby ResourceManager 切换成Active ResourceManager(手动切换和自动切换)
ResourceManager HA 是通过Active/Standby 架构模式实现的,在任意时刻只有一个ResourceManager 处于 Active状态,其余的则处于Standby 状态,等待Active ResourceManager 发生故障时切换用。
自动切换方式:通过内嵌的基于ZooKeeper 的 ActiveStandbyElector 来决定哪个 ResourceManager 处于Active状态,当Active ResourceManager 出现故障时,其它的ResourceManager 将被自动选举,选举出来的ResourceManager 会被切换为 Active 状态。
手动切换方式:
查看rm 状态
yarn rmadmin -getServiceState rm
切换rm
yarn rmadmin -transitionToStandby rm