1 弊端和优势
弊端:相比单机模式,集群模式会在节点之间同步数据,会降低20%-30%的性能,同时增加架构复杂性,提高硬件成本和学习成本。
优势:增加冗余,避免单点故障。单机模式如果要重启,必然会丢失期间的数据,而集群则不用担心。
2 由单机模式转为集群模式
先加两个redis,配置slaveof 到master,数据就会自动同步过去。
然后在每个redis服务器上部署一个哨兵。
sentinel.conf
bind 0.0.0.0 port 26379 pidfile "/opt/redis4.0.9/sentinel.pid" loglevel notice logfile "/opt/redis4.0.9/sentinel.log" dir "/opt/redis4.0.9/data" daemonize yes sentinel monitor mymasterprod 10.0.23.170 6379 2 sentinel down-after-milliseconds mymasterprod 15000 sentinel failover-timeout mymasterprod 120000
sentinel monitor <master-name> <ip> <redis-port> <quorum> 告诉sentinel去监听地址为ip:port的一个master,这里的master-name可以自定义,quorum是一个数字,指明当有多少个sentinel认为一个master失效时,master才算真正失效 sentinel auth-pass <master-name> <password> 设置连接master和slave时的密码,注意的是sentinel不能分别为master和slave设置不同的密码,因此master和slave的密码应该设置相同。 sentinel down-after-milliseconds <master-name> <milliseconds> 这个配置项指定了需要多少失效时间,一个master才会被这个sentinel主观地认为是不可用的。 单位是毫秒,默认为30秒 sentinel parallel-syncs <master-name> <numslaves> 这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行 同步,这个数字越小,完成failover所需的时间就越长,但是如果这个数字越大,就意味着越 多的slave因为replication而不可用。可以通过将这个值设为 1 来保证每次只有一个slave 处于不能处理命令请求的状态。 sentinel failover-timeout <master-name> <milliseconds> failover-timeout 可以用在以下这些方面: 1. 同一个sentinel对同一个master两次failover之间的间隔时间。 2. 当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那里同步数据时。 3.当想要取消一个正在进行的failover所需要的时间。 4.当进行failover时,配置所有slaves指向新的master所需的最大时间。不过,即使过了这个超时,slaves依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来了。
启动后,配置文件会被重写,加入自动生成的一些信息
这时候模拟故障,把master关掉,哨兵经过选举,另一个slave变为master,然后把master起来,发现它的redis.conf里,自动加上了slaveof的配置。