一,单实例模式
当系统中只有一台redis运行时,一旦该redis挂了,会导致整个系统无法运行。
二,主从模式
由于单台redis出现单点故障,就会导致整个系统不可用,所以想到的办法自然就是备份。当一台redis出现问题了,另一台redis可以继续提供服务。
三,自动故障转移机制
- 虽然上面redis做了备份,看上去很完美。但由于redis目前只支持主从复制备份(不支持主主复制),当主redis挂了,从redis只能提供读服务,无法提供写服务。所以,还得想办法,当主redis挂了,让从redis升级成为主redis。
- 这就需要自动故障转移,redis sentinel带有这个功能,当一个主redis不能提供服务时,redis sentinel可以将一个从redis升级为主redis,并对其他从redis进行配置,让他们使用新的主redis进行复制备份。
- Redis-Sentinel是Redis官方推荐的高可用性(HA)解决方案,当用Redis做Master-slave的高可用方案时,假如master宕机了,Redis本身(包括它的很多客户端)都没有实现自动进行主备切换,而Redis-sentinel本身也是一个独立运行的进程,它能监控多个master-slave集群,发现master宕机后能进行自动切换。它的主要功能有以下几点
- 实时地监控redis是否按照预期良好地运行;
- 如果发现某个redis节点运行出现状况,能够通知另外一个进程(例如它的客户端);
- 能够进行自动切换。当一个master节点不可用时,能够选举出master的多个slave(如果有超过一个slave的话)中的一个来作为新的master,其他的slave节点会将它所追随的master的地址改为被提升为master的slave的新地址。
四,redis的主从复制部署
4.1 环境描述
这里使用三台服务器,每台服务器上开启一个redis-server和redis-sentinel服务,redis-server端口为8000,redis-sentinel的端口为6800,修改默认端口是安全的第一步。
redis-server |
说明 |
redis-sentinel |
10.1.1.153:8000 |
redis-master |
10.1.1.153: 6800 |
10.1.1.154:8000 |
redis-slaveA |
10.1.1.154: 6800 |
10.1.1.155:8000 |
redis-slaveB |
10.1.1.155: 6800 |
部署环境,关闭防火墙和selinux
4.2 redis-server端的部署
三台服务器上都进行如下编译安装
[root@redis-master ~]# yum -y install gcc gcc-c++ make automake autoconf
[root@redis-master ~]# tar xf redis-4.0.11.tar.gz -C /usr/src/
[root@redis-master ~]# cd /usr/src/redis-4.0.11/
[root@redis-master redis-4.0.11]# make && make MALLOC=jemalloc && make PREFIX=/usr/local/redis install
[root@redis-master redis-4.0.11]# mkdir -p /usr/local/redis/conf
[root@redis-master redis-4.0.11]# cp redis.conf /usr/local/redis/conf/
[root@redis-master redis-4.0.11]# cp sentinel.conf /usr/local/redis/conf/
[root@redis-master conf]# ln -s /usr/local/redis/bin/* /usr/local/bin/
4.3 redis.conf配置文件修改
redis-master配置文件修改:(修改前可备份配置文件)
[root@redis-master ~]# cd /usr/local/redis/conf/
[root@redis-master conf]# ls
redis.conf sentinel.conf
[root@redis-master conf]# cp redis.conf{,.bak}
修改一下配置文件内容:
- port 8000
- daemonize yes
- bind 0.0.0.0
- pidfile /var/run/redis-8000.pid
- logfile "/var/log/redis-8000.log"
redis-slave配置文件修改:
- port 8000
- daemonize yes
- bind 0.0.0.0
- pidfile /var/run/redis-8000.pid
- logfile "/var/log/redis-8000.log"
- slaveof 10.1.1.153 8000 #比redis主多这行
4.4 redis-server的启动
先启动redis-master再启动两个从(都放后台启动,为的是在前台能直接看到日志输出信息)
[root@redis-master ~]# redis-server /usr/local/redis/conf/redis.conf &
通过命令查看主从复制情况
[root@redis-master ~]# redis-cli -p 8000 info replication
五,redis的高可用部署(redis-sentinel)
(1)修改sentinel.conf配置文件
修改配置文件以下几行
修改成如下内容
[root@redis-master conf]# cat -n /usr/local/redis/conf/sentinel.conf | sed -n '21p;69p;98p;106p;131p'
注意:现在这个sentinel.conf是可以scp的(没启动sentinel之前),但是当启动了sentinel后就不可以再scp了,启动了sentinel,它会在配置文件里加很多东西,它会往里面写许多数据,行号就和之前的行号不一样了,其中就会有sentinel的myid号,启动之后再复制,会导致所有sentinel的myid号都一样,它们之间都会认为是自己,就找不着对方了。
配置文件说明:
- sentinel monitor master8000 10.1.1.153 8000 2
- master8000:监控的主节点名字(随便写)
- 10.1.1.153 8000 :主节点的IP和端口
- 2:将这个主实例判断为失效至少需要2个 sentinel进程的同意,只要同意sentinel的数量不达标,自动failover就不会执行
- sentinel down-after-milliseconds master8000 5000(5秒)
- 当master8000节点宕机后多久进行检查
- sentinel parallel-syncs master8000 1
- 设定sentinel并发还是串行,1代表每次只能复制一个,可以减轻master压力
- sentinel failover-timeout master8000 15000(15秒)
- 表示故障转移的超时时间
再在sentinel.conf的最后追加以下四句话
- daemonize yes #守护进程模式
- logfile "/var/log/sentinel.log"
- pidfile "/var/run/sentinel.pid"
- protected-mode no
(2)启动redis-sentinel(先启动master)
[root@redis-master ~]# redis-sentinel /usr/local/redis/conf/sentinel.conf &(后台启动)
虽然用redis客户端连接sentinel 6800端口可以连接,但是往里面输入命令是没用的,sentinel是看info的
6800端口是sentinel之间互相访问的,sentinel的使用是主从突然发生切换,可以通过访问任何一台机器的sentinel,就会知道把谁切换成主了(没实现VIP漂移之前就是这么查看)
启动以后,查看sentinel信息
启动完sentinel之后,查看它的配置文件多了哪些东西
再启动redis-slaveA的sentinel
[root@redis-slaveA ~]# redis-sentinel /usr/local/redis/conf/sentinel.conf &
启动以后,查看sentinel信息
再启动redis-slaveB的sentinel
[root@redis-slaveB~]# redis-sentinel /usr/local/redis/conf/sentinel.conf &
启动以后,查看sentinel信息
(3)进行redis-master的宕机测试
我们宕掉redis-master的redis-server服务,然后查看sentinel信息
[root@redis-master conf]# redis-cli -p 8000 shutdown
查看redis-sentinel日志
[root@redis-master conf]# cat /var/log/sentinel.log
日志信息略,能看懂就行,看不懂百度翻译
再把主的服务启动,然后查看主的info信息
[root@redis-master conf]# redis-server /usr/local/redis/conf/redis.conf &
连续切换,试一下
[root@redis-slaveB conf]# redis-server /usr/local/redis/conf/redis.conf &
六,redis-sentinel的VIP漂移
假如在redis上,我们也建立一个VIP机制,一旦redis-master宕机,那么本来在master上的VIP就会漂移到新的master上。
如此一来开发在连接redis的时候,即便redis-master发生切换,那么开发也不需要修改代码了。
这里我们可以使用redis sentinel的一个参数client-reconfig-script,这个参数配置执行脚本,sentinel在做failover的时候会执行这个脚本,并且传递7个参数<master-name>,<role>,<state>,<from-ip>,<from-port>,<to-ip>,<to-port>,其中<to-ip>是新主redis的IP地址,可以在这个脚本里做VIP漂移操作
在sentinel.conf里增加一句话
sentinel client-reconfig-script master8000 /usr/local/redis/notify_master6800.sh 增加漂移脚本路径
写一个漂移脚本
[root@redis-master redis]# pwd
/usr/local/redis
[root@redis-master redis]# vim notify_master6800.sh
[root@redis-master redis]# cat notify_master6800.sh
#!/bin/bash
MASTER_IP=$6 #第六个参数就是sentinel传入进行来的新master的IP
LOCAL_IP="10.1.1.153" #脚本所在服务器的本地IP(每个服务器都不同)
VIP="10.1.1.244"
NETMASK="24"
INTERFACE="ens32"
if [[ "${MASTER_IP}" == "${LOCAL_IP}" ]];then
/usr/sbin/ip addr add ${VIP}/${NETMASK} dev ${INTERFACE}
/usr/sbin/arping -q -c 3 -A ${VIP} -I ${INTERFACE}
exit 0
else
/usr/sbin/ip addr del ${VIP}/${NETMASK} dev ${INTERFACE}
exit 0
fi
exit 1
改一下服务器的IP
给脚本加x权限
[root@redis-master redis]# chmod +x notify_master6800.sh
重新启动所有的redis-sentinel进程
[root@redis-master redis]# pkill redis-sentinel
[root@redis-master redis]# redis-sentinel /usr/local/redis/conf/sentinel.conf
第一次时手动给master添加VIP
[root@redis-master redis]# ip addr add 10.1.1.244/24 dev ens32
让ip地址即刻生效
[root@redis-master redis]# arping -q -c 3 -A 10.1.1.244 -I ens32
接下来进行ip漂移测试
查看VIP所在服务器
查看redis-master所属服务器
停止153服务器的redis-server服务
[root@redis-master ~]# redis-cli -p 8000 shutdown
查看redis-master的所属服务器
在154服务器上查看VIP及主从复制情况
再开启153的redis-server服务
[root@redis-master ~]# redis-server /usr/local/redis/conf/redis.conf &
查看主从复制情况
关掉154的服务,并查看154所属服务器
[root@redis-slaveA conf]# redis-cli -p 8000 shutdown
在主服务器153上查看VIP及主从复制情况
将154服务开启,再看主从复制情况
至此redis-sentinel的VIP漂移测试成功。redis-sentinel可以持续高可用,可以继续测试。