zoukankan      html  css  js  c++  java
  • redis-sentinel主从复制高可用

    一、Redis-Sentinel

    Redis-Sentinel是redis官方推荐的高可用性解决方案,
    当用redis作master-slave的高可用时,如果master本身宕机,redis本身或者客户端都没有实现主从切换的功能。
    
    而redis-sentinel就是一个独立运行的进程,用于监控多个master-slave集群,
    自动发现master宕机,进行自动切换slave > master。

    1、Redis Sentinel简介

    Sentinel(哨兵)进程是用于监控redis集群中Master主服务器工作的状态,在Master主服务器发生故障的时候,可以实现Master和Slave服务器的切换,保证系统的高可用,其已经被集成在redis2.6+的版本中,Redis的哨兵模式到了2.8版本之后就稳定了下来。一般在生产环境也建议使用Redis的2.8版本的以后版本。哨兵(Sentinel) 是一个分布式系统,你可以在一个架构中运行多个哨兵(sentinel) 进程,这些进程使用流言协议(gossipprotocols)来接收关于Master主服务器是否下线的信息,并使用投票协议(Agreement Protocols)来决定是否执行自动故障迁移,以及选择哪个Slave作为新的Master。每个哨兵(Sentinel)进程会向其它哨兵(Sentinel)、Master、Slave定时发送消息,以确认对方是否”活”着,如果发现对方在指定配置时间(可配置的)内未得到回应,则暂时认为对方已掉线,也就是所谓的”主观认为宕机” ,英文名称:Subjective Down,简称SDOWN。有主观宕机,肯定就有客观宕机。当“哨兵群”中的多数Sentinel进程在对Master主服务器做出 SDOWN 的判断,并且通过 SENTINEL is-master-down-by-addr 命令互相交流之后,得出的Master Server下线判断,这种方式就是“客观宕机”,英文名称是:Objectively Down, 简称 ODOWN。通过一定的vote算法,从剩下的slave从服务器节点中,选一台提升为Master服务器节点,然后自动修改相关配置,并开启故障转移(failover)。

    2、Sentinel(哨兵)进程的作用:

    (1) 监控(Monitoring): 哨兵(sentinel) 会不断地检查你的Master和Slave是否运作正常。

    (2)提醒(Notification):当被监控的某个Redis节点出现问题时, 哨兵(sentinel) 可以通过 API 向管理员或者其他应用程序发送通知。

     (3)自动故障迁移(Automatic failover):当一个Master不能正常工作时,哨兵(sentinel) 会开始一次自动故障迁移操作,它会将失效Master的其中一个Slave升级为新的Master, 并让失效Master的其他Slave改为复制新的Master;当客户端试图连接失效的Master时,集群也会向客户端返回新Master的地址,使得集群可以使用现在的Master替换失效Master。Master和Slave服务器切换后,Master的redis.conf、Slave的redis.conf和sentinel.conf的配置文件的内容都会发生相应的改变,即,Master主服务器的redis.conf配置文件中会多一行slaveof的配置,sentinel.conf的监控目标会随之调换。

    3、Sentinel(哨兵)进程的工作方式:

     (1)每个Sentinel(哨兵)进程以每秒钟一次的频率向整个集群中的Master主服务器,Slave从服务器以及其他Sentinel(哨兵)进程发送一个 PING 命令。

    (2)如果一个实例(instance)距离最后一次有效回复 PING 命令的时间超过 down-after-milliseconds 选项所指定的值, 则这个实例会被 Sentinel(哨兵)进程标记为主观下线(SDOWN)。


    (3)果一个Master主服务器被标记为主观下线(SDOWN),则正在监视这个Master主服务器的所有 Sentinel(哨兵)进程要以每秒一次的频率确认Master主服务器的确进入了主观下线状态。


    (4)当有足够数量的 Sentinel(哨兵)进程(大于等于配置文件指定的值)在指定的时间范围内确认Master主服务器进入了主观下线状态(SDOWN), 则Master主服务器会被标记为客观下线(ODOWN)。

    (5)在一般情况下, 每个 Sentinel(哨兵)进程会以每 10 秒一次的频率向集群中的所有Master主服务器、Slave从服务器发送 INFO 命令。


    (6)当Master主服务器被 Sentinel(哨兵)进程标记为客观下线(ODOWN)时,Sentinel(哨兵)进程向下线的 Master主服务器的所有 Slave从服务器发送 INFO 命令的频率会从 10 秒一次改为每秒一次。


    (7)若没有足够数量的 Sentinel(哨兵)进程同意 Master主服务器下线, Master主服务器的客观下线状态就会被移除。若 Master主服务器重新向 Sentinel(哨兵)进程发送 PING 命令返回有效回复,Master主服务器的主观下线状态就会被移除。

    4、Redis Sentinel工作简单原理图

         

        在Server1 掉线后:

        升级Server2 为新的主服务器:

      

     二、redis命令整理

    官网地址:http://redisdoc.com/
    
    redis-cli info             #查看redis数据库信息
    
    redis-cli info replication #查看redis的复制授权信息
    
    redis-cli info sentinel    #查看redis的哨兵信息

    三、Redis Sentinel配置

    (一)准备三个redis数据库实例(三个配置文件,通过端口区分)

    1、主节点master的redis-6379.conf

    port 6379
    daemonize yes
    pidfile "/data/6379/redis.pid"
    loglevel notice
    logfile "/data/6379/redis.log"
    dbfilename "dump.rdb"
    dir "/data/6379"

    2、从节点slave的redis-6380.conf

    port 6380
    daemonize yes
    pidfile "/data/6380/redis.pid"
    loglevel notice
    logfile "/data/6380/redis.log"
    dbfilename "dump.rdb"
    dir "/data/6380"
    slaveof 127.0.0.1 6379

    3、从节点slave的redis-6381.conf

    port 6381
    daemonize yes
    pidfile "/data/6381/redis.pid"
    loglevel notice
    logfile "/data/6381/redis.log"
    dbfilename "dump.rdb"
    dir "/data/6381"

    slaveof 127.0.0.1 6379

    4、启动主节点和从节点的redis服务

    [root@localhost redis-4.0.10]# redis-server redis-6379.conf 
    [root@localhost redis-4.0.10]# redis-server redis-6380.conf 
    [root@localhost redis-4.0.10]# redis-server redis-6381.conf 

    5、确定主从关系

      在主节点上查看主从通信关系

    [root@master ~]# redis-cli  -p 6379 info replication
    # Replication
    role:master
    connected_slaves:2
    slave0:ip=192.168.119.10,port=6380,state=online,offset=407,lag=0
    slave1:ip=192.168.119.10,port=6381,state=online,offset=407,lag=0
    master_repl_offset:407
    repl_backlog_active:1
    repl_backlog_size:1048576
    repl_backlog_first_byte_offset:2
    repl_backlog_histlen:406

      在从节点上查看主从关系(6380、6381)

    [root@slave 192.168.119.11 ~]$redis-cli  -p 6380 info replication
    # Replication
    role:slave
    master_host:192.168.119.10
    master_port:6379
    master_link_status:up
    master_last_io_seconds_ago:3
    master_sync_in_progress:0
    slave_repl_offset:505
    slave_priority:100
    slave_read_only:1
    connected_slaves:0
    master_repl_offset:0
    repl_backlog_active:0
    repl_backlog_size:1048576
    repl_backlog_first_byte_offset:0
    repl_backlog_histlen:0

    此时可以在master上写入数据,在slave上查看数据,此时主从复制配置完成

    (二)开始配置Redis Sentinel

    1、准备三个哨兵,准备三个哨兵的配置文件(仅仅是端口的不同26379,26380,26381)

      redis-sentinel-26379.conf配置文件写入如下信息

    #Sentinel节点的端口
    port 26379  
    dir /var/redis/data/
    logfile "26379.log"
    
    #当前Sentinel节点监控 192.168.119.10:6379 这个主节点
    #2代表判断主节点失败至少需要2个Sentinel节点节点同意
    #mymaster是主节点的别名
    sentinel monitor mymaster 192.168.119.10 6379 2
    
    #每个Sentinel节点都要定期PING命令来判断Redis数据节点和其余Sentinel节点是否可达,如果超过30000毫秒30s且没有回复,则判定不可达
    sentinel down-after-milliseconds mymaster 30000
    
    #当Sentinel节点集合对主节点故障判定达成一致时,Sentinel领导者节点会做故障转移操作,选出新的主节点,
    原来的从节点会向新的主节点发起复制操作,限制每次向新的主节点发起复制操作的从节点个数为1
    sentinel parallel-syncs mymaster 1
    
    #故障转移超时时间为180000毫秒
    sentinel failover-timeout mymaster 180000

      通过命令快速生成redis-sentinel-26380.conf,redis-sentinel-26381.conf两个文件

    sed "s/26379/26380/g" redis-sentinel-26379.conf >  redis-sentinel-26380.conf 
    
    
    sed "s/26379/26381/g" redis-sentinel-26379.conf >  redis-sentinel-26381.conf

    2、启动三个哨兵

    redis-sentinel redis-sentinel-26379.conf 
    
    redis-sentinel redis-sentinel-26380.conf 
    
    redis-sentinel redis-sentinel-26381.conf 

    3、检查哨兵的通信状态

    redis-cli -p 26379  info sentinel

    查看结果如下之后,表示哨兵正常

    [root@localhost redis-4.0.10]# redis-cli -p 26379  info sentinel 
    # Sentinel
    sentinel_masters:1
    sentinel_tilt:0
    sentinel_running_scripts:0
    sentinel_scripts_queue_length:0
    sentinel_simulate_failure_flags:0
    master0:name=s15master,status=ok,address=127.0.0.1:6381,slaves=2,sentinels=3

    4、杀死一个redis主库,6379节点,等待30s以内,检查6380和6381的节点状态

    kill 6379主节点
    redis-cli -p 6380 info replication 
    redis-cli -p 6381 info replication 
    #如果切换的主从身份之后,(原理就是更改redis的配置文件,切换主从身份)

    5、恢复6379节点的数据库,查看是否将6379添加为新的slave身份

  • 相关阅读:
    8-kubernetes-安全
    6-kubernetes网络
    5-kunernetes资源调度
    4-K8S 部署Java应用及应用程序生命周期管理
    3-kubernetes监控与日志管理
    2-K8S常用命令
    1-kubeadm部署1.18.0单master集群
    部署Prometheus+Grafana监控
    微信小程序学习
    vue 中使用 @scroll事件 没有用
  • 原文地址:https://www.cnblogs.com/fengchong/p/10218308.html
Copyright © 2011-2022 走看看