zoukankan      html  css  js  c++  java
  • Mariadb Galera Cluster 故障快速拉起

    Openstack 的控制节点使用了3个节点的Mariadb Galera Cluster集群。当Mariadb集群因故障重启时,有时会遇到Mariadb Galera Cluster集群无法正常启动的情况。有很多方式能将数据库拉起,但是如何做到快速启动,又不丢失数据呢?

    经分析日志发现Mariadb Galera Cluster节点宕机时会在日志中打印出如下信息:

    [Note] WSREP: New cluster view: global state: 874d8e7e-5980-11e8-8c23-83493ba049c2:3111, view# -1: non-P
    rimary, number of nodes: 0, my index: -1, protocol version 3

    1.找到数据最新的节点

    对比三个节点日志中的 New cluster view: global state状态,可知道那个节点中的数据是最新的。

    用这个最新的节点中的数据以wsrep_new_cluster的方式将数据拉起即可。

    对比三个节点日志中的New cluster view: global state状态,可知道那个节点中的数据是最新的

    cd /var/log/mariadb/
    grep "New cluster view" /var/log/mariadb/mariadb.log |awk  -F: 'END { print $1":"$2":"$3 $6":"$7}'
    
    
    [mysql@test45 logs]$ grep "New cluster view" mariadb.log |awk  -F: 'END { print $1":"$2":"$3 $6":"$7}'
    180518 14:59:00 [Note] WSREP 874d8e7e-5980-11e8-8c23-83493ba049c2:2840, view# 3
    
    [mysql@test44 logs]$ grep "New cluster view" mariadb.log |awk  -F: 'END { print $1":"$2":"$3 $6":"$7}'
    180518 15:55:03 [Note] WSREP 874d8e7e-5980-11e8-8c23-83493ba049c2:3068, view# 4
    
    [mysql@test43 logs]$ grep "New cluster view" mariadb.log |awk  -F: 'END { print $1":"$2":"$3 $6":"$7}'
    180518 15:55:41 [Note] WSREP 874d8e7e-5980-11e8-8c23-83493ba049c2:3111, view# -1

    得知三个节点数据的状态 :3111>3068>2840

    所以 [mysql@test43 logs] 上的节点上的数据是最新的

    2.修改最新节点上的grastate.dat文件

    修改这个最新节点上的grastate.dat文件,文件目录可能有所不同,他位于Mariadb的数据文件目录,即datadir

    [mysql@test43 script]$more grastate.dat 
    # GALERA saved state
    version: 2.1
    uuid:    874d8e7e-5980-11e8-8c23-83493ba049c2
    seqno:   -1
    safe_to_bootstrap: 0

    修改为:

    [mysql@test43 data]$  vim ../data/grastate.dat 
    # GALERA saved state
    version: 2.1
    uuid:    874d8e7e-5980-11e8-8c23-83493ba049c2
    seqno:   3111
    safe_to_bootstrap: 1

    seqno设置为3111(这是上面取到的,不是固定的)。
    safe_to_bootstrap设置为1

    注意:在启动数据库前,最好对数据目录做备份,以防万一出问题可以还原事故现场。

    3.按顺序启动节点

    1. 在【mysql@test43】节点以wsrep_new_cluster的方式启动mysql

    mysqld_safe --defaults-file=/data/conf/my.cnf  --user=mysql --wsrep_new_cluster &

    2.以正常方式启动其它两个节点

    mysqld_safe --defaults-file=/data/conf/my.cnf  --user=mysql&

    根据这两个节点数据的情况,会自动做SSTIST.

    参考:https://coding3min.com/855.html

    1. 在【mysql@test43】节点以wsrep_new_cluster的方式启动mysql

  • 相关阅读:
    [Go] 写文件和判断文件是否存在
    [日常] 解决github速度特别慢
    [Go] imap收信非并发
    [Linux] 使用secureCRT实现SSH隧道服务器端口转发到本机内网穿透
    [Linux] 解决nginx: [emerg] directive "rewrite" is not terminated by ";"
    [MySQL] 解决Error 1698: Access denied for user 'root'@'localhost'
    [Go] gocron源码阅读-判断是否使用root用户执行
    [日常] 前端资源测试机上忽略版本号的的nginx配置
    [Go] 使用go mod安装beego
    [Go] tcp服务下的数据传递
  • 原文地址:https://www.cnblogs.com/zhongguiyao/p/14149758.html
Copyright © 2011-2022 走看看