一,mysql-mha环境准备
1.1 实验环境:
主机名 | IP地址(NAT) | 描述 |
---|---|---|
mysql-db01 | eth0:192.168.0.51 | 系统:CentOS6.5(6.x都可以) 安装:mysql5.6 |
mysql-db02 | eth0:192.168.0.52 | 系统:CentOS6.5(6.x都可以) 安装:mysql5.6 |
mysql-db03 | eth0:192.168.0.53 | 系统:CentOS6.5(6.x都可以) 安装:mysql5.6 |
1.2 软件包
1) mha管理节点安装包:
mha4mysql-manager-0.56-0.el6.noarch.rpm
mha4mysql-manager-0.56.tar.gz
2) mha node节点安装包:
mha4mysql-node-0.56-0.el6.noarch.rpm
mha4mysql-node-0.56.tar.gz
3) mysql中间件:
Atlas-2.2.1.el6.x86_64.rpm
4) mysql源码安装包
mysql-5.6.17-linux-glibc2.5-x86_64.tar
1.3 主机名映射
1.4 关闭selinux和iptables
二,简介
2.1软件简介
- MHA(Master High Availability)目前在MySQL高可用方面是一个相对成熟的解决方案,是一套优秀的作为MySQL高可用性环境下故障切换和主从提升的高可用软件。在MySQL故障切换过程中,MHA能做到0~30秒之内自动完成数据库的故障切换操作,并且在进行故障切换过程中,MHA能最大程度上保证数据库的一致性,以达到真正意义上的高可用。
- MHA由两部分组成:MHA Manager(管理节点)和MHA Node(数据节点)。MHA Manager可以独立部署在一台独立的机器上管理多个Master-Slave集群,也可以部署在一台Slave上。当Master出现故障时,它可以自动将最新数据的Slave提升为新的Master,然后将所有其他的Slave重新指向新的Master。整个故障转移过程对应程序是完全透明的。
2.2 工作流程
- 从宕机崩溃的master保存二进制日志事件(binlog events);
- 识别含有最新更新的slave;
- 应用差异的中继日志(relay log)到其他的slave;
- 应用从master保存的二进制日志事件(binlog events);
- 提升一个slave为新的master;
- 使其他的slave连接新的master进行复制;
2.3 MHA架构图
2.5 MHA工具介绍
MHA软件由两部分组成,Manager工具包和Node工具包,具体的说明如下:
1 #Manager工具包主要包括以下几个工具:
2 masterha_check_ssh #检查MHA的SSH配置状况
3 masterha_check_repl #检查MySQL复制状况
4 masterha_check_status #检测当前MHA运行状态
5 masterha_master_monitor #检测master是否宕机
6 masterha_manger #启动MHA
7 masterha_master_switch #控制故障转移(自动或者手动)
8 masterha_conf_host #添加或删除配置的server信息
9 masterha_secondary_check #试图建立TCP连接从远程服务器
10 masterha_stop #停止MHA
11 #Node工具包主要包括以下几个工具:
12 save_binary_logs #保存和复制master的二进制日志
13 apply_diff_relay_logs #识别差异的中继日志事件
14 filter_mysqlbinlog #去除不必要的ROLLBACK事件
15 purge_relay_logs #清除中继日志
三,mysql环境准备
3.1安装mysql
3.2 安装(3台都装)
1 [root@zhengweiqiang ~]# yum -y install ncurses-devel
2 [root@zhengweiqiang ~]# yum -y install libaio
3 [root@zhengweiqiang ~]# tar xf mysql-5.6.17-linux-glibc2.5-x86_64.tar.gz -C /usr/local/
4 [root@zhengweiqiang ~]# ln -s /usr/local/mysql-5.6.17-linux-glibc2.5-x86_64 /usr/local/mysql
5 [root@zhengweiqiang ~]# useradd mysql -s /sbin/nologin -M
6 [root@zhengweiqiang~]# /usr/local/mysql/scripts/mysql_install_db --user=mysql --basedir=/usr/local/mysql --datadir=/usr/local/mysql/data/
7 [root@zhengweiqiang ~]# /bin/cp /usr/local/mysql/support-files/my-default.cnf /etc/my.cnf
8 [root@zhengweiqiang ~]# /bin/cp /usr/local/mysql/support-files/mysql.server /etc/init.d/mysqld
9 [root@zhengweiqiang ~]# ln -s /usr/local/mysql/bin/* /usr/local/bin/
10 [root@zhengweiqiang~]# which mysqladmin
11 /usr/local/bin/mysqladmin
3.2.2 配置密码
mysqladmin -uroot password '123123'
四,配置基于GTID的主从复制
4.1 先决条件
- 主库和从库都要开启binlog
- 主库和从库server-id不同
- 要有主从复制用户.
4.2 主库操作(mysql-db01)
修改配置文件
重启
4.2.2 登陆MySQL删除不必要的用户并创建主从复制用户
创建主从复制用户
4.3 从库操作(mysql-db02和mysql-db03)
1 #修改mysql-db02配置文件(和mysql-db01配置文件一致)
2 #只需要修改server-id = 5选项
3 [root@mysql-db02 ~]# cat /etc/my.cnf
4 [client]
5 socket = /usr/local/mysql/data/mysql.sock
6 [mysqld]
7 lower_case_table_names = 1
8 default-storage-engine = InnoDB
9 port = 3306
10 datadir = /usr/local/mysql/data
11 character-set-server = utf8
12 socket = /usr/local/mysql/data/mysql.sock
13 log_bin = mysql-bin #从binlog也要打开
14 server_id = 5 #仅需修改此项
15 innodb_buffer_pool_size = 200M
16 slave-parallel-workers = 8
17 thread_cache_size = 600
18 back_log = 600
19 slave_net_timeout = 60
20 max_binlog_size = 512M
21 key_buffer_size = 8M
22 query_cache_size = 64M
23 join_buffer_size = 2M
24 sort_buffer_size = 2M
25 query_cache_type = 1
26 thread_stack = 192K
27 [root@mysql-db02 ~]# /etc/init.d/mysqld restart #重启mysql
28 Shutting down MySQL.. SUCCESS!
29 Starting MySQL. SUCCESS!
30 #修改mysql-db03配置文件(和mysql-db01配置文件一致)
31 #只需要修改server-id = 10选项
32 [root@mysql-db03 ~]# cat /etc/my.cnf
33 [client]
34 socket = /usr/local/mysql/data/mysql.sock
35 [mysqld]
36 lower_case_table_names = 1
37 default-storage-engine = InnoDB
38 port = 3306
39 datadir = /usr/local/mysql/data
40 character-set-server = utf8
41 socket = /usr/local/mysql/data/mysql.sock
42 log_bin = mysql-bin #从binlog也要打开
43 server_id = 10 #只需修改此项
44 innodb_buffer_pool_size = 200M
45 slave-parallel-workers = 8
46 thread_cache_size = 600
47 back_log = 600
48 slave_net_timeout = 60
49 max_binlog_size = 512M
50 key_buffer_size = 8M
51 query_cache_size = 64M
52 join_buffer_size = 2M
53 sort_buffer_size = 2M
54 query_cache_type = 1
55 thread_stack = 192K
56 [root@mysql-db03 ~]# /etc/init.d/mysqld restart #重启mysql
57 Shutting down MySQL.. SUCCESS!
58 Starting MySQL. SUCCESS!
特别提示:
在以往如果是基于binlog日志的主从复制,则必须要记住主库的master状态信息。
4.4开启GTID
mysql-db01,mysql-db02,mysql-db03都需要加入上图的上行代码
4.5从库开启
配置主从复制
mysql-db01,mysql-db02,mysql-db03都需要加入上图的上行代码
从库开启
4.6 从库设置临时禁制mysql删除relay log日志功能
永久禁止Mysql删除relay log 日志功能
4.7 什么是GTID
- GTID(Global Transaction)全局事务标识符:是一个唯一的标识符,它创建并与源服务器(主)上提交的每个事务相关联。此标识符不仅对其发起的服务器是唯一的,而且在给定复制设置中的所有服务器上都是唯一的。所有交易和所有GTID之间都有1对1的映射。
- GTID实际上是由UUID+TID组成的。其中UUID是一个MySQL实例的唯一标识。TID代表了该实例上已经提交的事务数量,并且随着事务提交单调递增。
- 下面是一个GTID的具体形式:
3E11FA47-71CA-11E1-9E33-C80AA9429562:23
4.8 GTID的新特性
(1)支持多线程复制:事实上是针对每个database开启相应的独立线程,即每个库有一个单独的(sql thread)
(2)支持启用GTID,在配置主从复制,传统的方式里,你需要找到binlog和POS点,然后change master to 指向。在mysql5.6里,无须再知道binlog和POS点,只需要知道master的IP/端口/账号密码即可,因为同步复制是自动的,MySQL通过内部机制GTID自动找点同步。
(3)基于Row复制只保存改变的列,大大节省磁盘空间,网络,内存等
(4)支持把Master和Slave的相关信息记录在Table中;原来是记录在文件里,现在则记录在表里,增强可用性
(5)支持延迟复制
4.9 开启方法
#mysql配置文件:
[mysqld]
gtid_mode=ON
enforce_gtid_consistency
#查看
show global variables like ‘%gtid%’;
五,部署MHA
5.1 环境准备(所有节点mysql-db01,mysql-db02,mysql-db03)
#光盘安装依赖包 [root@mysql-db01 ~]# yum -y install perl-DBD-MySQL #安装mha4mysql-node-0.56-0.el6.noarch.rpm [root@mysql-db01 rpm]# rpm -ivh mha4mysql-node-0.56-0.el6.noarch.rpm Preparing... ########################################### [100%] 1:mha4mysql-node ########################################### [100%] [root@mysql-db01 ~]# mysql -uroot -p123123 mysql> grant all privileges on *.* to mha@'192.168.0.%' identified by '123123'; Query OK, 0 rows affected (0.00 sec) mysql> select user,host from mysql.user where user='mha'; +------+-------------+ | user | host | +------+-------------+ | mha | 192.168.0.% | #主库上创建从库会自动复制 +------+-------------+ 1 row in set (0.00 sec) #特别提示:3台MySQL都需要安装mha4mysql-node-0.56-0.el6.noarch.rpm 部署管理节点(mha-manager) 在mysql-db03上部署管理节点 #使用阿里云源+epel源 wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-6.repo wget -O /etc/yum.repos.d/epel-6.repo http://mirrors.aliyun.com/repo/epel-6.repo
5.2部署管理节点(mha-manager)
在mysql-db03上部署管理节点
1 #安装manager依赖包(需要公网源) 2 [root@zhengweiqiang ~]# yum -y install perl-Config-Tiny epel-release perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes
5.2.1编辑配置文件
配置文件
[server default]
manager_log=/var/log/mha/mha1/manager #manager管理日志存放路径
manager_workdir=/var/log/mha/mha1 #manager管理日志的目录路径
master_binlog_dir=/usr/local/mysql/data #binlog日志的存放路径
user=mha #管理账户
password=123123 #管理账户密码
ping_interval=2 #存活检查的间隔时间
repl_user=rep #主从复制的授权账户
repl_password=123123 #主从复制的授权账户密码
ssh_user=root #用于ssh连接的账户
[server1]
hostname=192.168.0.51
port=3306
[server2]
#candidate_master=1 #此条暂时注释掉
#check_repl_delay=0 #此条暂时注释掉
hostname=192.168.0.52
port=3306
[server3]
hostname=192.168.0.53
port=3306
#**特别提示:**
#以上配置文件内容里每行的最后不要留有空格,因此,不能复制的呦
特别说明:
参数:candidate_master=1
解释:设置为候选master,如果设置该参数以后,发生主从切换以后会将此从库提升为主库,即使这个主库不是集群中事件最新的slave
参数:check_repl_delay=0
解释:默认情况下如果一个slave落后master 100M的relay logs
的话,MHA将不会选择该slave作为一个新的master,因为对于这个slave的恢复需要花费很长时间,通过设置check_repl_delay=0,MHA触发切换在选择一个新的master的时候将会忽略复制延时,这个参数对于设置了candidate_master=1的主机非常有用,因为这个候选主在切换的过程中一定是新的master
5.3配置ssh信任(所有节点mysql-db01,mysql-db02,mysql-db03)
1 #创建密钥对
2 [root@zhengweiqiang ~]# ssh-keygen -t dsa -P "" -f ~/.ssh/id_dsa >/dev/null 2>&1
3 #发送mysql-db03公钥,包括自己
4 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.128
5 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.129
6 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.130
7 #发送mysql-db02公钥,包括自己
8 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.128
9 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.129
10 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200130
11 #发送mysql-db01公钥,包括自己
12 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.128
13 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.129
14 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.130
5.4 启动测试
测试SSH
1 Tue Sep 5 03:01:38 2017 - [warning] Global configuration file /etc/masterha_default.cnf not found. Skipping.
2 Tue Sep 5 03:01:38 2017 - [info] Reading application default configuration from /etc/mha/mha1.cnf..
3 Tue Sep 5 03:01:38 2017 - [info] Reading server configuration from /etc/mha/mha1.cnf..
4 Tue Sep 5 03:01:38 2017 - [info] Starting SSH connection tests..
5 ..中间省略若干行..
6 Tue Sep 5 03:01:40 2017 - [debug] Connecting via SSH from root@192.168.0.53(192.168.0.53:22) to root@192.168.0.52(192.168.0.52:22)..
7 Tue Sep 5 03:01:40 2017 - [debug] ok.
8 Tue Sep 5 03:01:40 2017 - [info] All SSH connection tests passed successfully. #出现这个就表示成功
测试主从复制
1 [root@zhengweiqiang ~]# masterha_check_repl --conf=/etc/mha/mha1.
2 cnfMon Dec 17 20:57:16 2018 - [warning] Global configuration file /e
3 tc/masterha_default.cnf not found. Skipping.Mon Dec 17 20:57:16 2018 - [info] Reading application default con
4 figuration from /etc/mha/mha1.cnf..Mon Dec 17 20:57:16 2018 - [info] Reading server configuration fr
5 om /etc/mha/mha1.cnf..Mon Dec 17 20:57:16 2018 - [info] MHA::MasterMonitor version 0.56
6 .Mon Dec 17 20:57:16 2018 - [info] GTID failover mode = 1
7 Mon Dec 17 20:57:16 2018 - [info] Dead Servers:
8 Mon Dec 17 20:57:16 2018 - [info] Alive Servers:
9 Mon Dec 17 20:57:16 2018 - [info] 192.168.200.128(192.168.200.1
10 28:3306)Mon Dec 17 20:57:16 2018 - [info] 192.168.200.129(192.168.200.1
11 29:3306)Mon Dec 17 20:57:16 2018 - [info] 192.168.200.130(192.168.200.1
12 30:3306)Mon Dec 17 20:57:16 2018 - [info] Alive Slaves:
13 Mon Dec 17 20:57:16 2018 - [info] 192.168.200.129(192.168.200.1
14 29:3306) Version=5.6.17-log (oldest major version between slaves) log-bin:enabledMon Dec 17 20:57:16 2018 - [info] GTID ON
15 Mon Dec 17 20:57:16 2018 - [info] Replicating from 192.168.20
16 0.128(192.168.200.128:3306)Mon Dec 17 20:57:16 2018 - [info] 192.168.200.130(192.168.200.1
17 30:3306) Version=5.6.17-log (oldest major version between slaves) log-bin:enabledMon Dec 17 20:57:16 2018 - [info] GTID ON
18 Mon Dec 17 20:57:16 2018 - [info] Replicating from 192.168.20
19 0.128(192.168.200.128:3306)Mon Dec 17 20:57:16 2018 - [info] Current Alive Master: 192.168.2
20 00.128(192.168.200.128:3306)Mon Dec 17 20:57:16 2018 - [info] Checking slave configurations..
21 Mon Dec 17 20:57:16 2018 - [info] read_only=1 is not set on slav
22 e 192.168.200.129(192.168.200.129:3306).Mon Dec 17 20:57:16 2018 - [info] read_only=1 is not set on slav
23 e 192.168.200.130(192.168.200.130:3306).Mon Dec 17 20:57:16 2018 - [info] Checking replication filtering
24 settings..Mon Dec 17 20:57:16 2018 - [info] binlog_do_db= , binlog_ignore_
25 db= Mon Dec 17 20:57:16 2018 - [info] Replication filtering check ok
26 .Mon Dec 17 20:57:16 2018 - [info] GTID (with auto-pos) is support
27 ed. Skipping all SSH and Node package checking.Mon Dec 17 20:57:16 2018 - [info] Checking SSH publickey authenti
28 cation settings on the current master..Mon Dec 17 20:57:16 2018 - [info] HealthCheck: SSH to 192.168.200
29 .128 is reachable.Mon Dec 17 20:57:16 2018 - [info]
30 192.168.200.128(192.168.200.128:3306) (current master)
31 +--192.168.200.129(192.168.200.129:3306)
32 +--192.168.200.130(192.168.200.130:3306)
33
34 Mon Dec 17 20:57:16 2018 - [info] Checking replication health on
35 192.168.200.129..Mon Dec 17 20:57:16 2018 - [info] ok.
36 Mon Dec 17 20:57:16 2018 - [info] Checking replication health on
37 192.168.200.130..Mon Dec 17 20:57:16 2018 - [info] ok.
38 Mon Dec 17 20:57:16 2018 - [warning] master_ip_failover_script is
39 not defined.Mon Dec 17 20:57:16 2018 - [warning] shutdown_script is not defin
40 ed.Mon Dec 17 20:57:16 2018 - [info] Got exit code 0 (Not master dea
41 d).
42 MySQL Replication Health is OK.
5.5 启动MHA