关于MySQL主从复制的过滤,例如通过binlog-ignore-db、replicate-do-db、replicate-wild-do-table等。如果不好好研究过这些过滤选项就用的话,是有可能造成主从数据不一致问题的。本文将参考MySQL-5.5官方文档并结合实验,和各位一起探讨下这里的各个设置。
以下内容参考5.5官方文档
binlog_format的设置会导致一些复制执行上的差异。
格式有三种(STATEMENT,ROW,MIXED,5.5默认为STATEMENT)
当使用MIXED格式时,binlog绝大多数情况也是以STATEMENT格式记录,只有在下列情况下才会切换到ROW格式:
1、 当时用UUID()函数时
2、 当一个或多个拥有AUTO_INCREMENT列的表被更新同时有‘trigger’或者‘stored function’被调用时
# MIXED对于‘trigger’和‘stored function’总是使用statement-based
3、 执行INSERT DELAYED时
4、 当视图里的某一部分需要row-based复制(例如UUID())时,创建该视图的语句被改为row-based
5、 使用用户自定义函数(UDF)时
6、 当某语句被判定为row-based,并且执行它的session需要用到临时表,则session下的所有子语句都将以ROW格式记录
7、 当使用USER(),CURRENT_USER()或者 CURRENT_USER
8、 当语句引用了一个或多个system variables。
9、 当使用LOAD_FILE()
下面几点要注意
1.所有DDL语句都是基于statements,不论binlog_format如何设置
2.复制双方binlog_format需一致,否则复制无法进行
3.Binlog格式影响到以下‘复制过滤’配置的行为
--binlog-do-db --binlog-ignore-db=ljk #黑名单,这个库的修改不记录二进制日志。 该选项的行为取决于binlog格式 对于Statement-based logging:当use ljk后(即当前库为ljk时),所有的语句不被记录进binlog 当登陆mysql后不使用use或者use ljk之外的库,执行update ljk.table 依然会记录近binlog并复制[只对ljk库生效] 对于Row-based format:告诉服务器不记录任何ljk库下表的更改,无论当前在哪个库(即无论有无use语句,是否使用use ljk) |
--replicate-do-db = ljk #白名单,允许复制哪个库 该选项的行为取决于binlog格式 对于Statement-based replication:只有主库在use ljk 之后执行的语句才会被从库复制,没有用use语句或者use其他库后执行的语句均不被复制 对于Row-based replication:只有ljk库的更改会被复制(无论use哪个库或者是否use) 无论是否use或use哪个库,ljk库之外的变更都不会被复制 --replicate-ignore-db |
总结:Statement-based跟当前use的库有关,Row-based更直接,只关心指定的库‘做或不做’。
还有以下两种参数可‘过滤复制’
以下两种选项只对表的更改有影响,库的复制不受这些参数影响(但是类似ljk.%这种,也会对库起作用)
--replicate-do-table 这两个选项在我的实验里跟描述不太一致,详细见下文实验结果 --replicate-ignore-table |
--replicate-wild-do-table = ljk.% >>>>严格限定复制 无论use ljk或use 其他库或不use,对ljk库的更新都能被复制,同时,其他任何库在任何情况下均不会复制(包括建库建表操作) --replicate-wild-ignore-table |
根据以上,综合建议:对复制的过滤,采用replicate-wild-do-table/ replicate-wild-ignore-table,比较严格和明确
下面是实验过程(MySQL-5.5.39)
一、 主库添加“binlog-ignore-db = mysql”,从库不加过滤
库操作: 在kai数据库执行建表操作: 对表内容修改: 1. 不 use mysql> create table mysql.ljk (id int,name varchar(15)); 从库复制 2. Use 其他库 mysql> drop table mysql.ljk; 从库复制 |
总结:对于主库使用binlog-ignore-db来说:只有在use db执行后才会生效
二、从库添加“replicate-ignore-db = mysql”,主库不加过滤
库操作 在kai数据库执行建表操作 对表内容修改: 对mysql库进行更改 |
总结对于从库设定replicate-ignore-db 来说,基本上只有在主库使用use db时才会生效。
三、从库添加“replicate-ignore-table = mysql.%”,主库不加过滤
注:这条规则加完在任何库下执行任何语句均复制;相反,在从库添加replicate-do-table = mysql.%后,在任何库下执行任何sql都不会被复制。不知道是不是bug 库操作: 在kai数据库执行建表操作 对表内容修改: 对mysql库进行更改 |
总结:好像有bug,应该来说在use db后,并在对应的库下创建表应该会忽略同步。
四、 从库添加“replicate-wild-ignore-table = mysql.%”,主库不加过滤
库操作: 在kai数据库执行建表操作 对表内容修改: 对mysql库进行更改 |
总结:使用replicate-wild-ignore-table之后,所有对于mysql库下的表级别的任何操作都被忽略同步
综上参考官方文档以及实验,可得出结论:
对于每一个添加的‘复制过滤’配置,应从两方面考虑:
1. 不用use语句引用库,或者use xxx引用其他库之后再执行sql(又分两部分:对‘过滤的库/表’ 或 ‘对其他库/表’)会怎样
2. use xxx引用‘过滤的库/表’,再执行sql(也分两部分:对‘过滤的库/表’ 或 ‘对其他库/表’)会怎样
除replicate-wild-do-table=/replicate-wild-ignore-table=外,其他过滤规则会受到“binlog_format”以及“当前所在库”的影响(即所谓的跨库问题)
建议使用 replicate-wild-ignore-table=mysql.% 因为replicate-ignore-db 是通过use db来确定是否过滤的。 而wild-ignore是通过真实被修改的表进行过滤的,更为准确。 |
实验也验证了上文提到的“对复制的过滤,采用replicate-wild-do-table/ replicate-wild-ignore-table,比较严格和明确”