复制延迟时间(Seconds_Behind_Master) = 当前从库系统时间(time(0)) - 最后binlog的时间戳( mi->rli->last_master_timestamp) - 主从系统时间差(mi->clock_diff_with_master) 最后binlog的时间戳( mi->rli->last_master_timestamp) = 最后binlog事件开始时间(ev->when.tv_sec)+最后binlog事件执行时间((time_t) ev->exec_time)
主从系统时间差(mi->clock_diff_with_master) = 从库系统时间(time((time_t*) 0)) - 主库系统时间(UNIX_TIMESTAMP())
3、最后binlog事件执行时间((time_t) ev->exec_time),当一个BINLOG事件被写入到BINLOG文件时,该BINLOG事件的执行时间也已确定,但行格式和语句格式两种复制格式会导致时间中记录的exec_time存在差异。
当SQL线程从relay log中读取到binlog event后,会先更新last_master_timestamp,再应用binlog event。
当SQL线程应用完relay log中所有binlog event并处以等待状态时,会更新last_master_timestamp为0,且复制延迟时间(Seconds_Behind_Master)被赋值为0。
并行复制模式下,会创建一个分发队列GAP来协调多个SQL进程消费不同binlog evenet,并根据条件(参数slave_checkpoint_group,默认512个事务)或定期(参数slave_checkpoint_period,默认300ms)触发一个checkpoint来推进当前从库执行事务的最低水位线LWM(low-warter mark)。如队列中有1-8号事务,而1、2、3、4、6、7号事务已被执行,剩余5和8号事务正在执行或等待执行,则已执行事务的最低水位线为4。
当执行GAP Checkpoint更新LWM时,会同时更新last_master_timestamp为LWM所在事务结束的EVENT时间,而由于LWM所在事务已被执行,因此是先应用binlog event再更新last_master_timestamp。
由于并行复制模式下不是在BINLOG EVENT执行完成后实时更新last_master_timestamp,因此会导致last_master_timestamp存在误差,在没有延迟情况下仍显示轻微延迟(slave_checkpoint_period + 事务在备库执行时间)。
slave_checkpoint_period,default 300 Sets the maximum time (in milliseconds) that is allowed to pass before a checkpoint operation is called to update the status of a multithreaded slave as shown by SHOW SLAVE STATUS. Setting this variable has no effect on slaves for which multithreading is not enabled. Setting this variable takes effect for all replication channels immediately, including running channels. slave_checkpoint_group,default 512 Sets the maximum number of transactions that can be processed by a multithreaded slave before a checkpoint operation is called to update its status as shown by SHOW SLAVE STATUS. Setting this variable has no effect on slaves for which multithreading is not enabled. Setting this variable has no immediate effect. The state of the variable applies on all subsequent START SLAVE commands.
begin; select now(); update tb003 set c1=sleep(5) where id=1; select sleep(3); select now(); update tb003 set c1=sleep(10) where id=2; commit;
# at 14681 #190625 23:18:14 server id 1614520 end_log_pos 14746 CRC32 0xdc27cdef GTID last_committed=48 sequence_number=49 rbr_only=no SET @@SESSION.GTID_NEXT= '025fd638-89ea-11e9-a749-40f2e9cf3aaa:112'/*!*/; # at 14746 #190625 23:17:56 server id 1614520 end_log_pos 14827 CRC32 0xf931e3c0 Query thread_id=3837 exec_time=5 error_code=0 SET TIMESTAMP=1561475876/*!*/;BEGIN /*!*/; # at 14827 #190625 23:17:56 server id 1614520 end_log_pos 14942 CRC32 0x3bc48f78 Query thread_id=3837 exec_time=5 error_code=0 use `db001`/*!*/; SET TIMESTAMP=1561475876/*!*/; update tb003 set c1=sleep(5) where id=1 /*!*/; # at 14942 #190625 23:18:04 server id 1614520 end_log_pos 15058 CRC32 0x053d4b3c Query thread_id=3837 exec_time=10 error_code=0 SET TIMESTAMP=1561475884/*!*/; update tb003 set c1=sleep(10) where id=2 /*!*/; # at 15058 #190625 23:18:14 server id 1614520 end_log_pos 15089 CRC32 0x5e7dfecd Xid = 11788 COMMIT/*!*/;
# at 15375 #190625 23:24:46 server id 1614520 end_log_pos 15440 CRC32 0x0efa5343 GTID last_committed=50 sequence_number=51 rbr_only=yes /*!50718 SET TRANSACTION ISOLATION LEVEL READ COMMITTED*//*!*/; SET @@SESSION.GTID_NEXT= '025fd638-89ea-11e9-a749-40f2e9cf3aaa:114'/*!*/; # at 15440 #190625 23:24:28 server id 1614520 end_log_pos 15513 CRC32 0x2b522fd6 Query thread_id=3837 exec_time=5 error_code=0 SET TIMESTAMP=1561476268/*!*/; BEGIN /*!*/; # at 15513 #190625 23:24:28 server id 1614520 end_log_pos 15576 CRC32 0x3753fee7 Rows_query # update tb003 set c1=sleep(5) where id=1 # at 15576 #190625 23:24:28 server id 1614520 end_log_pos 15628 CRC32 0xd8ef6183 Table_map: `db001`.`tb003` mapped to number 229 # at 15628 #190625 23:24:28 server id 1614520 end_log_pos 15698 CRC32 0x70dcd9f1 Update_rows: table id 229 flags: STMT_END_F ### UPDATE `db001`.`tb003` ### WHERE ### @1=1 /* LONGINT meta=0 nullable=0 is_null=0 */ ### @2=1 /* INT meta=0 nullable=1 is_null=0 */ ### @3=1561476236 /* TIMESTAMP(0) meta=0 nullable=0 is_null=0 */ ### SET ### @1=1 /* LONGINT meta=0 nullable=0 is_null=0 */ ### @2=0 /* INT meta=0 nullable=1 is_null=0 */ ### @3=1561476268 /* TIMESTAMP(0) meta=0 nullable=0 is_null=0 */ # at 15698 #190625 23:24:36 server id 1614520 end_log_pos 15762 CRC32 0x64123971 Rows_query # update tb003 set c1=sleep(10) where id=2 # at 15762 #190625 23:24:36 server id 1614520 end_log_pos 15814 CRC32 0xfb3c7742 Table_map: `db001`.`tb003` mapped to number 229 # at 15814 #190625 23:24:36 server id 1614520 end_log_pos 15884 CRC32 0xbd3dacd0 Update_rows: table id 229 flags: STMT_END_F ### UPDATE `db001`.`tb003` ### WHERE ### @1=2 /* LONGINT meta=0 nullable=0 is_null=0 */ ### @2=1 /* INT meta=0 nullable=1 is_null=0 */ ### @3=1561476236 /* TIMESTAMP(0) meta=0 nullable=0 is_null=0 */ ### SET ### @1=2 /* LONGINT meta=0 nullable=0 is_null=0 */ ### @2=0 /* INT meta=0 nullable=1 is_null=0 */ ### @3=1561476276 /* TIMESTAMP(0) meta=0 nullable=0 is_null=0 */ # at 15884 #190625 23:24:46 server id 1614520 end_log_pos 15915 CRC32 0x4d2dba05 Xid = 11799 COMMIT/*!*/;
MySQL 版本:MySQL 5.7.19 主库设置: binlog_format = 'STATEMENT' 从库设置: binlog_format = 'STATEMENT' slave_parallel_type='DATABASE'
update tb003 set c1=sleep(5) where id=1;
2019-06-xx xx:xx:xx 从库IO线程同步,获取主库系统时间,主从时间同步,主从系统时间差(mi->clock_diff_with_master)=0秒 2019-06-24 20:13:20 主库开始执行SQL(ev->when.tv_sec="2019-06-24 20:13:20"),主从同步,从库复制延迟0秒 2019-06-24 20:13:25 主库执行SQL完成,执行时间5秒(ev->exec_time=5秒),从库SQL线程等待IO线程获取BINLOG EVENT,从库复制延迟0秒 2019-06-24 20:13:25 主库将BINLOG推送给从库,从库SQL线程等待IO线程获取BINLOG EVENT,从库复制延迟0秒 2019-06-24 20:13:25 从库IO线程接受到BINLOG EVENT并保存到RELAY LOG中,从库SQL线程等待IO线程获取BINLOG EVENT,从库复制延迟0秒 2019-06-24 20:13:25 从库SQL线程读取到RELAY LOG中的BINLOG EVENT,并更新last_master_timestamp,复制延迟0秒。 从库复制延迟时间计算如下: 最后binlog的时间戳( mi->rli->last_master_timestamp) = 最后binlog事件开始时间(ev->when.tv_sec)+最后binlog事件执行时间((time_t) ev->exec_time) = "2019-06-24 20:13:20" + "5秒" = "2019-06-24 20:13:25" 复制延迟时间(Seconds_Behind_Master) = 当前从库系统时间(time(0)) - 最后binlog的时间戳( mi->rli->last_master_timestamp) - 主从系统时间差(mi->clock_diff_with_master) = "2019-06-24 20:13:25" - "2019-06-24 20:13:25" - "0秒" = 0秒 2019-06-24 20:13:26 从库上last_master_timestamp和clock_diff_with_master都未发生变化,从库时间增加1秒,主从复制延迟为1秒 2019-06-24 20:13:27 从库上last_master_timestamp和clock_diff_with_master都未发生变化,从库时间增加1秒,主从复制延迟为2秒 ...... 2019-06-24 20:13:31 从库上last_master_timestamp和clock_diff_with_master都未发生变化,从库时间增加1秒,主从复制延迟为5秒
2019-06-24 20:13:31 从库执行到事务的最后COMMIT EVENT,由于该EVENT无exec_time(ev->exec_time=0秒),更新last_master_timestamp,复制延迟11秒。 从库复制延迟时间计算如下: 最后binlog的时间戳( mi->rli->last_master_timestamp) = 最后binlog事件开始时间(ev->when.tv_sec)+最后binlog事件执行时间((time_t) ev->exec_time) = "2019-06-24 20:13:20" + "0秒" = "2019-06-24 20:13:20" 复制延迟时间(Seconds_Behind_Master) = 当前从库系统时间(time(0)) - 最后binlog的时间戳( mi->rli->last_master_timestamp) - 主从系统时间差(mi->clock_diff_with_master) = "2019-06-24 20:13:31" - "2019-06-24 20:13:20" - "0秒" = 11秒 2019-06-24 20:13:31 从库SQL线程应用完RELAY LOG中的所有BINLOG EVENT,SQL线程进入等待状态,last_master_timestamp被更新为0,从库复制延迟0秒。
MySQL 版本:MySQL 5.7.19 主库设置: binlog_format = 'STATEMENT' 从库设置: binlog_format = 'STATEMENT' slave_parallel_type='LOGICAL_CLOCK' slave_parallel_workers = 8 slave_preserve_commit_order = ON 主库系统时间和从库系统时间完全不同,不存在时间差。
## 执行周期 2019-06-26 09:32:53-- 2019-06-26 09:33:03,执行时间10秒 update tb003 set c1=SLEEP(10) where id=1; ## 执行周期 2019-06-26 09:33:03-- 2019-06-26 09:33:13,执行时间10秒 update tb003 set c1=SLEEP(10) where id=2; ## 执行周期 2019-06-26 09:33:13-- 2019-06-26 09:33:23,执行时间10秒 update tb003 set c1=SLEEP(10) where id=3;
## 从库上Relay_Master_Log_File未发送变化,因此只描述Exec_Master_Log_Pos变化 2019-06-26 09:32:53之前 Exec_Master_Log_Pos=18287,Seconds_Behind_Master=0 2019-06-26 09:32:53 -- 2019-06-26 09:33:13 Exec_Master_Log_Pos=18287,Seconds_Behind_Master=0 2019-06-26 09:33:14 -- 2019-06-26 09:33:23 Exec_Master_Log_Pos=18631,Seconds_Behind_Master 从10增长到19 2019-06-26 09:33:24 -- 2019-06-26 09:33:33 Exec_Master_Log_Pos=18975,Seconds_Behind_Master 从10增长到19 2019-06-26 09:33:34之后 Exec_Master_Log_Pos=19319,Seconds_Behind_Master=0
# at 18287 #190626 9:32:53 server id 1614520 end_log_pos 18352 CRC32 0x9bfcc652 GTID last_committed=59 sequence_number=60 rbr_only=no SET @@SESSION.GTID_NEXT= '025fd638-89ea-11e9-a749-40f2e9cf3aaa:123'/*!*/; # at 18352 #190626 9:32:53 server id 1614520 end_log_pos 18433 CRC32 0x0244bb1a Query thread_id=3848 exec_time=10 error_code=0 SET TIMESTAMP=1561512773/*!*/; BEGIN /*!*/; # at 18433 #190626 9:32:53 server id 1614520 end_log_pos 18549 CRC32 0xea35ba85 Query thread_id=3848 exec_time=10 error_code=0 use `db001`/*!*/; SET TIMESTAMP=1561512773/*!*/; update tb003 set c1=SLEEP(10) where id=1 /*!*/; # at 18549 #190626 9:32:53 server id 1614520 end_log_pos 18631 CRC32 0x0aafadd6 Query thread_id=3848 exec_time=10 error_code=0 SET TIMESTAMP=1561512773/*!*/; COMMIT /*!*/; # at 18631 #190626 9:33:03 server id 1614520 end_log_pos 18696 CRC32 0xcf5f7255 GTID last_committed=60 sequence_number=61 rbr_only=no SET @@SESSION.GTID_NEXT= '025fd638-89ea-11e9-a749-40f2e9cf3aaa:124'/*!*/; # at 18696 #190626 9:33:03 server id 1614520 end_log_pos 18777 CRC32 0x9b5bd9a2 Query thread_id=3848 exec_time=10 error_code=0 SET TIMESTAMP=1561512783/*!*/; BEGIN /*!*/; # at 18777 #190626 9:33:03 server id 1614520 end_log_pos 18893 CRC32 0xcb74bf8b Query thread_id=3848 exec_time=10 error_code=0 SET TIMESTAMP=1561512783/*!*/; update tb003 set c1=SLEEP(10) where id=2 /*!*/; # at 18893 #190626 9:33:03 server id 1614520 end_log_pos 18975 CRC32 0x2f80ec1e Query thread_id=3848 exec_time=10 error_code=0 SET TIMESTAMP=1561512783/*!*/; COMMIT /*!*/; # at 18975 #190626 9:33:13 server id 1614520 end_log_pos 19040 CRC32 0x16f3eadd GTID last_committed=61 sequence_number=62 rbr_only=no SET @@SESSION.GTID_NEXT= '025fd638-89ea-11e9-a749-40f2e9cf3aaa:125'/*!*/; # at 19040 #190626 9:33:13 server id 1614520 end_log_pos 19121 CRC32 0x52c49fbe Query thread_id=3848 exec_time=10 error_code=0 SET TIMESTAMP=1561512793/*!*/; BEGIN /*!*/; # at 19121 #190626 9:33:13 server id 1614520 end_log_pos 19237 CRC32 0x5638a3eb Query thread_id=3848 exec_time=10 error_code=0 SET TIMESTAMP=1561512793/*!*/; update tb003 set c1=SLEEP(10) where id=3 /*!*/; # at 19237 #190626 9:33:13 server id 1614520 end_log_pos 19319 CRC32 0x54716796 Query thread_id=3848 exec_time=10 error_code=0 SET TIMESTAMP=1561512793/*!*/; COMMIT /*!*/;
在2019-06-26 09:32:50 -- 2019-06-26 09:33:03期间,Exec_Master_Log_Pos=18287,从库上分发队列GAQ为空,将last_master_timestamp设置为0,Seconds_Behind_Master为0。
在2019-06-26 09:33:04 -- 2019-06-26 09:33:13期间,分发队列GAQ的CHECKPOINT没有推进,last_master_timestamp未被更新,Exec_Master_Log_Pos还是保持18287,因此Seconds_Behind_Master为0。
在2019-06-26 09:33:14 -- 2019-06-26 09:33:23期间,Exec_Master_Log_Pos= 18631 ,对应的事务开始时间"2019-06-26 09:32:53",执行时间10秒。
在2019-06-26 09:33:18时的从库复制延迟时间计算如下:
最后binlog的时间戳( mi->rli->last_master_timestamp) = 最后binlog事件开始时间(ev->when.tv_sec)+最后binlog事件执行时间((time_t) ev->exec_time)
= "2019-06-26 09:32:53" + "10秒"
= "2019-06-26 09:33:03"
复制延迟时间(Seconds_Behind_Master) = 当前从库系统时间(time(0)) - 最后binlog的时间戳( mi->rli->last_master_timestamp) - 主从系统时间差(mi->clock_diff_with_master)
= "2019-06-26 09:33:18" - "2019-06-26 09:33:03" - "0秒"
= 15秒