Replication 线程
Mysql 的Replication 是一个异步的复制过程,从一个Mysql instace(我们称之为Master)复制到另一个Mysql instance(我们称之Slave)。在Master 与Slave 之间的实现整个复制过程主要由三个线程来完成,其中两个线程(Sql 线程和IO 线程)在Slave 端,另外一个线程(IO 线程)在Master 端。
要实现MySQL 的Replication ,首先必须打开Master 端的Binary Log(mysqlbin.xxxxxx)功能,否则无法实现。因为整个复制过程实际上就是Slave 从Master 端获取该日志然后再在自己身上完全顺序的执行日志中所记录的各种操作
MySQL 复制的基本过程如下:
1. Slave 上面的IO 线程连接上Master,并请求从指定日志文件的指定位置(或者从最开始的日志)之后的日志内容;
2. Master 接收到来自Slave 的IO 线程的请求后,通过负责复制的IO 线程根据请求信息读取指定日志指定位置之后的日志信息,返回给Slave 端的IO 线程。返回信息中除了日志所包含的信息之外,还包括本次返回的信息在Master 端的Binary Log文件的名称以及在Binary Log 中的位置;
3. Slave 的IO 线程接收到信息后,将接收到的日志内容依次写入到Slave 端的Relay Log 文件(mysql-relay-bin.xxxxxx)的最末端,并将读取到的Master 端的binlog的文件名和位置记录到master-info 文件中,以便在下一次读取的时候能够清楚的高速Master“我需要从某个bin-log 的哪个位置开始往后的日志内容,请发给我”
4. Slave 的SQL 线程检测到Relay Log 中新增加了内容后,会马上解析该Log 文件中的内容成为在Master 端真实执行时候的那些可执行的Query 语句,并在自身执行这些Query。这样,实际上就是在Master 端和Slave 端执行了同样的Query,所以两端的数据是完全一样的。
可能有些读者朋友会有一个担心,这样搭建复制环境之后,难道不会造成两台MySQL 之间的循环复制么?
实际上MySQL 自己早就想到了这一点,所以在MySQL 的Binary Log 中记录了当前MySQL 的server-id,而且这个参数也是我们搭建MySQL Replication 的时候必须明确指定,而且Master 和Slave 的server-id 参数值比需要不一致才能使MySQLReplication 搭建成功。一旦有了server-id 的值之后,MySQL 就很容易判断某个变更是从哪一个MySQL Server 最初产生的,所以就很容易避免出现循环复制的情况。而且,如果我们不打开记录Slave 的Binary Log 的选项(--log-slave-update)的时候,MySQL 根本就不会记录复制过程中的变更到Binary Log 中,就更不用担心可能会出现循环复制的情形了。