zoukankan      html  css  js  c++  java
  • mydumper备份原理和使用方法

    MySQL 自身的 mysqldump 工具支持单线程工作, 依次一个个导出多个表,没有一个并行的机 ,这就使得它无法迅速的备份数据。

    mydumper 作为一个实用工具,能够良好支持多线程工作, 可以并行的多线程的从表中读入数据并同时写到不同的文件里 ,这使得它在处理速度方面快于传统的 mysqldump 。其特征之一是在处理过程中需要对列表加以锁定,因此如果我们需要在工作时段执行备份工作,那么会引起 DML 阻塞。但一般现在的 MySQL 都有主从,备份也大部分在从上进行,所以锁的问题可以不用考虑。这样, mydumper 能更好的完成备份任务。

    mydumper 特性

    • 多线程备份
    • 因为是多线程逻辑备份,备份后会生成多个备份文件
    • 备份时对 MyISAM 表施加 FTWRL (FLUSH TABLES WITH READ LOCK), 会阻塞 DML 语句
    • 保证备份数据的一致性
    • 支持文件压缩
    • 支持导出binlog
    • 支持多线程恢复
    • 支持以守护进程模式工作,定时快照和连续二进制日志
    • 支持将备份文件切块

    mydumper 的安装

    mydumper 使用 c 语言编写,使用 glibc

    mydumper 安装所依赖的软件包, glibc, zlib, pcre, pcre-devel, gcc, gcc-c++, cmake, make, mysql 客户端库文件

    1. 安装依赖软件包,将 mysql 客户端库文件路径添加至 /etc/ld.so.conf, /usr/local/mysql/lib
    2. 解压软件包进入目录, cmake .
    3. make && make install

    安装完成后生成两个二进制文件 mydumper myloader 位于 /usr/local/bin 目录下

    mydumper 备份机制

    mydumper 工作流程图

    主要步骤概括

    1. 主线程 FLUSH TABLES WITH READ LOCK , 施加全局只读锁,以阻止 DML 语句写入,保证数据的一致性
    2. 读取当前时间点的二进制日志文件名和日志写入的位置并记录在 metadata 文件中,以供即使点恢复使用
    3. N 个(线程数可以指定,默认是 4 dump 线程 START TRANSACTION WITH CONSISTENT SNAPSHOT ; 开启读一致的事物
    4. dump non-InnoDB tables , 首先导出非事物引擎的表
    5. 主线程 UNLOCK TABLES 非事物引擎备份完后,释放全局只读锁
    6. dump InnoDB tables , 基于事物导出 InnoDB
    7. 事物结束

    备份所生成的文件

    • 所有的备份文件在一个目录中,目录可以自己指定
    • 目录中包含一个 metadata 文件

    记录了备份数据库在备份时间点的二进制日志文件名,日志的写入位置,

    如果是在从库进行备份,还会记录备份时同步至主库的二进制日志文件及写入位置

    • 每个表有两个备份文件:

    database.table-schema.sql 表结构文件

    database.table.sql 表数据文件

    如果对表文件分片,将生成多个备份数据文件,可以指定行数或指定大小分片

    mydumper myloader 的使用

    mydumper 参数

    -B, --database              要备份的数据库,不指定则备份所有库
    -T, --tables-list           需要备份的表,名字用逗号隔开
    -o, --outputdir             备份文件输出的目录
    -s, --statement-size        生成的insert语句的字节数,默认1000000
    -r, --rows                  将表按行分块时,指定的块行数,指定这个选项会关闭 --chunk-filesize
    -F, --chunk-filesize        将表按大小分块时,指定的块大小,单位是 MB
    -c, --compress              压缩输出文件
    -e, --build-empty-files     如果表数据是空,还是产生一个空文件(默认无数据则只有表结构文件)
    -x, --regex                 是同正则表达式匹配 'db.table'
    -i, --ignore-engines        忽略的存储引擎,用都厚分割
    -m, --no-schemas            不备份表结构
    -k, --no-locks              不使用临时共享只读锁,使用这个选项会造成数据不一致
    --less-locking              减少对InnoDB表的锁施加时间(这种模式的机制下文详解)
    -l, --long-query-guard      设定阻塞备份的长查询超时时间,单位是秒,默认是60秒(超时后默认mydumper将会退出)
    --kill-long-queries         杀掉长查询 (不退出)
    -b, --binlogs               导出binlog
    -D, --daemon                启用守护进程模式,守护进程模式以某个间隔不间断对数据库进行备份
    -I, --snapshot-interval     dump快照间隔时间,默认60s,需要在daemon模式下
    -L, --logfile               使用的日志文件名(mydumper所产生的日志), 默认使用标准输出
    --tz-utc                    跨时区是使用的选项,不解释了
    --skip-tz-utc               同上
    --use-savepoints            使用savepoints来减少采集metadata所造成的锁时间,需要 SUPER 权限
    --success-on-1146           Not increment error count and Warning instead of Critical in case of table doesn't exist
    -h, --host                  连接的主机名
    -u, --user                  备份所使用的用户
    -p, --password              密码
    -P, --port                  端口
    -S, --socket                使用socket通信时的socket文件
    -t, --threads               开启的备份线程数,默认是4
    -C, --compress-protocol     压缩与mysql通信的数据
    -V, --version               显示版本号
    -v, --verbose               输出信息模式, 0 = silent, 1 = errors, 2 = warnings, 3 = info, 默认为 2

    myloader使用参数

    -d, --directory                   备份文件的文件夹
    -q, --queries-per-transaction     每次事物执行的查询数量,默认是1000
    -o, --overwrite-tables            如果要恢复的表存在,则先drop掉该表,使用该参数,需要备份时候要备份表结构
    -B, --database                    需要还原的数据库
    -e, --enable-binlog               启用还原数据的二进制日志
    -h, --host                        主机
    -u, --user                        还原的用户
    -p, --password                    密码
    -P, --port                        端口
    -S, --socket                      socket文件
    -t, --threads                     还原所使用的线程数,默认是4
    -C, --compress-protocol           压缩协议
    -V, --version                     显示版本
    -v, --verbose                     输出模式, 0 = silent, 1 = errors, 2 = warnings, 3 = info, 默认为2

    使用案例 备份 game 库到 /backup/01 文件夹中,并压缩备份文件

    mydumper -u root -p ### -h localhost -B game -c -o /backup/01

    备份所有数据库,并备份二进制日志文件,备份至 /backup/02 文件夹

    mydumper -u root -p ### -h localhost -o /backup/02

    备份 game.tb_player 表,且不备份表结构,备份至 /backup/03 文件夹

    mydumper -u root -p ### -h localhost -T tb_player -m -o /backup/03

    还原

    mysqlload -u root -p ### -h localhost -B game -d /backup/02

    mydumper less locking 模式

    mydumper 使用 --less-locking 可以减少锁等待时间,此时 mydumper 的执行机制大致为

    • 主线程 FLUSH TABLES WITH READ LOCK (全局锁)
    • Dump 线程 START TRANSACTION WITH CONSISTENT SNAPSHOT;
    • LL Dump 线程 LOCK TABLES non-InnoDB (线程内部锁)
    • 主线程 UNLOCK TABLES
    • LL Dump 线程 dump non-InnoDB tables
    • LL DUmp 线程 UNLOCK non-InnoDB
    • Dump 线程 dump InnoDB tables
  • 相关阅读:
    使用uploadify上传图片时返回“Cannot read property 'queueData' of undefined”
    用户在网站注册,网站通过微信发送验证码,这个操作是怎么实现的?
    Javascript Array和String的互转换。
    JS判断一个数组中是否有重复值的三种方法
    监控聚币网行情 并实时发送到微信
    聚币网API使用教程 demo
    sourceTree安装与使用
    SourceTree 的初次使用的两个小问题
    解决oracle语句中 含数字的字符串按数字排序问题
    使用git pull文件时和本地文件冲突怎么办
  • 原文地址:https://www.cnblogs.com/diyunpeng/p/6727349.html
Copyright © 2011-2022 走看看