zoukankan      html  css  js  c++  java
  • 三招搞挂Mysql(转)

    一、产生大量的undo日志

    众所周知,InnoDB是一个支持MVCC的存储引擎,为了支持MVCC,InnoDB需要保存undo日志,以便对用户提供记录的历史版本。如果我们开启一个事务,反复地更新一条记录而不提交,会怎么样呢?将会产生大量的undo日志,使得磁盘空间爆满,导致MySQL不可用。

    在innodb现有的实现中,并没有对单个用户或单个连接使用的undo空间进行限制。也就是说,我们只需要反复更新一条记录,而不提交,就会产生大量undo日志。由于我们的事务没有提交,undo日志不能被回收,从而使得磁盘空间被耗尽,最终导致MySQL挂掉。

    Jeremy Cole老早就提到过这个问题,不过该问题至今还存在。要进行该项测试,只需要有更新记录的权限即可。测试脚本如下:

    测试过程中,可以观察磁盘空间的使用率,一直在上升:

    磁盘空间满以后,再执行SQL语句就报错了,错误信息如下:

    错误日志如下:

    可以看到,虽然MySQL进程还存在,其实服务已经不可用了。事务在执行过程中,会产生undo日志以及binlog日志,占用磁盘空间,如果我们在线上执行一个大事务,就需要留意是否有可能因为undo和binlog导致磁盘空间爆满的情况。为了规避风险,我们还是应该尽可能地避免特别大的事务。

    二、定义大量的变量

    上面的例子并没有真的让MySQL进程挂掉,而且需要对数据库具有写的权限。你可能不服,那么,我们再来看另外一种情况,即定义大量的用户变量。

    这种方式将会导致MySQL占用的内存急剧上涨,最后被操作系统kill掉。而且,不再需要有更新记录的权限,只需要有登录数据库的权限即可。

    测试脚本如下:

    我们不断地定义用户变量,可以通过pidstat观察MySQL占用的内存:

    可以看到,MySQL占用的内存越来越大,最后,MySQL进程不在了。通过dmesg可以看到,是由于MySQL占用内存太多,被操作系统kill掉:

    上面的例子演示了一个普通用户耗尽资源,导致MySQL被操作系统kill掉的情况。其实,这个问题是完全可以避免的。MySQL支持在创建用户的时候,限制用户使用的资源。

    可以限制的资源包括:

    • 每小时的查询次数

    • 每小时的更新次数

    • 每小时的连接次数

    • 同时建立的连接数

    使用方式如下所示:

    虽然MySQL支持限制用户使用的资源,但是,在实际使用过程中,很少有人会去限制用户使用的资源,甚至很多用户根本不知道MySQL提供了这样的功能,这给”不法分子”有了可乘之机。

    三、触发MySQL的bug

    可以说,写MySQL的都是一群科学家,并且,MySQL使用如此广泛,遇到MySQL的bug应该不容易。不过,只要是程序就有可能存在bug,所以,遇到MySQL的bug也不是不可能的情况。如果看MySQL的release note,每次的新版本都会修复无数的bug。尤其以新功能的bug居多。

    这一节,我们来测试一下MySQL的bug。即在使用grant授权时,如果使用了一个很长的数据库名,将导致MySQL挂掉。之所以选择这个bug,是因为该bug复现起来特别容易了,只需要执行一条SQL语句即可。

    如下所示:

    很明显,该问题是由于缓冲区溢出导致,这也是我们编程中容易犯的一个错误。这个bug在MySQL 5.7中已经修复,我在5.6.19中进行测试,MySQL立马挂掉,可以说是搞挂MySQL的最快方式。

    四、总结

    在本文中,我演示了三种搞挂MySQL的方式,这三种方式的思路不同,涉及到的知识点也不一样。将这三种方式都尝试一遍,可以搞挂正在使用的无数MySQL实例。那么,是不是说MySQL特别脆弱,非常容易被搞挂呢?答案是否定的。MySQL在各互联网公司广泛使用,已经经受住了无数的考验。

    本文之所以显得MySQL容易被搞挂,主要还是因为大部分人的使用姿势不当,以及对MySQL的了解不足所导致的。要避免MySQL挂掉,这里有几点建议:

    • 特别大的事务会占用特别多的资源,甚至出现占满磁盘空间的情况,要避免特别大的事务

    • 限制用户使用的资源,避免不良用户恶意破坏;

    • 紧随社区的脚步,关注社区报告和修复的bug,必要时升级数据库版本,以免遇到已知bug;

    • 新功能一般bug较多,不要上得太快,避免踩到未知bug。

  • 相关阅读:
    IPC之——消息队列
    特殊命令
    面试概念集锦
    守护进程(精灵进程)
    IP SSL HTTPS
    钉钉监控样例
    中间人攻击
    iptables firewalld
    简单暴力高效率的OSM全球地图
    解决ubuntu使用命令sudo apt -get install 安装东西时出现"E: Sub-process /usr/bin/dpkg returned an error code (1) "的错误 问题描述:
  • 原文地址:https://www.cnblogs.com/xu-xiang/p/5862124.html
Copyright © 2011-2022 走看看