zoukankan      html  css  js  c++  java
  • 学会使用 Mysql show processlist 排查问题

    mysql show full processlist 查看当前线程处理情况
    

    事发现场

    每次执行看到的结果应该都有变化,因为是实时的,所以我定义为:“事发现场”,每次执行就相当于现场的快照。

    一般用到 show processlist 或 show full processlist 都是为了查看当前 mysql 是否有压力,都在跑什么语句,当前语句耗时多久了,有没有什么慢 SQL 正在执行之类的,可以看到总共有多少链接数,哪些线程有问题(time是执行秒数,时间长的就应该多注意了),然后可以把有问题的线程 kill 掉,这样可以临时解决一些突发性的问题.

    有时候一个快照可能看不出什么问题,那么可以频发的刷新试试.

    问题排查

    show full processlist 可以看到所有链接的情况,但是大多链接的 state 其实是 Sleep 的,这种的其实是空闲状态,没有太多查看价值
    show processlist 显示的信息都是来自MySQL系统库 information_schema 中的 processlist 表。所以使用下面的查询语句可以获得相同的结果:

    select * from information_schema.processlist;
    

    我们要观察的是有问题的,所以可以进行过滤:

    -- 查询非 Sleep 状态的链接,按消耗时间倒序展示,自己加条件过滤
    select id, db, user, host, command, time, state, info
    from information_schema.processlist
    where command != 'Sleep'
    order by time desc;
    
    #这样就过滤出来哪些是正在干活的,然后按照消耗时间倒叙展示,排在最前面的,极大可能就是有问题的链接了,然后查看 info 一列,就能看到具体执行的什么 SQL 语句了,针对分析 
    

    展示列解释:

    Id: 就是这个线程的唯一标识,当我们发现这个线程有问题的时候,可以通过 kill 命令,加上这个Id值将这个线程杀掉。前面我们说了show processlist 显示的信息时来自information_schema.processlist 表,所以这个Id就是这个表的主键。
    User: 就是指启动这个线程的用户。
    Host: 记录了发送请求的客户端的 IP 和 端口号。通过这些信息在排查问题的时候,我们可以定位到是哪个客户端的哪个进程发送的请求。
    DB: 当前执行的命令是在哪一个数据库上。如果没有指定数据库,则该值为 NULL 。
    Command: 是指此刻该线程正在执行的命令。这个很复杂,下面单独解释
    Time: 表示该线程处于当前状态的时间。
    State: 线程的状态,和 Command 对应,下面单独解释。
    Info: 一般记录的是线程执行的语句。默认只显示前100个字符,也就是你看到的语句可能是截断了的,要看全部信息,需要使用 show full processlist。
    

    下面我们单独看一下 Command 的值:

    Binlog Dump: 主节点正在将二进制日志 ,同步到从节点
    Change User: 正在执行一个 change-user 的操作
    Close Stmt: 正在关闭一个Prepared Statement 对象
    Connect: 一个从节点连上了主节点
    Connect Out: 一个从节点正在连主节点
    Create DB: 正在执行一个create-database 的操作
    Daemon: 服务器内部线程,而不是来自客户端的链接
    Debug: 线程正在生成调试信息
    Delayed Insert: 该线程是一个延迟插入的处理程序
    Drop DB: 正在执行一个 drop-database 的操作
    Execute: 正在执行一个 Prepared Statement
    Fetch: 正在从Prepared Statement 中获取执行结果
    Field List: 正在获取表的列信息
    Init DB: 该线程正在选取一个默认的数据库
    Kill : 正在执行 kill 语句,杀死指定线程
    Long Data: 正在从Prepared Statement 中检索 long data
    Ping: 正在处理 server-ping 的请求
    Prepare: 该线程正在准备一个 Prepared Statement
    ProcessList: 该线程正在生成服务器线程相关信息
    Query: 该线程正在执行一个语句
    Quit: 该线程正在退出
    Refresh:该线程正在刷表,日志或缓存;或者在重置状态变量,或者在复制服务器信息
    Register Slave: 正在注册从节点
    Reset Stmt: 正在重置 prepared statement
    Set Option: 正在设置或重置客户端的 statement-execution 选项
    Shutdown: 正在关闭服务器
    Sleep: 正在等待客户端向它发送执行语句
    Statistics: 该线程正在生成 server-status 信息
    Table Dump: 正在发送表的内容到从服务器
    Time: Unused
    

    kill 使用

    上面提到的 线程ID 是可以通过 kill 杀死的;所以上面基本上可以把有问题的执行语句找出来,然后就可以 kill 掉了,那么一个一个来 kill 么?

    -- 查询执行时间超过2分钟的线程,然后拼接成 kill 语句
    select concat('kill ', id, ';')
    from information_schema.processlist
    where command != 'Sleep'
    and time > 2*60
    order by time desc;
    

    在下一步我就不用说了吧,把拼接 kill 的执行结果跑一遍就搞定了,这个有时候非常好用,谁用谁知道

    常用SQL

    按客户端 IP 分组,看哪个客户端的链接数最多

    select client_ip,count(client_ip) as client_num from (select substring_index(host,':' ,1) as client_ip from information_schema.processlist ) as connect_info group by client_ip order by client_num desc;
    

    查看正在执行的线程,并按 Time 倒排序,看看有没有执行时间特别长的线程

    select * from information_schema.processlist where Command != 'Sleep' order by Time desc;
    

    找出所有执行时间超过 5 分钟的线程,拼凑出 kill 语句,方便后面查杀

    select concat('kill ', id, ';') from information_schema.processlist where Command != 'Sleep' and Time > 300 order by Time desc;
    

    常见问题

    一些问题会导致连锁反应,而且不太好定位,有时候以为是慢查询,很可能是大多时间是在等在CPU、内存资源的释放,所以有时候同一个查询消耗的时间有时候差异很大

    总结了一些常见问题:

    CPU报警:很可能是 SQL 里面有较多的计算导致的
    连接数超高:很可能是有慢查询,然后导致很多的查询在排队,排查问题的时候可以看到”事发现场“类似的 SQL 语句一大片,那么有可能是没有索引或者索引不好使,可以用:explain 分析一下 SQL 语句
    
  • 相关阅读:
    策略模式
    模板方法模式

    kafka
    Linux下部署MongoDB
    Linux下安装ssdb
    ssdb常用知识点
    Eclipse 的 Java Web 项目环境搭建
    PLSQL连接Oracle
    redis书籍
  • 原文地址:https://www.cnblogs.com/passzhang/p/13193415.html
Copyright © 2011-2022 走看看