一:概述
- 在 Mysql 中 使用 慢查询日志,可以记录产生慢查询的记录。
- 但是如果要分析慢查询的日志信息,直接打开文件是不可行的,只会浪费时间和金钱。
- 从慢查询日志中,剖析日志生成报告,我们可以使用 pt-query-digest
- 参考 《MySQL慢查询分析工具pt-query-digest详解》
二:安装
- 这里推荐使用源码安装,在 官网 上下载自己所需要的版本。
- tar -zxvf percona-toolkit-版本 & cd percona-toolkit-版本 & make & make install
- 即可以完成安装。
三:pt-query-digest 语法
pt-query-digest [OPTIONS] [FILES] [DSN] --create-review-table 当使用--review参数把分析结果输出到表中时,如果没有表就自动创建。 --create-history-table 当使用--history参数把分析结果输出到表中时,如果没有表就自动创建。 --filter 对输入的慢查询按指定的字符串进行匹配过滤后再进行分析 --limit 限制输出结果百分比或数量,默认值是20,即将最慢的20条语句输出,如果是50%则按总响应时间占比从大到小排序,输出到总和达到50%位置截止。 --host mysql服务器地址 --user mysql用户名 --password mysql用户密码 --history 将分析结果保存到表中,分析结果比较详细,下次再使用--history时,如果存在相同的语句,且查询所在的时间区间和历史表中的不同,则会记录到数据表中,可以通过查询同一CHECKSUM来比较某类型查询的历史变化。 --review 将分析结果保存到表中,这个分析只是对查询条件进行参数化,一个类型的查询一条记录,比较简单。当下次使用--review时,如果存在相同的语句分析,就不会记录到数据表中。 --output 分析结果输出类型,值可以是report(标准分析报告)、slowlog(Mysql slow log)、json、json-anon,一般使用report,以便于阅读。 --since 从什么时间开始分析,值为字符串,可以是指定的某个”yyyy-mm-dd [hh:mm:ss]”格式的时间点,也可以是简单的一个时间值:s(秒)、h(小时)、m(分钟)、d(天),如12h就表示从12小时前开始统计。 --until 截止时间,配合—since可以分析一段时间内的慢查询。
四:报告分析
- 第一部分:总体统计结果
-
-
# 工具执行日志分析的用户时间,系统时间,物理内存占用大小,虚拟内存占用大小
# 190ms user time, 40ms system time, 28.95M rss, 4.11G vsz# 报告生成时间
# Current date: Mon Apr 13 11:36:42 2020
# 报告主机
# Hostname: Hong# 慢日志文件
# Files: /Users/lihong/Desktop/on-line/homestead-slow.log# 语句总数量 唯一语句数 QPS 并发数
# Overall: 8 total, 8 unique, 0.73 QPS, 0.00x concurrency ________________# 日志时间范围
# Time range: 2020-04-13T03:18:17 to 2020-04-13T03:18:28# 属性 总计 最小 最大 平均 标准 中等
# Attribute total min max avg 95% stddev median
# ============ ======= ======= ======= ======= ======= ======= =======
# 语句执行时间
# Exec time 7ms 26us 4ms 903us 4ms 1ms 512us
# 锁占用时间
# Lock time 1ms 0 768us 142us 761us 245us 67us
# 发送客户端行数
# Rows sent 15 0 6 1.88 5.75 2.08 0.99
# select扫描行数
# Rows examine 1.02k 0 1.01k 130.75 1012.63 334.35 2.98
# 查询字符数
# Query size 177 11 32 22.12 31.70 7.09 26.08
-
- 第二部分:分组统计结果
-
-
# 解释 # Rank:所有语句的排名,默认按查询时间降序排列,通过--order-by指定 # Query ID:语句的ID,(去掉多余空格和文本字符,计算hash值) # Response:总的响应时间 # time:该查询在本次分析中总的时间占比 # calls:执行次数,即本次分析总共有多少条这种类型的查询语句 # R/Call:平均每次执行的响应时间 # V/M:响应时间Variance-to-mean的比率 # Item:查询对象 # Rank Query ID Response time Calls R/Call V/M # ==== ================================= ============= ===== ====== ===== # 1 0x19A1F14EFC0F221D30AFCB1E1344... 0.0044 61.1% 1 0.0044 0.00 SELECT users # 2 0xE77769C62EF669AA7DD5F6760F2D... 0.0011 15.7% 1 0.0011 0.00 SHOW VARIABLES ......
-
- 第三部分:详细的SQL信息
-
-
# Query 1: 0 QPS, 0x concurrency, ID 0x19A1F14EFC0F221D30AFCB1E1344BEBD at byte 1648 # Scores: V/M = 0.00 # Time range: all events occurred at 2020-04-13T03:18:24 # 执行时间 # Attribute pct total min max avg 95% stddev median # ============ === ======= ======= ======= ======= ======= ======= ======= # Count 12 1 # Exec time 61 4ms 4ms 4ms 4ms 4ms 0 4ms # Lock time 67 768us 768us 768us 768us 768us 0 768us # Rows sent 40 6 6 6 6 6 0 6 # Rows examine 0 6 6 6 6 6 0 6 # Query size 10 19 19 19 19 19 0 19 # String: # Databases test # Hosts localhost # Users root # 查询时间分布 # Query_time distribution # 1us # 10us # 100us # 1ms ################################################################ # 10ms # 100ms # 1s # 10s+ # Tables # SHOW TABLE STATUS FROM `test` LIKE 'users'G # SHOW CREATE TABLE `test`.`users`G # EXPLAIN /*!50100 PARTITIONS*/ select * from usersG
-
-