性能分析
慢查询日志分析
①查询慢查询日志的状态
show global variables like '%slow_query_log%';
②开启慢查询日志(当mysql重启时会重置)
set global slow_query_log;
③查询mysql默认限制慢sql语句的上限时间值
show variables like '%long_query_time%'; # 默认10s
④设置long_query_time的值
set global long_query_time=3; # 推荐使用config而不是这条命令
⑤显示慢sql的条数
show global status like '%Slow_queries%';
分析慢查询日志的工具
mysqldumpslow
explain查看执行计划
之前好像讲过了。
profile性能分析
①查询当前的profile状态
show variables like 'profiling';
②打开此功能
set profiling=on;
③查询所有sql执行的耗时时间
show profiles; # 这里会有sql编号
④显示具体那一条的sql语句的具体状态(sql语句执行的生命周期)
show profile [all|cpu,block io] for query sql编号;
如果在状态中出现converting HEAP to MyISAM或Creating tmp table或Copying to tmp table to disk或locked这四个字段其中的一个或一个以上,说明此sql出现问题的原因。
性能优化
服务器层面优化
innodb_buffer_pool_size设置
调优参考计算方法:
val = Innodb_buffer_pool_pages_data / Innodb_buffer_pool_pages_total * 100%
val > 95% 则考虑增大 innodb_buffer_pool_size, 建议使用物理内存的75%
val < 95% 则考虑减小 innodb_buffer_pool_size, 建议设置为:Innodb_buffer_pool_pages_data * Innodb_page_size * 1.05 / (1024 * 1024 * 1024)
设置命令:
set global innodb_buffer_pool_size = 2097152; //缓冲池字节大小,单位kb,如果不设置,默认为128M
设置要根据自己的实际情况来设置,并不是设置越大越好,可能设置的数值太大体现不出优化效果,反而造成系统的swap空间被占用,导致操作系统变慢,降低sql查询性能。
内存预热
默认情况,只有某条数据被读取一次,才会缓存在 innodb_buffer_pool。所以,数据库刚刚启动,需要进行数据预热,将磁盘上的所有数据缓存到内存中。数据预热可以提高读取速度。
innodb_log_file_size设置
推荐 innodb_log_file_size 设置为 0.25 * innodb_buffer_pool_size
选择SSD磁盘提高读写能力
SQL设计层面优化
中间表的设计
冗余字段的设计
拆表字段
把常用字段放在主表,不常用字段放在子表,两张表一对一关联。
拆表数据(分库分表)
拆分数据源,可分为拆库和拆表。
拆库的要求是所有数据可通过某一个唯一标识聚合到一起。而这种拆分方式,分为两种:hash拆分和冷热隔离。
hash拆分
比如某个库是用来存储用户多维度信息的,可通过用户id聚合到一起,这种库的特点是多表有共同的聚合id字段。
这种方式的拆库,需要同时操作多个库,比如mod 10
取值,那需要同时操作10个库,每个库的链接请求都是同量的,同时跨库操作也是十分麻烦的,事务就不用说了,维护成本也是成倍增加的。
优点是风险分散,某一个库挂了,其他库不受影响,整体服务受影响的比例也会降低。
冷热隔离
冷热隔离,是指把冷热数据区分开,这种隔离是基于数据访问的时效性,比如新闻资讯,越近的数据被访问概率越大。冷热的区分期间,或以时间来分割,或以id来分割。这种隔离的特点是,一core多non-core,重点维护core数据,而non-core随着时间推移,越早的数据被访问的概率越小,甚至可被直接归档。这样维护的数据会是极少的几个数据库。
SQL语句优化
limit优化
- 延迟加载(分页)
select id from test where id = 最大id limit 10;
- 做索引:对于有where条件,又想走索引用limit的,必须设计一个索引,将where放第一位,limit用到的主键放第2位,而且只能select主键。
索引优化
如何创建索引并正确使用索引组合
联合索引优化策略:(选择索引列的顺序)
- 经常会被使用到的列优先
- 选择性高的列优先
- 宽度小的列优先
order by group by与索引设计的联系
order by在两种情况下满足Using Index排序:
- 最左前缀法则,使用的复合索引为最左前列;
- 使用的where子句与order by子句条件组合满足索引最左前列;
group by与order by遵循的原则基本一致。除了:能在where限定的条件就不要在having中限定。
当无法使用索引列时,group by与order by需要增加max_length_for_sort_data与sort_buffer_size参数设置。(因为单路与双路排序的原因:当数据量大且多单路排序一次完不成时,就会再次执行,最终将结果合并,这样可能导致,两路以上的排序。过多的路排序导致IO流操作频繁)
其他优化项
- join语句优化:尽可能减少Join语句中的内循环次数,"永远是小结果集驱动大的结果集";保证Join语句中的被驱动表上join条件字段已经被索引;
- 最左前缀法则
- 范围条件(range)右边的所有条件全失效。
- 使用<、<=、>、>=等条件操作导致全表扫描失效。
- 一般最好写like查询的条件是"字符串%",而"%字符串%"与"%字符串"这两种形式是会导致索引失效。用“覆盖索引:建立的索引与查询的字段最好查询个数与顺序上最好完全一致”解决;
- 查询条件varchar类型的字符串不加单引号会导致索引失效。
- 少用or,用它来链接查询的是否也会导致索引失效。
- 索引列上无计算操作,不然也会到索引失效。