mysql之优化-SQL 语句执行慢分析

zoukankan html css js c++ java

mysql之优化-SQL 语句执行慢分析
文章目录
一、分类讨论
二、针对偶尔很慢的情况
2.1 数据库在刷新脏页（flush）
2.1.1 刷脏页有下面4种场景
2.2 拿不到锁我能怎么办
三、针对一直都这么慢的情况
3.1 没用到索引
3.1.1 字段没有索引
3.1.2 有索引，但却没用到
3.1.3 函数操作导致没有用上索引
3.2 数据库选错索引了
3.2.1 示例
3.2.2 为什么会这样呢？
3.2.3 系统是怎么判断走全表扫描而不走索引的?
四、总结
4.1 大多数情况下很正常，偶尔很慢，则有如下原因
4.1.1 数据库在刷新脏页
4.1.2 执行的时候遇到锁
4.2 这条 SQL 语句一直执行的很慢，则有如下原因。
4.2.1 没有用上索引
4.2.2 数据库选错了索引。
五，插入语句优化
5.1 大批量插入数据
5.2 优化INSERT语句
一、分类讨论

一条 SQL 语句执行的很慢，那是每次执行都很慢呢？还是大多数情况下是正常的，偶尔出现很慢呢？所以我觉得，我们还得分以下两种情况来讨论。
1. 大多数情况是正常的，只是偶尔会出现很慢的情况。
2. 在数据量不变的情况下，这条SQL语句一直以来都执行的很慢。
针对这两种情况，我们来分析下可能是哪些原因导致的。

二、针对偶尔很慢的情况

一条 SQL 大多数情况正常，偶尔才能出现很慢的情况，针对这种情况，我觉得这条SQL语句的书写本身是没什么问题的，而是其他原因导致的，那会是什么原因呢？

2.1 数据库在刷新脏页（flush）

当我们要往数据库插入一条数据、或者要更新一条数据的时候，我们知道数据库会在内存中把对应字段的数据更新了，但是更新之后，这些更新的字段并不会马上同步持久化到磁盘中去，而是把这些更新的记录写入到 redo log 日记中去，等到空闲的时候，在通过 redo log 里的日记把最新的数据同步到磁盘中去。

当内存数据页跟磁盘数据页内容不一致的时候，我们称这个内存页为“脏页”。内存数据写入到磁盘后，内存和磁盘上的数据页的内容就一致了，称为“干净页”。

2.1.1 刷脏页有下面4种场景
- redolog写满了：redo log 里的容量是有限的，如果数据库一直很忙，更新又很频繁，这个时候 redo log 很快就会被写满了，这个时候就没办法等到空闲的时候再把数据同步到磁盘的，只能暂停其他操作，全身心来把数据同步到磁盘中去的，而这个时候，就会导致我们平时正常的SQL语句突然执行的很慢，所以说，数据库在在同步数据到磁盘的时候，就有可能导致我们的SQL语句执行的很慢了。
- 内存不够用了：如果一次查询较多的数据，恰好碰到所查数据页不在内存中时，需要申请内存，而此时恰好内存不足的时候就需要淘汰一部分内存数据页，如果是干净页，就直接释放，如果恰好是脏页就需要刷脏页。
- MySQL 认为系统“空闲”的时候：这时系统没什么压力。
- MySQL 正常关闭的时候：这时候，MySQL 会把内存的脏页都 flush 到磁盘上，这样下次 MySQL 启动的时候，就可以直接从磁盘上读数据，启动速度会很快。
2.2 拿不到锁我能怎么办

这个就比较容易想到了，我们要执行的这条语句，刚好这条语句涉及到的表，别人在用，并且加锁了，我们拿不到锁，只能慢慢等待别人释放锁了。或者，表没有加锁，但要使用到的某个一行被加锁了。

如果要判断是否真的在等待锁，我们可以用 show processlist 这个命令来查看当前的状态哦。

下来我们来访分析下第二种情况。

三、针对一直都这么慢的情况

如果在数据量一样大的情况下，这条 SQL 语句每次都执行的这么慢，那就就要好好考虑下你的 SQL 书写了，下面我们来分析下哪些原因会导致我们的 SQL 语句执行的很不理想。

我们先来假设我们有一个表，表里有下面两个字段,分别是主键 id，和两个普通字段 c 和 d。
```
mysql> CREATE TABLE `t` (  
`id` int(11) NOT NULL,  
`c` int(11) DEFAULT NULL,  
`d` int(11) DEFAULT NULL,  
PRIMARY KEY (`id`)) ENGINE=InnoDB;
```
3.1 没用到索引

没有用上索引，我觉得这个原因是很多人都能想到的，例如你要查询这条语句
```
select * from t where 100 <c and c < 100000;
```
3.1.1 字段没有索引

刚好你的 c 字段上没有索引，那么抱歉，只能走全表扫描了，你就体验不会索引带来的乐趣了，所以，这回导致这条查询语句很慢。

3.1.2 有索引，但却没用到

好吧，这个时候你给 c 这个字段加上了索引，然后又查询了一条语句
```
select * from t where c - 1 = 1000;
```
我想问大家一个问题，这样子在查询的时候会用索引查询吗？

不会，如果我们在字段的左边做了运算，那么很抱歉，在查询的时候，就不会用上索引了，所以呢，大家要注意这种字段上有索引，但由于自己的疏忽，导致系统没有使用索引的情况了。

正确的查询应该如下
```
select * from t where c = 1000 + 1;
```
有人可能会说，右边有运算就能用上索引？难道数据库就不会自动帮我们优化一下，自动把 c - 1=1000 自动转换为 c = 1000+1。

3.1.3 函数操作导致没有用上索引

如果我们在查询的时候，对字段进行了函数操作，也是会导致没有用上索引的，例如
```
select * from t where pow(c,2) = 1000;
```
这里我只是做一个例子，假设函数 pow 是求 c 的 n 次方，实际上可能并没有 pow(c,2)这个函数。其实这个和上面在左边做运算也是很类似的。

所以呢，一条语句执行都很慢的时候，可能是该语句没有用上索引了，不过具体是啥原因导致没有用上索引的呢，你就要会分析了，我上面列举的三个原因，应该是出现的比较多的吧。

3.2 数据库选错索引了

3.2.1 示例

我们在进行查询操作的时候，例如
```
select * from t where 100 < c and c < 100000;
```
我们知道，主键索引和非主键索引是有区别的，主键索引存放的值是整行字段的数据，而非主键索引上存放的值不是整行字段的数据，而且存放主键字段的值。里面有说到主键索引和非主键索引的区别。

不大懂的可以看这思维导图

也就是说，我们如果走 c 这个字段的索引的话，最后会查询到对应主键的值，然后，再根据主键的值走主键索引，查询到整行数据返回。

好吧扯了这么多，其实我就是想告诉你，就算你在 c 字段上有索引，系统也并不一定会走 c 这个字段上的索引，而是有可能会直接扫描扫描全表，找出所有符合 100 < c and c < 100000 的数据。

3.2.2 为什么会这样呢？

其实是这样的，系统在执行这条语句的时候，会进行预测：究竟是走 c 索引扫描的行数少，还是直接扫描全表扫描的行数少呢？显然，扫描行数越少当然越好了，因为扫描行数越少，意味着I/O操作的次数越少。

如果是扫描全表的话，那么扫描的次数就是这个表的总行数了，假设为 n；而如果走索引 c 的话，我们通过索引 c 找到主键之后，还得再通过主键索引来找我们整行的数据，也就是说，需要走两次索引。而且，我们也不知道符合 100 c < and c < 10000 这个条件的数据有多少行，万一这个表是全部数据都符合呢？这个时候意味着，走 c 索引不仅扫描的行数是 n，同时还得每行数据走两次索引。

3.2.3 系统是怎么判断走全表扫描而不走索引的?

判断来源于系统的预测，也就是说，如果要走 c 字段索引的话，系统会预测走 c 字段索引大概需要扫描多少行。如果预测到要扫描的行数很多，它可能就不走索引而直接扫描全表了。

那么问题来了，**系统是怎么预测判断的呢？**这里我给你讲下系统是怎么判断的吧，虽然这个时候我已经写到脖子有点酸了。

系统是通过索引的区分度来判断的，一个索引上不同的值越多，意味着出现相同数值的索引越少，意味着索引的区分度越高。我们也把区分度称之为基数，即区分度越高，基数越大。所以呢，基数越大，意味着符合 100 < c and c < 10000 这个条件的行数越少。

所以呢，一个索引的基数越大，意味着走索引查询越有优势。

那么问题来了，怎么知道这个索引的基数呢？

系统当然是不会遍历全部来获得一个索引的基数的，代价太大了，索引系统是通过遍历部分数据，也就是通过采样的方式，来预测索引的基数的。

重点来了，居然是采样，那就有可能出现失误的情况，也就是说，c 这个索引的基数实际上是很大的，但是采样的时候，却很不幸，把这个索引的基数预测成很小。例如你采样的那一部分数据刚好基数很小，然后就误以为索引的基数很小。然后系统就不走 c 索引了，直接走全部扫描了。

所以呢，说了这么多，得出结论：由于统计的失误，导致系统没有走索引，而是走了全表扫描，而这，也是导致我们 SQL 语句执行的很慢的原因。

这里声明一下，系统判断是否走索引，扫描行数的预测其实只是原因之一，这条查询语句是否需要使用使用临时表、是否需要排序等也是会影响系统的选择的。

不过呢，我们有时候也可以通过强制走索引的方式来查询，例如
```
select * from t force index(a) where c < 100 and c < 100000;
```
我们也可以通过
```
show index from t;
```
来查询索引的基数和实际是否符合，如果和实际很不符合的话，我们可以重新来统计索引的基数，可以用这条命令
```
analyze table t;
```
来重新统计分析。

既然会预测错索引的基数，这也意味着，当我们的查询语句有多个索引的时候，系统有可能也会选错索引，这也可能是 SQL 执行的很慢的一个原因。

四、总结

以上是我的总结与理解，最后一个部分，我怕很多人不大懂数据库居然会选错索引，所以我详细解释了一下，下面我对以上做一个总结。

一个 SQL 执行的很慢，我们要分两种情况讨论：

4.1 大多数情况下很正常，偶尔很慢，则有如下原因

4.1.1 数据库在刷新脏页

例如 redo log 写满了需要同步到磁盘。

4.1.2 执行的时候遇到锁

如表锁、行锁。

4.2 这条 SQL 语句一直执行的很慢，则有如下原因。

4.2.1 没有用上索引

例如该字段没有索引；由于对字段进行运算、函数操作导致无法用索引。

4.2.2 数据库选错了索引。

五，插入语句优化

5.1 大批量插入数据
- 当用load命令导入数据的时候，适当的设置可以提高导入的速度。
- 对于MyISAM存储引擎的表，可以通过如下方式快速的导入大量的数据
代码如下:
```
`ALTER` `TABLE` `tb1_name DISABLE KEYS; ``loading the data ``ALTER` `TABLE` `tb1_name ENABLE KEYS;`
```
DISABLE KEYS 和 ENABLE KEYS 用来打开或者关闭MyISAM表非唯一索引的更新。在导入大量的数据到一个非空的MyISAM表时，通过设置这两个命令，可以提高导入的效率。

对于导入大量的数据到一个空的MyISAM表时，默认就是先导入数据然后才创建索引的，索引不用进行设置。
```
`load` `data infile ``'/home/mysql/text_txt'` `into` `table` `text`
```
对于InnoDB类型的表，这种方式不能提高导入数据的效率，但也有几种针对InnoDB类型的表进行优化的方式。
1. 因为InnoDB类型的表式按照主键的顺序保存的，所以将导入的数据按照主键的顺序排序，可以有效提高导入数据的效率。
2. 在导入数据前执行 SET UNIQUE_CHECKS=0，关闭唯一性校验，在导入结束后执行SET UNIQUE_CHECKS=1，恢复唯一性校验，可以提高导入的效率。
3. 如果应用使用自动提交的方式，建议在导入前执行SET AUTOCOMMIT=0，关闭自动提交，导入结束后执行SET AUTOCOMMIT=1，打开自动提交，也可以提高导入效率。
5.2 优化INSERT语句

当进行数据INSERT的时候，可以考虑采用以下几种方式进行优化
1. 如果同时从一个客户插入很多行，尽量使用多个值表的INSERT语句，这种方式将大大缩短客户端与MySQL数据库的链接、关闭等消耗，使得效率比分开执行的单个INSERT语句快。例如：
  
  insert into test values(1,2); insert into test values(3,4); insert into test values(5,6); #将上面三句改为: insert into test values(1,2),(3,4),(5,6)……
2. 如果从不同客户插入很多行，能通过使用INSERT DELAYED 语句得到更高的速度。
  
  DELAYED 的含义是让INSERT 语句马上执行，其实数据都被放在内存的队列中，并没有真正写入磁盘，这比每条语句分别插入要快得多；LOW_PRIORITY刚好相反，在所有其他用户对表的读写完后才进行插入。
3. 将索引文件和数据文件分在不同的磁盘上存放
4. 如果进行批量插入，可以增加bulk_insert_buffer_size变量值的方法来提高速度，但是，这只能对于MyISAM表使用。
5. 当从一个文本文件中装载一个表时，使用LOAD DATA INFILE。这通常比使用很多insert语句快20倍左右。
以上是MySQL 性能优化的一些其它需要注意的地方，大家结合和，充分发挥mysql的性能。
查看全文

相关阅读:
一、定义枚举类，并随机取值
 常用Linux日志查询命令
 一、爬虫之基础
 Jmeter接口自动化-3-生成HTML报告
 Jmeter接口自动化-2-查看结果数只能显示有限的数据，查看全部数据
 Jmeter接口自动化-1-启动报错：Could not initialize class org.apache.jmeter.gui.util.MenuFactory
三十一、Java基础之Collection集合
 设计模式
 缓存
 Ckeditor配置

原文地址：https://www.cnblogs.com/daozhangblog/p/12446420.html

mysql之优化-SQL 语句执行慢分析

文章目录

一、分类讨论

二、针对偶尔很慢的情况

2.1 数据库在刷新脏页（flush）

2.1.1 刷脏页有下面4种场景

2.2 拿不到锁我能怎么办

三、针对一直都这么慢的情况

3.1 没用到索引

3.1.1 字段没有索引

3.1.2 有索引，但却没用到

3.1.3 函数操作导致没有用上索引

3.2 数据库选错索引了

3.2.1 示例

3.2.2 为什么会这样呢？

3.2.3 系统是怎么判断走全表扫描而不走索引的?

四、总结

4.1 大多数情况下很正常，偶尔很慢，则有如下原因

4.1.1 数据库在刷新脏页

4.1.2 执行的时候遇到锁

4.2 这条 SQL 语句一直执行的很慢，则有如下原因。

4.2.1 没有用上索引

4.2.2 数据库选错了索引。

五，插入语句优化

5.1 大批量插入数据

5.2 优化INSERT语句