引言:
实际项目开发中,由于我们不知道实际查询的时候数据库里发生了什么事情,数据库软件是怎样扫描表、怎样使用索引的,因此,我们能感知到的就只有sql语句运行的时间,在数据规模不大时,查询是瞬间的,因此,在写sql语句的时候就很少考虑到性能的问题。但是当数据规模增大,如千万、亿的时候,我们运行同样的sql语句时却发现迟迟没有结果,这个时候才知道数据规模已经限制了我们查询的速度。所以,查询优化和索引也就显得很重要了。
一、Explain简介
1、作用
当我们在查询前能否预先估计查询究竟要涉及多少行、使用哪些索引、运行时间呢?答案是能的,mysql提供了相应的功能和语法来实现该功能。
通过Explain,我们可以分析出以下结果:
- 表的读取顺序
- 数据读取操作的操作类型
- 哪些索引可以使用
- 哪些索引被实际使用
- 表之间的引用
- 每张表有多少行被优化器查询
2、使用方式
在SQL语句前加一个"EXPLAIN"即可。比如我们要分析如下SQL语句:
mysql> EXPLAIN SELECT * FROM person_info_large ; +----+-------------+---------+------+---------------+------+---------+------+--------+-------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+------ --+------+---------------+------+---------+------+--------+-------+
二、Explain执行计划各字段解读
1、id
多表查询中表语句的执行顺序
id共有三种情况:
- id相同,执行顺序由上至下
mysql> EXPLAIN SELECT * from dept t1,dept t2,dept t3 WHERE t1.deptno=t2.deptno AND t2.deptno=t3.deptno; +----+-------------+-------+------+---------------+------+---------+------+------+---------------------------------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+-------+------+---------------+------+---------+------+------+---------------------------------+ | 1 | SIMPLE | t1 | ALL | NULL | NULL | NULL | NULL | 10 | NULL | | 1 | SIMPLE | t2 | ALL | NULL | NULL | NULL | NULL | 10 | Using where; Using join buffer | | 1 | SIMPLE | t3 | ALL | NULL | NULL | NULL | NULL | 10 | Using where; Using join buffer | +----+-------------+-------+------+---------------+------+---------+------+------+---------------------------------+ 3 rows in set (0.00 sec)
- id不相同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
- id相同与不同同时存在,id值越大优先级越高,id相同执行顺序由上至下
mysql> EXPLAIN SELECT * from (SELECT * FROM dept )t1,dept t2 WHERE t1.deptno=t2.deptno; +----+-------------+------------+------+---------------+-------------+---------+----------------+------+-------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+------------+------+---------------+-------------+---------+----------------+------+-------+ | 1 | PRIMARY | t2 | ALL | NULL | NULL | NULL | NULL | 10 | NULL | | 1 | PRIMARY | <derived2> | ref | <auto_key0> | <auto_key0> | 3 | test.t2.deptno | 2 | NULL | | 2 | DERIVED | dept | ALL | NULL | NULL | NULL | NULL | 10 | NULL | +----+-------------+------------+------+---------------+-------------+---------+----------------+------+-------+ 3 rows in set (0.00 sec)
2、select_type
表示查询的类型,主要是用于区别普通查询、联合查询、子查询等的复杂查询。
主要有以下这几种查询类型:
-
SIMPLE 简单的select查询,查询中不包含子查询或者UNION
-
PRIMARY 查询中若包含任何复杂的子部分,最外层查询则被标记为PRIMARY
-
SUBQUERY 在SELECT或WHERE列表中包含了子查询
-
DERIVED 在FROM列表中包含的子查询被标记为DERIVED(衍生),MySQL会递归执行这些子查询,把结果放在临时表中
-
UNION 若第二个SELECT出现在UNION之后,则被标记为UNION:若UNION包含在FROM子句的子查询中,外层SELECT将被标记为:DERIVED
-
UNION RESULT 从UNION表获取结果的SELECT
3、table
执行当前语句的那张表
4、type
显示查询使用了哪种类型,type包含的类型包括如下图所示的常见几种:
+-------+-------------+---------+------+---------------+----------------+------+ | all | index | range | ref | eq_fef | system,const | NULL | +-------+-------------+------ --+------+---------------+----------------+------+
从最好到最差依次是:
system > const > eq_ref > ref >fulltext>range > index_merge>index > all
- system 表只有一行记录(等于系统表),这是const类型的特列,平时不会出现,这个也可以忽略不计
- const 表示通过索引一次就找到了,const用于比较primary key 或者unique索引。因为只匹配一行数据,所以很快。如将主键置于where列表中,MySQL就能将该查询转换为一个常量。
mysql> EXPLAIN select * FROM (select * FROM dept t1 where id=1)t2; +----+-------------+-------------------+--------+---------------+---------+---------+-------+------+-------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+-------------------+--------+---------------+---------+---------+-------+------+-------+ | 1 | PRIMARY | <derived2> | system | NULL | NULL | NULL | NULL | 1 | NULL | | 2 | DERIVED | t1 | const | PRIMARY | PRIMARY | 4 | const | 1 | NULL | +----+-------------+-------------------+--------+---------------+---------+---------+-------+------+-------+ 2 rows in set (0.00 sec)
通俗易懂的讲 对于 system 而言 表t2里面有0条(空表)或者1条记录,对于 const 而言 表t1通过主键或者唯一索引过滤数据且数据集有且只有为一条记录
如上图所示,在id为1时,table显示的是 <derived2>
,这里指表t1过滤数据生成结果集的衍生表,我理解为临时表。
- eq_ref 唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描
mysql> EXPLAIN SELECT * from dept t1,dept t2 WHERE t1.id=t2.id ; +----+-------------+-------+--------+---------------+---------+---------+------------+------+-------------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+-------+--------+---------------+---------+---------+------------+------+-------------+ | 1 | SIMPLE | t1 | ALL | PRIMARY | NULL | NULL | NULL | 10 | NULL | | 1 | SIMPLE | t2 | eq_ref | PRIMARY | PRIMARY | 4 | test.t1.id | 1 | NULL | +----+-------------+-------+--------+---------------+---------+---------+------------+------+-------------+ 2 rows in set (0.00 sec)
通俗易懂的讲就是表t2的关联字段是主键或唯一索引与之对应表t1的关联字段是主键或唯一索引,t1和t2进行一对一匹配
- ref 非唯一性索引扫描,返回匹配某个单独值的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体。
mysql> EXPLAIN SELECT * from emp t1 ,dept t2 WHERE t1.deptno=t2.deptno; +----+-------------+-------+------+---------------+--------------+---------+----------------+-------+-------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+-------+------+---------------+--------------+---------+----------------+-------+-------+ | 1 | SIMPLE | t2 | ALL | NULL | NULL | NULL | NULL | 10 | NULL | | 1 | SIMPLE | t1 | ref | index_deptno | index_deptno | 3 | test.t2.deptno | 27685 | NULL | +----+-------------+-------+------+---------------+--------------+---------+----------------+-------+-------+ 2 rows in set (0.00 sec)
通俗易懂的讲就是t1关联字段是主键或唯一索引与之对应的t2的关联字段并不是主键或者唯一索引,t1和t2进行一对多匹配
- range 只检索给定范围的行,使用一个索引来选择行,key列显示使用了哪个索引,一般就是在你的where语句中出现between、< 、>、in等的查询,这种范围扫描索引比全表扫描要好,因为它只需要开始于索引的某一点,而结束于另一点,不用扫描全部索引。
- index Full Index Scan,Index与All区别为index类型只遍历索引树。这通常比ALL快,因为索引文件通常比数据文件小。(也就是说虽然all和Index都是读全表,但index是从索引中读取的,而all是从硬盘读取的)
- all Full Table Scan 将遍历全表以找到匹配的行
5、possible_keys 和 key
possible_keys 和 key 的前提条件是走索引,如果不走索引possible_keys 和 key 值为NULL
- possible_keys 显示可能应用在这张表中的索引,一个或多个。查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用。
- key