Explain作用
使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈
1、表的读取顺序
2、数据读取操作的操作类型
3、哪些索引可以使用
4、哪些索引被实际使用
5、表之间的引用
6、每张表有多少行被优化器查询
使用的方法很简单,就是在你要执行的查询语句前添加EXPLAIN关键字
数据库和表的结构
EXPLAIN SELECT * FROM users
由上图可以看到,通过EXPLAIN出来的信息一共有10列,那么接下来对这些字段所表示的信息逐一介绍(从前往后)
一、id
select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序
分为三种情况:
-
id相同,执行顺序由上至下
-
id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
-
id有部分相同和部分不同,同时存在,id值越大越先执行,相同id的由上至下执行
二、select_type
查询的类型,主要是用于区别普通查询、联合查询、子查询等的复杂查询
常见的取值
-
SIMPLE : 简单的select查询,查询中不包含子查询或者UNION
-
PRIMARY : 查询中者包含任何复杂的子部分,最外层查物则被标记为PRIMARY
- SUBQUERY:在SELECT或WHERE列表中包含了子查询
-
DERIVED :在FROM列表中包含的子查询被标记为DERIVED(衍生)MySQL会递归执行这些子查询,把结果放在临时表里
- UNION :若第二个SELECT出现在UNION之后,则被标记为UNION;若UNION包含在FROM子句的子查询中,外层SELECT将被标记为: DERIVED
- UNION RESULT:从UNION表获取结果的SELECT
- DEPENDENT UNION : UNION中的第二个或后面的SELECT语句,取决于外面的查询
-
DEPENDENT SUBQUERY:子查询中的第一个SELECT,依赖于外部查询
- UNCACHEABLE SUBQUERY:一个子查询的结果不能被缓存,必须重新评估外链接的第一行
三、table
显示这一步所访问数据库中表名称(显示这一行的数据是关于哪张表的),有时不是真实的表名字,也可能是第几步执行的结果的简称
四、type
对表访问方式,表示MySQL在表中找到所需行的方式,又称“访问类型”。
常用的类型有: ALL、index、range、 ref、eq_ref、const、system、NULL(从左到右,性能从差到好)
- system : 表中只有一行记录(等于系统表),这是const类型的特列,实际开发中几乎不会出现,这个也可以忽略不计
- const :表示通过索引一次就找到了,const用于比较primary key或者unique索引。因为只匹配一行数据,所以很快,如将主键置于where列表中,MySQL就能将该查询转换为一个常量
- eq_ref :唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描
-
ref :非唯一性索引扫描,返回匹配某个单独值的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体
- range :只检索给定范围的行,使用一个索引来选择行。key 列显示使用了哪个索引,一般就是在你的where语句中出现了between、<、>、in等的查询。这种范围扫描索引扫描比全表扫描要好,因为它只需要开始于索引的某一点,而结束语另一点,不用扫描全部索引。
- index :Full Index Scan, index 与ALL区别为index类型只遍历索引树。这通常比ALL快,因为索引文件通常比数据文件小。(也就是说虽然All和Index都是读全表,但index是从索引中读取的,而all是从硬盘中读的)
- All :Full Table Scan,将遍历全表以找到匹配的行
备注:一般来说,得保证查询至少达到range级别, 最好能达到ref。
五、possible_keys
指出MySQL能使用哪些索引在表中找到记录,查询涉及到的字段上若存在索引那么这些索引将会被列出,但不一定会被使用(如果没有任何索引可以使用此处的值为NULL)
六、Key
实际上本次查询所使用上的索引。没有用上任何索引的话,此值为NULL。必然包含在possible_keys中
查询中如果使用覆盖索引(下面会介绍),则该索引和查询的select字段重叠。要想强制MySQL使用或忽视possible_keys列中的索引,在查询中使用FORCE INDEX、USE INDEX或者IGNORE INDEX。
覆盖索引:解释一:就是select的数据列只用从索引中就能够取得,不必从数据表中读取,换句话说查询列要被所使用的索引覆盖。
解释二:索引是高效找到行的一个方法,当能通过检索索引就可以读取想要的数据,那就不需要再到数据表中读取行了。如果一个索引包含了(或覆盖了)满足查询语句中字段与条件的数据就叫做覆盖索引。
解释三:是非聚集组合索引的一种形式,它包括在查询里的Select、Join和Where子句用到的所有列(即建立索引的字段正好是覆盖查询语句[select子句]与查询条件[Where子句]中所涉及的字段,也即,索引包含了查询正在查找的所有数据)。
七:key_len
表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下,长度越短越好。
key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的。
八、ref
显示索引的哪一列被使用了,如果有可能是一个常数,哪些列或常量被用于查询索引列上的值
九、rows
根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数
十、Extra
包含不适合在其他列中显示但十分重要的额外信息
1、Using filesort:说明mysql会对数据适用一个外部的索引排序。而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成排序操作称为“文件排序”
2、Using temporary:使用了临时表保存中间结果,mysql在查询结果排序时使用临时表。常见于排序order by和分组查询group by。
3、Using index:表示相应的select操作用使用覆盖索引,避免访问了表的数据行。如果同时出现using where,表名索引被用来执行索引键值的查找;如果没有同时出现using where,表名索引用来读取数据而非执行查询动作。
4、Using where :表明使用where过滤
5、using join buffer:使用了连接缓存
6、impossible where:where子句的值总是false,不能用来获取任何元组
7、select tables optimized away:在没有group by子句的情况下,基于索引优化Min、max操作或者对于MyISAM存储引擎优化count(*),不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。
8、distinct:优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作。
对SQL进行优化之前先简单了解查询SQL的执行顺序
完整SQL语句
1 select distinct 2 <select_list> 3 from 4 <left_table><join_type> 5 join <right_table> on <join_condition> 6 where 7 <where_condition> 8 group by 9 <group_by_list> 10 having 11 <having_condition> 12 order by 13 <order_by_condition> 14 limit <limit number>
SQL执行顺序
1、from <left_table><join_type> 2、on <join_condition> 3、<join_type> join <right_table> 4、where <where_condition> 5、group by <group_by_list> 6、having <having_condition> 7、select 8、distinct <select_list> 9、order by <order_by_condition> 10、limit <limit_number>
1、FROM table1 left join table2 on 将table1和table2中的数据产生笛卡尔积,生成Temp1 2、JOIN table2 所以先是确定表,再确定关联条件 3、ON table1.column = table2.columu 确定表的绑定条件 由Temp1产生中间表Temp2 4、WHERE 对中间表Temp2产生的结果进行过滤 产生中间表Temp3 5、GROUP BY 对中间表Temp3进行分组,产生中间表Temp4 6、HAVING 对分组后的记录进行聚合 产生中间表Temp5 7、SELECT 对中间表Temp5进行列筛选,产生中间表 Temp6 8、DISTINCT 对中间表 Temp6进行去重,产生中间表 Temp7 9、ORDER BY 对Temp7中的数据进行排序,产生中间表Temp8 10、LIMIT 对中间表Temp8进行分页,产生中间表Temp9