Mysql的优化,一般是对索引优化,这里主要以innodb为主
索引是帮助MySQL高效获取数据的排好序的数据结构,排好序是索引数据结构的特点,也是索引优化的前提。
1. 索引数据结构
索引底层使用B+树作为其底层存储结构。相较于二叉树、红黑树、hash表、B树而言,B+树有自己独特的优势。
B+树特点
- 非叶子节点不存储data,只存储索引(冗余),可以放更多的索引
- 叶子节点包含所有索引字段
- 叶子节点用指针连接,提高区间访问的性能
1.1 聚集索引(主键索引)
聚集索引指索引包含了完整的数据记录,一般主键索引是聚集索引
mysql使用B+树存储索引,页大小默认为16K,mysql在查询时会一次性将一个页加载到内存中(一次磁盘I/O),在内存中可以快速定位下一次需要加载的页(有一次磁盘I/O),所以一般精准查询只需要进行三次磁盘I/O即可找到对应的数据。
1.2联合索引
也称非聚集索引,非聚集索引的data存储的是聚集索引的值,如果返回的数据包含了非索引值,那么就需要通过聚集索引找到完整的记录,这里就会产生回表,一般建议使用覆盖索引,也就是查询返回值都在索引列中,例如下图,只返回name,age,position值的话,就不需要再去聚集索引查找其他数据,速度会快很多。
2. 优化建议
- 建表时尽量建主键(不建主键,mysql内部也会自己创建一个主键)
- 主键尽量使用整型的自增主键(自增主键会减少插入)
- 索引最佳实践
- 全值匹配
- 最左前缀法则
- 不在索引列上做任何操作(计算、函数、(自动or手动)类型转换),会导致索引失效而转向全表扫描
- 存储引擎不能使用索引中范围条件右边的列
- 尽量使用覆盖索引(只访问索引的查询(索引列包含查询列)),减少 select * 语句
- mysql在使用不等于(!=或者<>),not in,not exists的时候无法使用索引会导致全表扫描<小于、>大于、<=、>=这些,mysql内部优化器会根据检索比例、表大小等多个因素整体评估是否使用索引
- is null,is not null 一般情况下也无法使用索引
- like以通配符开头(%abc)mysql索引失效会变成全表扫描操作
- 字符串不加单引号索引失效
- 少用or或in,用它查询时,mysql不一定使用索引,mysql内部优化器会根据检索比例、表大小等多个因素整体评估是否使用索引
3. Explain
- 模拟优化器执行SQL语句,分析你的查询语句或是结构的性能瓶颈
- 如果 from 中包含子查询,仍会执行该子查询,将结果放入临时表中
3.1 . id列
id列的编号是 select 的序列号,有几个 select 就有几个id,并且id的顺序是按 select 出现的顺序增长的。
id列越大执行优先级越高,id相同则从上往下执行,id为NULL最后执行
3.2 select_type列
select_type 表示对应行是简单还是复杂的查询
- simple:简单查询。查询不包含子查询和union
- primary:复杂查询中最外层的 select
- subquery:包含在 select 中的子查询(不在 from 子句中)
- derived:包含在 from 子句中的子查询。MySQL会将结果存放在一个临时表中,也称为派生表
- union:在 union 中的第二个和随后的 select
3.3 table列
这一列表示 explain 的一行正在访问哪个表。
当 from 子句中有子查询时,table列是
当有 union 时,UNION RESULT 的 table 列的值为<union1,2>,1和2表示参与 union 的 select 行id
3.4 type列
关联类型或访问类型,即MySQL决定如何查找表中的行
依次从最优到最差分别为:system > const > eq_ref > ref > range > index > ALL 一般来说,得保证查询达到range级别,最好达到ref
NULL:mysql能够在优化阶段分解查询语句,在执行阶段用不着再访问表或索引。例如:在索引列中选取最小值,可 以单独查找索引来完成,不需要在执行时访问表
3.5 possible_keys列
查询可能使用哪些索引来查找
出现 possible_keys 有列,而 key 显示 NULL 的情况,这种情况是因为表中数据不多,mysql认为索引 对此查询帮助不大,选择了全表查询
3.6 key列
这一列显示mysql实际采用哪个索引来优化对该表的访问。如果没有使用索引,则该列是 NULL。如果想强制mysql使用或忽视possible_keys列中的索引,在查询中使用 force index、ignore index。
3.7 key_len列
显示mysql在索引里使用的字节数,通过这个值可以算出具体使用了索引中的哪些列
key_len计算规则如下:
- 字符串,char(n)和varchar(n),n为字符数
- char(n):一个数字或字母占1个字节,一个汉字占3个字节,存汉子就是3n字节
- 如果存汉字则长度是 3n + 2 字节,加的2字节用来存储字符串长度,因为 varchar是变长字符串
- 数值类型:
- tinyint:1字节
- smallint:2字节
- int:4字节
- bigint:8字节
- 时间类型
- date:3字节
- timestamp:4字节
- datetime:8字节
- 如果字段允许为 NULL,需要1字节记录是否为 NULL
- 索引最大长度是768字节,当字符串过长时,mysql会做一个类似左前缀索引的处理,将前半部分的字符提取出来做索 引。
3.8 ref列
这一列显示了在key列记录的索引中,表查找值所用到的列或常量,常见的有:const(常量),字段名
3. 9rows列
是mysql估计要读取并检测的行数,注意这个不是结果集里的行数
3.10 Extra列
这一列展示的是额外信息