描述
sql的优化主要是围绕着在查询语句的时候尽量使用索引避免全表扫描。
使用索引
- 对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。
避免判断null值
- 应尽量避免在 where 子句中对字段进行 null 值判断(is null,is not null),否则将导致引擎放弃使用索引而进行全表扫描。
select id from t where num is null
可以在num上设置默认值0,确保表中num列没有null值,然后这样查询:
select id from t where num=0
避免不等值判断
- 应尽量避免在 where 子句中使用!=或<>操作符,否则引擎将放弃使用索引而进行全表扫描。
MySQL只对以下操作符才使用索引:
<, <= ,= ,> ,>= ,between,in,以及某些时候的like(不以通配符%或_开头的情形)
避免使用or逻辑
- 应尽量避免在 where 子句中使用 or 来连接条件,否则将导致引擎放弃使用索引而进行全表扫描,如:
select id from t where num=10 or num=20
可以这样查询:
select id from t where num=10
union all
select id from t where num=20
慎用in和not in逻辑
- in 和 not in 也要慎用,否则会导致全表扫描,
如:
select id from t1 where num in(select id from t2 where id > 10)
此时外层查询会全表扫描,不使用索引。
可以修改为:
select id from t1,(select id from t1 where id > 10) t2 where t1.id = t2.id
此时索引被使用,可以明显提升查询效率。
注意模糊查询
like以通配符开头,也会导致索引失效。
下面的查询也将导致全表扫描:
select id from t where name like '%abc%'
模糊查询如果是必要条件时,
可以使用select id from t where name like 'abc%' 来实现模糊查询,此时索引将被使用。
如果头匹配是必要逻辑,建议使用全文搜索引擎(Elastic search、Lucene、Solr等)。
通过组合索引可以解决like '%字符串%'索引失效的问题
可以在查询的字段上创建组合索引,假设以name,age字段建索引
但是如果查询sql中存在name,age之外的字段,索引将会失效,进行全表扫描。
使用短索引:
CREATE INDEX index_name ON table_name (column(length))
例如,如果有一个CHAR(255)的列,如果在前10个或20个字符内,多数值是惟一的,那么就不要对整个列进行索引,短索引不仅可以提高查询速度而且可以节省磁盘空间和I/O操作。
尽量不要包含多个列的排序,尽量使用默认排序
因为:MySQL查询只使用一个索引,因此如果where子句中已经使用了索引的话,那么order by中的列是不会使用索引的
不要在列上进行运算
如果在列上进行计算将导致每个行都会进行运算,这将导致索引失效而进行全表扫描,
select * from users where YEAR(adddate)<2007可以修改为:select * from users where adddate<’2007-01-01′
最佳左前缀法则
在使用索引字段作为条件时,如果该索引是复合索引,那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引,否则该索引将不会被使用,并且应尽可能的让字段顺序与索引顺序相一致。
注意
建议:一个表的索引数最好不要超过6个
用 exists 代替 in
很多时候用 exists 代替 in 是一个好的选择:
有一个口诀:外层查询表小于子查询表,则用exists,外层查询表大于子查询表,则用in,如果外层和子查询表差不多,则爱用哪个用哪个。
select num from a where num in(select num from b)
用下面的语句替换:
select num from a where exists (select 1 from b where num=a.num)
其中:select num from a 的结果就是外层查询表,(select 1 from b where num=a.num)的结果是子查询表
参考:in和exist的使用
表格字段类型选择
尽量使用数字型字段,若只含数值信息的字段尽量不要设计为字符型,这会降低查询和连接的性能,并会增加存储开销。这是因为引擎在处理查询和连接时会逐个比较字符串中每一个字符,而对于数字型而言只需要比较一次就够了。
尽可能的使用 varchar 代替 char ,因为首先可变长度字段存储空间小,可以节省存储空间,其次对于查询来说,在一个相对较小的字段内搜索效率显然要高些。
查询语法中的字段
任何地方都不要使用 select * from t ,用具体的字段列表代替“*”,不要返回用不到的任何字段
索引无关优化
-
不使用*、尽量不使用union,union all等关键字、尽量不使用or关键字、尽量使用等值判断。
-
表连接建议不超过5个。如果超过5个,则考虑表格的设计。(互联网应用中)
-
表连接方式使用外联优于内联
-
大数据量级的表格做分页查询时,如果页码数量过大,则使用子查询配合完成分页逻辑。
Select * from table limit 1000000, 10
Select * from table where id in (select pk from table limit 100000, 10)