mysql 实战 or、in与union all 的查询效率

zoukankan html css js c++ java

mysql 实战 or、in与union all 的查询效率
OR、in和union all 查询效率到底哪个快。

网上很多的声音都是说union all 快于 or、in，因为or、in会导致全表扫描，他们给出了很多的实例。

但真的union all真的快于or、in？本文就是采用实际的实例来探讨到底是它们之间的效率。

1：创建表，插入数据、数据量为1千万【要不效果不明显】。
Sql代码

drop table if EXISTS BT;

create table BT(

    ID int(10) NOT NUll,

    VName varchar(20) DEFAULT '' NOT NULL,

    PRIMARY key( ID )

)ENGINE=INNODB;
该表只有两个字段 ID为主键【索引页类似】，一个是普通的字段。（偷懒就用简单的表结构呢）

向BT表中插入1千万条数据

这里我写了一个简单的存储过程【所以你的mysql版本至少大于5.0，俺的版本为5.1】，代码如下。

注意：最好

    INSERT INTO BT ( ID,VNAME ) VALUES( i, CONCAT( 'M', i ) );---1

    修改为

   INSERT INTO BT ( ID,VNAME ) VALUES( i, CONCAT( 'M', i, 'TT' ) );---2

   修改原因在

   非索引列及VNAME使用了联合进行完全扫描请使用1 。

   非索引列及VNAME使用了全表扫描请使用2 。
Sql代码

DROP PROCEDURE IF EXISTS test_proc;

CREATE PROCEDURE test_proc()

BEGIN

declare i int default 0;

set autocommit = 0;

while i<10000000 do

INSERT INTO BT ( ID,VNAME )  VALUES( i, CONCAT( 'M', i ) );

set i = i+1;

if i%2000 = 0 then

commit;

end if;

end while;

END;
就不写注释呢，挺简单的。

存储过程是最好设置下innob的相关参数【主要和日志、写缓存相关这样能加快插入】，俺没有设置插入1千万条数据插了6分钟。

部分数据如下：1千万数据类似

2：实战

    2.1 :分别在索引列上使用 or、in、union all

           我们创建的表只有主键索引，所以只能用ID做查询呢。我们查 ID 为 98，85220，9888589的三个数据各个耗时如下：

时间都为0.00，怎么会这样呢，呵呵所有查询都是在毫秒级别。

我使用其他的工具--EMS SQL Manager for mysql

查询显示时间为

93 ms， 94ms，93 ms，时间相差了多少几乎可以忽略。

然后我们在看看各自的执行计划

这里要注意的字段type 与ref字段

我们发现union all 的所用的 type【type为显示连接使用了何种类型】为ref 而or和in为range【ref连接类型优于range，相差不了多少】，而查询行数都一样【看rows字段都是为3】。

从整个的过程来看，在索引列使用常数or及in和union all查询相差不了多少。

但为什么在有的复杂查询中，再索引列使用or及in 比union all 速度慢很多呢，这可能是你的查询写的不够合理，让mysql放弃索引而进行全表扫描。

2.2：在非索引列中使用 or、in及union all。

    我们查 VNAME 为 M98，M85220，M9888589的三个数据各个耗时如下：

我们发现为啥union all查询时间几乎为 or 和in的三倍。

这是为什么呢，我们先不说，先看看三个的查询计划。

这里我们发现计划几乎一样。

但我们要注意扫描的此时对于 or及in 来说只对表扫描一次即rows是列为9664782。

而对于union all 来说对表扫描了三次即rows的和为9664782*3。

这也是为什么我们看到union all 为几乎为三倍的原因。

备注： 如果使用存储过程使用第二sql该执行计划所有的type列为 all，其实这个是我最想演示的，但现在已经快写完毕了才发现问题将错就错呢。

3:总结

     3.1：不要迷信union all 就比 or及in 快，要结合实际情况分析到底使用哪种情况。

     3.2：对于索引列来最好使用union all，因复杂的查询【包含运算等】将使or、in放弃索引而全表扫描，除非你能确定or、in会使用索引。

    3.3：对于只有非索引字段来说你就老老实实的用or 或者in，因为非索引字段本来要全表扫描而union all 只成倍增加表扫描的次数。

    3.4：对于及有索引字段【索引字段有效】又包含非索引字段来时，按理你也使用or 、in或者union all 都可以，

       但是我推荐使用or、in。

      如以下查询：
Sql代码

select * from bt where bt.VName = 'M98' or bt.id ='9888589'



select * from bt where bt.VName = 'M98'

UNION ALL

select * from bt where  bt.id = '9888589'
该两个查询速度相差多少主要取决于索引列查询时长，如索引列查询时间太长的话，那你也用or或者in代替吧。

3.5：以上主要针对的是单表，而多表联合查询来说，考虑的地方就比较多了，比如连接方式，查询表数据量分布、索引等，再结合单表的策略选择合适的关键字。

个人观点仅供参考、需要结合实际数据用例测试选择合适的关键字.......................

以上测试mysql5.1
查看全文

相关阅读:
Asp.net 自定义config文件读取
 sql 两个数字范围取随机数
 数据库中一些简单的防刷机制
 sql日期操作收集
 全文索引工作收集
 JQuery Div滚动条插件 jScroll
OLE DB 访问接口 'Microsoft.Jet.OLEDB.4.0' 配置为在单线程单元模式下运行，所以该访问接口无法用于分布式查询
 vs 高级保存选项的设置
 Web.config配置文件详解
 JS,Jquery获取各种屏幕的宽度和高度

原文地址：https://www.cnblogs.com/shipengzhi/p/2695825.html