SQL优化使用 EXISTS 代替 IN 和 inner join来选择正确的执行计划

zoukankan html css js c++ java

SQL优化使用 EXISTS 代替 IN 和 inner join来选择正确的执行计划

    在使用Exists时，如果能正确使用，有时会提高查询速度：

      1，使用Exists代替inner join

      2，使用Exists代替 in

1，使用Exists代替inner join例子:

     在一般写sql语句时通常会遇到如下语句：

      两个表连接时，取一个表的数据，一般的写法通过关联查询（inner join）：

select a.id, a.workflowid,a.operator,a.stepid
from  dbo.[[zping.com]]] a
inner join workflowbase b on a.workflowid=b.id
and operator='4028814111ad9dc10111afc134f10041'

查询结果：

(1327 行受影响)
表 'Worktable'。扫描计数 0，逻辑读取 0 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。
表 'workflowbase'。扫描计数 1，逻辑读取 293 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。
表 '[zping.com]'。扫描计数 1，逻辑读取 1339 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

   还有一种写法使用exists来取数据

select a.id,a.workflowid,a.operator ,a.stepid
from  dbo.[[zping.com]]] a where exists
(select 'X' from workflowbase b where a.workflowid=b.id)
and operator='4028814111ad9dc10111afc134f10041'

执行结果：

(1327 行受影响)
表 '[zping.com]'。扫描计数 1，逻辑读取 1339 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。
表 'workflowbase'。扫描计数 1，逻辑读取 291 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

   这里两着的IO次数，EXISTS比inner join少 2个IO，对比执行计划成本不一样，看看两着的差异：

   这时我们发现使用EXISTS要比inner join效率稍微高一下。
     2，使用Exists代替 in

      要求：编写workflowbase表中id不在表中dbo.[[zping.com]]]的行：

       一般的写法：

select * from workflowbase
where  id not in (
select  a.workflowid
from  dbo.[[zping.com]]] a )

执行结果:

(1 行受影响)
表 'Worktable'。扫描计数 0，逻辑读取 0 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。
表 '[zping.com]'。扫描计数 5，逻辑读取 56952 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。
表 'workflowbase'。扫描计数 3，逻辑读取 1589 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。
表 'Worktable'。扫描计数 0，逻辑读取 0 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

    使用Existsl来写：

select * from workflowbase b
where not exists(
select 'X'
from  dbo.[[zping.com]]] a where a.workflowid=b.id )

   看看执行结果

(1 行受影响)
表 'Worktable'。扫描计数 0，逻辑读取 0 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。
表 '[zping.com]'。扫描计数 3，逻辑读取 18984 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。
表 'workflowbase'。扫描计数 3，逻辑读取 1589 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

  两个io的差距：56952+1589=58541次（使用IN)

                     18984+1589=20573次  (使用Exists）

   使用exists是in的2.8倍，查询性能提高很大。

   EXISTS 使查询更为迅速，因为RDBMS核心模块将在子查询的条件一旦满足后，立刻返回结果。

查看全文

相关阅读:
Linux编程 22 shell编程(输出和输入重定向，管道，数学运算命令，退出脚本状态码)
mysql 开发进阶篇系列 46 物理备份与恢复( xtrabackup的选项说明，增加备份用户，完全备份案例)
mysql 开发进阶篇系列 45 物理备份与恢复(xtrabackup 安装，用户权限，配置)
mysql 开发进阶篇系列 44 物理备份与恢复( 热备份xtrabackup 工具介绍)
Linux编程 21 shell编程(环境变量，用户变量，命令替换)
Linux编程 20 shell编程(shell脚本创建，echo显示信息)
mysql 开发进阶篇系列 43 逻辑备份与恢复(mysqldump 的基于时间和位置的不完全恢复)
Linux编程 19 编辑器(vim 用法)
(网页)angularjs中的interval定时执行功能(转)
(网页)在SQL Server中为什么不建议使用Not In子查询(转)

原文地址：https://www.cnblogs.com/zping/p/1260959.html

SQL优化使用 EXISTS 代替 IN 和 inner join来选择正确的执行计划

1，使用Exists代替inner join例子:

这时我们发现使用EXISTS要比inner join效率稍微高一下。 2，使用Exists代替 in

这时我们发现使用EXISTS要比inner join效率稍微高一下。
2，使用Exists代替 in