zoukankan      html  css  js  c++  java
  • SQL优化--使用 EXISTS 代替 IN 和 inner join来选择正确的执行计划

     

        在使用Exists时,如果能正确使用,有时会提高查询速度:

          1,使用Exists代替inner join

          2,使用Exists代替 in

      1,使用Exists代替inner join例子:

         在一般写sql语句时通常会遇到如下语句:

          两个表连接时,取一个表的数据,一般的写法通过关联查询(inner join):      

    select a.id, a.workflowid,a.operator,a.stepid
    from  dbo.[[zping.com]]] a
    inner join workflowbase b on a.workflowid=b.id
    and operator='4028814111ad9dc10111afc134f10041'

    查询结果:

    (1327 行受影响)
    表 'Worktable'。扫描计数 0,逻辑读取 0 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
    表 'workflowbase'。扫描计数 1,逻辑读取 293 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
    表 '[zping.com]'。扫描计数 1,逻辑读取 1339 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

       还有一种写法使用exists来取数据

    select a.id,a.workflowid,a.operator ,a.stepid
    from  dbo.[[zping.com]]] a where exists
    (select 'X' from workflowbase b where a.workflowid=b.id)
    and operator='4028814111ad9dc10111afc134f10041'

     执行结果:  

    (1327 行受影响)
    表 '[zping.com]'。扫描计数 1,逻辑读取 1339 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
    表 'workflowbase'。扫描计数 1,逻辑读取 291 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

       这里两着的IO次数,EXISTS比inner join少 2个IO, 对比执行计划成本不一样, 看看两着的差异:  

     

     

       这时我们发现使用EXISTS要比inner join效率稍微高一下。  
         2,使用Exists代替 in

          要求:编写workflowbase表中id不在表中dbo.[[zping.com]]]的行:      

           一般的写法:

    select * from workflowbase 
     where  id not in (
    select  a.workflowid
    from  dbo.[[zping.com]]] a )

    执行结果:

    复制代码

    (1 行受影响)
    表 'Worktable'。扫描计数 0,逻辑读取 0 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
    表 '[zping.com]'。扫描计数 5,逻辑读取 56952 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
    表 'workflowbase'。扫描计数 3,逻辑读取 1589 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
    表 'Worktable'。扫描计数 0,逻辑读取 0 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
    复制代码

        使用Existsl来写:

    select * from workflowbase b
     where not exists(
    select 'X'
    from  dbo.[[zping.com]]] a where a.workflowid=b.id )

       看看执行结果

    (1 行受影响)
    表 'Worktable'。扫描计数 0,逻辑读取 0 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
    表 '[zping.com]'。扫描计数 3,逻辑读取 18984 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
    表 'workflowbase'。扫描计数 3,逻辑读取 1589 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

      两个io的差距:56952+1589=58541次 (使用IN)

                         18984+1589=20573次  (使用Exists)

       使用exists是in的2.8倍,查询性能提高很大。

     

       EXISTS 使查询更为迅速,因为RDBMS核心模块将在子查询的条件一旦满足后,立刻返回结果。

  • 相关阅读:
    Python 设置 IP 代理 访问网页 ( 用户名密码验证代理 )
    Squid 3.3 部署 HTTP代理服务器
    文件打开模式 w+ r+ a+ 区别和辨析
    Python 学习工具书
    Conference Related to social network.
    Linux 使用故障小记
    正则表达式学习连接
    再次被windows操作系统伤害之吐槽
    数据结构——线性表的顺序表示(1)
    斐波那契数列两种算法的时间复杂度
  • 原文地址:https://www.cnblogs.com/firstdream/p/7327064.html
Copyright © 2011-2022 走看看