zoukankan      html  css  js  c++  java
  • 优化SQL语句:in 和not in的替代方案

    http://www.cnblogs.com/binbin695/archive/2010/03/03/1677079.html

    最近做一个网站,要求A库中的AA表导入到另一个B库中的AA表中。并且不能重复导入。因为A.AA中70多万条记录,而且以后可以会有添加新记录。所不可能一次性导完。所以又在B库中建立一个表用于记录导入过的记录。刚开始用 not in 来实现。在但发现在实现过程中经常超时。在网上找了半天。发现下面的文章。

    原文如下:

    用IN写出来的SQL的优点是比较容易写及清晰易懂,这比较适合现代软件开发的风格。 

      但是用IN的SQL性能总是比较低的,从SQL执行的步骤来分析用IN的SQL与不用IN的SQL有以下区别:

     

      SQL试图将其转换成多个表的连接,如果转换不成功则先执行IN里面的子查询,再查询外层的表记录,如果转换成功则直接采用多个表的连接方式查询。由此可见用IN的SQL至少多了一个转换的过程。一般的SQL都可以转换成功,但对于含有分组统计等方面的SQL就不能转换了。 推荐在业务密集的SQL当中尽量不采用IN操作符

     

      NOT IN 此操作是强列推荐不使用的,因为它不能应用表的索引。推荐用NOT EXISTS 或(外连接+判断为空)方案代替

     

      在数据库中有两个表,一个是当前表Info(id,PName,remark,impdate,upstate),一个是备份数据表bakInfo(id,PName,remark,impdate,upstate),将当前表数据备份到备份表去,就涉及到not in 和in 操作了:

     

      首先,添加10万条测试数据

     

      使用not in 和in操作:

     

            SET STATISTICS TIME ON
      GO
      --备份数据
      insert into bakInfo(id,PName,remark,impdate,upstate)
      select id,PName,remark,impdate,upstate from dbo.Info
      where id not in(select id from dbo.bakInfo)
      GO
      SET STATISTICS TIME OFF

     

      此操作执行时间:

     

      SQL Server 分析和编译时间:

     

      CPU 时间 = 0 毫秒,占用时间 = 3 毫秒。

     

      

     

      SQL Server 执行时间:

     

       CPU 时间 = 453 毫秒,占用时间 = 43045 毫秒。

     

      (100000 行受影响)

     

      SQL Server 分析和编译时间:

     

      CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。

     

      

     

      

     

      --更改当前表状态

     

      update Info set upstate=1 where id in(select id from dbo.bakInfo)

     

      此操作执行时间:

     

      SQL Server 分析和编译时间:

     

      CPU 时间 = 62 毫秒,占用时间 = 79 毫秒。

     

      SQL Server 执行时间:

     

      CPU 时间 = 188 毫秒,占用时间 = 318 毫秒。

     

      (100000 行受影响)

     

      SQL Server 分析和编译时间:

     

      CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。

     

      

     

      

     

      

     

      --删除当前表数据

     

      delete from Info where upstate=1 and id in(select id from dbo.bakInfo)

     

      此操作执行时间:

     

      SQL Server 分析和编译时间:

     

      CPU 时间 = 183 毫秒,占用时间 = 183 毫秒。

     

      

     

      SQL Server 执行时间:

     

      CPU 时间 = 187 毫秒,占用时间 = 1506 毫秒。

     

      (100000 行受影响)

     

      SQL Server 分析和编译时间:

     

      CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。

     

      使用join连接替代方案:

     

      SET STATISTICS TIME ON
      GO
      
      --备份数据
      insert into bakInfo(id,PName,remark,impdate,upstate)
      select id,PName,remark,impdate,upstate from
      (SELECT Info.id,Info.PName, Info.remark, Info.impdate,Info.upstate, bakInfo.id AS bakID
      FROM Info left JOIN
      bakInfo ON Info.id = bakInfo.id ) as t
      where t.bakID is null and t.upstate=0
      GO
      SET STATISTICS TIME OFF;

     

      此操作执行时间:

     

      SQL Server 分析和编译时间:

     

      CPU 时间 = 247 毫秒,占用时间 = 247 毫秒。

     

      SQL Server 执行时间:

     

      CPU 时间 = 406 毫秒,占用时间 = 475 毫秒。

     

      (100000 行受影响)

     

      SQL Server 分析和编译时间:

     

      CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。

     

      --更改当前表状态

     

      update Info set upstate=1
      FROM Info INNER JOIN
       bakInfo ON Info.id = bakInfo.id

     

      此操作执行时间:

     

      SQL Server 分析和编译时间:

     

      CPU 时间 = 4 毫秒,占用时间 = 4 毫秒。

     

      SQL Server 执行时间:

     

      CPU 时间 = 219 毫秒,占用时间 = 259 毫秒。

     

      (100000 行受影响)

     

      SQL Server 分析和编译时间:

     

      CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。

     

      --删除当前表数据

     

      delete from Info
      FROM Info INNER JOIN
       bakInfo ON Info.id = bakInfo.id
      where Info.upstate=1

     

      此操作执行时间:

     

      SQL Server 分析和编译时间:

     

      CPU 时间 = 177 毫秒,占用时间 = 177 毫秒。

     

      SQL Server 执行时间:

     

      CPU 时间 = 219 毫秒,占用时间 = 550 毫秒。

     

      (100000 行受影响)

     

      SQL Server 分析和编译时间:

     

      CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。

     

      可以看出使用join方案比使用not in 和in执行时间要短很多了

  • 相关阅读:
    BZOJ 3555: [Ctsc2014]企鹅QQ hash
    bzoj 4300: 绝世好题 dp
    Codeforces Round #192 (Div. 1) C. Graph Reconstruction 随机化
    Codeforces Round #192 (Div. 1) B. Biridian Forest 暴力bfs
    Codeforces Round #192 (Div. 1) A. Purification 贪心
    HDU 5514 Frogs 容斥定理
    HDU 5515 Game of Flying Circus 二分
    HDU 5521 Meeting 最短路
    HDU 5510 Bazinga 暴力匹配加剪枝
    HDU 5512 Meeting 博弈论
  • 原文地址:https://www.cnblogs.com/wonder223/p/2731402.html
Copyright © 2011-2022 走看看