zoukankan      html  css  js  c++  java
  • SQL Server Execpt和not in 性能区别

    网上有很多 except 和 not in的返回结果区别这里就就提了。

    主要讲 except 和 not in 的性能上的区别。

    CREATE TABLE tb1(ID int) 

    CREATE TABLE tb2(ID int)

    BEGIN TRAN
    DECLARE @i INT = 500
    WHILE @i > 0
    begin
    INSERT INTO dbo.tb1
    VALUES ( @i -- v - int
    )
    SET @i = @i -1
    end
    COMMIT
    我测试的时候tb1 是1000,tb2 是500
     DBCC FREESYSTEMCACHE ('ALL','default');

    SET STATISTICS IO ON
    SET STATISTICS TIME on
    SELECT * FROM tb1 EXCEPT SELECT * FROM tb2;
    SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值
    SET STATISTICS IO OFF
    SET STATISTICS TIME OFF

    执行计划:

    SELECT * FROM tb1 EXCEPT SELECT * FROM tb2;
    |--Merge Join(Right Anti Semi Join, MERGE:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID] = [master1].[dbo].[tb2].[ID]))
    |--Sort(DISTINCT ORDER BY:([master1].[dbo].[tb2].[ID] ASC))
    | |--Table Scan(OBJECT:([master1].[dbo].[tb2]))
    |--Sort(DISTINCT ORDER BY:([master1].[dbo].[tb1].[ID] ASC))
    |--Table Scan(OBJECT:([master1].[dbo].[tb1]))
    SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值
    |--Hash Match(Right Anti Semi Join, HASH:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID]=[master1].[dbo].[tb2].[ID]))
    |--Table Scan(OBJECT:([master1].[dbo].[tb2]))
    |--Nested Loops(Left Anti Semi Join)
    |--Nested Loops(Left Anti Semi Join, WHERE:([master1].[dbo].[tb1].[ID] IS NULL))
    | |--Table Scan(OBJECT:([master1].[dbo].[tb1]))
    | |--Top(TOP EXPRESSION:((1)))
    | |--Table Scan(OBJECT:([master1].[dbo].[tb2]))
    |--Row Count Spool
    |--Table Scan(OBJECT:([master1].[dbo].[tb2]), WHERE:([master1].[dbo].[tb2].[ID] IS NULL))

    SQL Server 执行时间:
    CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。

    (500 行受影响)
    表 'tb1'。扫描计数 1,逻辑读取 2 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
    表 'tb2'。扫描计数 1,逻辑读取 1 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

    (6 行受影响)

    (1 行受影响)

    SQL Server 执行时间:
    CPU 时间 = 0 毫秒,占用时间 = 528 毫秒。

    (500 行受影响)
    表 'Worktable'。扫描计数 0,逻辑读取 0 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
    表 'tb2'。扫描计数 3,逻辑读取 1002 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
    表 'tb1'。扫描计数 1,逻辑读取 2 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

    (10 行受影响)

    (1 行受影响)

    SQL Server 执行时间:
    CPU 时间 = 16 毫秒,占用时间 = 498 毫秒。

    SQL Server 执行时间:
    CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。


    结论:通过较多数据 和 较少数据的测试,在较少数据的情况下 not in 比 except 性能好,但是在较多数据情况下 execpt 比 not in 出色。

            看执行计划可以得知 如何 在 tb1 和tb2 上建立索引,那么except 的执行计划开可以得到优化。

            

    如果大家有兴趣可以看看 not exists 的执行计划。建议:

    大家不要迷信测试结果,因为所有的性能都是和执行计划密切相关的。而执行计划和统计数据又密不可分。

    所以过度的迷信测试结果,可能会对生产库造成性能的影响达不到预期的性能效果。

     

     

     

     




  • 相关阅读:
    个人永久性免费-Excel催化剂功能第86波-人工智能之图像OCR文本识别全覆盖
    git删除远程仓库的文件或目录
    使用document.execCommand复制内容至剪贴板
    使用clipboard.js实现复制内容至剪贴板
    正则匹配目标字符串不等于某些特定的字符串
    substr与substring的用法
    使用hexo搭建个人博客
    git修改最后一次commit的内容
    gulp压缩文件最简示例
    gulp最简示例
  • 原文地址:https://www.cnblogs.com/Amaranthus/p/2323606.html
Copyright © 2011-2022 走看看