zoukankan      html  css  js  c++  java
  • 如何删除 SQL Server 表中的重复行

      Microsoft SQL Server 表不应该包含重复行和非唯一主键。为简洁起见,在本文中我们有时称主键为“键”或“PK”,但这始终表示“主键”。重复的 PK 违反了实体完整性,在关系系统中是不允许的。SQL Server 有各种强制执行实体完整性的机制,包括索引、唯一约束、主键约束和触发器。

      如果表中有多组完全不同的重复的 PK 值,则逐个删除它们会很费时间。在这种情况下,可使用下面的方法: 1.首先,运行上面的 GROUP BY 查询来确定有多少组重复的 PK 值及每组的重复数。

      2.选择重复的键值放入临时表中。例如:

      SELECT col1, col2, col3=count(*)
      INTO holdkey
      FROM t1
      GROUP BY col1, col2
      HAVING count(*) > 1

      3.选择重复的行放入临时表中,以清除进程中的重复值。例如:

      SELECT DISTINCT t1.*
      INTO holddups
      FROM t1, holdkey
      WHERE t1.col1 = holdkey.col1
      AND t1.col2 = holdkey.col2

      4.此时,holddups 表应有唯一的 PK;但是,如果 t1 有重复的 PK 而行唯一(如上面的 SSN 示例),情况就不是这样了。请验证 holddups 中的各个键是否唯一,是否没有键重复而行唯一的情况。如果是这样,您必须停在该处,确定对于给定重复的键值,您希望保留哪些行。例如,以下查询:

      SELECT col1, col2, count(*)
      FROM holddups
      GROUP BY col1, col2

      应为各行返回计数 1。如果结果是 1,请继续执行下面的步骤 5。如果不是 1,则存在键重复而行唯一的情况,且需要您决定要保存哪些行。通常,这将需要舍弃行或为此行创建新的唯一的键值。为 holddups 表中每个此种重复 PK 执行这两个步骤之一。

      5.从原始表中删除重复的行。例如:

      DELETE t1
      FROM t1, holdkey
      WHERE t1.col1 = holdkey.col1
      AND t1.col2 = holdkey.col2

      6.将唯一行放回原始表中。例如:

      INSERT t1 SELECT * FROM holddups

  • 相关阅读:
    在centos7下 布隆过滤器2种安装方式
    Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the docker daemon running?
    redis lua --eval报错1: Lua redis() command arguments must be strings or integers
    redis+lua脚本 分布式锁初步学习
    redis中通用命令(key)和补充
    redis基本数据类型有序集合(zset)学习笔记
    redis基本数据结构集合(set)学习笔记
    大道至简读后感
    第一周
    《大道至简》读后感
  • 原文地址:https://www.cnblogs.com/chuncn/p/1437379.html
Copyright © 2011-2022 走看看