zoukankan      html  css  js  c++  java
  • MySQL数据库根据一个或多个字段查询重复数据

      系统在开发测试过程中出现bug,比如并发操作没有处理好,数据库中往往会插入重复数据,这些脏数据经常会导致各种问题。bug可以修改,但是数据往往也要处理,处理SQL如下:

      1、根据一个字段查找重复数据

      比如,User表中的userName需要保持唯一,查询重复数据的语句如下:

    SELECT userName from `User` GROUP BY userName HAVING count(*) > 1;

      如果要删除重复数据,则根据userName分组获取最大或最小id,然后删除其他数据即可,如下:

    DELETE FROM USER WHERE userId NOT IN ( SELECT MAX( userId ) AS maxid FROM `User` GROUP BY userName);

      

      2、根据多个字段查找重复数据

      比如,User表中的userName、loginType需要保持数据的唯一性,查询重复数据的语句如下:

    SELECT * FROM `User` GROUP BY userName,loginType HAVING count( * ) > 1

      如果要保证数据的唯一性,则分组后查找最大或最小id然后删除其他数据,如下:

    DELETE FROM USER WHERE userId NOT IN ( SELECT MAX( userId ) AS maxid FROM `User` GROUP BY userName,loginType );

      另外还有一种方法,就是用CONCAT函数把多个字段串联然后查找出需要保留的id,其他数据删除即可,查询语句如下:

    SELECT nameAndType from (SELECT CONCAT(userName,loginType) as nameAndType from User) tt GROUP BY nameAndType HAVING count(nameAndType) > 1;

      删除语句如下:

    DELETE FROM USER WHERE userId NOT IN (SELECT maxid from (SELECT MAX(userId) as maxid, CONCAT(userName,loginType) as nameAndType from User GROUP BY nameAndType) t);

      

      以上就是楼主的解决办法,只求解决问题,没有进行SQL优化,希望可以能对大家有所帮助。

  • 相关阅读:
    Centos6.5安装Oracle11.2.0.4 RAC(完整版)
    VMware搭建Oracle 11g RAC测试环境 For Linux
    Linux CentOS命令行界面字体重复问题解决记录
    SSH公钥认证(码云)
    Git 上传本地仓库到码云
    Git 相关工具及教程地址
    jdk8 新特性stream().map()
    PowerDesigner 使用记录
    IDEA 中.properties文件中文自动转Unicode编码及乱码问题
    idea在Maven Projects中显示灰色的解决办法
  • 原文地址:https://www.cnblogs.com/JohanChan/p/12156444.html
Copyright © 2011-2022 走看看