zoukankan      html  css  js  c++  java
  • Oracle删除重复数据

    http://blog.itpub.net/26736162/viewspace-2123234/

    在oracle中,有个隐藏了自动rowid,里面给每条记录一个唯一的rowid,我们如果想保留最新的一条记录, 

    我们就可以利用这个字段,保留重复数据中rowid最大的一条记录就可以了。 

    下面是查询重复数据的一个例子: 

    select a.rowid,a.* from 表名 a 
    where a.rowid != 
    (
    select max(b.rowid) from 表名 b 
    where a.字段1 = b.字段1 and 
    a.字段2 = b.字段2 
    )

    下面我就来讲解一下,上面括号中的语句是查询出重复数据中rowid最大的一条记录。 

    而外面就是查询出除了rowid最大之外的其他重复的数据了。 

    由此,我们要删除重复数据,只保留最新的一条数据,就可以这样写了: 

    delete from 表名 a 
    where a.rowid != 
    (
    select max(b.rowid) from 表名 b 
    where a.字段1 = b.字段1 and 
    a.字段2 = b.字段2 
    )

    随便说一下,上面语句的执行效率是很低的,可以考虑建立临时表,讲需要判断重复的字段、rowid插入临时表中,
    然后删除的时候在进行比较。 

    create table 临时表 as 
    select a.字段1,a.字段2,MAX(a.ROWID) dataid from 正式表 a GROUP BY a.字段1,a.字段2;
    delete from 表名 a 
    where a.rowid != 
    (
    select b.dataid from 临时表 b 
    where a.字段1 = b.字段1 and 
    a.字段2 = b.字段2 
    );

    二、对于完全重复记录的删除 

    如果想删除一个表的重复数据,可以先建一个临时表,将去掉重复数据后的数据导入到临时表,
    然后在从临时表将数据导入正式表中,如下: 

    INSERT INTO t_table_bak
    select distinct * from t_table;

  • 相关阅读:
    当期所得税费用总额
    所得税净利润算法
    [AGC028B]Removing Blocks 概率与期望
    bzoj 4319: cerc2008 Suffix reconstruction 贪心
    bzoj 2430: [Poi2003]Chocolate 贪心
    BZOJ 2839: 集合计数 广义容斥
    luogu 5505 [JSOI2011]分特产 广义容斥
    CF504E Misha and LCP on Tree 后缀自动机+树链剖分+倍增
    CF798D Mike and distribution 贪心
    CF707D Persistent Bookcase 可持久化线段树
  • 原文地址:https://www.cnblogs.com/gaomanito/p/8473145.html
Copyright © 2011-2022 走看看