zoukankan      html  css  js  c++  java
  • Oracle单表去重复(二)

    Oracle单表去重

    去重有两层含义,一:是记录完全一样。二:是符合一定条件的认为是重复。
    根据表的数量,去重可划分为:单表去重和多表关联去重。
     
    对于去重,一般最容易想到的是用distinct,而distinct只能对记录完全重复的记录保留一条。
    distinct使用的是二重循环的方式来去重的,如果数据量非常大的时候,会导致性能急剧下降。
    我们前一篇文章已经给出了详解,你可以去查看 Oracle单表去重复(一) 
     
    下面是一个单表去重的测试,认为name字段相同的即为重复记录,要查询出一个结果,过滤掉重复,distinct显然不能满足要求。
     
    表SQL:
    create table A_TEST    
    (    
            id                 number,    
            name         varchar2(20),    
            remark varchar2(20)    
    );    

    insert into A_TEST (ID, NAME, REMARK)    
    values (1, 'a''ss');    

    insert into A_TEST (ID, NAME, REMARK)    
    values (2, 'b''xxx');    

    insert into A_TEST (ID, NAME, REMARK)    
    values (3, 'b''x');    

    insert into A_TEST (ID, NAME, REMARK)    
    values (4, 'b''asd');    

    insert into A_TEST (ID, NAME, REMARK)    
    values (5, 'c''axxx');    

    insert into A_TEST (ID, NAME, REMARK)    
    values (6, 'c''asdf');    
     
     
    去重方式一(低效):
    select a.*    
            from A_TEST a, (select min(id) as id from A_TEST t group by name) b    
    where a.id = b.id;
     
    去重方式一(高效):
    select *    
            from (select a.*, rownum row_num from A_TEST a) x    
    where x.row_num in (select min(rownum) from A_TEST t group by name)
     
    可见,使用rownum的效率比使用id的效率要高,当表数据量很大的时候,差距会很明显。

    出处:http://lavasoft.blog.51cto.com/62575/368087

  • 相关阅读:
    iTerm2分屏快捷键
    k8s中运维/测试常用的命令整理(随时更新)
    httpRunner自动化测试用例使用笔记
    Git学习笔记-快速上手(mac系统)
    RBAC权限控制逻辑笔记
    CPS中有关CICD的配置
    LDAP中filter的使用
    Docker初级入门
    C语言 实现 HashTable
    从三个线程 排队打印 , 到 多个线程打印
  • 原文地址:https://www.cnblogs.com/mq0036/p/3701661.html
Copyright © 2011-2022 走看看