zoukankan      html  css  js  c++  java
  • Hive row_number() 等用法

    1、row_number() over()排序功能:

    (1) row_number() over()分组排序功能:

         在使用 row_number() over()函数时候,over()里头的分组以及排序的执行晚于 where group by  order by 的执行。

    partition by 用于给结果集分组,如果没有指定那么它把整个结果集作为一个分组,它和聚合函数不同的地方在于它能够返回一个分组中的多条记录,而聚合函数一般只有一个反映统计值的记录。

    例如:employee,根据部门分组排序。

    SELECT empno,WORKDEPT,SALARY, Row_Number() OVER (partition by workdept ORDER BY salary desc) rank FROM employee   
    --------------------------------------  
     A00 152750  1  
     A00 66500   2  
     A00 49250   3  
     A00 46500   4  
     A00 39250   5  
     B01 94250   1  
     C01 98250   1  
     C01 73800   2
    

      

    (2)对查询结果进行排序:(无分组)

    SELECT empno,WORKDEPT,SALARY, Row_Number() OVER (ORDER BY salary desc) rank FROM employee   
    --------------------------------------  
     A00 152750  1  
     C01 98250   2  
     D21 96170   3  
     B01 94250   4  
     E11 89750   5  
     E21 86150   6  
     E01 80175   7  
     C01 73800   8  
     D11 72250   9
    

      

    row_number() over()和rownum差不多,功能更强一点(可以在各个分组内从1开时排序).

    2、rank() over()是跳跃排序,有两个第二名时接下来就是第四名(同样是在各个分组内).

    select workdept,salary,rank() over(partition by workdept order by salary) as dense_rank_order from emp order by workdept;  
    ------------------  
    A00 39250   1  
    A00 46500   2  
    A00 49250   3  
    A00 66500   4  
    A00 152750  5  
    B01 94250   1  
    C01 68420   1  
    C01 68420   1  
    C01 73800   3
    

      

    3、dense_rank() over()是连续排序,有两个第二名时仍然跟着第三名。相比之下row_number是没有重复值的 .

    select workdept,salary,dense_rank() over(partition by workdept order by salary) as dense_rank_order from emp order by workdept;  
    ------------------  
    A00 39250   1  
    A00 46500   2  
    A00 49250   3  
    A00 66500   4  
    A00 152750  5  
    B01 94250   1  
    C01 68420   1  
    C01 68420   1  
    C01 73800   2  
    C01 98250   3
    

      

    使用ROW_NUMBER删除重复数据 
    ---假设表TAB中有a,b,c三列,可以使用下列语句删除a,b,c都相同的重复行。

    DELETE FROM (select year,QUARTER,RESULTS,row_number() over(partition by YEAR,QUARTER,RESULTS order by YEAR,QUARTER,RESULTS) AS ROW_NO FROM SALE )   
    WHERE ROW_NO>1  
    

      

    最后在执行hive 语句时出错, 出现错误:

    FAILED: ParseException line 22:7 extraneous input '10' expecting EOF near ''

    有看到解释说是,原因是:

    sql语句中多了分号。。。

    执行脚本时需要在sql后面添加分号,但是调用jdbc执行sql语句时,不可以在语句用分号结束。

    但依旧没有解决问题。

    转自:https://www.cnblogs.com/alsf/p/6344197.html

  • 相关阅读:
    阅读第十到十二章有感
    程序测试学习之5.2作业
    作业五——封装
    作业4 阅读《构建之法》第6 第7章有感
    汉堡包~~~
    作业3 阅读《构建之法》1-5章
    结对子实验——小学生四则运算
    小学生四则运算程序
    学会提问(转)
    error of “omission” and “commission”
  • 原文地址:https://www.cnblogs.com/Allen-rg/p/9268627.html
Copyright © 2011-2022 走看看