zoukankan      html  css  js  c++  java
  • Hive_Rank

    1.函数说明

    RANK():

      排序相同时会重复,总数不会变

    DENSE_RANK():

      排序相同时会重复,总数会减少

    ROW_NUMBER():

      会根据顺序计算

    2.数据准备

    name

    subject

    score

    孙悟空

    语文

    87

    孙悟空

    数学

    95

    孙悟空

    英语

    68

    大海

    语文

    94

    大海

    数学

    56

    大海

    英语

    84

    宋宋

    语文

    64

    宋宋

    数学

    86

    宋宋

    英语

    84

    婷婷

    语文

    65

    婷婷

    数学

    85

    婷婷

    英语

    78

    3.需求

    计算每门学科成绩排名。

    4.创建本地score.txt,导入数据

    [hadoop@hadoop102 datas]$ vi score.txt

    5.创建hive表并导入数据

    create table score(
    name string,
    subject string, 
    score int) 
    row format delimited fields terminated by "	";
    load data local inpath '/opt/module/datas/score.txt' into table score;

    6.按需求查询数据

    select name,
    subject,
    score,
    rank() over(partition by subject order by score desc) rp,
    dense_rank() over(partition by subject order by score desc) drp,
    row_number() over(partition by subject order by score desc) rmp
    from score;
    
    name    subject score   rp      drp     rmp
    孙悟空  数学    95      1       1       1
    宋宋    数学    86      2       2       2
    婷婷    数学    85      3       3       3
    大海    数学    56      4       4       4
    宋宋    英语    84      1       1       1
    大海    英语    84      1       1       2
    婷婷    英语    78      3       2       3
    孙悟空  英语    68      4       3       4
    大海    语文    94      1       1       1
    孙悟空  语文    87      2       2       2
    婷婷    语文    65      3       3       3
    宋宋    语文    64      4       4       4

    扩展:求出每门学科前三名的学生?

    select name,

    subject,

    score,

    rank() over(partition by subject order by score desc) rp,

    dense_rank() over(partition by subject order by score desc) drp,

    row_number() over(partition by subject order by score desc) rmp

    from score;

     

    name    subject score   rp      drp     rmp

    孙悟空  数学    95      1       1       1

    宋宋    数学    86      2       2       2

    婷婷    数学    85      3       3       3

    大海    数学    56      4       4       4

    宋宋    英语    84      1       1       1

    大海    英语    84      1       1       2

    婷婷    英语    78      3       2       3

    孙悟空  英语    68      4       3       4

    大海    语文    94      1       1       1

    孙悟空  语文    87      2       2       2

    婷婷    语文    65      3       3       3

    宋宋    语文    64      4       4       4

    学习中,博客都是自己学习用的笔记,持续更新改正。。。
  • 相关阅读:
    解剖PetShop系列之六PetShop表示层设计
    解剖PetShop系列之五PetShop之业务逻辑层设计
    用memset给一个char设置0xff,然后将该char和0xff ==,能相等么?
    用gdb如何查看指定地址的内存内容?
    Open a pipe will block if other side hasn't opened this pipe
    inet_aton和inet_pton的区别
    很多源码中看到的ignore SIGCHLD信号是做什么用的?
    Linux下getopt函数使用Tips
    Linux下编译一个静态链接的程序的注意点
    Linux 脚本和程序对SIGINT的处理方案,脚本通过kill给程序传递信号
  • 原文地址:https://www.cnblogs.com/Tunan-Ki/p/11808598.html
Copyright © 2011-2022 走看看