zoukankan      html  css  js  c++  java
  • Hive学习之数据去重

    insert overwrite table store  
      select t.p_key,t.sort_word from   
        ( select p_key,  
               sort_word ,  
               row_number()over(distribute by p_key sort by sort_word) as rn  
         from store) t  
         where t.rn=1;

      Hive上一个典型表内除重的写法, p_key为除重依据, sort_word 为排序依据,一般为时间   rn为排名。 这里就留下第一名,注意hql 方言中, 表的嵌套要家别名, 字段前加上表别名。 union all 不支持顶层视图,用一个实际中的案例做示例:

    select * from (
        select * , row_number() over ( partition by name order by num ) as num from xxcx.table
        where dateday = '20170919' 
    ) where num = 1
  • 相关阅读:
    hdu1507
    zoj1654
    hdu2444
    poj3692
    hdu1150
    hdu1151
    poj2771
    hdu3829
    hdu4619
    hdu4715
  • 原文地址:https://www.cnblogs.com/sunfie/p/7531293.html
Copyright © 2011-2022 走看看