zoukankan      html  css  js  c++  java
  • [转]hive实例讲解实现in和not in子句

    FROM : http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html

    目前hive不支持 in或not in 中包含查询子句的语法,所以只能通过left join实现。

    假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户,字段只有一个uid),这两个表都包含一个字段,uid。

     

    in查询

    如果要查询当天登陆的注册用户,需要用in查询,hive sql如下:

    select login.uid from login left outer join regusers on login.uid=regusers.uid where regusers.uid is not null

    如果login表和regusers表按天分区,字段是dt,那么查询2013年1月1号当天登陆的注册用户,hive sql如下:

    select login.uid from login day_login left outer join 
       (select uid from regusers where dt='20130101') day_regusers
    on day_login.uid=day_regusers.uid where day_login.dt='20130101' and day_regusers.uid is not null

     

    not in查询

    如果要查询当天登陆的老用户(这里假设非当天注册用户就是老用户),需要用not in查询,hive sql如下:

    select login.uid from login left outer join regusers on login.uid=regusers.uid where regusers.uid is null;

    如果login表和regusers表按天分区,字段是dt,那么查询2013年1月1号当天登陆的老用户,hive sql如下:

    select login.uid from login day_login left outer join 
       (select uid from regusers where dt='20130101') day_regusers
    on day_login.uid=day_regusers.uid where day_login.dt='20130101' and day_regusers.uid is null;

     

  • 相关阅读:
    net.sf.json Maven依赖配置
    springboot 测试 出错
    PowerDesigner 中SQL文件、数据库表反向生成PDM
    魔板问题(搜索)
    九宫重排(搜索)
    选点(树的遍历)
    【搜索】桐桐的运输方案
    细胞(搜索)
    传球游戏(dp)
    脚本_检测mysql存活状态
  • 原文地址:https://www.cnblogs.com/Athrun/p/hive_in_notin.html
Copyright © 2011-2022 走看看