zoukankan      html  css  js  c++  java
  • Hive 根据表中某个字段动态分区 以及临时表创建

    使用hive储存数据时,需要对做分区,如果从kafka接收数据,将每天的数据保存一个分区(按天分区),保存分区时需要根据某个字段做动态分区,而不是傻傻的将数据写到某一个临时目录最后倒入到某一个分区,这是静态分区。

    Hive动态分区步骤如下:

    1、建立某一个源表模拟数据源并插入一些数据

    create table t_test_p_source (
        id string,
        name string,
        birthday string
    ) 
    row format delimited fields terminated by '	'
    stored as textfile;
    
    insert into t_test_p_source values ('a1', 'zhangsan', '2018-01-01');
    insert into t_test_p_source values ('a2', 'lisi', '2018-01-02');
    insert into t_test_p_source values ('a3', 'zhangsan', '2018-01-03');
    insert into t_test_p_source values ('a4', 'wangwu', '2018-01-04');
    insert into t_test_p_source values ('a5', 'sanzang', '2018-01-05');
    insert into t_test_p_source values ('a6', 'zhangsan2', '2018-01-01');
    

      

    2、建立一张分区表 (按ds字段分区)

    create table t_test_p_target (
        id string,
        name string
    )
    partitioned by (ds string)
    row format delimited fields terminated by '	'
    stored as textfile;
    

      

    3、向分区表中插入数据

    SET hive.exec.dynamic.partition=true;   #是否开启动态分区,默认是false,所以必须要设置成true
    SET hive.exec.dynamic.partition.mode=nonstrict;    # 动态分区模式,默认为strict, 表示表中必须一个分区为静态分区,nostrict表示允许所有字段都可以作为动态分区
    
    insert into table t_test_p_target partition (ds) select id, name, birthday as ds from t_test_p_source;
    

      

    4、测试是否动态分区了

     2018-01-01这个分区只有2条数据,再来看下HDFS上的分区目录

    至此,hive动态分区已经完成了。

    HIVE Temporary Table

    创建的临时表仅仅在当前会话是可见的,数据将会被存储在用户的暂存目录中,并在会话结束时被删除。

    果创建临时表的名字与当前数据库下的一个非临时表相同,则在这个会话中使用这个表名字时将会使用的临时表,而不是非临时表,用户在这个会话内将不能使用原表,除非删除或者重命名临时表。

    临时表有如下限制:

    1)不支持分区字段
    2)不支持创建索引


    在Hive1.1.0之后临时表可以存储到memory,ssd或者default中,可以通过配置 hive.exec.temporary.table.storage来实现。 
    一般使用CREATE TEMPORARY TABLE ….来创建临时表。

    临时表也支持多种创建操作和insert操作:

    CREATE TEMPORARY TABLE ….,CTAS, CTL, INSERT INTO。

     https://www.cnblogs.com/jsnr-tdyd/p/9946788.html

  • 相关阅读:
    bzoj3159: 决战
    Codeforces Round #516 (Div. 1, by Moscow Team Olympiad) C
    Codeforces Round #516 (Div. 1, by Moscow Team Olympiad) B
    Codeforces Round #516 (Div. 1, by Moscow Team Olympiad) A
    loj 6401 字符串
    BZOJ5194 雪地靴
    BZOJ 4709 柠檬
    BZOJ 3343 魔法
    [8月16日绍兴]试剂
    设备塔
  • 原文地址:https://www.cnblogs.com/Allen-rg/p/10651051.html
Copyright © 2011-2022 走看看