zoukankan      html  css  js  c++  java
  • Hive动态分区 参数配置及语法

    Hive本身是不支持动态分区的..

    但动态分区是真的方便啊..不然手动维护要累死..按日期甚至小时来分区时动辄就好几千上万的分区..手动到哪一年去..?

    想要用动态分区要先做一些设置来修改默认的配置..

    set hive.exec.dynamic.partition=true;(可通过这个语句查看:set hive.exec.dynamic.partition;) 
    set hive.exec.dynamic.partition.mode=nonstrict; 
    SET hive.exec.max.dynamic.partitions=100000;(如果自动分区数大于这个参数,将会报错)
    SET hive.exec.max.dynamic.partitions.pernode=100000;

    可以直接把上述设置项在控制台中运行一下..以后就可以自由动态分区了..

    建立分区表的语法.

    Drop table table_name; --先删除表 没有则直接建表了
    CREATE TABLE table_name    --创建表
    (col1 string, col2 date, col3 double) 
    partitioned by (datekey date)  --可以多个字段的组合分区 
     ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' Stored AS TEXTFILE;

    插入数据..

    INSERT INTO TABLE table_Name
    
    PARTITION (DateKey)
    
    SELECT col1,col2,col3,DateKey FROM otherTable
    
    WHERE DATEKEY IN ('2017-02-26','2013-06-12','2013-09-24')
    
    GROUP BY col1,col2,col3,DateKey  
    
    DISTRIBUTE BY DateKey

    删除分区:

    ALTER TABLE table_Name DROP PARTITION (Datekey='2016-05-05');

    以上为整理的部分关于Hive分区的资料..欢迎取阅..

  • 相关阅读:
    python报错: invalid syntax
    python报错:not supported between instances of 'str' and 'int'
    python类型检查和类型转换
    python的input()函数
    为什么双击打开py文件时窗口瞬间关闭了?
    python条件判断语句
    python运算符的优先级
    JDK1.8 新特性(全)
    mysql事务详解
    Java判断指定日期是否为工作日
  • 原文地址:https://www.cnblogs.com/iiwen/p/6479607.html
Copyright © 2011-2022 走看看