zoukankan      html  css  js  c++  java
  • hive 分区表

    hive 表数据复合 struts类型

    STRUCT{a INT; b INT} 通过 c.a 来获得 a的值

    create table test1(id INT, info struct<name:STRING, age:INT, sources:Double>) 
    ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' COLLECTION ITEMS TERMINATED BY ':';

    Array类型

    array A中元素['a','b','c'],则A[1]的值为'b'
    create table test2(name string, stu_id Array<INT>)
    ROW FORMAT DELIMITED  FIELDS TERMINATED BY ','  COLLECTION ITEMS TERMINATED BY ':';

     Map类型 包含了 key ->value 通过 key 获得value的值

    create table test3(id string, perf map<string, int>) 
    ROW FORMAT DELIMITED FIELDS TERMINATED BY ' ' COLLECTION ITEMS TERMINATED BY ',' MAP KEYS TERMINATED BY ':';

    hive 不布隆滤器一个行健查询,一个列都可以实现, 布隆占用内存空间很小

    布隆过滤器可以实现缓存查询,如果查询不在再到磁盘查询

  • 相关阅读:
    synchronized的原理
    ThreadLocal是什么?使用场景有哪些?
    什么是死锁?死锁产生的原因?
    15-错误
    14-异常处理
    13-接口
    12-方法
    11-结构体
    10-指针
    09-字符串
  • 原文地址:https://www.cnblogs.com/zhanggl/p/4994220.html
Copyright © 2011-2022 走看看