zoukankan      html  css  js  c++  java
  • Hive数据类型总结

    转载自:http://blog.csdn.net/chenxingzhen001/article/details/20901045

    Hive的内置数据类型可以分为两大类:(1)、基础数据类型;(2)、复杂数据类型。其中,基础数据类型包括:TINYINT,SMALLINT,INT,BIGINT,BOOLEAN,FLOAT,DOUBLE,STRING,BINARY,TIMESTAMP,DECIMAL,CHAR,VARCHAR,DATE。下面的表格列出这些基础类型所占的字节以及从什么版本开始支持这些类型。

    数据类型 所占字节 开始支持版本
    TINYINT 1byte,-128 ~ 127
    SMALLINT 2byte,-32,768 ~ 32,767
    INT 4byte,-2,147,483,648 ~ 2,147,483,647
    BIGINT 8byte,-9,223,372,036,854,775,808 ~ 9,223,372,036,854,775,807
    BOOLEAN
    FLOAT 4byte单精度
    DOUBLE 8byte双精度
    STRING
    BINARY 从Hive0.8.0开始支持
    TIMESTAMP 从Hive0.8.0开始支持
    DECIMAL 从Hive0.11.0开始支持
    CHAR 从Hive0.13.0开始支持
    VARCHAR 从Hive0.12.0开始支持
    DATE 从Hive0.12.0开始支持
      复杂类型包括ARRAY,MAP,STRUCT,UNION,这些复杂类型是由基础类型组成的。

      ARRAY:ARRAY类型是由一系列相同数据类型的元素组成,这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits,它是由['apple','orange','mango']组成,那么我们可以通过fruits[1]来访问元素orange,因为ARRAY类型的下标是从0开始的;
      MAP:MAP包含key->value键值对,可以通过key来访问元素。比如”userlist”是一个map类型,其中username是key,password是value;那么我们可以通过userlist['username']来得到这个用户对应的password;
      STRUCT:STRUCT可以包含不同数据类型的元素。这些元素可以通过”点语法”的方式来得到所需要的元素,比如user是一个STRUCT类型,那么可以通过user.address得到这个用户的地址。
      UNION: UNIONTYPE,他是从Hive 0.7.0开始支持的。
      创建一个包含复制类型的表格可以如下

    [java] view plaincopy在CODE上查看代码片派生到我的代码片
    CREATE TABLE employees (
    name STRING,
    salary FLOAT,
    subordinates ARRAY<STRING>,
    deductions MAP<STRING, FLOAT>,
    address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>
    ) PARTITIONED BY (country STRING, state STRING);

  • 相关阅读:
    使用Pandas groupby连接来自多行的字符串
    Pandas数据分析介绍
    SQL Server 32位数据源与64位数据源区别
    SQL Server install
    windows 远程提示CredSSP
    linux 终端下以图形界面打开当前文件夹
    Linux g++ include link
    undefined reference to symbol 'pthread_create@@GLIBC_2.2.5'
    Linux下的库操作工具-nm、ar、ldd、ldconfig和ld.so
    git update
  • 原文地址:https://www.cnblogs.com/HendSame-JMZ/p/6145483.html
Copyright © 2011-2022 走看看