zoukankan      html  css  js  c++  java
  • hive一些基本用法

    1.hive中的数据库表的类型有两种,一种是managed,一种是external  :managed表类型是指传入的数据放在hive默认的储存位置下,而external 表类型可以将数据 放在任意的目录下存储
    managed类型的table当删除时会将表数据以及文件夹都删掉,而external类型的表则只是删除元数据,而不会删除原本的数据(言外之意就是把文件中的数据不作为数据库里的数据)



    有hdfs向hive是数据仓库中导入数据的语句   :load data inpath '/uuu.dat' into table t_order;
    2.hive中不支持像表中插入一条数据,但是可以用下列语法批量插入(可用于向临时表中 追加中间数据)
    insert overwrite table tab_ip_like  (将文件里的数据覆盖掉)
    insert into table tab_ip_like(向文件中的数据中追加数据,而不是覆盖)
    3.partition(分区)
    create table t_order(id int,name string,rongliang string,price double)
    partition by (month string)
    row format delimited fields terminated by ' ';

    4.hive中除了支持普通的数据类型外,还支持一些特殊的数据类型,比如数组,map,struct(结构体),
    5.hive中还支持自定义函数,只要将其封装好导出为jar包,再将其放入hive根目录下的lib中,便可以使用该jar包,即自定义的函数。

  • 相关阅读:
    ubuntu下Nodic开发环境搭建
    usb_modeswitch移植
    STM32F4编程手册学习2_内存模型
    STM32F4 编程手册学习1_编程模型
    ARM架构中的程序执行与调用
    锲形文字 数字
    疑问
    lisp 题目
    面试官在面试时让我去破解一个软件,我成功了
    php CI ip限制
  • 原文地址:https://www.cnblogs.com/ljysy/p/9643634.html
Copyright © 2011-2022 走看看