zoukankan      html  css  js  c++  java
  • hive一些基本用法

    1.hive中的数据库表的类型有两种,一种是managed,一种是external  :managed表类型是指传入的数据放在hive默认的储存位置下,而external 表类型可以将数据 放在任意的目录下存储
    managed类型的table当删除时会将表数据以及文件夹都删掉,而external类型的表则只是删除元数据,而不会删除原本的数据(言外之意就是把文件中的数据不作为数据库里的数据)



    有hdfs向hive是数据仓库中导入数据的语句   :load data inpath '/uuu.dat' into table t_order;
    2.hive中不支持像表中插入一条数据,但是可以用下列语法批量插入(可用于向临时表中 追加中间数据)
    insert overwrite table tab_ip_like  (将文件里的数据覆盖掉)
    insert into table tab_ip_like(向文件中的数据中追加数据,而不是覆盖)
    3.partition(分区)
    create table t_order(id int,name string,rongliang string,price double)
    partition by (month string)
    row format delimited fields terminated by ' ';

    4.hive中除了支持普通的数据类型外,还支持一些特殊的数据类型,比如数组,map,struct(结构体),
    5.hive中还支持自定义函数,只要将其封装好导出为jar包,再将其放入hive根目录下的lib中,便可以使用该jar包,即自定义的函数。

  • 相关阅读:
    .Net vs Java?
    使用HyperV安装Linux系统
    C#调用Lua
    KubernetesService介绍服务发现
    缓存雪崩、缓存击穿和缓存穿透
    10 个开源项目
    minikube cncf.io
    Parallel的使用
    通过Rancher Desktop在桌面上运行K8s
    2021 .NET 开发者峰会顺利在网上落幕,线上直播回看汇总
  • 原文地址:https://www.cnblogs.com/ljysy/p/9643634.html
Copyright © 2011-2022 走看看