zoukankan      html  css  js  c++  java
  • Hive基础操作

    1.创建数据库

     

    说明:hive的表存放位置模式是由hive-site.xml当中的一个属性指定的,在这个文件中还规定了文件的访问权限

    创建指定路径的数据库

     设置数据库键值对信息

    2.删除数据库

     这个命令只能删除空数据库,强制删除数据库连带下面的表一起删除可以在后面加一个参数:cascade

     3.创建表

    建表语法:

     external:创建一个外部表。在删除外部表时只删除元数据不删除表中的数据。

    comment:注释,默认不能使用英文

    partitioned by:表示使用分区,一个表可以使用多个分区,每一个分区单独存在一个目录下

    clustered by:分桶。类似于MapReduce的分区

    sorted by:指定排序字段和排序规则

    row format:指定表文件字段分隔符

    storted as:指定表文件的存储格式。   

        textfile:默认格式;存储方式为行存储;磁盘开销大 数据解析开销大;但使用这种方式,hive不会对数据进行切分,从而无法对数据进行并行操作。

          sequencefile:二进制文件,以<key,value>的形式序列化到文件中;存储方式:行存储;可分割 压缩;一般选择block压缩; 优势是文件和Hadoop api中的 mapfile是相互兼容的

            refile:存储方式:数据按行分块 每块按照列存储;压缩快 快速列存取;读记录尽量涉及到的block最少;读取需要的列只需要读取每个row group 的头部定义;读取全量数据的操作 性能可能比sequencefile没有明显的优势

    location:指定表文件的存储路径

  • 相关阅读:
    Linux下搭建PHP环境的参考文章小记
    jQuery遇到问题的小记
    小程序 login
    小程序编辑器vscode
    弹性布局详解——5个div让你学会弹性布局
    vue在页面嵌入别的页面或者是视频2
    VUE设置浏览器icon图标
    遮罩层出现后不能滚动 添加事件@touchmove.prevent
    vue 在script里写页面跳转
    axios post、get 请求参数和headers配置
  • 原文地址:https://www.cnblogs.com/wangzhaojun1670/p/13539205.html
Copyright © 2011-2022 走看看