zoukankan      html  css  js  c++  java
  • Hive内部表与外部表区别详解

    hive建表时,被external修饰的为外部表(external table),未被external修饰的是内部表(managed table)。
            二者区别:
            内部表数据由Hive自身管理,外部表数据则由HDFS管理;
            ①、内部表数据存储的位置是hive.metastore.warehouse.dir(默认:/user/hive/warehouse),外部表数据的存储位置由自己制定。

       ②、删除内部表会直接删除元数据(metadata)及存储数据;删除外部表仅仅会删除元数据,HDFS上的文件并不会被删除。
            ③、对内部表的修改会将修改直接同步给元数据,而对外部表的表结构和分区进行修改,则需要修复(MSCK REPAIR TABLE table_name)。

     

     

     

     

     

    desc formatted table_name;
    
    
        Location
        Table Type 
    这两个信息挺关键吧
    
    
    
    load data [local] inpath ' xx ' overwrite into table tablename
    
    insert  尽量少用 因为就算就算插入一条数据,也会调用MapReduce
  • 相关阅读:
    otto-group-product-classification-challenge(Pytorch处理多分类问题)
    F1值
    win10 安装torch
    win10 安装 scrapy
    头条 街拍
    1029 Median
    欧拉回路
    Pre-Post
    Django 安装for Python3.4
    Python 安装for Windows
  • 原文地址:https://www.cnblogs.com/654321cc/p/12172502.html
Copyright © 2011-2022 走看看