zoukankan      html  css  js  c++  java
  • impala 表迁移方式 partquet数据文件移动方法

    1、原表查询:
    select count(*) from temp.table01 where stat_dt = '2024-01-09' ;
     
    2、查看数据文件
    hadoop fs -ls /user/hive/warehouse/temp.db/table01/stat_dt=2024-01-09
    Found 2 items
    -rw-r--r--   3 impala hive      11173 2019-12-10 16:57 /user/hive/warehouse/temp.db/table01/stat_dt=2024-01-09/214b1691c9ed3b01-dfd95f5f00000000_data.0.parq
    -rw-r--r--   3 impala hive      10051 2019-12-10 16:57 /user/hive/warehouse/temp.db/table01/stat_dt=2024-01-09/214b1691c9ed3b01-dfd95f5f00000001_data.0.parq
     
    3、创建一张表
    create table temp.table02 like temp.table01
     
    4、获取parquet 格式文件
    hadoop fs -get  /user/hive/warehouse/temp.db/table01/stat_dt=2024-01-09/214b1691c9ed3b01-dfd95f5f00000000_data.0.parq
    hadoop fs -get  /user/hive/warehouse/temp.db/table01/stat_dt=2024-01-09/214b1691c9ed3b01-dfd95f5f00000001_data.0.parq
     
    5、创建分区目录
    hadoop fs -mkdir /user/hive/warehouse/temp.db/table02/stat_dt=2024-01-09
     
    6、上传partquet文件
    hadoop fs -put 214b1691c9ed3b01-dfd95f5f00000000_894437036_data.0.parq /user/hive/warehouse/temp.db/table02/stat_dt=2024-01-09/
    hadoop fs -put 214b1691c9ed3b01-dfd95f5f00000001_1509455238_data.0.parq /user/hive/warehouse/temp.db/table02/stat_dt=2024-01-09/


    7、Hive中修复表信息
    msck REPAIR TABLE temp.table02;
     
    8、Impala 中刷新元数据
    Invalidate  metadata temp.table02;
     
    9、进行查询
    select * from  temp.table02;
    可以显示结果
     
    总结:我们可以迁移partquet 文件到指定分区,然后进行查询数据。

  • 相关阅读:
    hdu4417 Super Mario
    bzoj3110 zjoi2013 K大数查询
    转:如何理解c和c ++的复杂类型声明
    UVa 489 刽子手游戏
    bzoj1006 神奇的国度
    bzoj2764 基因补全
    bzoj2338 数矩形
    bzoj3720 gty的妹子树
    Struts2(一)入门及工作原理
    输入人民币/美元后自动判断,输出转换后相对应的值
  • 原文地址:https://www.cnblogs.com/hello-wei/p/12022088.html
Copyright © 2011-2022 走看看