zoukankan      html  css  js  c++  java
  • hive笔记

    set hive.cli.print.header=true;
    -- 显示字段名称
    set hive.cli.print.current.db=true;
    -- 显示当前数据库名
    drop database dbname CASCADE;
    -- 删除数据库及库中表
    alter database dbname set dbproperties(key=value);
    -- 设置数据库元数据
    alter table table_name set tblproperties('creator'='wangbin');
    alter table table_name set tblproperties('EXTERNAL'='FALSE');    
    -- 注意大写的单词外部表转内部表
    alter table table_name set serdeproperties('field.delim'='	');
    -- 修改序列化信息
    alter table table_name partition(dt='') set fileformat sequencefile;
    -- 修改表的存储属性
    alter table table_name partition(dt='') set location 'hdfs://...';
    -- 修改表存储位置
    insert overwrite directory 'hdfs://...' select  *  from table_name;
    -- 将查询数据导入到一个hdfs目录
    order by 
    --全局排序
    sort by 
    --局部(每个reducer)排序
    distribute by + 字段 
    --控制相同字段的map输出会发到一个reduce
    cluster by 
    --等价于distribute by +sort by 
    left semi join 
    -- 左半连接,只返回左表中符合on条件的数据
  • 相关阅读:
    安装Kudu
    flume+kafka+spark streaming整合
    安装Kafka
    DataFrame格式化
    RDD/Dataset/DataFrame互转
    多个jar包合并成一个jar包的办法
    flume使用示例
    ecplise + hadoop 调试环境搭建
    web.xml文件加载顺序
    Web.xml配置参数详解
  • 原文地址:https://www.cnblogs.com/wangbin2188/p/10366126.html
Copyright © 2011-2022 走看看