zoukankan      html  css  js  c++  java
  • hive笔记

    set hive.cli.print.header=true;
    -- 显示字段名称
    set hive.cli.print.current.db=true;
    -- 显示当前数据库名
    drop database dbname CASCADE;
    -- 删除数据库及库中表
    alter database dbname set dbproperties(key=value);
    -- 设置数据库元数据
    alter table table_name set tblproperties('creator'='wangbin');
    alter table table_name set tblproperties('EXTERNAL'='FALSE');    
    -- 注意大写的单词外部表转内部表
    alter table table_name set serdeproperties('field.delim'='	');
    -- 修改序列化信息
    alter table table_name partition(dt='') set fileformat sequencefile;
    -- 修改表的存储属性
    alter table table_name partition(dt='') set location 'hdfs://...';
    -- 修改表存储位置
    insert overwrite directory 'hdfs://...' select  *  from table_name;
    -- 将查询数据导入到一个hdfs目录
    order by 
    --全局排序
    sort by 
    --局部(每个reducer)排序
    distribute by + 字段 
    --控制相同字段的map输出会发到一个reduce
    cluster by 
    --等价于distribute by +sort by 
    left semi join 
    -- 左半连接,只返回左表中符合on条件的数据
  • 相关阅读:
    datagrid
    IntelliJ IDEA for mac 引入js注意事项
    centos7安装并配置svn
    yum使用总结
    安装php
    类视图
    django里面添加静态变量
    Ubuntu16.04安装&创建虚拟环境
    制作dockerfile, 天眼查的镜像、并运行
    dockerfile
  • 原文地址:https://www.cnblogs.com/wangbin2188/p/10366126.html
Copyright © 2011-2022 走看看