zoukankan      html  css  js  c++  java
  • sqoop导出数据|Hive|HDFS和脚本编写

    导出数据

    在Sqoop中,“导出”概念指:从大数据集群(HDFS,HIVE,HBASE)向非大数据集群(RDBMS)中传输数据,叫做:导出,即使用export关键字。

    HIVE/HDFS到RDBMS

    $ bin/sqoop export 
    
    --connect jdbc:mysql://hadoop102:3306/company 
    
    --username root 
    
    --password 000000 
    
    --table staff 
    
    --num-mappers 1 
    
    --export-dir /user/hive/warehouse/staff_hive 
    
    --input-fields-terminated-by "	"

    提示:Mysql中如果表不存在,不会自动创建

    脚本打包

    使用opt格式的文件打包sqoop命令,然后执行

    1) 创建一个.opt文件

    $ mkdir opt
    
    $ touch opt/job_HDFS2RDBMS.opt

    2) 编写sqoop脚本

    $ vi opt/job_HDFS2RDBMS.opt

    export
    --connect jdbc:mysql://hadoop102:3306/company
    --username root
    --password 000000
    --table staff
    --num-mappers 1
    --export-dir /user/hive/warehouse/staff_hive
    --input-fields-terminated-by "	"

    3执行该脚本

    $ bin/sqoop --options-file opt/job_HDFS2RDBMS.opt
    

      

  • 相关阅读:
    静态检查lua语法工具luacheck
    centos7系列:
    git submodule 教程
    CENTOS 7 安装redis
    python基本语法:
    彻底理解lib和dll
    C++语言的设计与演化(空白):
    《Effective C++》 目录:
    C++进阶书籍(转)
    学习的心态(转)
  • 原文地址:https://www.cnblogs.com/alexzhang92/p/10927709.html
Copyright © 2011-2022 走看看