zoukankan      html  css  js  c++  java
  • Hbase基础(八):Sqoop 一些常用命令及参数

    1 常用命令列举

    这里给大家列出来了一部分 Sqoop 操作时的常用参数,以供参考,需要深入学习的可以参看对应类的源代码。

     

     

    2 命令&参数详解

    刚才列举了一些 Sqoop 的常用命令,对于不同的命令,有不同的参数,让我们来一一列举说明。
    首先来我们来介绍一下公用的参数,所谓公用参数,就是大多数命令都支持的参数。 
    2.1 公用参数:数据库连接 

    2.2 公用参数:import 

     

    2.3 公用参数:export 
    2.4 公用参数:hive 

     

     

    公用参数介绍完之后,我们来按照命令介绍命令对应的特有参数。
    2.5 命令&参数:import 
    将关系型数据库中的数据导入到 HDFS(包括 Hive,HBase)中,如果导入的是 Hive,那么当 Hive 中没有对应表时,则自动创建。
    1) 命令:
    如:导入数据到 hive 中
    $ bin/sqoop import 
    --connect jdbc:mysql://hadoop102:3306/company 
    --username root 
    --password 000000 
    --table staff 
    --hive-import
    如:增量导入数据到 hive 中,mode=append
    append 导入:
    $ bin/sqoop import 
    --connect jdbc:mysql://hadoop102:3306/company 
    --username root 
    --password 000000 
    --table staff 
    --num-mappers 1 
    --fields-terminated-by "	" 
    --target-dir /user/hive/warehouse/staff_hive 
    --check-column id 
    --incremental append 
    --last-value 3
    尖叫提示:append 不能与--hive-等参数同时使用(Append mode for hive imports is not yetsupported. Please remove the parameter --append-mode)
    如:增量导入数据到 hdfs 中,mode=lastmodified
    先在 mysql 中建表并插入几条数据:
    mysql> create table company.staff_timestamp(id int(4), name varchar(255), sex varchar(255), 
    last_modified timestamp DEFAULT CURRENT_TIMESTAMP ON UPDATE 
    CURRENT_TIMESTAMP);
    mysql> insert into company.staff_timestamp (id, name, sex) values(1, 'AAA', 'female');
    mysql> insert into company.staff_timestamp (id, name, sex) values(2, 'BBB', 'female');
    先导入一部分数据:
    $ bin/sqoop import 
    --connect jdbc:mysql://hadoop102:3306/company 
    --username root 
    --password 000000 
    --table staff_timestamp 
    --delete-target-dir 
    --m 1
    再增量导入一部分数据:
    mysql> insert into company.staff_timestamp (id, name, sex) values(3, 'CCC', 'female');
    $ bin/sqoop import 
    --connect jdbc:mysql://hadoop102:3306/company 
    --username root 
    --password 000000 
    --table staff_timestamp 
    --check-column last_modified 
    --incremental lastmodified 
    --last-value "2017-09-28 22:20:38" 
    --m 1 
    --append
    View Code
    尖叫提示:使用 lastmodified 方式导入数据要指定增量数据是要--append(追加)还是要
    --merge-key(合并)
    尖叫提示:last-value 指定的值是会包含于增量导入的数据中
    2) 参数:

     

     

     

     

     

    2.6 命令&参数:export
    。。。。。。
     

    本文来自博客园,作者:秋华,转载请注明原文链接:https://www.cnblogs.com/qiu-hua/p/13401268.html

  • 相关阅读:
    apache配置虚拟主机及虚拟目录
    Apache的443端口被占用解决方法
    Windows下XDebug 手工配置与使用说明
    php中输入这个网站的网址跳转到你定义的页面代码
    XAMPP的使用说明
    Linux致命命令
    wget 命令用法详解
    Linux 关机命令详解
    LINUX视频教程下载地址
    ubuntu 开机自动开启数字小键盘
  • 原文地址:https://www.cnblogs.com/qiu-hua/p/13401268.html
Copyright © 2011-2022 走看看