zoukankan      html  css  js  c++  java
  • sqoop

    把mysql中的表复制到hdfs/hive中,hdfs默认路径是/user/(username)中

      sqoop             ##sqoop命令

        import             ##表示导入

        --connect jdbc:mysql://ip:3306/sqoop    ##告诉jdbc,连接mysql的url

        --username root                                     ##连接mysql的用户名

        --password ad  min                                 ##连接mysql的密码

        --table mysql1                                        ##从mysql导出的表名称

        --fields-terminated-by ' '                        ##指定输出文件中的行的字段分隔符

        -m 1                                                       ##复制过程使用1个map作业

        --hive-import                                          ##把mysql表数据复制到hive空间中。如果不使用该选项,意味着复制到hdfs中

     选择增加内容

      --append  --hive-import  

       --check-column 'TBL_ID'              选择要导入的列Specifies the column to be examined when determining which rows to import.

       --incremental append      以哪种方式检查 append 或者lastmodified。

                                           Specifies how Sqoop determines which rows are new. Legal values for mode include append and lastmodified.

        --last-value 6                           检查的范围,从之前的导入的最大值   Specifies the maximum value of the check column from the previous import.

    把hive中的表数据复制到mysql中

      sqoop 

        export                                        ##表示数据从hive复制到mysql中

        --connect jdbc:mysql://ip:3306/sqoop

        --username root

        --password admin

        --table mysql2                                        ##mysql中的表,即将被导入的表名称

        --export-dir '/user/root/warehouse/mysql1'  ##hive中被导出的文件目录

        --fields-terminated-by ' '    ##hive中被导出的文件字段的分隔符 

    注意:mysql2必须存在

    sqoop job --create myjob -- import --connect jdbc:mysql://master.hadoop:3306/hive --username root --password admin --table TBLS --fields-terminated-by ' ' --null-string '**' -m 1 --append --hive-import

     4. 导入导出的事务是以Mapper任务为单位。

  • 相关阅读:
    删除顺序表L中下标为p(0<=p<=length-1)的元素,成功返回1,不成功返回0,并将删除元素的值赋给e
    设顺序表中的数据元素递增有序,试着写一算法,将x插入到顺序表上的适当位置上,以保持该表的有序性。
    数据结构-顺序表基本操作的实现(含全部代码)【转】
    【转】结构体指针
    结构体(第十四章 )
    线性表
    第二章 c语言概述
    时间复杂度
    软件质量与测试 黑盒测试
    软件质量保证与测试 基本内容
  • 原文地址:https://www.cnblogs.com/catWang/p/4337122.html
Copyright © 2011-2022 走看看