zoukankan      html  css  js  c++  java
  • Sqoop的安装和配置以及Sqoop的基本操作--导入Oracle和MySQL中的数据到Hive、HDFS、HBase

     一、概述

      Sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具。

      导入数据:把MySQL,Oracle数据导入到Hadoop的HDFS、HIVE、HBASE等数据存储系统;

      导出数据:从Hadoop的文件系统中导出数据到关系数据库mysql等

       

    sqoop1sqoop2架构对比

      sqoop1架构:

        

      sqoop2架构:

        

    Sqoop工作机制

      将导入或导出命令翻译成mapreduce程序来实现

      在翻译出的mapreduce中主要是对inputformat和outputformat进行定制

    Sqoop的安装配置

      安装sqoop的前提是已经具备javahadoop的环境

      1、下载并解压

      下载地址

        http://archive.cloudera.com/cdh5/cdh/5/

          sqoop1版本详细下载地址

        http://archive.cloudera.com/cdh5/cdh/5/sqoop-1.4.6-cdh5.14.0.tar.gz

        sqoop2版本详细下载地址

        http://archive.cloudera.com/cdh5/cdh/5/sqoop2-1.99.5-cdh5.14.0.tar.gz

      我们这里使用sqoop1版本,下载之后上传到/export/softwares目录下,然后进行解压

      #cd /export/softwares
      #tar -zxvf sqoop-1.4.6-cdh5.14.0.tar.gz -C ../servers/
    

      

      2、修改配置文件

      #cd /export/servers/sqoop-1.4.6-cdh5.14.0/conf/
      #cp sqoop-env-template.sh  sqoop-env.sh
    

      

      #vim sqoop-env.sh
      export HADOOP_COMMON_HOME=/export/servers/hadoop-2.6.0-cdh5.14.0
      export HADOOP_MAPRED_HOME=/export/servers/hadoop-2.6.0-cdh5.14.0
      export HIVE_HOME=/export/servers/hive-1.1.0-cdh5.14.0
    

      

    3、加入额外的依赖包

      sqoop的使用需要添加三个额外的依赖包,mysql驱动包,oracle驱动包java-json依赖包,不然就会报错

       mysql-connector-java-5.1.40.jar

       ojdbc8.jar

       java-json.jar

      

    4、验证启动

    # cd /export/servers/sqoop-1.4.6-cdh5.14.0
    # bin/sqoop-version 
    

      

  • 相关阅读:
    安卓证书获取sha1的方法 实测有效 原创!!!
    KafKa_原理及项目整合
    微服务-小结
    bd——kafka
    Zookeeper应用——
    idea使用小结
    服务管理框架——Zookeeper
    中间件汇总——了解
    新篇章:大数据——Flume
    70-71中期10道基石
  • 原文地址:https://www.cnblogs.com/yiming523/p/11389448.html
Copyright © 2011-2022 走看看