zoukankan      html  css  js  c++  java
  • Sqoop安装

    Sqoop 配置文档

    安装环境ubuntu14.04 64位 hadoop2.6 jdk 1.7.0_79  sqoop-1.99.6-bin-hadoop200

    Sqopp介绍:

    Sqoop 学习笔记

    1.sqoop 介绍

    1)多数是用hadoop技术处理大数据业务的企业有大量的数据存储在rdbms中。

    2)基于历史数据的数据分析,利用大数据的平台来进行处理。

    3)因此需要将关系型数据库中的数据迁移到hadoop(hive和hbase)中,将hadoop分析出来的数据可能要在倒回到关系型数据库中。利用mapreduce加快数据传输速度。Etl 批处理方式进行数据传输。

    4)Sqoop:sql-to-hadoop 

    5)选择的优势:高效的,可控的利用资源譬如任务的并行度,超时的时间。

    数据类型映射与转换,可自动进行,也可以用户定义。

    支持多种的数据库

    6)版本sqoop1和sqoop2

    a)         两个不同的版本,完全的不兼容

    b)        版本号划分:apache:1.4.x~,1.99.x~ ;DCH:sqoop-1.4.3-cdh4,sqoop2-1.99.2-cdh4.5.0/

    7)sqoop2比sqoop1的改进

    a)         引入sqoopserver,集中化的管理connector(连接不同关系型数据库的连接器)等

    b)        引入多种的访问方式:CLI(command line interface),Wen UI (浏览器中的数据导入到出),REST API(支持多语言的使用)

    c)         引入级角色的安全机制

    在上述的架构中:

    1)基于命令行的:编程容易出错,譬如敲错命令,而且不安全

    2)数据传输和数据格式是紧耦合的,这使得connector无法支持所有的数据格式。

    3)按群密钥是暴露出来的,非常不安全传统数据库的用户名和密码

    4)sqoop 安装需要root权限

    5)Connector 必须符合jdbc模,并且使用通用的jdbc词汇 比如URL,database table

    配置:

    首先在你需要安装的sqoop的节点上确认安装好hadoop,本文的版本是基于hadoop2兼容的sqoop1.99.6版本配置。

    1.下载sqoop-1.99.6,这个版本最新,可以与hadoop2.x.x兼容的更好

    2.现在以后解压到相应的目录

    tar  zxvf  sqoop-1.99.6-bin-hadoop200.tar.gz

    3.配置环境变量,sudo  vi /etc/profile进入profile文件,如下图

    (最好在安装sqoop之前,把Hbase和Hive安装上)

    添加几行代码:

    PATH=添加$SQOOP_HOME/bin(可以看下图)

    export SQOOP_HOME

    export CATALINE_BASE=$SQOOP_HOME/server

    export LOGDIR=$SQOOP_HOME/logs

    完成之后退出到命令行界面,使用  source /etc/profile   更些profile配置文

    4.配置${SQOOP_HOME}/server/conf/catalina.properties 文件,如下图

    找到  commen.loader=下图修改后的代码,注意,路径要换成你自己的安装路径哦

    =${catalina.base}/lib,${catalina.base}/lib/*.jar,${catalina.home}/lib,${catalina.home}/lib/*.jar,${catalina.home}/../lib/*.jar,/home/likai/hadoop-2.6.0/share/hadoop/common/*.jar,/home/likai/hadoop-2.6.0/share/hadoop/common/lib/*.jar,/home/likai/hadoop-2.6.0/share/hadoop/hdfs/*.jar,/home/likai/hadoop-2.6.0/share/hadoop/hdfs/lib/*.jar,/home/likai/hadoop-2.6.0/share/hadoop/mapreduce/*.jar,/home/likai/hadoop-2.6.0/share/hadoop/mapreduce/lib/*.jar,/home/likai/hadoop-2.6.0/share/hadoop/tools/*.jar,/home/likai/hadoop-2.6.0/tools/lib/*.jar,/home/likai/hadoop-2.6.0/share/hadoop/yarn/*.jar,/home/likai/hadoop-2.6.0/share/hadoop/yarn/lib/*.jar,/home/likai/hadoop-2.6.0/share/hadoop/httpfs/tomcat/lib/*.jar

     

    5.配置${SQOOP_HOME}/server/conf/:wq

    6.sqoop.properties 文件,如下图

    找到下图的代码,把你hadoop的配置文件路径写上,一般为:${HADOOP_HOME}/

     

    6.把mysql的驱动包mysql-connector-java-5.1.16-bin.jar放到${SQOOP_HOME}/server/lib/里面扯得

    此时sqoop的配置基本上已经结束:下面就开始测试是否安装成功!

    先启动hadoop,再启动sqojpsp,如下图:

     

     

    启动sqoop的客户端

     

    查看错误日志:

    set option --name verbose --value true

    set server --host hadoop000 --port 12000 --webapp sqoop

     入门程序:http://sqoop.apache.org/docs/1.99.6/Sqoop5MinutesDemo.html

  • 相关阅读:
    信息收集-DNS
    Xshell下载
    JSP
    本地网络配置
    P1485 火枪打怪
    P4155 [SCOI2015]国旗计划
    P1017 [NOIP2000 提高组] 进制转换
    P1013 [NOIP1998 提高组] 进制位
    P1011 [NOIP1998 提高组] 车站
    CF841B Godsend
  • 原文地址:https://www.cnblogs.com/java-cjt/p/5164015.html
Copyright © 2011-2022 走看看