zoukankan      html  css  js  c++  java
  • 大数据技术之kettle(1)——安装

    一、 kettle概述

      1.kettle是一款开源的ETL工具,纯java编写,可以在WindowsLinuxUnix上运行,绿色无需安装,数据抽取高效稳定。

      2.kettle的两种设计

       简述: Transformation(转换):完成针对数据的基础转换;Job(作业):完成整个工作流的控制。

       区别:(1)作业是步骤流,转换是数据流。2)作业的每一个步骤必须等到前面的步骤都跑完了后面的步骤才会执行;而转换会一次性把所有控件全部先启动(一个控件对应启动一个线程),然后数据流会从第一个控件开始,一条记录、一条记录的流向最后的控件。

      3 Kettle的组成

      (1) 勺子(Spoon.bat/spoon.sh):是一个图形化的界面,可以让我们用图形化的方式开发转换和作业。Windows选择.batLinux选择.sh

      (2)煎锅(Pan.bat/pan.sh):利用Pan可以用命令行的形式调用Trans

      (3)厨房(Ktitchen.bat/kitchen.sh):利用Kitchen可以使用命令行调用Job

      (4)菜单(Carte.bat/carte.sh):Carte是一个轻量级的Web容器,用于建立专用、远程的ETL Server

      4.kettle的一大亮点:定时功能

     二、 kettle安装

      1.kettle安装地址

      官网地址:https://community.hitachivantara.com/s/article/data-integration-kettle

      下载地址:https://sourceforge.net/projects/pentaho/files/

      2.下载kettle压缩包,因为kettle为绿色软件,解压缩到任意本地路径即可

      3.双击Spoon.bat,启动图形化界面工具即可使用(前提是系统配置了jdk环境)

      

  • 相关阅读:
    python--异常处理
    Codeforces 1499D
    Codeforces 1263E
    Codeforces 1493D
    Codeforces 1492D
    Codeforces 1490G
    Codeforces 1487E
    Codeforces 1485D
    Codeforces 1485C
    P6917 [ICPC2016 WF]Balanced Diet
  • 原文地址:https://www.cnblogs.com/ssyh/p/11443496.html
Copyright © 2011-2022 走看看