zoukankan      html  css  js  c++  java
  • 大数据技术之kettle安装使用

    kettle是一款开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。

     kettle的两种设计

    简述: Transformation(转换):完成针对数据的基础转换。

                  Job(作业):完成整个工作流的控制。

    区别:(1)作业是步骤流,转换是数据流。

    (2)作业的每一个步骤必须等到前面的步骤都跑完了后面的步骤才会执行;而转换会一次性把所有控件全部先启动(一个控件对应启动一个线程),然后数据流会从第一个控件开始,一条记录、一条记录的流向最后的控件。

    Kettle的组成

    1. 勺子(Spoon.bat/spoon.sh):是一个图形化的界面,可以让我们用图形化的方式开发转换和作业。Windows选择.bat;Linux选择.sh

    2. 煎锅(Pan.bat/pan.sh):利用Pan可以用命令行的形式调用Trans

    3. 厨房(Ktitchen.bat/kitchen.sh):利用Kitchen可以使用命令行调用Job

    4. 菜单(Carte.bat/carte.sh):Carte是一个轻量级的Web容器,用于建立专用、远程的ETL Server。

      kettle安装部署和使用

    kettle安装地址

    官网地址:

    https://community.hitachivantara.com/s/article/data-integration-kettle

    下载地址:

    https://sourceforge.net/projects/pentaho/files/

    解压后启动

  • 相关阅读:
    快速排序
    优先队列
    堆排序
    树、二叉树基础
    分治法
    递归算法详细分析
    算法基础
    Linux文件系统详解
    fs/ext2/inode.c相关函数注释
    块设备的读流程分析
  • 原文地址:https://www.cnblogs.com/liulala2017/p/11443458.html
Copyright © 2011-2022 走看看