zoukankan      html  css  js  c++  java
  • Kettle 介绍及安装教程

    Kettle介绍

    1、什么是ETL?

    ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少,这里我要学习的ETL工具是Kettle!

    2、什么是Kettle?

    Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。


    Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。


    Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。


    Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。


    Kettle(现在已经更名为PDI,Pentaho Data Integration-Pentaho数据集成)。

    3、Kettle的结构。

    4、Kettle的结构-Spoon和Data Integration Server。

    Spoon是构建ETL Jobs和Transformations的工具。Spoon以拖拽的方式图形化设计,能够通过spoon调用专用的数据集成引擎或者集群。

    Data Integration Server是一个专用的ETL Server,它的主要功能有:

    5、Kettle的结构-Enterprise Console。

    Enterprise Console(企业控制台)提供了一个小型的客户端,用于管理Pentaho Data Integration企业版的部署。包括企业版本的证书管理、监控和控制远程Pentaho Data Integration服务器上的活动、分析已登记的作业和转换的动态绩效。

    6、kettle的核心组件。


    7、Kettle概念模型。

    Kettle的执行分为两个层次:Job(作业)和Transformation(转换)。

    Kettle安装、配置

    环境要求:

    • 安装、配置好JDK

    1、下载Kettle

    • pdi-ce-8.2.0.0-342.zip

    网盘下载地址:

    需要的小伙伴,请关注微信公众号: Transkai, 或者扫描下方公众号二维码,回复关键字:kettle, 即可免费获取kettle。

    2、解压Kettle

    3、双击Spoon.bat即可驱动Kettle

  • 相关阅读:
    汉明距离
    Go_go build 和 go install
    rabbitmq的简单介绍二
    rabbitmq的简单介绍一
    redis的订阅和发布
    python操作redis
    vmware虚拟机开机报附件中的错误的解决办法
    使用twised实现一个EchoServer
    python事件驱动的小例子
    mysql数据库的最基本的命令
  • 原文地址:https://www.cnblogs.com/Transkai/p/15427134.html
Copyright © 2011-2022 走看看