Kettle是一款开源的、元数据驱动的ETL工具集,是开源ETL工具里功能比较强大的一个。
用来帮助你实现:抽取、转换、装入、和加载数据;翻译成中文名称水壶,名字的起源正如该项目主程序员MATT在一个论坛里说的那样:希望把各种数据放到一个壶里然后以一种指定格式流出。
Kettle是一个独立的产品,但它包括了在ETL开发和部署阶段用到的多个程序。每个程序都有独立的功能,也或多或少地依赖于其他程序。
Spoon:集成开发环境。提供了一个图形用户界面,用于创建/编辑转换和作业。Spoon也可以用于执行/调试转换和作业,它也有性能监控的功能。
Kitchen:作业的命令行运行程序,可以通过shell脚本来调用。
Pan:转换的命令航运行程序,和Kitchen一样通过Shell脚本来执行。执行的是转换而不是作业。
Carte:轻量级的HTTP服务器(基于Jetty),后台运行,监听HTTP请求来运行一个作业。Carte也用于分布式和协调跨机器执行作业,也就是Kettle的集群。
window下面是.bat文件,类UNIX下面是.sh文件。
Kettle保存之后可以有两种脚本文件:transformation (.ktr)和 job(.kjb),transformation 完成针对数据的基础转换,job 则完成整个工作流的控制。
kettle在启动之后,会在操作系统中生成.kettle文件夹。一般windows是在C:UsersAdministrator.kettle,Linux也会生成对应文件夹