简介:
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行, 数据抽取高效稳定。
Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。
Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
官网:
https://sourceforge.net/projects/pentaho/files/Data%20Integration/
绿色版本,直接解压缩,运行Spoon.bat即可(在Linux、AppleOSX、Solaris平台上运行Spoon)。
初步启动和使用可能出现的问题总结
因为是纯java编写要安装jdk配置环境变量
如果启动还报错 ERROR:could not create the java virtual machine!
不是Java虚拟出了问题,修改一下spoon.bat里内存配置:
if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms1024m" "-Xmx2048m" "-XX:MaxPermSize=256m" 改为: if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms512m" "-Xmx1024m" "-XX:MaxPermSize=256m"
若要连接mysql数据库,需要下载mysql驱动包 不然就会报下面这种错误
Driver class’sun.jdbc.odbc.JdbcOdbcDriver’ could not be found,make sure the sun.jdbc.odbc.JdbcOdbcDriver
意思就是没有找到你的mysql驱动包,所以我们要下载该jar包
下载地址:https://dev.mysql.com/downloads/connector/j/
或者点击直接下载里面包含MySQL和Oracle驱动包
下载好后,解压该文件将文件夹中的mysql-connector-java-5.1.46-bin.jar文件复制到kettle所安装的E:kettle-pdi-ce-7.1.0.0-12data-integrationlib下即可。