ETL:抽取(extract)、转换(transform)、加载(load)至目的端的过程;
Kettle是ETL工具代表之一,是pentaho中的一个数据整合的一个组件。Kettle里包括多个Job、转换,一个Job可以包含多个转换,转换是kettle执行的最小单位。
1,创建两个CSV文件:
如图


2,在Spoon.bat中创建两个CSV输入

保存,运行。
3,创建记录集连接

获得链接字段后,选择对应的行,删除多余的行
大致就是:

运行:

3,字段选择
删除多余的行:

运行
4,创建Excel输出,修改文件名和地址即可

生成的Excel文件:
