zoukankan      html  css  js  c++  java
  • Kettle 执行SQL脚本

    以下操作都在5.0.1版本下进行开发,其余版本可以进行自动比对

    本文将对Kettle5中常用步骤字段选择(又名选择/改名值,英文原名:Select Values)进行详细解释。这个步骤的功能非常强大,主要包括:
    选择:选择的字段将按照你指定的顺序加入到输出流中,其他字段一概丢弃。除非你选中包含未选择的列(图1中的第2个控件);
    删除:需要从输入流中丢弃的字段;
    元数据:需要改变的元数据,包括字段的名称、类型、长度、精度、格式等。

    步骤初始化时,需要准备元数据,其顺序是选择、删除、元数据,主要处理流程如下:
    从输入流中清空元数据集合;
    按顺序加入“选择”中设置的字段,包括重命名、修改长度与精度等。如果选中“包含未选择的列”,那么把其他字段按照名字排序,依次加入元数据中;
    从已有元数据中删除用户设置的“移除”字段集合;
    从已有元数据中按照“元数据”设置进行修改。
    了解上述处理顺序,才不会被一些奇怪的现象弄糊涂。

    二、说明
    1、步骤的属性对话框如下图1-3所示:
    图1.

    图2.

    图3.

    2、下面通过一个表格逐项解释每一个对话框中字段的含义。
    序号
    名称
    含义
    1
    选择和修改
    一共包含4个列,本标签实际上决定了输出行集的最大字段集合。也就是说,最终输出的列不会超过这个集合。4个列解释如下:
    字段名称:输入行集的字段名称
    改名成:新的字段名称
    长度:新的字段长度
    精度:新的字段精度
    2
    包含未指定的列,按名称排序
    如果选中,那么未在第1步中选择的输入行集其他列将自动加入到本步骤元数据中。否则,只包含第1步中配置的列。
    3
    移除的字段
    在第12步确定的字段集合基础上,删除所有配置的字段。
    4
    需要改变元数据的字段。
    在第123步确定的字段集合基础上,改变字段元数据。一共包含15个列,主要列解释如下:
    字段名称:输入行集的字段名称
    改名成:新的字段名称
    类型:新的字段类型
    长度:新的字段长度
    精度:新的字段精度
    Binary to Normal:采用二进制或者原始类型存储
    格式:格式化字符串时需要。例如需要格式化日期,那么可以用yyyy-MM-dd'T'HH:mm:ss.XXX,注意其中单引号限定部分。如果需要在日期格式中使用原始字母,那么必须用单引号限定,否则将当成表达式解析。
    Date format Lenient:在解析日期异常数据时是否支持宽容模式。例如碰到15月,如果启用宽容模式,那么15月会当成15-12=3月。

    三、附录
    主要代码解释如下:
    包:org.pentaho.di.trans.steps.selectvalues
    元数据类:SelectValuesMeta
    运行数据类:SelectValuesData
    执行过程类:SelectValues
    元数据配置类:SelectMetadataChange

    简单的操作步骤已经讲解完毕,接下来给大家带来具体的单表操作。
    更多知识资源分享,欢迎关注公众号《大喇叭玩转数据库》

  • 相关阅读:
    LeetCode First Bad Version (二分查找)
    LeetCode Permutations II (全排列)
    LeetCode Permutations (全排列)
    LeetCode Minimum Path Sum (简单DP)
    LeetCode Binary Tree Postorder Traversal(数据结构)
    LeetCode Sort Colors (技巧)
    邹忌
    参数传递
    父子窗体返回值与互操作
    其他数据库连接
  • 原文地址:https://www.cnblogs.com/dalaba/p/12024054.html
Copyright © 2011-2022 走看看