zoukankan      html  css  js  c++  java
  • 几种 ETL 工具的比较(Kettle,Talend,Informatica 等)

    成本:
    软件 成本包括多方面,主要包括软件产品, 售前培训, 售后咨询,

    技术 支持等。
    开源 产品本身是免费的,成本主要是培训和咨询,所以成本会一直维持在一个较低水平。
    商业产品本身价格很高,但是一般会提供几次免费的咨询或支持,所以采用商用软件最初成本很高,但是逐渐下降。
    手工编码最初成本不高,主要是人力成本,但后期维护的工作量会越来越大。

    风险:
    项目都是有风险的尤其是大项目。
    项目的风险主要包括:超出预算,项目延期,没有达到用户的满意和期望
    开源产品由于价格上的优势,可以在很大程度上降低项目的风险。

    易用性:
    Talend:有 GUI 图形界面但是以 Eclipse 的插件方式提供。
    Kettle:有非常容易使用的 GUI,出现问题可以到社区咨询。
    Informatica:有非常容易使用的 GUI,但是要专门的训练。
    Inaplex Inaport:没有GUI

    技术支持:
    Talend:主要在美国
    Kettle:在美国,欧洲(比利时,德国,法国,英国),亚洲( 中国 ,日本,韩国)都可以找到相关技术支持人员。
    Informatica:遍布全世界
    Inaplex Inaport:主要在英国

    部署:
    Talend:创建

    java

    或perl 文件,并通过操作系统调度工具来运行
    Kettle:可以使用 job 作业方式或操作系统调度,来执行一个转换文件或作业文件,也可以通过集群的方式在多台机器上部署。
    Informatica:需要有

    Server
    Inaplex Inaport:需要 .net 2.0

    速度:
    Talend:需要手工调整,对特定数据源有优化知识。
    Kettle:比 Talend 快,不过也需要手工调整,对 Oracle 和 PostGre 等数据源做了优化,同时也取决于转换任务的设计。
    Informatica:是最快的
    Inaplex Inaport:没有使用什么优化技术。

    数据质量:
    Talend:在 GUI 里有数据质量特性,可以手工写

    SQL

    语句。
    Kettle:在 GUI 里有数据质量特性,可以手工写 SQL 语句、java脚本、正则表达式来完成数据清洗。
    Informatica:专门有一个产品 Informatica Data Quality 来保证数据质量
    Inaplex Inaport:因为只处理特定数据,所以比较容易进行数据清洗。

    监控:
    Talend:有监控和日志工具
    Kettle:有监控和日志工具
    Informatica:有非常详细的监控和日志工具
    Inaplex Inaport:有监控和日志工具

    连接性:
    Talend:各种常用 数据库 ,文件, web

    service。
    Kettle:非常广泛的数据库,文件,另外可以通过插件扩展。
    Informatica:各种数据源
    Inaplex Inaport:ODBC 连接

  • 相关阅读:
    HDOJ 5414 CRB and String 模拟
    Python标准库:内置函数all(iterable)
    Can not find a java.io.InputStream with the name [downloadFile] in the invocation stack.
    关于TabLayout+ViewPager组合实现多页面滑动
    互联网产品经理应该具备的技能(需求篇)
    【Android】利用自己定义View的重绘实现拖动移动,获取组件的尺寸
    mybatis自己主动生成mapper,dao,映射文件
    Java解析注解
    如日中天的Uber到底是用什么开发语言做到的?
    [Swift]LeetCode1002. 查找常用字符 | Find Common Characters
  • 原文地址:https://www.cnblogs.com/journeyIT/p/8267223.html
Copyright © 2011-2022 走看看