zoukankan      html  css  js  c++  java
  • Oracle Warehouse Builder 自动化ETL处理进程(1)

    作者: cyw 出处:IT专家网 
     
    阅读提醒:本文将和人人一同切磋怎样用OWB构建一个自动化的ETL处理进程。在假定你已经安设了OWB的条件下,上面会图文并茂慢慢为人人阐明注解构建的进程。


    甲骨文公司有很多服从壮大大但受存眷水平较低的产物,Warehouse Builder(简称OWB)即是其中之一。就像甲骨文旗下其他的几个非关连数据库管理系统产物一样,OWB刚初阶的版本用起来都让人认为很不随手,譬喻用户界面不够友好,经常呈现错误,不易于安设和运用等等。不过,在最近的几个版本,OWB已经慢慢完美,成为一款高服从多服从的运用软件,让用户可以失失超凡的体验。

    本文将和人人一同切磋怎样用OWB构建一个自动化的ETL处理进程。在假定你已经安设了OWB的条件下,上面会图文并茂慢慢为人人阐明注解构建的进程。

    背景常识

    Oracle Warehouse Builder,常简称为OWB,可以将无花式结构的平面文件(flat file)加载到数据库的进程自动化。很大都据库管理员对SQL*Loader对象和shell脚本的搅浑运用非常认识,再加上在各个差其余中心进行一些cron设置就可以完成数据加载的进程。OWB也可以完成如许的义务(而且还有更多的服从),经过进程供给一个导游驱动兼备大批断点和不雅查点提醒及点击服从的图形用户界面来完成这一进程。经过进程其“规划中心”和“节制中心”界面,用户可以规划并布置ETL进程(本文重点存眷其中的加载进程,也即是将分隔数值的平面文件内容加载到一个表,而且在加载的进程中数据不产生变革)。别的,ETL的布置不局限于你当前正在义务的效劳器,OWB让你可以在一台效劳器上规划ETL进程,然后将规划的法式布置到另一台效劳器上,如果你想要,还可以布置到更多的效劳器上。

    这个操纵刻下的整个法式是怎样一个不雅点呢?我们来看看要完成整个操纵需要进行的法式,大概可以帮你理清大概的框架:

    1. 指定源文件,包括文件地点位置及其性子。

    2. 竖立一个内部表,作为数据字典的存储器。

    3. 确认数据库中“真实”表,如有需要竖立该表。

    4. 在有筹算的基础出息行整个进程,或一次性完成整个处理进程。

    OWB对这个进程的处理要领是利用与这些对象相干的元数据(metadata),经过进程规划映射和历程流(也称为进程流)来绑定他们。抱负上,可以将历程流作为一个可视化假象进行竖立,也即是说,OWB理论所运用的义务流只是OWB天生的一个历程流方式图,不过这个方式图足以算作义务流来运用。

    把这个进程的每一部门都算作一个对象来考虑:文件、文件的位置、内部表、真实表、将flat文件映射到内部表的进程、末了运转的功课等等。全数的这些都是对象,而这些对象都可以经过进程层级和依靠性将这些对象绑定起来。每个对象范例都存在一个模块当中。由于这个对象是基于Java言语的,所以面向对象的规划是可行的。一样平时来说,每个对象都是一个实例大概是经过进程某种要领实例化的对象。

    进程

    一个典型的ETL进程方式包括在循环的基础上加载一个平面文件(你也可以只实施其中的映射部门)。如果你将该进程剖析为触及项目树不同部门的几许法式,那么就很轻易搞分明整个义务了。一个项方针初阶,起首需要在Oracle下竖立一个一个模块。提醒人人,要记着几乎每一个类别都触及到相通的两个法式:竖立模块和导入元数据。而且抽样并不老是基于整齐个表。





    版权声明: 原创作品,许可转载,转载时请务必以超链接方式标明文章 原始出处 、作者信息和本声明。不然将追查规律责任。

  • 相关阅读:
    LIKE语句也可以这样写
    a链接触发javascript函数导致innerHTML里的图片无法加载
    引用类型真屌
    网站建设心得
    SPAN
    Go! 环境配置和入门
    linux内核编译
    面试题
    KCMT开源控件之方便简洁的分页控件
    c#中out、ref和params的用法与区别
  • 原文地址:https://www.cnblogs.com/zgqjymx/p/1974642.html
Copyright © 2011-2022 走看看