zoukankan
html css js c++ java
四种数据ETL模式
根据模型的设计和源数据的情况,有四种数据ETL模式:
完全刷新:数据仓库数据表中只包括最新的数据,每次加载均删除原有数据,然后完全加载最新的源数据。这种模式下,数据抽取程序抽取源数据中的所有记录,在加载前,将目标数据表清空,然后加载所有记录。为提高删除数据的速度,一般是采用Truncate清空数据表。如本系统中的入库当前信息表采用此种模式。
镜像增量:源数据中的记录定期更新,但记录中包括记录时间字段,源数据中保存了数据历史的记录,ETL可以通过记录时间将增量数据从源数据抽取出来以附加的方式加载到数据仓库中,数据的历史记录也会被保留在数据仓库中。
事件增量:每一个记录是一个新的事件,相互之间没有必然的联系,新记录不是对原有记录数值的变更,记录包括时间字段,可以通过时间字段将新增数据抽取出来加载到数据库中。
镜像比较:数据仓库数据具有生效日期字段以保存数据的历史信息,而源数据不保留历史并且每天都可能被更新。因此,只能将新的镜像数据与上次加载的数据的镜像进行比较,找出变更部分,更新历史数据被更新记录的生效终止日期,并添加变更后的数据。大多数源数据中需保存历史信息的维表.
查看全文
相关阅读:
Repeater自定义翻页 存储过程实现
Redis常用命令
常用的富文本框插件FreeTextBox、CuteEditor、CKEditor、FCKEditor、TinyMCE、KindEditor ;和CKEditor实例
网站转接支付宝解决方案
如何有效抓取SQL Server的BLOCKING信息
SVN 冲突文件详解
JavaScript可否多线程? 深入理解JavaScript定时机制
MS SQL Server:分区表、分区索引详解
支付宝外部商家购物流程
排查数据库性能的常用sql语句
原文地址:https://www.cnblogs.com/zhaofei/p/3622620.html
最新文章
Spring Security研究
ubuntu install oracle SQL Developer error fonts
常用命令
Oracle the network adapter could not establish the connection
maven nexus 搭建
cnblogs url temp
TDD从何开始
FTP命令详解
Ubuntu开启ssh服务2
ubunto 10.04 install pinyin site
热门文章
ubuntu 10.04 install vbox site
easyui
ubuntu python up
其实编写论坛也很简单 关键是数据库的设计(只针对像我这样.net新手)
好迷茫。。好失落。。
[翻译]在Asp.net 2.0中操作数据::母板页和站点导航
反射的性能测试 记录
不小心让自己头痛,细心编程
由对象持久化工具想到...................................
TreeView学习点滴,用TreeView实现资源管理器样式
Copyright © 2011-2022 走看看