四种数据ETL模式 - 走看看

zoukankan html css js c++ java

四种数据ETL模式

根据模型的设计和源数据的情况，有四种数据ETL模式：

完全刷新：数据仓库数据表中只包括最新的数据，每次加载均删除原有数据，然后完全加载最新的源数据。这种模式下，数据抽取程序抽取源数据中的所有记录，在加载前，将目标数据表清空，然后加载所有记录。为提高删除数据的速度，一般是采用Truncate清空数据表。如本系统中的入库当前信息表采用此种模式。

镜像增量：源数据中的记录定期更新，但记录中包括记录时间字段，源数据中保存了数据历史的记录，ETL可以通过记录时间将增量数据从源数据抽取出来以附加的方式加载到数据仓库中，数据的历史记录也会被保留在数据仓库中。

事件增量：每一个记录是一个新的事件，相互之间没有必然的联系，新记录不是对原有记录数值的变更，记录包括时间字段，可以通过时间字段将新增数据抽取出来加载到数据库中。

镜像比较：数据仓库数据具有生效日期字段以保存数据的历史信息，而源数据不保留历史并且每天都可能被更新。因此，只能将新的镜像数据与上次加载的数据的镜像进行比较，找出变更部分，更新历史数据被更新记录的生效终止日期，并添加变更后的数据。大多数源数据中需保存历史信息的维表.

查看全文

相关阅读:
Repeater自定义翻页存储过程实现
 Redis常用命令
 常用的富文本框插件FreeTextBox、CuteEditor、CKEditor、FCKEditor、TinyMCE、KindEditor ；和CKEditor实例
 网站转接支付宝解决方案
 如何有效抓取SQL Server的BLOCKING信息
 SVN 冲突文件详解
 JavaScript可否多线程? 深入理解JavaScript定时机制
 MS SQL Server：分区表、分区索引详解
 支付宝外部商家购物流程
 排查数据库性能的常用sql语句

原文地址：https://www.cnblogs.com/zhaofei/p/3622620.html

Copyright © 2011-2022 走看看