zoukankan
html css js c++ java
四种数据ETL模式
根据模型的设计和源数据的情况,有四种数据ETL模式:
完全刷新:数据仓库数据表中只包括最新的数据,每次加载均删除原有数据,然后完全加载最新的源数据。这种模式下,数据抽取程序抽取源数据中的所有记录,在加载前,将目标数据表清空,然后加载所有记录。为提高删除数据的速度,一般是采用Truncate清空数据表。如本系统中的入库当前信息表采用此种模式。
镜像增量:源数据中的记录定期更新,但记录中包括记录时间字段,源数据中保存了数据历史的记录,ETL可以通过记录时间将增量数据从源数据抽取出来以附加的方式加载到数据仓库中,数据的历史记录也会被保留在数据仓库中。
事件增量:每一个记录是一个新的事件,相互之间没有必然的联系,新记录不是对原有记录数值的变更,记录包括时间字段,可以通过时间字段将新增数据抽取出来加载到数据库中。
镜像比较:数据仓库数据具有生效日期字段以保存数据的历史信息,而源数据不保留历史并且每天都可能被更新。因此,只能将新的镜像数据与上次加载的数据的镜像进行比较,找出变更部分,更新历史数据被更新记录的生效终止日期,并添加变更后的数据。大多数源数据中需保存历史信息的维表.
查看全文
相关阅读:
Fiddler捕获https请求时勾选了Decrypt HTTPS traffic还是获取不到证书的问题(转)
ERROR: ORA-01033: ORACLE initialization or shutdown in progress Oracle无法启动的解决
JavaScript数据类型、函数、对象
HTML5新特性
Java 操作XML,JDOM&DOM4J
XML引入,DOM 方式解析XML 原理,SAX 方式解析XML
Json引入键值key&value,数组,嵌套,用户注册
Ajax异步XMLHttpRequest对象
JavaScript基于对象引入,闭包,面向对象的实现
MySql存储过程的操作
原文地址:https://www.cnblogs.com/zhaofei/p/3622620.html
最新文章
MyBatis使用
Oracle数据库中设置自增长列
J2EE开发实战基础系列之开卷有益
健康领域今年开始井喷了,养老地产和私人医生这两个领域目测成为下一轮BAT在健康领域布局的竞争方向
关于debian配置的问题汇总
关于配置tomcat多版本同eclipse的配置问题
html前端插件 ZenCoding 更名为Emmet
J2EE开发实战基础系列一 HelloWorld
Java相关配置合集
maven仓库地址
热门文章
2014下半年计划
StanFord 编程方法
Tomcat服务下部署CA证书(免费)实现https请求
Linux系统下weblogic服务下部署CA证书(免费),实现https请求
position详解(转)
H5移动端浏览器拖动
H5调用ios,安卓手机摄像头和相册
canvas画布使用总结
JAVA将Base64数据存储图片数据
ActiveMQ之点对点的消息实现
Copyright © 2011-2022 走看看