zoukankan
html css js c++ java
四种数据ETL模式
根据模型的设计和源数据的情况,有四种数据ETL模式:
完全刷新:数据仓库数据表中只包括最新的数据,每次加载均删除原有数据,然后完全加载最新的源数据。这种模式下,数据抽取程序抽取源数据中的所有记录,在加载前,将目标数据表清空,然后加载所有记录。为提高删除数据的速度,一般是采用Truncate清空数据表。如本系统中的入库当前信息表采用此种模式。
镜像增量:源数据中的记录定期更新,但记录中包括记录时间字段,源数据中保存了数据历史的记录,ETL可以通过记录时间将增量数据从源数据抽取出来以附加的方式加载到数据仓库中,数据的历史记录也会被保留在数据仓库中。
事件增量:每一个记录是一个新的事件,相互之间没有必然的联系,新记录不是对原有记录数值的变更,记录包括时间字段,可以通过时间字段将新增数据抽取出来加载到数据库中。
镜像比较:数据仓库数据具有生效日期字段以保存数据的历史信息,而源数据不保留历史并且每天都可能被更新。因此,只能将新的镜像数据与上次加载的数据的镜像进行比较,找出变更部分,更新历史数据被更新记录的生效终止日期,并添加变更后的数据。大多数源数据中需保存历史信息的维表.
查看全文
相关阅读:
测序分析软件-phred的安装
测序分析软件-trimmomatic的记录
linux-ubuntu下fastQC的安装及使用
linux 下统计文本行数
linux .gz文件 解压缩命令
启用谷歌浏览器Adobe Flash Player
「三代组装」使用Pilon对基因组进行polish
用BUSCO来评估基因组完整性
linux tar.gz 文件解压缩
查看jobs详情
原文地址:https://www.cnblogs.com/zhaofei/p/3622620.html
最新文章
05-关于DOM操作的相关案例
04-关于DOM的事件操作,DOM介绍
03-函数,伪数组 arguments
02-运算符,数据类型转换,流程转换,常用内置对象
01-javascript简介,第一个JavaScript代码,数据类型
webpack的一些命令
webpack不是内部命令问题
解决国内NPM安装依赖速度慢问题
微信小程序开发个人笔记
多行文本溢出显示省略号(…)
热门文章
验证车牌、手机号、电话、qq等
css公共样式整理
scroll滚动到一定距离触发事件/返回顶部animate
IE6 IE7 IE8 FF兼容符号
返回至顶部
RNA-seq学习操作流程
常见的生物信息学格式介绍
关于Ubuntu12.04中依赖关系问题的解决
motif分析软件-----Homer的安装
chip-seq数据分析中peak-calling软件-------MACS的安装
Copyright © 2011-2022 走看看