zoukankan html css js c++ java

kimball维度建模(4)-统一数仓层DW与事实表设计

为什么要设计数据分层 ——参考《一种通用的数据仓库分层方法》

　　这是数据仓库同学在设计数据分层时首先要被挑战的问题，类似的问题可能会有很多，比如说“为什么要做数据仓库？”、“为什么要做元数据管理？”、“为什么要做数据质量管理？”。当然，这里我们只聊一下为什么要做设计数据分层。

　　作为一名数据的规划者，我们肯定希望自己的数据能够有秩序地流转，数据的整个生命周期能够清晰明确被设计者和使用者感知到。直观来讲就是数据层次、依赖关系清晰。

　　但是，大多数情况下，我们完成的数据体系却是依赖复杂、层级混乱的。在不知不觉的情况下，我们可能会做出一套表依赖结构混乱，甚至出现循环依赖的数据体系。

　　因此，我们需要一套行之有效的数据组织和管理方法来让我们的数据体系更有序，这就是谈到的数据分层。数据分层并不能解决所有的数据问题，但是，数据分层却可以给我们带来如下的好处：

　　贴源数据层ODS、统一数仓层DW(细分为明细数据层DWD和汇总数据层DWS)、标签数据层TDM、应用数据层ADS。

　　其中，DW层采用维度建模的思想，包含维度表与事实表。涉及到常用的事实表如下：

　　1）事务事实表-记录业务事务级别数据（增量更新）

　　2）周期快照事实表-记录时间周期内的聚集事实或状态度量（增量更新）

　　3）累计快照事实表-覆盖一个事务从开始到结束之间所有关键事件（全量刷新）

只是形容存在某些事件，没有可记录的数字化事实。常用于两个场景：

1）“关注什么未发生”。如处于销售状态但尚未销售的产品(没有发生销售事实)有哪些，需要由促销范围事件表产品(无促销事实)-销售事实表中已卖出产品。

2）“客户/代理分配”。销售经理与客户分配关系表(有一本书专门讲了“关系”)，如尚未产生销售事实的代理分配有哪些，需要由分配关系-已发生销售行为的分配关系。

对多个原子粒度事实表进行事务度量汇总、进行简单的数字化上卷获得。

将来自多过程的事实打横，以相同粒度合并放在一个单一的事实表中。难点在于不同的过程事实的公共维度处理。

查看全文

相关阅读:
uniapp请求拦截
 stellar视差插件
 fullpage全屏插件应用
 fullpage全屏插件简介
 WdatePicker日期插件
 Ueditor富文本编辑器
 layer弹出层
 验证码绘制
 Ajax跨域访问
 JQuery封装的ajax方法