zoukankan      html  css  js  c++  java
  • 数据仓库建模:维模型的应用

      确定数据范围实际上是对ODS进行主题划分的过程,这种划分是基于对业务系统的基础上而进行的,并不十分关心整个数据仓库系统上端应用需求,但是需要把上端应用需求与ODS数据范围进行验证,以确保应用所需的数据都已经从业务系统中抽取出来,并且得到了很好的组织。一般来讲,主题的划分是以业务系统的信息模型为依据的,设计者需要综合各种业务系统的信息模型,并进行宏观的归并,得到企业范围内的高层数据视图,并加以抽象,划定几个逻辑的数据主题范围。在这个阶段,以ER模型表示数据主题关系最为恰当。
    2:根据数据范围进行进一步的数据分析和主题定义
        在第一步中定义出来了企业范围内的高层数据视图,以及所收集到的各种业务系统的资料,在这一步中,需要对大的数据主题进行分解,并进行主题定义,直到每个主题能够直接对应一个主题数据模型为止。在这个阶段,将把第一步生成的每个ER图中的实体进行分解,分解的结果仍以ER表示为佳。
    3:定义主题元素
        定义维、度量、主题、粒度、存储期限
        定义维的概念特性:
        维名称,名称应该能够清晰表示出这个维的业务含义。
        维成员,也就是这个维所代表的具体的数据,
        维层次,维成员之间的隶属与包含的层次关系,每个层次需要定义名称
        定义度量的概念特性:
        度量名称,名称应该能够清晰标书这个度量的业务含义
        定义主题的概念特性:
        主题名称和含义,说明该主题主要包含哪些数据,用于什么分析;
    主题所包含的维和度量;
        主题的事实表,以及事实表的数据。
        定义粒度:
        主题中事实表的数据粒度说明,这种粒度可以通过对维的层次限制加以说明,也可以通过对事实表数据的业务细节程度进行说明。  
        定义存储期限:
        主题中事实表中的数据存储周期。
    4:迭代,归并维、度量的定义
        在ODS中,因数据来自于多个系统,数据主题划分时虽然对数据概念进行了一定程度上的归并,但具体的业务代码所形成的各个维、以及维成员等还需要进一步进行归并,把概念统一的维定义成一个维,不允许同一个维存在不同的实体表示(象不同的业务系统中一样)。
    5:物理实现
        定义每个主题的数据抽取周期、抽取时间、抽取方式、数据接口,抽取流程和规则。
        物理设计不仅仅是ODS部分的数据库物理实现,设计数据库参数、操作系统参数、数据存储设计之外,有关数据抽取接口等问题必须清晰定义。
    DW设计指南

  • 相关阅读:
    PowerGhost
    watchdogs感染性挖矿病毒
    XorDDoS木马
    Gates(盖茨)木马
    seasame病毒
    zabbix监控之邮件报警通知
    ubuntu18.04 heirloom-mailx 通过外部SMTP服务器发送邮件
    linux小常识
    zabbix基本概念
    Zabbix图表中文乱码
  • 原文地址:https://www.cnblogs.com/HondaHsu/p/4756496.html
Copyright © 2011-2022 走看看