zoukankan      html  css  js  c++  java
  • 数仓 分层架构

    ods层:
    数据来源及建模方式:各业务系统的源数据,物理模型与业务模型一致;
    服务领域: 为其它逻辑层提供数据;
    数据ETL过程描述:把业务数据抽取落地成文本文件,再装载到数据仓库ods层,不做清洗转化。
    功能:
    1)ods是数仓准备区
    2)为dwd提供原始数据
    3)减少对业务系统影响
    建模方式及原则:
    数据保留时间根据实现业务需求而定;
    可以分表进行周期性存储,存储周期不长;
    从业务系统以增量方式抽取加载到ods;
    数据模型与粒度与业务系统一致(3NF)。

    dwd层:
    数据来源及建模方式:数据来自于ods层,是DW明细事实层,数据模型与ods层一致;
    服务领域:为edw提供各主题业务明细数据;
    数据ETL过程描述:根据ods增量数据和前一天DWD相关表进行merge生成全量数据,不做清洗转化,保留原始全量数据。
    功能:
    1)为DW层提供来源明细数据
    2)为未来分析类需求的扩展提供历史数据支持。
    建模方式及原则:
    为支持数据重跑可额外增加数据业务日期字段;
    可按天月年进行分表;


    dw层:
    数据来源及建模方式:数据来自dwd层,是DW事实层,采用维度建模,星型架构,这一层可细分为dwb与dws;
    服务领域:为EDS提供各主题业务明细;
    数据ETL过程描述:从dwd层进行轻度清洗,转化,汇总生成dw层数据,如字符合并,email,证件号,日期,手机号转换合并;按各个维度进行聚合汇总。


    dm层:
    数据来源及建模方式:数据来自dw层,采用维度建模,星型架构;
    服务领域:数据挖掘,自定义查询,应用集市;
    数据ETL过程描述:从dw层进行粗粒度聚合汇总,按业务需求对事实进行拉宽形成宽表。

    st层:
    数据来源及建模方式:数据来自dw层,采用维度建模,星型架构;
    服务领域:前端报表展示,主题分析,kpi报表;
    数据ETL过程描述:从dw层进行粗粒度聚合汇总,如按年、月、季、天对一些维度进行聚合生成业务需求的事实数据。

  • 相关阅读:
    数据表的水平拆分
    高性能网站架构
    文本框内容改变触发事件
    树莓派3B(1)- Raspberry Pi 3B 安装系统并联网
    一年经验Java程序员面经小记
    Windows系统安装总结
    树莓派3B(2)- 配置多个wifi,自动寻找可用网络
    Centos7 Apache实现Http访问SVN资源库
    Centos7搭建svn服务
    读《重构 改善既有代码的设计》有感
  • 原文地址:https://www.cnblogs.com/linkmust/p/11654488.html
Copyright © 2011-2022 走看看