zoukankan      html  css  js  c++  java
  • 数据产品-数据仓库分层建模02

    这次总结下维度建模的形式:星型建模,雪花建模,星座模型

    (维度建模不需要数据产品去实施,但是需要了解)

    先说下两个概念:事实表,维度表

    1. 维度表(dimension)

    比如"昨天早上我在TB使用了50元购买了一个鞋子"。那么以购买为主题进行分析,可从这段信息中提取三个维度:时间维度(昨天早上),地点维度(TB), 商品维度(鞋子)。通常来说维度表信息比较固定,且数据量小。

     2. 事实表(fact table)

    比如上面那个例子中,50元就是事实信息。事实表包含了与各维度表相关联的外码,并通过JOIN方式与维度表关联。事实表的度量通常是数值类型,且记录数会不断增加。

    1. 星形模式:

    1.1维表只和事实表关联,维表之间没有关联;

    1.2每个维表的主码为单列,且该主码放置在事实表中,作为两边连接的外码;

    1.3以事实表为核心,维表围绕核心呈星形分布

    2. 雪花形模式:

    雪花模式(Snowflake Schema)是对星形模式的扩展,每个维表可继续向外连接多个子维表。

    这种模式在实际应用中很少见,公司也基本不用,数据冗余问题的话在数据仓库里并不严重,也不用担心。

    3. 星座形模式:

    星座模式也是星型模式的扩展

    4. 对比:

  • 相关阅读:
    Shell与if相关参数
    Linux盘符漂移问题
    shell脚本,每5个字符之间插入"|",行末不插入“|”
    paste:linux合并两个文件中的列(左右合并)
    关于bc 的scale .
    RxJS与观察者模式
    什么是虚拟DOM
    JS设计模式
    JS自定义事件
    原生js实现拖拽功能
  • 原文地址:https://www.cnblogs.com/codewan/p/10819715.html
Copyright © 2011-2022 走看看