zoukankan      html  css  js  c++  java
  • 数仓中的全量表、增量表、拉链表、流水表、快照表

    全量表:每天的所有写最新状态的数据

    1、有无变化,都要报

    2、每次上报的数据都是所有的数据(变化的+没有变化的)

    增量表:新增的数据

    1、增量表,只报变化量,无变化不用报

    拉链表

    1、记录一个事物从开始,一直到当前状态的所有变化的信息

    2、拉链表每次上报的都是历史记录的最终状态,是记录在当前时候的历史总量

    流水表:对于表的每一个修改都会记录,可以用户反映实际记录的变更

    1、拉链表通常是对账户信息的历史变动进行处理保留的结果,流水表是对每天的交易形成的历史

    2、流水表用于统计业务相关情况,拉链表用于统计账户及客户的情况

    快照表:数据包含前一天的全量数据,按照每一天进行分区

  • 相关阅读:
    10_树基础部分
    11_多线程
    14_JUC
    Servlet代码实例
    关于JSP引用资源路径
    Struts2代码实例
    hadoop三大核心组件介绍
    presto自定义函数开发
    git使用
    hive优化总结
  • 原文地址:https://www.cnblogs.com/yayazhang221/p/12808305.html
Copyright © 2011-2022 走看看