zoukankan      html  css  js  c++  java
  • 学习数据仓库之概念基础

    数据仓库与数据库的差别是什么呢?各自的应用场景在哪里呢?

    在业务系统中使用的数据库,其中一般存储的是在线交易数据,是以业务单位组织数据并进行存储的。由于数据库是面向具体的应用,现在一般采用关系模型的设计方法。通过关系模型以保证数据的原子性、一致性和完整性,消除数据冗余,一般采用符合范式的规则来约束设计。

    数据仓库从设计之初就是为了数据分析服务的,因此在数据组织上是以面向主题进行组织和存储的。是通过在多个维度上对历史数据进行观察和分析,为决策人员提供在该关注点(主题)上的辅助决策信息。因此在设计上也不同于数据库的关系模型,而是采用多维分析数据模型。

    数据仓库是分析系统的数据平台,它利用从事务系统获取数据,并做汇总、加工,为决策者提供决策的依据。

    分析系统是事后的,它要提供关注时间段内所有的有效数据。这些数据是海量的,汇总计算起来也要慢一些,但是,只要能够提供有效的分析数据就达到目的了。

     数据仓库有事实表和维度表。

    事实表中一般存放的是和主题相关的度量(数值)数据以及为了和维表连接而建立的键字段,在维度表中存放的多是维度描述信息和键字段。

    为了更好地理解,我们可以看看这个例子:

    对于有个商品的营销业务进行分析,下面列出了我们的分析的需求目标、分析的维度指标、维度的层次结构等,可以更好的理解什么是事实表,什么是维度表。

     我们的事实表存放的是商品的销售记录。维度表存放的是客户的信息、商品的信息等。

  • 相关阅读:
    python 一个二维数组和一个整数,判断数组中是否含有该整数
    DDD 全称 “Domain-Driven Design”,领域驱动设计
    pytest + allure 生成测试报告
    AttributeError: module 'pytest' has no attribute 'allure'
    BDD的概念
    在im4java中使用GraphicsMagick
    缓存穿透与缓存雪崩
    Linux安装ImageMagick与JMagick完成过程及配置
    Windows/Linux下引用jar包,并用javac/java编译运行
    在CentOS4上安装JMagick
  • 原文地址:https://www.cnblogs.com/EVA-YANG/p/11850404.html
Copyright © 2011-2022 走看看