zoukankan      html  css  js  c++  java
  • Hadoop构建数据仓库实践读书笔记【2】--主要数据仓库架构

    几种主要的架构方法:数据集市架构、Inmon企业信息工厂架构、Kimball数据仓库架构和混合型数据仓库架构。

    数据集市是按主题域组织的数据集合,用于支持部门级的决策。两种类型的数据集合:独立数据集市和从属数据集市。

    • 独立数据集市集中于部门所关心的单一主题域,数据以部门为基础部署,无须考虑企业级别的信息共享与集成。数据分析或商业智能工具直接从数据集市查询数据,并将查询结果显示给用户。周期短,见效快。
    • 从属数据集市,数据来源于数据仓库,经过整合、重构、汇总后传递给所从属数据集市。

    建立从属数据集市的好处主要有:

    1. 性能:当数据仓库的查询性能出现问题,可以考虑建立几个从属数据集市,将查询从数据仓库移出到数据集市。
    2. 安全:每个部门可以完全控制他们自己的数据。
    3. 数据一致:因为每个数据集市的数据来源都是同一个数据仓库,有效消除了数据不一致的情况。

    Kimball 和Inmon 两种架构的主要区别在于核心数据仓库的设计和建立。Kimball的数据仓库包含高粒度的企业数据,使用多维模型设计,这样意味着数据仓库由星形模式的维度表和事实表构成。

    混合型结构:在一个数据仓库环境中,联合使用INmon 和Kimball 两种架构。

    操作数据存储又称为ODS,是Operational Data Store 的简写,是一个面向主题的、集成的、可变的、当前的细节数据集合,用于支持企业对于即时性的、操作性的、集成的全体信息的需求。

    负重前行
  • 相关阅读:
    背水一战 Windows 10 (90)
    背水一战 Windows 10 (89)
    背水一战 Windows 10 (88)
    背水一战 Windows 10 (87)
    背水一战 Windows 10 (86)
    背水一战 Windows 10 (85)
    背水一战 Windows 10 (84)
    背水一战 Windows 10 (83)
    背水一战 Windows 10 (82)
    背水一战 Windows 10 (81)
  • 原文地址:https://www.cnblogs.com/astride/p/11168546.html
Copyright © 2011-2022 走看看