zoukankan      html  css  js  c++  java
  • Hadoop构建数据仓库实践读书笔记【2】--主要数据仓库架构

    几种主要的架构方法:数据集市架构、Inmon企业信息工厂架构、Kimball数据仓库架构和混合型数据仓库架构。

    数据集市是按主题域组织的数据集合,用于支持部门级的决策。两种类型的数据集合:独立数据集市和从属数据集市。

    • 独立数据集市集中于部门所关心的单一主题域,数据以部门为基础部署,无须考虑企业级别的信息共享与集成。数据分析或商业智能工具直接从数据集市查询数据,并将查询结果显示给用户。周期短,见效快。
    • 从属数据集市,数据来源于数据仓库,经过整合、重构、汇总后传递给所从属数据集市。

    建立从属数据集市的好处主要有:

    1. 性能:当数据仓库的查询性能出现问题,可以考虑建立几个从属数据集市,将查询从数据仓库移出到数据集市。
    2. 安全:每个部门可以完全控制他们自己的数据。
    3. 数据一致:因为每个数据集市的数据来源都是同一个数据仓库,有效消除了数据不一致的情况。

    Kimball 和Inmon 两种架构的主要区别在于核心数据仓库的设计和建立。Kimball的数据仓库包含高粒度的企业数据,使用多维模型设计,这样意味着数据仓库由星形模式的维度表和事实表构成。

    混合型结构:在一个数据仓库环境中,联合使用INmon 和Kimball 两种架构。

    操作数据存储又称为ODS,是Operational Data Store 的简写,是一个面向主题的、集成的、可变的、当前的细节数据集合,用于支持企业对于即时性的、操作性的、集成的全体信息的需求。

    负重前行
  • 相关阅读:
    PHP WAMP关闭notice等提示
    PowerDesigner 逆向工程 从SQL文件转换成PDM 从PDM转成CDM
    Servlet 各种path路径比较
    数据库一对一的两种关联 主键关联和外键关联
    Java Timer定时器
    VS2010彻底卸载
    VS2010每次编译都重新编译整个工程的解决方案
    DbgPrint/KdPrint输出格式控制
    error TRK0002: Microsoft Visual Studio 10.0VCinlink.exe Access is denied.
    WinDbg F9时“code not found breakpoint not set”
  • 原文地址:https://www.cnblogs.com/astride/p/11168546.html
Copyright © 2011-2022 走看看