zoukankan      html  css  js  c++  java
  • 【数据仓库】数据仓库概述

    1.RDBMS数据库

    随着关系数据库理论的提出,诞生了一系列经典的RDBMS,如Oracle,MySQL,SQL Server等。这些RDBMS被成功推向市场,并为社会信息化的发展做出的重大贡献。然而随着数据库使用范围的不断扩大,它被逐步划分为两大基本类型:

    (1)操作型数据库

    主要用于业务支撑。一个公司往往会使用并维护若干个数据库,这些数据库保存着公司的日常操作数据,比如商品购买、酒店预订、学生成绩录入等;

    (2)分析型数据库

    主要用于历史数据分析。这类数据库作为公司的单独数据存储,负责利用历史数据对公司各主题域进行统计分析;

    2.操作型数据库 VS 分析型数据库

    因为主导功能的不同(面向操作/面向分析),两类数据库就产生了很多细节上的差异:

    (1)定位不同(数据以何种目的组织起来)

    操作型数据库是为了支撑具体业务的,因此也被称为"面向应用型数据库",使用者是业务环境内的各个角色,如用户,商家,进货商等;

    分析型数据库则是针对各特定业务主题域的分析任务创建的,因此也被称为"面向主题型数据库"。使用者只是少量用来做综合性决策的用户。

    (2)数据不同

    操作型数据库主要是存放90天以内的明细数据,反映的是现实世界的当前状态。

    分析型数据库存放的则主要是存放数年内的明细+汇总数据(用户重点关注汇总数据),反映的是当前状态和过去各时刻的快照。

    关于汇总数据特别说明:
    操作型数据库中自然也有汇总需求,但汇总数据本身不存储而只存储其生成公式。这是因为操作型数据是动态变化的,因此汇总数据会在每次查询时动态生成。 而对于分析型数据库来说,因为汇总数据比较稳定不会发生改变,而且其计算量也比较大(因为时间跨度大),因此它的汇总数据可考虑事先计算好,以避免重复计算。

    (3)性能要求不同

    操作型数据库操作的数据量少而频率多,系统对于大量用户并发读和写性能要求比较高。

    分析型数据库操作则的数据量大而频率少,系统对于大数据量的读性能要求比较高。

     3.数据仓库定义

    一个企业的、面向主题的、集成的、相对稳定的、反映历史变化的数据集合。

    (1)企业范围

    数据仓库内的数据是面向公司全局的。比如某个主题域为成本,则全公司和成本有关的信息都会被汇集进来;

    (2)面向主题

    面向主题特性是数据仓库和操作型数据库的根本区别。操作型数据库是为了支撑各种业务而建立,而分析型数据库则是为了对从各种繁杂业务中抽象出来的分析主题(如用户、成本、商品等)进行分析而建立;

    (3)集成性

    集成性是指数据仓库会将不同源数据库中的数据汇总到一起;

    (4)相对稳定的(时变性)

    时变性是指数据仓库包含来自其时间范围不同时间段的数据快照。有了这些数据快照以后,用户便可将其汇总,生成各历史阶段的数据分析报告;

    (5)历史性

    较之操作型数据库,数据仓库的时间跨度通常比较长。前者通常保存几个月,后者可能几年甚至几十年;

    参考文档:

    第一篇:数据仓库概述

  • 相关阅读:
    学海无涯,回头是岸
    理想很丰满,现实很骨感
    CodeIgniter的工作过程(1)
    如何干净安装OS X El Capitan 全新安装OS X El Capitan方法
    如何让虚拟机通过物理机上安装的代理软件上网
    如何创建可引导的 macOS 安装器
    为什么穿袜子睡觉入睡更快 还能提高睡眠质量?
    Windows下的dll注入(使用CreateRemoteThread)
    Windows下MinGW与MSVC2015关于char指针的区别
    大小端的区分
  • 原文地址:https://www.cnblogs.com/badboy200800/p/11176940.html
Copyright © 2011-2022 走看看