zoukankan      html  css  js  c++  java
  • 数据库与数据仓库

    decision support system (DSS) environments

    focussed on OLTP-type applications. For detailed information on DSS and mixed environments, see the Oracle Database Data Warehousing Guide.

    商业智能又名商务智能,英文为Business Intelligence,简写为BI。
    商业智能的概念于1996年最早由加特纳集团(Gartner Group)提出,加特纳集团将商业智能定义为:商业智能描述了一系列的概念和方法,通过应用基于事实的支持系统来辅助商业决策的制定。商业智能技术提供使企业迅速分析数据的技术和方法,包括收集、管理和分析数据,将这些数据转化为有用的信息,然后分发到企业各处。

    商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。这里所谈的数据包括来自企业业务系统的订单、库存、交易账目、客户和供应商等来自企业所处行业和竞争对手的数据以及来自企业所处的其他外部环境中的各种数据。而商业智能能够辅助的业务经营决策,既可以是操作层的,也可以是战术层和战略层的决策。为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。因此,从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。

    商业智能的实现涉及到软件、硬件、咨询服务及应用,其基本体系结构包括数据仓库、联机分析处理和数据挖掘三个部分。

    因此,把商业智能看成是一种解决方案应该比较恰当。商业智能的关键是从许多来自不同的企业运作系统的数据中提取出有用的数据并进行清理,以保证数据的正确性,然后经过抽取(Extraction)、转换(Transformation)和装载(Load),即ETL过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图,在此基础上利用合适的查询和分析工具、数据挖掘工具、OLAP工具等对其进行分析和处理(这时信息变为辅助决策的知识),最后将知识呈现给管理者,为管理者的决策过程提供支持。

    商业建立在信任之上。信任是一种披着情感外衣的互惠主义。在困境中做出正确决策的人和机构能够赢得自尊和他人的尊敬,这种感情上的东西是非常宝贵的,即便它不能为数据所捕捉和反映。

    目前这一历史时期最大的创新就在于,我们的生活现在由收集数据的计算机调控着。在这个时代,头脑无法理解的复杂情况,数据可以帮我们解读其中的含义。数据可以弥补我们对直觉的过分自信,数据可以减轻欲望对知觉的扭曲程度。

    关系理论导致关系数据库
    数据仓库理论导致数据仓库

    任何一个实践应用都有相应的理论作为支撑

    数据仓库之父比尔·恩门(Bill Inmon)在1991年出版的“Building the Data Warehouse”(《建立数据仓库》)一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。
    数据仓库的架构领域在理论知识上存在着两大流派,它们分别是由两位大师Ralph Kimball&Bill Inmon,在上世纪 90年代初提出。这两位大师均是商业智能/数据仓库领域的泰斗宗师级人物、理论家, 但是他们两位的理念和思路有较大差异。他们的跟随者之间也经常有关于哪种架构和建设方式更优的辩论。
    在国内,我们通常所说的数据仓库的四个特性角度的定义(面向主题、集成、相对稳定、 反映历史变化,用于支持决策),就是inmon提出来的,他也被称为数据仓库之父。而实践大师kimball他的的工具箱系列著作,亦被奉为数据仓库建设的经典书籍。


    从数据库到数据仓库

    二者的区别:
    1、出发点不同:数据库是面向事务的设计;数据仓库是面向主题设计的。
    2、存储的数据不同:数据库一般存储在线交易数据;数据仓库存储的一般是历史数据。
    3、设计规则不同:数据库设计是尽量避免冗余,一般采用符合范式的规则来设计;数据仓库在设计是有意引入冗余,采用反范式的方式来设计。
    4、提供的功能不同:数据库是为捕获数据而设计,数据仓库是为分析数据而设计,
    5、基本元素不同:数据库的基本元素是事实表,数据仓库的基本元素是维度表。
    6、容量不同:数据库在基本容量上要比数据仓库小的多。
    7、服务对象不同:数据库是为了高效的事务处理而设计的,服务对象为企业业务处理方面的工作人员;数据仓库是为了分析数据进行决策而设计的,服务对象为企业高层决策人员。


    企业的数据处理大致分为两类:
    一类是操作型处理,也称为联机事务处理,它是针对具体业务在数据库联机的日常操作,通常对少数记录进行查询、修改。
    另一类是分析型处理,一般针对某些主题的历史数据进行分析,支持管理决策。数据仓库,数据挖掘
    OLTP    二维关系        联机事务处理    On-Line Transaction Processing    
    OLAP    多维关系        联机分析处理    On-Line Analytical Processing    数据仓库,数据挖掘
    OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。
    OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。

    联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。OLAP的提出引起了很大的反响,OLAP作为一类产品同联机事务处理 (OLTP) 明显区分开来。

      
    OLTP
    OLAP
    用户
    操作人员,低层管理人员
    决策人员,高级管理人员
    功能
    日常操作处理
    分析决策
    DB 设计
    面向应用
    面向主题
    数据
    当前的, 最新的细节的, 二维的分立的
    历史的, 聚集的, 多维的,集成的, 统一的
    存取
    读/写数十条记录
    读上百万条记录
    工作单位
    简单的事务
    复杂的查询
    DB 大小
    100MB-GB
    100GB-TB

    奥威Power-BI 包含ETL+DW+OLAP+DM+Dashboard+Query+Report等所有BI工具

    数据可视化

    对于数据分析人员,不再依赖IT开发人员,随需而动,任意组合,任意筛选,任意联动,任意钻取,我的数据我作主,真正实现自助式BI应用
    对于IT开发人员,不再需要无止境的响应数据分析人员的个性化需求,专注构建数据中心与分析模型,保证有数据,准确,以及正确的访问权限即可。

  • 相关阅读:
    ibatis 中isNull, isNotNull与isEmpty, isNotEmpty区别
    关于异常Microsoft.CSharp.RuntimeBinder.RuntimeBinderException
    php 利用fsockopen GET/POST 提交表单及上传文件
    php发送get、post请求获取内容的几种方法
    修改WampServer的默认端口
    SQL Server2008附加数据库之后显示为只读时解决方法
    Linux一键安装web环境全攻略(阿里云服务器)
    如何从Windows远程上传文件到Linux(例如CentOS 7)
    在CentOS上搭建PHP服务器环境
    linux(系统centos6.5)常用命令总结
  • 原文地址:https://www.cnblogs.com/createyuan/p/4683625.html
Copyright © 2011-2022 走看看