zoukankan      html  css  js  c++  java
  • 数据产品-OLAP

    OLAP和BI是日常工作中比较熟悉的了,也是经常会接触到的,这里总结下。

    这里先说一个概念:数据立方体

    我们分析一堆数据报告时候通常这些数据报告采用二维表示,是行与列组成的二维表格。但在我们分析数据的角度很可能有多个,数据立方体可以理解为就是维度扩展后的二维表格。但更多时候数据立方体是多维的,如下图数据立方体:

    数据立方体中常规的五大操作:切片,切块,旋转,上卷,下钻

    1. 切片和切块(Slice and Dice)

    在数据立方体的某一维度上选定一个维成员的操作叫切片,而对两个或多个维执行选择则叫做切块。

    切片:我选择了2011 2012 2013年份 北京 上海 广州地区的鞋子销量

    切块:我选择了2011 2012 2013年份 北京 上海 广州地区的鞋子和裤子销量

     2. 旋转(Pivot)

    旋转就是指改变报表或页面的展示方向。对于使用者来说,就是个视图操作。拿上图举例就是把X轴和Z轴替换一下。

     3. 上卷和下钻

    上卷可以理解为"无视"某些维度;下钻则是指将某些维度进行细分。

    上卷:我把Y轴地区上卷为国家,那么我要看2011 2012 2013年份 中国的鞋子销量

    下钻:我把X轴的年份下钻为月份,那么11 12  13月份 北京 上海 广州地区的鞋子销量

    不同的OLAP工具也会提供自有的OLAP查询功能,如钻过,钻透等,通常一个复杂的OLAP查询是多个这类OLAP操作叠加的结果。

    OLAP的架构模式:

    1. MOLAP :

     MOLAP架构会生成一个新的多维数据集,也可以说是构建了一个实际数据立方体

    2. ROLAP :

    ROLAP架构并不会生成实际的多维数据集,而是使用星形模式以及多个关系表对数据立方体进行模拟。

    3. HOLAP

    这种架构综合参考MOLAP和ROLAP而采用一种混合解决方案,将某些需要特别提速的查询放到MOLAP引擎,其他查询则调用ROLAP引擎。

    ====================================================================================分割

     数据仓库建设好以后,用户就可以编写SQL语句对其进行访问并对其中数据进行分析。但每次查询都要编写SQL语句的话,未免太麻烦,而且对维度建模数据进行分析的SQL代码套路比较固定。于是,便有了OLAP工具,它专用于维度建模数据的分析。而BI工具则是能够将OLAP的结果以图表的方式展现出来,它和OLAP通常出现在一起。

    度建模数据仓库中,OLAP/BI工具和数据仓库的关系是这样的:

    通常在维度建模数据仓库中,OLAP从数据仓库中直接取数进行分析

  • 相关阅读:
    如何使用Python创建可视化对象
    Power Query中如何解析累积总计
    如何快速复制度量值?
    如何使用文本字段进行条件格式设置
    Power BI 3-4月功能更新培训合集
    2019微软Power BI 每月功能更新系列——Power BI 4月版本功能完整解读
    送你一份堆积柱形图小点心,请收下~
    命令行编译带外部包依赖的java源文件 [以JDBC MySQL8为例]
    JavaScript (JS)常用方法
    JDK8过渡到JDK11
  • 原文地址:https://www.cnblogs.com/codewan/p/10945185.html
Copyright © 2011-2022 走看看