zoukankan      html  css  js  c++  java
  • 数据挖掘概念与技术15--为快速高维OLAP预计算壳片段

    1. 论数据立方体预计算的多种策略的优弊

      (1)计算完全立方体:需要耗费大量的存储空间和不切实际的计算时间。

      (2)计算冰山立方体:优于计算完全立方体,但在某种情况下,依然需要大量的存储空间和计算时间。

         因为冰山立方体的确定在于最小支持度的确定,所以例如:如果基本立方体单元(a1,.....a60)则,他将至少产生2的60次方个冰山立方体单元;另外最小支持度这个值是难于确定的,小的话将导致巨大的立方体,大的话可能无法用于许多有意义的运用。在实际运用的过程中,应用数据随时间的变化不断增加,之前剪枝的,可能在之后有出现,然而度量确实每次都重新开始计算的。

      (3)计算一个很薄的立方体外壳。大师如果仅仅固定外壳的厚度则,这种立方体不具备高维OLAP,例如:只计算维数小于等于3的数据立方体,那么在计算时候可能只能对该3个维进行运算,而不能进行下钻等。

      所以,对于该情况,取代计算完全外壳的策略,而只计算它的一部分或片段,然后沿该部分维进行高维空间OLAP。即或者首先找到某些感兴趣的方体,然后按照它的一两个维进行下钻,考虑多个维上   

  • 相关阅读:
    python 多个变量赋值
    python标准数据类型
    Python 变量类型
    H3C 扩展ACL与基于时间的ACL
    H3C BGP-filter-policy
    H3C 标准ACL
    H3C BGP实验集合
    H3C IS-IS实验大集合(ipv6)
    H3C ISIS实验大集合(IPv4)
    JS 封装一个显示时间的函数
  • 原文地址:https://www.cnblogs.com/zjh225901/p/6124406.html
Copyright © 2011-2022 走看看