zoukankan      html  css  js  c++  java
  • 粒度 分割

    1、粒度
    粒度是数据仓库的重要概念。粒度可以分为两种形式,第一种粒度是对数据仓库中的数
    据的汇总程度高低的一个度量,它既影响数据仓库中的数据量的多少,也影响数据仓库所能
    回答询问信息的种类。在数据仓库中,多维粒度是必不可少的。由于数据仓库的主要作用是
    多维分析,因而绝大多数查询都基于一定程度的汇总数据之上的,只有极少数查询涉及到细
    节。
    还有一种粒度形式,即样本数据库。它根据给定的采样率从细节数据库中抽取出一个子
    集。这样样本数据库中的粒度就不是根据汇总程度的不同来划分的,而是有采样率的高低来
    划分,采样粒度不同的样本数据库可以具有相同的数据汇总程度。
    2、分割
    分割是数据仓库中的数据存储中的另外一个重要概念,它的目的在于提高效率。它是将数
    据分散到各自的物理单元中去, 以便能分别独立处理,以实现查询操作的并行。有许多数据
    分割的标准可供参考:如时间、地域、业务领域等等,也可以是其组合。一般而言,分割标准总
    应包括一些能让它十分自然而且分割均匀的项目,例如时间项。
  • 相关阅读:
    VS批处理命令使用
    python实现域账号登陆
    Sql Server 优化技巧
    Windows 2012 R2 安装net4.6.1
    Resharper报“Possible multiple enumeration of IEnumerable”
    京东模拟点击
    使用常规方法爬取猫眼电影
    关于断点调试
    看网络开发实战书笔记
    scrapy的request的meta参数是什么意思?
  • 原文地址:https://www.cnblogs.com/honkcal/p/2107138.html
Copyright © 2011-2022 走看看