1.Cube:Cube是数据仓库中存放数据的地方,也称为多维数据集或度量值measures.
2.hierarchy:定义了hierarchy,我们就可以方便的进行钻取操作(drill)。钻取操作其实就是按照不同的hierarchy对数据进行分析。
例如现有的报表按照市级地区对全国的订单进行汇总分析,那么按照省级地区进行分析就称为向上钻取(roll up),按照县级地区分析就称为向下钻取(drill down)。
3.设计数据仓库的模型:常见的模型为星型模型和雪花模型
星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余(尤其是当维度中有关联关系的时候)
雪花模型是对星型模型的扩展,有一个或多个维度表没有直接连接到事实表上,而是通过其他维度表连接到事实表上。优点是:通过最大限度地减少数据存储量以及联合较小的维表来改善查询性能
星型模型由于数据的冗余所以很多统计查询不需要做外部的连接,因此一般情况下效率比雪花模型要高
4.由于数据仓库的本质是,在数据进入仓库时就按照设计的cube和维度将对应的值都计算好并存放在硬盘上,因此,数据进入数据仓库是一个很慢的过程,因为有大量的计算。一旦数据进入数据仓库,得到报表是非常快的,因为数据已经计算好了