问:什么是星型模型?
答:星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余。
问:什么是雪花模型?
答:当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。
问:星型模型与雪花模型有什么优缺点?
答:
- 数据存储方面:星型架构有数据冗余,反范式化,雪花架构没有数据冗余。
- 雪花模型在ETL操作,加载数据集市的数据是会比较复杂,因为维度表之间还存在关联模型,星型就相对简单很多。
- 雪花模型在维度表、事实表之间的连接很多,因此性能方面会比较低,而星型模型的性能就会比较高。
- 雪花模型更加适合维度分析的场景,星型模型更加适合指标分析的场景。
感悟:
雪花模型在应用系统的表设计(关系型数据库)中涉及的会比较多,分析系统偏向于(大数据系统的数据库hadoop)星型模型
雪花模型的耦合度比较高