前两篇《自助式微软BI工具PowerPivot简介!》,《自助式微软BI工具PowerPivot使用介绍!》已对PowerPivot工具作了一些使用介绍,今天开始具体来介绍一下如何利用PowerPivot工具进行自助式的BI。本文以SQL Server 2008 R2 PowerPivot为例,介绍一下如何从SQL Server数据源中获取数据及如何在Excel中进行展现和交互,后续将介绍一些高级应用及技巧,敬请关注本博客的更新。
本文及后续源数据库以微软提供的AdventureWorksDW2008为例进行介绍,该数据库的下载网址为:http://msftdbprodsamples.codeplex.com/,具体数据库如下图:
以此数据库的三张维表:DimEmployee、DimSalesTerritory、DimGeography为例进行介绍,PowerPivot安装成功后将在Excel选项卡中将增加PowerPivot选项,如下图:
点击PowerPivot窗口进行获取和设置数据源,如下图:
在表导入向导中选择关系数据库Microsoft SQL Server,并设置相关数据库连接参数,如下图:
选择此数据库的DimEmployee、DimSalesTerritory、DimGeography导入到PowerPivot中,PowerPivot可以直接获取数据库的表和视图,对于高级用户也可以自定义SQL查询语句进行获取数据,如下图:
可以根据需要进行设置表的友好名称(如可以把英文改成中文,即数据库表的别名),还可以进行表数据筛选(即进行数据过滤),如下图:
为了方便演示,本文不做任何特殊处理,全部导入此三张表的数据,如下图:
数据导入成功后就可以创建数据透视表或数据透视图在EXCEL中进行展现,注意一旦数据导入成功后,只要不进行重新导入数据或进行数据刷新,已跟源数据库已没有任何关系了,即PowerPivot相当于一个离线的数据库。在PowerPivot For Excel的数据透视表中可以创建相应的报表,如下图:
如创建图和表(水平)的,如下图:
在EXCEL进行展现,数据来源于PowerPivot,如下图:
一个简单的PowerPivot报表已完成了,实际报表可以做的很漂亮和专业,可以充分利用EXCEL自带的功能,只要记住两点就可以理解整个架构的核心:第一点可以理解为PowerPivot是Excel的后台数据库(主要是为了解决海量数据存储问题,EXCEL一个SHEET的最高行数只能存储100万行左右,而PowerPivot可以存储上千万甚至是上亿的数据行),第二点作为分析一般使用的并非明细数据,而是聚合的、汇总的数据,因此可以充分利用Excel的透视表和透视图及报表筛选、切片、钻取的分析功能。