zoukankan      html  css  js  c++  java
  • 利用BI进行报表分析(一)--利用ETL进行数据转换

          本人也是初学BI的菜鸟一枚,如有写的不对的地方,希望大家指出。报表分析,当然数据抽取最重要。如何完成报表分析全过程,接下来我把我的经验分享一下,以我做的一个例子为例:

         首先说明一下我们用到的工具:SSIS、SSAS、SSRS。在SSIS这个项目中,我们进行ETL(数据抽取、加载、转换)操作,要做好这一步我们就需要知道用到数据源业务表,然后提炼出维度,建立好事实表(fact table)、维度表(dimension table),最后利用ETL进行数据转换。SSAS进行多维数据集cube的建立为报表分析项目提供数据源。SSRS建立报表,开始分析。

         首先,我们新建立一个Integration Services项目。接着打开项目中SSIS包中Package.dtsx包或我们自己新建一个SSIS包,(假设我们是自己新建的包),然后拖放一个数据流任务到控制流面板,如下图:图1

    双击数据流任务进入数据流面板下图:

    图2

    双击ADO.NET源进行数据源编辑,选择数据源连接、抽取数据源(这个数据源可以是数据表、视图或者SQL命令),如下图:

    图3

    然后双击ADO NET Destination进入ADO.NET目标编辑器进行目标数据连接、目标与源之间字段的映射、字段类型转换编辑选择(维度时间是我的一张维度表,数据转换要先进行维度转换--即把业务表就诊时间转换到维度表,然后才可以进行事实表的数据转换),如下图:

    图4.1

    图4.2

    如果数据源字段类型与对应目标字段类型不一样可以进行类型转换,如下图5:

    图5

    最后一步右键SSIS包选择执行包完成数据转换。如果数据抽取源、数据转换、目标这三块都是绿色,那么恭喜你,这一步的数据转换成功了。

    至此ETL过程就全部完成。

    今天菜鸟就先到这里,明天继续为大家奉上后续的SSAS和SSRS的使用经验以及心得。

  • 相关阅读:
    python系列十二:python3模块
    python系列十一:python3数据结构
    python系列十:python3函数
    python系列九:python3迭代器和生成器
    python系列八:Python3条件控制&循环语句
    python系列七:Python3字典dict
    python系列六:Python3元组tuple
    Linux Ubuntu 安装SSH服务
    Linux Ubuntu 查看IP
    Linux 基础命令
  • 原文地址:https://www.cnblogs.com/zhenghuishuang/p/3522736.html
Copyright © 2011-2022 走看看