zoukankan      html  css  js  c++  java
  • 学习在7天内创建MSBI (Microsoft Business Intelligence)项目

    , 你好读者。“学习MVC项目成功后的7天”,我再次与一个新概念——学习MSBI项目在7天内。这将是一个详细的一步一步系列涵盖几乎所有需要MSBI开发者。 学习和发展你的更深入的知识完全一步一步MSBI教程在http://www.learnmsbitutorials.net/上 在第一天我们将会看到什么? 第一天将一个介绍性的会话。那些已经有了好主意MSBI,对他们来说这是一个放松的时间。他们可以去玩一些游戏,足球也可以看电影和抓住我们第二天或真正的学习者可以修改他们的概念,只是继续又是章; 这是第一天的主题。 在第一天我们将会看到什么? BI是什么? 什么是数据仓库? ETL是什么? MSBI是什么? 我们需要开始的呢? 创建解决方案 实验室1 -创建SSIS项目和起步 结论 特别注意: 如果你正在寻找一个课程将谈论个人选项或任务MSBI世界然后你在错误的地方。在这里我们会为一个完整的项目和讨论的大部分概念MSBI从项目的观点。 BI是什么? BI或者商业智能是有利可图的,有价值的和逻辑的决定。 BI是一个过程,数据将被转换成信息。信息是知识作出正确的决定。 如果你环顾四周,你会看到一个巨大的企业家,商人运行一个特定的公司,在一个很大的问题称为“决策”。很多人不能正确做出决策。 当我们说决定,这并不意味着决定像敲定旅游目的地。家庭旅游是否应该☻计划在迪拜和新加坡 这决定意味着,决策相关的业务。例如,我们是否应该雇佣更多的销售人员,我们应该生产更多的牛仔裤或长裤,最好的位置是什么新分支等。 这样的困惑的原因是什么? 他们做生意意味着肯定不傻。 然后呢?我们可以考虑缺乏数据的原因吗?现在一天的大部分业务维护所有相关的业务数据在一些格式。所以考虑缺乏数据的原因不会是正确的。 真正的原因是缺乏信息。 信息和数据是两个不同的东西。当我说数据有如下的例子。 Customer1带来了65000年印度Product1 rs. customer2带来Product2在美国为888美元。 这些数据可能存储在数据库表格格式在Sql Server或MySql数据库可能存储在逗号分隔formatinside文本文件。这将是一个纯技术的东西。决策者不会去考虑这些单独的数据源,然后作出决定。几乎不可能。 决策者在决策时将相当感兴趣的东西。 大部分销售什么产品?哪个国家最适合某一特定类型的产品? 这是信息/知识。使用这些信息在公司或企业决策者可以做出有价值的和有利可图的决策。 你不觉得,这个信息被获取的数据?是的。将数据转换成信息的过程称为商业智能。 商业智能是 收集所有必要的数据,显示这些数据的方式,自动决策者得到回答的所有问题。 一点值得记住 我们明白一个事实,决定将基于信息和知识但有一件事值得注意到是,信息总是依赖于“数量”。 的例子, 哪个国家更适合哪个产品?→这里SalesAmount这个数字。总销售额为每个产品在每个国家会告诉我们是否该产品是否对那个国家更好。 如果你不理解这一点,就进一步系列。最后你会明白我的意思。 什么是数据仓库? 门外汉而言DW或数据仓库是一个仓库的数据。所有的数据将被保存的地方。 实施商业智能时,最大的一个问题是分散的数据。 实时的,有可能一个公司或业务保持数据通过一个以上的系统。让我们takean组织称为ABC公司的例子。在Sql Server数据库维护员工的相关信息,客户信息在Excel中,销售和采购信息是Oracle数据库。现在信息/知识生成涉及到三个步骤。 收集数据从所有这些子系统。应用一些计算所有这些数据——从每个数据源中检索数据,将分析信息和可能呆在一起。终于在一个易于理解的格式显示它们。 更多的数据是分散的更复杂的数据检索bec和更多的时间将生成的地步信息/知识。 为了解决这个问题,行业标识解决方案称为数据仓库。这将是像Oracle这样的一个简单的数据库,Sql或任何其他。 所有数据保持在不同的子系统在不同的格式将检索和转换成一个共同的格式和存储数据仓库。它成为了商业智能程序的第一步。数据存储在数据仓库变成了创造的信息来源。而不是分析每个数据源中的数据,只是将数据仓库数据分析。 ETL是什么? ETL代表提取、转换和加载。 到目前为止,我们已经明白以下事情。 信息将使用哪个业务产生的数据做出决定的人。实时场景数据分散在多个系统在不同的格式。所有这些数据将被扔进数据仓库最终成为创作的来源信息。 数据加载到数据仓库 ETL数据加载到数据仓库是一个过程 在初始阶段的商业智能数据仓库将designedbased业务需求。我经常与学生分享一句话在我公司培训。“生活是很容易的,数据仓库的目的是正确”。 但我们必须意识到真实世界的现实。“主要是它永远不会被裁决为正确”。 在本课程中,我们不仅能了解数据仓库设计的正确方法,但我们也将学习如何处理糟糕的设计。 一旦DW设计,数据加载到它通过ETL过程。 ETL过程可以解释如下 从数据源提取读数据变换,将数据转换为数据仓库是期待的一种格式。例子——数据源可能包含DateOfBirth但数据仓库预计年龄。转换DateOfBirth年龄称为转换。这不是一个强制性的一步。在一些情况下可能这些数据已经在所需的格式。在这种情况下将跳过此步骤。负载,最后将被倾倒到数据仓库的数据。 MSBI是什么? MSBI是微软商业智能的缩写。这是微软套件包括各种工具实现商业智能解决方案。 使用MSBI王我们将得到一个机会来创建三个项目。 SSIS——这将帮助我们执行ETL操作或简单的词语。它将用于填充数据仓库。介绍,让我们创建数据仓库的多维数据集。我们将详细讨论立方体进一步行动。现在,把多维数据集等一个存储空间数据仓库这里数据将存储在更多性能高效的方式。数据检索将快于正常数据仓库的这里。SSRS——让我们创建报告,以漂亮的图形方式显示数据的帮助下各种图表、图片等。SSRS的报告是最终用户最终的信息来源。通过调查终端用户将做出决定。 我们需要开始的呢? 首先我们需要Sql Server 2014企业版。您可以从http://www.microsoft.com/en下载试用版本为学习目的- us/evalcenter/evaluate - sql - server - 2014。 确保检查分析、报告和集成服务的安装。 安装完成后你会发现“Sql Server数据工具,用于Visual studio 2013”在Sql Server在开始菜单文件夹。 如果你对MSBI很新,那么我们建议通过本文这表明详细的一步一步安装SQL Server和SQL Server数据的工具。 创建解决方案 现在我们将创建一个项目,使用相同的一整个系列。作为一个开始,让我们创建一个空白的解决方案。 对于那些新单词“解决方案” 在visual studio的世界我们创建项目。每个项目将某一特定类型的。项目的项目决定什么类型的能力。项目类型的例子是“控制台应用程序”、“Windows窗体应用程序”等。在我们的例子中,我们将创建三种项目, 集成服务项目- ssis服务多维分析和数据挖掘项目介绍服务项目——SSRS的报告 项目是在逻辑上分为解决方案。一个解决方案可能有超过一个项目的不同的类型。如下步骤创建一个空白的解决方案。 步骤1 - Open Sql服务器数据的工具 Open Sql服务器数据工具从上面指定的位置。 第二步,创建新的解决方案 点击文件在祝辞新在祝辞项目。“新项目”对话框将打开。 选择“Visual Studio解决方案”在“其他项目类型”集团在左边部分。 从右边选择“空白的解决方案”。 名字的解决方案为“SalesBI”并单击Ok。 实验室1 -创建SSIS项目和起步 让我们理解项目的第一要求。的目标,这演示是理解SSIS项目基础。 我们有Customer.txt文件如下。(确保你创建一个并将其保存为演示目的。) 注:SalesDate“dd / mm / yyyy”格式。 第一个要求是,从上面数据文本文件加载到TblCustomer SalesDW数据库Sql server management studio。(创建数据库和表在你的机器用于演示目的) 只是提醒你,我要谈论的正确方法的数据仓库设计在一个即将到来的章。在初始阶段,我们会试图让MSBI的感觉。 第1步—创建SSIS项目。 ,右键点击解决方案并选择Add>的在新项目。 它将启动“添加新项目”对话框。选择“商业智能”从左部分,从右侧“集成服务项目”。项目名称为“SalesETL”并单击Ok。 只是为了修订——ssi或集成服务项目将主要用于执行ETL操作。 第2步—创建新包 右键单击新创建的项目并选择Add>在新项。它将启动“添加新项”对话框。选择“新SSIS包”。名字是CustomerETL并单击Add。 世界上SSIS包是一个可执行文件。Visual studio提供一个称为SSIS的UI界面设计师的设计方案。内部包是一个XML文件将被叫做“dtsexec”的特殊效用。该实用程序将安装MSBI安装的一部分。我们很快就会了解它的细节。包将会有一个扩展名为DTSX代表“可执行数据转换服务”。在早期版本的sql server执行ETL我们有一个称为“数据转换服务”的特性。DTSX命名它。 步骤3 -设计控制流 在解决方案资源管理器中双击创建的新包。 正如你所看到的在SSIS设计师,我们有几个选项卡——控制流、数据流、参数、事件处理程序,Package Explorer。我们将考虑每一个选项卡。 现在我们感兴趣的是控制流选项卡。 这个选项卡将让我们决定需要做什么。你会注意到我们已经SSIS工具箱在左边。如果不是在你的演示,那么你可以把它从View>在其他Windows>在SSIS工具箱。 工具箱包含任务和数据流任务,执行Sql任务等。每个任务让我们取得了一些不同的行为。的例子, 发送邮件的任务——这将被用来发送电子邮件使用SSIS包执行SQL任务——让我们的结果集上执行SQL查询和解决脚本任务——让我们执行自定义c#代码 现在我们的需求要求我们从一个文本文件加载数据到sql server数据库,为此,我们需要“数据流任务”。简单地把任务从SSIS工具箱SSIS设计师。 右键单击新创建的“数据流任务”并选择rename。名字是“CsvCustomer TblCustomer”。 步骤3 -添加DestinationConnection经理 除了所有这些标签,SSIS设计师还提供了一个叫做连接管理部分。这是位于底部角落的设计师。 只需右键单击区域并选择“新Ado。网络连接…” 单击New 输入服务器名称,输入凭证,并选择数据库并单击OK。 再次单击Ok。 重命名SalesDWConnection连接管理器。 步骤4 -添加SourceConnection经理 现在是时候来添加源连接管理器。 右击连接管理器区域但这次选择“新的平面文件连接…” 它将推出“平面文件连接管理器编辑器”。 把名字放在“CustomerCSVConnection”和客户选择源文件。 在对话框的左侧两部分定义如通用,列和先进等。 选择列部分。不需要更改任何设置。只需单击Ok。 步骤5 -配置数据流任务 之后,双击数据流任务。它会带你到数据流选项卡。 步骤6的东西—源 数据流选项卡是一个会决定ETL。在这里我们将定义,数据流的地方,如果有任何需要转换。 当你移动到数据流选项卡,您将注意到的改变SSIS工具箱。 正如你所看到的,任务的工具箱是隔离分成三组,来源,变换和目的地。“共同”是一个特殊的组,包含主要用于来源,转换和目的地。 我们感兴趣的是“平面文件源”。你会发现在“其他来源”一节。简单地将其拖至SSIS设计师和将它重命名为“CustomerCsv” 步骤7 -配置源 双击CustomerCsv来源。它将推出“平面文件源代码编辑器”。从下拉选择“CustomerCSVConnection”。 搬到列部分,如果需要,进行任何更改,然后单击ok。 步骤8 -添加目的地 拖Ado。净目的地从“其他目的地”部分SSIS设计师和将它重命名为“TblCustomer”。 步骤9 -配置的目的地 双击“TblCustomer”目的地。这次不是显示配置编辑器窗口,而是显示以下错误消息。 单击No。 目标任务不能配置,除非或直到它有适当的输入。 现在单击“CustomerCsv”源。你会注意到有两个箭头从里面出来。蓝色的和红色的。我们稍后会讨论红色的。蓝色的是数据流。因此这个箭头被称为“数据流路径”。把这个箭头连接到“TblCustomer”目的地。 步骤10-配置目的地(续) 再次双击“TblCustomer”目的地。在“配置编辑器窗口”中,选择连接管理器到“SalesDWConnection”,选择表到“TblCustomer”。 点击“Mappings”部分并确认所有的映射都是正确的。 单击ok。 步骤11-执行并测试包 正如我以前说过的,包将由一个称为“DtsExec.exe”的特殊实用程序执行。Visual studio在开发时使我们的生活变得轻松。测试只是按F5☻一切将由Visual studio和包开始执行。 红色标记表示执行失败。 步骤11-理解错误 转到progress选项卡,向下滚动,找到左边有“Red Cross”图标的第一个语句。不幸的是,在这个屏幕上无法读取完整的错误。因此,只需右键点击它说“复制消息文本”。 粘贴它在一些文本文件。错误如下。 " [TblCustomer[27]]错误:在数据插入期间发生异常,提供程序返回的消息为:数据源中给定的类型字符串不能转换为指定目标列的类型datetime。" 步骤12-添加数据转换转换 错误是很常见的,我们有DateTime列在数据库和文本文件所有列将默认为字符串类型。 为了解决这个问题,我们将使用一种称为“数据转换”的特殊转换。 首先在工具箱中按下stop按钮停止执行。 现在将“数据转换”转换从工具箱拖到设计器窗口。右击连接源和目标的“数据流路径”,并说删除。最后将来自源的“数据流路径”连接到“数据转换”转换。 步骤13-配置数据转换 双击数据转换转换并依次执行以下步骤。 检查可用栏中的销售日期。它将在下面的网格中添加一个新条目,将别名更改为salesdate_datetime,选择数据类型为“Database_timestamp” 单击Ok。 步骤14 -重新配置目标 连接来自“数据转换”转换的“数据流路径”到“TblCustomer”目的地,双击。 将目标中的SalesDate映射更改为可用列中的SalesDate_DateTime。 步骤15 -执行和测试 按F5重新执行包。这个时间包将完成它的执行。 打开数据库表并检查记录。 一切看起来都是正确的,但实际上有些地方是错的。在源数据中,第三行和第四行中SalesDate分别为“12/1/2013”(2013年1月12日)和“15/06/2015”(2015年6月15日),而目的地第三行和第四行中SalesDate分别为“2013年12月1日”和“2015年6月15日”。 让我们来了解一下到底发生了什么。 “数据转换”转换假设日期为“mm/dd/yyyy”格式,因此相应更新前三条记录。上一个源记录的销售日期是“2015年6月15日”,如果考虑“年月日”,则不是合适的日期。因此,“DataConversion”转换假设为“dd/mm/yyyy”格式,并相应地更新目的地。 这是逻辑错误。为了使它正确,我们必须确保,当DateTime值作为字符串出现时,它应该是正确的“mm/dd/yyyy”格式。 步骤16 -添加“派生列”转换 首先手动截断目标中的TblCustomer表。 停止执行并删除“CustmerCsv”源和“数据转换”转换之间的连接。 添加从工具箱到设计器窗口的“派生列”转换。 将“CustomerCsv”源连接到“派生列”转换。 步骤17 -配置“派生列”转换。 双击转换。 使用下面的表达式创建一个名为SalesDate_MMDDYYY的新派生列。 SUBSTRING (SalesDate中(SalesDate, " / ", 1) + 1,中(SalesDate, " / ", 2),中(SalesDate, " / ", 1) - 1) + " +子串(SalesDate 1中(SalesDate, " / ", 1) - 1) + " +子串(SalesDate,中(SalesDate, " / ", 2) + 1, LEN (SalesDate)中(SalesDate, " / ", 2)) 上述表达式只是将“年月日”格式的当前销售日期转换为“年月日”格式的新销售日期。 步骤18 -重新配置“数据转换”转换 通过“数据流路径”将“派生列”转换连接到“数据转换”转换。 双击“数据转换”转换和之前一样,创建一个转换列称为SalesDate_DateTime SalesDate_MMDDYY列。 步骤19 -重新配置的目的地。 “数据转换”转换连接到目的地。双击目标。地图SalesDate列在目的地SalesDate_DateTime列输入列。 一步20 -执行和测试 最后一次重新执行的方案。确保截断表之前执行。 , 最后实现。☻☻ 结论 希望你喜欢阅读第一天。请继续关注第二天。有很多学习和挑战。 更多的像这样的东西请点击这里。订阅或跟随在twitter @SukeshMarla文章更新 你也可以参考以下1小时MSBI youtube视频:——学习MSBI 4天。 点击这里更多MSBI一步一步的教程。 本文转载于:http://www.diyabc.com/frontweb/news2125.html

  • 相关阅读:
    noip2011 总结
    noip2010 总结
    noip2009 总结
    noip2008 总结
    noip2006总结
    noip2007 总结
    noip2006 总结
    【模板】线段树模板
    【数学】8.30题解-count数页码
    【数论】8.30题解-prime素数密度 洛谷p1835
  • 原文地址:https://www.cnblogs.com/Dincat/p/13457154.html
Copyright © 2011-2022 走看看