版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据仓库与数据挖掘实验指导 By TMS J目录第 1 课:创建SQL server2005的DT项目和基本包31.1创建新的 Integration Services 项目51.2 添加和配置平面文件连接管理器61.3添加和配置 OLE DB 连接管理器81.4在包中添加数据流任务81.5添加并配置平面文件源91.6添加并配置查找转换91.7添加和配置 OLE DB 目标101.8测试 Lesson 1 教程包11第 2 课:添加循环1221 创建 Lesson 2 包132.2添加和配置 Foreach 循环容器13一、 添加 Foreach 循环容器13三、将枚举器映射为用户定义的变量1
2、4四、将数据流任务添加到循环中1423修改平面文件连接管理器142.4 测试 Lesson 2 教程包15第 3 课:在 Analysis Services 项目中定义数据源视图及多维数据集16一、创建 Analysis Services 项目16二、定义新的数据源18三、定义数据源视图22四、修改表的默认名称25五、定义多维数据集27五、检查多维数据集和维度属性32六、部署 Analysis Services 项目40第 1 课:创建SQL server2005的DT项目和基本包 在本课中,您将创建一个简单 ETL 包,该包可以从单个平面文件源提取数据,使用两个查找转换组件转换该数据,然后将
3、该数据写入 AdventureWorksDW 中的 FactCurrencyRate 事实数据表。在本课中,您还将学习如何创建新包、添加和配置数据源和目标连接以及使用新的控制流和数据流组件。重要事项: 本教程需要 AdventureWorksDW 示例数据库。有关安装和部署 AdventureWorksDW 的详细信息,请参阅: 了解包要求在创建包之前,需要充分了解在源数据和目标数据中使用的格式。了解了这些数据格式后,便可定义将源数据映射到目标数据所需的转换。查看源对于本教程,源数据是平面文件 SampleCurrencyData.txt 中包含的一组历史货币数据。源数据包括以下四列:平均汇率
4、、货币键、日期键和当天汇率。下面是 SampleCurrencyData.txt 文件中所包含的源数据示例:1. ARS 9/3/2001 0:00 0.1. ARS 9/4/2001 0:00 1.1. ARS 9/5/2001 0:00 0.1. ARS 9/6/2001 0:00 1.1. ARS 9/7/2001 0:00 0.1. ARS 9/8/2001 0:00 1.1. ARS 9/9/2001 0:00 11. ARS 9/10/2001 0:00 1.1. ARS 9/11/2001 0:00 0.1. ARS 9/12/2001 0:00 1. 在使用平面文件源数据时,需
5、要了解平面文件连接管理器如何解释平面文件数据,这一点很重要。如果平面文件源是 Unicode 编码的,则平面文件连接管理将所有列定义为 DT_WSTR,默认列宽为 50。如果平面文件源是 ANSI 编码的,则将列定义为 DT_STR,默认列宽为 50 。您可能必须更改这些默认设置,才能使字符串列类型与所使用的数据更相符。为此,您需要查看将写入数据的目标的数据类型,然后在平面文件连接管理器中选择正确的类型。查看目标源数据的最终目标是 AdventureWorksDW 中的 FactCurrencyRate 事实数据表。FactCurrencyRate 事实数据表有四列,并且与两个维度表有关系,如
6、下表所示。列名称 数据类型 查找表 查找列 AverageRatefloat无无CurrencyKeyint (FK)DimCurrencyCurrencyKey (PK)TimeKeyInt (FK)DimTimeTimeKey (PK)EndOfDayRatefloat无无将源数据映射为与目标兼容对源数据和目标数据的分析指出需要查找 CurrencyKey 和 TimeKey 值。将执行这些查找的转换通过使用 DimCurrency 和 DimTime 维度表中的备用键来获取 CurrencyKey 和 TimeKey 值。平面文件列 表名 列名称 数据类型 0FactCurrencyRa
7、teAverageRateFloat1DimCurrencyCurrencyAlternateKeynchar(3)2DimTimeFullDateAlternateKeyDatetime3FactCurrencyRateEndOfDayRateFloat本课程包含以下任务:创建新的 Integration Services 项目添加和配置平面文件连接管理器添加和配置 OLE DB 连接管理器在包中添加数据流任务添加并配置平面文件源添加并配置查找转换添加和配置 OLE DB 目标使 Lesson 1 包更易理解测试 Lesson 1 教程包1.1 创建新的 Integration Servic
8、es 项目 创建新的 Integration Services 项目2 在“开始”菜单中,依次指向“所有程序”、“Microsoft SQL Server 2005”,再单击 SQL Server Business Intelligence Development Studio。3 在“文件”菜单中,指向“新建”,再单击“项目”,以创建一个新的 Integration Services 项目。4 在“新建项目”对话框的“模板”窗格中,选择“Integration Services 项目”。5 在“名称”框中,将默认名称更改为 SSIS Tutorial。或者,清除“创建解决方案的目录”复选框。
9、 6 接受默认位置,或单击“浏览”,以浏览并找到要使用的文件夹。7 在“项目位置”对话框中,单击文件夹,再单击“打开”。8 单击“确定”。默认情况下,将创建一个名为 Package.dtsx 的空包,并将该包添加到项目中。9 在解决方案资源管理器工具栏中,右键单击 Package.dtsx,再单击“重命名”,将默认包重命名为 Lesson 1.dtsx。10 当系统提示重命名包对象时,单击“是”。设置受区域设置影响的属性1. 在“视图”菜单中,单击“属性窗口”。2. 在“属性”窗口中,将 LocaleID 属性设置为“英语(美国)“。1.2 添加和配置平面文件连接管理器添加一个平面文件连接管理
10、器1. 右键单击“连接管理器”区域中的任意位置,再单击“新建平面文件连接”。2. 在“平面文件连接管理器编辑器”对话框的“连接管理器名称”字段中,键入 Sample Flat File Source Data。3. 单击“浏览”。4. 在“打开”对话框中,浏览并找到示例数据文件夹,再打开 SampleCurrencyData.txt 文件。默认情况下,教程示例数据安装在 c:Program FilesMicrosoft SQL Server90SamplesIntegration ServicesTutorialCreating a Simple ETL PackageSample Data
11、文件夹中(如果没有,请找老师提供)。设置受区域设置影响的属性1. 在“平面文件连接管理器编辑器”对话框中,单击“常规”。2. 将“区域设置”设置为“英语(美国)”,并将“代码页”设置为 1252。重命名平面文件连接管理器中的列1. 在“平面文件连接管理器编辑器”对话框中,单击“高级”。2. 在“属性”窗格中,进行如下更改: 将 Column 0 名称属性更改为 AverageRate。 将 Column 1 名称属性更改为 CurrencyID。 将 Column 2 名称属性更改为 CurrencyDate。 将 Column 3 名称属性更改为 EndOfDayRate。注意: 默认情况下
12、,所有四个列最初都设置为字符串数据类型 DT_STR,其 OutputColumnWidth 为 50。 重新映射列数据类型1. 在“平面文件连接管理器编辑器”对话框中,单击“建议类型”。Integration Services 将根据前 100 行数据自动建议数据类型,但您可以通过更改建议选项来增加和减少取样数据,指定整数数据或布尔数据的默认数据类型,或添加作为填充量添加到字符串列中的空格。 但现在,请不要进行任何更改,单击“取消”返回“平面文件连接管理器编辑器”对话框的“高级”窗格,查看建议的列数据类型。如果单击“确定”,则针对列元数据给出建议。在本教程中,Integration Serv
13、ices 为 SampleCurrencyData.txt 文件中的数据建议了下表第二列中显示的数据类型。但是,目标中的列要求的数据类型(将在以后的步骤中定义)显示在下表的最后一列。平面文件列 建议的类型 目标列 目标类型 AverageRateFloat DT_R4FactCurrencyRate.AverageRateFloatCurrencyIDString DT_STRDimCurrency,CurrencyAlternateKeynchar(3)CurrencyDateDate DT_DATEDimTime.FullDateAlternateKeydatetimeEndOfDayRa
14、teFloat DT_R4FactCurrencyRate.EndOfDayRateFloat为 CurrencyID 和 CurrencyDate 列建议的数据类型与目标表中的字段的数据类型不相容。由于 DimCurrency.CurrencyAlternateKey 的数据类型为 nchar (3),CurrencyID 需要从字符串类型 DT_STR 更改为字符串类型 DT_WSTR。另外,字段 DimTime.FullDateAlternateKey 被定义为 DataTime 数据类型,因此 CurrencyDate 需要从日期类型 DT_Date 更改为数据库时间戳类型 DT_DB
15、TIMESTAMP。2. 在“属性”窗格中,将列 CurrencyID 的数据类型从字符串类型 DT_STR 更改为 Unicode 字符串类型 DT_WSTR。3. 在“属性”窗格中,将列 CurrencyDate 的数据类型从日期类型 DT_DATE 更改为数据库时间戳类型 DT_DBTIMESTAMP。4. 单击“确定”。1.3添加和配置 OLE DB 连接管理器1. 右键单击连接管理器区域中的任意位置,再单击“新建 OLE DB 连接”。2. 在“配置 OLE DB 连接管理器”对话框中,单击“新建”。3. 在“服务器名称”中,输入 localhost(注意:如果此步不成功,请联系老师
16、,要求新的数据库地址,你们的客户机可能没有安装此服务器)。将 localhost 指定为服务器名称时,连接管理器将连接到本地计算机上 Microsoft SQL Server 2005 的默认实例。若要使用 SQL Server 2005 的远程实例,请将 localhost 替换为要连接到的服务器的名称。4. 在“登录到服务器”组中,确认选择了“使用 Windows 身份验证”。5. 在“连接到数据库”组的“选择或输入数据库名称”框中,键入或选择 AdventureWorksDW。6. 单击“测试连接”,验证指定的连接设置是否有效。7. 单击“确定”。8. 单击“确定”。9. 在“配置 OL
17、E DB 连接管理器”对话框的“数据连接”窗格中,确认选择了 localhost.AdventureWorksDW。10. 单击“确定”。1.4在包中添加数据流任务1. 单击“控制流”选项卡。2. 在“工具箱”中,展开“控制流项”,并将一个数据流任务拖到“控制流”选项卡的设计图面上。3. 在“控制流”设计图面中,右键单击新添加的数据流任务,再单击“重命名”,将名称更改为 Extract Sample Currency Data。好的做法是为添加到设计图面的所有组件提供唯一的名称。考虑到易用性和可维护性,名称应说明每个组件执行的功能。按照这些命名指南,Integration Services 包
18、可以进行自我说明。1.5添加并配置平面文件源1. 打开“数据流”设计器,方法是双击 Extract Sample Currency Data 数据流任务或单击“数据流”选项卡。2. 在“工具箱”中,展开“数据流源”,然后将“平面文件源”拖动到“数据流”选项卡的设计图面上。3. 在“数据流”设计图面上,右键单击新添加的“平面文件源”,单击“重命名”,然后将该名称更改为 Extract Sample Currency Data。4. 右键单击此平面文件源,打开“平面文件源编辑器”对话框。5. 在“平面文件连接管理器”框中,键入或选择 Sample Flat File Data。6. 单击“列”并验
19、证列名是否正确。7. 单击“确定”1.6添加并配置查找转换对于本教程,您将向包中添加以下两个查找转换组件并对其进行配置: 一个转换是根据平面文件中匹配的 CurrencyID 列值对 DimCurrency 维度表的 CurrencyKey 列中的值执行查找。 一个转换是根据平面文件中匹配的 CurrencyDate 列值对 DimTime 维度表的 TimeKey 列中的值执行查找。无论在哪种情况下,查找转换都将使用前面创建的 OLE DB 连接管理器。添加并配置 CurrencyKey 查找转换1. 在“工具箱”中,展开“数据流转换”,然后将“查找”拖动到“数据流”选项卡的设计图面上。2.
20、 单击 Extract Sample Currency Data 平面文件源,并将绿色箭头拖动到新添加的“查找”转换中,以连接这两个组件。3. 在“数据流”设计图面上,右键单击新添加的“查找”转换,单击“重命名”,然后将该名称更改为 Lookup Currency Key。4. 双击 Lookup Currency Key 转换。5. 在“查找转换编辑器”对话框的“OLE DB 连接管理器”框中,确保显示 localhost.AdventureWorksDW。6. 在“使用表或视图”框中,键入或选择 dbo.DimCurrency。7. 单击“列”选项卡。8. 在“可用输入列”面板中,将 Cu
21、rrencyID 拖放到“可用查找列”面板的 CurrencyAlternateKey 上。9. 选择 CurrencyKey。10. 单击“确定”。添加并配置 DateKey 查找转换1. 在“工具箱”中,将“查找”拖动到“数据流”设计图面上。2. 单击 Lookup Currency Key 转换,并将绿色箭头拖动到新添加的“查找”转换中,以连接这两个组件。3. 在“数据流”设计图面上,右键单击新添加的“查找”转换,单击“重命名”,然后将该名称更改为 Lookup Date Key。4. 双击 Lookup Date Key 转换。5. 在“查找转换编辑器”对话框的“OLE DB 连接管理
22、器”框中,确保显示了 localhost.AdventureWorksDW。6. 在“使用表或视图”框中,键入或选择 dbo.DimTime。7. 单击“列”选项卡。8. 在“可用输入列”面板中,将 CurrencyDate 拖放到“可用查找列”面板的 FullDateAlternateKey 上。9. 选择 TimeKey。10. 单击“确定”。1.7添加和配置 OLE DB 目标1. 在“工具箱”中,展开“数据流目标”,并将“OLE DB 目标”拖到“数据流”选项卡的设计图面上。2. 单击“查找日期键”转换,并将绿色箭头拖到新添加的“OLE DB 目标”上,以便将两个组件连接在一起。3.
23、在“数据流”设计图面上,右键单击新添加的“OLE DB 目标”组件,单击“重命名”,然后将名称更改为 Sample OLE DB Destination。4. 双击 Sample OLE DB Destination。5. 在“OLE DB 目标编辑器”对话框中,确保已在“OLE DB 连接管理器”框中选中 localhost.AdventureWorksDW。6. 在“表或视图的名称”框中,键入或选择 dbo.FactCurrencyRate。7. 单击“映射”。8. 确保输入列已正确映射到目标列。9. 单击“确定”。1.8测试 Lesson 1 教程包1. 在“调试”菜单上,单击“启动调试
24、”。包将开始运行,结果有 1097 个行被成功添加到 AdventureWorksDW 中的 FactCurrency 事实数据表中。2. 当包运行完毕后,在“调试”菜单上,单击“停止调试”。第 2 课:添加循环 在第 1 课:创建简单 ETL 包中,创建了从单个平面文件源提取数据的包,然后使用查找转换功能对数据进行了转换,最后将数据加载到 AdventureWorksDW 示例数据库的 FactCurrency 事实数据表中。但是,提取、转换和加载 (ETL) 过程很少使用单个平面文件。典型的 ETL 过程从多个平面文件源提取数据。从多个源提取数据需要采用迭代控制流。Microsoft SQ
25、L Server 2005 Integration Services (SSIS) 的一项最有可能出现的功能是您将很容易向包中添加迭代或循环。Integration Services 为循环遍历包提供了两种容器类型:Foreach 循环容器和 For 循环容器。Foreach 循环容器使用枚举器执行循环,而 For 循环则通常使用变量表达式。本课使用 Foreach 循环容器。Foreach 循环容器使包能够对指定枚举器的每个成员重复执行控制流。使用 Foreach 循环容器,可以枚举: ADO 记录集行和架构信息 文件和目录结构 系统、包和用户变量 SQL 管理对象 (SMO)在本课中,您将
26、修改在第 1 课中创建的简单 ETL 包,以便利用 Foreach 循环容器。还将设置用户定义的包变量,以便使该教程包能够迭代遍历文件夹中的所有平面文件。课程任务本课程包含以下任务: 复制 Lesson 1 包 添加和配置 Foreach 循环容器 修改平面文件连接管理器 测试 Lesson 2 教程包21 创建 Lesson 2 包1. 如果 Business Intelligence Development Studio 尚未打开,请单击“开始”,指向“所有程序”,指向 Microsoft SQL Server 2005,再单击 Business Intelligence Developm
27、ent Studio。2. 在“文件”菜单上,依次单击“打开”、“项目/解决方案”、SSIS Tutorial 文件夹,然后再次单击“打开”,最后双击 SSIS Tutorial.sln。 3. 在解决方案资源管理器中,右键单击 Lesson 1.dtsx,再单击“复制”。4. 在解决方案资源管理器中,右键单击“SSIS 包”,再单击“粘贴”。默认情况下,复制的包将命名为 Lesson 2.dtsx。5. 在解决方案资源管理器中,双击 Lesson 2.dtsx 打开该包2.2添加和配置 Foreach 循环容器一、 添加 Foreach 循环容器1. 在 Business Intellige
28、nce Development Studio 中,单击“控制流”选项卡。2. 在“工具箱”中,展开“控制流项”,然后将“Foreach 循环容器”拖到“控制流”选项卡的设计图面上。3. 右键单击新添加的“Foreach 循环容器”,并选择“编辑”。4. 在“Foreach 循环编辑器”对话框的“常规”页上,为“名称”输入 Foreach File in Folder。1. 在 Business Intelligence Development Studio 中,单击“控制流”选项卡。2. 在“工具箱”中,展开“控制流项”,然后将“Foreach 循环容器”拖到“控制流”选项卡的设计图面上。3.
29、 右键单击新添加的“Foreach 循环容器”,并选择“编辑”。4. 在“Foreach 循环编辑器”对话框的“常规”页上,为“名称”输入 Foreach File in Folder。二、为 Foreach 循环容器配置枚举器1. 单击“集合”。2. 在“集合”页上,选择“Foreach 文件枚举器”。3. 在“枚举器配置”组中,单击“浏览”。4. 在“浏览文件夹”对话框中,找到包含教程示例数据的示例数据文件夹。默认情况下,教程示例数据安装在 c:Program FilesMicrosoft SQL Server90SamplesIntegration ServicesTutorialCre
30、ating a Simple ETL PackageSample Data 文件夹中(如果找不到,请联系联系老师)。5. 在“文件”框中,键入 Currency_*.txt。三、将枚举器映射为用户定义的变量1. 单击“变量映射”。2. 在“变量映射”页的“变量”列中,单击空单元格并选择“”。3. 在“添加变量”对话框中,为“名称”键入 varFileName。4. 单击“确定”。5. 再次单击“确定”,退出“Foreach 循环编辑器”对话框。四、将数据流任务添加到循环中将“提取示例货币”数据流任务拖到现已重命名为 Foreach File in Folder 的 Foreach 循环容器中。
31、23修改平面文件连接管理器在本任务中,您将修改在第 1 课中创建和配置的平面文件连接管理器。平面文件连接管理器在最初创建时配置为静态加载单个文件。若要启用平面文件连接管理器以重复加载文件,您必须修改连接管理器的 ConnectionString 属性以接受用户定义的变量 User:varFileName,该变量包含要在运行时加载的文件的路径。通过将连接管理器修改为使用用户定义的变量 User:varFileName 的值并填充连接管理器的 ConnectionString 属性,连接管理器将能够连接到不同的平面文件。在运行时,Foreach 循环容器的每次迭代都将动态更新 User:varFi
32、leName 变量。更新变量时,还会使连接管理器连接到不同的平面文件,并使数据流任务处理其他数据集。配置平面文件连接管理器以使用连接字符串的变量1、在“连接管理器”窗格中,单击 SampleCurrencyData。2、在“属性”窗口中,针对“表达式”,单击空单元,然后单击省略号按钮“()”。3、在“属性表达式编辑器”对话框的“属性”列中,键入或选择 ConnectionString。4、在“表达式”列中,单击省略号按钮“()”以打开“表达式生成器”对话框。5、在“表达式生成器”对话框中,展开“变量”节点。将变量 User:varFileName 拖到“表达式”框中。单击“确定”关闭“表达式生
33、成器”对话框。再次单击“确定”关闭“属性表达式编辑器”对话框。2.4 测试 Lesson 2 教程包使用现在配置的 Foreach 循环容器和平面文件连接管理器,Lesson 2 包可以迭代遍历示例数据文件夹中由 14 个平面文件组成的集合。每次找到与指定的文件名条件匹配的文件名时,Foreach 循环容器都将用该文件名填充用户定义的变量。该变量又会更新平面文件连接管理器的 ConnectionString 属性,并与新平面文件建立连接。然后,在连接到文件夹中的下一个文件之前,Foreach 循环容器将对新平面文件中的数据运行未修改的数据流任务。使用以下过程可以测试已添加到包中的新循环功能。测
34、试 Lesson 2 教程包1. 在“调试”菜单上,单击“启动调试”。包将运行。可以在“输出”窗口中或单击“进度”选项卡来验证每个循环的状态。例如,可以看到 1097 行从文件 Currency_VEB.txt 添加到目标表中。2. 当包运行完毕后,在“调试”菜单上,单击“停止调试”。第 3 课:在 Analysis Services 项目中定义数据源视图及多维数据集在以下任务中,将打开 Business Intelligence Development Studio,并基于 Analysis Services 项目模板创建名为 Analysis Services Tutorial 的新 Mi
35、crosoft SQL Server 2005 Analysis Services (SSAS) 项目。项目是相关对象的集合。项目存在于解决方案中,而解决方案包括一个或多个项目。一、 创建 Analysis Services 项目1. 单击“开始”,指向“所有程序”,再指向 Microsoft SQL Server 2005,再单击 SQL Server Business Intelligence Development Studio。将打开 Microsoft Visual Studio 2005 开发环境。2. 关闭“起始页”选项卡。在 Visual Studio 的“文件”菜单上,指向“
36、新建”,再单击“项目”。 可以使用 Business Intelligence Development Studio 从与 Visual Studio 一起安装的模板或从您定义的模板创建几种不同类型的项目。安装哪些模板取决于所安装的 Microsoft SQL Server 2005 组件。3. 在“新建项目”对话框中,从“项目类型”窗格中选择“商业智能项目”,再在“模板”窗格中选择“Analysis Services 项目”。注意位于对话框底部的默认项目名称、默认解决方案名称和默认项目位置。默认情况下,将为解决方案创建新的目录。4. 将项目名称更改为 Analysis Services Tu
37、torial,这也将更改解决方案名称,然后单击“确定”。至此,您已经在同样名为 Analysis Services Tutorial 的新解决方案中基于 Analysis Services 项目模板成功创建了 Analysis Services Tutorial 项目。下图显示在 Visual Studio 开发环境中的 Analysis Services Tutorial 项目二、定义新的数据源1. 在解决方案资源管理器中,右键单击“数据源”,然后单击“新建数据源”。将打开数据源向导。2. 在“欢迎使用数据源向导”页上,单击“下一步”。 将显示“选择如何定义连接”页。在该页上,可以基于新连接
38、、现有连接或以前定义的数据源对象来定义数据源。以前定义的数据源对象是当前项目中或当前解决方案的其他项目中的现有数据源定义。在本教程中,将基于新连接定义新数据源。3. 在“选择如何定义连接”页上,单击“新建”。 将显示“连接管理器”对话框。在此对话框中,可定义数据源的连接属性。连接管理器是将在运行时使用的连接的逻辑表示形式。例如,连接管理器包括一个在设计时设置的连接字符串属性;在运行时,将通过使用连接字符串属性中的值创建一个物理连接。4. 在“提供程序”列表中,确保已选中“本机 OLE DBMicrosoft OLE DB Provider for SQL Server”。Analysis Se
39、rvices 还支持“提供程序”列表中显示的其他访问接口。5. 在“服务器名称”文本框中,键入 localhost。要连接到本地计算机上的命名实例,请键入 localhost。将项目部署到 Analysis Services 的特殊实例时,Analysis Services 引擎将连接到 Microsoft SQL Server 的默认实例(位于 Analysis Services 实例所在的计算机上)的 Adventure Works DW 数据库。如果在定义数据源时指定特定的计算机名或 IP 地址,则项目或部署的应用程序将与指定计算机而不是本地计算机建立连接。通过 Analysis Ser
40、vices 部署向导,可以在部署时指定源数据的实际服务器名。6. 确保已选中“使用 Windows 身份验证”。在“选择或输入数据库名称”列表中,选择 AdventureWorksDW。 下图显示了包含到目前为止已定义设置的“连接管理器”。7. 单击“确定”,然后单击“下一步”。将显示“模拟信息”页。在该向导的此页上,可以定义 Analysis Services 用于连接数据源的安全凭据。在本教程中,您将选择 Analysis Services 服务帐户,因为该帐户具有访问 Adventure Works DW 数据库所需的权限。8. 选择“使用服务帐户”,然后单击“下一步”。 下图显示了随后
41、出现的“完成向导”页。9. 在“完成向导”页上,单击“完成”以创建名为 Adventure Works DW 的新数据源。 下图显示了解决方案资源管理器的“数据源”文件夹中的新数据源。注意: 若要修改现有数据源的属性,请在“数据源”文件夹中双击该数据源,以在“数据源设计器”中显示数据源属性。 您已经为 Analysis Services Tutorial 项目成功定义了 Adventure Works DW 数据源。 三、定义数据源视图1. 在解决方案资源管理器中,右键单击“数据源视图”,再单击“新建数据源视图”。此时将打开数据源视图向导。2. 在“欢迎使用数据源视图向导”页中,单击“下一步”
42、。 此时将显示“选择数据源”页。“关系数据源”下的 Adventure Works DW 数据源已被选中。 提示: 若要创建一个基于多数据源的数据源视图,必须先定义一个基于单一数据源的数据源视图。此数据源将被称为主数据源。随后,可以添加来自辅助数据源的表和视图。异类查询要求至少有一个数据源是 Microsoft SQL Server 数据源。 3. 单击“下一步”。 此时将显示“选择表和视图”页。在此页中,可以从选定的数据源提供的对象列表中选择表和视图。可以筛选此列表,为选择表和视图提供帮助。4. 在“可用对象”列表中,选择下列表(同时按下 Ctrl 键可选择多个表): DimCustomer
43、 DimGeography DimProduct DimTime FactInternetSales5. 单击 ,将选中的表添加到“包含的对象”列表中。下图显示了将表添加到“包含的对象”列表后的“选择表和视图”页。6. 单击“下一步”,再单击“完成”以定义 Adventure Works DW 数据源视图。 此时,数据源视图 Adventure Works DW 将在解决方案资源管理器的“数据源视图”文件夹中显示。同时,数据源视图的内容也将在 Business Intelligence Development Studio 的数据源视图设计器中显示。此设计器包含以下元素: “关系图”窗格,其中
44、将以图形方式显示各个表及其相互关系。 “表”窗格,其中将以树的形式显示各个表及其架构元素。 “关系图组织程序”窗格,可在其中创建子关系图,用于查看数据源视图的子集。 一个特定于数据源视图设计器的工具栏。下图显示了数据源视图设计器中的 Adventure Works DW 数据源视图。7. 单击“最大化”按钮,最大化 Microsoft Visual Studio 开发环境。 8. 在沿数据源视图设计器顶部显示的工具栏上,使用“缩放”图标,将“关系图”窗格中的表缩小 50% 进行查看。这将隐藏每个表的列详细信息。9. 单击“自动隐藏”按钮,该按钮是解决方案资源管理器的标题栏上的图钉图标。 此时解
45、决方案资源管理器被最小化,成了位于开发环境右侧的一个选项卡。若要再次查看解决方案资源管理器,请将指针指向解决方案资源管理器选项卡。若要取消隐藏解决方案资源管理器,请再次单击“自动隐藏”按钮。 10. 如果“属性”窗口没有默认为隐藏,请单击该窗口标题栏上的“自动隐藏”。 现在,可以在“关系图”窗格中轻松查看所有表及其相互关系了。请注意,在 FactInternetSales 表和 DimTime 表之间存在三种关系。每个销售都具有三个与其关联的日期:订单日期、到期日期和发货日期。若要查看某种关系的详细信息,可双击“关系图”窗格中的关系箭头。下图显示了数据源视图设计器中的“关系图”窗格。您已经成功
46、创建了 Adventure Works DW 数据源视图,该视图包括来自 Adventure Works DW 数据源的五个表的元数据。在下一课中,将根据这五个表定义 Analysis Services Tutorial 多维数据集的初始版本。提示: 若要向现有数据源视图添加表,请右键单击“关系图”窗格或“表”窗格,再单击“添加/删除表”。为了简便起见,请仅将要在项目中使用的表和视图添加到数据源视图中。四、修改表的默认名称1. 在数据源视图设计器的“关系图”窗格中,右键单击 FactInternetSales 表,再单击“属性”。 此时将出现隐藏的“属性”窗口,其中显示了 Adventure
47、Works Tutorial 数据源视图中 FactInternetSales 对象的属性。2. 单击“属性”窗口标题栏上的“自动隐藏”按钮,使该窗口保持未隐藏状态。 在“属性”窗口保持打开状态时,更容易更改数据源视图中各个表的属性。如果不使用“自动隐藏”按钮使窗口保持打开状态,则在“关系图”窗格中单击其他对象时,该窗口将会关闭。3. 将 FactInternetSales 对象的 FriendlyName 属性更改为 InternetSales。 如果在 FriendlyName 属性单元格外单击,则应用此更改。在下一课中,将定义基于此事实数据表的度量值组;由于在本课程中进行了更改,事实数据
48、表的名称将是 InternetSales 而不是 FactInternetSales。4. 在“关系图”窗格中单击 DimProduct,或在“属性”窗口的列表框中选择 dbo.DimProduct DataTable,再将 FriendlyName 属性更改为 Product。在下一课中,将定义基于 DimProduct 表的维度;由于在本课程中进行了更改,此维度的名称将是 Product 而不是 DimProduct。5. 用同样的方法更改数据源视图中剩余的各个表的 FriendlyName 属性,删除“Dim”前缀。 6. 完成更改后,单击“自动隐藏”按钮,重新隐藏“属性”窗口。下图显示
49、了数据源视图设计器中的数据源视图,以及新修改的对象名称。7. 在“文件”菜单上,或者在 BI Development Studio 的工具栏上,单击“全部保存”。这将保存到目前为止您在 Analysis Services Tutorial 项目中所做的更改,您可以根据需要在此处停止教程,以后再继续。您已成功地更改了数据源视图中的表的默认名称,提高了将基于这些表定义的维度和度量值组的用户友好特性。五、定义多维数据集1. 在解决方案资源管理器中,右键单击“多维数据集”,然后单击“新建多维数据集”。2. 在“欢迎使用多维数据集向导”页上,单击“下一步”。 3. 在“选择生成方法”页上,确认已选中“使
50、用数据源生成多维数据集”选项和“自动生成”选项,然后单击“下一步”。 4. 在“选择数据源视图”页上,确认已选中 Adventure Works DW 数据源视图,然后单击“下一步”。注意: 在使用多维数据集向导生成多维数据集时,可以在“选择数据源视图”页上单击“完成”,以让该向导定义多维数据集的其余属性。在这种情况下,该向导将直接进入“完成向导”页,您可以在该页为多维数据集指定名称并可以查看其结构。该向导通过使用默认设置和它从基础数据源对象中查询到的数据来定义多维数据集。不过,为了实现本教程教学目的,请单击“下一步”继续向导的其他页,以查看和更改该向导指定的多维数据集定义。 5. 该向导扫描
51、在数据源对象中定义的数据库中的表,以标识事实数据表和维度表。事实数据表包含相关的度量值,如售出的部件数等。维度表包含有关这些度量值的信息,如售出产品、售出该产品的月份等。 6. 在向导标识完事实数据表和维度表后,请在“检测事实数据表和维度表”页上单击“下一步”。7. 在“标识事实数据表和维度表页上,将显示该向导所标识的事实数据表和维度表。 对于 Analysis Services Tutorial 项目,该向导标识四个维度表和一个事实数据表。为该事实数据表定义了一个度量值组。 每个维度表必须链接到多维数据集中的一个事实数据表。维度表具有下列关系类型之一: 与事实数据表的直接主键-外键关系。这称
52、为“星型架构”。 通过某个其他表与事实数据表的间接主键-外键关系。这称为“雪花型架构”。 请注意,表既可以用作事实数据表,又可以用作维度表。在第 5 课中,您将基于事实数据表定义维度。 在“标识事实数据表和维度表”页上,还可以指定时间维度表,然后将时间属性与指定维度表中的列相关联。时间属性与指定时间维度表中的列相关联是基于时间的多维表达式 (MDX) 计算(如 YTD 和 ParallelPeriod)所必需的,而且时间智能向导将使用这一关联定义与时间相关的计算成员。 下图显示了该向导的“标识事实数据表和维度表”页,其中为 Analysis Services Tutorial 项目选择了事实数
53、据表和维度表。8. 在“标识事实数据表和维度表”页的“时间维度表”列表中,选择 Time,然后单击“下一步”。9. 在“选择时间段”页上,将时间属性名称映射到以指定为“时间”维度的维度为基础的维度表中的相应列。根据以下列表映射这些属性: 将 Year 属性映射到 CalendarYear 列。 将 Half Year 属性映射到 CalendarSemester 列。 将 Quarter 属性映射到 CalendarQuarter 列。 将 Month 属性映射到 EnglishMonthName 列。 将 Date 属性映射到 FullDateAlternateKey 列。下图演示了该向导中
54、的这些列映射。10. 单击“下一步”按钮进入向导的下一页。 随即会出现“选择度量值”页,其中显示了该向导所选择的度量值。该向导选择它标识为事实数据表的表中的各数值数据类型列作为度量值。在本课中,只定义了一个度量值组。但在后面的课程中,您将使用多个度量值组。11. 在“选择度量值”页上,查看在“Internet 销售”度量值组中选择的度量值,然后清除下列度量值的复选框: 促销关键字 货币关键字 销售区域关键字 修订号该向导选择事实数据表中未链接到维度的所有数值列作为度量值。但这四列不是实际的度量值。前三列是将事实数据表与未在此多维数据集的初始版本中使用的维度表链接起来的键值。下图显示了“选择度量
55、值”页上已清除的复选框和其余选定维度。12. 单击“下一步”。由于您前面已在该向导选择了“自动生成”选项,因此该向导将扫描层次结构。 该向导对定义为维度表的表中的各列记录进行采样,以确定列之间是否存在层次结构关系。层次结构关系是多对一关系,例如“市/县”和“省/市/自治区”之间的关系。13. 在该向导完成对维度的扫描和对层次结构的检测后,请在“检测层次结构”页上单击“下一步”。 14. 在“查看新建维度”页上,通过展开树控件显示该向导检测到的三个维度的层次结构和属性,查看其中每个维度的维度层次结构。 下图显示了“查看新建维度”页上的这三个维度。15. 依次展开“产品” 维度和“属性”,然后清除
56、 Large Photo 复选框。单击“下一步”。Large Photo 列在本教程项目的多维数据集中不是很有用,并且由于它可能会占用大量空间,因此最好将其从多维数据集中删除。16. 在“完成向导”页上,将多维数据集的名称更改为 Analysis Services Tutorial。在该页上,也可以查看多维数据集的度量值组、度量值、维度、层次结构和属性。17. 单击“完成”按钮以完成向导。 在解决方案资源管理器的 Analysis Services Tutorial 项目中,Analysis Services Tutorial 多维数据集显示在“多维数据集”文件夹中,而三个数据库维度则显示在“维度”文件夹中。此外,多维数据集设计器在开发环境的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 神经系统疾病护理查房:神经系统功能评估与康复训练
- 护理艺术呵护生命之美
- 环境恢复治理措施承诺书4篇
- 能源管理企业安全生产承诺书(6篇)
- 眼科患者健康教育与指导
- 便秘的膳食纤维补充
- 金融机构安全防范责任书范例7篇范文
- 2026年上海市临床检验中心招聘备考题库及一套完整答案详解
- 《中国古代科技发明简介:初中历史课程教案》
- 江西省第五人民医院2026年公开招聘编制外工作人员备考题库及答案详解(夺冠系列)
- 2025宁夏贺兰工业园区管委会招聘40人模拟笔试试题及答案解析
- 建设单位项目安全生产保证体系
- 2026期末家长会:初三备战没有不辛苦的 教学课件
- 真空乳化设备维护与清洁操作手册
- 上海财经大学2026年辅导员及其他非教学科研岗位人员招聘备考题库带答案详解
- 2026湖北恩施州建始县教育局所属事业单位专项招聘高中教师28人备考笔试试题及答案解析
- 2025贵州铜仁市“千名英才·智汇铜仁”本地引才413人参考笔试题库及答案解析
- 心肺康复课件
- 2025中原农业保险股份有限公司招聘67人笔试参考题库附带答案详解(3卷)
- 2026年内蒙古商贸职业学院单招职业技能测试题库及参考答案详解一套
- 退赃后赔偿协议书
评论
0/150
提交评论