2008集成服务设计和实现包教程_第1页
2008集成服务设计和实现包教程_第2页
2008集成服务设计和实现包教程_第3页
2008集成服务设计和实现包教程_第4页
2008集成服务设计和实现包教程_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Integration Services- 数据挖掘SSIS 2008 集成服务设计和实现包使用本节中的可以了解如何在 Integration Services 项目中创建包,并指导您使用 Integration Services 工具。在 Microsoft Integration Services 中,可以方便地创建可靠而复杂的解决方案,用于执行提取、转换和加载数据 (ETL) 的处理。使用 Integration Services 工具可以设计、创建、部署和管理包,从而可以处理日常的业务需求。 下面列出的分步将帮助您了解有关 Business IntelligenceDevelopmen

2、t Studio 环境的知识。 前两个通过示例讲解了在 Integration Services 项目中创建包的方法,还详尽地讲述了 Integration Services 工具的使用方法,从而使您一开始就能有效地进行工作。 第三个通过示例讲解了如何使用 Integration Services 工具轻松地在其他计算机上安装包及其依。:使用向导创建基本包通过示例讲解了如何使用 SQL Server 导入和导出向导创建基本的数据传输包。完成向导此之后,使用排序和数据转换功能来增强包。 您还将了解如何使用新的 Integration Services 表达式语言重新生成列值。Microsoft

3、Microsoft Integration Services 可提供 SQL Server 导入和导出向导,用于生成执行数据传输的包。这些以从数据源中提取数据并将其加载到目标中,但在传输过包只能执行很少的数据转换。此外,使用该向导可快速创建基本包,然后可以在 SSIS 设计器中对增强。Excel 工在本中,您将了解如何使用SQL Server 导入和导出向导来创建基本包。创建的作簿提取数据,并将其加载到 AdventureWorks 数据库中的表。该表定义为向导中的步骤之一,然后在运行动态创建。在后续课,扩展为包括对数据进行排序、创建新列以及用值填充列的数据流。为了生成新值,您将了解如何将新的

4、 Integration Services 表语句与图形表一起使用,以编写一个基于现有数据列创建新值的表。在安装所用的示例数据的同时,也会安装的每一课中已完成的包版本。使用已完成的lesson 1 包,您可以按需要跳过第 1 课而从第 2 课开始学习。如果您是第一次使用包、SQLServer 导入和导出向导或新的开发环境,我们建议从第 1 课开始学习。学习内容熟悉本Microsoft SQL Server Integration Services 的新工具、控件和功能的最好方法,就是使用它们。首先引导您完成 SQL Server 导入和导出向导以创建基本数据传输包,再介绍如何使用SSIS 设计

5、器增强包的数据转换功能。要求本适用于熟悉基本数据库操作,但对 SQL Server Integration Services 中的新功能认识有限的用户。1Integration Services- 数据挖掘若要使用本,系统中必须安装有下列各项:AdventureWorks 数据库的 SQL Server。为了增强安全性,默认情·带有安装示例数据库。若要安装示例数据库,请参阅安装 SQL Server 示例和示例数据库的注意事项。您必须具有在 AdventureWorks 中创建和删除表的权限。··本还需要示例数据。示例数据与示例一起安装。如果无法找到示例数据,请返

6、回以上过程,按说明完成安装。本假定没有将 SSIS 设计器重新配置为使用流元间或数据流元间的自动连接功能。如果 SSIS 设计器使用自动连接功能,则元素可能会在添加到设计图面时自动进行连接。流的自动连接功能还支持将“失败”和“完成”,而不是将“”用作默认的约束。如果 SSIS 设计器未使用“”作为默认的约束,则应当在执行时重置此配置。可以在“选项”框的“商业智能设计器”部分中配置自动连接功能,该框可通过“工具”菜单中的“选项”获得。学的估计时间:1 小时第 1 课:创建基本包SQL Server 导入和导出向导创建数据传输包。在本课中,将使用在本课中,将使用SQL Server 导入和导出向导

7、创建基本包。该包选择并提取Excel 电子表格中的数据,再将该数据写入向导中定义,在您运行AdventureWorks 示例数据库中的创建。ProspectiveCustomers 表。该表在SQL Server 导入和导出向导将在 Business Integration Services 项目启动该向导。在您完成 SQL Server 导入和导出向导后,该Intelligence Development Studio 中运行,您将从被添加到Integration Services 项目。您将在 SSIS设计器(该设计器是用于生成复杂包的正确配置了该包的某些属性。Integration Se

8、rvices 图形工具)中打开该包,再验证是否最后,将在 Business Intelligence Development Studio 中运行该包来测试它。课程任务本课程包含以下任务:步骤 1:创建 Integration Services 项目使用 SQL Server导入和导出向导创建基本包,方法是在 Business Intelligence本Development Studio 中运行该向导。该向导是从 Integration Services 项目启动的。在此任务中,将创建 Integration Services 项目。创建 Integration Services 项目1.

9、在“开始”菜单上,依次指向“所有程序”和 Microsoft SQL Server,再Business Intelligence Development Studio。SQL Server、2重要提示:本需要 AdventureWorks 示例数据库。有关安装和部署 AdventureWorks 的详细信息,请参阅安装 SQL Server 示例和示例数据库的注意事项。Integration Services- 数据挖掘2.在“文件”菜单中,指目。建”,再“项目”,以创建一个新的 Integration Services 项3.在“新建项目”框的“模板”窗格中,选择“Integration S

10、ervices 项目”。4.在“名称”框中,将默认名称更改为 SQL Server Import and Export Wizard Tutorial或者,清除“创建解决方案的目录”复选框。5.“浏览”,以浏览并找到要使用的文件夹。接受默认位置,或6.在“项目位置”框中,文件夹,再“打开”。7.“确定”。8.,将创建名为 Package.dtsx 的空包,并将它添加到每个新项目。但是,您将默认情的包。您可以删除 Package.dtsx,或者稍后将它用作不使用此包,因为向导将创建它,再“删除”。其他包的基础。若要删除它,请右键步骤 2:运行向导创建基本包在此任务中,将运行 SQL Server

11、 导入和导出向导创建基本的数据传输包。·指定数据源。将使用 Excel 工作簿Customers.xls 作为数据源。在一个向导页上将提供一个,该从该工作簿的Customers 电子表格中选择拥有至少一辆汽车的客户。·指 定 目 标 。 将 数 据 写 入 AdventureWorks 数 据 库 中 的 表 。 将 动 态 创 建 表ProspectiveCustomers。将使用向导定义目标列的元数据。在向导完成后,您将重命名该包,并验证包、任务、源和目标的某些受区域设置影响的属性的值。此步骤非常重要,因为 Excel 工作簿的 BirthDate 列中包含受区域设置影

12、响的日期数据。如果计算机上的区域设置不指定“英语(美国)”,则必须更新指定属性的值,否则无法运行该包。运行1.2.SQL Server 导入和导出向导如果它尚未打开,请打开在上一个任务中创建的 Integration Services 项目。在解决方案管理器中,右键“SSIS 包”文件夹,再“SSIS 导入和导出向导”。如果“解决方案管理器”窗口未打开,请“视图”菜单上的“解决方案管理器”。在 SQL Server 导入和导出向导的“欢迎”页上,”。3.4.5.“在“选择数据源”页上的“数据源”列表中选择“Microsoft Excel”。“ 浏览”, 导航到 C:Program FilesM

13、icrosoft SQL Server100SamplesIntegrationServicesTutorialCreating a Basic PackageSample Data ,Customers.xls,再“打开”。验 证 “Excel文 件 路 径 ” 框 是 否 包 含 “C:ProgramExcel 工作簿文件6.FilesMicrosoftSQLServer100SamplesIntegrationDataCustomers.xls”。ServicesTutorialCreatingaBasicPackageSample验证“Excel 版本”框是否包含“Microsoft

14、Excel 97-2003”,以及是否选中“首行包含列名称”复选框。7.”。8.9.“在“选择目标”页上的“目标”列表中选择 SQL Server Native Client,然后在“服务器名称”框中键入 localhost。3Integration Services- 数据挖掘将 localhost 指定为服务器名称时 连接管理器将连接到本地计算机上的 SQL Server 的默认实例。若要使用 SQL Server 的默认实例或命名实例 请将 localhost 替换为要连接到的服务器或者服务器及命名实例的名称。若要连接到命名实例,请使用以下格式:<服务器名称><实例名称

15、>。如果指定的数据库引擎实例支持验证,请使用默认的 Windows验证”,然后分别在“用户名”和“验”框中键10.Windows证模式;否则,入用户名和“使用 SQL Server。在“数据库”列表中,选择“AdventureWorks”。4.15.”。“在“查看数据类型在“指定表或”页上,接受默认设置,并”。“”页上,“编写以指定要传输的数据”,再”。“在“提供源”页上的“SQL 语句”框中键入或以下 SQL 语句:”。16.17.18.“若要编辑列元数据和表选项,请在“选择源表和源视图”页上,“编辑”。在“列”页上,验证是否选中“创建目标表”选项,选中“删除并重新

16、创建目标表”复选框,再修改目标列的元数据。下表列出各列和需要进行的元数据更改:“确定”。19.20.”。“4列名默认类型更新的类型默认大小更新的大小FirstNamenvarchar没有变化25550MiddleIntialnvarcharnchar2551LastNamenvarchar没有变化25550BirthDatedatetime没有变化不适用不适用MaritalStatusnvarcharnchar2551Gendernvarcharnchar2551Addressnvarchar没有变化25550efloatmoney不适用不适用TotalChildrenfloattinyint

17、不适用不适用NumberChildrenAtHomefloattinyint不适用不适用教育nvarchar没有变化25550职业nvarchar没有变化25550HouseOwnerFlagfloatbit不适用不适用NumberCarsOwnedfloattinyint不适用不适用AddressLine1nvarchar没有变化25560AddressLine2nvarchar没有变化25560Citynvarchar没有变化25530Statenvarchar没有变化2553ZIPfloat没有变化不适用无Phonenvarchar没有变化25550代码SELECT * FROM Cus

18、tomers$ WHERE NumberCarsOwned > 0Integration Services- 数据挖掘21. 在“完成该向导”页上,检查有包的信息,再“完成”。22. 在“执行操作”页上,查看该向导执行的操作。完成后,每项操作的“状态”列应该显示“成功”。“关闭”。23.24. 在解决方案管理器中,右键“SSIS 包”文件夹中的新包,“重命名”,再键入Basic Package Lesson 1。确保该名称包括 .dtsx 扩展名。25. 如果询问您是否也重命名对象,请设置包的受区域设置影响的属性1.双击 Basic Package Lesson 1.dtsx,位置。“是

19、”。“流”选项卡,再设计图面背景上的任意2.在“视图”菜单上,“属性窗口”。3.在“属性”窗口中,验证是否已将 LocaleID 属性设置为“英语(美国)”。设置执行1.在SQL 任务的受区域设置影响的属性流设计图面上,“删除表 SQL 任务”。2.在“视图”菜单上,“属性窗口”。3. 在“属性”窗口中,验证是否已将 Codepage 属性设置为“1252”,将 LocaleID “英语(美国)”。4. 对于“准备 SQL 任务”,重复步骤 1-3。设置数据流任务的受区域设置影响的属性属性设置为“数据流任务”。1.2.在“视图”菜单上,“属性窗口”。3.在“属性”窗口中,验证是否已将 Loca

20、leID 属性设置为“英语(美国)”。设置数据流组件的受区域设置影响的属性1.双击“数据流任务”或“数据流”选项卡。2.在“数据流”选项卡上,“源 -”。3.在“视图”菜单上,“属性窗口”。4. 在“属性”窗口中,验证是否已将 LocaleID 属性设置为“英语(美国)”。5. 对于“目标 - ProspectiveCustomers”,重复步骤 2-4。步骤 3:测试第 1 课“基本包”在本课中,已经完成了下列任务:···创建了一个新的 Integration Services 项目。运行 SQL Server 导入和导出向导以创建基本包。验证并更新了受区域设置

21、影响的属性的值。包现在已经完成了!该对测试了。检查包布局测试包之前,应该验证 lesson 1 包 Basic Package Lesson 1.dtsx 中的流和数据流是否包含下5重要提示:第一次运行 ,名为“删除表 SQL 任务”的任务将失败。此行为是预期行为。任务失败的是该包尝试删除并重新创建表 ProspectiveCustomers;但是,包第一次运行时该表并不存在,因此 DROP 语句失败。由于“删除表 SQL 任务”和“准备 SQL 任务”之间的优先约束已设置为“完成” 而非“ ,因此这 导致包失败。Integration Services-数据挖掘列关系图所示的对象。流数据流此

22、外,该包应该包括下列两个连接管理器。接到 Excel 工作簿文件 Customers.xls,另一个连接到AdventureWorks 数据库。运行 Lesson 1 包1.在解决方案管理器中,Basic Package Lesson 1.dtsx。2.在“调试”菜单中,“启动调试”。开始运行,结果有 809 个行被中。添加到AdventureWorks 中的 ProspectiveCustomers 表3.当包运行完毕后,在“调试”菜单中,“停止调试”。6Integration Services- 数据挖掘第 2 课:增强基本包在本课中,将基本在第 1 课:创建基本为包括排序操作以及将新列和

23、列值添加到现有数据集。,使用 SQL Server 导入和导出向导快速了解了基本的 IntegrationServices 包。该包具有有限的功能;它仅仅从Excel 工作簿文件中提取数据,并将该数据加载到AdventureWorks 示例数据库的 ProspectiveCustomers 表中。通常,需要对数据进行操作和转换。Integration Services 提供了许多可以用来对数据进行复制、清除、修改、排序和聚合的转换。如果需要以标准转换不支持的方式转换数据,则可以很容易地为转换编写或编写自定义转换的代码以满足您的需要。便对数据排序,并基于其他列中的值为数据集添加新列。在此方案中,

24、在本课中,将增强基本一个列包含Null 值,在串联现有列中的值时会引起问题。为了解决此问题并生成新列的值,将使用新的复杂表Integration Services 功能,即表。Integration Services 表语言包括可用来生成的函数、运算符和类型转换。将使用一个表串联三个列中的值,有条件地在列间空格,再将新值添加到新列。由于已将一个新列添加到数据集,因此必须将ProspectiveCustomers 表和OLE DB 目标修改为包括此列。将同执行 SQL 任务中的 SQL 语句(它创建了 ProspectiveCustomers 表)和OLE DB 目标(它将数据写入表),以包括这

25、一新列。还要将数据集中的新列到表中的新列。在本课中,将在第 1 课中创建的基本包,再增强它。如果尚未完成上一课,也可以第 1课的已完成包(附带)。课程任务本课程包含以下任务:Lesson 1 基本包<1>.在此任务中,将为在第 1课中创建的、名为 Basic Package Lesson 1.dtsx 的包创建一个副本。如果您未完成第 1 课的学习,则可以向项目添加本中附带的已完成 Lesson 1 包,它。您将使用这一新副本来完成第 2 课剩余部分。再创建 Lesson 2 包1.如果 Business Intelligence Development Studio向“所有程序”

26、和 Microsoft SQL Server,再Development Studio。尚未打开,请“开始”,依次指Business Intelligence2.在“文件”菜单上,依次“打开”、“项目/解决方案”、“SQL Server Import andExport Wizard Tutorial”文件夹,然后再次Import and Export Wizard Tutorial.sln”。“打开”,最后双击“SQL Server3.Basic Package Lesson 1.dtsx,再“”在解决方案管理器中,右键7重要提示:本需要 AdventureWorks 示例数据库。有安装和部署

27、 AdventureWorks 的详细信息, 请参阅安装 SQL Server 示例和示例数据库的注意事项。Integration Services- 数据挖掘4.管理器中,右键“SSIS 包”,再“粘贴”。在解决方案Basic Package Lesson 2.dtsx。默认情,的5.管理器中,双击 Basic Package Lesson 2.dtsx 打开该包。在解决方案6.右键“流”设计图面背景的任意位置,再“属性”。7.在“属性”窗口中,将 Name 属性更新为 Basic Package Lesson 2。8.ID 属性框,然后在列表中,“<生成新 ID>”。添加已完成

28、的 Lesson 1 包1.打开 Business Intelligence Development Studio,再打开 SQL Server Import andExport Wizard Tutorial 项目。2.“SSIS 包”,再“添加现有包”。在解决方案管理器中,右键3.在“添加现有包的副本”框的“包位置”中,选择“文件系统”。4.浏览 () 按钮,导航到 C:Program FilesMicrosoft SQL Server100SamplesIntegration ServicesTutorialCreating a Basic PackageCompleted Packag

29、es,选择“Basic Package Lesson 1.dtsx”,再“打开”。5.步骤 3-8 中所述,并粘贴 Basic Package Lesson 1 包。按先前过<2>步骤 2:更新执行 SQL 任务在此任务中,将在名为“准备 SQL 任务”的执行 SQL任务中更新 SQL 语句。现有的 SQL 语句是从您逐步完成 SQL Server 导入和导出向导的各页创建 lesson 1指定的选项自动,此 SQL 语句在 AdventureWorks 数据库中创建 Query 表。生成的。运行在本课的后面部分中,将为从 Excel 电子表格提取的数据生成其他列,并需要将该列的定

30、义包括在 SQL 语句中。修改 SQL 语句1.“流”选项卡。2.双击“准备 SQL 任务”。3.在“常规”页上,SQLStatement 属性,再浏览按钮 ()。8Integration Services- 数据挖掘4.在“输入 SQL”框中,在 Phone nvarchar (50) 一行的结尾添加一个逗号,按 Enter,然后在新行上键入 FullName nvarchar (103)。完成后的 SQL 语句应该与如下所示类似:CREATE TABLE AdventureWorks.dbo.Query(FirstName nvarchar(50),MiddleInitial nchar(

31、1),LastName nvarchar(50),BirthDate datetime,MaritalStatus nchar(1),Gender nchar(1) NOT NULL,Address nvarchar(50),e money,TotalChildren tinyint,NumberChildrenAtHome tinyint,Education nvarchar(50),Occupation nvarchar(50),HouseOwnerFlag bit,NumberCarsOwned tinyint,AddressLine1 nvarchar(60),AddressLine2

32、 nvarchar(60),City nvarchar(30),State nchar(3),ZIP float,9Integration Services- 数据挖掘Phone nvarchar(50),FullName nvarchar (103)GO5.“确定”。6.“分析”。SQL 语句应该进行了分析。7.“确定”。<3>步骤3:添加并配置排序转换在此任务中,将添加排序转换并对其进行配置。排序转换是一个数据流组件,用于对数据排序,还用于将规则应用于排序所执行的比较。还可以使用排序转换删除具有重复排序键值的数据行。以及市县对从 Excel 电子表格中提取的数据进行排序。排序转

33、换将按省市添加排序转换1.通过双击“数据流任务”或者“数据流”选项卡,打开“数据流”设计器。2.右键“数据转换”和 Destination - Query 之间的路径(绿色箭头),再“删除”。3.在“工具箱”中,展开“数据流转换”,再将“排序”拖动到“数据流”选项卡的设计图面上“数据转换”的下方。如果“目标 - Query”会产生遮挡,请面上靠下的位置。它将其拖动到“数据流”设计图4.在“数据流”设计图面上 在排序转换中“排序”,再将名称更改为 Sort by State andCity。5.“源 -”,并将其绿色箭头拖动到“Sort by State and City”。6.双击“Sort

34、by State and City”以打开“排序转换编”框。7.在“可用输入列”列表中,首先选中“State”列左侧的复选框,再选中“City”列旁边的复选框。各列现在将出现在“输入列”列表中。State 具有排序顺序 1,City 具有排序顺序 2。这意味着数据集先按省市再按市县进行排序。10Integration Services- 数据挖掘8. 在“输入列”列表中,包含省市选框,再“确定”。的行。“比较标志”框,选中“忽略大小写”复9.“确定”。10. 右键“Sort by State and City”,再“属性”。11. 在“属性”窗口中,验证是否已将 LocaleID 属性设置为“

35、英语(美国)”。<4>步骤 4:添加和配置派生列转换在此任务中,将派生列转换添加到包。派生列转换是一个数据流组件,它通过使用数据集、常量和变量中的值或通过应用函数来创建新的数据值。将使用此转换添加新列,再用表果填充该列。的计算结派生列转换的用户界面包括表。此图形工具使用户轻松地使用拖放操作快速编写复杂表,并提供用于函数、类型转换和运算符的模板以及输入列和变量。,用于串联数据集的 FirstName、MiddleInitial 和在派生列转换中,将创建一个表LastName 列中的值,再将结果写入新列。由于中间名首字母可能为空,因此表此列的特殊处理。新列 FullName 将被添加到

36、转换输出。将包括添加派生列转换1.如果数据流设计器尚未打开,请打开它,方法是双击“数据流任务”或“数据流”选项卡2.在“工具箱”中,展开“数据流转换”,再将“派生列”转换拖动到“数据流”选项卡的设计图面上,使其位于“Sort by State and City”的下方。3.在“数据流”设计图面上,在派生列转换中FullName Column。“派生列”,再将该名称更改为 Add4.“Sort by State and City”,再将其绿色箭头拖动到“Add FullName Column”。5.双击“Add FullName Column”以打开“派生列转换编”框。6.在左窗格中,展开“列”

37、文件夹,FirstName 列,再将它拖动到“表”框。7.在“表”框中,在 FirstName后键入 + " " +。8.在“列”文件夹中,MiddileInitial 列,再将它拖动到“表”框。9.将 MiddleInitial 更新为 (ISNULL(MiddleInitial) ?"" : MiddleInitial + " ")+ .10. 在“列”文件夹中,LastName 列,再将它拖动到“表”框。11Integration Services- 数据挖掘11. 验证“表”框中的值是否为以下值:FirstName + &qu

38、ot; " + (ISNULL(MiddleInitial) ? "" : MiddleInitial +" ") + LastName您还可以删除表中括起列名的方括号。列名是常规标识符,不需要用方括号括起来。包含无效字符(如空格)的名称必须用方括号括起来。如果表本将以红色显示。键入得不正确,则其文12. 在刚创建的行的“派生列”框中,选择“<作为新列添加>”。13. 在同一行的“派生列名称”框中,键入 FullName。14. 如果“数据类型”框尚未设置为“Unicode string DT_WSTR”,请在“数据类型”列表中选择

39、“Unicode string DT_WSTR”。15. 将“长度”框的值设置为 103(FirstName、MiddleInitial 和 LastName 列以及两个空格的长度的总和)。16.“确定”。17. 在“属性”窗口中,验证是否已将 LocaleID 属性设置为“英语(美国)”。<5>步骤 5:修改OLE DB 目标在前面的第 2 课中,您在执行 SQL 任务“准备 SQL 任务”中更新了 SQL 语句,以包括Query 表中 FullName 列的定义。在此任务中,您将修改 OLE DB 目标 Destination - Query,以支持 FullName 列。因为

40、您向数据流添加了排序转换,您还将还原 Destination - Query 中不再有效的列。Destination - Query排序转换生成了一组具有不同列标识符的新列,因此您需要重新中的输入列和目标列。修改 OLE DB 目标1.如果数据流设计器尚未打开,请打开它,方法是双击“数据流任务”或“数据流”选项卡2.名为 Add FullName Column 的派生列转换,再将其绿色箭头拖动到Destination - Query。3.双击 Destination - Query。4.在“还原无效列“<使用列名进行编”“全选”,在“所选行的列选项”列表中选择框中,>”选项,再“应

41、用”。12Integration Services- 数据挖掘您可以清除“包含下游无效列不起作用。”复选框。在此,没有下游数据流组件,所以此选项5.“确定”。6.右键Destination - Query,再“显示高级编”。7.在“高级编部列”,再”“输入属性和输出属性”选项卡,展开“目标输入”,“外框中“添加列”。名为 Column 的新列将被添加到“外部列”文件夹。8.新列。9.在右侧窗格中,将 Name 属性更新为 FullName,中选择“Unicode string DT_WSTR”。将 LengthDataType 属性,再从列表属性更新为 103。10.“列”选项卡,再向下滚动到

42、“目标列”列表中包含“FullName”的行。该行的“输入列”列表中的“<忽略>”,再列表中的“FullName”。11. 验证是否了同名的所有输入列和输出列。12.“确定”。<6>步骤 6:测试 Lesson 2 基本包在本课中,已经完成了下列任务:····更新了执行 SQL 任务中的 SQL 语句以包括其他列的定义。添加并配置了排序转换,以便先按州再按城市对数据集进行排序。 添加了派生列转换,并将其配置为使用表示式为新列生成值。修改了 OLE DB 目标以便将新列 FullName 写入ProspectiveCustomers

43、 表。包现在已经完成了!该对测试了。检查包布局测试包之前,应该验证 Lesson 1的流。13重要提示:第一次运行,删除表任务将失败。此行为是预期行为。任务失败的是该包尝试删除并重新创建表 ProspectiveCustomers;但是,包第一次运行时该表并不存在,因此 DROP 语句失败。Integration Services-数据挖掘数据流此外,该包应该包括下列两个连接管理器。接到 customers.xls Excel工作簿文件,另一个连接到AdventureWorks 数据库。运行 Lesson 2 包1.在解决方案管理器中,Basic Package Lesson 2.dtsx。2

44、.在“调试”菜单中,“启动调试”。开始运行,将 809 个行添加到 AdventureWorks 中的Query 表中。3.当包运行完毕后,在“调试”菜单中,验证 ProspectiveCustomers 表的内容“停止调试”。1.在“开始”菜单上,依次指向“所有程序”、Microsoft SQL Server,再Management Studio。SQL Server2.在“连接到服务器”框中提供在其上安装框中,选择“服务器类型”列表中的“数据库引擎”,在“服务器名称”AdventureWorks 的服务器的名称,再选择验证模式选项。如14Integration Services- 数据挖掘

45、果选择“SQL Server验证”,请提供用户名和。“连接”。将打开 SQL Server Management Studio。3.4.在工具栏上,“新建”。5.在窗口中键入或以下。SELECT * FROM AdventureWorks.dbo.Query6.在工具栏上,“执行”。“结果”窗格将显示数据集,其中包括新的 FullName 列。您可以根据中间名首字母是否为空,验证表是否正确设置了列值的格式。15Integration Services- 数据挖掘:创建简单的 ETL 包此首先阐释如何创建一个基础包,该在 AdventureWorksDW 示例数据库进行如下操作:从文件中提取数据

46、,在表中执行查找以及将数据写入一个表。后续的课程将扩展该基础包,其中包括在循环中实现重复工作流、启用日志理等。、创建配置以动态更新包属性以及添加错误处Microsoft Microsoft Integration Services 是一个可以生成高性能数据集成解决方案(包括为数据仓库提取、转换和加载 (ETL) 包)的平台。 Integration Services 包括用于生成和调式包的图形工具和向导;用于执行工作流函数(如 FTP 操作)、执行 SQL 语句以及电子邮件的任务;用于提取和加载数据的数据源和目标;用于清除、聚合、合并和数据的转换;用于管理包执行和的管理服务,即 Integra

47、tion Services;以及用于 Integration Services 对象模型编程的应用程序编程接口 (API)。在本中,您将学习如何使用 SSIS 设计器创建一个简单的 Microsoft SQL Server IntegrationServices 包。所创建的从平面文件提取数据,重新设置数据的格式,然后将已重新设置格式的数据在安装到事实数据表中。在下列课,将扩展阐释循环、包配置、日志和错误流。所用的示例数据的同时,也会安装将在的每一课中创建的完整的包版本。使用完整的包,您可以按需要跳过前面几课而从后面的课程开始学习。如果您是第一次使用新的开发环境,我们建议从第学习内容1 课开始

48、学习。熟悉本日志Microsoft SQL Server Integration Services 的新工具、控件和功能的最好方法,就是使用它们。将引导您使用 SSIS 设计器创建一个简单的。ETL 包,其中包含循环、配置、错误流逻辑和要求本适用于熟悉基本数据库操作,但对 SQL Server Integration Services 中的新功能认识有限的用户。若要使用本,系统中必须安装有下列各项:AdventureWorksDW 数据库的 SQL Server。为了增强安全性,默认情·带有安装示例数据库。若要安装示例数据库,请参阅安装 SQL Server 示例和示例数据库的注意事

49、项。·本还需要示例数据。示例数据与示例一起安装。如果无法找到示例数据,请返回以上过程,按说明完成安装。本假定没有将 SSIS 设计器重新配置为使用流元素或数据流元素的自动连接功能。如果SSIS 设计器使用自动连接功能,则元素可能会在添加到设计图面时自动进行连接。流的自动连接功能还支持将“失败”和“完成”,而不是将“”用作默认的约束。如果SSIS 设计器未使框的“商业智能用“”作为默认的约束,则应当在执行时重置此配置。可以在“选项”设计器”部分中配置自动连接功能,该框可通过“工具”菜单中的“选项”获得。本中的课程16注意:阅读时,建议将“下一个主题”和“上一个主题”按钮添加到文档查看器

50、工具栏中。有关详细信 息,请参阅向帮助中添加“”和“”按钮。Integration Services- 数据挖掘第1 课:创建项目和基本包在本课中,将创建一个简单的 ETL 包,从单个平面文件中提取数据,再使用查找转换转换数据,最后将所得结果加载到目标事实数据表中。在本课中,您将创建一个简单 ETL 包,该以从单个平面文件源提取数据,使用两个查找转换组件转换该数据,然后将该数据写入 AdventureWorksDW 中的 FactCurrencyRate 事实数据表在本课中,您还将学习如何创建新包、添加和配置数据源和目标连接以及使用新的流组件。流和数据了解包要求在创建包之前,需要充分了解在源数

51、据和目标数据中使用的格式。 了解了这些数据格式后,便可定义将源数据查看源到目标数据所需的转换。在本中,源数据是平面文件 SampleCurrencyData.txt 中包含的一组历史货币数据。 源数据具有以下四列:货币的平均汇率、货币键、日期键和收盘汇率。下面是 SampleCurrencyData.txt 文件中所包含的源数据示例:1.000100011.000100011.000200041.000200041.000500251.000500251.000500251.000100011.000200041.00020004ARSARS ARS ARS ARS ARS ARS ARS A

52、RS ARS9/3/2001 0:009/4/2001 0:009/5/2001 0:009/6/2001 0:009/7/2001 0:009/8/2001 0:009/9/2001 0:009/10/2001 0:009/11/2001 0:009/12/2001 0:000.999600161.0010010010.999900011.000400160.999900011.00100100111.000400160.999900011.001101211在使用平面文件源数据时,需要了解平面文件连接管理器如何解释平面文件数据,这一点很重要如果平面文件源是 Unicode 编码的,则平面文件连接所有列定义为 DT_WSTR,默认列宽为 50。如果平面文件源是 ANSI 编码的,则将列定义为 DT_STR,默认列宽为 50 。您可能必须更改这些默认设置,才能使字符串列类型与所使用的数据更相符。 为此,您需要查看将写入数据的目标的数据类型,然后在平面文件连接管理器中选择正确的类型。查看目标源 数 据 的 最 终 目 标 是 AdventureWorksDW 中 的 FactCurrencyRate 事 实 数 据 表 。FactCurrencyRate 事实数据表有四列,并且与两个维度表有关系,如下表所示。17列名称数据类型查找表查找列Average

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论