版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据仓库与ETL的实现过程一、抽取维度表(一)抽取维度表DimEmp1、 依次打开Satrt|All program|Microsoft SQL Server 2008| Microsoft SQL Server Business Intelligence Development Studio。2、 依次打开File|New|Project,在打开的对话框中选择Integration Services Project,命名为ToDW,保存位置为C:Documents and SettingsAdministratorDesktop课程练习第2课,然后点击OK。在Solution Explore
2、r中选中SSIS Packages ,单击右键选择新建SSIS包。选中新建的包,右键单击选择rename,然后输入Dim.dtsx 。点击空白处显示如下提示框,点击Yes。3、 双击新建的SSIS包,即Dim.dtsx。在左侧Toolbox面板中将Execute SQL Task拖到Control Flow中,再双击打开,如下图: 在General 中的Name后输入:truncate table EMP Product 。4、 点击选中Connection然后 点击向下的箭头,选择New Connection出现如下对话框:在该对话框中选择New出现下图:在Server name 中输入Lo
3、calhostLog on to the server 中选择Use Windows AuthenticationConnect to database中选择Select or enter or database name ,在下拉菜单选择 HealthDW。5、 点击Test Connection ,显示Test Connection succeeded 对话框即: 然后点击OK关闭此信息框。6、 点击OK 关闭Connection Manger对话框。7、 在Data connection 中,选中LOCALHOST .HealthDW,然后点击OK关闭Configure OLE DB C
4、onnection Manager 对话框。8、 选中SQLStatement 然后点击后面的省略号,在出现如下对话框:在对话框中输入以下语句:use HealthDWtruncate table DimEmpdbcc checkident(DimEmp,reseed,1)truncate table DimProductdbcc checkident(DimProduct,reseed,1)9、 点击OK关闭Enter SQL Query对话框。10、 点击OK关闭Excute SQL Task Editor对话框。11、 在Toolbox面板中将Data Flow Task 拖到Contr
5、ol Flow窗体中,并拖动truncate table EMP Product下面的绿色箭头连接到Data Flow Task上。12、 选中Data Flow Task后单击,将其重命名为DimEmp。13、 双击DimEmp,然后在Toolbox面板中将Excel Source 拖到Data Flow 窗体中。14、 选中Excel Source后单击,将其重命名为:店面销售一组,并双击它出现如下图示:选择OLE DB connection manager 右边的New出现Excel Connection Manager对话框,如下图所示: 15、 在Excel file path 中点
6、击Brower,浏览Excel数据源所在位置C:Documents and SettingsAdministratorDesktop课程快速入门第2课:数据仓库与ETL的实现过程工程文件ToDWDataSourceStore sales.xlsx。出现如下图示:然后点击OK关闭Excel Connection Manager对话框。16、 在Data access mode 中选择SQL command;在SQL command text中输入:select distinct EmployName,GroupName from sheet1$ where EmployName is not n
7、ull,然后点击OK。17、 在Toolbox面板中将Derived Column拖到Data Flow 窗体中,选中Derived Column重命名为:DeptName。18、 拖动店面销售一组下面的绿色箭头到DeptName上。19、 双击DeptName后,加入 DeptName列,在 expression中输入”店面”,然后点击OK。具体操作如下图所示:注意:加入店面销售二组、店面销售三组 和其派生列操作步骤同上。20、 在Toolbox中将OLE DB Source 到Data Flow中,重命名为Pos。21、 双击Pos出现下图:OLE DB connection manage
8、r 中选择New,出现configure OLE DB Connection Manager对话框 ,然后点击New 出现Connection Manager对话框,在Provider 中选择Native OLE DB Microsoft Office 12.0Access DataBase Engine OLE DB Provider。22、 然后点击Data Links,出现Data Link Properties对话框。如下图所示: 23、 在Data Source中输入C:Documents and SettingsAdministratorDesktop课程快速入门第2课:数据仓库与
9、ETL的实现过程工程文件ToDWDataSourcePos.accdb24、 Data Link Properties对话框中,选择Test Connection 。25、 点击Test Connection 显示连接成功,然后点击OK关闭此对话框。26、 点击OK关闭Connection Manager对话框。27、 点击OK关闭configure OLE DB Connection Manager对话框。28、 在Data access mode 中选择SQL command;在SQL command text中输入:select distinct EmployName,GroupName
10、 From Sales where EmployName is not null。29、 点击OK 关闭对话框。30、 在Toolbox面板中将Derived Column拖到Data Flow中,重命名为DeptName131、 将Pos的绿箭头拖动到DeptName1上面,以连接这两个组件。32、 双击DeptName1后加入 DeptName 列,在expression中输入”Pos”,具体操作如下图所示:然后点击OK。33、 从Toolbox面板中将OLE DB Source拖到Data Flow中,将其命名为网售。双击打开。34、 在OLE DB connection manager
11、 下面点击New,出现configure OLE DB Connection Manager对话框,点击New出现Connection Manager 对话框。如下图所示: 在Provider 中选择Native OLE DB SQL Server Native Client 10.0 server name中输入:localhost选中Select or enter a database name:然后在下拉菜单里选择:WangShouOri35、 点击Test Connection 显示连接成功信息对话框,然后点击OK关闭此对话框。36、 点击OK关闭对话框。37、 选中localhost
12、.WangShouOri然后点击OK,在Data access mode 中选择SQL command ,SQL command text中输入以下代码:select distinct EmployName,GroupName from internetsale where EmployName is not null然后点击OK。38、 从Toolbox面板中将Derived Column拖到Data Flow中,将其重命名为:DeptName2 。39、 将网售上面的绿箭头拖动到DeptName2上面。40、 双击打开DeptName2,添加DeptName列, Expression中输入
13、:“网售”,然后点击OK 。41、 从Toolbox面板中将Union All 拖到DataFlow中,分别将三个Derived Column的绿箭头拖动UnionAll上。42、 双击UnionAll查看,确保各Union All Input 值准确对应,并且数据类型一致。43、 从Toolbox面板中将Aggregate拖到DataFlow,将Union All上的绿箭头拖到Aggregate上 。确保右侧属性框中的LocaleID为English(United States)。44、 双击Aggregate,在Aggregation中选择EmployName,GroupName,Dept
14、Name ,如下图所示:然后点击OK。45、 从Toolbox面板中将OLE DB Destination拖到DataFlow 中。将Aggregate的绿箭头拖到OLE DB Destination上。确保右侧属性框中的LocaleID为English(United States)。46、 将OLE DB Destination重命名 为DimEmp。47、 双击DimEmp,在OLE DB connection manager 下拉菜单中选中LocalHost.HealthDW。48、 在Data access mode 中选择Table or view,在Name of the tabl
15、e or the view中选择dbo.DimEmp。49、 点击Mappings查看映射,然后点击OK 。50、 点击工具栏中绿色箭头,可以运行组件全部变成绿色,说明运行成功。然后停止运行,返回到设计模式。(二)抽取维度表DimProduct1、 单击Control Flow ,拖动Data Flow Task到Control Flow 中将其重命名为DimProduct。2、 双击DimProduct,然后拖动Excel source到Data Flow 中,将其重命名为店面产品。3、 双击店面产品, 在Data access mode中选择SQL command。在SQL command
16、 text 中输入如下代码:select distinct ProductName,ProductStyle,ProductClass,UnitPrice from sheet1$ where ProductName is not null 然后点击OK。4、 拖动Data Conversion 到Data Flow 中,连接 店面产品和Data Conversion。双击Data Conversion,选中UnitPrice,然后点击OK。注意:加入店面销售二组产品、店面销售三组产品 和其数据转换操作步骤同上。5、 拖动OLE DB Source到Data Flow 中 将其重命名为Pos产
17、品。6、 双击Pos产品, 出现如下图示:在OLE DB connection manager下拉菜单中选择包含Pos.accdb的那个源。在Data access mode中选择:SQL command在SQL command text 中输入如下代码:select distinct ProductName,ProductStyle,ProductClass,UnitPricefrom Sales where ProductName is not null然后点击OK。7、 拖动Data Conversion 到Data Flow 中,并连接 Pos产品和Data Conversion。8、
18、 双击Data Conversion1然后选中UnitPrice然后点击OK。9、 拖动OLE DB Source到Data Flow 中将其重命名为网售产品10、 双击网售产品,显示如下图:在OLE DB connection manager下拉菜单中选中:localhost.WangShouOri在Data access mode中选择:SQL command在SQL command text 中输入如下代码:select distinct ProductName,ProductStyle,ProductClass,UnitPrice from internetsale where Pro
19、ductName is not null然后点击OK。11、 拖动Data Conversion 到Data Flow 中,并连接 网售产品和Data Conversion2。12、 双击Data Conversion2然后选中UnitPrice,然后点击OK。13、 拖动Union All 到Data Flow中,并分别把它和Data Conversion、Data Conversion1、Data Conversion2相连接。14、 拖动Aggregate到 Data Flow中,并把它和Union All相连。15、 双击Union All查看各Output和Input列是否对应准确,
20、确保所有Input的数据类型一致。16、 双击Aggregate,出现如下图示:17、 选中PtroductName、ProductStyle,ProductClass和Copy of UnitPrice,然后单击OK。18、 拖动OLE DB Destination到Data Flow中,并把它和Aggregate相连。19、 双击OLE DB Destination,在OLE DB connection manager下拉菜单中选中localhost.HealthDW,在Data access mode中选择Table or view ,在Name of the table or the
21、view中选择dbo.DimProduct。20、 点击Mappings,然后点击OK 。21、 点击工具栏中绿色箭头,可以运行组件全部变成绿色,说明运行成功。可以到查询分析器中查看运行结果。二、抽取事实表1、 在Solution Explorer中选中SSIS Packages ,单击右键选择新建SSIS包。选中新建的包,单击右键单击选择rename,然后输入FactSales 。点击空白处显示如下图:点击Yes。2、 拖动Execute SQL Task到Control Flow窗体中,命名为truncate table FactSales。然后双击truncate table FactS
22、ales。出现如下图示:选中Connection ,点击Connection后面向下的箭头,选择New Connection出现下图:3、 Data connection 中选中HealthDW。4、 点击OK关闭Configure OLE DB Connection Manager 对话框。5、 选中SQLStatement 然后点击后面的省略号,并输入以下代码:Use HealthDWtruncate table dbo.FactSales然后点击OK。6、 拖动Data Flow Task 到Control Flow窗体中,选中truncate table FactSales拖动下面的绿
23、色箭头连接到Data Flow Task上。7、 点击名称Data Flow Task,将其修改为: 店面销售一组8、 双击店面销售一组,拖动Excel Source 到Data Flow 窗体中。9、 选中Excel Source将其重命名为:店面销售一组,并双击出现Excel Source Editor ,如下图所示:在OLE DB connection manager 下面选择New,出现Excel Connection Manager 对话框,在Excel file path 中点击Brower, C:Documents and SettingsAdministratorDesktop
24、课程快速入门第2课:数据仓库与ETL的实现过程工程文件ToDWDataSourceStore sales.xlsx文件,具体操作如下图所示:然后单击OK 。10、 Data access mode 中选择 Table or view,Name of the Excel sheet 中选择sheet1,然后点击OK。11、 拖动Derived Column到Data Flow 窗体中,将其重命名为DeptName。12、 连接DeptName和店面销售一组。13、 双击DeptName,添加 DeptName列,expression中输入”店面”,如下图所示:然后点击OK。注意:加入店面销售二组
25、、店面销售三组操作步骤同上。14、 拖动Data Convertion到Data Flow中,将DeptName的绿箭头拖到它上面,并将它重命名为:Time。15、 双击Time,选中Time列, 修改Output Alias 和Data Type如下图所示: 然后点击OK。16、 拖动Lookup组件到Data Flow中,将其重命名为:TimeKey。17、 连接Time 和TimeKey。18、 双击TimeKey 出现下图:点击ConnectionOLE DB connection manager中下拉菜单里选择LOCALHOST.HealthDW选中Use a table or vi
26、ew 在下拉菜单里选择dbo.DimDate。点击Columns 连接两表中的D列 ,并选中TimeKey,如图所示:然后点击OK。19、 拖动Lookup组件到Data Flow中,将其重命名为:EmployKey20、 连接EmployKey 和TimeKey,出现如下对话框:在OutPut:下拉菜单中选择lookup Match output,然后单击OK。21、 双击EmployKey,点击ConnectionOLE DB connection manager中下拉菜单里选择LOCALHOST.HealthDW选中Use a table or view 在下拉菜单里选择dbo.DimEmp,对话框如下图所示:点击Columns 连接两表中的DeptNa
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 26年银发护理质控要点总结课件
- 26年慢病老人饮食调理课件
- 2025年中广核笔试试题及答案
- 中小学教师副高级职称晋升讲课答辩真题附答案初中语文部分
- 房地产销售个人工作总结
- 财务成本专责个人工作总结
- 腹膜透析置管术前术后护理
- 残障人士现金业务办理指南
- 2025-2026学年鸡西市高三3月份模拟考试历史试题含解析
- 基于小学生体验式学习的城市垃圾分类政策实践探索教学研究课题报告
- 衡阳县岣嵝峰林场招聘社区网格员考试试题附答案详解
- 视频监控系统技术规范书
- 2026云南昆明市国和勘察规划设计院有限公司招聘工作人员3人考试备考试题及答案解析
- 低碳城市智慧路灯节能改造升级方案
- 第二轮土地承包到期后再延长30年试点工作意见政策解读
- 2026年监考人员培训试题及答案
- 2026年上海市奉贤区高三二模数学试卷及答案解析
- 医院屋顶光伏施工造价预算方案模板
- 2026年大连市教育基金会招聘工作人员备考题库含答案详解(满分必刷)
- 2026年原料药国际注册策略与实践
- 从创意到创业知到智慧树章节测试课后答案2024年秋湖南师范大学
评论
0/150
提交评论