数据仓库实验二_第1页
数据仓库实验二_第2页
数据仓库实验二_第3页
数据仓库实验二_第4页
数据仓库实验二_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据仓库与数据挖掘设计并构造AdventureWorks数据仓库实例2015-2016学年 第1学期 学院: 电子工程学院 学号: 姓名: 2016年1月实验二 设计并构造 AdventureWorks 数据仓库实例1. 实验目的在 SQL Server 平台上,利用 AdventureWorks 数据库作为商业智能解决方案的数据源,设计并构造数据仓库,建立 OLAP 和数据挖掘模型,并以输出报表的形式满足决策支持的查询需求。2. 实验环境及工具实验环境:win7 系统实验工具:Microsoft SQL Server 2012SQL Server Management StudioSQL S

2、erver Data Tools3. 实验内容3.1 需求分析AdventureWorks 数据库中有很多实体关系表,涉及到自行车制造企业的人力资源、产品管理、市场销售和采购、供应商管理及生产管理多个方面。而作为自行车的决策者,最关心的就是销售业绩的问题。而这里经过思考,主要是对这几个主题完成以下三个目标:(1)分析不同类别的产品通过网上销售在不同时间段内销售的业绩;(2) 生成分析结果的报表;(3)分析影响客户所有车的数量的因素。3.2 确定主题与边界对于该类自行车商品的公司管理层,需要关注和分析的主题主要是四个:供应商、产品、库存、和客户。其中商品主题的内容包括记录超市商品的采购情况、商品

3、的销售情况和商品的存储情况;客户主题包括的内容可能有客户购买商品的情况;仓库主题包括仓库中商品的存储情况和仓库的管理情况等,简单的主题关系图如图 3-1 所示。图3-1 主题关系图分析销售业绩主要基于三个维度:产品、客户和时间。事实数据为销售记录。3.2.1 产品维度对于产品,起关键作用的是产品名称和分类。所以对产品实体,应该具备表3-1 中的属性。产品的各个属性存在 dbo.DimProduct 表中。属性含义类型约束ProductKey确定唯一产品的主键intNot nullEnglishProductName产品英文名nvarchar(50)Not nullColor产品颜色nvarch

4、ar(15)Not null表3-1 产品维度属性表3.2.2 客户维度客户维度则主要关心姓名、年龄、性别、受教育程度、子女个数、是否拥有房产、拥有汽车数量、所在地区等信息,如表格 3-2 中所示。客户的各个属性存在 dbo.DimCustomer 和 dbo.DimGeography等表中,表之间通过主键或外键连接。属性含义类型约束CustomerKey表示唯一客户的主键intNot nullCustomerAlternateKey客户全称nvarchar(15)Not nullGeographyKey客户地理位置,外键int表3-2 客户维度属性表3.2.3时间维度对于时间维度,相关的是年

5、、月、日、季度、半年等,与时间相关的信息存放在dbo.DimDate 表中。图3-2 时间维度图3.2.4事实数据对于事实数据,只关心订单产品价格、折扣、数量和总价等情况,它的所有属性如表格 3-4 中所示。其中,单位产品价格及折扣、订单总数和订单总价等信息在 dbo. FactInternetSales 表中,如下图所示。图3-3 事实数据图3.3 逻辑模型创建3.3.1 添加数据源(1)运行 AdventureWorks SQL Server 2005示例数据库 .msi 文 件,生成AdventureWorks_Data.mdf 和AdventureWorks_Log.ldf 文件。在

6、Microsoft SQL Server Management Studio 工具中,右键点击对象资源管理器中的数据库节点,选择“附加”选择 AdventureWorks_Data.mdf ,可看到AdventureWorks 中的表格及其内容,如图 3-2 所示。图 3-4. AdventureWorks 导入数据库同样的方法,附加了AdventureWorks SQL Server 2012示例数据库AdventureWorksDW2012。在后续操作中使用AdventureWorks DW 2012。图 3-5. AdventureWorks DW 2012 导入数据库(2) 在 SQL

7、 Server Data Tools 工具中,创建一个Analysis Services商业智能项目Analysis Services Tutorial,为它创建新的数据源,选择步骤(1)中的数据库。生成 AdventureWorks 对应的数据源,如图 3-6 所示。新建完成后数据源下出现AdventureWorks DW 2012。图3-6. 添加数据源3.3.2 添加数据源视图右击添加数据源视图,选择AdventureWorks DW 2012 数据源,选择需要添加的表格,这里我关心的只有产品、客户的信息,所以选择 DimProduct、DimCustomer、DimDate、FactI

8、nternetSales及相关的表格,并以此将表名中的Dim去掉。添加好后的数据源视图如图 3-7 所示。图3-7. 数据源视图3.3.3 添加维度维度的添加方式都是右击维度,使用现有表来新建。(1)添加时间维度,选择相应的属性。图 3-8. 时间维度(2) 添加产品维度,选择相应的属性。图3-9. 产品维度(3) 添加客户维度,选择相应的属性图3-10. 客户维度3.3.4 添加多维数据集根据上面添加生成的维度,生成多维数据集。右键点击多维数据集,选择新建,使用现有表建立,度量值选为Internet Sales,维度选择上一步生成的即可。图3-11. 度量值与维度图3-12. 多维数据集3.

9、4 部署 Analysis Services 项目新建多维数据集成功之后,进行部署。第一次部署失败,提示错误28000。如图3-13所示。图3-13. 部署失败解决方法:在SQL Server Management Studio中新建一个账户,并映射到AdventureWorks DW 2012、权限设置为db_datareader。然后在Data Tools中双击数据源下的AdventureWorks DW 2012,把模拟信息改成使用服务账户。最后重新点击部署,部署成功。图3-14. 部署成功3.5决策树建立上述完成后可以可以在工具栏的窗口中查看信息。如图 3-15 所示,为维度用法。图3-15. 浏览维度用法右击挖掘结构,建立相应的挖掘结构模型,通过决策树等直观查看挖掘结果。图3-16. 决策树结果示例4. 实验总结通过本次实验,熟悉了 SQL Server 2012 的使用以及 Analysis Services 项目的创建和部署,加深了数据仓库中数据源、维度、多维数据集等概念的理解,并且练习运用这些组成部分构建和部署数据仓库,通过建立决策树对数据进行挖掘。对本课程的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论