数据仓库与数据挖掘上机实验报告.doc_第1页
数据仓库与数据挖掘上机实验报告.doc_第2页
数据仓库与数据挖掘上机实验报告.doc_第3页
数据仓库与数据挖掘上机实验报告.doc_第4页
数据仓库与数据挖掘上机实验报告.doc_第5页
免费预览已结束,剩余3页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据仓库与数据挖掘上机实验报告实验目的:学习Analysis Services的操作和基本的数据清洗实验内容:浏览SQL Server 2000 Analysis Services随机教程;规划需求分析;仓库设计;数据清洗转换;建立分析数据库,设置数据源;建立多维数据库(Cube);设置多维数据库的数据存储方式及访问权限;利用Excel2000访问Analysis Services实验分析:下面只进行两个关键的实验,数据清洗转换和建立多维数据库(使用Northwind数据库),先用数据清洗转换,将需要的表从源库转换到新数据库,为数据仓库提供需要的数据,要形成的维表有Products,Category,Employees,Dates,Facts(事实表),在实验二中Products和Category将组成雪花架构的维表。实验一:数据清洗转换内容:为数据仓库新建一个数据库,将Products,Categories,Employees,Orders,Order Details转换到新数据库,为数据仓库提供需要的数据目的:为数据仓库事实表和各维表建立基本数据步骤:1) 新建一个数据库myNorthwind,并准备从Northwind导入数据。 2) 建立Products和Categories两个维度表,将维度表需要的列从Northwind数据库复制到myNorthwind。3) 建立Employees维度表,将源表的列内容复制过来,并将源表中first name和lastname合成一个fullname列,在DTS导入/导出向导中使用SQL语句合成新的列fullname。4) 建立Dates维度表,由源表Orders表中OrderDate一列产生出年、月、日、周、季等列,同时保留OrderDate一列。在处理数据时使用了VBScript中的DatePart函数。5) 建立Facts表,(事实表)该表的数据来自Order Details表,首先用Select语句将产品类别编号和员工编号等从各自表中取出;其次计算合计列值,计算方法为单价*(1-折扣)*数量;然后将Order Details表的内容复制到Facts表各列即可;再建立主、外键关系。6) 最后的新数据库内容为:下面是需要用到的数据转换SQL语句:源表中姓名有first name和lastname两列,将它们合成一个fullname列select Employees.EmployeeID, Employees.FirstName+ +Employees.LastName FullName,Employees.Title, Employees.TitleOfCourtesy, Employees.BirthDate, Employees.HireDate, Employees.Address,Employees.City, Employees.Region, Employees.PostalCode, Employees.Country, Employees.HomePhone, Employees.Extension, Employees.Photo, Employees.Notes, Employees.ReportsTo, Employees.PhotoPathfrom Employees由源表Orders表中OrderDate一列产生出年、月、日、周、季等列select Orders.OrderID, Orders.CustomerID, Orders.EmployeeID, Orders.OrderDate,DatePart(yyyy,Orders.OrderDate) OrderYear,DatePart(mm,Orders.OrderDate) OrderMonth,DatePart(dd,Orders.OrderDate) OrderDay,DatePart(ww,Orders.OrderDate) OrderWeek,DatePart(qq,Orders.OrderDate) OrderQuarter,Orders.RequiredDate, Orders.ShippedDate,Orders.ShipVia, Orders.Freight, Orders.ShipName, Orders.ShipAddress, Orders.ShipCity, Orders.ShipRegion, Orders.ShipPostalCode, Orders.ShipCountryfrom OrdersFacts表的建立select Order Details.OrderID, Order Details.ProductID, Order Details.UnitPrice, Order Details.Quantity, Order Details.Discount, Order Details.UnitPrice*(1-Order Details.Discount)*Order Details.Quantity TotalPrice, Orders.EmployeeID, Products.CategoryIDfrom Order Details,Orders,Productswhere Order Details.OrderID=Orders.OrderID ANDOrder Details.ProductID=Products.ProductID实验二:建立多维数据库内容:建立多维数据库(cube),要建立事实表Facts和维表Products,Categories,Employees,Dates,设置多维数据库的数据存储方式目的:学会建立事实表,度量,时间维度,雪花表,使用数据存储方式步骤:1) 设置数据源,选中实验一中建立的myNorthwind数据库。2) 建立多维数据集的事实表,使用Analysis Server的向导。此时显示刚才选中的myNorthwind数据集,还有一个系统自带的FoodMart数据集。向导提示选择事实数据表,在这里我们选好了Facts表作为事实表。 *在下一步用了定义度量值的数据中选择TotalPrice,UnitPrice,Quantity,Discount作为度量,度量值的选择与决策者关心的项目有关。在这里假设决策者关心的是价格对销量产生的影响,从这些数据中可以得出进一步的经营方针。3)定义好事实表后,我们要建立cube的维度表选择维度的创建方式,维度表的结构有星型架构,雪花架构等等,在本实验中,只用到前两个架构,因为本实验中根本没必要用到其他的结构。而雪花架构的运用也只是用于学习和研究,在实际中,如此简单的数据仓库结构也不需要雪花架构,因为它会降低系统的性能。在Products和Categories表上用雪花结构,Employees和Dates用星型架构,使用Dates的OrderDate作为时间维度的日期列。选择的时间级别为年,季度,月,日,点下一步再下一步,最给给出列的名字Times。建立Employees维度表时,需要注意的是选择维度的级别,注意下图,级别名称的列中,Country应该是在City上面,分级关系中,先分国家再分城市,最后才到员工。在建立雪花架构时,将Categories和Products两表都选中,并根据其中的关系创建和编辑联接。接着是选择维度的级别等等。4)各维度表已经完成。最后在多维数据集编辑器中就可能看到大体的结构:5)用MOLAP方式保存数据,最后得到的视图是这样的:实验总结:实验一:DTS转换中对Employees,Dates,Facts表的转换存在一定的难度,但通过对VB函数的学习,也不是很困难。不过应该是注意的是:1)要新建一个数据库(此处,命名为myNorthwind),将原来数据库的内容转换格式后导回来。 2)对Facts表的转换时,要充

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论