数据挖掘实验指导4.doc_第1页
数据挖掘实验指导4.doc_第2页
数据挖掘实验指导4.doc_第3页
数据挖掘实验指导4.doc_第4页
数据挖掘实验指导4.doc_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验2:多维数据集的建立及分析1.实验目的1) 学习使用 Microsoft Analysis Services 进行数据仓库的构建。2) 学习使用多维数据集进行OLAP分析。2.实验软硬件环境1) 安装SQL Server 2000 Analysis Services的计算机系统。2) 实验一中准备好的加载数据。3.实验说明使用实验一中整理好的数据load.mdb,学生需要建立ODBC数据源,建立分析服务器的数据库,多维数据集,并进行存储设计,处理等,并练习各种数据观察方法。多维模型如下所示:4.实验内容和步骤4.1建立系统数据源连接1)设置系统数据源名称(DSN)a. 单击“开始”按钮,指向“设置”,单击“控制面板”,然后双击“管理工具”,再双击“数据源 (ODBC)”。 b. 在“系统 DSN”选项卡上单击“添加”按钮。 c. 选择“Microsoft Access 驱动程序 (*.mdb)”,然后单击“完成”按钮。 d. 在“数据源名”框中,输入“实验二”,然后在“数据库”下,单击“选择”。 e. 在“选择数据库”对话框中,浏览到你准备的load.mdb。单击“确定”按钮。 f. 在“ODBC Microsoft Access 安装”对话框中单击“确定”按钮。 2) 启动 Analysis Manager单击“开始”按钮,依次指向“程序”、“Microsoft SQL Server”和“Analysis Services”,然后单击“Analysis Manager”。 3)建立数据库结构a. 在 Analysis Manager 树视图中展开“Analysis Servers”。 b. 单击服务器名称,即可建立与 Analysis Servers 的连接。 c. 右击服务器名称,然后单击“新建数据库”命令。 d. 在“数据库”对话框中的“数据库名称”框中,输入“实验二”,然后单击“确定”按钮。 e. 在 Analysis Manager 树窗格中展开服务器,然后展开刚才创建的“实验二”数据库。新的“实验二”数据库包含下列项目: 数据源,多维数据集,共享维度,挖掘模型,数据库角色。然后,建立到“实验二”数据源中的示例数据的连接。全部练习都将使用这个示例。 4)建立数据源在 Analysis Manager 中建立一个数据源,将数据库连接到在 ODBC 数据源管理器中建立的系统数据源名称 (DSN) 上。在建立多维数据集的过程中,所有的数据都将来自这个源。a. 在 Analysis Manager 树窗格中,右击“实验二”数据库下的“数据源”文件夹,然后单击“新数据源”命令。 b. 在“数据链接属性”对话框中,单击“提供者”选项卡,然后单击“Microsoft OLE DB Provider for ODBC Drivers”。 c. 单击“连接”选项卡,然后从“使用数据源名称”列表中单击“实验二”。 d. 单击“测试连接”以确保一切工作正常。在“Microsoft 数据链接”对话框中应出现一条消息,说明连接成功。在消息框中单击“确定”按钮。 e. 单击“确定”按钮关闭“数据链接属性”对话框。4.2建立多维数据集多维数据集是数据的一种多维结构。多维数据集由维度和度量值的集合进行定义。如何打开多维数据集向导 在 Analysis Manager 树窗格中,“实验二”数据库下,右击“多维数据集”文件夹,单击“新建多维数据集”菜单,然后单击“向导”命令。 1) 向多维数据集添加事实表-度量值度量值是要进行分析的数据库中的量化值。常用的度量值为销售、成本和预算数据。度量值根据多维数据集不同的维度类别进行分析。 a. 在多维数据集向导的“欢迎”步骤,单击“下一步”按钮。 b. 在“从数据源中选择事实数据表”步骤,展开“实验二”数据源,然后单击“订单明细”。 c. 单击“浏览数据”按钮可以查看“订单明细”表中的数据。数据浏览完毕后,关闭“浏览数据”窗口,然后单击“下一步”按钮。 d. 若要定义多维数据集的度量值,在“事实数据表数据列”下,双击“数量”列重复此步骤,然后单击“下一步”按钮。 2)建立时间维度a. 在向导的“选择多维数据集的维度”步骤,单击“新建维度”命令。此操作将调用维度向导。 b. 在“欢迎”步骤,单击“下一步”按钮。 c. 在“选择维度的创建方式”步骤,选择“星型架构:单个维度表”选项,然后单击“下一步”按钮。 d. 在“选择维度表”步骤,单击“时间”。单击“浏览数据”按钮可以查看包含在“时间”表中的数据。 查看完“时间”表后,单击“下一步”按钮。 e. 在“选择维度类型”步骤,选择“时间维度”选项,然后单击“下一步”按钮。 f. 接下来,将定义维度的级别。在“创建时间维度级别”步骤,单击“选择时间级别”,单击“年、月、日”,然后单击“下一步”按钮。 g. 在“选择高级选项”步骤,单击“下一步”按钮。 h. 在向导的最后一步,输入“时间”作为新维度的名称。注意: 使用“与其它多维数据集共享此维度”复选框,可以指定此维度是共享的,还是专用的。该复选框位于屏幕的左下角。 保持该复选框的选中状态。单击“完成”返回到多维数据集向导。 i. 在多维数据集向导中,现在应能在“多维数据集维度”列表中看到“Time”维度。 3)建立产品维度a. 再次单击“新建维度”命令。在“欢迎进入维度向导”步骤,单击“下一步”按钮。 b. 在“选择创建维度的方式”步骤,选择“雪花架构: 多个相关维度表”选项,然后单击“下一步”按钮。 c. 在“选择维度表”步骤,双击“产品”和“类别”将它们添加到“选定的表”。单击“下一步”按钮。 d. 在维度向导的“创建和编辑联接”步骤,显示在上一步选定的两个表以及它们之间的联接。单击“下一步”按钮。 e. 若要定义维度的级别,在“可用的列”下,按顺序双击“类别名称”、“产品名称”。 双击每列后,其名称显示在“维度级别”下。在选择了所有三列后,单击“下一步”按钮。 f. 在“指定成员键列”步骤,单击“下一步”按钮。 g. 在“选择高级选项”步骤,单击“下一步”按钮。 h. 在向导的最后一步,在“维度名称”框中,输入“Product”,并保持“与其它多维数据集共享此维度”复选框为选中状态。单击“完成”按钮。 i. 现在应能在“多维数据集维度”列表中看到“Product”维度。4)建立客户维度和雇员维度分别建立客户维度和雇员维度,这两个是星型模型,标准维度,每个只涉及一张表。其中客户维度定义4个级别,为国家、地区、城市、公司名称。雇员纬度定义4个级别,为国家、地区、城市、姓名。5)完成多维数据集的生成a. 在多维数据集向导中,单击“下一步”按钮。 b. 在“事实数据表行数”消息给出提示时,单击“是”按钮。 c. 在多维数据集向导的最后一步,将多维数据集命名为“实验二”,然后单击“完成”按钮。 d. 向导将关闭并随之启动多维数据集编辑器,其中包含刚刚创建的多维数据集。单击蓝色或黄色的标题栏,对表进行排列,使其符合下图所示的样子。 用鼠标右键单击上图中订单明细和产品之间的关于“单价”和“单价”的关联,删除该关联(因为这个关联妨碍多维分析)。6)设计存储和处理多维数据集可以设计多维数据集中的数据和聚合的存储选项。在使用或浏览多维数据集中的数据之前,必须先进行处理。 a. 在5)打开的多维数据集编辑器中,(或者通过鼠标右击analysis manager控制台的实验二数据库下“实验二”多维数据集,选择“编辑”,打开多维数据集编辑器),在“工具”菜单中选择“设计存储”。在 “欢迎”步骤中单击“下一步”按钮。 b. 选择“MOLAP”作为数据存储类型,然后单击“下一步”按钮。 c. 在“设置聚合选项”下单击“性能提升达到”。在此框中输入“40”作为指定百分比。 d. 此操作指示 Analysis Services 将性能提升到 40%,而不管需要多大的磁盘空间。管理员可以用此优化能力平衡查询性能需求和存储聚合数据所需磁盘空间大小。e. 单击“开始”按钮。 f. 在 Analysis Services 设计聚合时,您可以查看向导右边的“性能与大小”图。从中可以看出增加性能提升对使用额外磁盘空间的需求。完成设计聚合的进程之后,单击“下一步”按钮。 g. 在“您希望做什么?”下选择“立即处理”,然后单击“完成”按钮。 注意:处理聚合可能会花费一些时间。 h. 在处理时可以在出现的窗口中查看多维数据集。处理完成之后将出现一则信息,确认处理已成功完成。 i. 单击“关闭”按钮返回 Analysis Manager 树窗格。4.3 浏览多维数据集数据可以开始浏览 Sales 多维数据集中的数据了!使用多维数据集浏览器,可以用不同的方式查看数据:可以筛选出可见的维度数据量,可以深化以看到数据的细节,还可以浅化以看到较为概括的数据。1) 使用多维数据集浏览器查看多维数据集数据a. 在 Analysis Manager 树窗格中,右击“实验二”多维数据集,然后单击“浏览数据”命令。 b. 出现多维数据集浏览器,显示由多维数据集的一个维度和度量值组成的网格。其它三个维度显示在浏览器的上方。2) 替换网格中的维度a. 要用另一个维度替换网格中的维度,拖动上方框中的维度,然后直接将该维度放在要与其交换的列上。确保在此过程中,指针的形状为双端箭头。 b. 使用这种拖放方法,选择“客户”维度按钮并将其拖动到网格上,然后直接放在“类别名称”上方。“客户”维度和“产品”维度在多维数据集浏览器中将交换位置。 注意: 如果想将维度添加到网格,而不是用另一个维度进行替换,则将该维度拖动到网格的中间。3) 按时间筛选数据a. 单击“时间”维度旁边的箭头。 b. 展开“所有时间”和“1998”节点,然后单击“May”。将对网格中的数据进行筛选,使筛选出的数据为仅反映该月情况的数字。4) 如何深化a. 使用拖放方法交换“产品”和“mesures”。b. 双击网格中包含“中国”的单元。多维数据集展开以包括各地区列。 注意:双击已经展开的单元可以关闭。 用上述方法使维度在网格上来回移动。这有助于了解如何使用 Analysis Manager 将有关复杂数据关系的信息信手拈来。 完成后,单击“关闭”按钮关闭多维数据集浏览器。5) 钻取a. 通过鼠标右击analysis manager控制台的实验二数据库下“实验二”多维数据集,选择“编辑”,打开多维数据集编辑器b

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论