版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据仓库与数据挖掘课程的实验指导实验1数据仓库的构建一、实验的目的和要求实验的目的1 .理解数据库和数据仓库的差异和联系2 .掌握数据仓库的基本方法和相关工具的使用。(2)实验要求利用实验室和指导老师提供的实验软件,认真完成规定的实验项目,真实记录实验中遇到的各种问题和解决方法和过程,描绘了模拟实验例的数据仓库模型。 实验结束后,应该根据实验情况写实验报告。二、实验设备和软件基于NT的局域网、服务器和客户机安装MS SQL Server服务系统和Analysis Services系统。三、实验内容以SQL Server为系统平台,设计、构建数据库,并在此基础上创建数据仓库。四、实验程序启动SQ
2、L Server服务SQL Server服务在SQL Server实例启动时启动。 启动SQL Server服务后,用户可以与服务器建立新连接。 SQL Server服务可以在本地或远程作为Microsoft Windows NT 4.0或Windows 2000服务启动和停止。启动MSSQLServerOLAPServices如果SQL Server服务是默认实例,则在为名为MSSQLServer的实例命名时,它被称为MSSQL $实例名称。3 .建立系统数据源连接 Microsoft Windows NT 4.0用户:单击“开始”按钮,指向“设置”,单击“控制面板”,然后双击“数据源(OD
3、BC )”。 Windows 2000用户:单击“开始”按钮,指向“设置”,单击“控制面板”,双击“管理工具”,然后双击“数据源(ODBC )”。在系统DSN标签上单击“添加”按钮。选择“microsoftaccessdriver (*.MDB )”,然后单击“完成”按钮。在“数据源名称”框中输入教程,然后在“数据库”下单击“选择”。在“选择数据库”对话框中,导航到“c : 程序文件 microsoftanalysisservicessamples”,然后单击FoodMart 2000.mdb。 单击“确定”按钮。4 .建立数据库和数据源数据库结构的构建方法在“分析管理器”树视图中,展开分析服
4、务器。点击服务器名称,建立与analysis服务器的连接。右键单击服务器名,然后单击“新建数据库”命令。在“数据库”对话框的“数据库名称”框中输入教程,然后单击“确定”按钮。在Analysis Manager树窗格中,展开服务器,然后展开您创建的教程数据库。建立数据源;在Analysis Manager树窗格中,右键单击“教程”数据库下的“数据源”文件夹,然后单击“新建数据源”命令。 在“数据链接属性”对话框中,单击“提供程序”标签,然后单击“microsoftelocommenterdbaproviderfordodbcdrivers”。单击“连接”标签,然后从“使用数据源名称”列表中单击“
5、教程”。点击“连接测试”,确认一切正常工作。 “microsoftdatalink”对话框将显示一条消息,表示连接成功。 在消息框中单击“确定”按钮。单击“确定”按钮,关闭“数据链接属性”对话框。5 .建立立方结构当前用户是foodmart公司的数据库管理员。 FoodMart是一家大型连锁店,在美国、墨西哥、加拿大有销售业务。 市场部想按产品和顾客分析1998年进行的所有销售业务数据。 使用存储在公司数据仓库中的数据,可以构建多维数据结构(多维数据集),市场分析家可以在查询数据库时快速响应。 制作销售分析的立方体。打开多维数据集向导在“分析管理器树”窗格中,右键单击“教程”数据库下的“多维数
6、据集”文件夹,单击“新建多维数据集”菜单,然后单击“向导”命令。向多维数据集添加度量值度量值是要分析的数据库中的量化值。 典型的度量值是销售、成本和预算数据。 度量的值根据立方的不同维类别进行分析。在多维数据集向导的“欢迎”步骤中,单击“下一步”按钮。在“从数据源中选择数值数据表”步骤中,展开“教程”数据源,然后单击sales_fact_1998。点击“参照数据”按钮,显示“sales_fact_1998”表的数据。 数据浏览完成后,关闭“数据浏览”窗口,然后单击“下一步”按钮。要定义多维数据集的度量值,请双击“事实数据表数据列”中的store_sales。 对store_cost和unit_
7、sales列重复此过程,然后单击“下一步”按钮。建立时间维度在向导的“选择多维数据集维”步骤中,单击“新建维”命令。 启动维向导。在“欢迎”步骤中,点击“下一步”按钮。在“选择维的创建方法”步骤中,选择“星型架构:一维表”选项,然后单击“下一步”按钮。在“选择维表”步骤中,单击“time_by_day”。 单击“浏览数据”按钮,显示“time_by_day”表中包含的数据。 确认time_by_day表后,单击“下一步”按钮。在“选择维类型”步骤中,选择“时间维”选项,然后单击“下一步”按钮。然后定义维的级别。 在“创建时间维层”步骤中,单击“选择时间层”,单击“年、季度、月”,然后单击“下一
8、步”按钮。在“选择高级选项”的步骤中,单击“下一步”按钮。在向导的最后一步中,输入“Time”作为新维的名称。点击“完成”返回“多维数据集向导”。多维数据集向导现在在“多维数据集维”列表中显示“时间”维。建立产品维度再次单击“新建维”命令。 在欢迎使用维向导步骤中,单击下一步按钮。在“选择维的创建方法”步骤中,选择“雪花架构:多个相关维表”选项,然后单击“下一步”按钮。在“选择维表”步骤中,双击Product和product_class,将其添加到“选定的表”中。 单击“下一步”按钮。维向导的“创建和编辑联接”步骤显示在上一步中选择的两个表及其联接。 单击“下一步”按钮。要定义l维的级别,请在
9、可用列中双击product_category、product_subcategory、brand_name。 双击每一列,将其名称显示在“维级别”下。 选择所有三列后,单击“下一步”按钮。l在“指定成员键列”步骤中,单击“下一步”按钮。l在“选择高级选项”步骤中,单击“下一步”按钮。l在向导的最后一步中,在“维名称”框中输入Product,并保持“与其他多维数据集共享此维”复选框处于选中状态。 单击“完成”按钮。l产品维现在显示在“多维数据集维”列表中。建立客户维度点击“新建维”命令。在“欢迎”步骤中,单击“下一步”按钮。在“选择创建维的方法”步骤中,选择“星型架构:一维表”选项,然后单击“下
10、一步”按钮。在“选择维表”步骤中,单击“客户”,然后单击“下一步”按钮。在“选择维类型”步骤中,单击“下一步”按钮。要定义维级别,请在可用列中双击Country、State_Province、City、lname。 双击每一列,其名称将显示在“维级别”下。 选择了所有四列后,单击“下一步”按钮。在“指定成员键列”的步骤中,单击“下一步”按钮。在“选择高级选项”的步骤中,单击“下一步”按钮。在向导的最后一步,在“维名称”框中输入Customer。 保持选中“与其他多维数据集共享此维”复选框。 单击“完成”按钮。多维数据集向导现在在“多维数据集维”列表中显示“客户”维。完成立方体的生成在多维数据集
11、向导中,单击“下一步”按钮。显示“事实数据表行数”的信息后,点击“是”按钮。在多维数据集向导的最后一步中,将多维数据集命名为“Sales”,然后单击“完成”按钮。向导关闭,启动包含刚创建的多维数据集的多维数据集编辑器。 点击蓝色或黄色标题栏,如下图所示排列表。实验二维数据的组织和分析(OLAP )一、实验的目的和要求实验的目的1 .理解维度(表)、成员、层次(粒度)等基本概念及其关系2 .了解多维数据集创建的基本原理和过程理解和掌握OLAP分析的基本过程和方法(2)实验要求利用实验室导师提供的实验软件,认真完成规定的实验内容,真实记录实验中遇到的各种问题和解决方法和过程,并根据实验案例描绘多维
12、数据组织模型及其OLAP操作过程。 实验结束后,应该根据实验情况写实验报告。二、实验设备和软件基于NT的局域网,服务器和客户机安装MS SQL Server服务系统和分析服务系统。三、实验内容使用Analysis Server工具创建维、度量值和多维数据集(模拟方案)。2 .使用维浏览器查询、编辑多维数据。3 .对立方体进行切片、切片、旋转、钻孔操作。四、实验程序1 .编辑多维数据集使用多维数据集向现有的销售多维数据集添加维。有两种方法可以启用多维数据集编辑器。在Analysis Manager树窗格中,右键单击现有多维数据集,然后单击“编辑”命令。使用多维数据集编辑器直接创建新多维数据集。
13、除非您是高级用户,否则不推荐此方法。从上一节的操作继续时,应该已经在多维数据集编辑器中。多维数据集的“架构”窗格中显示与数值数据表(黄色标题栏)连接的维表(蓝色标题栏)。 在多维数据集编辑器的树窗格中,可以在层次树中预览多维数据集的结构。 通过单击左窗格底部的属性按钮,可以编辑多维数据集的属性。使用存储设计向导来设计存储在“分析管理器树”窗格中,展开教程数据库下的多维数据集文件夹,右键单击销售多维数据集,然后单击编辑命令。在“欢迎”步骤中单击“下一步”按钮。选择“MOLAP”作为数据保存类型,点击“下一步”按钮。在“设置聚合选项”中,单击“提高性能”。 在此框中输入40作为指定的百分比。此操作
14、指示Analysis Services将性能提高40%,而不管所需的磁盘空间如何。 使用此优化功能,管理员可以在查询的性能要求和存储聚合数据所需的磁盘空间之间取得平衡。点击开始按钮。当Analysis Services设计聚合时,可以显示向导右侧的“性能和大小”图表。 由此可以看出,为了提高性能,需要增加磁盘容量. 聚合设计过程完成后,单击“下一步”按钮。2 .参考多维数据集数据使用多维数据集浏览器对Sales数据进行切片和切片。如何使用多维数据集浏览器显示多维数据集数据在Analysis Manager树窗格中,右键单击销售多维数据集,然后单击“浏览数据”命令。显示多维数据集浏览器,并显示由
15、多维数据集维和度量值组成的网格。 另外四个维显示在浏览器的顶部。替换网格维的方法要用其他维替换网格中的维,请将上方框中的维直接拖放到要交换维的列上。 在此过程中,请确保指针的形状为两端的箭头。使用此拖放方法,选择“产品”维按钮,将其拖动到网格上,然后直接拖放到“测量”上。 Product和Measures维在多维数据集浏览器中交换位置。注:如果要将维添加到网格,而不是添加到其他维,请将该维拖到网格的中心。按时间筛选数据单击Time维旁边的箭头。展开“所有时间”和“1998”节点,然后单击“第1季”。 网格中的数据将被筛选,筛选的数据仅反映季度情况。l通过拖放来交换产品维和客户维。 单击Product,并将其拖到Country维中。双击l网格中包含“唤醒工具”的单元格。 多维数据集已展开,包含子类别列。l完成后,单击关闭按钮关闭多维数据集浏览器。3 .编辑多维数据集您可以使用立方结构编辑器修改现有的立方结构。 使用多维数据集编辑器向现有的销售多维数据集添加维有两种方法可以启用多维数据集编辑器。在Analysis Manager树窗格中,右键单击现有多维数据集,然后单击“编辑”命令。使用l多维数据集编辑器直接创建新多维数据集。 除非您是高级
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医学26年:产学研医协同创新 查房课件
- 26年抗拒洗澡老人应对技巧课件
- 语文01卷(广东广州专用)-(参考答案)七年级下册语文期末考试
- 施工安全培训安全管理网
- 七年级语文上册第二单元7散文诗两首习题
- 【高中语文】+高考语文考前指导
- 幼儿安全宣传日
- 记账实操-承包业务的会计分录
- 煤炭开采合同协议2026年安全版
- 3.2做自尊的人课件 2025-2026学年统编版道德与法治七年级下册
- 景德镇市检察机关2026年公开招聘司法辅助文员工作【26人】笔试参考题库及答案解析
- 2026届天津市东丽区重点中学中考押题历史预测卷含解析
- 2026广东惠州惠城区桥东街道招聘党建联络员和村(社区)“两委”班子储备人选11人笔试参考题库及答案详解
- 北京市西城区2026年高三模拟测试(二模)英语试卷(含答案)
- 2025年全国金属非金属矿山企业主要负责人考试练习题有答案
- 2026年北京各区高三语文一模作文题汇编(高考趋势题附标杆文)
- 储能电站电池热失控火灾应急演练脚本
- 简阳市中小企业融资担保有限公司2026年招聘金融科技部工作人员等岗位笔试参考题库及答案解析
- 2026上海市闵行区区管国企招聘42人备考题库含答案详解(精练)
- 保洁12小时工作制度
- 输变电工程可行性研究内容深度规定(2025版)
评论
0/150
提交评论