数据仓库与数据挖掘实验二(多维数据组织与分析).doc_第1页
数据仓库与数据挖掘实验二(多维数据组织与分析).doc_第2页
数据仓库与数据挖掘实验二(多维数据组织与分析).doc_第3页
数据仓库与数据挖掘实验二(多维数据组织与分析).doc_第4页
数据仓库与数据挖掘实验二(多维数据组织与分析).doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、实验内容和目的目的:1理解维(表)、成员、层次(粒度)等基本概念及其之间的关系;2理解多维数据集创建的基本原理与流程;3理解并掌握OLAP分析的基本过程与方法;内容:1运用Analysis Server工具进行维度、度量值以及多维数据集的创建(模拟案例)。2使用维度浏览器进行多维数据的查询、编辑操作。3对多维数据集进行切片、切块、旋转、钻取操作。二、所用仪器、材料(设备名称、型号、规格等)操作系统平台:Windows 7数据库平台:SQL Server 2008 SP2三、实验原理在数据仓库系统中,联机分析处理(OLAP)是重要的数据分析工具。OLAP的基本思想是企业的决策者应能灵活地、从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化。OLAP是在OLTP的基础上发展起来的,OLTP是以数据库为基础的,面对的是操作人员和低层管理人员,对基本数据的查询和增、删、改等进行处理。而OLAP是以数据仓库为基础的数据分析处理。它具有在线性(online)和多维分析(multi-dimension analysis)的特点。OLAP超越了一般查询和报表的功能,是建立在一般事务操作之上的另外一种逻辑步骤,因此,它的决策支持能力更强。建立OLAP的基础是多维数据模型,多维数据模型的存储可以有多种不同的形式。MOLAP和ROLAP是OLAP的两种主要形式,其中MOLAP(multi-dimension OLAP)是基于多维数据库的OLAP,简称为多维OLAP;ROLAP(relation OLAP)是基于关系数据库的OLAP,简称关系OLAP。OLAP的目的是为决策管理人员通过一种灵活的多维数据分析手段,提供辅助决策信息。基本的多维数据分析操作包括切片、切块、旋转、钻取等。随着OLAP的深入发展,OLAP也逐渐具有了计算和智能的能力,这些能力称为广义OLAP操作。四、实验方法、步骤要求:利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的各种问题和解决的方法与过程,并根据实验案例绘出多维数据组织模型及其OLAP操作过程。实验完成后,应根据实验情况写出实验报告。五、实验过程原始记录(数据、图表、计算等)本实验以实验一建立的数据仓库为基础,使用Microsoft的SQL Server Business Intelligence Development Studio工具,建立OLAP相关模型,并实现OLAP的一些简单基本功能。u 首先打开SQL Server Business Intelligence Development Studio工具,新建一个Analysis Service项目,命名为:DWu 新建:数据源,连接实验一中建立的数据仓库u u 新建数据源视图,选择OLAP中要用到的所有表 u 建立维度表和事实表之间的主外键关系,如下u 根据订单主题建立分析维度:发货方式、下单方式、订单状态、订单价值、销售人员、日期(年月日/年月旬日/年季月日/年月周日)、客户(年龄/性别/客户类型/所在地区/年收入/职称/受教育程度/婚姻状况/拥有车辆数/子女数量)以【订单价值】维度为例,说明如下:选择使用现有表,选择订单价值表:V_SUBTOTAL_VALUES 选择所有属性,设置维度名称为:订单价值,完成 添加一个层次结构,处理维度,查看效果 显示字段按字符排序,显然不符合习惯,给维度添加一个属性关系,做为字段排序依据,重新处理后查看效果 其他各维度建立完成后效果如下(部分):u 建立多维数据集,确定度量值(修改相应度量值的显示名称),选择已经建好的维度 u OLAP模型建立完成,如下为对多维数据集进行切片、切块、旋转、钻取的操作示例切片【订单价值-订单数量】切块【订单价值-订单数量-客户受教育程度】旋转【订单价值-订单数量-客户受教育程度 客户受教育程度-订单数量-订单价值】钻取【客户所在地区:国家省市-订单数量】六、实验结果、分析和结论(误差分析与数据处理、成果总结等。其中,绘制曲线图时必须用计算纸)通过本次实验,我们理解了OLAP的多维数据分析的概念,简单实现了一个多维数据分析模型,对多维数据分析的基本操作(切片、切块、钻取、旋转)有一个基本的认识。同时,在进行模型建立过程中,因为建立数据仓库过程中数据导入问题,需要我们重新检查数据仓库的ETL过程,寻找问题并予以解决,这

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论