数据仓库应用实例_第1页
数据仓库应用实例_第2页
数据仓库应用实例_第3页
数据仓库应用实例_第4页
数据仓库应用实例_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 数据仓库应用实例 1数据仓库的数据加载与钻取 2数据挖掘模型的设计 3SQL Server中的数据挖掘工具 4数据仓库客户端界面的设计 1 数据仓库的数据加载与钻取 1.1 数据仓库的数据加载 1. SQL Server的数据复制工具与应用 5个有关复制的向导工具:创建发布向导、创建强制新订阅向导、创建请求订阅发布、禁用发布或分布向导、配置发布和分布向导、SQL Server数据复制向导 2.创建发布向导利用发布向导可以完成这样一些操作:选择发布数据库。使用发布模板。选择发布类型。选择可更新的订阅。可传送的订阅(快照复制或事务复制可使用的选项)。指定订阅服务器类型。指定要发布的数据和数据库对

2、象项目。选择发布名称和描述。3.创建强制新订阅向导 在强制订阅中,集中的分发服务器将建立调度,按照此调度与远程的、偶尔连接的订阅服务器进行连接。使用强制订阅,分发代理程序(用于快照发布和事务发布)或合并代理程序(用于合并发布)可以运行于分发服务器。 建立订阅时要考虑的因素是需要订阅的类型(强制、请求或匿名)以及运行复制代理程序的位置。 为了创建订阅,发布服务器上必须有发布,订阅服务器上也必须有订阅数据库。可以在创建订阅之前创建订阅数据库,或在创建强制订阅向导中指定新的订阅数据库。可以为任何在发布服务器和分发服务器的属性中启用的订阅服务器创建强制订阅。3.创建强制新订阅向导4.创建请求订阅向导5

3、.禁用发布或分布向导在SQL Server的企业管理器中的“工具”菜单中打开向导菜单项,调出“选择向导”对话框,选择其中的“复制”节点,选择“禁用发布或分布向导”菜单项。进入“欢迎使用禁用发布或分布向导”对话框。利用该向导可以完成“除去所选服务器上的所有发布”或“除去对应已除去发布的所有订阅”这些设置不会影响到该服务器从其它发布服务器接受到的订阅。 1.2 超市数据仓库系统的数据加载数据仓库的数据导入 1.2 超市数据仓库系统的数据加载DTS数据导入/导出向导 1.2 超市数据仓库系统的数据加载数据导入源的选择 1.2 超市数据仓库系统的数据加载数据导入源的确定 1.2 超市数据仓库系统的数据

4、加载数据导入目的库选择 1.2 超市数据仓库系统的数据加载数据导入方式选择 1.2 超市数据仓库系统的数据加载导入数据表和视图的选择 1.2 超市数据仓库系统的数据加载数据导入源和目的的映射确定 1.2 超市数据仓库系统的数据加载数据导入的转换语言 1.2 超市数据仓库系统的数据加载数据导入任务包的保存与调度 1.2 超市数据仓库系统的数据加载任务包的作业调度 任务包的保存 任务包完成提示 任务包的浏览 1.3 多维数据集的更新DTS调度包的建立 处理任务框架 选择处理对象 调度任务处理选项确定 任务的建立 任务工作流确定 任务工作流属性设置 DTS包的保存 任务包的调度设置 任务包的运行时间

5、设置 1.4 数据仓库的钻取访问1.数据钻取的进入2.数据钻取选项的确定3.钻取数据列的选择4.数据钻取角色的管理在进行数据钻取前,还需要利用与编辑命令同一菜单中的“管理角色”命令确定可以进行数据钻取的管理人员。 5.钻取数据的选择6.钻取结果显示 1.5 数据仓库的多维表达式MDX应用MDX启动顺序:开始程序Microsoft SQL ServerAnalysis ServicesMDX示例应用程序。启动MDX以后将出现Connect对话框,在Server输入框中输入Analysis Services服务器名称,Provider输入框中输入MSOLAP,单击“OK”按钮后,出现示例应用程序窗

6、口 MDX新查询建立 MDX查询结果显示 MDX的立方体旋转显示 2 数据挖掘模型的设计 2.1 数据挖掘对象的分析由数据挖掘项目组成员共同分析数据挖掘对象超市营销策略评价主要通过门市、商品、营销策略、日期和客户五个维度。要分析的则是商品的销售量、销售额、商品的成本和商品销售的利润等度量信息。商品销售量增长率=(实施促销策略后商品销售量/实施促销策略前商品销售量-1)100%商品销售额增长率=(实施促销策略后商品销售额/实施促销策略前商品销售额)100%商品利润增长率=(实施促销策略后商品利润/实施促销策略前商品利润)100%商品促销策略门市影响率=不同门市相同促销策略商品利润增长率之比商品促

7、销策略时间影响率=不同时间相同促销策略商品利润增长率之比等各种新的变量。 2.2 数据挖掘模型与相关数据的准备1挖掘模型的确定 映射:业务数据是否能够转换成多维的、可比较的、地理的、时间的或不同的层次问题。 主要方法:分类、估计、关联分组、聚类、细分或预测等 有时为了解决一些较大的业务问题,可能还需要对业务问题进行分解,将业务问题分解成多个较小的问题。如果这些问题能够使用分类、估计、关联分组、聚类、细分或预测等挖掘方法来解决。那么这一较大的问题也就可以用数据挖掘方法解决。 2挖掘数据的准备一、建立数据挖掘库的步骤:选择业务数据、转换业务数据、验证业务数据。 二、为数据挖掘工作准备训练数据集与数

8、据验证集的步骤:确定数据质量、准备适当的数据、为目标变量确定初值、确定数据挖掘变量的格式。 2.3 数据挖掘模型的应用注意多目标变量之间的相互关系 确定多目标变量最终的分析顺序 剔除那些对目标变量具有强相关性的变量 挖掘模型的维护和完善将所获得挖掘结果存储进多维数据集 3 SQL Server中的数据挖掘工具MS SQL Server2000中的Analysis Services可以对关系数据库和多维数据源中的数据进行挖掘,因此任何利用OLE DB可以访问的关系数据源数据以及通过Analysis Services创建的多维数据集的数据都可以训练挖掘模型。而且SQL Server系统的可扩展性使

9、第三方工具能够与SQL Server的数据挖掘工具组装使用,提高了系统的性能与灵活性。 Analysis Services中所提供的数据挖掘模型主要是两种:Microsoft决策树模型和Microsoft数据聚集模型。 3.1 决策类数据挖掘工具的应用1.挖掘数据源选择2.挖掘事例表选择3.挖掘技术选择挖掘事件例关键字选择 4.挖掘参数选择挖掘模型完成对话框 5.挖掘模型保存选择挖掘模型的处理 挖掘模型编辑器 6.挖掘结果浏览 3.2 聚类分析的数据挖掘工具应用多维数据集编辑 多维数据集成员属性添加 新成员属性选择 源多维数据集选择 挖掘事例选择 预测实体选择 培训数据选择 挖掘结果存储方式选

10、择 挖掘模型保存设置 挖掘模型编辑器 挖掘模型浏览 4 数据仓库客户端界面的设计 4.1 客户端界面展现内容设计数据仓库的使用主要集中在主题的多维数据集展现、数据挖掘结果的查看浏览、管理决策的预测和数据仓库内容的动态查询。 主题多维数据集的不同维度、不同层次的上卷、下钻,可以方便地查看数据仓库的内容。 数据挖掘结果的展现 管理决策的预测 数据仓库内容的动态查询 销售分析主题展现界面设计表 分析对象界面名称基本维钻取层次12345销售收入商品子类Brand_Area.xls地区商品子类商店类型客户Brand_Time.xls时间商品子类商店类型客户类型商品地区Area_Stor.xls商店省市县

11、/区客户Cust_Time.xls时间客户客户收入Cust_Prod.xls商品客户家庭人口家庭同住人口销售分析主题展现界面设计表 分析对象界面名称基本维钻取层次12345商品扩展特性商品类型Prod_Stor.xls商店客户类型客户月消费客户收入商品子类Prod_Cust.xls客户家庭人口家庭同住人口商品商标Brad_Area.xls省市县/区活动地域商店时间Time_Cust.xls客户年季度月日客户Cust_Area.xls省市县/区活动地域商品Prod_Area.xls地区商品种类商品类型商品子类型商标销售分析主题展现界面设计表 分析对象界面名称基本维钻取层次12345客户客户活动地

12、域Area_Stor.xls商店省市县/区活动地域客户类型Cust_Prod.xls商品客户收入客户家庭人口客户住房客户汽车会员Memb_Prod.xls商品会员卡性别Sex_Time.xls时间客户类型年季度月日 4.2 客户端界面展现工具选择一般在客户端开发中可以通过C+编程使用为OLAP服务的OLE DB,在VB和ASP中使用ADO MD编写客户端程序。Microsoft Excel使用了许多为OLAP服务的OLE DB核心API,使得Excel具有了强大的OLAP数据提取和分析功能。可以采用Excel作为数据仓库的OLAP数据提取和分析的主要工具。在客户端界面展现中,有时为了对展现给用

13、户的数据仓库数据进行更好的控制,使一部分用户可以进行数据的钻取,而禁止另外一部分用户进行同样的操作,对客户按照其职能范围进行必要的安全控制,或能够使用户进行动态的数据操作,或希望将数据仓库的应用与其它的信息处理整合在一起,此时,Excel VBA就是一个很好的编程工具。 4.3 EXCEL展现界面的实现要求在客户端上有Microsoft Office 2000以上的EXCEL版本。并要求在要访问的数据仓库服务器上有Microsoft Internet Information服务(IIS)运行。在客户端计算机操作系统所在盘上的inetpubwwwroot目录中有Msolap.asp文件存在,如果没有,可以从安装OLAP Services的Program FilesMicr

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论