




已阅读5页,还剩87页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据仓库应用实例,1数据仓库的数据加载与钻取 2数据挖掘模型的设计 3SQL Server中的数据挖掘工具 4数据仓库客户端界面的设计,1 数据仓库的数据加载与钻取,1.1 数据仓库的数据加载 1. SQL Server的数据复制工具与应用 5个有关复制的向导工具: 创建发布向导、 创建强制新订阅向导、 创建请求订阅发布、 禁用发布或分布向导、 配置发布和分布向导、,SQL Server数据复制向导,2.创建发布向导,利用发布向导可以完成这样一些操作: 选择发布数据库。 使用发布模板。 选择发布类型。 选择可更新的订阅。 可传送的订阅(快照复制或事务复制可使用的选项)。 指定订阅服务器类型。 指定要发布的数据和数据库对象项目。 选择发布名称和描述。,3.创建强制新订阅向导,在强制订阅中,集中的分发服务器将建立调度,按照此调度与远程的、偶尔连接的订阅服务器进行连接。使用强制订阅,分发代理程序(用于快照发布和事务发布)或合并代理程序(用于合并发布)可以运行于分发服务器。 建立订阅时要考虑的因素是需要订阅的类型(强制、请求或匿名)以及运行复制代理程序的位置。 为了创建订阅,发布服务器上必须有发布,订阅服务器上也必须有订阅数据库。可以在创建订阅之前创建订阅数据库,或在创建强制订阅向导中指定新的订阅数据库。可以为任何在发布服务器和分发服务器的属性中启用的订阅服务器创建强制订阅。,3.创建强制新订阅向导,4.创建请求订阅向导,5.禁用发布或分布向导,在SQL Server的企业管理器中的“工具”菜单中打开向导菜单项,调出“选择向导”对话框,选择其中的“复制”节点,选择“禁用发布或分布向导”菜单项。 进入“欢迎使用禁用发布或分布向导”对话框。 利用该向导可以完成“除去所选服务器上的所有发布”或“除去对应已除去发布的所有订阅”这些设置不会影响到该服务器从其它发布服务器接受到的订阅。,1.2 超市数据仓库系统的数据加载,数据仓库的数据导入,1.2 超市数据仓库系统的数据加载,DTS数据导入/导出向导,1.2 超市数据仓库系统的数据加载,数据导入源的选择,1.2 超市数据仓库系统的数据加载,数据导入源的确定,1.2 超市数据仓库系统的数据加载,数据导入目的库选择,1.2 超市数据仓库系统的数据加载,数据导入方式选择,1.2 超市数据仓库系统的数据加载,导入数据表和视图的选择,1.2 超市数据仓库系统的数据加载,数据导入源和目的的映射确定,1.2 超市数据仓库系统的数据加载,数据导入的转换语言,1.2 超市数据仓库系统的数据加载,数据导入任务包的保存与调度,1.2 超市数据仓库系统的数据加载,任务包的作业调度,任务包的保存,任务包完成提示,任务包的浏览,1.3 多维数据集的更新,DTS调度包的建立,处理任务框架,选择处理对象,调度任务处理选项确定,任务的建立,任务工作流确定,任务工作流属性设置,DTS包的保存,任务包的调度设置,任务包的运行时间设置,1.4 数据仓库的钻取访问,1.数据钻取的进入,2.数据钻取选项的确定,3.钻取数据列的选择,4.数据钻取角色的管理,在进行数据钻取前,还需要利用与编辑命令同一菜单中的“管理角色”命令确定可以进行数据钻取的管理人员。,5.钻取数据的选择,6.钻取结果显示,1.5 数据仓库的多维表达式MDX应用,MDX启动顺序:开始程序Microsoft SQL ServerAnalysis ServicesMDX示例应用程序。启动MDX以后将出现Connect对话框,在Server输入框中输入Analysis Services服务器名称,Provider输入框中输入MSOLAP,单击“OK”按钮后,出现示例应用程序窗口,MDX新查询建立,MDX查询结果显示,MDX的立方体旋转显示,2 数据挖掘模型的设计,2.1 数据挖掘对象的分析 由数据挖掘项目组成员共同分析数据挖掘对象 超市营销策略评价主要通过门市、商品、营销策略、日期和客户五个维度。要分析的则是商品的销售量、销售额、商品的成本和商品销售的利润等度量信息。 商品销售量增长率=(实施促销策略后商品销售量/实施促销策略前商品销售量-1)100% 商品销售额增长率=(实施促销策略后商品销售额/实施促销策略前商品销售额)100% 商品利润增长率=(实施促销策略后商品利润/实施促销策略前商品利润)100% 商品促销策略门市影响率=不同门市相同促销策略商品利润增长率之比 商品促销策略时间影响率=不同时间相同促销策略商品利润增长率之比等各种新的变量。,2.2 数据挖掘模型与相关数据的准备,1挖掘模型的确定 映射:业务数据是否能够转换成多维的、可比较的、地理的、时间的或不同的层次问题。 主要方法:分类、估计、关联分组、聚类、细分或预测等 有时为了解决一些较大的业务问题,可能还需要对业务问题进行分解,将业务问题分解成多个较小的问题。如果这些问题能够使用分类、估计、关联分组、聚类、细分或预测等挖掘方法来解决。那么这一较大的问题也就可以用数据挖掘方法解决。,2挖掘数据的准备,一、建立数据挖掘库的步骤: 选择业务数据、 转换业务数据、 验证业务数据。 二、为数据挖掘工作准备训练数据集与数据验证集的步骤: 确定数据质量、 准备适当的数据、 为目标变量确定初值、 确定数据挖掘变量的格式。,2.3 数据挖掘模型的应用,注意多目标变量之间的相互关系 确定多目标变量最终的分析顺序 剔除那些对目标变量具有强相关性的变量 挖掘模型的维护和完善 将所获得挖掘结果存储进多维数据集,3 SQL Server中的数据挖掘工具,MS SQL Server2000中的Analysis Services可以对关系数据库和多维数据源中的数据进行挖掘,因此任何利用OLE DB可以访问的关系数据源数据以及通过Analysis Services创建的多维数据集的数据都可以训练挖掘模型。而且SQL Server系统的可扩展性使第三方工具能够与SQL Server的数据挖掘工具组装使用,提高了系统的性能与灵活性。 Analysis Services中所提供的数据挖掘模型主要是两种:Microsoft决策树模型和Microsoft数据聚集模型。,3.1 决策类数据挖掘工具的应用,1.挖掘数据源选择,2.挖掘事例表选择,3.挖掘技术选择,挖掘事件例关键字选择,4.挖掘参数选择,挖掘模型完成对话框,5.挖掘模型保存选择,挖掘模型的处理,挖掘模型编辑器,6.挖掘结果浏览,3.2 聚类分析的数据挖掘工具应用,多维数据集编辑,多维数据集成员属性添加,新成员属性选择,源多维数据集选择,挖掘事例选择,预测实体选择,培训数据选择,挖掘结果存储方式选择,挖掘模型保存设置,挖掘模型编辑器,挖掘模型浏览,4 数据仓库客户端界面的设计,4.1 客户端界面展现内容设计 数据仓库的使用主要集中在主题的多维数据集展现、数据挖掘结果的查看浏览、管理决策的预测和数据仓库内容的动态查询。 主题多维数据集的不同维度、不同层次的上卷、下钻,可以方便地查看数据仓库的内容。 数据挖掘结果的展现 管理决策的预测 数据仓库内容的动态查询,销售分析主题展现界面设计表,销售分析主题展现界面设计表,销售分析主题展现界面设计表,4.2 客户端界面展现工具选择,一般在客户端开发中可以通过C+编程使用为OLAP服务的OLE DB,在VB和ASP中使用ADO MD编写客户端程序。 Microsoft Excel使用了许多为OLAP服务的OLE DB核心API,使得Excel具有了强大的OLAP数据提取和分析功能。可以采用Excel作为数据仓库的OLAP数据提取和分析的主要工具。 在客户端界面展现中,有时为了对展现给用户的数据仓库数据进行更好的控制,使一部分用户可以进行数据的钻取,而禁止另外一部分用户进行同样的操作,对客户按照其职能范围进行必要的安全控制,或能够使用户进行动态的数据操作,或希望将数据仓库的应用与其它的信息处理整合在一起,此时,Excel VBA就是一个很好的编程工具。,4.3 EXCEL展现界面的实现,要求在客户端上有Microsoft Office 2000以上的EXCEL版本。并要求在要访问的数据仓库服务器上有Microsoft Internet Information服务(IIS)运行。在客户端计算机操作系统所在盘上的inetpubwwwroot目录中有Msolap.asp文件存在,如果没有,可以从安装OLAP Services的Program FilesMicrosoft Analysis ServicesBin中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024焊工考试考前冲刺练习试题含完整答案详解【名校卷】
- 实习律师考试历年试题汇编
- 2025年疼痛科慢性疼痛诊断与管理模拟测试答案及解析
- 初中化学重点难点分析报告
- 2025年精神病学临床诊治技术综合评估答案及解析
- 2025年流行病学疾病防控知识应用能力检测模拟考试卷答案及解析
- 水利工程河湖治理规划预案
- 工作总结:充分发挥个人优势完善工作
- 考研论文写作技巧心得分享交流
- 2025年福建中闽水务建设工程有限公司招聘8名笔试参考题库附带答案详解
- 电力电缆模拟题及答案
- 2025年药物制剂工(中级)考试题库(附答案)
- 仿古建筑施工常见问题及应对策略
- 辽宁省沈阳市2024-2025学年八年级上学期期末考试英语试题(含答案无听力原文及音频)
- 小班晨间活动体能大循环
- 绿化小型工程合同范例
- 涂层材料与叶轮匹配性研究-洞察分析
- 讯问笔录课件教学课件
- 《建筑工程设计文件编制深度规定》(2022年版)
- 2.3地表形态与人类活动课件湘教版(2019)高中地理选择性必修一
- 病例报告表(CRF)模板
评论
0/150
提交评论