基于数据挖掘的决策支持系统.doc_第1页
基于数据挖掘的决策支持系统.doc_第2页
基于数据挖掘的决策支持系统.doc_第3页
基于数据挖掘的决策支持系统.doc_第4页
基于数据挖掘的决策支持系统.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于数据挖掘的决策支持系统 学号:2009370185 姓名:吴萌 摘要:近年来,数据挖掘技术在市场分析预测、客户分析预测方面得到了广泛的应用,本文首先介绍了数据挖掘的定义、目的、一般过程及与此相关的一些技术。然后论述了决策支持系统的定义及发展层次,最后阐述了如何搭建一个基于数据挖掘的决策支持系统。1、数据挖掘1.1数据挖掘概述 数据挖掘是从大型数据库或数据仓库中发现并提取隐藏在其中的信息或知识的过程,即从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中具有潜在利用价值的信息和知识的过程。其目的是帮助分析人员寻找数据间潜在的关联,发现忽略的要素,而这些信息对预测趋势和决策行为是十分有用的。所以它属于决策支持系统的范畴。数据挖掘的一般过程如图1所示。1.2数据挖掘的任务 根据发现知识的不同,数据的任务可以分为以下几类:关联规则分析:其目的是发现隐藏在数据间的相互关系。这就是数据挖掘中比较成熟的问题。特征规则分析:从数据中提取出关于这些数据的特征式,用以表达该数据集的总体特征。区分规则分析发现或提取数据的某些特征,使之与对比数据区分开来。分类分析:先为每个记录赋予一个标记,即按标记分类记录,然后检测这些标记的纪录,描述出这些记录的特征。聚类分析:从数据中得出一组聚类规则,将数据分成若干类。预测:通过对数据的分析处理,估计一组数据中某些丢失数据的可能值或数据集合中某些属性值的分布情况。变化和偏差分析:探测现有数据与历史纪录或标准之间的显著变化和偏离,从而获得有用的知识。1.3数据挖掘的特点及分类 数据挖掘的特点:处理的数据规模十分巨大,一般为GB级,甚至TB级;由于用户不能形成精确的查询要求,因此需要靠数据挖掘技术来寻找其可能感兴趣的东西;在某些应用中,要求数据挖掘对数据的迅速变化做出迅速响应,以提供决策支持信息。数据挖掘既要发现潜在规则,还要管理和维护规则。而规则是动态的,当前的规则只能反映当前状态的数据特征,随着数据的不断加入,规则需要随之更新;数据挖掘中规则的发现基于统计规律,发现的规则不必适合于所有数据,而且当达到某一阙值时,便认为有此规则。因此,利用数据挖掘技术可能会发现大量规则。1.4数据挖掘的方法和常用技术 数据挖掘需要其他多种技术的支持,才能挖掘出令用户满意的结果。具体来说,有以下几种主要的数据挖掘方法。 决策树方法:利用树形结构来表示决策集合,这些决策集合通过对数据集的分类产生规则。 规则归类法:通过统计方法归纳、提取有价值的f-then规则。 神经网络方法:从结构上模拟生物神经网络,以模型和学习规则为基础,建立三大类多种神经网络模型:前馈式网络、反馈式网络、自组织网络。 遗传算法:模拟生物进化过程的算法,由繁殖(选择)、交叉(重组)、变异(突变)三个基本算子组成。为了应用遗传算法,需要将数据挖掘任务表达为一种搜索问题,从而发挥遗传算法的优化搜索能力。 K最邻近技术:这种技术通过K个最与之相近的历史记录的组合来辨别新的纪录。它可以作为聚类、偏差分析等挖掘任务。 可视化技术:将信息模式、数据的关联或趋势等以直观的图形方式表示,决策者可以通过可视化技术交互地分析数据关系可视化数据分析拓宽了传统的图表功能,使用户对数据的剖析更清楚。2、 决策支持系统2.1决策支持系统概述 决策支持系统(DSS)就是能够利用数据和模型来帮助决策者解决非结构问题的高度灵活的、人机交互的计算机信息系统,是专门为高层管理人员服务的一种信息系统。2.2 决策支持系统的体系结构 DSS的概念结构由会话系统、控制系统、运行及操作系统、数据库系统、模型库系统、规则库系统和用户共同构成。最简单和实用的三库DSS逻辑结构如图2所示。2.3 基于数据仓库的决策支持系统体系结构 将数据仓库和OLAP技术、DM技术引入DSS,提出基于数据仓库的DSS体系结构框,系统主要由三部分组成,第一部分是模型库、方法库、知识库和数据仓库及相应的管理系统;第二部分是OLAP和DM单元。第三部分是问题综合处理单元,其结构框如图3所示。 2.4 DSS的分析方法 DSS应满足决策支持系统的要求和达到DSS的性能指标,由于DSS的特殊性,对DSS的系统分析通常采用一种基于决策过程基本活动的方法,是决策者进行表达(R)、操作(O)、存储辅助(M)和控制(C)的方法,其基本思路是建立起的要求与性能之间的关系,并力求减少它们之间的差异。ROMC分析方法正式建立在用户目标的基础上的,它主要从以下几点进行分析。1表达(Representation):提供表达式以帮助决策者将问题概念化,以便于处理和交流;2操作(Operation):提供这些表达式进行分析和运算的某些操作方法;3存储辅助(Memory aid):表达与加工的存储支持;4控制机制(Control mechanism):提供处理和使用整体系统的控制机制。 首先识别的决策支持过程的基本活动,其次分析每一基本活动的组成部分:表达(R)、操作(O)、存储辅助(M)和控制(C),然后集成这些部分建立一个专用DSS。在交付使用时,设计者将继续沿着这四个方面的追踪系统和用户,不断地扩展和修改基本部件,直到用户最终满意为止。3 、基于数据挖掘的决策支持系统的建立3.1 在决策支持系统中应用数据挖掘技术 数据挖掘是指从大量数据中发现潜在的、有价值的及未知的关系、模式和趋势,并以易被理解的方式表示出来。在DSS中通过进行数据挖掘用以发现数据之间的复杂联系对决策的影响。在数据仓库基础上挖掘的知识通常以图表、可视化、类自然语言等形式表示出来,但挖掘的知识并不都是有意义的,必须进行评价、筛选和验证,把有意义的知识放到知识库中,随着时间的推移将积累更多的知识,知识库中的知识包括总结性知识、关联性知识、分类模型知识等等,这些知识通过相应挖掘算法得到,常用的挖掘技术和方法包括:决策树方法、神经网络方法、粗糙集方法、遗传算法、模糊论方法、统计分析方法、概念树方法、公示发现等。3.2 决策支持系统的发展基于数据仓库的决策支持系统 数据仓库是支持管理决策过程的、面向主题的、集成的、稳定的、不同时间的数据集合。主题是数据归类的标准,每个主题对应一个客观分析领域,它可为辅助决策集成多个部门不同系统的大量数据。数据仓库是一种管理技术,它将企业的商业数据集成到一起,为决策者提供多种类型的、有效的数据分析,起到决策支持的作用。随着数据仓库的广泛应用,基于数据仓库的决策支持系统应运而生。基于数据仓库的决策支持系统,能够为分析和决策提供查询、报表、统计、挖掘的服务。3.3 基于数据挖掘的决策支持系统的建立 基于数据挖掘的决策支持系统基本结构框架基本包括数据库、数据仓库、数据仓库管理模块、数据挖掘工具、知识库、知识发现模块、人机交互模块组成。系统的主要输入是源于数据库的数据以及存储在知识库中的知识和经验。人机交互模块通过自然语言处理和语义查询在用户和系统之间提供相互联系的集成界面。数据仓库管理模块完成数据仓库的创建以及数据仓库中数据的综合、提取等各种操作,负责管理整个系统的运转。数据挖掘工具用于完成实际决策问题所需的各种查询检索工具、多维数据的OLAP分析工具和数据开采DM工具等,以实现决策支持系统的各种要求。知识发现模块控制并管理知识发现过程,它将数据的输入和知识库中的信息用于驱动数据选择过程、知识发现引擎过程和发现的评价过程。决策支持同数据仓库管理是密切联系的。用户发出决策请求命令后,通过数据挖掘工具触发数据仓库管理模块从数据仓库中获取与任务相关的数据。 在这个“数据仓库+数据挖掘=决策支持系统”的可行性方案中,DSS以DW技术为基础,以DW工具为手段来具体实施该系统。 4 结语 本文分别介绍了数据挖掘及决策支持系统的基本概念以及相互关系,基于数据挖掘的决策支持系统不仅具有传统的DSS功能,而且通过使用数据仓库的联机分析技术和数据挖掘技术强化了DSS的智能功能。但应当注意,数据仓库不是对数据库的替代,数据仓库和操作性数据库在信息系统中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论