(计算机应用技术专业论文)决策支持系统中的模型选择研究——决策树分类算法.pdf_第1页
(计算机应用技术专业论文)决策支持系统中的模型选择研究——决策树分类算法.pdf_第2页
(计算机应用技术专业论文)决策支持系统中的模型选择研究——决策树分类算法.pdf_第3页
(计算机应用技术专业论文)决策支持系统中的模型选择研究——决策树分类算法.pdf_第4页
(计算机应用技术专业论文)决策支持系统中的模型选择研究——决策树分类算法.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(计算机应用技术专业论文)决策支持系统中的模型选择研究——决策树分类算法.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着计算机科学与技术的发展,计算机被应用到各行各业。决策支持系统( d e c i s i o n s u p p o r ts y s t e m ,简称d s s ) 越来越被人们重视,决策支持系统的模型系统也同样受到人 们越来越多的重视。 早期决策支持系统的模型系统将模型作为数据或子程序存储,并采用类似数据管理 的办法对模型进行管理。随着决策问题日益复杂化和支持知识处理的需要,这种简单的 模型系统己不能适应新的决策需求。 近年来,在模型选择方法和模型选择知识处理等方面取得了一些进展。但因为模型 选择是一个比较困难的问题,至今这方面的成果还很有限,绝大多数研究成果还不能实 现自动模型选择,而是依靠专家经验进行选择。基于这种情形,研究模型的自动选择具 有一定的理论价值和深远的意义。 本文对典型决策树分类算法进行研究后,针对规则生成方法对决策树算法进行了改 进。在属性的信息熵和信息增益的计算公式中加入一个根据专家的先验知识和领域知识 而定义的平衡度系数,将其加权和变为加权和与系数的和,从而可以增加某些属性的信 息熵,相应的降低其他属性的信息熵。用改进后的决策树算法建立的决策树比原决策树 更紧凑、简单,这不但可以加快决策树的生长,而且可以得到结构比较好的决策树,以 便从中挖掘出更有价值的规则信息。 文章最后通过建立某大型超市决策模型对改进后的决策树算法进行实例分析,并依 据u c i 公共数据库中的4 个标准数据集为数据源,对建立的决策树模型进行了模拟仿真 测试。实验证明,改进算法在基本上不改变原来算法预测精度的基础上,建立的决策树 模型更紧凑、简洁。减少了决策者的劳动量,更易于被决策者们所采用。最后总结本次 研究所取得的成果,提出不足与待改进的部分,供以后继续研究。 关键词:决策支持系统:决策模型;决策树算法;平衡度系数 人连交通人学t 学硕+ 学位论文 a b s t r a c t w i t ht h ed e v e l o p m e n to fc o m p u t e rs c i e n c ea n dt e c h n o l o g y ,c o m p u t e ri sa p p l i e dt oa l lo f l i f e t h em o d e ls y s t e mo fd e c i s i o ns u p p o r ts y s t e mi sa l s om o r ea n dm o r ea t t e n t i o nt op e o p l e e a r l yt h em o d e ls y s t e mo fd e c i s i o ns u p p o r ts y s t e ms t o r a g e st h em o d e la sad a t ao ra s u b r o u t i n e ,a n dm a n a g e sm o d e l sb yam e t h o do fs i m i l a rd a t am a n a g e m e n t w i t ht h e i n c r e a s i n gc o m p l e x i t yo fd e c i s i o n m a k i n ga n dn e e d so fs u p p o r tf o rk n o w l e d g ep r o c e s s i n g , t h i ss i m p l em o d e ls y s t e mc a nn o tm e e tt h en e w d e c i s i o n - m a k i n gn e e d s t h e s ey e a r s ,i nt h ea s p e c t so fm o d e ls e l e c t i o nm e t h o da n dm o d e ls e l e c t i o nk n o w l e d g e m a n a g e m e n th a sm a d es o m ep r o g r e s s h o w e v e r ,s i n c em o d e ls e l e c t i o ni sad i f f i c u l tp r o b l e m , s of a rt h er e s u l t si n t h i sf i e l da r es t i l ll i m i t e d ,t h ev a s tm a j o r i t yo fr e s e a r c hr e s u l t sa r ea l s on o t a c h i e v ea u t o m a t i cm o d e ls e l e c t i o n ,b u tr a t h e rd e p e n do ne x p e r t sa n d p a s tc h o i c ee x p e r i e n c et o c h o o s e b a s e do nt h i ss c e n a r i o ,t h ea u t o m a t i cm o d e ls e l e c t i o nh a sac e r t a i nt h e o r e t i c a lv a l u e a n df a r r e a c h i n gs i g n i f i c a n c e t h i sp a p e r , a f t e rs t u d yo fd e c i s i o nt r e ec l a s s i f i c a t i o na l g o r i t h m ,d i r e c tt o w a r d st h er u l e g e n e r a t i o nm e t h o d s ,i m p r o v ed e c i s i o nt r e ea l g o r i t h m a d dac o e f f i c i e n td e f i n e db a s e do n e x p e r t sp r i o r ia n dd o m a i nk n o w l e d g et oc a l c u l a t i o nf o r m u l a so fs o m ep r o p e r t yi n f o r m a t i o n e n t r o p i e sa n di n f o r m a t i o ng a i n s t r a n s f o r mw e i g h t e ds u mi n t os u mo fw e i g h t e ds u ma n d w e i g h t e dc o e f f i c i e n t s ,w h i c h c a ni n c r e a s es o m ea t t r i b u t ei n f o r m a t i o n e n t r o p i e s ,a n d c o l l r e s p o n d i n gr e d u c t i o no t h e rp r o p e r t yi n f o r m a t i o ne n t r o p i e s t h ed e c i s i o nt r e ee s t a b l i s h e d b yt h ei m p r o v e dd e c i s i o nt r e ea l g o r i t h mi sm o r ec o m p a c ta n ds i m p l et h a nt h eo r i g i n a l ,a n di t c a nn o to n l ys p e e du pt h eg r o w t ho fd e c i s i o nt r e eb u ta l s oc a ng e tab e t t e rs t r u c t u r ed e c i s i o n t r e e ,i no r d e rt oe x c a v a t eb e t t e rr u l e sf r o mi n f o r m a t i o n e n d ,t h i sp a p e rh a sac a s es t u d yi nt h ed e c i s i o n - m a k i n gm o d e le s t a b l i s h e db yt h e i m p r o v e dd e c i s i o nt r e ea l g o r i t h mb yf o r m i n gad e c i s i o n - m a k i n go fas u p e r m a r k e t a n dh a sa a n a l o gs i m u l a t i o nt e s tf o rt h ed e c i s i o n m a k i n gm o d e lu s i n gf o u rd a t as e t so fu c ip u b l i c d a t a b a s e e x p e r i m e n t ss h o wt h a t t h ei m p r o v e da l g o r i t h me s t a b l i s h e dam o r ec o n c i s e d e c i s i o n m a k i n gm o d e lb a s e do nd o e sn o tc h a n g et h ep r e d i c t i o na c c u r a c yo ft h eo r i g i n a l a l g o r i t h mb a s i c a l l y r e d u c ed e c i s i o nm a k e r s l a b o ri n p u ta n di t i sm o r ee a s i l yu s e db y d e c i s i o nm a k e r s a tl a s t ,c o n c l u d et h er e s u l t so ft h i si n s t i t u t ea n dp r o p o s et h ei m p r o v e dp a r t a n dt h es h o r t a g ef o rs t u d yi nt h ef u t u r e k e yw o r d s :d s s ;m o d e l ;d e c i s i o nt r e ea l g o r i t h m ;e q u i l i b r i u mc o e f f i c i e n t n 大连交通大学学位论文独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作 及取得的研究成果。尽我所知,除了文中特别加以标注和致谢及参考 文献的地方外,论文中不包含他人或集体已经发表或撰写过的研究成 果,也不包含为获得太壅塞通太堂或其他教育机构的学位或证书而 使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在 论文中作了明确的说明并表示谢意。 本人完全意识到本声明的法律效力,申请学位论文与资料若有不 实之处,由本人承担一切相关责任。 学位论文作者签名:魂渺梅 日期: 争呷年陟月砂日 大连交通大学学位论文版权使用授权书 本学位论文作者完全了解太整塞通太堂有关保护知识产权及保 留、使用学位论文的规定,即:研究生在校攻读学位期间论文工作的 知识产权单位属太整塞通太堂,本人保证毕业离校后,发表或使用 论文工作成果时署名单位仍然为太整塞通太堂。学校有权保留并向 国家有关部门或机构送交论文的复印件及其电子文档,允许论文被查 阅和借阅。 本人授权太董塞通太堂可以将学位论文的全部或部分内容编入 中国科学技术信息研究所中国学位论文全文数据库等相关数据库 进行检索,可以采用影印、缩印或扫描等复制手段保存j 汇编学位论 文。 ( 保密的学位论文在解密后应遵守此规定) 学位论文作者签名:馥玩偬导师签名: 日期:矽萨陟月砂日日期:枷哆年v 月砂日 学位论文作者毕业后去向: 工作单位: 通讯地址: 电子信箱: 电话: 邮编: 绪论 绪论 1 课题的提出 决策支持系统是在电子数据处理系统和管理信息系统的基础上发展起来的一种更 高级的管理信息系统。它是一种以支持半结构化或非结构化的决策过程为特征的人机交 互系统,主要用来为决策者提供分析问题、构造模型、模拟决策过程及评价决策效果的 决策支持环境。 决策支持系统的发展经历了从单机向网络、分布式平台的发展过程,在这个发展过 程中,模型的种类繁多,类别不同,编程语言差异;模型之间的关系不自然,缺少一种 在决策过程中控制和使用模型的方法;模型和数据之间的联系缺乏统一性。以上问题导 致模型所需要的数据常常不可使用,模型的输出难以进一步使用,缺乏模型和用户之间 的交互。 对使用人员来说需要有一个良好的对话接口,对维护人员来说需要有一个方便的软 件工作环境。可以说,人机对话系统是决策支持系统的一个窗口,它的好坏标志着该系 统的水平。基于现实的考虑,不能指望决策支持系统的使用者掌握过多的模型知识,因 此,实现模型的自动选择,就有着非常重要的意义。 2 模型选择研究的国内外现状 在决策支持系统的发展过程中模型管理是决策支持系统走向实用和成功的关键。模 型管理的主要研究内容有模型操纵方法和模型表示等。其中,模型选择又是模型操纵的 基础,在模型管理中起着重要的作用。并且,模型选择也是决策问题求解中的重要问题。 但至今模型选择方面的研究成果还很有限,大多数研究成果尚不能实现模型的自动选 择,而是依靠专家经验进行选择。 下面分别从模型管理角度、模型选择层次角度和模型选择方法角度等三个方面描述 模型选择的研究现状: 从模型管理角度,d g h o s h 和r a g n a v a n 将模型选择分为两类:一类是根据问题的 特征从模型库中选出适合的模型;另一类是在没有合适的单一模型的情况下,将两个或 两个以上的简单模型以一定方式结合成求解复杂决策问题的模型串。l i a n g 则将基于实 例的学习应用于i d s s 的模型管理中瞳1 ,用于处理更为复杂的知识结构方面。 从模型选择层次角度,s b a n e r j c c 和a b a s u 将模型选择i o i 题分为两个层次呤1 :模型 结构选择和模型实例确定。模型结构选择指根据问题的特征从众多的模型结构中选择一 个合适的模型结构。模型实例确定就是在选择模型结构之后,对该模型结构中的一些参 火连交通人学f j 学硕十学位论文 数进行估值,这些参数确定后模型实例也就得到确定。下面分析这两个方面的研究状况: ( 1 ) 模型结构选择可以定义为一个这样的过程,即利用观测数据提供的信息采用一 定的统计推断技术,依据一定的标准,对给定的若干模型结构,进行特征的比较,从而 选定在当自 条件下最优的模型。 国内在模型选择方面作了如下的研究工作:许复兴应用模糊数学原理,给出了一种 回归方程最优选择的综合评判法h 1 ;汤军其等将人工神经网络用于模型结构选择的方法 畸1 ;喻永新等将f u z z y 真值传播用于模型选择阳1 等。 国外在模型结构方面的研究,较为典型的研究工作有b o x 和j e n k i n s 提出的被广泛 采用的时间序列模型及其建模方法口1 ;s a d d a n k i 等提出了一种“模型图的方法陋3 ;另 外还有s e h o u k e n sj o h a n 和d o b r o w i e c k it a d e u z z 等提出的a r 模型选择方法阳3 ;j c o b s r o b e z t a 和p e n g 、f e n g c h u n 等提出的使用马尔可夫链来选择模型的方法n 们及s u z u k i j a e 对模型选择正确率的研究1 等。 ( 2 ) 模型实例的确定,模型实例就是对某具体问题的特定的表达形式。模型实例的 确定是在选定模型结构的基础上,根据所给定的具体问题,确定出一个能用于解决该具 体问题的模型。传统的模型实例确定方法是根据模型结构的不同采用不同的方法。 从模型选择方法的角度来看,该方法又可分为两类: ( 1 ) 模型选择的解析方法。该方法最早由k l e o n 等人提出,用来选择单一模型n 2 1 和 组合模型n 3 1 。 ( 2 ) 模型选择的人工智能方法。该方法指依据一定的模型选择策略( 启发式算法、专 家规则) ,自动地从模型库中选取合适的模型。m a r o no d e d n 钔等人利用竞争策略方法选 择模型;b a r i n z e n 5 1 采用规则推导的方法选择预测模型;黄梯云教授将b p 神经网络用 于趋势外推预测模型结构的选择;向阳等将a g e n t 技术用于模型选择n 引。人工智能技术 在模型选择问题研究中的应用,极大地推动了模型管理的研究工作,目前,人工智能技 术也是一个正在不断发展的领域,这方面研究的进展,将会极大的影响模型管理的研究 工作。 3 目前模型选择方法的不足 以上研究丰富了模型选择的方法,但基于目前模型选择方法的决策支持系统仍然存 在以下不足之处n 刀: ( 1 ) 缺乏良好的人机交互手段。目前大多数d s s 是采用命令驱动、菜单驱动、图形 界面等技术,但是从本质上来说,这些技术都是静态的,在设计时求解过程就己经固化 在系统中,决策者既不能根据问题需要主动建造适当的模型,也无法对问题求解过程提 出自己的建议。 2 绪论 ( 2 ) 缺乏适应学习的能力。适应学习能力是指系统无论何时,当知识库对于新的情 况、新的事例的决策不适应时,模型就应该能够自动地进行再学习,精炼现有的知识库。 适应性是任何系统处于一个易变的、不确定的环境下维持下去的最重要的能力之一。也 正是适应性使一个系统能够对内部或外部引起的需求变化做出反应,能够处理不确定的 问题。决策坏境是不断变化的,因此决策支持系统应能随着环境和时间的变换和具体决 策问题的不同作适当的调整,传统的d s s 尚缺乏这种适应能力。 ( 3 ) 知识获取的困难。知识获取的途径之是由知识工程师向领域专家获取;另一 途径是由机器学习方式自动获取。领域专家往往很难将自己的知识表达清楚,很多专家 在很多场合,可能知道怎样去解决面对的问题,但是说不出为什么应当这样解决。因为 专家只是凭直觉凭经验这样做的,并且专家的知识未必很好,有时甚至还可能出错。这 样会使获取的知识很成问题,而由机器学习方式自动获取知识的能力仍然相当低。因此, 知识的获取仍是目前亟待解决的问题。 ( 4 ) 缺乏对经验的积累。对于单一的决策者来说,决策环境相对稳定,他所面对的 决策问题存在很大的相似性。通常传统的d s s 相互独立地确定相似问题的求解过程, 模型的利用率较低,造成了系统时间和空间开销的浪费。 4 本论文工作及论文结构 本论文工作: 本文主要对典型决策树分类算法进行研究后,针对规则生成方法即属性选择标准算 法在特定环境下对决策树算法进行了改进。在某些属性的信息熵和信息增益的计算公式 中加入一个根据专家的先验知识和领域知识而定义的平衡度系数,将其加权和变为加权 和与平衡度系数的和,从而可以增加这些属性的信息熵,相应的降低其他属性的信息熵。 用改进后的决策树算法建立的决策树比原决策树更紧凑、简单,这不但可以加快决策树 的生长,而且可以得到结构比较好的决策树。最后选取u c i 公共数据库中的数据集对改 进后算法生成的决策树模型进行验证,从算法的结点数目和分类错误率两个方面进行比 较。结果显示,与原始的c 4 5 算法相比较,改进后的c 4 5 算法可以构建出更加简洁的 决策树分类模型,而改进后的算法在预测精度方面与原始的c 4 5 算法基本持平,即改 进后的c 4 5 算法在基本上不改变原来c 4 5 算法预测精度的基础上,可以构建出规模较 之相对较小的决策树。而且随着样本总数的增长,条件属性数的增多,这种优势会更加 明显。 论文结构: 论文以决策支持系统中的模型选择技术为背景,将改进后的决策树学习算法在某大 型超市的决策模型中进行实例分析。本文的具体安排如下: 3 人连交通人学i :学硕十学f 节论文 首先是绪论部分,主要介绍了课题的背景,目前的研究现状和论文将要进行的主要 研究工作。 第一章、将对决策支持系统进行系统的概述。包括决策支持系统的产生与发展、决 策支持系统的定义、决策支持系统的功能、决策支持系统的体系结构以及现有决策支持 系统中现存的模型问题等。 第二章、将对决策模型进行详细介绍。包括模型的定义、用途、分类以及模型的选 择。在模型的选择中又将对模型选择的分类、模型选择的步骤以及模型的结构选择进行 详细叙述。 第三章、将对决策树分类算法进行详细介绍。其中包括决策树的描述、生成过程及 决策树分类算法的性能评价,然后是常见的几种决策树分类算法的介绍包括i d 3 算法、 c 4 5 算法、s u q 算法和s p r i n t 算法等,最后将对几种常见的决策树分类算法进行简 单的比较。 第四章、将对决策树分类算法中的c 4 5 算法进行改进。其中包括c 4 5 算法的描述、 算法属性选择标准的改进、算法的构建流程、算法的数据结构、算法的实例分析和算法 的实现等等。 第五章、将会详述改进后的c 4 5 算法生成的决策树模型建立及评估过程,并在某 大型超市的决策模型中进行实例分析。其中包括问题的定义、数据的收集、数据的预处 理( 清洗、提取、转换和加载) 、模型的建立以及决策规则的生成等。最后将对建立的模 型进行模型评估,包括决策树选择属性的分析、决策树规则的分析以及决策树性能的分 析等等。 最后,将对整篇论文进行总结。 4 第一章决策支持系统概述 第一章决策支持系统概述 1 1 决策支持系统的定义、产生与发展 人们在进行各种活动之前经常要做出各种各样的决策。通俗一点说,决策就意味着 要解决问题。一个决策系统一般包含了五个基本要素:决策者、决策对象、决策信息、 决策理论与方法、决策结果。 1 9 7 1 年,美国g o r r y 、m o r o n 等人首次提出“决策支持系统d s s ”术语,标志着决 策支持理论研究的开始。3 0 多年来,d s s 已在理论研究、系统开发支持新技术的探讨 和实际应用等诸方面取得了较大的进展,呈现出多元化的发展态势。d s s 的理论发展及 其开发与很多学科有关,它涉及到计算机、网络、数据库、信息论、人工智能、信息经 济学、管理科学、行为科学等,显然这些学科构成了d s s 发展的理论框架,亦称之为 d s s 的理论基础。 8 0 年代初期,关系数据库技术日益成熟,决策支持研究得到进一步深化,出现了基 于关系数据库的“三库和“四库一结构的决策支持系统。 在d s s 的发展过程中,决策支持是一个先导性的概念,决策支持的概念形成若干 年后,才出现决策支持系统。可以说,决策支持是目标,而决策支持系统则是实现目标 的工具。 虽然d s s 已经得到了很大的发展,但至今没有个明确的被公认的定义,不同的 学者从不同的角度阐述了自己的看法: 1 9 7 8 年,k e n n 首先给出了d s s 的定义:“决策支持系统是一个计算机系统,该系 统对决策有其影响。其中,计算机及分析辅助工具是有作用的。但管理者的判断仍是决 策制定的基础州坩1 。k e n n 的定义强调了d s s 的主要功能是辅助决策制定,而且指出d s s 不能取代决策制定者的地位。 1 9 8 1 年,b o n c z e k 从d s s 的结构框架方面指出:“决策支持系统是一个基于计算 机的系统,该系统由三个部分组成:语言系统、问题处理系统和知识系统川1 9 1 。b o n c z e k 的定义为d s s 系统框架的建立提供了依据。同年,g i n z b e r g 指出:“决策支持系统是 一个基于计算机的信息系统,用于支持不可能或不能期望有一个自动的系统实现整个决 策制定过程情况下的决策制定活动”n 8 帕1 。这个定义在k e n n 定义的基础上,进一步表 明支持半结构化和非结构化条件下决策制定过程是d s s 的主要任务。 2 0 0 1 年,s e a n 综合了上述观点给出了d s s 的特征性定义:“d s s 是一种基于计算 机的、具有人机交互功能的决策制定辅助系统,并具有如下的特征:辅助决策制定而不 5 大连交通大学r 学硕十学忙论史 是取代决策者;有效利用数据和模型进行决策制定;对半结构化问题、非结构化或病态 结构问题进行求解;注重于决策过程的有效性”n 7 1 引。 至今,决策支持系统仍没有一个完备公认的定义。其实,对于一个处于快速发展中 的事物,给出一个完善的定义未必是一个明智之举。d s s 没有标准的模式或标准规范。 凡是能达到决策支持这一目标的所有技术都可以用于构造d s s 。不同时期、不同用途、 采用不同技术所构造的d s s 可能完全不同。但是,有一点却是共同的,那就是d s s 一 定能起到决策支持的作用。因而把握住d s s 的基本特征和发展方向有着很重要的意义。 d s s 的基本特征: ( 1 ) 面对上层管理人员经常面临的结构化程度不高、说明不够充分的问题。 ( 2 ) 把模型或分析技术与传统数据存储技术及检索技术结合起来。 ( 3 ) 易于为非计算机专业人员以交互会话的方式使用。 ( 4 ) 强调对环境及用户决策方法改变的灵活性和适用性。 ( 5 ) 支持但不是代替决策者制定决策。 d s s 的结构特征: ( 1 ) 模型库及其管理系统。 ( 2 ) 数据库及其管理系统。 ( 3 ) 知识库及其管理系统。 ( 4 ) 交互式计算机硬件及软件。 ( 5 ) 对用户有好的建模语言。 1 2 决策支持系统的功能 ( 1 ) 管理并随时提供与决策问题有关的组织内部信息。如:订单要求、库存状况、 生产能力与财务报表等。 ( 2 ) 收集、管理并提供与决策问题有关的组织外部信息。如:政策法规、经济统计、 市场行情、同行动态与科技进展等。 ( 3 ) 收集、管理并提供各项决策方案执行情况的反馈信息。如:订单或合同执行进 程、物料供应计划落实情况、生产计划完成情况等。 ( 4 ) 能以一定的方式存储和管理与决策问题有关的各种数学模型。如:定价模型、 库存控制模型与生产调度模型等。 ( 5 ) 能够存储并提供常用的数学方法及算法。如:回归分析方法、线性规划、最短 路径算法等。 ( 6 ) 上述数据、模型与方法能容易地修改和添加。如:数据模式的变更、模型的连 6 第章决策支持系统概述 接或修改、各种方法的修改等。 ( 7 ) 能灵活地运用模型与方法对数据进行加工、汇总、分析、预测,得出所需的综 合信息与预测信息。 ( 8 ) 具有方便的人机对话和图像输出功能,能满足随机的数据查询要求,回答“如 果则之类的问题。 ( 9 ) 提供良好的数据通信功能,以保证及时收集所需数据并将加工结果传送给使用 者。 ( 1 0 ) 具有使用者能忍受的加工速度与响应时间,不影响使用者的情绪。 1 3 决策支持系统的体系结构 1 9 8 0 年s p r a g u e 提出著名的决策支持系统三部件结构,它是由三个子系统组成的, 即人机交互子系统( 综合部件) 、模型库子系统( 模型部件) 和数据库子系统( 数据部件) n 8 驯。 这种三部件结构被广泛接受,如下图1 1 : 用户 图1 1 决策支持系统结构 f i g 1 1s t r u c t u r eo fd s s 1 3 1 人机交互子系统 人机对话子系统是d s s 中用户和计算机的接口,在操作者、模型库、数据库和方 法库之间起着传送( 包括转换) 命令和数据的重要作用,其核心是人机界面。用户通过此 部件输入必要的数据和控制信息,并得到结果和反馈信息。人机交互系统负责控制决策 支持主体过程,它控制数据访问、组织模型运行,调用数据部件和模型部件完成决策。 从系统使用角度,对话接口的设计目标是:能使用户了解系统所能提供的数据、模 7 火连交通人学1 学硕十学位论文 型及方法的情况。如:数据模式与范围,模型种类、数量、用途及运行要求等。通过“如 果则 ( w h a t i f ) 方式提问。对请求输入有足够的检验与容错能力,给用户某 些必须的提示与帮助。通过运行模型使用户取得或选择某种分析结果或预测结果。在决 策过程结束之后,能把反馈结果送入系统,对现有模型提出评价及修正意见。当需要的 时候,可以按使用者要求的方式,很方便地以图形及表格等表达方式输出信息、结论及 依据等。 1 3 2 数据库子系统 数据库子系统是负责存储、管理、提供与维护用于决策支持的数据的d s s 基本部 件,是支撑模型库子系统及方法库子系统的基础。数据库子系统由数据库、数据析取模 块、数据字典、数据库管理系统及数据查询模块等部件组成。d s s 数据库中存放的数据 大部分来源于m i s 等信息系统的数据库,这些数据库被称为源数据库。源数据库与d s s 数据库的区别在于用途与层次的不同,是模型库、方法库和对话系统的基础部分;数据 析取模块负责从源数据库提取能用于决策支持的数据,析取过程也是对源数据进行加工 的过程,是选择、浓缩与转换数据的过程;数据字典用于描述与维护各数据项的属性、 来龙去脉及相互关系,也可被看作是数据库的一部分。 数据库管理系统用于管理、提供与维护数据库中的数据,也是与其他子系统的接口。 数据查询模块用来解释来自人机对话及模型库等子系统的数据请求,通过查阅数据字典 确定如何满足这些请求,并详细阐述数据库管理系统的数据请求,最后将结果返回对话 子系统或直接用于模型的构建与计算。 1 3 3 模型库子系统 模型库子系统是构建和管理模型的计算机软件系统,它是d s s 中最复杂且最难实 现的部分。d s s 用户是依靠模型库中的模型进行决策的,因此我们认为d s s 是由“模 型驱动的 。 模型是对客观事物的一种抽象描述,人们通过对模型的认识来增加对复杂问题的理 解。用模型来辅助决策己经成为人们的共识。建模是为了理解事物的行为而对其进行的 一种简化,在决策中建模的目的大致相同。 模型库及其管理系统,是决策支持系统区别于其它信息系统的重要特征,是决策支 持系统的核心。同时模型部件也是d s s 开发中最有难度的部分,尽管经过多年的发展, 模型技术仍远未成熟。 模型库子系统由模型库和模型库管理系统两部分组成。 ( 1 ) 模型库 8 第一章决策支持系统概述 模型部件中,模型库用于存放以某种计算机程序形式表示的模型,其中数学模型是 辅助决策中使用最广泛的模型。模型库一般由模型字典和模型文件库两部分组成呤。 模型字典是模型文件的索引,d s s 通过查询字典获得对模型的引用。字典的组织结 构般有文本形式、菜单形式和数据库形式。其中数据库形式是最常用的一种,每个模 型的相关信息作为一条数据记录存储在数据库中。这样,通过数据库访问操作就可以实 现对模型查询、增加、删除、修改等的管理。 模型文件库是模型库的主体。目前的d s s ,模型大多以程序( 源程序和目标程序) 或 数据文件的形式表示和存储嘲,另外,每个模型往往还要有一个用于说明的文本文件或 数据文件。对模型的组织管理就是通过对这些文件的组织管理实现的。如何存储以及如 何调用模型文件是模型文件库的关键问题。模型文件的存储一般都是在操作系统提供的 文件管理基础上完成的。在调用模型文件时,一般先通过模型字典找到模型文件在操作 系统中的存储路径,然后找到该模型,再完成调用。 ( 2 ) 模型库管理系统 模型库管理系统的主要功能是模型的利用与维护。模型的利用:包括决策问题的定 义和概念模型化,从模型库中选择恰当的模型或单元模型构造具体问题的决策支持模 型,以及运行模型。模型的维护:包括模型的联结、修改与增删等。模型库子系统是在 与d s s 其他部件的交互过程中发挥作用的。 有些研究观点认为d s s 的结构中还包括方法库和方法库管理系统。方法库由基本 方法和标准算法组成,为模型提供基本模块和程序。方法库是存储方法模块的工具。方 法库内存储的方法程序般有:排序算法、分类算法、最小生成树算法、最短路径算法、 计划评审技术( p e r t ) 、线性规划、整数规划、动态规划、各种统计算法、各种组合算法 等。按方法的存储方式,方法库可以分为:层次结构型方法库、关系型方法库、语义网 络模型结构方法库和含有人工智能技术的方法库等;方法库管理系统是方法库系统的核 心部分,是方法库的控制机构。 1 4 决策支持系统中的模型问题 对于决策支持系统的开发,归纳起来有三个关键技术需要解决:模型系统、部件接 口和系统集成。模型系统是决策支持的核心部件,通过模型或者模型的组合来辅助决策 是决策支持系统的中心思想,其主要任务是建立决策模型并支持其使用,通过帮助决策 者理解决策问题、检验候选方案和增强预测能力等一系列手段来改善决策者的行为表 现。模型系统的主要目标不仅是模型的存储、运行与维护,而且应该以一种易于接受的、 灵活的方式向决策者提供各种各样的模型,如:预测模型、优化模型、回归分析与模拟 9 大连交通人学。ii 学硕 :学位论文 模型等,使决策在应用这些模型时不必考虑模型技术实现和过程上的某些细节。从这个 意义上来说,模型系统起着决策问题与相应的模型之间的桥梁作用。 随着对d s s 要求的提高,人们对模型管理系统的要求也越来越高。数据管理手段加 强了对数据的管理,而模型管理则强调模型的表示、组织与应用。目l j 决策者所面临的 本质问题是如何确定可以用来求解某一特定问题的模型。一个有效的模型管理系统应能 通过模型表示与模型操纵减少决策者为实现目标形式化描述而与系统进行的对话。一个 有效的模型管理系统应该为构模周期的各个阶段提供支持,提高决策者的效率,经过国 内外众多学者的致力研究,得到的普通观点是:模型管理的关键在于模型生成和模型自 动选择。模型选择是指在d s s 系统中,模型管理系统依据一定的模型选择策略代替决策 者选择模型。因为模型选择是一个比较困难的问题,至今这方面的成果还很有限,绝大 多数研究成果还不能实现自动模型选择,而是依靠专家和过去的选择经验进行选择汹1 。 基于此种情况,研究模型的自动选择具有重大的理论价值和深远的意义。 1 5 本章小结 本章对决策支持系统的基本知识做了详细概述。介绍了d s s 的产生和发展,介绍 了决策支持系统的定义和功能。d s s 由人机交互部件、数据部件和模型部件三个部件组 成,其中模型部件是d s s 中最关键的部件,其设计好坏关系到系统的成败。最后,介 绍了决策支持系统中的模型问题,指出研究模型自动选择的重大意义。 1 0 第二:帝决策模掣介? f 第二章决策模型介绍 2 1 模型的定义 模型是对客观事物的一种抽象描述,以物理的、数学的或其他合理的逻辑方法对系 统、实体、现象或进程的再现。从建模过程划分,模型可以分为三类即:概念模型、数 学模型和程序模型。程序模型是在前两者模型基础上,将模型算法表达成可以在计算机 上运行的、用一定程序设计语言编写的程序。 决策支持系统中的模型,理论上是指一个规则体( 规则集) 对一定环境下所作决策的 结果进行预测。决策支持模型往往还包含对预测的评价,评价标准由用户定义。决策支 持模型的规则体是建立在一定环境下元素之间的假定关系集上的,这些关系可以由方程 或特定的数学模型来表示,也可以用知识库中的规则来表示。 一般来说,模型包括以下几个方面:系统中包含哪些实体;每一个实体具有的属性 和属性值;实体之间、属性之间的相互关系;属性随时间的变化规律;系统的目标以及 评价标准等。 决策系统中有许多模型,这些模型通过帮助决策者理解决策问题、检验候选方案和 增强预测能力等一系列手段来改善决策者的行为表现。而模型管理的主要研究内容有模 型操纵方法和模型表示等,其中,模型选择是模型操纵的基础,在模型管理中起着重要 的作用。 在传统决策支持系统中,模型选择是通过d s s 人机对话,以菜单方式或命令方式 来实现的,这不仅要求用户对面临的决策问题做深入分析,提取问题的特征和要素,同 时还要掌握各类模型的结构及适用范围,这是不现实的。应用自动模型选择模式可以避 免这些缺点,减轻决策者的负担。 2 2 模型的用途 模型是对客观实际系统的特征和客观规律的一种抽象。在探索某些较为复杂的现象 和过程时,根据已经掌握的事实材料,首先建立一个适当的模型加以描述,进而认识和 掌握其变化规律,分析各个因素对决策问题的影响程度,为确定最优化决策提供定量依 据。 模型的主要用途可以分为一下几种: ( 1 ) 帮助决策者们更好地理解现有的系统。 ( 2 ) 分析和设计实际系统。模型能够使决策者集中精力于系统中最重要的部分,有 利于产生更具创造力的解决办法。 人连交通人学丁学硕十学伊论文 ( 3 ) 预测或预报实际系统的未来发展趋势。 ( 4 ) 对系统实行最优控制。设定几个待选方案,比较预测的结果,选择最优的方案。 ( 5 ) 利用模型可以全面把握复杂的系统。 2 3 模型的分类 按模型的应用领域分类:生物数学模型、医学数学模型、地质数学模型、数量经济 学模型和数学社会学模型。 按随机因素分类:确定性模型和随机性模型。 按模型的变化分类:静态模型和动态模型。 按应用离散方法或连续方法分类:离散模型和连续模型。 按建立模型的数学方法分类:几何模型、微分方程模型、图论模型、规划论模型、 马氏链模型。 按人们对事物发展过程的了解程度分类:白箱模型、灰箱模型和黑箱模型。白箱模 型指那些内部规律比较清楚的模型。如力学、热学、电学以及相关的工程技术问题;灰 箱模型指那些内部规律尚不十分清楚,在建立和改善模型方面都还不同程度地有许多工 作要做的问题。如气象学、生态学经济学等领域的模型;黑箱模型指一些其内部规律还 很少为人们所知的现象。如生命科学、社会科学等方面的问题。但由于因素众多、关系 复杂,也可简化为灰箱模型来研究。 2 4 模型选择 模型管理是现阶段d s s 研究的热点和难点。最初的模型管理“视模型为数据, 模型被视为一个黑箱,像一组数据一样被处理,并且用一组类似数据管理的功能来管理。 但是,模型和数据并不是等同的,用处理数据的手段来处理模型,导致了在模型表示、 模型集成和模型实现等方面的诸多难题啪3 。 模型选择作为模型操纵的基础,在模型管理中起着重要作用。借助d s s 进行实际 决策的首要任务是选样一个合适的管理模型,对于具有d s s 框架结构的决策支持系统, 其模型选择是根据问题的需要搜索模型库中已有的模型来为新问题创建相应的模型,通 过模型的重用来提高模型的利用率。 2 4 1 模型选择的分类 按照模型管理来分类: d g h o s h 和r a g a n v a 口2 1 将模型选择分为两类:一类是根据问题的特征从模型库中选 出适合的模型;另一类是在没有合适的单一模型的情况下,将两个或两个以上的简单模 第:二章决策横掣介? “ 型以一定方式结合成求解复杂决策问题的模型串,其中一个模型的输出可以是后继模型 的输入。 按照模型选择层次来分类: s b a n e r j e e 和a b a s u 将模型选择问题分为两个层次引,即模型结构选择和模型实 例确定。也有人将其分为三个层次:模型类选择、模型结构选择和模型实例确定。模型 类选择是根据问题的性质选取某类模型。例如,模型库中有分析类模型、预测类模型等 不同类型的模型,选取模型时,根据问题的性质来选取某类模型;模型结构选择是在某 类模型中根据问题的特征从众多的模型结构中选择一个合适的模型结构。例如,在趋势 预测模型中可以选择直线模型、对数曲线模型、季节模型等;模型实例确定就是在选择 模型结构之后,对该模型结构中的一些参数进行估值的实例化过程。实际开发中,模型 的结构选择和模型实例确定之间的层次并不明显,往往统称为模型的结构选择。 按照模型选择方法来分类: ( 1 ) 模型选择的解析方法。该方法最早由k l e o n 等人提出,用来选择单一模型阱1 和 组合模型b 。5 1 。这种基于目标线性规划模型的方法,依靠模型使用的历史信息来选择模型。 模型选择的过程为:对于某个特定的问题,排除不可能用到的模型;对于剩余的模型, 根据用户提出的问题特征定出线性规划表达式;对每个模型进行线性目标规划,以求出 该模型与问题特征之间的距离,选择具有最短距离的模型。 ( 2 ) 模型选择的人工智能方法。该方法是依据一定的模型选择策略( 启发式算法、专 家规则) 自动地从模型库中选取合适的模型。模型选择的人工智能方法目前是研究的热 点,黄梯云教授将b p 神经网络用于趋势外推预测模型结构的选择上;向阳等将a g e n t 技术用于模型选择啪1 等。模型选择的人工智能方法又可详细分为以下几种: 基于神经网络的模型自动选择。通过问题的数据描述应用神经网络的方法确定 模型的结构和参数。 基于知识的模型自动选择。将专家系统中的定性分析机制引入决策支持模型系 统,实现定性分析和定量分析的有机结合。 基于自然语言理解的模型自动选择。对用户输入的问题,采用自然语言的理解 识别文字描述中的描述部分和数据部分,根据问题的描述部分和数据部分通过数据库和 知识库来确定模型。 基于遗传算法的模型自动选择。该模型选择可以通过决策树表示和实现,每一 个结点代表一个问题,该结点不同的分支对应不同的特征,即选择不同的模型趋向。 1 3 大连交通人学i j 学硕十学位论文 2 4 2 模型选择的步骤 决策问题的求解是指在一定的决策环境和约束条件下,针对给定的决策问题,确定 如何达到决策目标,即确定决策方案的过程口7 1 。整个求解过程大致可以分为以下几个步 骤: 第一步:根据决策用户提出的要求进行问题的辨识和分解。作为问题分解理论基础 的问题结构理论汹3 叩认为,一个复杂问题能够被分解成为更小的、更容易解决的子问题。 利用这个原理,我们可以将原来难以直接求解的问题分解,逐步地细化、精确,直至所 有问题逐一解决。 第二步:进行问题与模型之间的匹配。明确问题求解所用的模型类子集,并搜索模 型库,看是否可以找到现存的匹配模型。如果存在则加载相应的方法和数据,求解模型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论