(计算机应用技术专业论文)基于模糊粗糙集的气象预测cbr系统.pdf_第1页
(计算机应用技术专业论文)基于模糊粗糙集的气象预测cbr系统.pdf_第2页
(计算机应用技术专业论文)基于模糊粗糙集的气象预测cbr系统.pdf_第3页
(计算机应用技术专业论文)基于模糊粗糙集的气象预测cbr系统.pdf_第4页
(计算机应用技术专业论文)基于模糊粗糙集的气象预测cbr系统.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(计算机应用技术专业论文)基于模糊粗糙集的气象预测cbr系统.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究工作所取得的成果。除文中已注明引用的内容以外,本论 文不包含任何其他个人或集体已经发表或撰写过的作品成果,也不包 含为获得江苏大学或其他教育机构的学位或证书而使用过的材料。对 本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标 明。本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名:磅掺 加7 f 年6 月1 2 e t 学位论文版权使用授权书 江苏大学、中国科学技术信息研究所、国家图书馆、中国学术期 刊( 光盘版) 电子杂志社有权保留本人所送交学位论文的复印件和电 子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文 档的内容和纸质论文的内容相一致,允许论文被查阅和借阅,同时授 权中国科学技术信息研究所将本论文编入中国学位论文全文数据 库并向社会提供查询,授权中国学术期刊( 光盘版) 电子杂志社将 本论文编入中国优秀博硕士学位论文全文数据库并向社会提供查 询。论文的公布( 包括刊登) 授权江苏大学研究生处办理。 本学位论文属于不保密 学位论文作者签名:拗指导狮签名:私屹 劢年6 月j z 日 刎年多月j2 日 江苏大学硕士学位论文 摘要 灾害性天气的预报和警示在人们的生产、生活中具有举足轻重的地位。天气 的历史数据和预报员的经验往往对气象预测的结果起着重要作用,通常预报员可 以根据当前的天气情况和历史上相似的天气进行比较,从而对当前的天气进行预 测。因此如何建立一个包含预报员经验总结、历史天气范例分析、历史天气档案 等各种信息的综合天气范例库,并在此基础上对综合天气范例库的简化、相似检 索等方面进行研究,具有重要的理论意义和工程实用价值。 本文将模糊粗糙集理论应用于范例推理( c b r ,c a s eb a s e dr e a s o n i n g ) 系统中, 对范例检索过程中的属性约简算法、权重分配算法、以及相似检索算法都做了详 细的分析与深入探讨,在此基础上,设计并实现了一个基于模糊粗糙集的气象预 测c b r 系统。 本文的主要工作如下: 1 介绍范例推理和模糊粗糙集的相关理论知识,并对其中的核心技术进行详 细的分析和比较。 2 深入探讨属性约简和权重分配算法,并对传统的属性约简算法的不足:如 适用范围较小,约简后仍存在冗余等问题进行深入的研究,给出一种基于模糊粗 糙集的属性约简和权重分配算法。该算法以模糊相似关系代替经典粗糙集中的等 价关系,在模糊环境下重新定义了属性重要度的概念,扩大了算法的适用范围, 并且将权重确定问题转化为模糊粗糙集理论中属性重要性的评价问题,在一定程 度上克服了传统权重确定主观性太大的不足,实验结果表明,该方法是有效的。 3 范例检索与匹配是实现范例推理的关键,本文利用最近相邻算法和相似度 量理论,结合基于模糊粗糙集属性约简和权重分配算法,提出一种基于相似度量 理论的最近相邻检索算法,通过计算新旧范例间的相似度并将其与相似阈值进行 比较,最后得到相似范例集。 4 在上述研究成果基础上,设计并实现一个基于模糊粗糙集的气象预测c b r 系统,更好地帮助气象预报员做出快速、正确的决策( 诊断) 。 关键词:模糊粗糙集;范例推理;属性约简;权重分配;相似范例检索 江苏大学硕士学位论文 a b s t r a c t i nt h ef i e l do fw e a t h e rp r e d i c t i o n ,p u b l i cm e t e o r o l o g i c a lf o r e c a s ta n ds e v e r e w e a t h e rw a r n i n gi s u r g e n t l yn e e d e df o rp e o p l e h i s t o r i c a lw e a t h e rd a t aa n dt h e e x p e r i e n c eo ff o r e c a s t e r so f t e np l a y sav e r yi m p o r t a n tr o l ei nt h er e s u l to fw e a t h e r f o r e c a s t i n g f o r e c a s t e r sc a nc o m p a r e dc u r r e n tw e a t h e rc o n d i t i o n sw i t ht h ew e a t h e ri n t h eh i s t o r yo fas i m i l a rc o m p a r i s o nt ot h ec u r r e n tw e a t h e rf o r e c a s t t h u sh o wt oe s t a b l i s ht h ew e a t h e rc a s eb a s ew h i c hl e a r n e df r o mf o r e c a s t e r s c o n t a i n sh i s t o r i c a le x a m p l e so ft h ew e a t h e r , h i s t o r i c a lw e a t h e ri n f o r m a t i o n ,a n dd e e p a n a l y s i s ,s y s t e m a t i cs t u d yo nc a s eb a s es i m p l i f i e da n ds i m i l a rr e t r i e v a lh a si m p o r t a n t t h e o r e t i c a ls i g n i f i c a n c ea n dp r a c t i c a lv a l u e t h i sp a p e rw i l la p p l yf u = yr o u g hs e tt h e o r yt oc b rs y s t e m ,a n dh a sd o n ea d e t a i l e da n a l y s i sa n dd e e pd i s c u s s i o ni nt h es i m i l a r i t yr e t r i e v a lm e t h o d s ,t h e nd e s i g n sa f u z z yr o u g hs e tb a s e do nw e a t h e rf o r e c a s t sc b rs y s t e m t h em a i nw o r ki sa sf o l l o w s : 1 i n t r o d u c ec b ra n df u z z yr o u g hs e tr e l e v a n tt h e o r e t i c a lk n o w l e d g ea n do n eo f t h ec o r et e c h n o l o g i e sf o rad e t m l e da n a l y s i sa n dc o m p a r i s o n 2 t h o r o u g h l yd i s c u s s ea t t r i b u t er e d u c t i o na n dw e i g h td i s t r i b u t i o na l g o r i t h m , a n a l y z ea d v a n t a g ea n dd i s a d v a n t a g eo ft h et r a d i t i o n a la t t r i b u t er e d u c t i o na l g o r i t h m : n a r r o wa p p l i e ds c o p ea n dr e d u n d a n c y , e t c a n dt h i sp a p e rp r o p o s e san e wa t t r i b u t e r e d u c t i o na n dw e i g h td i s t r i b u t i o na l g o r i t h mb a s e do nf u z z yr o u g hs e t ,t h ew e i g h t d e t e r m i n a t i o np r o b l e mi st r a n s f o r m e dt of u z z yr o u g hs e tt h e o r yt oe v a l u a t et h e i m p o r t a n c eo fa t t r i b u t e s ,w h i c ho v e r c o m e st h ed i s a d v a n t a g e so ft h et r a d i t i o n a l m e t h o d si nag r e a te x t e n ta sw e l la n dm a k e st h ew e i g h tm o r eo b j e c t i v ea n dr e a s o n a b l e d e t e r m i n a t i o n e x p e r i m e n t a lr e s u l t ss h o w t h a tt h em e t h o di se f f e c t i v ea n df e a s i b l e 3 c a s er e t r i e v a la n dm a t c h i n gi sac r i t i c a ls t e pt oa c h i e v ec a s e - b a s e dr e a s o n i n g , t h i sp a p e rc o m b i n e sn e i g h b o ra l g o r i t h ma n ds i m i l a r i t ym e a s u r et h e o r yw i t ha t t r i b u t e r e d u c t i o na n dw e i g h td i s t r i b u t i o na l g o r i t h m ,c o m b i n e s n e i g h b o ra l g o r i t h ma n d s i m i l a r i t ym e a s u r et h e o r yw i t l la t t r i b u t er e d u c t i o na n dw e i g h td i s t r i b u t i o na l g o r i t h m , a n dt h e nc a l c u l a t e st h es i m i l a r i t yb e t w e e nt h eo l da n dn e wc a s e s ,t h e nc o m p a r e sw i h t h es i m i l a rt h r e s h o l dt og e tt h ef i n a ls i m i l a rs e to fc a s e s 4 o nt h eb a s i so ft h ea b o v et h e o r ya n dt e c h n o l o g yr e s e a r c h , t h ep a p e rd e s i g n sa m e t e o r o l o g i c a ld i s a s t e rf o r c a s tc b rs y s t e mb a s e do nf u z z yr o u g hs e t ,w h i c ht oh e l p w e a t h e rf o r e c a s t e r st om a k eq u i c k ,c o r r e c td e c i s i o n s ( d i a g n o s i s ) k e y w o r d s :f u z z yr o u g hs e t ,c b r , a t t r i b u t er e d u c t i o n ,a t t r i b u t ew e i g h td i s t r i b u t i o n , s i m i l a rc a s er e t r i v a l i i 江苏大学硕士学位论文 目录 第一章绪论1 1 1 研究背景和意义l 1 2 范例推理的研究现状和发展2 1 3 模糊粗糙集的研究现状和发展3 1 4 论文的主要内容及组织结构4 第二章基础理论和关键技术介绍6 2 1 范例推理简介6 2 2 范例推理的整体结构一7 2 3 范例核心技术介绍8 2 3 1 范例表示8 2 3 2 范例检索9 2 3 3 范例重用1 0 2 3 4 范例维护和保存1 1 2 4 范例推理的优缺点分析1 2 2 5 模糊粗糙集1 3 2 5 1 粗糙集理论和模糊粗糙集理论的关系1 3 2 5 2 粗糙集理论的基本概念1 3 2 5 3 模糊粗糙集理论的基本概念1 5 2 6 本章小结16 第三章基于模糊粗糙集的属性约简和权重分配算法研究1 7 3 1 属性约简算法相关研究1 7 3 1 1 基于属性依赖度的启发式属性约简算法1 7 3 1 2 基于互信息的知识相对约简算法。1 9 3 1 3 模糊粗糙快速约简算法2 1 3 2 基于模糊粗糙集的属性约简和权重分配算法2 2 3 2 1 基本概念2 3 3 2 2 属性约简和权重分配算法2 5 3 3 实例与分析2 8 3 4 本章小结3 1 第四章基于相似度量理论的最近相邻范例检索算法3 2 江苏大学硕士学位论文 4 1 相似范例检索算法相关研究。3 2 4 2 基于相似度量理论的最近相邻范例检索算法3 4 4 2 1 最近相邻算法3 4 4 2 2 相似度量理论3 6 4 2 3 权重的计算方法3 7 4 2 4 相似范例检索算法3 8 4 3 实例与分析3 9 4 4 本章小结4 0 第五章气象预测c b r 系统的设计与实现4 1 5 1 项目背景4 l 5 2 系统的总体设计4 2 5 2 1 系统的框架4 2 5 2 2 系统的功能模块一4 3 5 3 核心模块的设计4 3 5 3 1 气象范例的表示与存储模块4 3 5 3 2 数据预处理模块4 6 5 3 3 相似气象范例检索模块4 8 5 3 4 气象范例管理模块。5 0 5 4 系统的实现5 l 5 4 1 开发环境51 5 4 2 运行界面51 5 5 本章小结5 4 第六章总结与展望5 5 6 1 总结5 5 6 2 展望5 6 参考文献5 7 致谢6 l 攻读硕士学位期间发表的论文6 2 江苏大学硕士学位论文 1 1 研究背景和意义 第一章绪论 社会信息化给人们的生活和社会带来了巨大变革,而对于海量信息和众多历 史经验,人们却往往显得手足无措,不知如何作出决策。这就迫切需要高度智能 化的软件来帮助人们。基于范例的推n ( c a s e b a s e dr e a s o n i n g ,c b r ) 技术,正是 在这种情况下迅速发展起来的。c b r 把当前所面临的问题或情况称为目标范例, 把记忆的问题或情况称为源范例。基于范例推理的过程是从目标范例的提示中获 得记忆中的源范例,并在源范例指导下对目标范例进行求解的过程,即系统能够 实现经验的自学习。c b r 方法是基于自然界的两条原则【l 】:一条是世界是有规律 的,相似的问题具有相似的解决办法。另一条是以前出现的问题可能会再次重复 出现。当两条原则都成立时,基于范例的推理便是一种有效的推理策略。 目前c b r 系统广泛应用于企业决策、机械制造、法律咨询、疾病识别、天 气预报等领域,并且取得了很好的效益。本文研究的目标是如何将c b r 技术应 用于天气预测领域。 近年来,气象灾害事件的频繁发生,给人们的生活造成了巨大的损失与影响, 气候变化引起的极端天气气候事件出现的频率与强度明显上升,直接威胁到国民 经济的发展。干旱、洪涝、雷击、冰雹、台风、高温、沙尘暴、低温雨雪冰冻等 重大灾害性天气频繁袭扰我国。这些恶劣天气还会引发次生灾害,如山区泥石流、 道路结冰造成的交通中断、冻雨压断电线造成大面积停电等。百年一遇的超强台 风“桑美 、强热带风暴“碧利斯 、川渝特大旱灾等重大气象灾害的破坏性在自 然灾害事件中名列前茅。各省气象局通过2 兆宽带网、g p r s 等现代化的网络和 通讯技术,已基本实现了气象信息实施采集和无间隙传输。各省市气象局都保存 了历年的气象数据,并能相互共享。这些数据为预报员进行天气预测提供了重要 的参考。然而,随着时间的推移,原始天气数据的积累越来越庞大,如何从海量 历史天气数据中提取出有参考价值的范例数据成为人们越来越关心的问题,而 c b r 技术、模糊粗糙集理论以及数据挖掘技术为该问题的解决提供了有效的理 论支持。 江苏大学硕士学位论文 1 2 范例推理的研究现状和发展 关于c b r 的研究,国外起源于2 0 世纪8 0 年代初期,r o g e rs c h a n k 在1 9 8 2 年的d y n a m i cm e m o r y 书中首次提出,在2 0 世纪8 0 年代末期开始受到人们的重 视,断断续续有一些应用成果。1 9 8 3 年著名的左治亚工学院的j a n e tk o l o d n e r 开 发的c y r u s 系统在计算机上首次实现了r o g e rs h a n k 著作中的许多原理1 2 1 3 1 。而 后,耶鲁大学、左治亚工学院和马萨诸塞大学的研究生又建立了一些系统,这些 系统在法律、烹饪、医药、故障诊断等领域中的应用效果有力说明了c b r 的实 用性。目前,美国是开展c b r 研究与开发最普遍的国家,欧洲、日本等工业化 国家对c b r 的有关问题及相应的系统也正在进行大量的研究和开发,已建立了 上百个用c b r 推理的知识系统1 4 ,5 ,6 。我国对c b r 的研究与系统的开发起步较 晚,但在上个世纪9 0 年代初也开始有了这方面的研究与应用,基于案例推理方 面的研究成果也相继问世。姜丽红、刘豹等【8 l 设计了智能化预测支持系统,通过 提供当前问题的相似案例,充分利用案例中隐含的专家常识知识,设计开发了基 于案例推理的人机合作求解系统。王君等【9 j 研究了基于案例推理的知识管理咨询 系统,在分析基于案例推理技术特点和知识管理咨询系统含义的基础上,提出了 基于案例推理的知识管理咨询系统架构。杨健等【1 0 1 研究了利用案例推理的信息技 术解决中医诊断信息化过程中的关键问题,建立了系统模型,研究了案例提取网 及案例提取算法,并提出了利用基于案例的解释来生成诊断结果的解释性说明, 并构建了基于案例的中医诊疗辅助教学系统,这些都充分说明了c b r 作为人工 智能的一个分支,有较大的应用价值。 当前,利用范例推理技术对气象进行预测的系统不是很多,美国k a n s a s 大 学开发了基于粗糙集的实例学习系统。在我国台湾,通过c b r 的研究方法,搜 集了台湾历年来都市层级的地震防灾救灾相关研究案例,利用英国w a l e s 大学开 发的c b r 软件c a s p i a n ,建立了“地震防灾救灾文献案例式查询系统 ,应用于 都市的防灾救灾。国内的主要研究有:安徽省气象台提出了类似c b r 技术的方 法,即利用数值预报图进行相似个例的查询。但该方法需要建立历史天气图库和 天气系统库,需要很大的存储空间存储大量的相关信息,巨量的存储信息同时也 限制了检索的速度。因而,本文对模糊粗糙集和c b r 技术展开的深入研究,不 仅有重要的理论意义,而且也是有重要的工程意义的。在范例推理系统中使用粗 2 江苏大学硕士学位论文 糙集和模糊粗糙集,国内外的研究还不多,已有的成果有:s k p a la n dp m i t r a ! 】 提出了的粗糙集理论,粗糙集在气象预测c b r 中所起的作用是对范例库中的范 例进行简化,文献【1 2 , 1 3 , 1 4 对粗糙集理论在范例推理中的应用作了介绍,提出了利 用模糊集理论和粗糙集理论约简范例库,而使用该方法的缺点是不能很好的处 理噪声数据,同时需要预先指定较多的参数。为此,本文拟采用模糊粗糙集与范 例推理相结合的方法来对气象灾害天气进行预测。下文将对模糊粗糙集在属性约 简方面的研究现状进行详细介绍。 1 3 模糊粗糙集的研究现状和发展 粗糙集理论对离敖数据集合的约简处理十分适用,国内外学者在这方面做了 大量的研究,并取得了一定成梨1 5 , 1 6 , 1 7 , 1 8 。然而利用粗糙集理论进行约简处理之 前,必须对连续属性进行离散化,这一过程将造成某种程度的信息缺失,因为离 散化后的属性值没有保留属性在实值上存在的差异。 为了解决粗糙集离散化过程的信息缺失问题,法国学者d u b o i s 和p r a d e d l l 9 , 2 0 1 首次将模糊集理论引入粗糙集中,提出了模糊粗糙集理论。他们对信息系统中的 对象不再进行离散化,而是利用对象的相似关系替代粗糙集中的等价关系来讨论 对象间的关系。正是由于模糊粗糙集理论引入的模糊概念易于保留连续属性值的 信息,因此使用该理论处理数据集能更好的保留原始数据集中所包含的信息。已 有学者研究表明,应用模糊粗糙集得到的基于范例的推理系统或原始数据集的约 简比粗糙集具有更高的准确度f 2 1 , 2 2 1 。 近十年来,国内学者对模糊粗糙集的基本特征和基本理论进行了有益的研 究,并取得了一定的应用成果【2 3 , 2 4 1 。然而,当前的研究主要集中于从不同的角度 考察模糊粗糙集的性质,至于模糊粗糙集的约简算法,同粗糙集的约简相比,由 于引入模糊集后会导致计算复杂且算法思想发生改变,因此现在的研究成果还比 较有限。 国内外当前对属性约简的研究主要集中在粗糙集属性约简方面。国外的研究 主要有t y l i n 【2 5 】提出的启发式算法,它首先求出决策表的属性核,并以属性核 为基础来求决策表的最小属性约简。r b a t t i t i l 2 6 j 提出了一种基于互信息的属性约 简算法m i b a r k 算法,它也是从属性核出发,每次从剩余的条件属性集合中选 江苏大学硕士学位论文 择一个互信息最大的属性添加进来,直到所得属性结合对决策属性的互信息与条 件属性全集对决策属性的互信息相同,此属性集合即为所求。国内对属性约简的 研究虽然起步较晚,但也提出了一些有新意的方法,王国j g t z 7 1 提出了一个粗糙集 知识约简方法,它从系统的信息表出发,以条件信息熵为启发式信息构造了属性 约简算法,但作者未能对该算法的正确性给出严格的验证。叶东毅【2 8 j 提出了一个 j e l o n e k 属性约简算法的改进版本,它利用单属性的近似精度和h u 的差别矩阵方 法,求出一个较优的属性约简,使得计算复杂性下降到o ( n 2 m 2 ) ,其中n 为数据集 中对象数,m 为属性数。刘宗田1 2 9 1 提出在增加数据库记录后,能够在已有最小 属性约简的基础上求解新的最小属性约简的算法,该算法同样基于记录间的不可 区分关系。基于模糊粗糙集的属性约简的算法目前还很少,r i c h a r d 和q i a n g s h e n p u j 提出了一个称为q u i c k r e d u c t 的模糊粗糙集属性约简算法,它是基于启发式信息 的,计算复杂度不高,但约简性能不稳定,算法执行效果随决策表系统的具体性 质不同而差异很大。 1 4 论文的主要内容及组织结构 本文主要给出了基于模糊粗糙集的属性约简和权重分配算法和基于相似度 量原理的最近相邻检索算法,设计并实现了一个基于模糊粗糙集的气象预测c b r 系统,主要进行的工作是: ( 1 ) 对范例推理技术和模糊粗糙集的基本理论和相关概念进行概括和总结, 详细分析范例推理过程中的关键技术:范例表示、范例检索、范例重用、范例维 护和储存。 ( 2 ) 范例属性约简和权重分配算法研究与实现。针对经典的粗糙集进行属性 约简存在的不足,给出了一种基于模糊粗糙集的属性约简和权重算法。该算法以 模糊相似关系代替经典粗糙集中的等价关系,在模糊环境下重新定义了属性重要 度的概念,扩大了算法的适用范围,并且将权重确定问题转化为模糊粗糙集理论 中属性重要性的评价问题,在一定程度上克服了传统权重确定主观性太大的不 足,而使得权重的确定更具客观性和合理性。实验证明该算法是十分有效的。 ( 3 ) 相似范例检索算法的研究与实现。提出了一种基于相似度量理论的最近 相邻范例检索算法,该算法以最近相邻算法和相似度量理论为基础,利用基于模 4 江苏大学硕士学位论文 糊粗糙集的属性约简和权重分配算法得到的权重集,通过衡量范例属性间的相似 性,计算新、旧范例之间的相似度,利用相似阂值进行筛选,从而确定出该范例 库中与目标范例最为相似的源范例,实验验证该算法是十分有效的。 ( 4 ) 将文中给出的基于模糊粗糙的属性约简和权重分配算法和基于相似度 量原理的最近相邻检索算法应用到具体的气象预测c b r 系统中,设计并实现一 个基于模糊粗糙集的气象预测c b r 系统。 本文结构安排如下: 第l 章介绍了本课题的研究背景与意义、以及范例推理和模糊粗糙集的研 究现状和发展。 第2 章介绍了基于范例推理和模糊粗糙集的基本概念和理论,并且对范例 推理中的核心技术进行了研究。 第3 章研究了粗糙集和模糊集的基本概念及其联系,说明了两者相结合在 研究属性约简方面的优势。介绍了目前属性约简算法已取得韵一些成果,并针对 其中存在的问题,给出了一种基于模糊粗糙集的属性约简和权重分配算法。 第4 章介绍了相似范例检索的一些常见算法,并以相似度量方法和最近相 邻算法为基础,结合第三章给出的基于模糊粗糙集的属性约简和权重分配算法, 提出了基于相似度量原理的最近相邻检索算法,并验证了该算法的有效性。 第5 章在前面研究的基础上,设计一个基于模糊粗糙集的气象预测c b r 系 统。 第6 章对全文进行一个总结,提出下一步的工作与展望。 5 江苏大学硕士学位论文 第二章基础理论和关键技术介绍 基于范例的推理( c a s e b a s e dr e a s o n i n g ,c b r ) 的研究及其系统的开发近年受 到人们的普遍关注【3 ,粗糙集和模糊粗糙集在范例推理中的作用主要是约简范例 库,但由于粗糙集在范例库的属性约简中存在一定的缺陷,且天气预测领域的气 象元素的数据组织分散,具有一定的特征约束,存在大量特征的非线性及相关性, 因此本文采用模糊粗糙集对范例库进行属性约简。下面本章将对范例推理和模糊 粗糙集中的基本概念进行介绍。 2 1 范例推理简介 人类在解决问题时,通常以过去类似问题的处理结果为依据来解决新的问 题。受人类认知过程的启示,专家们提出了基于范例推理( c b r ) 的方法。c b r 技 术反映了人类认知科学研究的新成果,强调了人类对过去经验和前人智慧的重 现,并依据它们指导解决实际工作中遇到的新问题。c b r 特别适用于领域定理 难以表示成规则形式,而易于表示成范例形式并且积累了丰富范例的领域【3 引。 同人类的思维和处理问题模式一样,c b r 系统首先通过对比问题范例与先前 范例的相似性,来决定选择以前的哪一个或哪一些范例,并修改或修正以前问题 的解法。在这一点上,与其它人工智能解决问题的方法( 如专家系统利用领域内 通用的启发性知识和规则,通过逐步的推导,得出问题的解) 截然不同。而且更 重要的是c b r 系统固有的属性,它采用增量式的学习方法问题的方法和问 题范例一同被系统记录并存储起来,以备将来之用系统的学习能力不断提 高,知识和经验也不断增加。 c b r 的基本原理是:一个范例推理系统把过去处理过的问题,描述成由问题 特征集和解决方案组成的范例,存储在系统的范例库中。当新问题提出时,系统 从范例库中检查出与新问题最相近的旧范例。如果旧范例和新问题完全一致,则 自然可以把旧范例的解决方案作为新问题的答案;否则需要对旧范例进行修改, 从而得到新问题的解决方案。这样,就完成了对新问题的解答。多数情况下,新 解决的问题将被加入范例库中,实现范例的自我学习过程。 6 2 2 范例推理的整体结构 一个完整的c b r 系统一般包括几个循环过程【3 3 1 ,a m o d t 和p l a z a 归纳为 4 r ,:r e t r i e v e ,r e u s e ,r e v i s e ,r e t a i n ,一般翻译为检索、重用、修改修正、保留。 范例推理的基本过程如图2 1 所示。 实施方案 推荐方案 图2 - l 范例推理的基本过程 基于范例推理的步骤如下: ( 1 ) 提出新问题作为目标范例,定义新问题的特征或属性。 ( 2 ) 检索范例库,根据问题的要求,在范例库中找出与目标范例最为相似的 范例( 源范例) ,其关键是找出对新问题的解决有最大潜在启发价值的旧范例。 ( 3 ) 根据修正规则来修改检索到的旧范例,为新范例进行计算求解,为成功 解决问题提供参考。 ( 4 ) 将有利用价值的新范例存储到范例库中,并对c b r 系统作出相应的调 整,以完成c b r 的学习功能。 7 江苏大学硕士学位论文 2 3 范例核心技术介绍 2 3 1 范例表示 范例的表示方法并不是新出现的技术。在c b r 系统中,不是规则而是范例 作为知识片断存储在范例库中。因此,范例的表示是c b r 求解问题的第一个步 骤。输入的范例首先要以系统可以识别的方式进行描述,然后才可以进行检索、 修改等操作。范例的表示方式决定着现实问题的范例表示形式,同时对范例推理 的效率有很大的影响。 在c b r 系统中没有通用的范例表示方法,往往需要在分析具体问题领域的 基础上,通过选择、综合或修改现有的各种知识表示方法来实现。最简单的方法 是对范例进行属性抽取,然后对各个属性赋值。根据领域问题的特点采用语义网 络、文本方式、数据库记录方式、框架、剧本和动态存贮模式等方式进行存储。 目前在基于范例推理的系统中,主要采用的策略有剧本策略、s c h a n k 提出的动 态存贮模型策略和p o r t e r 等【3 4 】提出的范畴模型策略。剧本策略是用事件序列来表 达知识,并以具体形式描述各个事件;s c h a n k 提出的动态存贮模型策略是用记 忆组织包( m o p ) 来表达知识,m o p 是由景物组成的序列,它将具有类似特征的 某几类事物组成一个更一般的事类;p o r t e r 等提出的范畴模型策略则根据对人类 思维过程的分析,将自然概念的不同特征辅以不同的重要度,以描述一个范例对 某一范畴的从属关系。 从本质上讲,范例被描述为能够导致特定结果的一系列特征的集合,比如, 医疗诊断系统中,病例和相应的诊断就是一个范例。对于复杂的问题领域,范例 既可以组织成复杂的层次结构,也可以是若干个子范例的组合。用于描述范例的 各个特征,在内容上可以分为以下三部分:问题情景描述( 即范例发生时的相关 状态及需要解决的问题) ,求解及最后结果。一个范例不一定包含全部以上三个 部分,具体包含这三个部分中的哪些部分,决定于范例可用于解决哪些问题。范 例中包含的许多信息对以后的推理十分有用,例如结果中既可以包括执行求解方 案后的结果,还可以包括对这种结果的解释及修正解的方法等。这些信息可以为 建议解的修正提供指导。由于范例包括了对问题的描述及其求解的情况,所以范 例的表示至少应该包含这两个方面。因此范例可以表示为一个有序对( 问题描述, 8 江苏大学硕士学位论文 解描述) ,若其中有解的描述,比如解得效果情况,所给出的解是否有效等,这 样又可以表示为三元组( 问题描述,解描述,效果描述) 。 在气象预测c b r 系统中,灾害天气的发生往往是由一个或者多个重要属性 值的变化所引起的。一般的灾害天气是由温度、风力、降雨量、日照以及湿度决 定的。因此可以建立一个气象范例,其条件属性为 温度、风力、降雨量、日照、 湿度 ,其决策属性为天气灾害类型。 2 3 2 范例检索 范例检索或提取是从范例库中找到一个或多个与当前问题最相似的范例。遇 到一个新问题时,首先是从记忆或范例库中回忆出与当前问题相关的最佳范例, 后续工作能否发挥出应有的效果,很大程度依赖于这一阶段得到范例的质量高 低。因为检索到的范例的数量和质量直接影响问题的解决效果,所以范例检索是 c b r 系统中一个关键步骤【3 5 1 ,也是目前c b r 的一个研究热点。范例检索最终要 达到以下两个目标:一是检索出的范例应该尽可能的少,二是检索出的范例应尽 可能与目标范例相关、相似或匹配。 检索过程的核心之一是检索算法。算法与数据结构密切相连,不同的范例库 组织结构要有相应的不同算法来检索。因此,c b r 系统中已形成了一系列范例 组织和检索的策略和算法,但并没有通用的检索算法。在实践中,人们往往使用 多维分析法【3 6 1 、知识引导法【3 7 3 8 1 等方法来检索相似范例。软件计算方法如模糊逻 辑、遗传算法 3 9 1 也在基于范例推理的检索中有所应用。本文对灾害天气范例的相 似检索采用的是基于相似度原理的最近相邻检索算法。 c b r 成功应用的关键是通过检索得到相似范例集。范例检索是在相似比较 的基础上进行的,因此,如何定义相似度对检索结果至关重要。范例表示是由许 多属性组成的,范例间的相似度是根据属性间的相似度定义的。属性间相似性计 算根据数值类型的不同分为数值性属性的相似度、枚举型属性的相似度和顺序性 属性的相似度。范例间相似度通常是通过距离来定义的,常用的典型距离有绝对 值距离,欧氏距离和麦考斯基距离等。本文在第四章中将对范例检索中的两个关 键技术相似度量和权重计算方法进行详细介绍。 9 江苏大学硕士学位论文 2 3 3 范例重用 将检索到的旧范例的解答复用到新问题时,首先要对复用结果进行评估,如 果成功,就不需要调整或修改,否则需要对解决方案进行调整或修改。结果的评 估既可依据在实际应用后的反馈,也可通过向专家咨询完成。 范例重用就是在找到最相似范例后,利用解决旧范例的经验来解决新的问 题。一般情况下检索到的旧范例不可能和新问题完全匹配,因此c b r 系统一般 都必须调整过去的问题解答以得到适合新问题的较好解答。文献h o 4 1 】介绍了范 例调整的四种方法。 ( 1 ) 替换法 把旧解中的相关值作相应替换形成新解,常用的方法有重新例化 ( r e i n s t a n t i a t o n ) :将旧解决方案重新实例化为新对象;参数调整( p a r a m e t e r a d j u s t m e n t ) :通过不同的输入参数会导致不同输出结果的启发式方法,对旧解答 的数值参数进行调整;局部搜索( 1 0 c a ls e a c h ) :通过搜索辅助的知识结构来替换 那些不适合新情况的值或结构的方法;查询( q u e r y ) :用带条件的查询在范例库 或辅助知识结构中获得替换的内容;特定搜索( s p e c i a l i z e ds e a c h ) :同时在范例 库和辅助知识结构中进行查询,但在范例库中查询时使用辅助知识来启发式指导 如何搜索;基于范例的替换:使用其它范例来建议一个替换。 ( 2 ) 转换法 包括常识转换法和模型制导修补法。前者利用明白易懂的常识性启发式从旧 解中替换、删除或添加某些组成成分。后者是通过因果模型来指导如何转换。 ( 3 ) 特定目标驱动法( s p e c i a lp u r p o s ea d a p t a t i o no rr e p a i r ) 该方法主要是基于规则的产生式系统给出领域特定的适应性修改。 ( 4 ) 派生重演( d e r i v a t i o nr e p l a y ) 使用过去推导旧解的方法来推导出新解,其重点在于如何求解。 传统c b r 系统的范例修改是基于人工的,目前对于范例自动修改的研究已 有一些成果,如有学者提出利用一个基于范例的适应性修改部件来获得和复用成 功范例的修改过程,这是一种在c b r 方法自身过程中应用c b r 方法的思想。由 于系统本身的不确定性、不完整性和不精确性【4 2 1 ,模糊理论在范例的修改上显示 了其优越性。 1 0 江苏大学硕士学位论文 2 - 3 4 范例维护和保存 范例库的维护主要包括范例的存储与删除。范例存储与范例学习紧密相关, 新问题一旦得到解决,则形成了一个可能用于将来情形与之相似的新范例,此时 需要将该新范例加入到范例库中,这个过程包括哪些信息需要保留,以及如何把 新范例集成到范例库中,并会涉及范例库的组织和管理方面的知识。 范例的存储包括新范例的属性提取、将新范例集成到索引结构和存储结构中 等问题。c b r 系统采用增量式的学习方法,能不断积累经验和知识,这来源于 对新范例及解法的保留。但若无条件地对范例进行保留势必导致另一个问题产 生,即无法控制范例库中范例数目的增长而导致检索成本增加,且范例库中会遗 留大量噪音范例以及错误范例,最终会导致系统总体性能的降低。 因此范例推理系统必须有维护功能,以限制范例库的无限膨胀。目前对范例 库的维护,主要采用的方法是删除无用的范例,限制范例库的大小,主要有以下 几种方法【4 3 , 4 4 j : ( 1 ) 随机删除法。当范例库数量大于预定值时,随机删除一个范例。随机的 删除范例,可能是关键范例,从而导致系统能力的急剧下降,且会导致有的目标 问题永远无解。 ( 2 ) 实用值度量法。效用= 平均节省时间x 应用频率匹配代价。根据效用值 来决定是否删除。由于随着知识库的增加,一个特定知识的应用频率总是要下降 的,所以它的度量值u t i l i t y 也在衰减。而且实用值较小的不一定就是无用的范例, 因为一些问题可能在某一段时期内频繁使用,而可能在另_ 段时期内几乎不使 用。 ( 3 ) i b 3 方法。i b 3 方法是对范例库中的每个范例建立一个匹配记录,一旦记 录显示该范例是一个无用范例,即把它从范例库中删去。此算法的缺点是:它是 一个被动的不太精确的办法,没有对每个范例的重要性给予准确的计算。 ( 4 ) 选择删除法。该方法是目前最为可靠的删除法。通过有选择地删除特定 的范例,从而保证范例库在合理的限度内同时保障基于范例推理系统的性能。目 前有多种方法,有维护规则方法、基于范例分类的删除策略、基于模式归纳的范 例库维护等。 ( 5 ) 基于相似粗糙集技术的范例维护1 4 5 1 。这种方法,从差别矩阵入手,实施 江苏大学硕士学位论文 选择删除法,实现范例库维护过程中对特定范例的选择删除,从而做到系统效率 与性能兼顾,主要体现在: 通过对某些相似范例的删除,实现了范例库空间的释放;范例库中存有一 定相似范例,使得相似范例检索时能够获取相关范例。避免了因上述几种删除法 ( 如随机删除法、实用值度量法等) 删除某类或某些关键范例而导致的性能下降。 通过范例问相似度阈值的控制,保证了范例库中保留的范例拥有最好的覆 盖度。这样范例库维护后,基于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论