已阅读5页,还剩47页未读, 继续免费阅读
(运筹学与控制论专业论文)粗糙集理论及其推广模型的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 粗糙集理论,作为一种新型的处理不确性和不精确性知识的数学方法,是波 兰数学z d z i s l a w p a w l a k 于1 9 8 2 年提出的。其主要思想是利用已知的知识或信息来 近似不精确的概念或现象。自从上世纪九十年代以来,粗糙集在理论上的不断完 善,在实际上的广泛应用逐渐成为国际学术界的研究热点之一。而同为数据分析 的有力工具概念格理论和模糊集理论分别是由1 9 8 2 年w i l l er 。和1 9 6 5 年z a d 矗创 立。这两种理论虽然与粗糙集理论不同,但在数据问题的处理上都与之存在一定 的棚容性和相似性,利用粗糙集理论与方法研究概念格理论和模糊集理论,利用 概念格理论和模糊集理论与方法研究粗糙集理论,相互借鉴,相互促进,推动了 粗糙集理论的发展。 基于粗糙集理论圈前的广泛应用,本文就粗糙集理论模型的研究的现状,主 要采用构造型方法,结合模糊集、概念格、概率等不确定性理论,对经典的p a w l a k 粗糙集模型和其它糨糙集模型俸了推广研究,其具体工作如下: ( 1 ) 结合粗糙集与概念格在数据分析方面的相似之处以及存在的相互联系。 本文将概念格在模糊意义下展开,得到由不同蕴涵算子表示的模糊概念,并在基 于粗糙集的概念格这一模型的基础上,针对粗糙集所描述的分类是完全精确的这 一局限性,通过引入阙值,放松了在原粗糙集中要求的概率分类的近似边界的 严格定义,允许上近似和下近似存在一定的分类误差,从而讨论了基于变精度粗 糙集的概念格与其性质。 ( 2 ) 由于现有的模糊粗糙集大多数定义在模糊最小相似关系下,这就使得模 糊粗糙集没有经典粗糙集的某蝗性质,并且条件模糊最小相似关系中的模糊最小 传递关系盂的定义太过严格,使得u 中的两对象幂| l 用模糊最小相似关系不能有效 的测出两者的相似度,导致现存的模糊粗糙集的应用领域得到限制。针对这一局 限性,本文在已有的模糊粗糙集模型上加以改进,孳| 进模糊罗相似关系,并在此关 系下构建新的模糊信息系统,得到了基于新的模糊信息颗粒的模糊r 粗糙集,并 结合三角模算子r 和秽对其相关性质和上下近似算子之间的关系进行了讨论。 关键词:粗糙集,概念格,模糊粗糙集,下近似,上近似 a b s t r a c t a b s t r a c t r o u g hs e tt h e o r y , an e wm a t h e m a t i c a lt o o ld e a l i n gw i 也v a g u e n e s sa nu n c e r t a i n t y , w a si n 曩o d u c e db yz d z i s l a wp a w l a ki n 19 8 2 弧ep r i m a r yi d e ai st om a k eu s eo ft h e k n o w nk n o w l e d g eo ri n f o r m a t i o na sa l la p p r o x i m a t i o nf o rt h eu n p r e c i s ec o n c e p t so r p h e n o m e n a s i n c et h en i n e t i e so ft h et w e n t i e t hc e n t u r y , t h ec o n t i n u o u sp e r f e c t i n gi n t h e o r ya n dt h ew i d ee x t e n d i n gi na p p l i c a t i o nf o rt h er o u g hs e tb e c a m eav e r yh o t r e s e a r c hs p o t si n t h ew o r l da c a d e m e n e a r l yt h es a m ee r a ,a sw e l la sa p o w e r f u lt o o lf o r d a t aa n a l y s e s ,t h et h e o r yo ft h ef u z z ys e ta n dt h ec o n c e p tl a t t i c ew e r ea d v a n c e db y a a d e hi n19 6 5a n db yw i l l er i n19 8 2 ,r e s p e c t i v e l y t h o u g ht h et w ot h e o r i e sa r e d i f f e r e n tf r o mt h er o u g hs e t s ,m e yb e a rs o m ec o m m o nc o n s i s t e n c ya n dc o m p a r a b i l i t y i nt h ep r o c e s s e so fd a t aa n a l y s e s f u r t h e rd e v e l o p m e n t sh a v eb e e na c h i e v e db yu s i n gt h e t h e o r i e sa n dm e t h o d so fr o u g hs e t ,c o n c e p tl a t t i c ea n dt h ef u z z ys e tf o rr e f e r e n c eo n e a n o t h e r a c c o r d i n gt ot h ep r e s e n ta p p l i c a t i o n so ft h er o u g hs e t ,c o n t i n u o u sg e n e r a l i z a t i o n s t u d i e sf o rr o u g hm o d e lw i l lb ed o n ei nt h i sp a p e r , i tm a i n l ya d o p t st h ef o r m a t i o nw a y s a n da s s o c i a t e sw i t ht h i su n c e r t a i n t yt h e o r i e so fp r o b a b i l i t y , f u z z ys e t ,c o n c e p tl a t t i c e w h i c ha r er e f e r r e dt oa sf o l l o w s : ( 1 ) a n a l y z et h ec o m p a r a b i l i t ya n dt h er e l a t i o nb e t w e e nt h er o u g hs e ta n dc o n c e p t l a t t i c ei nt h ep r o c e s s e so fd a t aa n a l y s e s 1 1 1 i st e x td e v e l o p e dt h ec o n c e p tl a t t i c eu n d e r t h ei n f o r m a t i o ns y s t e ma n dg a i n e dt h ef u z z yc o n c e p tl a t t i c ee x p r e s s e db yd i f f e r e n t r e s i d u a t e di m p l i c a t i o n s ,骶羚t e x ti se s t a b l i s h e do nt h ec o n c e p tl a t t i c ew h i c hb a s e so n r o u g hs e ta n da i m sa tt h el i m i t a t i o n st h a tt h ec l a s s i f i c a t i o nd e s c r i b e db yr o u g hs e ti s 疗 c o m p l e t e l yp r e c i s e b yi n t r o d u c i n gt h et h r e s h o l dv a l u ep ,w eb r o a d e nt h er i g o r o u s d e f i n eo ft h ea p p r o x i m a t eb o u n dd e m a n d e di nf o r m e rr o u g hs e tw i mp r o b a b i l i t y c l a s s i f i c a t i o n w ea l s op r o m i s ec e r t a i ne r r o ro fc l a s s i f i c a t i o ni nu p p e ra n dl o w e r a p p r o x i m a t i o n c o n s e q u e n t l y , w ei l l u m i n a t et h ec o n c e p tl a t t i c eb a s e do nv p r sa n di t s p r o p e r t i e s ( 2 ) t h ee x i s t i n gf u z z yr o u g hs e t s a r ea l ld e f i n e dw i t h r e s p e c t t o f u z z y m i n - s i m i l a r i t yr e l a t i o ns ot h a tm e yh a v en o ts o m ep r o p e r t i e sa st h e 谢s pr o u g hs e t sd o , 珏 a b s t r a c t a n dt h ec o n d i t i o nn e e d e df o rt h ef u z z ym i n t r a n s i t i v i t yi nt h ef u z z ym i n s i m i l a r i t y r e l a t i o nrd e f i n e dt o os t r i c ts ot h a tt h es i m i l a rd e g r e eb e t w e e nt w oo b j e c ti nu c a n n o tb em e a s u r e de f f e c t i v e l yb ym e a n so ft h ef u z z yr a i n - s i m i l a r i t yr e l a t i o n d u et o t h e s ec h a r a c t e r i s t i c s ,t h ea p p l i c a t i o nf i e l d so ft h ee x i s t i n gf u z z yr o u g hs e t sa r el i m i t e d a i m e da tt h e s el i m i t a t i o n s ,w em a k es o m ei m p r o v e m e n t sf o rt h ef o r m e rf u z z yr o u g hs e t m o d e la n di n t r o d u c et h e f u z z yt 。s i m i l a r i t yr e l a t i o n , c o n s t r u c tan e wf u z z y i n f o r m a t i o ns y s t e m t h e n ,w eo b t a i naf u z z yt - r o u g hs e tb a s e do nt h en e wf u z z y i n f o r m a t i o ng r a n u l e i t sc o r r e s p o n d i n gp r o p e r t i e sa n dt h er e l a t i o n s h i pb e t w e e nt h en e w l o w e l a n du p p e ra p p r o x i m a t i o n sa r ea l s od i s c u s s e di nd e t a i l k e y w o r d s :r o u g hs e t ,c o n c e p tl a t t i c e , f u z z yr o u g hs e t ,u p p e r ( 1 0 w e r ) a p p r o x i m a t i o n 联l 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特另j j ;h i :l 以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名: 强k 磋上日期:p 嘞年r 月妇 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 冒期:e 必年f 胃o ;冒 第一霉绪论 1 1 选题背景 第一章绪论 2 1 世纪是信息爆炸的时代,计算机与网络信息技术的飞速发展使得各个领域 的数据和信息急剧增加,并且由于人类的参与使数据与信息系统中的不确定性更 加显著,构成了复杂的信息系统。如何从大量的、杂乱无章的、强干扰的数据( 海 量数据) 中挖掘潜在的、有利于价值的信息即有用知识,这给人类的智能信息处 理能力提出了前所未有的挑战,由此产生了人工智能研究的一个崭新领域数 据挖掘( d m ) 和数据库知识发现( k d d ) 。 褪糙集理论是教授p a w l a kz 。瑟壤! 出熬一种研究不完备、不确定知识和数据的 表达、学习、归纳的理论方法,其主要思想就是在保持分类能力不变的前提下, 通过知识约简,导出问题的决策或分类艇则,从丽获得知识的简洁表达。在粗糙 集的理论中,知识被认为是一种对对象进行分类的能力,知识库是分类方法的集 合,这些描述虽然不是十分完备严格,但却非常清晰地体现了粗糙集模型的基本 思想,为粗糙集理论奠定了基础,并逐步形成了自身理论体系。 在d m 和k d d 诸多方法中,有基于网络结构的神经网络算法,基于训练选优 的遗传算法,基子统诗理论的数据挖掘与支持向量祝方法,基于翔纳学习的枕器 学习方法,基于范例的推理方法,基于生物信息的知识发现方法等。而对于2 0 世 纪下半世纪产生的粗糙集理论与方法对于处理不精确、不确定、不完全信息的复 杂系统不失为一种有效的方法,因为它与概率方法、模糊集方法和证据理论方法 等其他处理不确定性问题理论的显著区别是它无需提供闯题所需处理的数据集合 之外的任何先验信息,所以对问题的不确定性的描述或处理也是比较客观的。而另 一方面由于该理论未能包含处理不精确或不确定原始数据的机制,所以与其他处 理不确定性闯题的理论有很强的互补性。 如何从海量数据中获取不同简洁程度的知识表达己成为当前研究的一个热 点,但数据瘴孛数据的缺失又限制了缀多理论与方法对不完备信息系统的有效处 理。现在虽然对空值有了大量的研究,但基于粗糙集理论的不完备信息系统的研 究还很薄弱,特别是在不改变原信息系统的前提下如何从不完备信息系统中获取 电子科技火学硕士学位论文 知识的理论与方法的研究更为迫切。 因此,有效的将粗糙集理论与其它理论相结合形成更为有效的方法是目前粗 糙集理论及运用研究的重点。 1 2 粗糙集概念的提出 粗糙集理论是由波兰数学家p a w l a kz 于1 9 8 2 年提出的。作为一种刻画不完整 性和不确定性的有效数学工具,粗糙集( r o u g hs e t ,r s ) 理论能有效地分析和处理不 精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规 律。八十年代,许多波兰学者对粗糙集理论及其应用进行了坚持不懈的研究,其 中对粗糙集理论的数学性质及逻辑系统进行了广泛的研究【2 矧。同时,他们也开发 了一些应用系统。但是由于最初的研究成果大多是以波兰文字发表在“b u l l e t i no f t h ep o l i s ha c a d e m yo fs c i e n c e s :m a t h e m a t i c s ”或“b u l l e t i no ft h ep o l i s ha c a d e m yo f s c i e n c e s :t e c h n i c a ls c i e n c e s 上,该项研究限于东欧各国,当时并未引起国际计算 机学界和数学界的重视,直到2 0 实际8 0 年代末才逐渐引起各国学者的注意。1 9 9 1 年p a w l a kz 乜1 的专著,粗糙集一关于数据推理的理论( r o u g hs e t t h e o r e t i c a l a s p e c t so f r e a s o n i n ga b o u td a t a ) 的问世,奠定了粗糙集理论的基础,标志着粗糙集 理论及其应用的研究进入了活跃时期。同时,随着1 9 9 2 年s l o w i n s k ir 主编的关于 粗糙集应用及其与相关得到比较研究的论文集的出版,推动了国际上对粗糙集理 论与应用的深入研究,掀起了粗糙集理论的研究高潮。从1 9 9 2 年至今,每年都召 开以r s 为主题的国际会议,推动了r s 理论的拓展和应用,国际上成立了粗糙集 学术研究会,参加的成员来自波兰、美国、加拿大、日本、挪威、俄罗斯、乌克 兰和印度等国家;1 9 9 5 年a c mc o m 姗】n j c a t i o n 【7 】将粗糙集列为新浮现的计算机科 学的研究课题,大量关于粗糙集及其应用的学术论文和研究性报告应运而生;1 9 9 8 年国际信息科学杂志( i n f o r m a t i o ns c i e n c e s ) 还为粗糙集理论的研究出了一期专辑。 由于其在机器学习【2 ,7 】、决策分析8 , 9 , 1 0 】、过程控制、模式识别及数据挖掘【1 1 , 1 2 , 1 3 】等 领域的成功运用而获得强大的生命力。 粗糙集理论从新的视角对知识进行了定义,把知识看作是关于论域的划分, 从而认为知识是具有粒度( g r a n u l a r i t y ) 的。认为知识的不精确性是由知识粒度太大 引起的。为处理数据( 特别是带噪声、不精确或不完全数据) 分类问题提供了一套严 密的数学工具,使得对知识能够进行严密的分析和操作。同时,粗糙集理论是建 2 第一章绪论 立在分类枫制韵基磷主,它将分类理鳃为在特定空闻上的等价关系,丽等价关系构 成了对该空阕鲍划分。褪糙集理论褥知识理解秀对数据的划分,每一被鲻分煎集 合称淹概念。糕糙集理论的主要思想是利用巴知的知识库,将不精确或不确定的 知识用已知的知识痒中熬知识来描述。该理论与其他处理不确定和不精确问题理 论的最显著熬区刹是它无需提供阉题新需处理的数据集合之外的任何先验信息, 所以对问题的不确定性的描述或处理可以说是比较客观的,由于这个理论未能包 含处理不精确或不确定原始数据的机制,所以这个理论与概率论、模糊数学 1 4 , 1 5 】 和证据理论等其他处理不确定或不精确闯题的理论有很强的互补性。目前r s 理论 已经成为入工智髓领域中一个较新的学术热点,弓| 起了越来越多的学者关注。 1 3 粗糙集理论的特点及应用领域 糨糙集方法的篱单实用性楚令入惊奇的,它麓在剑立籍的不长时闻内得烈迅 速应用是爨为具有以下特点f 1 6 q 9 : ( 1 ) 它能处理备穗数据,包括不完整( i n c o m p l e t e ) 的数据以及拥有众多变量的数 据; ( 2 ) 它能处理数据的不精确性和模棱两可( a m b i g u i t y ) ,包括确定性和非确定性 的情况; 3 ) 它麓求得翔识的最小表达( r e d u c t ) 和知识的各种不嗣颡粒( g r a n u l a r i 妫层次; ( 4 ) 它麓从数据中揭示出概念简单,易于操作的模式( p a t t e r n ) ; f 5 ) 它笺产生精确嚣又易于检查和证实的规煲l j ,特别逶于智憩控制中瓶则豹叁 动生成。 e l l 于糨糙集方法的特殊性,它能有效地处理下列问题:不确定或不精确知识的 表达;经验学习并从经验中获取知识;不致信息的分析;根据不确定、不完整 的知识进行推理;在保黧信息的前提下进行数据化简;近似模式分类;识别并评 估数据之间的裱赖关系( d a t ad e p e n d e n c i e s ) 。 粗糙集理论从诞生到现在厦然只有几十年的时间,德已经在许多领域取得了 令人鼓舞豹藏果 2 0 , 2 1 2 2 1 : ( 1 投票数据分析。g o l a n 2 3 】等运用糕糙集方法分挺了十年阉懿股票鲶历史数 据,研究了股票价格与经济指数之间的依赖关系,获褥的预测规则褥到了华尔街证 券交易专家的认可。 电子科技大学硕士学位论文 ( 2 ) 模式识别。n 豸撒a n 【2 4 】应用粗糙集方法研究彳手写字符识别阀题,提敢了 特征属性。 ( 3 ) 地震预报。t e 曲e m 研究了地震前的地质和气象数据与里氏地震级别的依 赖关系。 ( 4 ) 冲突分析。d c j a 应用粗糙集方法建立了反映以色列、巴基斯坦、约旦、埃 及、叙利亚和沙特阿拉伯等六国关予中东和平阀题各自的谈判模型。 ( 5 ) 从数据库中发现知识。粗糙集方法现成为k d d 的一种重要方法,其导出 的知识精炼且便子储存和使用。 ( 6 ) 粗糙控制。把控制过程中的一些育代表性的状态以及操作人员在这些状态 下所采用的控制策略都记录下来,形成决策表,然后对其分析化简,总结出控制 规则。粗糙集方法是一类符号化分析方法,需要将连续的控制变量离散化,为此 p a w l a k 提出了粗糙函数( r o u g hf u n c t i o n ) ,为粗糙控制打下了理论基础。粗糙控制 的优点是简单迅速、实现容易,不需要象f u z z y 控制那样进行模糊恍和去模糊化。 因此在特别要求控制器绐构和算法简单的场合,采取粗糙控制较为合适。另外, 由于控制算法完全来自观测数据本身,其决策和推理过程可以很容易被检验和证 实。一种新的有吸引力的控制策略“模糊一粗糙控制 正悄然兴起,其主要思路 是利用糨糙集获取模糊控制规则。 ( 7 ) 医疗诊断。粗糙集方法根据以往的病铡归纳出诊断规则,用来知道新的兵 力诊断。现有的人工预测早产的准确率只有1 7 3 8 ,应用粗糙集理论则可提高到 6 8 9 0 。 ( 8 ) 专家系统。粗糙集抽取规则的特点,为构造专家系统知识提供了一条崭新 的途径。 ( 9 ) 神经网络。训练世界过于漫长的固有缺点是制约神经网络实用化的因索之 一。j e l o n e k 等用褪糙集化篱神经网络训练样本数据集,在保留重要信息的前提下 消除了多余的数据,使训练速度提高了4 7 7 倍,获得了较好的效果。 虽然粗糙集理论至今只有二十年的发展历史,但取得的研究成果是令人瞩目 的。它是一种非常有前途的软计算方法,为处理不确定信息提供了强有力的分析 手段【2 5 2 6 1 。相信粗糙集理论具有广阔的发展空间,今后会在更多的实际领域中发 挥作用。 4 第一章绪论 1 4 粗糙集的基本概念 给定一个有限的非空集合u 称为论域,设尺是u 上一个等价关系( 满足自反 性、对称性和传递性) ,记为r u x u 。论域u 中所有与x u 具有等价关系尺的 元素的集合,记为 = y u y ) r ( 1 - 1 ) 商集v r - - x k i x t r 是等价关系r 将论域u 进行划分,所得的等价类的集合。 即3 一,x 2 ,吒u ,使得 u = 【x 。】尺u 【】置u u 【】r ( 1 2 ) 其中【薯kn x j 矗= 囝,i 歹,i ,j = 1 ,2 ,诈。 对于论域u 上的任意一个子集x ,x 不一定能用知识库中的知识来精确地描 述,即x 可能为不可定义集,这时就用x 关于a 的一对下近似蹦和上近似劢来 “近似 地描述,其定义如下 2 8 】: 蹦= u 。j d 露_ c x ) = x u l x 。c _ x ) ( 1 3 ) 劢= u 。恻膏f t x , o = 扛u 州足n x f 2 j ) ( 1 - 4 ) 其中,【z 】。是石所在的r 一等价类。 蹦它可以解释为由那些根据现有知识判断出肯定属于x 的对象所组成的最 大集合,上近似面可以解释为由那些根据现有知识判断出可能属于x 的对象所组 成的最小集合。p o s 。( ) = 丛为x 的尺正域;n e g 旯( x ) = 【厂一页( x ) 为x 的尺负域, 可以解释为由那些根据现有知识判断出肯定不属于x 的对象所组成的集合。 b n r ( x ) = 页( x ) 一星( x ) 为x 的r 边界域,它可以解释为由那些根据现有知识判断出可 能属于x 但不能完全肯定是否一定属于x 的对象中所组成的集合。这些概念可由 下图直观地描述出来: 电予科技大学硕:l 二学位论文 星( x ) 图l 一1 租糙集上f = 近似圈 在图中,整个区域为论域u ,每一小方格代表u i n d ( r ) 的一个元素,即等价类, 包含在概念x 孛的、童若干个空表方格组成的区域莠盖的下近似,南瞬影方格组 成的区域为z 的边界,由边界及下近似组成x 的上近似。 x 关于么的近似精度定义为么柳= 黟,其中| x | 表示集合x 的基数近似精 度反映了根据现有知识对并的了鳃程度。 x 关于么的粗糙度定义为九( x ) = 1 - l i - r 脯x - - - ,它反映了知识的不完全程度显然 若近似精度为1 ,则粗糙度为0 。 1 5 粗糙集的发展状况 在经典粗糙集理论中,“知识 被认为一种将现实或抽象的对象进行分类的能 力,经熟粗糙集理论是假设已知的对象全域拥有必要知识的前提之下进行数据处 理的。但一般而言,由于信息的缺乏,人们对知识的了解和认识往往不够充分, 但要求分类必须正确或可靠的,不可靠或不正确的分类不能采用该方法解决。但 事实上,现实世界中存在的分类规则往往不是可靠的,但对于大部分已知数据采 用该规则导出的分类是正确的,那么这些包含部分错误的分类规则就能提供有用 的导向信息。由此可见,该分类规则可以提供有用的导向信息,这些导向信息应 该被提取并采用一定的方法进行分析,此时,若采用经典粗糙集理论分析这些数 6 第一牵缝论 据,那么这些导向信息则成为无用信息。也就是说,在数据集中存在噪声等孑撬 情况下,经典理论会由于对数据的过于拟合而使得其对新信息的预测能力大大地 降低。因此,有许多工作集中在寻求有效的约简算法和对经典粗糙集理论的扩展 上。 粗糙集目前的研究得到了很大的发展,主要方向如下: 1 獠糙集的数学性质。主要讨论粗糙集代数和撼扑结构以及粗糙集瓣收敛性 斛等瀚题。 2 粗糙集模型的扩展。p a w l a k 粗糙集模型的推广一奁是粳糙集理论研究的主 流方向,目前主要莉蹲种方法( 1 ) 构造性方法;( 2 ) 代数性( 公理化) 方法。 ( 1 ) 构造性方法是对原始p a w l a k 粗糙集模型的般推广,其主要思路怒从给 定的近似空间出发去研究粗糙集帮近似算子。它楚以论域上的二元关系或帮尔予 代数作为基本要素的,然后导出粗糙集代数系统( 2 “,气u ,n a p r ,缈) 。这种方法所 研究的闻题往往来源予实际,所建立的模型有很强的应焉价值,其主要缺点是不 易深刻了解近簌算予熬代数结梅。 在经典粗糙集模受中有三个最基本的要素:一个论域移,移上的一个二元等 价关系r ( 它们构成了近似空间) ,一个被近似描述的( 经典) 集合爿,也称为专家 概念。由此,推广的形式也有三个方向,即从论域方向、从关系方向( 包括近似 空耀) 和从集合方嘲。 l 、 从论域方向推广的鼷黼主要是双论域【3 0 的情形,这时的二元关系就变成了 两个论域笛卡歹l 乘积的个子集。对于将论域推广到多个的情形来研究粗糙集理 论豹文献很少,这种讨论也将随着维数翡增热变褥越复杂。 2 关系方向的推广:一种是将论域上酶二元等价关系推广为任意的二元关系 得到一般关系下的粗糙集模型【2 8 】;另一种是将对象x 所在的等价类看成是搿的个 邻域,从而推广导出了籀于领域算予的粗糙集模型【3 1 3 2 】;也有将由关系导出的划 分推广成为一般的布尔代数的,以此出发去定义糨糙集和近似算子的;更般的 有将普遴关系推广成模糊关系或模糊划分f 3 3 3 4 】丽获彳譬模糊粗糙集模型f 3 5 】。 3 ) 集合和近似空闻簸推广:这一类的推广是与其他处理不确定,不精确或模 糊的知识( 概率论、模赣数学、信息论、证据理论等) 结合起来进行研究的。 当知识疼中的知识楚国于随枫原因或经统计得到的,即知识库中的知识缀可 能是不确定的,很多学者提出了统计( 或概率) 粗糙集模型,变精度粗糙集模型实 际上也可以归入这类模型,寻求具有最小风险的熙叶斯决策问题也可以转化为这 类模型。这一类模型在数据分析的增量式机器学习中有熏要应用。目前觅到的此 7 电予辩技大学联:学霞论文 类模型中,近似空间中二元关系大都是等价关系,对于非等价关系给出的情形的 文章尚未见到。 当知识库中的知识模块都是清晰概念,而被描述的概念是一个模糊概念,人 们建立了粗糙模糊集模型来解决此类问题的近似推理。当知识库中的知识模块也 是模糊的,有些学者就提出了模糊粗糙集模型并作了推广3 5 ,3 6 翮。对于知识库中的 知识模块既是模糊知识又是随机得到的至今讨论甚少,但在实际问题中肯定是存 在的,因此也是值得继续研究的。 随着这几年对粗糙集理论的进一步研究,经典的粗糙近似算子已经被大量的 推广,主要表现在和其他不确定性概念或者其缝知识发现酶方法的结合上,特别 是与模糊系统的联系仍然是研究的热点,这方面的成果也是最多的;而另一方面 对于不完备信息系统上粗糙集模型的研究也主要是对容差关系和相似关系的讨 论;再者对被近似概念和集合的一般化、广泛化也是研究的主流,所有这方面的 工作都是为了使粗糙集理论更加深入到实际问题的解决中,或者是在更多领域中 寻找与粗集理论相结合的交叉点,以此拓展粗糙集的应用。 ( 2 ) 代数方法也称为公理化方法有时也称为算子方法,这种方法不是以二元关 系为基本要素,它的基本要素是一对满足菜些公理的一元( 集合) 近似算子 厶h :2 专2 u ,即粗糙代数系统( 2 u ,u ,n ,l ,h ) 中近似算子是事先给定的。这种 方法研究的明显优点是能够深刻地了解近似算子的代数结构,其缺点是应用性不 够强。 近似算子的某些公理能保证有一些特殊类型的二元关系的存在,使这些能够 通过构造性方法产生给定的算子;反过来,由二元关系通过构造性方法导出的近 似算子定满足某些公理,傻这些公理通过代数方法产生给定的二元关系。 公理化方法的研究一开始只局限于p a w l a k 粗糙代数系统,即公理与二元等价 关系相对应情形,压逐渐发展到般关系下的粗糙集系统。至今为止,关于公理 化方法的粗糙集理论研究大多局限于经典集情形,对于模糊集情形虽有讨论,但 比较少。 3 。粗糙逻辑。在粗糙集的基础上建立的r o u g h 逻辑。 4 有效算法的研究。包括决策规则的提取算法,属性约简算法,粗糙集基本 并行算法,以及与粗糙集有关的神经网络和遗传算法等。 5 多方面的融合。主要有:粗糙集与神经网络的结合 3 8 - 4 0 1 ,出现的粗糙神经 网络,加快神经网络的速度;与遗传算法的结合来处理大数据集。 8 第一鼗绪论 1 6 本文的组织结构 本文主要研究耱糙集理论模型以及粗糙集理论中的不确定性| 、蘧题,在西前已 有的研究成果上继续推广应用粗糙集理论模型。一是基予p a w l a k 提出的经典粗糙 集模型的理论来源,将此类特殊的模型从论域、关系、集合三个方向进行一般的 推广和拓展;二是根据粗糙集理论在现目前的广阔应用,结合其他一些领域的不 确定性理论和经验( 概念格理论,模糊集理论等不确定性理论) 构造某些特殊的粗 糙集模型或把褪糙集理论的一些思想应用到其绝的知识系统中,不断丰富粗糙集 的理论体系,使其在更多行业中发挥它自身的优势。其文章的组织如下: 第一章:绪论。阐述了本文麓选题背景,介绍了粗糙集的基本概念及其特点 和应用领域,国内外粗糙集的研究状况,并对本文的工作进行介绍。 第二章:粗糙集与概念格理论。介绍了概念格理论,就概念格与粗糙集进行 比较和结合,引入了基于粗糙集的概念格模型,并将概念格在模糊意义下展开,得 到用不同蕴涵算子表达的模糊概念。 第三章:基于交精度粗糙集的概念格。针对一定的错误分辨率,结合变精度 粗糙集模型,建立了基于变精度粗糙集的概念格模型,对其相关性质进行了讨论, 对糨糙集模型进行了补充。 第四章:模糊粗糙集。对粗糙集和模糊集进行了比较,并结合模糊集理论, 引入了模糊糨糙集模型,_ 并对英研究进嶷进行介绍。 第五章:基于一新的模糊信息系统的模糊r 粗糙集。本文在已有的模糊粗糙 集模型上加以改进,引进模糊r 相似关系,并在此关系下构建新的模糊信息系统, 得到了基于新的模糊信息系统的模糊? 一粗糙集,并对相关性质和上下近似算子之 间的关系进行了讨论。 第六章:总结。对全文的工作进行了总结。 9 电予科技大学硕:b 学位论文 第二章粗糙集与概念格理论 粗糙集理论是由p a w l a kz 。于1 9 8 2 年提出来的,其基本思想是通过案例的分 类归纳出概念和规则。它从不可分辨关系对论域的戈0 分出发,用一对上下近似集 对不能用已有概念表述的新概念给出某种近似表示,并对信息系统中所隐含的知 识以决策规则进行表示。粗糙集是一种处理模糊性和不确定性的新型数学工具。 与粗糙集理论同时产生的是概念格理论。概念格,又称为g a l o i s 格,是w i l l e 装于1 9 8 2 年提出的。概念格同样是建立在分类基磊窭上,但是它比分类有更大的概 括性,它往往在归纳几个分类的基础上产生一个概念概念格是根据二元关系提 出的一种概念层次结构【4 l 】,是数据分斩和艘则提取的一种有效工具。从数据集中 生成概念格的过程实际上是一种概念聚类过程,它的每一个节点称为一个概念, 概念的外延表示为属于这个概念的所有对象的集合,面内涵表示为所有对象所共 有的属性的集合。概念格本质上是通过对象和属性的二元关系达到两者的某种对 应,体现了概念之间的泛化和特化关系。因此,概念格与粗糙集理论一样,同样 成为研究决策规则的一种重要方法。 由于概念格与粗糙集理论都是建立在分类基础上的,因此两种理论虽然不同, 僵又有共性。利用粗糙集理论与方法研究概念格理论,剩用概念揍理论与方法研 究粗糙集理论,相互借鉴、相互促进,推动了粗糙集理论与概念格理论的发展, 同时也为不确定性规则获取与数据提取提供了有效的工具。 本章首先介绍了概念格的产生背景以及发展历史,并对这一有效的数学工具 的实际应用给出了介绍,回忆了概念格理论中的基本概念,给出了基于粗糙集理 论的概念格构造方法,并给出了糨糙集与概念格之阉的关系。 2 1 概念格理论的应用 属粗糙集理论一样,概念搔作为一种具有极大潜力和有效的知识发现工舆, 备受人工智能工作者的广泛关注,并广泛应用于机器学习、模式识别、专家系统、 计算机飕络、数据分析、决策分析、数据挖握等领域。 1 0 第二章秘糙蕊与概念掐蠼论 目前,涉及概念格理论的主要成果有: ( 1 ) 作为阁为数据分橱和数据处理的互补的有效数学工具概念格理论和粗糙集 理论,许多学者尝试结合这两种理论,构造了基于粗糙集理论的概念格,提出了 属性概念和对象概念,并尝试着用粗糙集理论的约筒的方法来对概念格中的属性 和对象进行约简。并有许多学者把模糊集、粗糙集和概念格三者结合,构造新型 的分类模型。 ( 2 ) 一系列概念格生成算法:目前已有酶概念格的生成算法大致分为两类:一 类是批处理算法,其中,o s h z m 算法【4 2 】是首先构造格的最上层节点,再逐渐往下。 于此相反,c h e i n 算法是首先构造底部的节点,褥向上扩震。n o u f i n e 算法1 4 3 英i j 是 采用枚举的方法,按照一定顺序枚举格的所有节点,再生成h a s s e 图;另一种则是 增量算法,这类算法的思想是大同小异的,如g o d i n 算法f 删,动态的生成概念格, 谢志鹏、刘宗田【4 5 】提出了采用树状结构对概念格节点集进行组织的快速渐进式构 造算法。 ( 3 ) 概念格在许多领域得到成功的应用:如数字图书馆,c n e u s s ,r 。e k e n t1 4 6 1 事业概念格进行i n t e r n e t 上稳当元信息分类和分析,他们讨论的两个著名的资源发 现服务w h o i s + + 和h a r v e s t 都可以包含在基于概念的更为一般和具有良姆结 构的方法中。r c o l e ,p w e k l u n d 4 7 】将概念格方法应用于分析和可视化具有1 9 6 2 个属性和4 0 0 0 个厨房摘要的医药数据瘁。p w e k l u n d ,囊m a r t i n 4 8 】展示了概念格 层次进行w e b 稳当索引和导航的能力。另外,概念格还可以应用于词典的调整、 软件工程、知识发现等领域,丽且已取得了良好的经济效益和社会效益。 2 2 概念格理论的基本概念 定义2 1 4 9 称( u ,a ,j ) 为一个形式背景,其中u = 誓,如,毛) 为对象集,每 个薯o ,z ) 称为一个对象;a = ( 搿,t 2 ,) 为属性集,每一个口,( 坍) 称为一个属 性,歹为移和么之间的二元关系,i 曼u 圆a 。若瓴露) i ,则称x 具有属性a 。若 阮a ) 正j ,则称x 不具有属性a 。 对于形式背景( u ,a ,) ,在对象集x u 和属性集艿悠a 分别定义运算【2 6 】: 电予科技大学硕:b 学位论文 x 。= a l a 专a ,v x e x ,( x ,控) ? 2 一1 ) b + = x l x e u ,讹b ,i x ,a ) e i ) ( 2 - 2 ) x 表示并中所有对象共同具有的属性集合,萨表示具有曰中所有属性的对象集 合。魄秽,记 x ;4 为f ;v aca ,记 露;+ 为疗,魄黩f ,f ,a 至iv ae a , a 多,a u ,称形式背景缈,以,) 是正则的。 定义2 2 刚设( u ,么,) 是形式背景,如果一个二元组( x ,b ) ,满足x = b ,且 x = 矿,荧| j 称( 菇,客) 是一个概念( c o n c e p t ) 。 其中,x 成为概念的外延,用e x ( x ,b ) 表示,曰称为概念的内涵,用i n ( x ,b ) 表示。用l ( u ,a ,) 表示形式背景( u ,么,) 的全体概念,在l ( u ,a ,) 中两个元素: 冀= ( 墨,骂) 和避= ( 鼍,岛) ,瓶定置 也是概念,从i 7 i il ( u ,a ,i ) 是完备格。 2 3 基于粗糙集的概念格 ( 2 - 3 ) 0 q 租糙集悬研究划分的,而概念格是在划分的基础上产生的,因此,可以模仿 粗糙集的方法构造“上近似格鞠“下近似格”,以程糙集方法研究概念格的梅造。 设缈,a ,i ) 为形式背景,对予x u ,a a ,记 = 露么峙鑫) z , 露= x 秽| o ,a ) g i 。 显然行x + 等价于工蹦4 。由于概念格是雁则的,则 x + 卜毯u ) 构成4 的覆盖,同理 爨+ 扭么 构成u 的覆盖。对予形式背景影,叠? ) ,晨“霜表示下近似,用“秽 表示上近似,对予爿蠡及b 囊a 有 x a = 扛么p 簸x ( 2 - 5 ) x 。= 摈么江4 八x 囝;( 2 - 6 ) 酽= 扣i 么f 器;( 2 - 7 ) b 。= 扛彳f n 霹囝 ( 2 - 8 ) 定理2 3 2 7 运算据1 3 弦与搿捧有以下性质: ( 1 ) 当置蔓,则x ? 必:及x ;o 墨; ( 2 ) 当骂s 盈,则b 。o b :o 及b ;o 篓群; 1 3 一一 电予科技大学硕:i :学位论文 _ 二= 二- 一一一 3 ) x 酌量x x 钯,b q 。互b cb 妇; ( 4 ) x 铀o = x 。,x 咖= x 。, b o ”= b 。,b 螂一b 垂; ( 5 ) 伐n 五广= 冒八霹,瞄u 置户= 霹u 霹, ( 墨n 岛) a = 群厂、劈,( 岛u 岛) 。嚣晟ou 霹 定义2 3 设( ,a ,) 为形式背景,对于x u 及艿互彳,若有x :b o b :x a , 称,嚣) 为对象概念;若x = b o ,b = x 。,称盖,功为属性概念。 定理2 4 【2 7 】设( u ,a ,j
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年年中国朱砂市场发展分析及未来投资潜力可行性报告
- 多肽药物生产设备选型与配置方案
- 压铸生产企业人才培训与发展方案
- 燃气计量与收费系统优化方案
- 建筑垃圾消纳场节能减排措施方案
- 数据中心冷却技术优化方案
- 厨余垃圾无害化处理设施建设方案
- 与总包的安全协议书
- 企业厂房转租协议书
- 代课协议书劳动合同
- 2025年小学五年级语文上学期期中综合测试试卷(含答案)
- 2025年脉石英行业分析报告及未来发展趋势预测
- 2025年建筑师资格考试《建筑装饰设计》备考题库及答案解析
- 无人机教学平台建设方案
- 2025年政治理论时政热点知识试题库(+答案)
- GB/T 46391-2025城市和社区可持续发展宜居城市总体要求
- 贵州金融控股集团有限责任公司招聘笔试题库及答案2025
- 简单版公司向个人借款合同范本5篇
- 《JavaScript程序设计案例教程》全套教学课件
- 2025年铆工中级职业技能理论知识考试练习题库含答案
- 开设国际班申请书
评论
0/150
提交评论