(运筹学与控制论专业论文)粗糙集理论模型的研究.pdf_第1页
(运筹学与控制论专业论文)粗糙集理论模型的研究.pdf_第2页
(运筹学与控制论专业论文)粗糙集理论模型的研究.pdf_第3页
(运筹学与控制论专业论文)粗糙集理论模型的研究.pdf_第4页
(运筹学与控制论专业论文)粗糙集理论模型的研究.pdf_第5页
已阅读5页,还剩46页未读 继续免费阅读

(运筹学与控制论专业论文)粗糙集理论模型的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 基于粗糙集理论目前在数据挖掘和数据库知识发现中的广泛应用,本文就粗 糙集理论模型的研究现状,主要采用构造性方法,结合模糊集、v a g u e 集、集对 分析等不确定性理论,对经典的p a w l a k 粗糙集模型和其它粗糙集模型作了推广研 究,其具体如下: ( 1 ) 变精度b a y e s i a n 粗糙集模型只是适用于完备信息系统,为了弥补这一 缺陷,本文引入集对分析概念,把该模型进一步推广到不完备信息系统,提出了 集对分析下的变精度b a y e s i a n 粗糙集模型,并且给出了一个与该模型定义等价的 一个定理。利用这种模型可以通过对相似度和精度的调节,得到某个概念z 上的 各种不同相似度和不同精度的知识集,从而可以增加对数据信息的了解。 ( 2 ) 不完备信息系统中目前有多种扩充,如基于容差关系的扩充、基于相似 关系的扩充等等,但是这些扩充都各自存在局限性。针对这些局限性,引入相对 分类错误率的概念,提出了一种基于限制容差关系下的集对变精度粗糙集模型。 这就将经典的粗糙集模型和限制容差关系下的集对租糙集模型进行了推广。然后, 讨论了该模型上、下近似算子的一些性质。最后,通过一个具体例子,说明了该 模型在不完备信息系统中处理模糊和不确定性知识是可行、有效的。 ( 3 ) 利用v a g u e 集截集的概念,提出了v a g u e 集的分解定理;随后本文又提 出了一种v a g u e 关系,利用它定义了一种v a g u e 环境下的粗糙近似算子,从而推 广了模糊关系下的模糊粗糙近似算子。并且讨论了该模型的近似算子的一些性质 和其他形式的表示形式。这就将v a g u e 集理论应用到粗糙集理论中的同时,也推 广了粗糙集模型。 关键词:粗糙近似算子,模糊集,v a g u e 集,集对分析,粗糙集 a b s t r a c t a b s t r a c t a tp r e s e n t ,r o u g hs e tt h e o r i e sa r eb o n gw i d e l ya p p l i e di nd a t am i n i n ga n d k n o w l e d g ed i s c o v e r yi nd a m b a s e a c c o r d i n gt ot h ep r e s e n tr e s e a r c h e sf o rr o u g hs e t m o d e l ,c o n t i n u o u sg e n e r a l i z a t i o ns t u d i e sf o rp a w l a kr o u g hs e tm o d e lw i l lb ed o n ei n t h i sp a p e r i tm a i n l ya d o p t st h ef o r m a t i o nw a y sa n da s s o c i a t e sw i mt h e s eu n c e r t a m t y t h e o r i e so f f u z z ys e t , s e tp a i ra n a l y s i sa n dv a g u es e tw h i c ha r er e f e r r e dt o 笛f o l l o w s : ( 1 ) v a r i a b l ep r e c i s i o nb a y e s i a nr o u g hs e tm o d e li sj u s ts u i t a b l ef o rc o m p l e t e i n f o r m a t i o ns y s t e m a sf o rt h el i m i t a t i o n , v a r i a b l ep r e c i s i o nb a y e s i a nr o u g hs e tm o d e l b a s e do ns e tp a i ra n a l y s i si sp r o p o s e db yi n t r o d u c i n gt h ec o n c e p to fs e tp a i ra n a l y s i s , w h i c he x t e n d st h em o d e lt oi n c o m p l e t ei n f o r m a t i o ns y s t e m a n dat h e o r e me q u i v a l e n t t ot h ed e f i n i t i o no fm o d e li sg i v e n w h e nw e r e g u l a t et h es i m i l a r i t ya n dp r e c i s i o no f m o d e l ,k n o w l e d g eo f v a r i o u ss i m i l a r i t i e sa n dp r e c i s i o n so nt h ec o n c e p txi so b t a i n e d t h u sw ew i l lf u r t h e rk n o wi n f o r m a t i o no f 也cd a t a b a s e ( 2 ) i np r e s e n t ,t h e r ee x i s ts e v e r a le x t e n s i o n si ni n c o m p l e t ei n f o r m a t i o ns y s t e m , s u c h 勰e x t e n s i o n sb a s e do nt o l e r a n c er e l a t i o na n ds i m i l a r i t yr e l a t i o n , e r e h o w e v e r , t h e s ee x t e n s i o n sh a v et h e i ro w nl i m i t a t i o n s a sf o rt h el i m i t a t i o n s s e t - p a i rv a r ! i a b l e p r e c i s i o nr o u g hs e tm o d e lb a s e do nl i m i t e dt o l e r a n c er e l a t i o n i s p r o p o s e db y i n t r o d u c i n gt h ec o n c e p to f r e l a t i v e l yc l a s s i f i e df a u l tr a t e t h u st h ec l a s s i c a lr o u g hs e t m o d e la n ds e t - p a i rr o u g hs e tm o d e lb a s e do nl i m i t e dt o l e r a n c er e l a t i o na r ee x t e n d e d a l s os o m e p r o p e r t i e sa b o u tt h eu p p e ra n dl o w e ra p p r o x i m a t i o no p e r a t o r so ft h em o d e l a r ed i s c u s s e d f i n a l l y , b ya ne x a m p l e , i ti sv e r i f i e dt h a tt h em o d e li sf e a s i b l ea n d e f f e c t i v et od e a lw i t hv a g u e n e s sa n du n c e r t a i n t yi ni n c o m p l e t ei n f o r m a t i o ns y s t e m ( 3 ) t h ed e c o m p o s i t i o nt h e o r e mi nv a g u es e t si sg i v e nb yt h ec o n c e p to ft h ec u ti n v a g u es e t s m e a n w h i l e , ar o u g ha p p r o x i m a t i o no p e r a t o ri nt h ev a g u ee n v i r o n m e n ti s d e f i n e db yav a g u er e l a t i o np r o p o s e db yn s ,w h i c he x t e n d sf u z z yr o u g h a p p r o x i m a t i o n o p e r a t o r si nt h e 向函可r e l a t i o n a l s os o m ep r o p e r t i e so fo p e r a t o r so ft h em o d e la r e d i s c u s s e d t h er e p r e s e n t a t i o n so fv a g u er o u g ha p p r o x i m a t i o no p e r a t o r sa r ep r e s e n t e d t h u sv a g u es e tt h e o r yi sn o to n l ya p p l i e db u te x t e n d e dt or o u g hs e tt h e o r y a b s t r a c t k e yw o r d s :r o u g ha p p r o x i m a t i o no p e r a t o r s ,f u z z ys e t s ,v a g u es e t s ,s e tp a i ra n a l y s i s , r o u g hs e t 1 l i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 虢丞;秘,导师签名堑羔 日期:剃7 年1 月j d 日 第一章绪论 1 1 选题背景 第一章绪论 当今,社会已经进入网络信息时代,计算机与网络信息技术的飞速发展使得 各个领域的数据和信息急剧增加( 信息爆炸) ,并且由于人类的参与使数据与信息 系统中的不确定性更加显著,构成了复杂的信息系统。信息系统是一个具有对象 和属性( 条件属性和目标属性) 关系的数据库,这种数据库通过数据隐含着知识 的对象与属性之间的关系,最终表达的知识模式是用属性来表达的,它有明确的 直观意义,因此是可以理解的。由于数据表的规模性和多样性( 定性值、定量值、 离散值、连续值、缺省值、集合值等) ,知识表达的对象与属性的关系不是能直接 观察到的,必须依赖一定的数学方法与计算工具,因此模式的获得是非平凡的。 如何从大量的、杂乱无章的、强干扰的数据( 海量数据) 中挖掘潜在的、有利于 价值的信息即有用知识,这给人类的智能信息处理能力提出了前所未有的挑战, 由此产生了人工智能研究的一个崭新领域一数据挖掘( d m ) 和数据库知识发 现( k d d ) 。 在d m 和k d d 诸多方法中,有基于网络结构的神经网络算法,基于训练选 优的遗传算法,基于统计理论的数据挖掘与支持向量机方法,基于归纳学习的机 器学习方法,基于范例的推理方法,基于生物信息的知识发现方法等。而对于2 0 世纪下半世纪产生的粗糙集理论与方法对于处理不精确、不确定、不完全信息的 复杂系统不失为一种有效的方法,因为它与概率方法、模糊集方法和证据理论方 法等其他处理不确定性问题理论的显著区别是它无需提供问题所需处理的数据集 合之外的任何先验信息。而另一方面由于该理论未能包含处理不精确或不确定原 始数据的机制,所以与其他处理不确定性问题的理论有很强的互补性。 粗糙集理论近年来在数据挖掘中得到广泛应用,主要被用来发现数据库中隐 含着的确定性规则,应用于k d d 中的粗糙集方法主要是用来由数据构成决策表, 以及对决策表的简化,通过去除冗余元组及冗余属性和冗余概念,最后形成最小 决策表。这种方法在人工智能和知识处理领域非常有效,尤其在机器学习、知识 获取、决策分析、数据库中的知识发现、专家系统、决策支持系统、归纳推理、 电子科技大学硕士学位论文 模式识别等领域更为重要,在市场研究、医学数据分析、药物研究、传感器数据 库分析以及导致新的合成材设计等方面也得到应用。 单纯地使用粗糙集理论不一定总能有效地描述数据不精确或不确定的实际问 题,与其他理论相结合形成更加有效的方法是目前粗糙集理论及应用研究的重点。 粗糙集理论与神经网络计算相结合的应用,可用作神经网络的分类器,产生 基本的规则系统;粗糙集理论与p c t d 网结合,可对决策表进行实时计算的并 行算法;粗糙集与模糊集相结合,用粗糙集构造近似关系,由边界关系生成模糊 集中的隶属度,以此构成模糊粗糙关系数据库。对于粗糙集理论的研究和应用正 在飞速的发展之中,还存在许多问题等待解决,由于粗糙集模型自身的完备性, 加上其对不确定性描述无需主观假设的特点,使其必将得到更广泛的应用。 本文以粗糙集模型为研究对象,以p a w l a k 经典粗糙集模型为依据,通过对粗 糙集模型的扩充和推广,进一步完善粗糙集理论知识的研究,为它更加广泛、灵 活地应用到实际问题的解决中奠定理论的基础。 1 2 粗糙集理论及应用简介 1 2 1 粗糙集概念的提出 粗糙集( r o u g hs e t , r s ) 理论是一种刻画不完整性和不确定性的数学工具, 能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐 含的知识,揭示潜在的规律。r s 理论是由波兰学者p a w l a kz 于1 9 8 2 i t 年提出 的1 9 9 1 【2 1 年zp a w l a k 的专著,粗糙集一关于数据推理的理论( r o u g h s e t - t h e o r e t i c a la s p e c t so fr e a s o n i n ga b o u td a t a ) 的问世。标志着粗糙集理论及其应 用的研究进入了活跃时期:从1 9 9 2 年至今,每年都召开以r s 为主题的国际会议, 推动了r s 理论的拓展和应用,国际上成立了粗糙集学术研究会,参加的成员来自 波兰、美国、加拿大、日本、挪威、俄罗斯、乌克兰和印度等国家:1 9 9 5 年a c m c o m m u n i c a t i o n ”1 将粗糙集列为新浮现的计算机科学的研究课题,大量关于粗糙 集及其应用的学术论文和研究性报告应运而生:1 9 9 8 年国际信息科学杂志 ( i n f o r m a t i o ns c i e n c e s ) 还为粗糙集理论的研究出了一期专辑。由于粗糙集理论在 机器学习【2 ,“、决策分析【”圳、过程控制、模式识别及数据挖掘唧4 4 1 等领域的 成功运用,从而获得强大的生命力。 粗糙集理论是建立在分类机制的基础上,它将分类理解为在特定空间上的等 2 第一章绪论 价关系,而等价关系构成了对该空间的划分。粗糙集理论将知识理解为对数据的划 分,每一被划分的集合称为概念。粗糙集理论的主要思想是利用已知的知识库,将 不精确或不确定的知识用已知的知识库中的知识来描述。该理论与其他处理不确 定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外 的任何先验信息,所以对问题的不确定性的描述或处理可以说是比较客观的,由于 这个理论未能包含处理不精确或不确定原始数据的机制,所以这个理论与概率论、 模糊数学”。”和证据理论等其他处理不确定或不精确问题的理论有很强的互补 性。目前r s 理论已经成为人工智能领域中一个较新的学术热点,引起了越来越多 的科研人员的关注。粗糙集理论模型也由此而不断的拓展运用于更多领域,下面 将从与粗糙集理论模型有关的几个主要方面介绍它的发展与应用。 1 2 2 粗糙集理论的基本概念 给定一个有限的非空集合【,称为论域,r 为u 上的一族等价关系,r 将【,划 分为互不相交的基本等价类二元对a = ( 【,r ) 构成一个近似空间( a p p r o x i m a t i o n s p a c e ) 设z 为【厂的一个子集,4 为【,中的一个对象,k 1 。表示所有与d 不可分辨 的对象所组成的集合,即由口决定的等价类。 对于论域【,上的任意一个子集x ,x 不一定能用知识库中的知识来精确地描 述,即x 可能为不可定义集,这时就用x 关于4 的一对下近似肼和上近似融来 “近似”地籀述,其定义如下: 丛= u 【x 】 i m 。c x = 扛ec ,i m 。j ) 融= u 。n x # o = x e u l x 。n 工t a ) 其中,【z k 是工所在的r 一等价类 称p o s a ( x ) = 型为x 的ri f - 域;n e g 。( z ) = c ,一页( z ) 为x 的r 负域: 6 皤) = 页( 抑一墨) 为x 的r 边界域,显然:页= p o s 。( x ) u b n ( x ) 。 联刊的近似精度定义为悯2 筒,其中吲表示集厶肭基数施似精 度反映了根据现有知识对z 的了解程度。 电子科技大学硕士学位论文 联相的粗糙度定义为孵h 一蹰,它反映了知识的不完全程度。显然 若近似精度为1 ,则粗糙度为o 。 1 2 3 粗糙集模型的研究现状 p a w l a k 粗糙集模型的推广一直是粗糙集理论研究的主流方向,目前主要有两 种方法( 1 ) 构造性方法:( 2 ) 代数性( 公理化) 方法。 ( 1 ) 构造性方法是对原始p a w l a k 粗糙集模型的一般推广,其主要思路是从给 定的近似空间出发去研究粗糙集和近似算子。它是以论域上的二元关系或布尔子 代数作为基本要素的,然后导出粗糙集代数系统( 2 “,u ,n ,a p t ,a p r ) 。这种方法所 研究的问题往往来源于实际,所建立的模型有很强的应用价值,其主要缺点是不易 深刻了解近似算子的代数结构。 在经典粗糙集模型中有三个最基本的要素:一个论域u ,【,上的一个二元等 价关系r ( 它们构成了近似空间) ,一个被近似描述的( 经典) 集合x ,也称为专家 概念。由此。推广的形式也有三个方向,即从论域方向、从关系方向( 包括近似空 间) 和从集合方向。 1 ) 从论域方向推广的目前主要是双论域1 的情形,这时的二元关系就变成了 两个论域笛卡儿乘积的一个子集。对于将论域推广到多个的情形来研究粗糙集理 论的文献很少,这种讨论也将随着维数的增加变得越复杂。 2 ) 关系方向的推广:一种是将论域上的二元等价关系推广为任意的二元关系 得到一般关系下的粗糙集模型 1 0 1 ;另一种是将对象工所在的等价类看成是x 的一 个邻域,从而推广导出了基于领域算子的粗糙集模型哦”;也有将由关系导出的划 分推广成为一般的布尔代数的,以此出发去定义粗糙集和近似算子的;更一般的有 将普通关系推广成模糊关系或模糊划分【6 川而获得模糊粗糙集模型【3 ”。 3 ) 集合和近似空间的推广:这一类的推广是与其他处理不确定,不精确或模 糊的知识( 概率论,模糊数学,信息论,证据理论等) 结合起来进行研究的。 当知识库中的知识是由于随机原因或经统计得到的,即知识库中的知识很可 能是不确定的,很多学者提出了统计( 或概率) 粗糙集模型,变精度粗糙集模型 实际上也可以归入这类模型,寻求具有最小风险的贝叶斯决策问题也可以转化为 这类模型。这一类模型在数据分析的增量式机器学习中有重要应用。目前见到的 此类模型中,近似空间中二元关系大都是等价关系,对于非等价关系给出的情形的 4 第一章绪论 文章尚未见到。张文修等提出了基于随机集的粗糙集模型”作为一种尝试,既是 对基于领域算子的粗糙集模型的推广,又适用于双论域情形,同时也是对统计粗糙 集模型的推广。我们认为在统计粗糙集模型和变精度粗糙集模型中,近似逼近好坏 的本质是张文修提出的包含度的大小,因此我们认为租糙集理论与包含度理论的 关系非常密切。 当知识库中的知识模块都是清晰概念,而被描述的概念是一个模糊概念,人们 建立了粗糙模糊集模型来解决此类问题的近似推理。当知识库中的知识模块也是 模糊的,有些学者就提出了模糊粗糙集模型并作了推广0 3 , 2 4 3 ”。对于知识库中的知 识模块既是模糊知识又是随机得到的至今讨论甚少,但在实际问题中肯定是存在 的,因此也是值得继续研究的。 随着这几年对粗糙集理论的进一步研究,经典的粗糙近似算子已经被大量的 推广,主要表现在和其他不确定性概念或者其他知识发现的方法的结合上,特别 是与模糊系统的联系仍然是研究的热点,这方面的成果也是最多的;而另一方面 对于不完备信息系统上粗糙集模型的研究也主要是对容差关系和相似关系的讨 论;再者对被近似概念和集合的一般化、广泛化也是研究的主流,所有这方面的 工作都是为了使粗糙集理论更加深入到实际问题的解决中,或者是在更多领域中 寻找与粗集理论相结合的交叉点,以此拓展粗糙集的应用。 ( 2 ) 代数方法也称为公理化方法有时也称为算子方法,这种方法不是以二元 关系为基本要素,它的基本要素是一对满足某些公理的一元( 集合) 近似算子 厶h :2 ”- - 9 2 ”,即粗糙代数系统( 2 u , - , u ,n ,l ,日) 中近似算子是事先给定的。这种 方法研究的明显优点是能够深刻地了解近似算子的代数结构,其缺点是应用性不 够强。 近似算予的某些公理能保证有一些特殊类型的二元关系的存在,使这些能够 通过构造性方法产生给定的算子;反过来,由二元关系通过构造性方法导出的近似 算子一定满足某些公理,使这些公理通过代数方法产生给定的二元关系。 公理化方法的研究一开始只局限于p a w l a k 粗糙代数系统,即公理与二元等价 关系相对应情形,后逐渐发展到一般关系下的粗糙集系统川。至今为止,关于公理 化方法的粗糙集理论研究大多局限于经典集情形,对于模糊集情形虽有讨论,但比 较少。 电子科技大学硕士学位论文 1 2 4 不确定性问题的理论研究 粗糙集理论中知识的不确定性主要由两个原因产生的:一个原因是直接来自 于论域上的二元关系及其产生的知识模块,即近似空间本身,如果二元等价关系产 生的每一个等价类中只有一个元素,那么等价关系产生的划分不含有任何信息划 分越粗,每一个知识模块越大,知识库中的知识越粗糙,相对于近似空间的概念和 知识就越不确定,这时处理知识的不确定性方法往往用香农信息熵( s h a n n o m 信息 熵:设c ,是论域,蜀,z :,z 。是【,的一个划分,其上有概率分布 x = ,五x 。 则称 三 日( j ) = 一芝:p fl o g p f f = i 为信息源z 的信息熵,其中对数取以2 为底,而当某个p ,为零时,则理解为 0 l 0 9 0 = 0 ) 来刻画,知识的粗糙性与信息熵的关系比较密切,知识的粗糙性实质上 是其所含信息多少的更深层次的刻画。单从这个角度看粗糙集与信息论的关系就 比较密切,不少学者在这方面做了研究工作。 粗糙集理论中知识不确定性的另一个原因来自于给定论域里粗糙近似的边界 当边界为空集时知识是完全确定的,边界越大知识就越粗糙或越模糊至今,粗糙 集理论刻画概念x 的不确定性用正则条件熵日o ( x i r ) ( 其中x = ,x 是 由x 产生的一个划分,r + = 五,x :,z 。 是由r 产生的一个划分) 和粗糙度 p 。( x ) 来实现的但是这两个度量并没有提供那些完全属于x 的下近似的区域里 面与不可分辨关系的知识粒度有关的不确定性,于是有人引入了粗糙熵e ,( 石) 的 概念来刻画石的不确定性。 在粗糙集理论与其他处理不确定性或模糊性的理论研究中”j 3 】,主要集中在 它与概率统计,模糊数学,d s 证据理论和信息论的相互渗透和补充。在信息系统 中,知识库的知识的类型一般有两类:一类是库中所有对象的描述是完全已知 的,p a w l a k 粗糙集模型和一般二元关系下的粗糙集模型就是属于这一种;另一类 库中的对象的描述只有部分是已知的,即知识库中的知识是不确定的,它只能通过 训练样本所提供的信息来刻画概念,为了使从训练样本获得的规则符合整个论域 的对象,在抽取样本时应符合统计规律性,粗糙集理论不管这一类工作,因此概率 统计作为研究自然界,人类社会以及技术过程中大量随机现象的规律性的一门学 科,它与粗糙集理论的结合就显得非常自然。 模糊集和粗糙集在处理不确定性和不精确性问题方面都推广了经典集合论, 6 第一章绪论 虽然有一定的相容性和相似性【5 ”,然而它们的侧重面不同。从知识的“粒度”的 描述上看,模糊集是通过对象关于集合的隶属程度来近似描述的,而租糙集是通过 一个集合关于某个可利用的知识库的一对上、下近似来描述的:从集合对象间的关 系来看,模糊集强调的是边界的不分明性,而粗糙集强调的是对象间的不可分辨性 从研究的对象来看,模糊集研究的是属于同一类的不同对象间的隶属关系,重在隶 属程度,而粗糙集研究的是不同类中的对象组成的集合关系,重在分类虽然模糊 集的隶属函数和粗糙集的粗糙隶属函数都反映了概念的模糊性,直观上有一定的 相似性,但是模糊集的隶属函数大多是专家凭经验给出的,因此往往带有很强的主 观意志,而粗糙集的粗糙隶属函数的计算是从被分析的数据中直接获得的,非常客 观正因为如此将粗糙集理论和模糊集理论进行某些整合后去描述知识的不确定 性和不精确性比它们各自的描述显示出更强的功能目前所见的模糊租糙集模型 是其中的一些成功例子。 粗糙集理论与d s 证据理论在处理不确定性的问题方面其产生和研究的方法 是不同的,但却有某种相容性,粗糙集理论是为开发规则的机器自动生成而提出 的,而d s 证据理论主要用于证据推理。粗糙集理论用概念的一对上,下近似对 其进行描述,而d s 证据理论是用一对信任函数和似然函数在给定证据下对假设 进行估计和评价。粗糙集理论中的下近似和上近似的概率恰好分别是信任函数和 似然函数,然而生成信任函数和似然函数的基本概率分配函数( 即m 勰s 函数) 方法 是不同的,前者来自于系统中数据本身,比较客观,而后者往往来自于专家的经 验,带有很强的主观性粗糙集理论与d s 证据理论有很强的互补性。 作为描述大系统的数学工具的可拓集、集对分析、含糊集之间也有着一些 内在的联系和区别。人类已步入全新的时代,社会已发展成为一个宏观复杂的大 系统,预测和决策所要考虑的因素越来越多,也越来越复杂,同时科学技术达到 了非常高的水平,问题的研究和解决都需要借助宏观复杂的大系统,大系统理论 和方法的研究必须有能够描述系统的数学工具,由于经典数学不能满足这个要求, 且由于人工智能的迅猛发展,粗糙集和模糊集、可拓集、集对分析1 4 7 1 、v a g u e 集p l 、 界壳论等新兴理论相继产生,认识和分析它们之间的联系与区别对今后的理论和 应用研究都有非常重要的意义。 首先看一下模糊集和v a g u e 集之间的关系,v a g u e 集实际上是一个新的处理模 糊信息的模糊理论,它是对模糊集的扩充,它弥补了模糊集中隶属度函数的不足, 提出了从真假两个方面对研究对象进行描述,v a g u e 集中的真隶属度相当于模糊 集中的隶属度,由于它又给出假隶属度,v a g u e 集能比模糊集更好地描述不确定 7 电子科技大学硕士学位论文 性,因此我们很自然地认识到它与模糊集有一些相同的地方,它们都是从论域出 发根据实际问题做一个集合,而由于问题或研究对象带有不确定性,使得该集合 带有不确定性。从理论上讲,模糊集的应用也可以通过v a g u e 集来实现,而且可 能用v a g u e 集会更好,但实际上在某些情况下用模糊集已经足够了,而有些情况 用模糊集仍显不够准确地描述模糊信息,这时就该用v a g u e 集,由此可见,v a g u e 集和模糊集有一定的互补性。 集对分析是我国学者赵克勤于上世纪8 0 年代提出的,它提出从同、异、 反三方面来表征两个集合的关系。后来又有人提出了模糊联系数】,考虑到了在 研究构成集对的两个集合之间关系的模糊性,从而把模糊数学引入集对分析,文 5 5 在 5 4 的基础上模糊集对势,由于联系度和集对势是集对分析的核心内容, 这两篇文章就搭成了集对分析与模糊数学之间的桥梁,通过它们模糊数学可以广 泛应用到集对分析中,这对两门学科的进一步发展和应用都具有重要意义。 通过比较分析可以看出v a g u e 集与集对分析有很多相似之处。v a g u e 集中的真 隶属度f ( x ) 相当于集对分析中的同一度,假隶属度,( x ) 相当于集对分析中的对立 度,而1 一f ( x ) 一,( x ) 就相当于集对分析中的差异度,在这种情况下,v a g u e 集与集 对分析的作用差不多,但在形式上有一定的区别,这种区别可能给具体的分析带 来一些麻烦,也就是说即使在这种情况下它们也不一定能通用,从严格意义上说 集对分析不是一种集合论,而是一门讨论分析具有特殊意义的经典集合之间的关 系,用于比较两物,可以通过比较两个具体明确的对象而得出关于某一问题的模 糊性结果,并对它们进行量化;而v a g u e 集比集对分析更广泛地应用于描述各种 不确定性信息,可以更广泛地用于人工智能领域。由于v a g u e 集与集对分析关系 密切,它们的理论可以相互渗透或借鉴,促进彼此的发展,在应用中也可以相互 协同。 最后说一点可拓集与上面的几个集合的联系和发展。可拓集与集对分析的关 系已经非常紧密,已有许多学者进行了一系列的研究,主要文献有 5 6 1 1 5 7 ,目前 可拓集与v a g u e 集之间联系的研究仍是空白,但从理论上讲,v a g u e 集是模糊集 的扩充,模糊集与可拓集之间的结合已经产生了f e e c 和灰色物元空间,因此 v a g u e 集与可拓集也将创造出新的理论和方法。 1 2 5 目前粗糙集的主要应用 粗糙集主要应用在人工智能领域和数据挖掘方面,具体表现在: 第一章绪论 ( 1 ) 粗糙集应用于智能控制f l o 。粗糙集根据观测数据获得控制策略,称为从 范例中学习( 1 e a r n i n g f r o me x a m p l e s ) ,属于智能控制的范畴; ( 2 ) 粗糙集用于神经专家系统。将租糙集与神经网络相结合形成粗糙神经专 家系统的混合结构,粗糙集用作数学工具来处理不确定与不精确数据,作为该结 构中神经网络的预处理器,而神经网络加入该结构形成粗糙神经推理引擎的新结 构,它是基于神经网络与粗糙分析约筒的结合上2 7 j ”8 】; ( 3 ) 粗糙集应用于决策分析。粗糙集理论的决策规则是在分析以往经验数 据的基础上得到的,它允许决策对象存在一些不太明确的属性; ( 4 ) 粗糙集和模糊集在词汇挖掘中的应用h o 。采用粗糙集和模糊集的结合, 研究了信息检索中一种新的词汇挖掘机制,指出文本查询既可以使用权重即模糊 表示,也允许使用基于粗糙集的近似表示; ( 5 ) 粗糙集应用于股票数据分析呻】。即运用粗糙集理论分析股票价格与经济 指数之间的依赖关系,并获得预测规则; ( 6 ) 粗糙集应用于医疗诊断p “。在医疗诊断方面,用粗糙集方法根据以往病 例归纳出诊断规则,用来指导新的病例。 1 3 本文的主要工作 本文主要研究租糙集理论模型以及粗糙集理论中的不确定性问题,继续对 p a w l a k 粗糙集模型作推广研究。一是基于p a w l a k 提出的经典粗糙集模型的理论 来源,将此类特殊的模型从论域、关系、集合三个方向进行一般的推广和拓展; 二是根据粗糙集理论在现目前的广阔应用,结合其他一些领域的不确定性理论和 经验,构造某些特殊的粗糙集模型或把粗糙集理论的一些思想应用到其他的知识 系统中,不断丰富粗糙集的理论体系,使其在更多行业中发挥它自身的优势。主 要工作具体如下: ( 1 ) 引入集对分析概念,扩充了变精度b a y e s i a n 粗糙集模型,把该模型进一 步推广到不完备信息系统,提出了集对分析下的变精度b a y e s i a n 粗糙集模型。利 用这种模型可以通过对相似度口和精度占的调节,得到某个概念x 的各种不同 相似度和不同精度的知识集,从而可以增加对数据信息的了解。 ( 2 ) 尽管已有文献将集对分析与粗糙集理论结合起来了,但这些模型它们得 到的某个概念知识集都是一个层次上的,无法得到多个层次上的知识集。本文引 9 电子科技大学硕士学位论文 入相对分类错误率的概念,提出了一种基于限制容差关系下的集对变精度粗糙集 模型。 ( 3 ) 由于v a g u e 集和粗糙集都是描述大系统不确定性的数学工具,由此将这 两个不确定性理论联系起来是自然的。利用我们定义的v a g u e 关系,提出了一种 v a g u e 环境下的粗糙近似算子,从而推广了模糊关系下的模糊粗糙近似算子。这 就在把v a g u e 集理论应用到粗糙集理论中的同时,也推广了粗糙集模型。 i o 第二章集对分析理论 第二章集对分析理论 在这一章里,我们将主要介绍文献 4 7 的相关内容。 2 1 引言 集对分析( s p a ) 是有我国学者赵克勤于1 9 8 9 年f 7 1 正式提出的,是用于研究两 个集合相互关系的理论,其核心思想是把被研究的客观事物之确定性联系和不确 定性联系作为一个确定不确定性系统来分析和处理。在这个确定不确定系统中, 确定性与不确定性互相联系,互相影响,互相制约,并在一定条件下互相转化, 并用一个能充分体现上述思想的确定不确定式子p = a + b i + 来统一的描述各种 不确定性,从而把对不确定性的辩证认识转化成一个具体的数学工具。对集对理 论的初步研究表明,随机不确定性,模糊不确定等不确定性问题均可以用集对理 论作新的研究,因而具有重要的理论意义和广泛的应用前景。 2 2 联系度1 t = a + b i + c j 的确定与表达 联系度= a + b i + 巧在集对分析中又常称为同异反联系度表达式,或确定不 确定式,它一般是按以下思路来确定的。 设我们根据问题矿的需要对由集爿和集口所组成的集对日展开分析,共得到 个特性,其中有s 个为集对中两个集合所共有,这两个集合又在另外的p 个特 性上相对立,在其余的f nsp 个特性上既不对立,又不同一,则在不计各 特性权重的情况下,称此值: 吖为集合4 和集合口在问题矿下的同一度,简称为同一度,并简记为口; 州为集合4 和集合口在问题矿下的差异度,简称为差异度,并简记为b ; p 为集合4 和集合b 在问题形下的对立度,简称为对立度,并简记为c 。 由于同一度,差异度,对立度是从不同的侧面刻画两个集合的联系状况,因 1 1 电子科技大学硕士学位论文 此为全面的刻画两个集合总的联系状况,采用式子 妒) = 万s + 万f f + 昙,( 2 - 0 来加以表示。 ( 2 1 ) 式中的i 为差异度系数,在卜1 ,1 】区间视不同的情况取值( 有时i 仅起标 记的作用) ,而( 2 - 1 ) 式中的,则为对立度的系数,规定其恒取值一1 ( 有时仅起标 记的作用) ,( 2 - 1 ) 式中的t 称为联系度,它在一般情况下表示等式右边的那个式子, 特殊情况下才是一个数值,并称为联系数。通常情况下为简便起见,把( 2 - 1 ) 式简 写成: = a + b i + c j 其中a , b ,c 三个满足归一化条件a + 6 + c = 1 2 3 集对分析的特点 初步的研究表明,集对分析有以下一些特点: 1 全面性。集对分析在具体的问题背景下,既分析两个集合( 或系统) 的同 一性,又分析两个集合( 或系统) 的对立性和差异性。正因为如此,集对分析又 被常称为同异反分析法。当然,这里的前提是,对一个集对( 或系统) 所具有的 特性之分析必须是充分展开的,分析内容必须全面。 2 定性定量相结合。这主要是指集对分析不仅要对具体分析得到的特性作这 两个集合是否共同具有,还是互相对立或者差异的分析、判断、分类,还要对同 异反程度作定量刻画,在还要根据同异反程度作出由若干个集对所表征的那个系 统质的判断。其间要进行一定的数学运算推导和分析。 3 是分析方法的一种综合集成。根据集对的定义可知,集对的具体内容可以 各式各样,加上不同的问题背景,其具体的分析方法也就可以是物理的、化学的、 数学的、系统的、经验的等等。集对分析所进行的同异反分析和刻画是建立在这 些具体分析之上的一种再分析,所以从方法论角度看,集对分析是一种综合集成 的分析方法。 4 把确定性分析和不确定性分析有机的结合起来。在集对分析中,两个集合 第二章集对分析理论 的同一性分析和同一性刻画是相对确定的,对立性分析和对立性刻画也是相对确 定的,但是两个集合的差异性分析和差异性刻画是相对不确定的,尚可进一步做 到底是同一还是对立的分析。之所以这样处理,一方面因为差异是客观事物互相 联系转化的一个普遍形态,是客观存在的中介与过渡;另一方面,差异又是人们 对实际情况的观察、分析受客观条件限制,不可能彻底进行的一种反映。集对分 析把确定性分析结果和不确定性分析结果统一在一个同异反联系度表达式中,便 于人们对实际系统作辩证、定量和完整的分析研究。 5 应用广泛。集对分析既可直接用于对系统作宏观分析,也可用于对系统作 微观分析;既适宜于对简单系统分析,也适宜于对复杂系统分析等等。 下面我们主要站在数学的角度,来看看集对分析在数学方面展开的深入理论 和应用研究。 集对分析与模糊数学的关系密切,但在基本概念、研究方法和实际应用上都 有着明显的区别。首先,隶属度是模糊数学的一块基石。在模糊数学中,元素对 指定集合的隶属度的确定规则不是严格唯一的。在集对分析当中,考虑的是两个 集合的联系问题,元素对指定集的隶属联系只是一种特例,看上去,只有联系度 表达式中的同一度能和模糊数学中的隶属度等价,但两个集合的同一度的计算规 则却是唯一的,当我们在具体的问题背景下,对个集对中的两个集合之特性分 析充分展开后,两个集合的同一度就被唯一的确定了。其次,从集对分析角度看, 模糊数学是从同一性方面去研究和度量事物问的联系,原则上没有超越传统数学 的思维范畴;集对分析是从两个集合的同性、差异性、对立性三方面去研究和 刻画事物问的联系。差异度与对立度对同一度来说,既可起“增益”的作用,也 可能起“惩罚”的作用,反映了两个集合同异反联系本身的互相影响作用,而模 糊数学中的隶属度显然不存在上述情况。再次,模糊数学主要研究系统的同异程 度,而集对分析则侧重于研究系统的转化。 集对分析的上述特点决定了这一系统分析方法在自然科学和社会科学的各个 方面都有重要的应用价值。 总之,集对分析是分析方法的一种综合集成,集对的具体内容可以各式各样, 加上不同的问题背景,其具体的分析方法也就可以是物理的、化学的、数学的、 系统的、经验的等等,而集对分析所进行的同异反分析和刻画是建立在这些具体 分析之上的一种再分析;另一方面,它把确定性分析和不确定性分析有机地结合 起来,两个集合的同一性分析和同一性刻划是相对确定的,对立度分析和对立度 刻划也是相对确定的,但是差异度分析和差异度刻划是相对不确定的,还可进一 电子科技大学硕士学位论文 步作到底是同一还是对立的分析,这样的分析方法便于人们对实际系统作辨证、 定量和完整的分析研究。 1 4 第三章集对分析下的变精度b a y i a n 租糙集模型 第三章集对分析下的变精度b a y e s i a n 粗糙集模型 上一章介绍了集对分析理论相关的内容,以下两章将把该理论与粗糙集理论 结合起来,推广经典的粗糙集模型,提出两种基于集对分析下的粗糙集模型。 3 1 引言 文献 4 2 提出了变精度b a y e s i a n 粗糙集模型,尽管利用它得到的某个概念x 的知识集是多个层次上的知识集,但是对于不完备信息系统却是无能为力。为此, 引入集对分析概念,把该模型进一步推广到不完备信息系统。利用这种模型可以 通过对相似度瑾和精度占的调节,得到某个概念x 的各种不同相似度和不同精度 的下近似知识集g z ) 和上近似知识集r :( x ) ,从而可以增加对数据信息的了 解。接着讨论了集对分析下的变精度b a y e s i a n 粗糙集模型的一系列性质,证明了 该模型确实是p a w l a k 经典粗糙集模型和文献 4 2 ,4 5 ,4 6 中的模型的推广。 3 2 集对分析下的变精度b a y e s i a n 粗糙集模型 集对分析方法是用于研究集合之间相互关系的一种新理论,其核心思想是把 被研究的客观事物之确定性联系和不确定性联系作为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论