(计算机应用技术专业论文)模糊粗糙集与知识获取研究.pdf_第1页
(计算机应用技术专业论文)模糊粗糙集与知识获取研究.pdf_第2页
(计算机应用技术专业论文)模糊粗糙集与知识获取研究.pdf_第3页
(计算机应用技术专业论文)模糊粗糙集与知识获取研究.pdf_第4页
(计算机应用技术专业论文)模糊粗糙集与知识获取研究.pdf_第5页
已阅读5页,还剩95页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要摘要目前,模糊集理论和粗糙集理论已成为知识获取的两种重要数学工具。模糊集理论是一种用精确的数学语言对模糊性进行描述的方法,而粗糙集理论是建立在分类基础上的,将知识理解为对数据的划分,每一划分块是一个概念,其主要思想就是利用已知的知识库中的知识去描述模糊或不确定的知识。模糊集理论和粗糙集理论都有其现实的背景和严密的理论基础,均可用来描述知识的不精确性和不完全性,两者之间既有深刻的联系,又有本质的不同,具有很强的互补性。模糊集理论着眼于知识的模糊性,而粗糙集理论着眼于知识的粗糙性,两者反映的知识粒度不同。粗糙集理论的优势在于它不需要任何预备的额外的数据信息,而模糊集理论处理不确定性问题的常用方法需要一些数据的附加信息或先验知识。但是,粗糙集理论也有其局限性,单纯地使用粗糙集理论未必能完全有效地描述不精确或不确定性问题,将两者进行有机地融合,便可发挥各自的优势,就会得到更具表达力的粗糙模型,即模糊粗糙集模型。为此,本文在对模糊集理论和粗糙集理论的一些基本问题进一步讨论的基础上( 见第2 ,3 章) ,重点研究了模糊粗糙集的数字特征及其公理化问题( 见第4 章) ,并探讨了模糊粗糙集理论在知识获取中的应用( 见第5 章) 。首先,本文讨论了模糊度的形式以及有关模糊关系的几个问题,其主要成果是:得到了模糊度的一个扩展形式和一个新的模糊度计算公式,以及不同模糊度计算公式的多种组合方式;给出了模糊关系合成的分解形式;证明了模糊关系是模糊相似( 等价) 关系的一个充要条件。其次,本文对粗糙集理论的一些基本问题做了进一步地研究,其主要成果是:给出了两个等价关系并、交下的集合近似与每一等价关系下的集合近似之间的关系,两个等价关系相等与集合的上、下近似相等之间的关系;提出了粗糙集的反问题的概念,并讨论了其求解方法;给出了两个等价关系的并、交下的粗糙度与每一等价关系下的粗糙度之间的关系;给出了粗糙集的上近似算子的一个公理组和一个极小化公理组,并证明了其可靠性和独立性。再次,本文讨论了模糊粗糙集的若干理论问题,其主要成果是:利用模糊关系的合成运算,给出了模糊上、下近似的简洁表示形式,并提出了模糊粗糙集的反问题的概念;建立了模糊粗糙集与p a w l a k 粗糙集之间的各种关系;给出了模糊粗糙集的粗糙度、模糊度和贴近度的公理化定义及其构造方法,得到了摘要两个关于模糊粗糙集的粗糙度不等式,以及多个具体的模糊粗糙集的粗糙度、模糊度和贴近度;引入了数加模糊集和模糊关系的外合成运算两个概念,推导出了模糊下近似算子的一个公理组,并证明了其可靠性和独立性。最后,本文讨论了几种重要信息系统中的知识获取方法,其主要成果是:给出了离散型决策表属性的一个基于可辨识0 1 信息表的启发式约简算法和一个二分归纳约简算法;给出了连续型决策表的基于模糊贴近度的属性约简与规则获取方法;针对连续型决策表,提出了模糊相对约简和模糊相对核的概念,证明了模糊相对约简的存在性,以及所有模糊相对约简的交是模糊相对核的结论,给出了属性重要性的一个计算公式,并由此给出了一个启发式属性约简算法和一种规则获取方法;将偏好关系引入信息系统,提出了偏好信息系统、偏好决策表、信息效用函数的概念,给出了信息效用函数的存在性定理以及信息效用函数在知识获取中的几个应用。本文还列举了需要进一步研究的相关问题。关键词:模糊集,粗糙集,模糊粗糙集,知识获取,信息系统i ia b s t r a c ta b s t r a c ta tp r e s e n t ,f u z z ys e tt h e o r ya n dr o u g hs e tt h e o r yh a v eb e c o m et w oi m p o r t a n tm a t h e m a t i c a lt o o l sf o rk n o w l e d g ea c q u i s i t i o n f u z z ys e tt h e o r yi st h em e t h o dt h a td e s c r i b e sf u z z i n e s sw i t hp r e c i s em a t h e m a t i c a ll a n g u a g e ,w h i l er o u g hs e tt h e o r yi sam e t h o dt h a ti sb a s e do nc l a s s i f i c a t i o na n dc o n s i d e r sk n o w l e d g ea st h ed a t ad i v i s i o nw i t he a c hd i v i s i o na sac o n c e p t i o n t h em a i ni d e ao fr o u g hs e tt h e o r yi st od e s c r i b ef u z z yo ru n c e r t a i nk n o w l e d g eu s i n gp r i o r ik n o w l e d g ei nk n o w l e d g eb a s e b o t hf u z z ys e tt h e o r ya n dr o u g hs e tt h e o r yh a v ep r a c t i c a lb a c k g r o u n d s ,s t r i c tt h e o r yf o u n d a t i o n s ,a n dc a nb eu s e dt od e s c r i b et h ef u z z i n e s sa n di n c o m p l e t e n e s so fk n o w l e d g e t h e yh a v ed e e pr e l a t i o n s h i p ,e s s e n t i a ld i f f e r e n c ea n ds t r o n gc o m p l e m e n t a r i l yb e t w e e nt h e m f u z z ys e tt h e o r yf o c u s e so nt h ef u z z i n e s so fk n o w l e d g e ,w h i l er o u g hs e tt h e o r yf o c u s e so nt h er o u g h n e s so fk n o w l e d g e t h ek n o w l e d g eg r a n u l a r i t i e st h a tt h e yr e f l e c t ea r ed i f f e r e n t t h es u p e r i o r i t yo fr o u g hs e tt h e o r yl i e si nt h ef a c tt h a ti td o e s n tn e e da n ye x t r ap r e p a r a t o r yd a t ai n f o r m a t i o nw h i l ef u z z ys e tt h e o r yc o m m o n l yn e e d s h o w e v e r r o u g hs e tt h e o r yh a si t sl i m i t a t i o n st h a ti tc o m m o n l yc a n td e s c r i b ef u z z yo ru n c e r t a i np r o b l e m sf u l l ya n de f f e c t i v e l y a m a l g a m a t i n gt h et w ot h e o r i e so r g a n i c a l l yc a l le m p l o yt h e i re a c hs u p e r i o r i t y , a n dt h e nw ec a ng e tam o r ee x p r e s s i v er o u g hm o d e l ,t h a ti s ,t h ef u z z yr o u g hs e tm o d e l t h e r e f o r e ,b a s i n go nt h ef u r t h e rd i s c u s s i o n so fs o m eb a s i cp r o b l e m so ff u z z ys e tt h e o r ya n dr o u g hs e tt h e o r y ( c h a p t e r 2 ,3 ) ,t h i sd i s s e r t a t i o nm a i n l yr e s e a r c h e st h en u m e r i c a lf e a t u r ea n da x i o m a t i z a t i o no ff u z z yr o u g hs e t ( c h a p t e r 4 ) ,a n dt h e nd i s c u s s e st h ea p p l i c a t i o no ff u z z yr o u g hs e tt h e o r yi nt h ek n o w l e d g ea c q u i s i t i o n ( c h a p t e r 5 ) f i r s t ,t h ef o r mo ff u z z yd e g r e ea n ds e v e r a lp r o b l e m sa b o u tf u z z yr e l a t i o na r ed i s c u s s e d t h em a i na c h i e v e m e n t sa r e :a l le x t e n d e df o r ma n dan e wc a l c u l a t i o nf o r m u l ao ff u z z yd e g r e ea n ds o m ec o m b i n a t i o nf o r m so fd i f f e r e n tc a l c u l a t i o nf o r m u l ao ff u z z yd e g r e ea r eo b t a i n e d ;t h ed e c o m p o s i t i o nf o r mo ff u z z yr e l a t i o nc o m p o s ei sp r o p o s e d ;as u f f i c i e n ta n dn e c e s s a r yc o n d i t i o nt h a tt h ef u z z yr e l a t i o ni saf u z z ys i m i l a r ( e q u i v a l e n c e ) r e l a t i o ni sp r o v e d n e x t , f u r t h e rr e s e a r c ho ns o m eb a s i cp r o b l e m so fr o u g hs e tt h e o r yi sc a r r i e do n t h em a i na c h i e v e m e n t sa r e t h er e l a t i o nb e t w e e ns e ta p p r o x i m a t i o nb a s e do nt h ei i ia b s t r a c tu n i o na n di n t e r s e c t i o no ft w oe q u i v a l e n c er e l a t i o n sa n dt h eo n et h a ti sb a s e do ne a c he q u i v a l e n c er e l a t i o n ,a n dt h er e l a t i o nb e t w e e nt h ee q u a l i t yo ft w oe q u i v a l e n c er e l a t i o na n dt h ee q u a l i t yo fu p p e ra n dl o w e ra p p r o x i m a t i o no ft h es e ta r ep r o p o s e d ;t h ec o n c e p t i o no fi n v e r s ep r o b l e mo fr o u g hs e ti sp r e s e n t e d ,a n di t ss o l v i n gm e t h o di sd i s c u s s e d ;t h er e l a t i o nb e t w e e nr o u g hd e g r e eb a s e do nt h eu n i o na n di n t e r s e c t i o no ft w oe q u i v a l e n c er e l a t i o n sa n dt h eo n eb a s e do ne a c he q u i v a l e n c er e l a t i o ni sp r o p o s e d ;a na x i o mg r o u pa n dam i n i m i z a t i o na x i o mg r o u po fu p p e ra p p r o x i m a t i o no p e r a t o ro fr o u g hs e ta r eo b t a i n e d ,a n dt h e i rr e l i a b i l i t ya n di n d e p e n d e n c ea r ea l s op r o v e d i na d d i t i o n ,an u m b e ro ft h e o r e t i c a lp r o b l e m so ff u z z yr o u g hs e ta r ed i s c u s s e d t h em a i na c h i e v e m e n t sa r e t h el a c o n i ce x p r e s s i o no ff u z z yu p p e ra n dl o w e ra p p r o x i m a t i o ni so b t a i n e dw i t ht h ec o m p o s eo p e r a t i o no ff u z _ z yr e l a t i o n ,a n dt h ec o n c e p t i o no fi n v e r s ep r o b l e mo ff u z z yr o u g hs e ti sp r e s e n t e d ;v a r i o u sr e l a t i o n sb e t w e e nf u z z yr o u g hs e ta n dp a w l a kr o u g hs e ta r ee s t a b l i s h e d ;t h ea x i o m a t i z a t i o nd e f i n i t i o na n dt h ec o n s t r u c t i o nm e t h o d so fr o u g hd e g r e e ,f u z z yd e g r e ea n dc l o s ed e g r e eo ff u z z yr o u g hs e ta r ep r o p o s e d ,t w or o u g hd e g r e ei n e q u a l i t yo ff u z z yr o u g hs e ta n ds e v e r a lc o n c r e t ef o r m u l a sa b o u tr o u g hd e g r e e ,f u z z yd e g r e ea n dc l o s ed e g r e eo ff u z z yr o u g hs e ta r eo b t a i n e d ;t w oc o n c e p t i o n so fn u m b e ra d d e df u z z ys e ta n do u t s i d ec o m p o s eo p e r a t i o no ff u z z yr e l a t i o na r ei n t r o d u c e d ,a l la x i o mg r o u po ff u z z yl o w e ra p p r o x i m a t i o no p e r a t o ri sd e r i v e da n dt h er e l i a b i l i t ya n di n d e p e n d e n c ea r ep r o v e d f i n a l l y , k n o w l e d g ea c q u i s i t i o nm e t h o d si ns e v e r a li m p o r t a n ti n f o r m a t i o ns y s t e m sa r ed i s c u s s e d t h em a i na c h i e v e m e n t sa r e h e u r i s t i cr e d u c t i o na l g o r i t h mb a s e do ni d e n t i f i e do 一1i n f o r m a t i o nt a b l ea n dd i c h o t o m yi n d u c t i o nr e d u c t i o na l g o r i t h mo fd i s c r e t ed e c i s i o nt a b l ea t t r i b u t ea r ep r o p o s e d ;t h em e t h o d so fa t t r i b u t er e d u c t i o na n dr u l ea c q u i s i t i o no fc o n t i n u o u sd e c i s i o nt a b l eb a s e do nf u z z yc l o s ed e g r e ea r ep r o p o s e d ;a c c o r d i n gt oc o n t i n u o u sd e c i s i o nt a b l e ,t h ec o n c e p t i o n so ff u z z yr e l a t i v er e d u c t i o na n df u z z yr e l a t i v ec o r ea r ep r o p o s e d ,t h ee x i s t e n c eo ff u z z yr e l a t i v er e d u c t i o na n dt h ec o n c l u s i o nt h a tt h ei n t e r s e c t i o no ff u z z yr e l a t i v er e d u c t i o ni sf u z z yr e l a t i v ec o r ea r ep r o v e d , ac a l c u l a t i o nf o r m u l ao fa t t r i b u t es i g n i f i c a n c ei so b t a i n e d ,h e u r i s t i ca t t r i b u t er e d u c t i o na l g o r i t h ma n dr u l ea c q u i s i t i o nm e t h o da r eo b t a i n e db a s e do nt h ea b o v e ;p r e f e r e n c er e l a t i o ni si n t r o d u c e di n t oi n f o r m a t i o ns y s t e m ,t h ec o n c e p t i o n so fp r e f e r e n c ei n f o r m a t i o ns y s t e m ,p r e f e r e n c ed e c i s i o nt a b l e ,i n f o r m a t i o ni va b s t r a c tu t i l i t yf u n c t i o na r ep r e s e n t e d ,t h et h e o r e ma b o u tt h ee x i s t e n c eo ft h ei n f o r m a t i o nu t i l i t yf u n c t i o na n ds e v e r a la p p l i c a t i o n sa b o u tt h ei n f o r m a t i o nu t i l i t yf u n c t i o ni nk n o w l e d g ea c q u i s i t i o na l eo b t a i n e d r e l a t i v ep r o g r a m so ff u r t h e rs t u d i n ga r ea l s oe n u m e r a t e di nt h i sd i s s e r t a t i o n k e y w o r d s :f u z z ys e t ,r o u g hs e t ,f u z z yr o u g hs e t ,k n o w l e d g ea c q u i s i t i o n ,i n f o r m a t i o ns y s t e mv学位论文版权使用授权书本人完全了解同济大学关于收集、保存、使用学位论文的规定,同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。一o 荔葛j f经指导教师同意,本学位论文属于保密,在年解密后适用本授权书。指导教师签名:学位论文作者签名:年月日年月日八u工么n2(同济大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。储恕签名:乙一础刈夕第1 章序言第1 章序言1 1 粗糙集理论研究概况1 9 8 2 年,波兰数学家z p a w l a k 发表了论文“r o u g hs e t s ” 1 5 j ,宣告了粗糙集理论的诞生,为处理不完整和不精确信息提供了一种有效的数学工具。由于最初的研究大多是以波兰文发表的,因此,在当时并未引起国际上数学界和计算机界的重视,研究地域也仅局限于东欧一些国家。到了8 0 年代末,由于粗糙集理论在机器学习、知识获取、决策支持、模式识别和金融管理等方面得到了广泛而成功的应用,才逐渐引起了世界各国学术界的关注,许多数学家、逻辑学家和计算机研究人员对该理论及其应用产生了极大兴趣,并做了大量研究工作,取得了丰富的成果7 引。1 9 9 1 年,z p a w l a k 的专著( ( r o u g hs c t 栅e o r e t i c a la s p e c t so fr e a s o n i n ga b o u td a m ) ) 的问世,是粗糙集理论及其应用研究的第一个里程碑,并使该领域的研究进入了一个繁荣时期。1 9 9 2 年,第一届关于粗糙集理论的国际学术会议在波兰召开。1 9 9 5 年,a c mc o m m u n i c a t i o n 将粗糙集理论列为新浮现的计算机科学的研究课题。1 9 9 8 年,国际信息科学杂志 i n f o r m a t i o ns c i e n c e s ) ) 为粗糙集理论的研究出了一期专集。粗糙集理论发展至今,已成为信息科学最为活跃的研究领域之一。对粗糙集理论的研究主要有两种方法:构造性方法和公理化方法,其中的构造性方法所研究的问题往往来源于实际,所建立的模型有很强的实用价值,其缺点是不易深刻了解粗糙集的数学结构,而公理化方法的优缺点是恰好与之相反 5 2 , 7 4 1 。比较而言,粗糙集理论的公理化研究比构造性研究要少的多,t y l i n是粗糙集理论公理化研究的第一人 4 5 j ,祝峰和孙辉等分别在此基础上做了进一步地研究1 4 6 , 4 7 j ,得到了更为简洁的粗糙集公理组。总起来讲,对粗糙集理论的研究主要集中在三个方面:模型的推广、有效约简算法的设计和与纯数学理论的结合。( 1 ) 粗糙集模型的推广z p a w l a k 粗糙集模型的推广一直是粗糙集理论研究的主流方向。在z p a w l a k 粗糙集模型中有三个最基本的要素:论域u 、二元等价关系r ( u 和尺构成了近似空间) 和集合x ( 被近似描述) ,因此,推广形式也就有三个基本的方向:从论域方向、从关系方向和从集合方向f 7 4 j 。从论域第1 章序言方向推广:目前的一种是双论域的情形1 3 引。这方面的研究成果很少,可能与该模型缺少实际应用背景有关。从关系方向推广:一般是将论域u 上的二元等价关系尺推广为任意的二元关系,获得一般关系下的粗糙集模型 6 5 , 7 2 】。更为一般的情况是,将经典关系推广为模糊关系,获得模糊粗糙集模型 1 1 , 5 1 , 5 2 , 5 7 , 5 8 , 8 7 , 1 0 6 l 。关于模糊粗糙集模型的讨论,往往伴随着被描述概念的模糊化,是极具一般性的。特殊地,是基于模糊等价关系的粗糙集模型 8 3 j 。从集合方向推广:当关系清晰、集合模糊时,便可建立粗糙模糊集模型 i ! , 8 8 , 1 0 3 j 。另外,若将近似空间推广为概率近似空间,就可建立概率粗糙集模型 1 1 , 8 9 j ,变精度粗糙集模型 1 1j 实质上也可归入此类。推广的粗糙集模型的研究主要是集中在理论上,应用性研究相对较少。( 2 ) 属性约简算法的设计属性约简作为粗糙集理论的一项关键技术,至今仍是粗糙集理论研究的重要内容之一,其基础性研究已比较成熟,但因求最小属性约简是一个n p 一完全问题 1 1 , 1 4 j ,所以,寻求高效的属性约简算法一直是众多学者们的追求目标,有关算法不断出现,如启发式算法、归纳算发和基因算法等 1 4 , 9 1 棚j 。多数的属性约简算法都是以属性核为基础的,这样可以有效地减小约简算法在属性空间中的搜索范围,极大地缩短算法的运行时间。对这类利用了属性核的算法而言,如何有效地计算属性核就是一个非常值得注意的问题。遗憾的是,对这一问题的研究不多,相应的属性约简算法或者根本不提及计算属性核的方法,或者只是简单地指明直接引用h x h u 的研究成果1 3 引。为了更高效地解决属性核的计算问题,赵军和王国胤等提出了一个新算法 4 2 j ,该算法按计算关键属性集合的方法来确定属性核,不必建立可分辨矩阵,其效率明显高于h x h u 的算法。几乎所有的属性约简算法都是针对离散属性的,直接针对连续属性的属性约简算法是少见的。( 3 ) 粗糙集理论与纯数学理论的结合将粗糙集理论与纯数学理论结合起来进行研究是纯数学的领域,为纯数学研究提供了一个良好的思路和背景,两者的结合形成了或将要形成一些新的数学分支,其中的一些有着良好的应用背景,如粗糙逻辑等 9 4 , 9 5 , 1 0 7j 。将粗糙集的思想引入到一个代数系统,可以按十分自然的方式导出所谓的粗糙代数的概念。粗糙集的代数分析是粗糙集理论研究中的一个活跃分支。将粗糙集的思想培植到半群理论中去,即可导出粗糙半群代数 9 6 , 9 7 j ;培植到群理论中去,即可导出粗糙群代数l l o l j 。还可以将粗糙集理论与格论、拓扑空间结合起来进行研究 1 0 9 , 1 1 0 j 。以上研究均属于经典粗糙集理论2第1 章序言与经典数学理论的结合,还没有涉及与模糊集理论的结合。粗糙集理论和模糊集理论研究问题的着眼点不同【2 引,将两者结合起来,可以发挥各自的优势,作为解决一些特定问题的方法,这是提出粗糙模糊集( r o u g hf u z z ys e t s ) 模型和模糊粗糙集( f u z z yr o u g hs e t s ) 模型的背景 1 1 , 5 1 , 5 2 , 5 7 , 5 8 , 8 7 , 8 8 】。关于这两类粗糙集模型的代数结构、拓扑性质的讨论文献较少。刘贵龙探讨了粗糙模糊集的格论性质,把有关粗糙集的格论性质完整地推广到了粗糙模糊集上 6 s j 。目前,粗糙集理论与纯数学理论的结合研究主要是停留在理论阶段,应用性研究非常少,任何学科都具有两面性,往往理论性越强,其应用背景也就相对变弱。粗糙集理论至今已有二十余年的发展历史,取得的成果令人瞩目,但这一理论仍是一个处在发展中的学科,还有不少有意义且极具挑战性的研究方向及应用领域需要探讨。1 2 模糊集和粗糙集的区别与融合模糊集( f u z z ys e t s ) 理论是美国计算机与控制论专家l a z a d e h 于1 9 6 5 年提出的v 1 ,是一种用精确的数学语言对模糊性进行描述的方法。所谓的模糊性,是指客观事物在差异的中间过渡时所呈现的“亦此亦彼”性。模糊集理论的出现把数学的应用范围从精确现象扩大到了模糊现象。粗糙集( r o u g hs e t s ) 理论是建立在分类基础上的,将知识理解为对数据的划分,每一划分块是一个概念,其主要思想就是利用已知的知识库中的知识去描述模糊或不确定的知识。模糊集理论和粗糙集理论的产生与发展都同计算机科学的发展及应用有着密切的关系,两者都有其现实的背景和严密的理论基础,都己广泛应用于知识获取等领域。模糊集理论和粗糙集理论都是对经典集合论的拓展,它们都可以用来描述知识的不精确性和不完全性,两者之间既有深刻的联系,又有本质的不同,具有很强的互补性,在描述不确定性问题上扮演着不同的角色“1 砬巩2 5 训。经典集合对应二值逻辑,适合于描述确定性问题,但不能很好地描述模糊和不确定性概念。模糊集将经典集合的特征函数推广为隶属函数,很好地解决了描述模糊概念的问题。模糊集对应模糊逻辑。粗糙集为处理模糊和不确定性问题,也推广了经典集合。粗糙集是通过基于不可分辨关系形成的集合的上、下近似来描述知识的不精确性和不确定性。粗糙集对应粗糙逻辑。模糊集着眼于知识的模糊性,而粗糙集着眼于知识的粗糙第1 章序言性,两者从不同的侧面反映知识的粒度性。模糊集与粗糙集分别刻画了不完备信息的两个方面。从集合的对象间的关系来看,模糊集强调集合边界的病态定义,即边界的不分明性;粗糙集强调集合对象间的不可分辨性。从研究的对象来看,模糊集研究的是属于同一类的不同对象对集合的隶属关系,重在隶属度,因此,模糊集是知识获取中常用的聚类方法之一;粗糙集以不可分辨关系为基础,研究的是不同类中的对象组成的集合之间的关系,重在分类,分类的能力在于论域上的不可分辨关系提供的知识多少,不可分辨关系是粗糙集中最基本和重要的概念。与模糊集不同,粗糙集中不精确性的数值不是事先假定的,而是通过表达知识不精确性的概念一集合的上、下近似计算出来的。在粗糙集中,集合的不精确性是由边界域引起的。相对于正域来说,边界域的大小与集合的精确性成反比,近似精度刻画了所能了解的关于集合x 的知识的完全程度。而在模糊集中,集合的模糊性是由元素对集合的隶属度大小引起的。粗糙集不能精确定义的原因是缺乏足够的论域知识,但可以用一对精确集合即上、下近似表示一个粗糙集。当关于论域的知识越多时,越能精确地表示所考虑的集合。粗糙隶属函数并非z a d e h 意义下的隶属函数,它是根据论域数据隐含的分类知识计算出来的,具有较强的客观性;而模糊集的隶属函数值一般是由专家给定的,具有较强的主观性。模糊集是通过对象关于集合的隶属度来近似描述集合的模糊性,而粗糙集是通过一个集合的上、下近似来描述集合的粗糙性。粗糙隶属函数可以看成特殊的隶属函数,此时,论域中任意一个集合x 对应一个模糊集;,集合x 的上、下近似分别是:的支集和核。粗糙集的优势在于它不需要任何预备的额外的数据信息,而模糊集处理不确定性问题的常用方法需要一些数据的附加信息或先验知识。但是,粗糙集也有其局限性,单纯地使用粗糙集不一定能完全有效地描述不精确或不确定问题。注意到模糊集与粗糙集之间的互补性,将两者进行有机地融合,可以发挥各自的优势,得到更具表达力的粗糙模型,包括:将经典关系推广为模糊关系,而获得的模糊粗糙集模型;当关系清晰、集合模糊时,而建立的粗糙模糊集模型。一般的情况是,当关系和集合都模糊时,而建立的模糊粗糙集模型1 1 2 , 5 3 , 5 9 j 。刘贵龙、莫智文、刘华文和王玲芝等对模糊粗糙集的数字特征做了一定的讨论 5 9 , 6 6 , 6 7 , 7 0 , 7 0 7 1 j ,n n m o i l s 、h t h i e l e 、吴伟志和刘贵龙等比较全面地研究了模糊粗糙集的公理化问题 5 1 “5 3 , 舢矧。s n a n d a 将模糊粗糙集定义为p a w l a k 意义下的4第1 章序言上、下近似算子的一对模糊子集【5 8 l ,因其缺乏实用性,而实际采用的较少。关于模糊粗糙集,理论研究的多,应用研究的少。1 3 基于粗糙集理论的知识获取知识是人类认识客观世界的结果,同时,也是人类指导自己行为的准则。人类可以从不同的途径获取知识,但是,不同的知识获取手段有着不同的方法。这里所说的知识获取是一种特定的知识获取,是指从数据集中识别出正确、新颖、有潜在应用价值的,并最终可被理解的模式的方法 m 4 , m 】。该方法的特点是:( 1 ) 基础信息是数据库( 可用信息系统表示) ;( 2 ) 模式是可以理解的;( 3 )模式的获取是非平凡的。知识获取一直是人工智能的核心问题,但是,这样一种特定的知识获取被正式提出来,是在1 9 8 9 年8 月于美国召开的第1 l 届国际人工智能联合会议的专题讨论会上。从那以后,知识获取,或者说数据库中的知识获取( k d d ) 备受重视。同样是基于数据库的知识获取,有着完全不同的方法,使用着完全不同的数学工具。其中,模糊集和粗糙集就是两种重要的数学工具。粗糙集理论可以支持知识获取的多个步骤,如数据预处理、数据约简和规则生成等l i 引。近年来,粗糙集理论在知识获取中的应用得到了较大的发展,基于粗糙集理论的方法已成为知识获取的主流方法之一,这是因为粗糙集理论作为知识获取的工具有许多优点1 1 1 2 j :( 1 ) 粗糙集理论提供了一套完整的数学方法来严格地处理数据分类问题,尤其是当数据具有噪声、不完全或不精确时;( 2 )粗糙集理论仅仅分析隐藏在数据中的事实,并没有校正数据中所表现的不一致性,而是一般地将所生成的规则分为确定的和不确定的规则;( 3 ) 粗糙集理论包括了知识的一种形式模型,这种模型将知识定义为不可区分关系的一个集合族,这就使得知识具有了一种清晰定义的数学意义,并可使用数学方法来分析处理;( 4 ) 粗糙集理论不需要关于数据的任何附加信息。下面,列举几个具有代表性的粗糙集理论在知识获取中的应用。n s h a n 等研究了基于粗糙集理论的从数据库中发现最大泛化规则和约简的增量算法l i j 。该算法的最大特点是决策规则和约简的计算转化为一组相关联的布尔表达式的化简和修改,无需搜索算法寻找和修改规则。x h h u 等提出了一种基于属性的归纳概念技术和粗糙集理论相结合的方法【1 1 4 j 。首先,使用面向属性的归纳树爬第1 章序言升技术对属性进行泛化,并使用一个内部属性v o t e 来记录泛化过程中被合并的元组个数,滤除v o t e 值低于噪声门限的元组,这使得数据库学习过程的计算复杂度大为降低。然后,利用粗糙集理论计算约简并生成规则。由于在泛化过程中消除了不必要的属性值和约简过程中去掉了不相关的属性,所以,最后获得的规则具有很一般的形式且可用高层次抽象概念表达。m k r y s z k i e w i c z 等提出了寻找复合信息系统的约简的一种方法【1 1 引。r s l o w i n s k i 等研究了粗糙集理论中处理各种不确定性的方法1 1 1 6 j 。t b e a u b o u e f 等在粗糙集理论的基础上提出了一种粗糙关系数据库模型,并定义了各种粗糙关系算子1 1 1 引。1 4 论文的主要研究内容和成果本文主要有六章组成,除第l 章的序言和第6 章的结束语以外,其余四章的主要研究内容和成果分别叙述如下:( 1 ) 关于模糊集理论的若干基本问题讨论( 第2 章)本章在阐述模糊集理论的基本概念、原理和方法的基础上,重点讨论了模糊度的形式以及有关模糊关系的几个问题。主要成果是:得到了模糊度的一个扩展形式,并据此导出了一个新的模糊度计算公式。该扩展形式包括了目前普遍采用的模糊度一般形式。同时,给出了m i n k o w s k i 模糊度的三种推导方法,以及不同模糊度计算公式的多种组合方式,说明了模糊度的多样性。给出了两个模糊关系合成的截集与两个模糊关系截集的合成之间的各种关系,并在此基础上给出了模糊关系合成的分解形式。证明了一个模糊关系是模糊相似( 等价) 关系的充要条件是其任意强截集都是经典相似( 等价) 关系。( 2 ) 关于粗糙集理论的若干基本问题讨论( 第3 章)本章在阐述粗糙集理论的基本概念和原理的基础上,对粗糙集理论的一些基本问题做了进一步地研究。主要成果是:给出了两个等价关系并、交下的集合近似与每一等价关系下的集合近似之间的关系,不同知识粒度下的集合近似之间的关系,以及两个等价关系相等与集6第1 章序言合的上、下近似相等之间的关系。提出了粗糙集的反问题的概念,并讨论了其求解方法。给出了两个等价关系的并、交下的粗糙度与每一等价关系下的粗糙度之间的关系。证明了知识约简的存在性,给出了知识依赖性与依赖度之间的关系。给出了粗糙集的上近似算子的一个公理组和一个极小化公理组,并证明了其可靠性和独立性。利用上、下近似算子之间的对偶性,还得到了上近似算子的两个公理组、下近似算子的一个公理组,以及上近似算子的两个极小化公理组。( 3 ) 模糊粗糙集及其公理化( 第4 章)本章的主要讨论内容包括:模糊粗糙集与p a w l a k 粗糙集之间的关系;模糊粗糙集的数字特征;模糊粗糙集的公理化。主要成果是:利用模糊关系的合成运算,给出了模糊上、下近似的简洁表示形式,并提出了模糊粗糙集的反问题的概念。证明了模糊上、下近似的截集可以表示为模糊集的截集在模糊关系的截集下的上、下近似,在此基础上给出了模糊粗糙集的分解形式,建立了模糊粗糙集与p a w l a k 粗糙集之间的关系。给出了模糊粗糙集的粗糙度的公理化定义及其两种构造方法,得到了两个关于模糊粗糙集的粗糙度不等式。给出了模糊粗糙集的模糊度的公理化定义及其两种构造方法,以及若干具体的模糊粗糙集的模糊度。给出了模糊粗糙集的贴近度的公理化定义及其构造方法,以及若干具体的模糊粗糙集的贴近度。引入了数加模糊集和模糊关系的外合成运算两个概念,推导出了模糊下近似算子的一个公理组,并证明了其可靠性和独立性。( 4 ) 信息系统中的知识获取( 第5 章)本章在阐述离散型信息系统基本问题的基础上,重点讨论了以下几个方面的问题:离散型决策表的属性约简算法;连续型决策表中的知识获取;偏好信息系统以及偏好决策表中的知识获取。主要成果是:给出了离散型决策表属性的基于可辨识0 - 1 信息表的启发式约简算法。该7第1 章序言算法较好地解决了如何在重要性相同的条件属性中选择其一加入到相对约简的问题。给出了离散型决策表属性的二分归纳约简算法。该算法在每次搜索时,仅考虑把所有待搜索的有序幂集一分为二的一个有序幂集,需要计算和搜索的有序幂集明显减少。从而,算法的效率得到了很大程度地提高。给出了连续型决策表的基于模糊贴近度的属性约简与规则获取方法。该方法认为,两个条件属性越贴近,它们之间的替代性就越强。其优点是口贴近约简中的属性具有较好的代表性。针对连续型决策表,提出了模糊相对约简和模糊相对核的概念,并证明了模糊相对约简的存在性,以及所有模糊相对约简的交是模糊相对核的结论。另外,还给出了属性重要性的个计算公式。在这些工作的基础上,给出了连续型决策表的一个启发式属性约筒算法和一种规则获取方法。为增强信息系统描述现实的能力,将偏好关系引入信息系统,提出了偏好信息系统、偏好决策表和信息效用函数的概念,给出了信息效用函数的存在性定理,并讨论了信息效用函数在知识获取中的若干应用。第2 章关于模糊集理论的若干基本问题讨论第2 章关于模糊集理论的若干基本问题讨论模糊集理论及其应用已比较成熟,但仍有一些基本的问题需要研究。本章在阐述模糊集理论的基本概念、原理和方法的基础上,重点讨论模糊度的形式以及有关模糊关系的若干问题。本章内容是第4 章和第5 章内容的基础。2 1 模糊集的概念与运算设u 为论域,记p ( u ) 是u 的幂集,即尸( u ) = 忸i 彳u ) 。经典集合彳尸( u )可以用其特征函数,f l ,甜a以( 甜) 21o ,甜芒彳来刻画。经典集合所表达的概念是清晰的。用特征函数表示经典集合的实质是特征函数只取0 ,l 两个值。模糊集合是经典集合的推广,它是用论域u 到闭区间【0 ,1 】的一个映射来刻画的。定义2 1 1 1 _ 4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论