




已阅读5页,还剩38页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要摘要粗糙集是一种有效地处理不完整和不确定信息的数学工具,但是对于原始模糊数据的处理能力较弱。本文针对粗糙集理论这一不足,将模糊集理论与粗糙集理论相结合,对于两种不同类型的原始模糊数掘提出以模糊相似关系代替经典粗糙集中的等价关系,给出一种基于模糊相似关系处理模糊数据的粗糙集模型。首先,从模糊相似的角度考虑,在模糊环境下重新定义了粗糙集合的概念。并且,将约简与核等一系列知识约简的基本概念推广到模糊环境下,给出了一种模糊的、动态的简化原始模糊数据的方法。最后通过具体的数值试验,验证本文的方法简化结果简练,丢失信息少,得到更为符合实际情况的模糊规则。关键词:知识发现;知识表示;粗糙集;模糊粗糙集;模糊约简;模糊核a b s t r a c ta l t h o u g hr o u g hs e tt h e o r yi sap o w e r f u lt o o ld e a l i n gw i t hi n c o m p l e t e n e s sa n du n c e r t a i n t y ,i t sp e r f o r m a n c et od e a lw i t hi n i t i a lf u z z yd a t ai sp o o ni nt h i sp a p e rw em a k ea na t t e m p tt oi m p r o v et h ep e r f o r m a n c eo fe x i s t i n gr o u g hs e t sm o d e lv i af u z z ys i m i l a r i t yr e l a t i o n f r o mb o t hk n o w l e d g er e p r e s e n t a t i o na n dk n o w l e d g er e d u c t i o n ,w eg e n e r a l i z er o u g hs e t st of u z z ye n v i r o n m e n t s c o n s i d e rt h es i m i l a r i t yo fo b j e c t sw ed e f i n ef u z z yl o w e r 、u p p e ra p p r o x i m a t i o na n df u z z yr o u g hs e t s f u r t h e r m o r e ,w eg e n e r a l i z eas e r i e so fc o n c e p t so fk n o w l e d g er e d u c t i o nt of u z z ye n v i r o n m e n t 、a n dt h e np r o p o s eah e u r i s t i ca l g o r i t h mw h i c hg i v eaf u z z ya n dd y n a m i cp r o c e s st od e a lw i t hi n i t i a lf u z z yd a t a f i n a l l yt h en u m e r i c a le x a m p l ei l l u s t r a t e st h a tt h ep r o p o s e da p p r o a c hi nt h i sp a p e rc a no b t a i ns o m es i m p l ef u z z yp r o d u c t i o nr u l e s k e yw o r d s :k n o w l e d g ed i s c o v e r y ;k n o w l e d g er e p r e s e n t a t i o n ;r o u g hs e t s ;f u z z yr o u g hs e t s ;f u z z yr e d u c t ;f u z z yc o r e第1 章绪论第1 章绪论1 1 粗糙集理论的研究现状在经典的逻辑中,只有真假之分。但在现实生活中有许多含糊现象并不能简单得用真、假值来表示,如何表示和处理这些现象就成为一个研究领域。k 期以来许多逻辑学家和哲学家就致力于研究含糊概念。早在1 9 0 4 年谓词逻辑的创始人g f r e g e 就提出了含糊一词,他把它归结到边界线h 也就是说全域上存在一些个体不能在其某个子集上分类,也不能在该子集的补集上分类。1 9 6 5 年,la z a d e h 提出了模糊集,不少理论计算机科学家和逻辑学家试图通过这一理论解决g f r e g e 的含糊概念,但是模糊集是不可计算的,既没有给出数学公式描述这一含糊概念,无法计算出它的具体的含糊得数目。8 0 年代初,波兰华沙理工大学p a w l a k 教授针对g ,f r e g e 的边界线区域思想提出了粗糙集( r o u g hs e t ) 理论 2 1 ,把那些无法确认的个体都归属于边界线区域,而这种边界线区域被定义为上近似集和下近似集的差集。由于他有确定的数学公式描述,所以含糊元素数目是可以计算的。即在真假值之问的含糊度是可计算的。粗糙集理论的主要特点在于它恰好反映了人们用粗糙集方法处理不分明问题的常规性,即以不完全信息或知识处理一些不分明现象的能力,或依据观察、度量到的某些不精确的结果而进行分类数据的能力。8 0 年代以来经过许多计算机科学家和数学家的努力,粗糙集理论已日趋完善。它已经在信息系统分析、人工智能机器应用、决策支持系统、模式识别与分类、故障检测等方面取得了较为成功的应用。相对于其它处理不确定性和模糊性的理论工具而言,粗糙集理论有着许多不可替代的优越性。它的主要优势之一是它无需提供问题所需处理集合之外的任何先验信息。但是,由于这个理论未包含不精确或不确定原始数据的机制。因此单纯地使用这一理论不一定能够有效地描述不精确或不确定的实际问题。这意味着需要其它方法的补充。由于证据理论与模糊集理论等具有处理不精确和不确定数据的方法,因此,将它们与粗糙集理论互相补充,也1河北大学理学硕士学位论文许会获得更好的处理结果。目前,粗糙集大多数成功的应用,都从不同的侧面对p a w l a k 的粗糙集理论进行拓广。p a w l a k 的睾日糙集理论对于不确定信息处理有很多优点,然而自身仍存在着片面性与不足之处【 j :( 1 ) 对原始数据本身的模糊性缺乏相应的处理能力:( 2 ) 对粗糙集的边界区域的刻画过于简单;( 3 ) 粗糙集理论的方法在可用信息不完全的情况下将对象归于某一具体的类,通常分类是确定的,但并未提供数理统计中常用的一个给定错误率的条件下将近可能多的对象分类的方法,而实际中常常遇到这类问题。因此,在粗糙集理论研究中已提出了许多扩张模型。例如,可变精度模型f v a r i a b l ep r e c i s i o nr o u g hs e t ,v p r s ) h jj 、一种基于粗糙集的非单调逻辑模型 6 - 8 1 ,以及与粗糙集理论或证据理论相结合的模型【、粗糙集弓模糊集相结合的模糊粗糙模型等f l o - 2 5 1 。1 2 模糊粗糙集模型的提出及其意义p a w l a k 建立的粗糙集理论主要是处理信息表的简化。简化的目的是从原始数据中进行知识抽取,获得一组产生式规则。信息表通常是由一组示例组成,每一个示例由若干条件属性和决策属性给定。属性的取值在p a w l a k 的粗糙集理论中被记为一种符号。符号之间认为是无联系的、相互独立的。然而在人们的实际生活中,涉及更多的是模糊概念与模糊知识。也就是说信息表中示例的属性值不是符号值,而是这样两种模糊数据:( 1 ) 属性取值是有偏序关系并加了限定修饰词的语言术语:( 2 ) 属性取值是示例对某几个模糊集( 模糊语吉术语) 不同的隶属程度。在很多实际问题中,信息表的属性取值是有偏序关系的语言术语。如属性“温度”,可取值为“高”、“中”、“低”。如果认为它们是三个符号a 、b 、c ,则它们之间的偏序关系在信息表的处理过程中丢失。另外,还有一些的属性取值是一些基本语言术语加一些限定修饰词。如:“大”、“很大”、“极大”。在p a w l a k 的粗糙集理论中,它们仍然被记为是三个符号a 、b 、c 。在信息表处理过程中这种“限定修饰”关系也会丢失。而且信息表简化结果有大量的冗余数据。第1 章绪论针对这j 降原始模期数据,本文提出了新酶信惑表跫黧葱貉。它不弄穗有偏序关系属性值视为符号值,而是视为模糊集合。根据l - a z a d e h 的模糊集理论,每一个模糊隳合蒋等闯于定义于菜个论域上的隶耩函数。隶属函数之洲可定义多种运算如取大、取小、比较运算等。这种处理将使原有的属性值之间的偏序关系、修饰限定关系樗以充分体现。从而得到更为合壤、更为合乎实际的信息表简化结果。已有学者将模糊集与椒糙集相结合”“i “。1 ,把模糊榴似关系引入糨糙集理论,但最他们的处理过稷是将模糊相似关系在一定阂谯水平下转化为等俊关系,再用传统的p a w l a k 的方法求如规则的核与约简,直至求出极小算法。应用这种将模糊数据转化为清晰数壬;嚣,再对清晰数据进行处理的方法,造成丢失僚息过多。如果有一静方法,躞可以在一定程度上简化规则,又可| 三l 尽量减少的信息的丢失。则不失是一种很好的方法。于是本文提出了搂凝不可分辨关系兹摄念,绘坦曩模蝴豹方法、动念的过程处理原始模糊数据的方法。得到简化结果为简练的模糊规则。更一般麴清嚣楚信患表黪霾链淑篷不蔽仅是摸期语砉术语,嚣是示铡踺某几个模糊集( 模糊语言术语) 不同的隶属程度,例如,对某天的天气情况、瀑黢、湿度、鸯无撤等气象蔼惠综合考虑,放两判濒是否遴予亍某项缚煮溪动。采集数据得到这样的结果:表1 - 1 摸凝绩患表艾o u t l o o kt e m p e r a t u r eh u m i d i t vw i n d yc l a s ss u n n yo v e r c a s tr a i nh o tm l i dc o o ih i 妫n o t t f l a if a l s et f u ep o s i t i v en e g m i v ej = 10 90 10 o0 90 10 o0 80 20 7o 40407j = 2& 9o ,l0 + l0 s0 ,20 ,10 90 20 19 。8o 3o7l = 3ol0 9o 20 9o 10 10 ,90 10 9o ,l0 8o3j = 40o0 10 90 10 90 00 60 50 j 8o 3o - 60 5j = 50 ,lo o90 + 00 ,lo 9o e0 ,l0 寒0 20 ,90 2j = 60 10l090 0020 90 1o 9ol090 ,30 8j = 70 ,0l00 0o 00 】0 90 10 9020 90 9o3j = 80 90l0 ,00 30 90 。l0 擘0 1 00 00 ,2o 9j = 908020 0o ,0040 60 ,0101 00 o0902j = 1 0ooo ,10 9o 0l ,o0 00 o1 0o 9ol060 + 5j = l0 90 10 0000 9o 10 10 90 。el 。0o + 8e ,3j = 1 20o1o0 001090 o1 00 00 01 0o 704j = ;30 0o 9o 11 0o oo o0 0l ,oo 9olo 7o ,2i j = 1 4o o0 1o ,9e 。oo 9o 10 90 10 0 00l09对于这样的原始模糊数据,经典的粗糙集的方法无法处理。针对粗糙集河北大学理学硕士学位论文的这一不足,已有很多学者将经典的粗糙集推广到模糊环境下。他们工作大致可以分为三类:一类是将原始模糊数据视为或转化为清晰( 离散) 数据后,直接应用经典粗糙集的知识约简的方法简化信息表【1 0 】。一些学者从知识描述的角度出发,将描述粗糙集的一对上下近似推广到模糊环境下,提出了模糊粗糙集( f u z z yr o u g hs e t s ) 或粗糙模糊集( r o u g hf u z z ys e t s )的概念1 1 1 。还有许多学者将粗糙集的基础一一等价关系推广为模糊等价关系或t 一模糊相似关系( t - s i m i l a r i t yr e l a t i o n ) ,这些关系对论域有一个模糊划分或弱模糊划分。在此推广的基础上,提出了各自模糊知识简化的方法陋博卜模糊等价关系或t 一模糊相似关系相比较等价关系而占,对于模糊知识的表示是一个很大的进步,有丢失信息较少的优点。而相对于模糊相似关系而言,仍是丢失了较多的模糊信息。因此针对这样的原始模糊数据,本文提出应用模糊相似关系替代等价关系,从知识描述( k n o w l e d g er e p r e s e n t a t i o n ) 和知识简化f k n o w l e d g er e d u c t i o n ) 两个方面入手,给出一种推广至模糊环境下的粗糙集模型。用模糊的方法、动态的过程简化模糊信息,简化得到更为符合实际情况的模糊规则。1 3 本文研究的主要内容粗糙集与模糊集都可以用来描述知识的不确定性,各自的特点不同,因此模糊集理论与粗糙集理论有很强的互补性,将这两个理论进行整合,去处理知识的不确定性和完全性,比它们各自去处理知识的不确定性和不完全性可望显示出更强的功能。本文针对经典的粗糙集理论对于原始模糊数据的处理能力较弱这一不足,将模糊集理论与粗糙集理论相结合,对于两种不同类型的原始模糊数据提出具体的解决方法,提出用粗糙集的方法处理模糊数据的模糊粗糙集模型。为了有效地在信息表中处理取值为模糊语言术语的属性,解决粗糙集对模糊值属性处理能力较弱的问题,提出了模糊不可分辨关系的概念,用于处理属性值为模糊术语的信息表。将约简、核、相对约简与相对核以及规则的约简与核等粗糙集理论中一系列知识约简的概念推广到模糊环境下,提出了4第1 苹绪论一种有效的模糊值信息表简化的启发式算法。数值实验验证陔方法在模糊值属性信息表简化方面比传统的p a w l a k 方法和其他一些学者的相关工作更为有效。对于属性取值不仅是模糊语言,而是对某几个模糊语言术语( 模糊集) 不同的隶属程度的模糊集。本文为以模糊相似关系为基础,从知识描述和知识简化两个方面入手,给出一种推广至模糊环境下的粗糙集模型。提出以模糊相似关系代替经典粗糙集中的等价关系。首先,以模糊相似关系为基础,提出了模糊上下近似的概念,在模糊环境下重新定义了粗糙集的概念。本文模糊知识描述的方法与前人工作的不同之处在于对论域不进行任何形式的划分( 模糊划分或弱模糊划分) ,只是从示例相似的角度考虑,用模糊相似矩阵表示各元素之f n j 的关系( 元素为模糊集) 。并且,在模糊相似关系的基础上,将约简与核等一系列知识约简的基本概念推广到模糊环境下,给出了一种模糊的、动态的简化原始模糊数据的启发式算法。最后给出具体的数值试验,验证本文的方法简化结果简练,丢失信息少,得到更为符合实际情况的模糊规则。河北大学理学硕士学位论文2 1 知识表示系统第2 章粗糙集理论基础2 1 1 知识表示系统粗糙集的研究对象是一个对象集合,这些对象的知识是通过指定对象的屙| 生( 特征) 和它们的属性值( 特征值) 来描述的。一般地,一个知识表示系统s 可以表示为s = ( u ,a ,v ,厂) p 。这里,u 是对象的集合,也称为论域。a = c u d 是属性的集合,子集c 和d分别称为条件属性集和决策属性集。v = v 圪是属性值得集合,表示属性。a的属性值得集合,即属性口的值域;f :u 爿v 是一个信息函数,它指定u中每一个对象x 的属性值。为了直观方便,知识表示系统也可以写成一个二维表格一一信息表。第一列表示的是研究对象,第一行表示的是描述对象的属性。行与列的交叉点就是该研究对象在这个属性下的属性值。2 1 2 不可分辨关系对于每一个属性子集b c a ,我们定义一个不可分辨二元关系( i n d i s c e m i b i l i t yr e l a t i o n ) i n d ( b 、,即1 n d ( b ) = 缸,_ y 】g ,y ) u x u ,v b b ,6 g ) = 6 ( y ) 显然,上述不可分辨二元关系满足自反性、对称性、传递性,是一个等价关系。并且,m 0 ) = 盆肋( 6 ) ) ,由定义得到,每一个属性子集对应一个等价关系。由离散数学的基本知识【2 “,集合u 上的任一等价关系可以唯一确定集合u 的一个划分。并且每一个等价类对第2 章粗糙集理论基础应划分中一个块。因此每一个属性子集对应的等价关系对论域有一个划分。我们称u 上的一簇划分称为u 的一个知识库( k n o w l e d g eb a s e ) 。划分的每一个块称为u 的基本知识。设州d 佃) 是u 上的一个等价关系,乡氖d 佃) 表示州d 协) 的所有的等价类构成的集合,b 一( 一) 表示包含元素x u 的等价类。这样r7 j d 佃) 表示与等价关系n ,d ) 相关的知识,称为关于u 的i n d ( b ) 基本知识。2 2 粗糙集的基本概念2 2 1 集合的近似对于论域u 中的任一个子集x ,也称为一个概念。对这样一个概念,在给定的知识表示系统中,如何来描述呢? 可以用包含该概念z 的论域中最大的基本知识集合与包含该概念的论域中最小的基本知识集合来表示,前者称为的下近似集合,后者称为x 的上近似集合,其具体定义如下:定义2 1 :给定的知识表示系统s = ( u ,a ,v ,f ) ,对于每个子集x u ,根据属性子集b ,爿的下近似( 1 0 w e ra p p r o x i m a t i o n ) 集合和上近似( u p p e ra p p r o x i m a t i o n ) 集合分别可以定义为:量z = u 扛u i k ,d 。) x 瓦z = u 扛u i b 】。( 。) n z 中定义2 2 ”1 :集合b 。) = b x 一斟称为集合的b 边界( b o u n d a r y ) ;p o s 口似) = b _ x 称为集合x 的b 正域( p o s i t i v er e g i o n ) ;n e g 。协) = u 一删称为集合z 的b 负域( n e g a t i v er e g i o n ) 。x 的下近似集合b x 是根据知识b ( 属性子集b ) ,u 中所有一定可以归入集合肖的元素构成的集合,即集合x 中所有与x 的补集中任何元素都不等价的元素构成的集合。z 的下近似集合豆y 是根据知识b ,u 中所有一定能和可能归7河北人学理学硕士学位论文入集合爿的元素构成的集合,即u 中所有与集合任一元素等价的元素构成的集合。x 的边界b n 。( j ) 是根据知识b ,既不能肯定一定可以归入集合爿,也不能肯定一定不可以归入集合彳的元素构成的集合。x 的正域p o s 。) 是根据知识日,u 中所有一定可以归入集合的元素构成的集合。x 的负域n e g 。) 是根据知识b ,u 中所有一定不可以归入集合z 的元素构成的集合。通过观察发现,j 2 2 界b n 。) 是某种意义上的论域的不确定域。边界域中的元素既不能肯定一定可以归入集合x ,也不能肯定一定不可以归入集合x 的元素构成的集合。当b n 。伍) = e 1 ) 时,洗明根据我们已掌握的知识可以恰当的观察到集合。定义2 3 ”1 :( 1 ) x 是占可定义的,当且仅当鲋= 鼢,即b n 。) = 。( 2 ) x 关于b 是粗糙的,当且仅当酗鼢,即b n 。( x ) 中。2 2 2 知识约简知识的约简是粗糙集理论的核心内容之一。众所周知,知识库中的知识( 属性) 并不是同等重要的,甚至某些知识是冗余的。所谓知识约简,就是保持分类能力不变的条件下,删除其中不相关或不重要的知识。知识的约简包括属性的约简、属性的相对约简与属性值得约简。2 2 2 1 、属性的约简知识的约简中有两个基本概念:约简( r e d u c t ) 和核( c o r e ) 。在对约简和核进行讨论之前,我们先作如下定义:定义2 4 :设集合b 是知识表示系统的属性子集,对于b b ,如果i n d ( b ) = 1 n d ( b 一 6 ) ,则称b 为b 中可省的;否则,称b 为b 中不可省的。定义2 5 :设集合b 是知识表示系统的属性子集,对于b cb ,如果满足i n d ( b ) = i n d ( b )( 2 1 )第2 章粗糙集理论基础v b b ,i n d ( b ) = i n d ( b 一 6 )( 2 2 )则称b 为b 的一个约简。记为r e d ( b 1 。显然,b 的约简不是唯一的。定义2 6 :设集合占是知识表示系统的属性子集,集合b 中所有不可省得属性的集合称为b 的核,记为c o r e ( b ) 。核与约简有如下关系:定理2 1 :集合b 的核等于集合b 的所有约简的交。即c o r e ( b ) = c _ 、r e d ( b 1 ,其中nr e d ( b ) 表示集合b 的所有约简的交。2 2 2 2 、属性的相对约简在应用中,一个分类相对另一个分类的关系十分重要,b i 止k 提出了知识相对约简( r e l a t i v er e d u c t ) 和相对核( r e l a t i v ec o r e ) 的概念。为此,首先需要定义一个分类关于另一个分类的f 区域的概念。定义2 ,7 :设集合p ,q 是知识表示系统的属性子集,属性g 的p 一f 域( p - p o s i t i v er e g i o no fq ) ,记作p o s p ( q ) ,定义为p o s p ( q ) =u p x r i ;:m l o ( t oq 的p 一正域是u 中所有根据分类品( q ) 的信息可以准确地划分到关系q的等价类中去的对象的集合。定义2 8 :设集合p ,q 是知识表示系统的属性子集,对于b p ,如果p o s m ,( ,) ( n ,d ( q ) ) = p o s d ( p 一* 1 ) ( n ( q ) ) ,则称6 为p 中q 可省的;否则,称b 为p 中q 不可省的。定义2 9 :设集合j d ,q 是知识表示系统的属性子集,对于p cp ,如果满足p o s , u o ( p ) ( i n d ( q ) ) = p m ( 川( 刀( q ) )r 。,、v b p ,p o s ,d ( 刷d ( q ) ) = 户舢伽”( 上d ( q ) )( 2 4 )则称尸为p 的相对于q 的约简。记为r e d 。) 。定义2 1 0 :设集合p ,q 是知识表示系统的属性子集,集合尸中相对于q 所有不可省得属性的集合称为尸的核,记为c o r e 。) 。河北大学理学硕士学位论文相对核与相对约简有如下关系:定理2 2 :c d 7 ( p ) = c 、r e d 。( 尸) ,其中r e d a p ) 表示集合p 相对于q 的所有约简的交集。222 3 、属性值的约简。对于决策表而言,属性值的约简就是决策规则的约简。它不是整体上约简属性,而是针对每个决策规则,去掉表达该规则时的冗余属性值,以便进一步使决策表算法最小。对于决策表进行属性值的约简,实际上是针对条件属性而言的。而每一行对应一条决策规则。对于某决策规则,把其某条件属性的值删去后,剩下的决策规则中的条件属性值唯一的决定此行中的决策属性值,则称刈r 咳条决策舰则而苦,该属性值是可省得。否则,对于浚条决策规则而言,该属性值是不可省得。该值也就是这条决策规则的核值。该决策规则的约简就是其条件属性值的子集,该集合是能保证决策表的一致性不变的最小的条件属性值的子集。2 2 3 辨识矩阵“”辨识矩阵( d i s c e m i b i l i t ym a t r i x ) 又称区分矩阵,是a s k o w r o n 在1 9 9 1 提出的。利用辨识矩阵表示知识有很多优点,特别是可以快速、简单的计算约简与核。定义2 1 l :给定的知识表示系统s = ( u ,a ,v ,厂) ,设l u | = ,则s 的辨识矩阵是一个 i , l 矩阵,其任一元素为a ( x ,y ) = 扛a l f ( x ,口) ,( y ,d *因此,口b ,_ y ) 是区分对象x 和y 的所有属性的集合。该分辨矩阵具有很好的两条性质:性质2 1 :如果占4 是满足条件b n 口g ,y ) m ,v a ( x ,_ y ) 中的极小子集( 关于包含) ,则b 是4 的一个约简。性质2 2 :核是辨识矩阵中所有的单个元素组成的集合。利用这两个性质,我们可以快速的计算出约简与核。o第3 章模糊语言属性值信息表的简化第3 章模糊语言属性值信息表的简化3 1 准备工作在实际应用中,当考虑某个论域的模糊概念时,需要建立它的隶属函数。常见的隶属函数可分为三种类型:偏大型、偏小型、中间型”。”1 。为了简单起见,我们选用梯形分布来刻画这三种类型的模糊集:升半梯形分布、降半梯形分布与梯形模糊分布。设论域为u = - ,6 】表3 1 三种类型的梯形分伟f 梯彤分布降半梯形分布梯形模糊分布3 h 十鲁字字4+ j f 。,一s 警圳7 降,簟j 、( ,) = :;等一| z 导i “) 十音,半cx s 旦i :,半o * t些程度副词可以作为语气算子来处理“”,令“很”= 凰,“极”= 风,“略”= h 1 ,“微”= h “较”= h 3 ,“相当”2 h 5 。这样,我们只需给出模2444糊语言的隶属函数,应用这些语气算子,就可以得到每一个有程度副词修饰模糊语言的隶属函数。然后选用一种贴近度来刻画任两个模糊语言之间的贴近程度。这里不妨选用最大一最小贴近度1 。当u = k ,6 】,j ,百为论域u 上的模糊集,令枷) - 糌则( ,) 为贴近度函数。j v 伍,百) 为模糊集j ,茁的贴近度。河北大学理学硕士学位论文应用上面给出的贴近度函数,即可得到模糊语言之间的贴近程度。这为下一步的工作做好了准备。3 2 粗糙集基本概念的推广3 21 模糊不可分辨关系传统的知识表不系统是基于不日 分辨关系的,为7 扩展料糙集处理模糊语言数据的能力,本章提出用模糊不可分辨关系作为推广的粗糙集模型的基础。定义3 1 :设论域为u ,对于每个属性子集b 互a ,称r ( i n d ( b ) ) 为一个模糊不可分辨二元关系,如果v x , yeu ,r ( i n d ( b ) ) ( x ,y 逢咖( ( 6 ( x 1 6 ( y ) ) )其中( ) 为贴近度函数。我们称孟d 陋) ) ( x ,j ,) 为x ,y 在属性集b 下的不可分辨度。如果v x ,y u ,若6 g 1 6 0 ) 为字符串型、整型或枚举型( 非模糊性语言)等离散数据,当6 g ) = 6 ) ,则( 6 g 1 6 ( y ) ) = 1 ;当6 b ) b ( y ) ,则( 6 g 1 6 ( y ) ) = 0 。这时,模糊不可分辨关系退化为传统的不可分辨关系。若6 g 1 6 ( y ) 为模糊语言时,则应用上面的准备工作即可求出( 6 g 1 6 ) ) 。r ( i n d 陋) ) ( ,) 的值域为【o ,1 】,是论域u 上的模糊集,且满足自反性与对称性。故模糊不可分辨二元关系是一种模糊相似关系。对于i ,= 1 , 2 ,n ,令_ ,= r ( i n d 陋) ) b ,x ,) ,则j i d 陋) ) 可以用模糊矩阵表示,即r ( i n d ( b ) ) = i 也一也:+ 七一ko :蠢需要指出的一种情况是,当b = 中时,我们规定: :i i 第3 章模糊语言属性值信息表的简化这样规定是合理的,这就是说当属性集是空集时,对论域中的示例无法加以辨认,只能认为它们是完全相同。在本文中,我们规定符号m a x 阻) 表示取矩阵a 中数值最大的元素:r a i n )表示取矩阵4 中数值最小的元素。3 22 模糊核与模糊约简3221 模糊核与模糊约简本章在模糊不可分辨关系的基础上提出模糊约简与模糊核的概念。首先我们引入下面的定义。定义3 2 :设论域为 ,属性集为b ,v b 占,令= m & x ( r ( i n d ( b 一 6 ) ) ) 一r ( i n d ( b ) ) )则称b 在b 中不可省的程度为,也称b 在占中是卢一不可省的。定义3 3 :设论域为u ,属性集为日,b b 。对于给定的阈值卢, 0 , 1 。如果有m a x ( 蠢( 加d 陋) ) 一蠢( 抽d ( 丑) ) ) 1 一( 3 1 )v be 日7 ,m a x 伍d p 一伽 ) ) 一r ( i n d 忙) ) ) 1 一( 3 2 )则称为b 的约简的程度为,也称b7 是b 的一约简。记为r e d u c t 4f b l 。需要指出,占的口一约简不是唯一的,定义3 4 :设论域为u ,属性集为b ,对于给定的闽值卢, o ,1 。将所有不可省程度大于1 一口的属性所组成的集合记为p ,则称p 为b 的核的程度为卢,也称p 是b 的一核。记为c o r e p ) 。下面对定义3 3 、3 4 中的阈值口进行讨论:当口= 1 时,定义3 3 、3 4 退化为定义3 37 :设论域为u ,属性集为b ,b7 b 。如果有m a x ( r ( i n d ( b ) ) 一j i 伽d 陋) ) ) s0( 3 3 )v b b7 ,m a x ( r ( i n d ( b 一曲 ) ) 一五( 胁d ( 召) ) ) o( 3 4 )j 1问北大学理学坝士学位论文则称b 为b 的约简,记为r e d u c t ( b 1 。定义3 4 :设论域为u ,属性集为b ,将所有不可省程度大于0 的属性所组成的集合记为尸,则称p 为b 的核。记为c o r e ( b 1 。在定义3 37 中,( 3 3 ) 式相当于p a w l a k 的r o u g h 集理论中的约简的定义中的i n d ( b7 ) = i n d ( b ) ,而( 3 4 ) 式相当于p a w l a k 的r o u g h 集理论中的约简的定义中的日是独立的。这也就是说,当口= 1 时,定义3 3 退化为p a w l a k提出的r o u g h 集理论中定义的约简。同样的,当= i 时,定义3 4 也就是p a w l a k 提出的r o u g h 集理论中定义的核。与此同时,我们要求 m i n ( r ( i n d ( b ) ) ) ,因为若m i n ( j i ( m d 恤) ) ) ,则有m a x ( 矗( 胁d ( 曰7 ) ) 一五( 加d ( b ) ) ) 1 一m i n ( r ( i n d ( b ) ) )( 3 j )v b b 、m 。( r ( i n d ( br 一曲 ) ) 一j i 协d 忙) ) ) sl m i n 伍d 陋) ) )瞄酬1 一m i n 恒似d ( 占) ) ) s 1 一( 3 7 由( 3 5 ) ( 3 6 ) ( 3 7 ) 式,定义3 3 中的( 3 1 ) 式恒成立,而( 3 2 )式恒不成立。也就是说,在口m i n ( r ( n d ( b ) ) ) 时,不存在满足定义3 3 的属性集b 。换句话说,在属性集占下,论域u 中所有的示例在所给的阈值s m i n ( r ( i n d 忙) ) ) 下是无法区分。那么再求b 的一约简也不再有意义。模糊核与模糊约简存在着如下的关系:定理3 1 :属性集b 的所有的一约简的交等于属性集b 的一核。即c o r e 4 ( b ) = n r e d u c t 4 ( b ) 。证明:首先证明c o r e 4 忙) 【n r e d u c t 4 忙) ) 。用反证法,设3 c n r e d u c t 9 0 ) ,但是c 隹c o r e 4 p ) 。于是由一核的定义,必有m a x ( r ( i n d ( b 一 c ) ) 一j i 胁d ) ) ) 茎1 一。则一定存在这样一个属性子集b7 b c ) ,b 满足m a x ( r ( i n d ( b ) ) 一盖( 跏d ) ) ) 蔓1 一,而v b b ,都有m a x ( r ( i n d ( b 一伽 ) ) 一蠢沏d 陋) ) ) 1 一。即b 为b 的一个一约简,并且c g b 。得出矛盾。故假设不成立。若c n r e 出c f 4 ( b ) ,就有c c o r e p ( b ) 。即c o r e 4 ( b ) 2 ( n r e d u c t 9 ( b ”。要证c o r e 9 ) ( n r e d u c f 4 忙) ) ,即v c c o r e 4 忙) ,有c n r e d u c t 4 ( b ) 。我t l 2 i 正明它的逆否命题:若c gc 、r e d u c t z ( b ) ,则e 盛c o r e 4 ( b ) 。第3 蕈模糊语言属性值信恳表的简化设b 为b 的一个p 一约简,若b = b ,则b 只有b 一个口一约简。由模糊约简与模糊核的定义,b 也为b 的一个一核。即c o r e b ( b ) = n r e d u c t 4 ( b ) :若b cb,耿c b b7,则有b7 b 一 c ,并且m a x 慷d 陋7 ) ) 一五d 陋”) l 一。由模糊不可分辨关系的定义,若b b ,则模糊矩阵r ( i n d 佃) ) 的元素大于等于模糊矩阵k ( i n a 陋) ) 对应的元素,即m i n ( r ( i n d ( b ”一j i d 陋一 c ) ) ) ) 0 。则矩阵j i d 陋) ) 一r ( i n d 国) ) 的任一元素都大于矩阵k ( i n d 陋一 c ) ) ) 一j i 胁d 陋) ) 对应的元素。于是m a x 慷似d 忙一 c ) ) ) 一爱妇d 陋) ) ) s 1 一成立。这就是说cg c o r e i s ( b ) 。逆否命题得证。c o r e 4 ( b ) 量( n r e d u c t p p ) ) 是成立的。一3 222 相对模糊核与相对模糊约简在传统知识表示系统中,若两个示例在条件属性集下是不可分辨的,而在决策属性集下可分辨,我们称这两个对象是不一致( i n c o n s i s t ) 的,可以记为不一致程度为1 。其它的情况称为一致的,记为不一致程度为0 。在不可分辨关系推广以后,也存在不一致性的度量。只是不一致程度的取值为 0 ,1 。我们这样定义:定义3 5 :设论域为u ,c 为条件属性( c o n d i t i o na t t r i b u t e ) 集,d 为决策属性( d e c i s i o na t t r i b u t e ) 集。z ,x ,u ,令f = r ( i n d ( c ) ) x ,_ ) 一j i ( 抽d ( d ) ) b ,x ,) ,r :j 矿b ow1 0o t h e r w i s e我们称k 是对象x ,与x ,之间条件属性集c 相对于决策属性集d 的不一致程度。记r o ( c ) = h l 。称( c ) 为论域u 上条件属性集c 相对决策属性集d 的不一致度量矩阵。接下来引入条件属性集c 相对决策属性集d 的相对模糊约简与相对模糊核的概念。首先引入相对不可省的定义。定义3 6 :设论域为u ,c 为条件属性集,d 为决策属性集。v c c ,令p = m a x ( t o ( c 一 c ) ) 一( c ) ) ,则称c 在c 中相对d 不可省的程度为,也称c 在c 中相对d 是一不可省的。定义3 7 :设论域为u ,c 为条件属性集,d 为决策属性集,c7 c 。对河北大学理学硕士学位论文于给定的阈值, o ,1 ,如果有m a x ( c ) 一( c ) ) s 1 一p( 3 8 )v c c ,m a x 仃。( c 一 c ) ) 一t 。( c ) ) 1 一卢( 3 9 )则称c 为c 相对d 的约简的程度为,也称c 为c 相对d 的一约简。记为r e d u c t 。4 ( c ) 。需要指出,c 相对d 的口一约简是不唯一的。定义3 8 :设论域为u ,c 为条件属性集,d 为决策属性集,对于给定的阈值p , 0 , 1 。将所有c 中相对d 不可省程度大于1 一的属性所组成的集合记为p ,则称p 为c 相对d 的核的程度为,也称p 是c 相刑d 的一核。记为c o r e 。4 ( c ) 。下面对定义3 7 、3 8 中的阈值口进行讨论:当口= 1 时,定义3 7 、3 8 退化为定义3 77 :设论域为u ,c 为条件属性集,d 为决策属性集,c 曼c 。如果有m a x ( t o ( c ) 一( c ) ) 0( 3 1 0 )v c c ,m a x 口。( c 一 c ) ) 一t 。( c ) ) ,0( 3 1 1 )则称c 为c 相对d 的约简,记为r e d u c t 。( c ) 。定义3 87 :设论域为u ,c 为条件属性集,d 为决策属性集。将所有c中相对d 不可省程度大于0 的属性所组成的集合记为尸,则称尸为c 相对d 的核。记为c o r e d ( c ) 。这也就是说,当口= 1 时,定义3 7 、3 8 退化为p a w l a k 的r o u g h 集理论中定义的相对约简、相对核。与此同时,我们要求卢 r a i n ( c ) ) ,因为若m i n ( ( c ) ) ,不存在满足定义3 7 的属性集c 。也就是说,论域u 中所有的示例在所给的阈值卢sm i n ( t 。( c ) ) 下都是不一致的。那么再求相对约简也不再有意义。相对模糊核与相对模糊约简也存在如下关系:定理3 2 :属性集c 相对属性集d 的所有的口一约简的交等于属性集c 相对属性集d 的卢一核。即c o r e d p ( c ) = r e d u c t 0 4 ( c ) 。证明:首先证明c o r e 。4 ( c ) j ( n r e d u c r ,4 ( c ) ) 。用反证法,设1 6第3 蕈模糊语言属性值信息表朐伺化3 c r 、r e d u c t ) p ( c ) ,但是ce c o r e ,f ( c ) 。于是出相对卢一核的定义,必有m a x ( t o ( c 一 c ) ) 一( c ) ) 1 一p 。则一定存在这样一个属性子集q 量c 一 c ,q满足m a x ( t o ( q ) 一( c ) ) 1 一p,而v b q,都有m a x ( t o ( q 一伽 ) 一t o ( c ) ) 1 一p 。即q 为c 的一个相对d 的一约简,并且cgq 。这与假设矛盾。故假设不成立。若c r e d u c t p ( c ) ,就有c c o r e d 4 ( c ) 。即c o r e d 4 ( c ) ( n r e d u c t 0 4 ( c ) )要证c o r e d p ( c ) n r e d u c r d 9 ( c ) ),即v c c o r e ,4 ( c ),有c ( n r e d u c t ,4 ( c ) j 。我们证明它的逆否命题:若c r e d u c t n p ( c ) ,则cgc o r e ) 4 ( c ) 。没c 为c 的相对d 的口一约简,取( - c c ,则有( ”( 1 一知 并且m a x ( t o ( c ) 一t o ( c ) ) 1 一。由不一致度量矩阵的定义,若( “( 1 ,则模糊矩阵( c ) 的元素大于等于模糊矩阵( c ) 对应的元素,即m i n ( t o 心) 一( c ) ) 0 。则矩阵( c ) 一( c ) 的任一元素都大于矩阵r o ( c 一 c ) ) 一( c ) 对应的元素。m a x ( l ( c 一 c ) ) 一( c ) ) m a x ( m i n ( ( c ) ) b ,) ) ,因为若卢玉m i n ( ( c ”g ,) ,j _ l ,, ,论域u 中第f 个示例与其余的示例都不一致。那么再求其约简规则也不再有意义。规则的模糊核与模糊约简也有如下关系:定理3 3 :第i 条原始规则的所有的口一约简规则的前件的交等于第i 条原始规则的口一核规则的前件。证明同定理3 2 。基于模糊不可分辨关系的决策规则的简化,我们要提出一个规则覆盖的定义。定义3 1 2 :设论域为己,且己知规则i ,对于给定的阂值口和任给的规则,若规则j 的前件与规则i 的| j i 件的模糊不可分辨度不小于,并且规则的后件与规则i 的后件模糊不可分辨度为1 。则称规则f 覆盖规则,。3 3 模糊语言属性值信息表简化的启发式算法基于模糊不可分辨关系的信息表的简化,我们给出一种启发式算法。设论域为u = 扛,x :,- ,矗) ,c 为条件属性集,d 为决策属性集。输入:尸是原始规则的集合,口给定的闽值。蒋3 章模猢语言麟性德信息表的简化裂舞璺鼍燃曼曼拦詈甍燃邕烹糌il li , 燃苎鼎燃竺曼鼎邕曼荆拦曼篡燃苎! ! 懋!辕瘵:q 楚篱纯爱熬撬羹l 懿集合。第一步:裙始豫算,p = u ,露= 第二步:对于尹中的餐一条器始瓣辩,袋密它辫裔斡一约麓蔑羹l 激发簿个约篱袋簧l j 获耧蘸的鞭戆撬簧| j 。第三步:对于骈有的滕始蕊翔瓣露一统储藏羽,选出覆羲舔骼蕊嬲最多酶约筒麓嬲期入澍q 中。藏p 中去簿该麓剿新溪蕊的溅始烧列。第隧步:蛰p 喾,转刘第二步。否赋,停止。3 ,4 襁关工 乍的比较下例为依攒周末天气驰各项数据,决定怒否进行晨练鼹一个穰襁语言属性壤决策表( 根据文献 1 9 l 表l 修敬褥剥豪3 - t ) 。表3 - 1 一个模糊值属性决策衰fu天气情况气温邋度风力琏褥曩动: i = l穰壤辍热戒需貉夺番定ft = 2靖镞热聂卷极小疼定i1 = 3疆溺孰正常,| 、青定fl = 4比较阴濡霸f正常小旨定l1 = 5久蠢热微蔫中甭定l 宝6缓掰玲比较藏书舔定l = 7中褥极冷诫常极小谬定i = 8溺翱当冷藏卷小餐定i = 9援薅援热徽离丈褥定t = 1 0很媾冷藏常很大镶定 = 1 1魄较谤掇熬锻离投夺蓉定| = 1 2羰溺滠和挺裳瑕,j 、鸯定i = 1 3很晴滠和雁常极大褥定i = 1 4强胡温衣藏霉天资定l = 1 5大嚣
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 防雷知识试题及答案
- 小学数学入学考试试题及答案
- 2025年合肥市肥东县第六中学教师招聘考试笔试试题(含答案)
- 社区预防考试题及答案
- 气管技能考试题及答案
- 民法中考试题及答案
- 2025年广州市天河区五一小学教师招聘考试笔试试题(含答案)
- 北京知识付费主播培训课件
- 医学综合考试题(附参考答案)
- 压力性损伤诊疗与护理规范理论考核试题及答案
- 劳保用品验收标准
- 2024年北师大版八年级上册全册数学单元测试题含答案
- 军工PCB市场潜力
- 敏捷开发方法绩效评估
- 会议保障实施方案
- JGJ196-2010建筑施工塔式起重机安装、使用、拆卸安全技术规程
- 100以内两位数进位加法退位减法计算题-(直接打印版)
- DL-T5501-2015冻土地区架空输电线路基础设计技术规程
- 2023-2024学年山东省济南市天桥区物理八下期末学业质量监测试题及答案解析
- DZ∕T 0173-2022 大地电磁测深法技术规程(正式版)
- 奇瑞汽车使用说明书
评论
0/150
提交评论