粗糙集理论的基本概念_第1页
粗糙集理论的基本概念_第2页
粗糙集理论的基本概念_第3页
粗糙集理论的基本概念_第4页
粗糙集理论的基本概念_第5页
已阅读5页,还剩220页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.人的分类能力是对事物的认识能力,是知识。 从认知科学的角度来理解知识,可以理解知识可以用知识系统的集合表现来表现事物的分类能力和知识的分类能力。 知识在各个领域都有不同的含义。 粗糙集理论认为,知识与真实或抽象世界中不同的分类模式有直接关系。 知识被视为论域的划分,是对对象进行分类的能力。 第2章粗糙集理论的基本概念2.1知识和知识库,定义1.1 (知识和概念(类别或信息粒子) ) u作为被给予的研究对象的非空有限集合,称为一个论域。 论域u的任何子集xu称为论域u的概念或范畴。 论域u的一个划分X1,X2,Xn (概念簇)被称为关于u的抽象知识,简称知识。 为了规范化,空集也是概念,被认为是空概念。 在粗糙集理论中,主要讨论能够在论域u中形成区分和霸盖的知识。u的划分部分X1,X2,Xn与u上的等效关系r一对一地对应,即,给定u的划分部分X1,X2,Xn等于给定u上的等效关系r,从数学上看,关系的显示和处理总是比分类的显示和处理简单得多因此,知识可以被定义为r是u上的等效关系,其中U/R=X1,X2,Xn表示基于r的分类,并且被定义为关于u的知识。 通常,在解决问题的过程中,我们处理的不是论域u上的单一区分(知识和分类),而是论域u上的一系列区分,引起了知识库的概念。定义1.2 (知识库) u是给定的一个逻辑域,s是u上的一簇的等价关系,二维组K=(U,s )是逻辑域u上的一个知识库或近似空间。 因此,论域上的等价关系表示区分和知识。 这样,知识库表示从论域上的等价关系(这里是属性特征及其有限的交叉点)导出的各种知识,即区分和分类模式,同时表示对论域的分类能力,表示知识库中的概念之间存在的各种关系。 另外,定义2.3 (不可分关系(模糊关系)给出一个论域u和u上的一系列等价关系s,如果PS,pp,则P(P中所有等价关系的交叉点)仍是论域u上的一个等价关系,称为P上的不可分关系,记为IND(P ),简记为p 然后,如上所述,U/IND(P)=xIND(P)|xU表示有关等价关系IND(P )的知识,被称为知识库K=(U,s )中的有关论域u的P-基本知识(P-基本组)。 在不发生混淆的情况下,即,在p、u和k明确的情况下,为了简单起见,使用p来代替IND(P )。 使用U/P代替U/IND(P ),IND(P )的等价类别也称为知识p的基本概念和基本类别。 实际上,p基本范畴具有知识p的论域的基本特征,换句话说,他们是知识的基本模块。 特别是在QS的情况下,q是关于论域u的q初等知识,q的等价类别是知识s的q初等概念或初等范畴。 我们用IND(K)=IND(P)|PS表示知识库K=(U,s )中的所有等价关系,并且关于集合的正交运算。 把任意有限个P-基本类别的合并称为P-类别,把知识库K=(U,s )的所有类别称为K-类别。定义2.4 (两个知识库的关系) K1=(U,S1)和K2=(U,S2)为两个知识库,如果IND(S1)=IND(S2),即U/IND(S1)=U/IND(S2),则知识库K1和K2等价,记为K1K2或S1S2。 因此,如果两个知识库具有相同的基本类别集合,那么这两个知识库的知识能够准确地表达我们关于逻辑域的完全相同的事实。 这意味着可以用不同的属性集描述论域的对象,并且针对论域表现出完全相同的知识。 如果是IND(S1)IND(S2),则可以说知识库K1(知识S1)比知识库K1(知识S2)细,或者K2(知识S2)比K1(知识S1)粗。 在S1比S2更精细的情况下,S1也称为S2变换,或者S2也称为S1泛化。泛化是指组合多个类别,特化是指将类别分割成更小的概念。 两种情况都不满意的话,两个知识库就无法比较粗细。表2.1积木的信息表,这里,x,y是论域u的子集,表示集合的补充运算。例2.3如表2.2 (一个决定表)所示,对于属性子集(等价关系) P=头痛、肌肉痛,请判断区域的一个子集X=e2、e3、e5是否为p的粗糙集。 否则,请说明理由,求x的P-下近似集、上近似集、边界域、正域、负域.表2.2例2.3的一个医疗诊断决定表。,2.3粗糙集的特征2.3.1粗糙集的数字特征1 .集合的近似精度和粗糙度定义2.7 (近似精度和粗糙度)是由一个论域u和u的一个等价关系r,等价关系r定义的集合x的近似精度和粗糙度,集合(类别和概念)的不正确性由于边界区域的存在而导致集合的边界反映了在知识r下理解集合x的表现范畴的程度。 显然,由于各r与x的R-边界区域为空集合,因此集合x为可R-定义(R-严格密集)的1时,由于集合x中存在非空R-边界区域,因此集合x不能R-定义(R-粗糙度集),x的R-粗糙度与精度相反,反映了在知识r下理解集合x的表示范畴的不完整性。 当x为空集合时,例2.6给出知识库K=(U,s )和知识库的等价关系RIND(K ),其规定为导出Y1=x1,x4,x8、Y2=x2,x5,x7、Y3=x3、Y4=x6。 其中,论域U=x1,x2,x8。 正在计算下一个集合的R-近似精度和粗糙度。 其中,直观上,粗糙集理论是对事物的不正确表现没有任何假设的先验知识,但只是依赖于给出的知识表现系统,通过上下近似运算符直接计算的概率论和模糊集合论完全不同。 从粗糙集理论的角度来看,客观事物的不正确性起因于我们掌握知识的有限性,换句话说,事物中包含的对象的分类能力有限的结果。 因此,在没有先验知识的条件下,可以通过分类手段处理不正确的数值特征,表明概念是正确的。2.近似分类精度和近似分类品质.,222222222222222222222222222222222222222222222226,其一个是以近似度的精度表现粗糙集的数字特征,其二个是以粗糙集的分类表示粗糙集的拓扑特征。 粗糙集的数值特征表示集合边界域的大小,但是未描述边界域结构的粗糙集的拓扑特征不提供边界域大小的信息并且提供边界域结构。 而且,粗糙集的数字特征与粗糙集的拓扑特征之间存在关系。 首先,如果集合不可定义或不可定义,则其精度为0。然后,如果集合在外部不可定义或完全不可定义,则其补集精度为0。 这样,即使知道集合的近似精度,我们也不能确定其拓扑,相反,集合的拓扑也没有精度的信息。因此,粗糙集的实用化需要结合边界区域的两个信息,考虑近似精度因素和集的拓扑。 用另一个例子说明这两种表达的关系。例2.17与知识库给出了等价关系,其中,在论域中,r的等价类别为:计算讨论下列集合的数字特征和拓扑特征:解: (1)对集合、下近似、上近似、R-可定义集合,因此,对于边界域、近似精度、(2)对集合、下近似、上近似、同时,根据边界域、近似精度、(3)对集合、下近似、上近似、定义2.12,集合X3不能进行R-内定义。 为了近似精度,可以用R-粗糙度定义X2。 另外,可从定义2.12看出,边界区域、(4)集合、向下近似和向上近似不能在R-外定义集合X4。 从定义2.12可以看出,(5)集合的下近似、上近似,集合X5是R-全部不可定义的,近似精度、边界域、近似精度、边界域、2.4粗集合的所属关系在集合论中,成员和集合的所属关系(成员关系)是所有关系中最基本的关系。 所属关系的分析是我们计算推理的基础。 本节主要介绍粗糙集中的成员资格。 2.4.3粗集合论的成员关系,定义2.14知识库(近似空间) K=(U,s ),其中s是论域u上的等价关系簇或单个等价关系。 (2.16 )、元素x的知识r的归属也称为集合x的粗归属度、集合x的R-粗归属函数。 | |表示集合的基数,xR表示关于要素知识r的等价类别。 注意:在粗糙集理论中,隶属函数(成员关系)依赖于我们的知识r。 也就是说,对象是否属于集合取决于我们掌握的知识r。 成员关系不是绝对的。性质2.4粗糙集理论中的成员关系(成员函数)的性质,值越大表示对象x属于集合x的程度越高。 此时,在对象x根据知识r表示一定不属于集合x的情况下,在对象x根据知识r表示一定属于集合x的隶属度的情况下,根据知识r判断为对象x有可能属于集合x,并且有可能不属于集合x,即成对这说明集合x的模糊性完全是由于边界区域不空。(2)根据知识r判断对象x必定属于集合,根据知识r判断对象x有可能属于集合,根据知识r判断对象x必定不属于集合,是集合x的特征函数。 所提供的不可区分的关系是等价关系。集群(包括在论域u中两个相互不交叉的集合)、Xu及其成员函数可被使用(2.17 )、粗成员函数来定义粗集合逻辑的基本概念,例如上下近似、边界域、正域、负域,等等。 定义2.15某个论域u和u上的等价关系r,xu,我们将集合x的R-下近似集、R-边界域、R-正域、R-负域定义如下。由此可见,粗糙集定义的两个方法是强调粗糙集概念的各个方面。 根据近似定义推导粗糙集的拓扑结构,成员函数的方法强调其数值性质,概论术语可以解释为粗糙集理论中是否属于某个对象集合(概念)取决于知识r的分类能力,而不是该元素的客观性质。 这更符合人类的认知过程。2.5粗集的集合关系,2.5.1集的粗集关系粗集合论的基本概念之一是粗集关系。 同样,可以通过上近似和下近似来定义粗包含关系。 很明显,集合的包含关系与集合的粗包含关系不同,所以记述粗包含关系的例子如下所示。,性质2.5粗糙度包含关系的性质,2.5.2集合的粗糙度相等的关系集合的粗糙度与一般的不同。在许多实际问题的解决过程中,我们很难利用掌握的知识来判断两个类别之间是否完全相同。 通常,只能判断两者之间是否存在较大的差异(粗糙的不均匀)、较小的差异或极小的差异(粗糙的同等,也就是两个类别的特征之间仅存在微小的差异)。 在某些情况下,可以分别考虑在概念的修正例和反例之间存在的关系,这可以用下粗相等还是上粗相等的关系来描述。 集合的粗糙相等关系在解决实际问题中具有应用价值。 关于这些内容,将在下面进行说明。,实际上,集合的粗糙度相等的关系不是集合的要素,而主要是比较集合的拓扑学。 在一个特定的知识库中,基于不同的知识,两个集合是精确相等的、粗糙的(近似的)还是粗糙的(近似的)不同。 从粗糙集的角度来看,集合的等价是相对概念,不是绝对的,而是与我们掌握的知识或者对事物的理解度密切相关。 如上所述,粗糙集的基本性质,例如成员的所属关系、集合的包含关系、集合的等价关系等是相对的,与我们所把握的知识r有关系。 因此,在这个意义上,粗糙集的方法是古典集合论方法的主观认识。 2.6知识简化在智能信息和数据处理中占有十分重要的地位,也是粗糙集理论的核心内容之一。 一般来说,知识库的知识(属性和等价关系)并不是同等重要的,其中也有不需要的知识和冗长的知识。 所谓知识的概略就是在保持知识库的分类能力的同时,删除其中不需要的知识。 本节主要介绍知识的简约和核心,包括概念聚类的简约。 2.6.1知识的简约和核知识简约有简约(reducer )和核(core )两个基本概念。 关系到知识独立性,首先介绍知识独立性的定义。 对于每个RP、r、以及p,如果对于每个p所需要的话,p就称为独立的,否则的p称为依赖性或独立的。 定理2.10知识p是独立的,如果是gp的话,g一定也是独立的。 此外,定义2.19 (知识的简约)知识库K=(U,s )和知识库上的等价关系PS,对于任意的gp,g独立时,满足(2)IND(G)=IND(P )这两个条件。 g被称为p的简称,标记为gRED(P )。 其中,red(p )表示整个p简体的集合。 很明显,知识的任何简约都等同于知识本身在知识库中的任何类别的表达,即对论语的分类能力相同。 一般来说,知识简约不是唯一的,而是有多种简约。定义2.20 (知识的核)知识库K=(U,s )和知识库上的一族的等价关系PS,对于任意的RP,r满足IND(P-R)IND(P ),(2.24 )的话r是p所需要的,p所需要的知识组成的集合称为p的核,记为CORE(P )。 请注意

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论