基于集对分析下的粗糙集理论模型研究论文.doc_第1页
基于集对分析下的粗糙集理论模型研究论文.doc_第2页
基于集对分析下的粗糙集理论模型研究论文.doc_第3页
基于集对分析下的粗糙集理论模型研究论文.doc_第4页
基于集对分析下的粗糙集理论模型研究论文.doc_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于集对分析下的粗糙集理论模型研究摘 要: 粗糙集理论是一种新的处理模糊和不确定性知识的数学工具,其主要思想就是在保持分类能力不变的前提下,通过知识简约,导出问题的决策分析或分类规则。而用集对分析理论的方法来建立概率粗糙集理论的模型,是一种研究粗糙集模型的新方法,它为处理不确定信息方面提供了一种新的途径和方法。本文是用概率粗糙集模型,然后引入集对分析理论,把两者结合起来,提出一个新的集对分析下的粗糙集模型,并且讨论和研究该模型的一些性质。关键字:集对,基对分析,粗糙集,概率粗糙集ABSTRACT Rough set theory is one kind of new deal with the fuzzy and non-deterministic mathematical tool, the main idea of Jiu Shi Zai Bao Chi Xia premise constant classification ability, through knowledge and simple, export issues of Juecefenxi 或 classification rules. The use of set pair analysis theory is applied to establish the probability model of rough set theory, rough set model is a study of new methods for handling uncertain information that it provides a new approach and methods. This article is a rough set model with a probability, then the introduction of set pair analysis theory, the two together with a new set on the analysis of the rough set model, and discuss and study some properties of the model.Key words: Set right, Based On The Analysis, Rough Sets, Probabilistic Rough Set一引入集对分析的概念1集对的概念集对是由一定联系的两个集合组成的基本单位。由于数学中规定集合的元素可以是人、事、物、数字、概念,因而如:评价标准与评价对象、设计要求和实物、目标与现状、状态与趋势、现在和将来、已知与末知、确定性与不确定性、线性与非线性、简单与复杂、时间和空间、以及两个学生、一对恋人、教师与学生、领导与群众、工人与农民、商人与医生、官员与市民,以及生存与发展、投资与回报、改革与创新、计划与市场,以及太阳与地球、月亮与星星、火箭与飞船、物质与能源、信息与智能、机器与知识,科学与技术,以及正数与负数、实数与虚数、2个数字、2条直线、2个图形、2个方程、2个函数、以及函数与图表、图像与方程、精确解与近似解等等,以及东西、南北、好坏、胜负、进退、盈亏、虚实、等等,都可以在一定条件下看在是集对的例子。事实上,集对也是一种自然现象,例如我们的2只眼睛、2只耳朵、2个鼻孔、2只手,2条腿,都可以看作是集对的例子。 从数学的角度看,引进集对这个概念是必要的,可以为解决集合论中的悖论提供一种全新的思路。例如在集合论中有一个罗素悖论,也称理发师悖论,是说村上有一个理发师,贴出服务公告,宣称他为所有不为自己理发的人理发,根据集合论,这些人能组成一个集合A ,但由此引出一个问题,理发师自己的头该由谁理发?如果他不为自己理发,那么,理发师属于A,但这样一来,理发师又不能给自己理发了,也就是不能属于A ,那么,理发师自己的头究竞该由谁理发?上面这个理发师悖论由英国数学家和哲学家罗素(Bertrand Russell, 1872-1970)于1903年发现,所以也称罗素悖论。罗素悖论的发现,说明了由德国数学家康托(Georg Cantor, 1845-1918)提出的集合论存在着矛盾,这个矛盾是如此的显而易见,在构造一个普通的集合时就存在于这个集合中,震动了当时的数学界,正如著名的法国数学家庞加莱(Henri Poincare,1854-1912)所坦言,“我们围住了一群羊,然而在羊群中也可能围进了狼”。有了集对这个概念后,我们就用一个确定集A和一个不确定集B同时去描述理发师要服务的全体对象。例如设村上包括理发师在内共有100人,这是我们的研究对象,其中不能为自己理发的有99人,确定属于理发师的服务范围(A=99);加上理发师1人不能确定是否属于理发师的服务范围(B=1),于是得联系数A+B i=99+1i,这个联系数的集对意义显然是关于“所有不为自己理发的人”这个对象集O的两个映射集合AO(确定集)与BO(不确定集)的基数之“联系和”。根据以上这个例子,也可以称集对是为研究(描述和分析)某个事物所必须的2个集合。反过来也表明:即使是一个简单的对象(事物),也至少要用2个集合去描述。例如,要把某校的全体教师作成一个集合A,看上去是一件没有异义、轻而易举的事情,但有的教师同时又是学生(例如在职读博士),具有双重身份,遇到这种情况时,只给一个教师集A,就比较难办,如果同时给出一个学生集B就比较好办一些,因为虽然把在职攻博的教师放入B中也不尽全妥,但我们可以用AB表示有的人既是教师同时又是学生这种情况,但这里的AB指的是同一个对象,因而把A和B组成集对更为自然。从这个例子又可以看出,组成集对的2个集合既可以一个是确定集,一个是不确定集;也可以2个集合都是确定集,或者都是不确定集。集对一般用大写字母表示,如H,M,等,要表示集对H是由集合A、集合B组成时,记为H=(A,B)表示;此外,集对也有几何表示,例如用一只角度表示集对等等。以上主要参考文献 集对是集对分析和联系数学中最基本的一个概念。2基对分析的概念2.1 引言集对分析(SPA)是有我国学者赵克勤于1989年正式提出的,是用于研究两个集合相互关系的理论,其核心思想是把被研究的客观事物之确定性联系和不确定性联系作为一个确定不确定性系统来分析和处理。在这个确定不确定系统中,确定性与不确定性互相联系,互相影响,互相制约,并在一定条件下互相转化,并用一个能充分体现上述思想的确定不确定式子来统一的描述各种不确定性,从而把对不确定性的辩证认识转化成一个就提的数学工具。对集对理论的初步研究表明,随即不确定性,模糊不确定等不确定性问题均可以用集对理论作新的研究,因而具有重要的理论意义和广泛的应用前景。2.2 联系度的确定与表达 联系度在集对分析中又常称为同异反联系度表达式,或确定不确定式,它一般是按以下思路来确定的。 设我们根据问题W的需要对由集A和集B所组成的集对H展开分析,共得到N个特性,其中有S个为集对中两个集合所共有,这两个集合又在另外的P个特性上相对立,在其余的F=N-S-P个特性上既不对立,又不同一,则在不计各特性权重的情况下,称此值: S/N为集合A和集合B在问题W下的同一度,简称为同一度,并简记为a; F/N为集合A和集合B在问题W下的差异度,简称为差异度,并简记为b; P/N为集合A和集合B在问题W下的对立度,简称为对立度,并简记为c。 由于同一度,差异度,对立度是从不同的侧面刻画两个集合的联系状况,因此为全面的刻画两个集合总的联系状况,采用式子 (2-1)来加以表示。(2-1)式中的i为差异度系数,在-1,1区间视不同的情况取值(有时i仅起标记的作用),而(2-1)式中的j则为对立度的系数,规定其恒取值-1 (有时j仅起标记的作用),(2-1)式中的称为联系度,他在一般情况下表示等式右边的那个式子,特殊情况下才是一个数值,并称为联系数。通常情况下为简便起见,把(2-1)式简写成: 其中a,b,c三个满足归一化条件a+b+c=1.2.3 集对分析的特点初步的研究表明,集对分析有以下一些特点:1. 全面性。集对分析在具体的问题背景下,既分析两个集合(或系统)的同一性,又分析两个集合(或系统)的对立性和差异性。正因为如此,集对分析又被常称为同异反分析法。当然,这里的前提是,对一个集对(或系统)所具有的特性之分析必须是充分展开的。分析内容必须全面。2. 定性定量相结合。这主要是指集对分析不仅要对具体分析得到的特性作这两个集合是否共同具有,还是互相对立或者差异的分析、判断、分类,还要对同异反程度作定量刻画,在还要根据同异反程度作出由若干个集对所表征的那个系统质的判断。其间要进行一定的数学运算推导和分析。3. 是分析方法的一种综合集成。根据集对的定义可知,集对的具体内容可以各式各样,加上不同的问题背景,其具体的分析方法也就可以是物理的、化学的、数学的、系统的、经验的等等。集对分析所进行的同异反分析和刻画是建立在这些具体分析之上的一种再分析,所以从方法论角度看,集对分析是一种综合集成的分析方法。4. 把确定性分析和不确定性分析有机的结合起来。在集对分析中,两个集合的同一性分析和同一性刻画是相对确定的,对立性分析和对立性刻画也是相对确定的,但是两个集合的差异性分析和差异性刻画是相对不确定的,尚可进一步做到底是同一还是对立的分析。之所以这样处理,一方面是因为差异是客观事物互相联系转化的一个普遍形态,是客观存在的中介与过度;另一方面,差异又是人们对实际情况的观察、分析受客观条件限制,不可能彻底进行的一种反映。集对分析把确定性分析结果和不确定性分析结果统一在一个同异反联系度表达式中,便于人们对实际系统作辩证、定量和完整的分析研究。5. 应用广泛。集对分析即可直接用于对系统作宏观分析,也可用于对系统作微观分析;既适宜于对简单系统分析,也适宜于对复杂系统的分析等等。下面我们主要站在数学的角度,来看看集对分析在数学方面展开的深入理论和应用研究。集对分析和模糊数学的关系密切,但在基本概念、研究方法和实际应用上都有着明显的区别。首先,隶属度是模糊数学的一块基石。在模糊数学中,元素对指定集合的隶属度的确定规则不是严格唯一的。在集对分析当中,考虑的是两个集合的联系问题,元素对指定集的隶属联系只是一种特例,看上去,只有联系度表达式中的同一度能和模糊数学中的隶属度等价,但两个集合的同一度的计算规则却是唯一的,当我们在具体的问题背景下,对一个集对中的两个集合之特性分析充分展开后,两个集合的同一度就被唯一的确定了。其次,从集对分析角度看,模糊数学是从同一性方面去研究和度量事物间的联系,原则上没有超越传统数学的思维范畴;集对分析是从两个集合的同一性、差异性、对立性三方面去研究和刻画事物间的联系。差异度与对立度对同一度来说,既可起“增益”的作用,也可能起“惩罚”的作用,反映了两个集合同异反联系本身的互相影响作用,而模糊数学中的隶属度显然不存在上述情况。再次,模糊数学主要研究系统的同异程度,而集对分析则侧重于研究系统的转化。集对分析的上述特点决定了这一系统分析方法在自然科学和社会科学的各个方面都有重要的应用价值。总之,集对分析是分析方法的一种综合集成,集对的具体内容可以各式各样,加上不同的问题背景,其具体的分析方法也就可以是物理的、化学的、数学的、系统的、经验的等等,而集对分析所进行的同异反分析和刻画是建立在这些具体分析之上的一种再分析;另一方面,他把确定性分析和不确定性分析有机的结合起来,两个集合的同一性分析和同一性刻划是相对确定的,对立度分析和对立度刻划也是相对确定的,但是差异度分析和差异度刻划是相对不确定的,还可进一步作到底是同一还是对立的分析,这样的分析方法便于人们对实际系统作辩证、定量和完整的分析研究。二几种粗糙集模型的介绍2.1粗超集概念的提出 粗超集(Rough Set,RS)理论是一种刻画不完整性和不确定性的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。RS理论是由波兰学者Pawlak Z于1982年提出的。1991年Z Pawlak的专著,粗糙集关于数据推理的理论(Rough Set-Theoretical Aspects of Reasoning about Data)的问世,标志着粗糙集理论及其应用的研究进入了活跃时期,从1992年至今,每年都召开以RS为主题的国际会议,推动了RS理论的拓展和应用,国际上成立了粗糙集学术研究会,参加的成员来自波兰、美国、加拿大、日本、挪威、俄罗斯、乌克兰和印度等国家;1995年ACM Communication将粗糙集列为新浮现的计算机科学的研究课题,大量关于粗糙集及其应用的学术论文和研究性报告应运而生;1998年国际信息科学杂志(Information Sciences)还为粗糙集理论的研究出了一期专辑。由于粗糙集理论在机器学习、决策分析、过程控制、模式识别及数据挖掘等理论的成功运用,从而获得强大的生命力。粗糙集理论是建立在分类机制的基础上,它将分类理解为在特定空间上的等价关系,而等价关系构成了对该空间的划分。粗糙及理论将知识理解为对数据的划分,每一被划分的集合称为概念。粗糙集理论的主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来描述。该理论与其他处理不确定和不精确问题理论的最显著的区别是它无须提供问题所需处理的数据集合之外的任何先验信息,所以对问题的的不确定性的描述或处理可以说是比较客观的,由于这个理论未能包含处理不精确或不确定原始数据的机制,所以这个理论与概率论、模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性。目前RS理论已称为人工智能领域中一个较新的学术热点,引起了越来越多的科研人员的关注。粗糙及理论模型也由此而不断的拓展运用于更多领域,下面将从与粗糙及理论模型有关的几个主要方面介绍他的发展和应用。2.2 粗糙集理论的基本概念 给定一个有限的非空集合U称为论域,R为U上的一族等价关系,R将U划分为互不相交的基本等价类二元对构成一个近似空间(approximation space)。设X为U的一个子集,a为U中的一个对象,aR表示所有与a不可分辨的对象所组成的集合,即由a决定的等价类。对于论域U上的任意一个子集X,X不一定能用知识库中的只是来精确的描述,即X可能为不可定义集,这时就用X关于A的一对下近似和上近似来“近似”地描述,其定义如下:其中,是x所在的R-等价类。称为X的R正域; 为X的R负域;为X的R边界域,显然: 。X关于A的近似精度定义为,其中表示集合X的基数。近似精度反映了根据现有知识对X的了解程度。X关于A的粗糙度定义为,它反映了知识的不完全程度。显然若近似精度为1,则粗糙度为0.2.3 Pawlak粗糙集模型的推广 Pawlak粗糙集模型一直是粗糙集理论研究的主流方向,目前主要有两种方法(1)构造性方法;(2)代数性(公理化)方法。(1)构造性方法是对原始Pawlak粗糙集模型,其主要思路是从给定的近似空间出发去研究粗糙集和近似算子。它是以论域上的二元关系或布尔子代数作为基本要素的,然后导出粗糙集代数系统(2U,apr,apr).这种方法所研究的问题往往来源于实际,所建立的模型有很强的应用价值,其主要缺点是不易深刻了解近似算子的代数结构。在经典粗糙集模型中有三个最基本的要素:一个论域U,U上的一个二元等价关系R(它们构成了近似空间),一个被近似描述的(经典)集合X,也称为专家概念.由此,推广的形式也有三个方向,即从论域方向、从关系方向(包括近似空间)和从集合方向。1)从论域方向推广的目前主要是双论域的情形,这时的二元关系就变成了两个论域笛卡儿乘积的一个子集.对于将论域推广到多个的情形来研究粗糙集理论的文献很少,这种讨论也将随着维数的增加变得越复杂。2)关系方向的推广:一种是将论域上的二元等价关系推广为任意的二元关系得到一般关系下的粗糙集模型;另一种是将对象x所在的等价类看成是x的一个邻域,从而推广导出了基于领域算子的粗糙集模型;也有将由关系导出的划分推广成为一般的布尔代数的,以此出发去定义粗糙集和近似算子的;更一般的有将普通关系推广成模糊关系或模糊划分而获得模糊粗糙集模型。3)集合和近似空间的推广:这一类的推广是与其他处理不确定,不精确或模糊的知识(概率论,模糊数学,信息论,证据理论等)结合起来进行研究的。当知识库中的知识是由于随机原因或经统计得到的,即知识库中的知识很可能是不确定的,很多学者提出了统计(或概率)粗糙集模型,变精度粗糙集模型实际上也可以归入这类模型,寻求具有最小风险的贝叶斯决策问题也可以转化为这类模型.这一类模型在数据分析的增量式机器学习中有重要应用。目前见到的此类模型中,近似空间中二元关系大都是等价关系,对于非等价关系给出的情形的文章尚未见到。张文修等提出了基于随机集的粗糙集模型作为一种尝试,既是对基于领域算子的粗糙集模型的推广,又适用于双论域情形,同时也是对统计粗糙集模型的推广。我们认为在统计粗糙集模型和变精度粗糙集模型中,近似逼近好坏的本质是张文修提出的包含度的大小,因此我们认为粗糙集理论与包含度理论的关系非常密切。当知识库中的知识模块都是清晰概念,而被描述的概念是一个模糊概念,人们建立了粗糙模糊集模型来解决此类问题的近似推理.当知识库中的知识模块也是模糊的,有些学者就提出了模糊粗糙集模型并作了推广。对于知识库中的知识模块既是模糊知识又是随机得到的至今讨论甚少,但在实际问题中肯定是存在的,因此也是值得继续研究的。随着这几年对粗糙集理论的进一步研究,经典的粗糙近似算子已经被大量的推广,主要表现在和其他不确定性概念或者其他知识发现的方法的结合上,特别是与模糊系统的联系仍然是研究的热点,这方面的成果也是最多的;而另一方面对于不完备信息系统上粗糙集模型的研究也主要是对容差关系和相似关系的讨论;再者对被近似概念和集合的一般化、广泛化也是研究的主流,所有这方面的工作都是为了使粗糙集理论更加深入到实际问题的解决中,或者是在更多领域中寻找与粗集理论相结合的交叉点,以此拓展粗糙集的应用。(2)代数方法也称为公理化方法有时也称为算子方法,这种方法不是以二元关系为基本要素,它的基本要素是一对满足某些公理的一元(集合)近似算子L ,H:2 U 2U,即粗糙代数系统(2U ,L, H)中近似算子是事先给定的.这种方法研究的明显优点是能够深刻地了解近似算子的代数结构,其缺点是应用性不够强。近似算子的某些公理能保证有一些特殊类型的二元关系的存在,使这些能够通过构造性方法产生给定的算子;反过来,由二元关系通过构造性方法导出的近似算子一定满足某些公理,使这些公理通过代数方法产生给定的二元关系。公理化方法的研究一开始只局限于Pawlak粗糙代数系统,即公理与二元等价关系相对应情形,后逐渐发展到一般关系下的粗糙集系统.至今为止,关于公理化方法的粗糙集理论研究大多局限于经典集情形,对于模糊集情形虽有讨论,但比较少。2.4模糊粗糙集模型 在awlak粗糙集模型中,论域上任意一个经典集合不一定能用知识库(,)中的知识来精确的描述,这时就用关于(,)的一对上下近似来描述。但在实际生活中,人们涉及到的知识或概念往往是模糊的不确定的,即是上的一个模糊集合,现在的问题是:如何用(,)中的知识来描述?模糊粗糙集模型就是针对这类问题提出来的。设(,)是awlak近似空间,即是论域上的一个等价关系。若是上的一个模糊集合,则关于(,)的一对下近似和上近似定义为上的一对模糊集合,其隶属函数分别定义为 其中为元素在关系下的等价类。若,则称是可定义的,否则称是模糊粗糙集(Fuzzy rough set)。称是关于(,)的正域,称是关于(,)的负域,称为的边界。以后如果关系比较明确,我们将下标省掉。我们知道,在awlak近似空间(,)中属于同一等价类中的两个对象是不可分辨的,从上面的定义可以看出, 和中的同一等价类中的隶属函数都是常数,这符合直观的意义。可理解为对象肯定属于模糊集的隶属程度;可理解为可能属于模糊集的隶属程度。可以验证,当是上的经典集合时,和就退化为在awlak意义下关于(,)的下近似和上近似,因此定义是awlak意义下的推广形式。定理:由定义给出的下近似和上近似满足下列(对偶)性质:()。() ()()()()()若,则,且。定义设(,)是awlak近似空间,是上的模糊集合,称与是模糊粗下相等的,若,记为;称与是模糊粗上相等的,若记作;称与是模糊粗相等的,若且,记作。易见,对于上的等价关系, , 和都是上的等价关系。以后对于, 和,我们都是指在某个特定的等价关系下的。定理设(,)是近似空间,则在中下列性质成立:()当且仅当,且。()当且仅当,且。()若,且,则()若,且,则()若,且,则()若,且,则 ()若,或,则 ()若或,则()若当且仅当。()当且仅当定理设(,)是近似空间, ,则()()三概率粗糙集模型3.1概率粗糙集模型的提出概率,作为随机事件的一种度量,它反映了一种不确定性,因此,它在不确定性的推理中有重要的应用。它从产生之日起就有两种理解:一种理解为信任的程度,反映了人们的经验和知识,常称为主观概率;另一种理解为随机事件在大量重复试验中结果出现的相对频率,常称为客观概率。即使是主观概率,也能反映或符合某种统计规律性,也具有客观性,因此,我们可以认为概率是对不确定的随机事件的一种客观的反映。Pawlak粗糙集模型是基于确定性知识的,即它的近似空间是完全确定的,因此它忽略了可以利用信息的不完全性和可能存在的统计信息,若我们仍然用Pawlak粗糙集模型来处理随机产生的知识库的数据分析等问题,就不能完全反映问题的实质。后来就有提出了概率粗糙集模型,为用粗糙集理论研究不确定性信息系统提供了一种可利用的途径。3.2概率粗糙集模型的定义定义3.2.1设U是有限对象构成的论域,R是U上的等价关系,其构成的等价类为U/R=,仍记X所在的等价类为X,令P为定义在U的子集类构成的代数上的概率测度,三元组称为概率近似空间。U中的每个子集称为概念,它代表了一个随机事件。P(X|Y)表示事件Y发生下X出现的条件概率,也可解释为随机选择的对象在概念Y的描述下属于X的概率。设,对于任意,我们定义X关于概率近似空间依参数的概率(I)型下近似和近似如下:,X关于依参数的概率(I)型正域、边界和负域分别为 显然,X关于依参数的概率(I)型正域、边界和负域构成了论域U的划分。而且显然有或者当时,或等价地当时,称X依参数关于是概率(I)型粗糙集。因此,X依参数关于的概率(I)型粗糙集是Pawlaw推广形式。此粗糙集模型是利用条件概率定义了一种概率粗糙近似算子,这种近似算子依赖两个参数,它是从一个侧面用去定义下近似,用去定义近似。3.3概率粗糙集模型的性质 学者对概率粗糙集模型的研究很多也很广泛,总结出了很多性质 定理3.3.1设则概率(I)型近似算子满足下列性质: (1)(2)(3)(4)(5) (6)若则 (7)若由定理看出(I)型粗糙集的正域随着德减少而增大,负域随着的增大而增大,同时边界缩小。 定理3.3.2设则对于任意有(1)(2) 定理3.3.3设则可以看出,随着逐渐增大(到),逐渐下降(到),边界逐渐收缩,成为。定理3.3.4设则对于任意有(1)(2)若,则关于依参数的粗糙度和近似精度分别定义为 可见,X关于概率近似空间依参数是定义的当且仅当其近似精度为1而粗糙度为0。 定义3.3.2设U有限论域,R是U上的二元等价关系,P是定义在U子集类构成的代数上的概率测度,仍称三元有序组是概率近似空间。对于则X关于近似空间依参数的概率(II)型下近似和上近似分别定义为 若,则称X关于近似空间依参数的概率(II)型可定义的,否则称X是概率(II)型不可定义的或概率(II)型粗糙集。对于参数概率(II)型粗糙集可分为下列四类:(1)若称X是部分可定义的。(2)若称X是内部可定义的。(3)若称X是外部可定义的。(4)若称X是完全不可定义的。X关于近似空间依参数的概率(II)型正域,负域和边界分别定义为 X关于依参数的粗糙度和近似精度分别定义为 由以上两个定义可见, 定理3.3.5对于参数和概率(II)型粗糙近似算子满足下列对偶性质:(1)(2)(3)(4)(5) (6)若则 (7)若 注:当取时,这时所得到的粗糙边界是绝对边界,即 定理3.3.6设则对于任意有(1)(2) 定理3.3.7设则 定理3.3.8设则对于任意有(1)(2)四集对分析下的概率粗糙集模型4.1集对分析下的概率(II)型粗糙集模型 著作定义了概率粗糙集模型。此模型利用条件概率定义了一种概率粗糙近似算子,这种近似算子依赖两个参数,它是从一个侧面即用去定义下近似,用去定义上近似,然而实际应用中往往要碰到这样的问题:选取或使用参数是尽量使其有利于问题的解决或优化,因而这种粗糙近似算子的定义显得过于严格。下面将另一种处理不完备系统的方法结合到此近似算子当中,使得粗糙集模型中的参数利用更加精细,从而使得信息库中的不完备信息更多的被利用。更加完善概率粗糙集模型在实际问题中的应用。定义4.1.1设(U,A)是一个不完备信息系统,其中U是非空论域,A是属性的非空有限集。定义x的领域为:这里 注:表示在属性集D下与x相似的对象全体。特别的,当是简记为称为x的领域。定义4.1.2设是一个信息系统,P为定义在U的子集类构成的代数上的概率测度,对于则定义集对分析下的概率 (I)型粗糙集模型的下近似和上近似如下: 若,则称X关于近似空间依参数的概率(II)型可定义的,否则称X是概率(II)型不可定义的或概率(II)型粗糙集。对于参数概率(II)型粗糙集可分为下列四类:(1)若称X是部分可定义的。(2)若称X是内部可定义的。(3)若称X是外部可定义的。(4)若称X是完全不可定义的。X关于概率近似空间依参数的概率(II)型正域、负域和边界分别定义为 X关于依参数的粗糙度和近似精度分别定义为 由以上两个定义可见, 五。集对分析下的概率(II)型粗糙集模型的性质下面考虑基于集对分析下的概率粗糙集模型与Pawlak经典粗糙集模型,以及文献的粗糙集模型之间的关系定理5.1设是一个信息系统,对于,若表示Pawlak上、下近似,表示领域集对型上、下近似,表示概率(II)型粗糙集模型下、上近似,表示依参数领域对型上、下近似,则:(1)当时,(2)当是一个完备信息系统,且时,(3)当是一个完备信息系统,且时, 证明:这里只给出下近似的证明,上近似的类似。(1)当时,则因此,所以由文献15结论可以得证;(2)当是一个完备信息系统,且时,由文献结论可以得到:这就转化为的概率粗糙集模型;(3)当是一个完备信息系统,且时,由(2)可得:这就转化为经典粗糙集模型。此定理表明基于集对分析下的概率(II)型粗糙集模型确实是Pawlak经典粗糙集模型,也是文献的粗糙集模型的推广。定理5.2对于参数和概率(II)型粗糙近似算子满足下列,对偶性质:(1)(2)(3)(4)(5) (6)若则(7)若证明:由定义可以得证以上性质。下面我们给出下近似的相关性质证明,上近似类似。都有不等式成立。(1)假设使得。这与已知矛盾,从而从而故此。(2)(3)因此,同理可证。(4)且,所以且同时即因此。(5) 或,所以且同时即因此。(6)因为所以有从而,因此,。(7),由可以得到,所以,因此,故 证毕。 定理5.3设则对于任意有(1)(2)证明:(1)当时,由定义知 又由定理知随着的减小而增大,因此 若存在则有但是对任意有即,这说明矛盾!这意味着因此,结论(1)成立 (2)由可得 从而由关于的单调递减性得若存在则对于但于是,但是,由定理知,这与矛盾!故结论(2)成立。 定理5.4设 证明:显然,而当单调下降趋于单调上升趋于时,由定理知是单调下降的,从而。若,则对于任意,有,但。从而而且由定理知,由定理知,这样我们就得到了,这与假设矛盾!定理得证。 定理5.5设则对于任意有(1)(2) 证明:(1)当时,由定理知又由定理知道随着德增大而减少,因此若存在,则对任意有,但是,即,这是矛盾的,因为,这意味着因此,结论(1)成立。 (2)由和定理知从而由关于的单调递减性得若存在即,但对于,于是,而由定理知,这与矛盾!故结论(2)成立。六.结束语 粗糙集理论是一种刻画不完整性和不确定性的数学工具,在数据挖掘。风险预测等众多领域得到了广泛的应用。对于不完备信息系统目前也有多种扩充方法,如基于容差关系的扩充,基于相似关系的扩充等等。本文引入集对分析概念,提出了一种基于集对分析下的概率粗糙集模型,推广了经典粗糙集模型。本文还存在着一些问题有待与进一步的去挖掘和探讨。参考文献1 赵克勤著:集对分析及其初步应用M,杭州,浙江科技出版社,2000;2 赵克勤,二元联系数 的理论基础与基本算法及在人工智能中的应用J,智能系统学报2008,3(6):476-486;3 赵克勤,联系数学的原理与应用J,安阳工学院学报,2009(2):107-110)4Beaubouf T.Petry F,Arora G.Information-theoretic measures of uncertainty for rough sets and rough relational databases.Information Sciences,1998,109:185-195.5Chan C C.A rough set approach to attribute generalization in data mining.Journal of Information Sciences,1998,107:169-176.6Lingras P J,Yao Y Y.Data mining using extensions of the rough set model.Journal of the American Society for Information Science,1998,49(5):415-422.7Mc Sherry D.Knowledge discovery by inspection.Decision Support Systems,1997,21:43-47.8 张文修,吴伟志.粗糙集理论介绍和研究综述.模糊系统与数学,2000,14:1-12.9 Yao Y Y,Lingras P.Interpretations of belief functions in the theory of rough sets.Information Sciences,1998,104:81-106.10 Yao Y Y,Lin T Y.Gerneralization of rough sets using modal logic.Intelligent Automation and Soft Computing,1996,2:103-120.11 Wei-Zhi Wu,Wen-Xiu Zhang.Neighborhood operator systems and approximations.Information Science,2002,144:201-217.12Yao Y Y.Relation interpretations of neighborhood operators and rough set approximation. Information Sciences,1998,111:239-259.13Dubois D,Prade H.Rough fuzzy sets and fuzzy rough sets.Int.J.General Systems,1990,17:14 Bodjanova S.Approximation of fuzzy concepts in decision making.Fuzzy Sets and Systems,1997,85:23-29.15张文修,吴伟志.基于随机集的粗糙集模型.西安交通大学学报,2000,34(12):15-19.16 Yao Y Y.Constructive and algebraic methods of the theory of rough sets.Information Sciences,1998,109:21-47.17张文修,吴志伟,梁吉业,李德玉。粗糙集理论与方法。北京:科学出版社,18黄兵,钟斌,周献中.改进的集对粗糙集模型.计算机工程与应用,2004,40(2):82-8419刘富春.基于集对分析的变精度粗糙集模型. 计算机工程与应用,2005,41(10):74-76答谢时光荏苒、光阴似箭,转眼间四年的大学生活就要结束了很高兴借此机会在这里表达我的感激之情感谢学校和老师的培育,使我在学习上和生活上都受益匪浅感谢张海东老师在这次论文写作过程中,从一开始开题,到资料搜集,再到论文初稿、二稿,直到定稿,给予了我很大的帮助与支持我的论文也凝聚了他的智慧与汗水张老师孜孜不倦地给我提出了许多宝贵的意见和建议,使我在论文的完成过程中能及时得到修正和完善,使我能更好地按要求来完成论文感谢我的同学谭家红、于海悦、王爱萍在平时的学习生活中给我的帮助,在大家的共同支持与督促下,使我的论文能比较顺利地完成,在这里向他们表示真诚地谢意最后感谢数学与计算机科学学院和西北民族大学四年来对我的栽培!毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得 及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。作 者 签 名: 日 期: 指导教师签名: 日期: 使用授权说明本人完全了解 大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论