(运筹学与控制论专业论文)粗糙集理论模型研究.pdf_第1页
(运筹学与控制论专业论文)粗糙集理论模型研究.pdf_第2页
(运筹学与控制论专业论文)粗糙集理论模型研究.pdf_第3页
(运筹学与控制论专业论文)粗糙集理论模型研究.pdf_第4页
(运筹学与控制论专业论文)粗糙集理论模型研究.pdf_第5页
已阅读5页,还剩49页未读 继续免费阅读

(运筹学与控制论专业论文)粗糙集理论模型研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 基于粗糙集理论目前在数据挖掘和数据库知识发现中的广泛应用,本文就粗 糙集理论模型的研究现状,主要采用构造性方法,结合概率论、模糊集、随机集、 集对分析以及含糊集等不确定性理论,继续对粗糙集理论模型作推广研究,具体 如下: ( 1 ) 结合已有的概率粗糙集模型,利用概率论中的对立事件,从参数不等式的 另一个侧面定义粗糙近似算子,进一步完善了概率( ,) 型粗糙集模型,并讨论了它 的一些相关性质。 ( 2 ) 一方面在模糊邻域算子的概念下给出了双论域上的粗糙上下近似算子;另 一方面提出了在一定错分率存在的条件下的模糊集合问的相对错分率,之后结合 这两个理论给出了基于模糊邻域算子的模糊变精度粗糙集模型。 ( 3 ) 引进随机集的选择函数,给出了双论域上基于随机集的模糊粗糙集模型, 用来解决知识库中的知识是由随机原因得到的、模糊的并且被描述的对象也是模 糊的粗糙近似问题。 ( 4 ) 用元素数目这个定量信息去描述了两个普通集合的关系,进而基于这个关 系提出了一种新的集对分析思想,并根据v a g i l e 集中真隶属度和假隶属度的概念, 定义了一种模糊集对联系度,最后把这些思想引入粗糙集理论中,提出新的集对 粗糙集模型及模糊集对粗糙集模型,并分别讨论了它们的一些性质。 ( 5 ) 首先提出了含糊集的截集的概念,之后结合v a g u e 集和粗糙集这两个描述 大系统不确定性的数学工具,联系它们的不确定性理论提出了两种新的粗糙近似 算子一粗糙含糊近似算子和含糊粗糙近似算子。 ( 6 ) 根据k a t a i l a s s o v 提出的直觉工模糊集的概念,结合粗糙集理论,定义了 直觉三一模糊粗糙集,并由此证明了之前所提出的v a g u e 粗糙集实际上就是一种直 觉三模糊粗糙集。 关键词:粗糙近似算子,模糊集,随机集,集对分析,含糊集 电子科技大学硕士学位论文 a tp r e s e n t ,m u 曲s c tt h e o r i e sa r e b e i n g 、v i d e l y 印p l i e di nd a t am i i l i n ga 1 1 d k n o w l e d g ed i s c o v e r yi nd a t a b a s e a c c o r d i n gt op r e s e n tr e s e a r c h e s ,c o n t i n u o u s g e n e r a l i z a t i o ns t l l d i e sf o rr o u 曲s e tm o d e lw i l lb ed o n ei nt l l i sp a p e li tm a i m ya d o p t s 也ef i o m a t i o nw a y sa n da s s o c i a t e sw i t l l l e s e1 1 1 1 c e n a i n t yt 1 1 e 耐e so f p m b a b i l i 吼n l z z y s e t ,m n d o ms e t ,s e tp a i ra n a l y s i sa 1 1 dv a g u es e tw h i c ha r cr e f 宅r r e dt oa sf o l l o 、: ( 1 ) r o u g ha p p r o x i m a t i o no p e r a t o r sa r cp r o p o s e db yt 1 1 eo p p o s i t eo fam a n e ri n p r o b a b i l 毋廿l e o r i e s hi sa ni m p m v e m e n tf o rp r o b a b n i t y ( ,) r o u 曲s e tm o d e l ( 2 ) u n d e rt l l ec o n c e p to f 缸坷n e i 曲b o r h o o do p e r a t o r s ,r o u 曲a p p r o x i m a t i o n o p e r a t o r so nd u a lu n i v e r s e sa r ei m m d u c e d t h e n t 1 1 em i s t a k ec l a s s i 丘c a 廿o n 珀t e b e m e e n 细of h z 珂s e t si sd e f l n e d l a t e r ,胁z yv a r i a b l ep r e c i s i o nr o u 曲s e tm o d e li s p r o p o s e db a s e do nt h et w od e f i 血t i o n s ( 3 ) f u z z yr o u 曲s e tm o d e lb a s e do nr a l l d o ms e to nd u a lu 1 1 i v e r s e si sp m p o s e d n g i v e saw a y t od e a lw i mt h el l n c e n a i n t ) rp r o b l e m st l l a tk 1 1 0 w l e d g ei nk n o w l e 旭e b a s ei s n l z z ya i l dg a i l l e db yr 锄d o mr e a s o n s ,a j l dt l l ed e s c 曲e do b j e c ti sa l s om z z y ( 4 ) o nt h eo n eh a i l d ,an e wi d c ao fs e tp a i rc o n n e c t i o nd e g m ei sp r o p o s e d b a s e do n m en 砌b e ro fe l 锄e n 乜o f m e 百v 锄s e t s m o r c o v e r ,缸z ys e tp a i rc o m l e c t i o nd e 伊e ei s d e 抽e d l 勰t l y t 1 1 et w oi d e a sa r ei l l 的d u c e dt or o u 曲s c tt 1 e o r i e s ,w l l i c hi n d u c e sn e w s e tp a i rr o u g hs e tm o d e l a n d 如五可s e tp a i rr o u g hs e tm o d e l ( 5 ) i n l i sp a p e r ,t l l ec o n c e p to fv a g u ec u t s e ti si n 们d u c e d 1 1 1 e n ,m u g hv a g u e a p p r o x i l i l a t i o no p e r a t o r sa 1 1 dv a g u er o u 曲a p p m x i m a t i o no p e r a t o r sa r ed e 矗n e db a s e do n 也et v l e o r i e so f r o u 曲s e t 觚d v a g 耻es e t ( 6 ) a c c o r d i n g t ot 1 1 ed e 丘n i t i o no fi n t u i t i o n i s t i c 上- n l z z y s e t p r o p o s e db y k a 协a s s o v ,i n t i l i t i o i l i s d c 三一f h z z ) ,r o u 曲s e ti si n 订o d u c e d f u n h e n n o r e ,i ti sp r o v e d 廿1 a tv a g u em u g hs e ti n t r o d u c e db e f o r ci sa c t u a l l ya j li n t u i t i o n i s t i c 上f i l z z yr o u 出s c t 1 畸w o r d s :r o u 曲a p p m x i m a t i o no p e r a t o r s ,f 也z ys e t s ,r a n d o ms e t s ,s e tp a i r 锄a l y s i s , v a g u es e t s i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名: i 1 丕日期:加伊年,2 一月刀日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:l 茎3 盏导师签名: 日期:伽p 彳 第一章绪论 1 1 选题背景 第一章绪论 当今,社会已经进入网络信息时代,计算机与网络信息技术的飞速发展使得 各个领域的数据和信息急剧增加( 信息爆炸) ,并且由于人类的参与使数据与信息 系统中的不确定性更加显著,构成了复杂的信息系统。信息系统是一个具有对象 和属性( 条件属性和目标属性) 关系的数据库,这种数据库通过数据隐含着知识 的对象与属性之间的关系,最终表达的知识模式是用属性来表达的,它有明确的 直观意义,因此是可以理解的。由于数据表的规模性和多样性( 定性值、定量值、 离散值、连续值、缺省值、集合值等) ,知识表达的对象与属性的关系不是能直接 观察到的,必须依赖一定的数学方法与计算工具,因此模式的获得是非平凡的。 如何从大量的、杂乱无章的、强干扰的数据( 海量数据) 中挖掘潜在的、有利于 价值的信息即有用知识,这给人类的智能信息处理能力提出了前所未有的挑战, 由此产生了人工智能研究的一个崭新领域数据挖掘( d m ) 和数据库知识发现 ( k d d ) 。 在d m 和) d 诸多方法中,有基于网络结构的神经网络算法,基于训练选优 的遗传算法,基于统计理论的数据挖掘与支持向量机方法,基于归纳学习的机器 学习方法,基于范例的推理方法,基于生物信息的知识发现方法等。而对于2 0 世 纪下半世纪产生的粗糙集理论与方法对于处理不精确、不确定、不完全信息的复 杂系统不失为一种有效的方法,因为它与概率方法、模糊集方法和证据理论方法 等其他处理不确定性问题理论的显著区别是它无需提供问题所需处理的数据集合 之外的任何先验信息。而另一方面由于该理论未能包含处理不精确或不确定原始 数据的机制,所以与其他处理不确定性问题的理论有很强的互补性。 粗糙集理论近年来在数据挖掘中得到广泛应用,主要被用来发现数据库中隐 含着的确定性规则,应用于k d d 中的粗糙集方法主要是用来由数据构成决策表, 以及对决策表的简化,通过去除冗余元组及冗余属性和冗余概念,最后形成最小 决策表。这种方法在人工智能和知识处理领域非常有效,尤其在机器学习、知识 获取、决策分析、数据库中的知识发现、专家系统、决策支持系统、归纳推理、 电子科技大学硕士学位论文 模式识别等领域更为重要,在市场研究、医学数据分析、药物研究、传感器数据 库分析以及导致新的合成材设计等方面也得到应用。 单纯地使用粗糙集理论不一定总能有效地描述数据不精确或不确定的实际问 题,与其他理论相结合形成更加有效的方法是目前粗糙集理论及应用研究的重点。 粗糙集理论与神经网络计算相结合的应用,可用作神经网络的分类器,产生基本 的规则系统;粗糙集理论与p e t r i 网结合,可对决策表进行实时计算的并行算法; 粗糙集与模糊集相结合,用粗糙集构造近似关系,由边界关系生成模糊集中的隶 属度,以此构成模糊粗糙关系数据库。对于粗糙集理论的研究和应用正在飞速的 发展之中,还存在许多问题等待解决,由于粗糙集模型自身的完备性,加上其对 不确定性描述无需主观假设的特点,使其必将得到更广泛的应用。 本文以粗糙集模型为研究对象,以p a w l a k 经典粗糙集模型为依据,通过对粗 糙集模型的扩充和推广,进一步完善粗糙集理论知识的研究,为它更加广泛、灵 活地应用到实际问题的解决中奠定理论的基础。 1 2 粗糙集理论及应用简介 粗糙集概念的提出 粗糙集( r o u 曲s e t ,r s ) 理论是一种刻画不完整性和不确定性的数学工具,能 有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含 的知识,揭示潜在的规律r s 理论是由波兰学者p a w l a k z 于1 9 8 2 【l 】年提出的1 9 9 1 【2 】 年zp a w l a k 的专著,粗糙集一关于数据推理的理论( r o u 曲s e t - n l e o r e t i c a la s p e c t s o fr e a s o n _ i 1 1 9a b o u td a t a ) 的问世,标志着粗糙集理论及其应用的研究进入了活跃时 期:从1 9 9 2 年至今,每年都召开以r s 为主题的国际会议,推动了r s 理论的拓展和 应用,国际上成立了粗糙集学术研究会,参加的成员来自波兰、美国、加拿大、日 本、挪威、俄罗斯、乌克兰和印度等国家:1 9 9 5 年a c mc o m m l l i l i c a l i o n 【3 】将粗糙集 列为新浮现的计算机科学的研究课题,大量关于粗糙集及其应用的学术论文和研 究性报告应运而生:1 9 9 8 年国际信息科学杂志( i n f o n n a t i o ns c i e n c e s ) 还为粗糙集理 论的研究出了一期专辑由于其在机器学习【2 4 】、决策分析【5 ,6 】、过程控制、模式识 别及数据挖掘【7 ,8 ,j l0 】等领域的成功运用而获得强大的生命力 粗糙集理论是建立在分类机制的基础上,他将分类理解为在特定空间上的等 价关系,而等价关系构成了对该空间的划分粗糙集理论将知识理解为对数据的划 第一章绪论 分,每一被划分的集合称为概念粗糙集理论的主要思想是利用己知的知识库,将 不精确或不确定的知识用已知的知识库中的知识来描述该理论与其他处理不确 定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外 的任何先验信息,所以对问题的不确定性的描述或处理可以说是比较客观的,由于 这个理论未能包含处理不精确或不确定原始数据的机制,所以这个理论与概率论、 模糊数学l l l ”j 和证据理论等其他处理不确定或不精确问题的理论有很强的互补性 二粗糙集理论的基本概念 给定一个有限的非空集合u 称为论域,r 为u 上的一族等价关系,r 将u 划 分为互不相交的基本等价类二元对一= ( 【,月) 构成一个近似空间( a p p r o x i m a t i o n s p a c e ) 设为u 的一个子集,口为u 中的一个对象,k k 表示所有与口不可分辨的 对象所组成的集合,即由4 决定的等价类 对于论域u 上的任意一个子集,x 不一定能用知识库中的知识来精确地描 述,即x 可能为不可定义集,这时就用j 关于爿的一对下近似丛和上近似劢来 “近似”地描述,其定义如下f 1 3 l 墨r = u 【x k i f x k 盖 = x e uj f x k x 瓦r = u 【x k i 【x k n x g = p e u i 【x k n x o 其中,m 。是工所在的r 一等价类 称胛。( x ) = 丛为x 的r 正域;h ( x ) = 【,一_ ( x ) 为z 的r 负域; 加俩) = _ ( 一旦盖) 为x 的r 边界域,显然:- ( j ) = p m 。( ) u ) 。这些概念可 电子科技大学硕士学位论文 联刊的近似精度定义砾耻矧,其中吲表示集合确基数,近似精 度反映了根据现有知识对x 的了解程度。 x 关于a 的粗糙度定义为彬) - l 一矧,它反映了知识的不完全程度显然 若近似精度为1 ,则粗糙度为o 。 三粗糙集模型的研究现状 p a w l a k 粗糙集模型的推广【1 4 】一直是粗糙集理论研究的主流方向,目前主要有 两种方法( 1 ) 构造性方法:( 2 ) 代数性( 公理化) 方法。 ( 1 ) 构造性方法是对原始p a w l a l 【粗糙集模型的一般推广,其主要思路是从给定 的近似空间出发去研究粗糙集和近似算子。它是以论域上的二元关系或布尔子代 数作为基本要素的,然后导出粗糙集代数系统( 2 “,u ,n ,印r ,印r ) 这种方法所研 究的问题往往来源于实际,所建立的模型有很强的应用价值,其主要缺点是不易深 刻了解近似算子的代数结构。 在经典粗糙集模型中有三个最基本的要素:一个论域u ,u 上的个二元等价 关系r ( 它们构成了近似空间) ,一个被近似描述的( 经典) 集合j ,也称为专家概念 由此,推广的形式也有三个方向,即从论域方向、从关系方向( 包括近似空间) 和 从集合方向。 1 ) 从论域方向推广的目前主要是双论域【1 5 】的情形,这时的二元关系就变成了 两个论域笛卡儿乘积的一个子集对于将论域推广到多个的情形来研究粗糙集理 论的文献很少,这种讨论也将随着维数的增加交得越复杂。 2 ) 关系方向的推广:一种是将论域上的二元等价关系推广为任意的二元关系得 到一般关系下的粗糙集模型1 1 q :另一种是将对象x 所在的等价类看成是x 的一个邻 域,从而推广导出了基于领域算子的粗糙集模型【l l 坤1 :也有将由关系导出的划分推 广成为一般的布尔代数的,以此出发去定义粗糙集和近似算子的:更一般的有将普 通关系推广成模糊关系或模糊划分f 1 2 ,1 9 1 丽获得模糊粗糙集模型【2 0 1 。 3 ) 集合和近似空间的推广:这一类的推广是与其他处理不确定,不精确或模糊 的知识( 概率论,模糊数学,信息论,证据理论等) 结合起来进行研究的。 当知识库中的知识是由于随机原因或经统计得到的,即知识库中的知识很可 能是不确定的,很多学者提出了统计( 或概率) 粗糙集模型,变精度粗糙集模型 实际上也可以归入这类模型,寻求具有最小风险的贝叶斯决策问题也可以转化为 第一章绪论 这类模型这一类模型在数据分析的增量式机器学习中有重要应用。目前见到的此 类模型中,近似空间中二元关系大都是等价关系,对于非等价关系给出的情形的文 章尚未见到。张文修等提出了基于随机集的粗糙集模型【2 l 】作为一种尝试,既是对基 于领域算子的粗糙集模型的推广,又适用于双论域情形,同时也是对统计粗糙集模 型的推广。我们认为在统计粗糙集模型和变精度粗糙集模型中,近似逼近好坏的本 质是张文修提出的包含度的大小,因此我们认为粗糙集理论与包含度理论的关系 非常密切。 当知识库中的知识模块都是清晰概念,而被描述的概念是一个模糊概念,人们 建立了粗糙模糊集模型来解决此类问题的近似推理当知识库中的知识模块也是 模糊的,有些学者就提出了模糊粗糙集模型并作了推广口o ,2 2 ,矧。对于知识库中的知 识模块既是模糊知识又是随机得到的至今讨论甚少,但在实际问题中肯定是存在 的,因此也是值得继续研究的。 随着这几年对粗糙集理论的进一步研究,经典的粗糙近似算子已经被大量的 推广,主要表现在和其他不确定性概念或者其他知识发现的方法的结合上,特别 是与模糊系统的联系仍然是研究的热点,这方面的成果也是最多的:而另一方面 对于不完备信息系统上粗糙集模型的研究也主要是对容差关系和相似关系的讨 论;再者对被近似概念和集合的一般化、广泛化也是研究的主流,所有这方面的 工作都是为了使粗糙集理论更加深入到实际问题的解决中,或者是在更多领域中 寻找与粗集理论相结合的交叉点,以此拓展粗糙集的应用。 ( 2 ) 代数方法也称为公理化方法有时也称为算予方法,这种方法不是以二元关 系为基本要素,它的基本要素是一对满足某些公理的一元( 集合) 近似算子 厶日:2 ”斗2 ”,即粗糙代数系统( 2 ”,u ,n ,厶h ) 中近似算子是事先给定的这种方法 研究的明显优点是能够深刻地了解近似算子的代数结构,其缺点是应用性不够强。 近似算子的某些公理能保证有一些特殊类型的二元关系的存在,使这些能够 通过构造性方法产生给定的算予:反过来,由二元关系通过构造性方法导出的近似 算子一定满足某些公理,使这些公理通过代数方法产生给定的二元关系。 公理化方法的研究一开始只局限于p a w l a k 粗糙代数系统,即公理与二元等价 关系相对应情形,后逐渐发展到一般关系下的粗糙集系统【2 4 j 至今为止,关于公理 化方法的粗糙集理论研究大多局限于经典集情形,对于模糊集情形虽有讨论,但比 较少。 电子科技大学硕士学位论文 四不确定性问题的理论研究 粗糙集理论中知识的不确定性主要由两个原因产生的:一个原因是直接来自 于论域上的二元关系及其产生的知识模块,即近似空间本身如果二元等价关系产 生的每一个等价类中只有一个元素,那么等价关系产生的划分不含有任何信息划 分越粗,每一个知识模块越大,知识库中的知识越粗糙,相对于近似空间的概念和 知识就越不确定,这时处理知识的不确定性方法往往用香农信息熵( s h a n n o m 信息 熵:设u 是论域,置,工:,工。是u 的一个划分,其上有概率分布: r t ,、” = 一2 则称打( x ) = 一n l o gp l 为信息源的信息熵,其中对数取以2 l h ,见,rj ,* 1 为底,而当某个n 为零时,则理解为o l 0 9 0 = o ) 来刻画,知识的粗糙性与信息熵的关 系比较密切,知识的粗糙性实质上是其所含信息多少的更深层次的刻画。粗糙集理 论中知识不确定性的另一个原因来自于给定论域里粗糙近似的边界,当边界为空 集时知识是完全确定的,边界越大知识就越粗糙或越模糊,至今,粗糙集理论刻画 概念x 的不确定性用正则条件熵皿,( j + | 五+ ) ( 其中= z ,j 是由产生的一 个划分,r = 五,肖:,瓦) 是由r 产生的一个划分) 和粗糙度九( x ) 来实现的但 是这两个度量并没有提供那些完全属于x 的下近似的区域里面与不可分辨关系的 知识粒度有关的不确定性,于是有人引入了粗糙熵e ,( z ) 的概念来刻画石的不确 定性。 在粗糙集理论与其他处理不确定性或模糊性的理论研究中【2 5 ,2 矾,主要集中在 它与概率统计,模糊数学,d s 证据理论和信息论的相互渗透和补充。在信息系统中 知识库的知识的类型一般有两类:一类是库中所有对象的描述是完全已知 的,p a w l a k 粗糙集模型和一般二元关系下的粗糙集模型就是属于这一种:另类库 中的对象的描述只有部分是已知的,即知识库中的知识是不确定的,它只能通过训 练样本所提供的信息来刻画概念,为了使从训练样本获得的规则符合整个论域的 对象,在抽取样本时应符合统计规律性,粗糙集理论不管这一类工作,因此概率统 计作为研究自然界,人类社会以及技术过程中大量随机现象的规律性的一门学科, 它与粗糙集理论的结合就显得非常自然。 模糊集和粗糙集在处理不确定性和不精确性问题方面都推广了经典集合论, 虽然有一定的相容性和相似性【25 。,然而它们的侧重面不同。从知识的“粒度”的描 第一章绪论 述上看,模糊集是通过对象关于集合的隶属程度来近似描述的,而粗糙集是通过一 个集合关于某个可利用的知识库的一对上、下近似来描述的:从集合对象间的关系 来看,模糊集强调的是边界的不分明性,而粗糙集强调的是对象间的不可分辨性; 从研究的对象来看,模糊集研究的是属于同一类的不同对象问的隶属关系,重在隶 属程度,而粗糙集研究的是不同类中的对象组成的集合关系,重在分类虽然模糊 集的隶属函数和粗糙集的粗糙隶属函数都反映了概念的模糊性,直观上有一定的 相似性,但是模糊集的隶属函数大多是专家凭经验给出的,因此往往带有很强的主 观意志,而粗糙集的粗糙隶属函数的计算是从被分析的数据中直接获得的,非常客 观正因为如此将粗糙集理论和模糊集理论进行某些整合后去描述知识的不确定 性和不精确性比它们各自的描述显示出更强的功能目前所见的模糊粗糙集模型 是其中的一些成功例子。 粗糙集理论与d - s 证据理论在处理不确定性的问题方面产生和研究的方法是 不同的,但却有某种相容性,粗糙集理论是为开发规则的机器自动生成而提出的, 而d - s 证据理论主要用于证据推理粗糙集理论用概念的一对上,下近似对其进行 描述,而d s 证据理论是用一对信任函数和似然函数在给定证据下对假设进行估计 和评价粗糙集理论中的下近似和上近似的概率恰好分别是信任函数和似然函数, 然而生成信任函数和似然函数的基本概率分配函数( 即m a s s 函数) 方法是不同的 前者来自于系统中数据本身,比较客观,而后者往往来自于专家的经验,带有很强 的主观性粗糙集理论与d s 证据理论有很强的互补性。 作为描述大系统的数学工具1 2 的可拓集、集对分析、含糊集之间也有着一些 内在的联系和区别。人类已步入全新的时代,社会已发展成为一个宏观复杂的大 系统,预测和决策所要考虑的因素越来越多,也越来越复杂,同时科学技术达到 了非常高的水平,问题的研究和解决都需要借助宏观复杂的大系统,大系统理论 和方法的研究必须有能够描述系统的数学工具,由于经典数学不能满足这个要求, 且由于人工智能的迅猛发展,粗糙集和模糊集、可拓集、集对分析【2 8 】、v a g u e 集【2 9 1 、 界壳论等新兴理论相继产生,认识和分析它们之间的联系与区别对今后的理论和 应用研究都有非常重要的意义。 首先看一下模糊集和v a g u e 集之间的关系,v a g u e 集实际上是一个新的处理模 糊信息的模糊理论,它是对模糊集的扩充,它弥补了模糊集中隶属度函数的不足, 提出了从真假两个方面对研究对象进行描述,v a g i l e 集中的真隶属度相当于模糊集 中的隶属度,由于它又给出假隶属度,v a g u e 集能比模糊集更好地描述不确定性, 因此我们很自然地认识到它与模糊集有一些相同的地方,它们都是从论域出发根 7 电子科技大学硕士学位论文 据实际问题做一个集合,而由于问题或研究对象带有不确定性,使得该集合带有 不确定性。从理论上讲,模糊集的应用也可以通过v a g u e 集来实现,而且用v a g u e 集可能会更好,但实际上在某些情况下用模糊集已经足够了,而有些情况用模糊 集仍显不够准确地描述模糊信息,这时就该用v a g l l e 集,由此可见,v a g u e 集和模 糊集有一定的互补性。 集对分析是我国学者赵克勤f 2 8 】于上世纪8 0 年代提出的,它提出从同、异、反 三方面来表征两个集合的关系。后来又有人提出了模糊联系数【3 0 】,考虑到了在研 究构成集对的两个集合之间关系的模糊性,从而把模糊数学引入集对分析,文【3 l 】 在【3 0 】的基础上模糊集对势,由于联系度和集对势是集对分析的核心内容,这两篇 文章就搭成了集对分析与模糊数学之间的桥梁,通过它们模糊数学可以广泛应用 到集对分析中,这对两门学科的进一步发展和应用都具有重要意义。 通过比较分析可以看出v a g u e 集与集对分析有很多相似之处。v a g u e 集中的真 隶属度f 相当于集对分析中的同一度,假隶属度( x ) 相当于集对分析中的对立 度,而1 一,( x ) 一,( z ) 就相当于集对分析中的差异度,在这种情况下,v a g l l e 集与集对 分析的作用差不多,但在形式上有一定的区别,这种区别可能给具体的分析带来 一些麻烦,也就是说即使在这种情况下它们也不一定能通用,从严格意义上说集 对分析不是一种集合论,而是一门讨论分析具有特殊意义的经典集合之间的关系, 用于比较两物,可以通过比较两个具体明确的对象而得出关于某一问题的模糊性 结果,并对它们进行量化:而v a g i l e 集比集对分析更广泛地应用于描述各种不确定 性信息,可以更广泛地用于人工智能领域。由于v a g u e 集与集对分析关系密切,它 们的理论可以相互渗透或借鉴,促进彼此的发展,在应用中也可以相互协同。 最后说一点可拓集与上面的几个集合的联系和发展。可拓集与集对分析的关 系已经非常紧密,已有许多学者进行了一系列的研究,主要文献有【3 2 】【3 3 ,目前 可拓集与v a g l l e 集之间联系的研究仍是空白,但从理论上讲,v a g u e 集是模糊集的 扩充,模糊集与可拓集之间的结合已经产生了f e e c 和灰色物元空间,因此v a g u e 集与可拓集也将创造出新的理论和方法。 五目前粗糙集的主要应用 粗糙集主要应用在人工智能领域和数据挖掘方面,具体表现在: ( 1 ) 粗糙集应用于智能控制 1 6 1 。粗糙集根据观测数据获得控制策略,称为从范 例中学习( 1 e 锄i n gf m me x 锄p l e s ) ,属于智能控制的范畴i 第一章绪论 ( 2 ) 粗糙集用于神经专家系统。将粗糙集与神经网络相结合形成粗糙神经专家 系统的混合结构,粗糙集用作数学工具来处理不确定与不精确数据,作为该结构 中神经网络的预处理器,而神经网络加入该结构形成粗糙神经推理引擎的新结构, 它是基于神经网络与粗糙分析约简的结合上4 ,3 5 j ; ( 3 ) 粗糙集应用于决策分析【6 】。粗糙集理论的决策规则是在分析以往经验数据 的基础上得到的,它允许决策对象存在一些不太明确的属性; ( 4 ) 粗糙集和模糊集在词汇挖掘中的应用【3 6 1 。采用粗糙集和模糊集的结合,研 究了信息检索中一种新的词汇挖掘机制,指出文本查询既可以使用权重即模糊表 示,也允许使用基于粗糙集的近似表示: ( 5 ) 粗糙集应用于股票数据分析【3 ”。即运用粗糙集理论分析股票价格与经济指 数之间的依赖关系,并获得预测规则; ( 6 ) 粗糙集应用于医疗诊断【3 ”。在医疗诊断方面,用粗糙集方法根据以往病例 归纳出诊断规则,用来指导新的病例。 1 3 本文的主要工作 本文主要研究粗糙集理论模型以及粗糙集理论中的不确定性问题,在目前已 有的研究成果上继续推广应用粗糙集理论模型。一是基于p a w l a l 【提出的经典粗糙 集模型的理论来源,将此类特殊的模型从论域、关系、集合三个方向进行一般的 推广和拓展:二是根据粗糙集理论在现目前的广阔应用,结合其他一些领域的不 确定性理论和经验,构造某些特殊的粗糙集模型或把粗糙集理论的一些思想应用 到其他的知识系统中,不断丰富粗糙集的理论体系,使其在更多行业中发挥它自 身的优势。主要工作具体如下: ( 1 ) 利用概率论中对立事件,结合已有的概率粗糙集模型,从参数不等式的另 一个侧面定义粗糙近似算子,进一步完善概率粗糙集模型。 ( 2 ) 研究在模糊邻域算子概念下的双论域上的粗糙上下近似算子,并探讨在 定错分率存在的条件下的模糊集合间的相对错分率,由此把已有的变精度粗糙集 模型推广到模糊环境下去讨论。 ( 3 ) 根据随机集的选择函数,探讨双论域上由随机原因得到的模糊粗糙集模 型,由此来讨论知识库中的知识是由随机原因得到的、模糊的并且被描述的对象 也是模糊的粗糙近似问题。 9 电子科技大学硕士学位论文 ( 4 ) 利用元素数目这个定量信息去描述两个普通集合的关系,基于这个关系提 出一种新的集对分析思想,并根据v a g u e 集中真隶属度和假隶属度的概念,定义了 一种模糊集对联系度,最后把这些思想引入粗糙集理论中。 ( 5 ) 由于g i l e 集和粗糙集都是描述大系统不确定性的数学工具,由此联系这 两个不确定性理论提出两种新的粗糙近似算子,在把v a g u e 集理论应用到粗糙集理 论中的同时,也推广了粗糙集模型。 l o 第二章概率粗糙集模型的推广 第二章概率粗糙集模型的推广 概率,作为随机事件的一种度量,它反映了一种不确定性,在不确定的推理 中有重要的应用。它从产生之日起就有两种理解:一种理解为信任的程度,反映 了人们的经验和知识,常称为主观概率;另一种理解为( 随机) 事件在大量重复 试验中试验结果出现的相对频率,常称为客观概率,即使是主观概率,也能反映 或符合某种统计规律性,也具有客观性,因此,我们可以认为概率是对不确定的 随机事件的一种客观性的反映。p a w l a l ( 粗糙集模型是基于确定性知识的,即它的 近似空间是完全确定的,因此它忽略了可利用信息库的不确定性,若我们仍然用 p a w l a k 粗糙集模型来处理随机产生的知识库的数据分析等问题,就不能完全反映 问题的实质。后来就有人提出了概率粗糙集模型,为用粗糙集理论研究不确定性 信息系统提供了一种可利用的途径。 2 1 概率( ,) 型粗糙集模型 定义1 i l “ 设u 是有限对象构成的论域,月是u 等价关系,其构成等价类 u r = 五,五,以) 仍记z 所在的等价类为渊,令尸为定义在u 上的子集类构成的 a 代数上的概率测度,三元组4 = ( 矿,r ,p ) 称为概率近似空间。 设o 卢 ) 关于一,依参数n ,卢的概率( ,) 型正域、边界和负域分别为: p 。s ( x ,口,卢) = ! 厶( r ) = x e u p ( 爿| 卜】) 口 6 一( ,a ,) = x e u p c p ( x i 【x 】) c a ”昭( z ,卢) = u 万,= x e uj p ( j i 【x 】) 卢 当致( x ) 2 面) 时,或等价地当拥( z ,n ,p ) = o 时,称爿依参数。,关于爿。是概率 1 1 电子科技大学硕士学位论文 ( ,) 型可定义的,否则称j 依参数d ,卢关于爿。是概率( ,) 型粗糙集。 此粗糙集模型是利用条件概率定义了一种概率粗糙近似算子,这种近似算子 依赖两个参数a ,卢,它是从一个侧面即用a 去定义下近似,用芦去定义上近似,然而 实际应用中往往要碰到这样的问题:选取或使用参数时尽量使其有利于问题的解 决或优化,因而这种粗糙近似算子的定义显得过于严格,若能构由口的信息去定义 下近似,而用a 的信息去刻画上近似,势必在应用粗糙集理论解决问题时更加方便 灵活,更加有效受此启发,下丽就根据概率粗糙集模型中参数的特点,利用事件 中的对立事件( 或补事件) ,结合概率测度,从条件参数不等式的另一个侧面,重新 定义粗糙集中的上下近似算子。 2 2 推广的概率( ,) 型粗糙集模型 定义2 设o 口1 ,对于任惹并u ,用j 表不x 的补集,定义| = 5 关于概 率近似空间4 = ( u ,r ,p ) 依参数。,芦的概率( ,) 型下近似玛) 和上近似葡。( ) 如下: 岛( 工) = z e u p ( j i 【x 】) s 卢 刀。( x ) = x e u p ( 一x 【x 】) c 口 p m ( j ,a ,卢) = 玛( j ) = x e u p ( j i 【司) 卢 = x e u p ( x i 【x 】) l 一芦 此时,h ( x ,a ,卢) = z e u p c ,( 一j i 【x 】) c a = l n c ,( 工l 【x d c l 一夕 ,孵( j ,a ,p ) = u 、岛= x e u | ,( x l 卜】) 。) = z e u p ( j l 卜d 蔓l 一“) 分别叫做概率( ,) 型正域、边界和负域构成了论域v 的划分,而且显然 万。( z ) = p m ( j ,口,) u 抽( x ,q ) 当匕f ) = 万0 ( x ) 时称工依参数吼卢关于4 是 概率( ,) 型可定义的,否则称x 依参数口,卢关于一,是概率( ,) 型粗糙集。 性质设o 1 一口) = 扛e 己,i 野盖】) c 口 = 。( x ) 且同时也有 p ,。( y ) = x u i 尸( y 似】) 口) ,故而x e 。( x ) n 。( r ) 即为, 川。似n 】,) 肼a ( x ) n h a ( y ) 6 ) :由j 】,有,z r p ( 一工j 【x 】) p ( y x 】) ,所以 ! 型,( z ) = z e u p ( r i f z 】) s 芦 x e u p ( r l 【x 】) s 砖= 岛( j ,) 结论成立 讨黼当删肛。,若取删,】) = 皆川有 旦0 ( j ) = 匕( z ) = x e 【厂| 【z 】z 两i ( 工) = 葡- l ( 并) = x e u l 【x 】n x o 这时概率( ,) 型下近似和上近似就退化为p a w l a k 意义下的下近似和上近似因 此这里提出的概率( ,) 型粗糙集模型是p a w l a k 粗糙集模型的推广。 2 由定理中的( 2 ) 和( 7 ) 知, 墨( z ) = 仁e u i 【x 】j ) 盟o ( z ) 两i ( z ) 夏( j ) = p e z x 】n x 。 ,并且由( 7 ) 可以 看出概率( ,) 型粗糙集的正域随着p 的增大而增大,负域随着a 的减小而增大,同 时边界缩小。 但是大多数情况下,脚盟名岱) = 曼,( ) ,卿兄( 卫) = 万- ( ) 不成立。例如, 设瞻 1 2 删功= 皆w 州砒焉孙其中刑m 电子科技大学硕士学位论文 置= 屯,墨) ,也= 矗,_ ,而,南) ,五= _ 。,五,墨:)z = _ ,艺,鼍,黾,畸,葺,一: 则有, x = _ ,墨,k ,为,五。 ,丛”( 互) = 一j ,( 工i 【x 】) o 5 ) 2 鼍u 五,但热丛,( _ ) 2 以:而州。,) 2 墨。骢o 心) 2 五u 五u 五- 对于这种粗糙集模型,还有一些类似于概率( d 型粗糙集模型的定理,在此就不 再一一列出,有兴趣的读者可以参考文献 1 3 自己作一些总结。 若o ,c 口1 ,则并关于概率近似空间4 依参数卢的粗糙度p ( x ,a ,) 和近似 精度口( x ,a ,声) 分别定义为: p ( x ,口,芦) = l 一 口( l 口,) = l 一尸( x ,a ,卢) = 从而可以知道,j 关于概率近似空间爿。依参数口,卢是可定义的,当且仅当其近似 精度为1 ,粗糙度为o 。 由此定义的粗糙集模型不但是对概率( n 型粗糙集模型的一个扩充,另一方面 也完善了概率粗糙集模型在实际问题中的运用。而类似地也可以把概率f 口) 型,( 肌) 型以及( ) 型粗糙集模型作如上推广,使得更全面更有效地利用粗糙集模 型中的参数作一些决策( 如医疗诊断,风险预测,数据约简等) 。 第二章模糊环境f 粗糙集模型的新扩充 第三章模糊环境下粗糙集模型的新扩充 模糊集和粗糙集总是有很多内在的联系,结合这两个理论的研究工作一直是 粗糙集理论研究的热点。对于经典粗糙集模型的推广的一个重要方面是等价关系 的推广,1 9 9 8 年y 幻y y 【1 目给出了邻域算予与粗糙集之间的关系解释,将对象x 所 在的等价类看成是x 的一个邻域,从而导出了基于邻域算子的粗糙集模型,后来又 有学者提出了基本模糊点,模糊邻域算子的概念。在此我们结合模糊关系,给出双 论域上模糊邻域算子的表示,从而定义双论域上模糊集的上近似和下近似:另一方 面,当知识库中的知识模块既是不确定的又是模糊的情形时,在允许一定程度的错 误分类率存在的条件下,提出了基于模糊邻域算子的模糊变精度粗糙集模型,并讨 论了它的一些相关性质。 3 1 双论域上的模糊关系和模糊邻域算子表示 预备知识:记善= j ( o ,1 ,善中的元记作( 置 ) 且称为基本f u

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论