(控制理论与控制工程专业论文)粗糙集理论中的若干方法研究与应用.pdf_第1页
(控制理论与控制工程专业论文)粗糙集理论中的若干方法研究与应用.pdf_第2页
(控制理论与控制工程专业论文)粗糙集理论中的若干方法研究与应用.pdf_第3页
(控制理论与控制工程专业论文)粗糙集理论中的若干方法研究与应用.pdf_第4页
(控制理论与控制工程专业论文)粗糙集理论中的若干方法研究与应用.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(控制理论与控制工程专业论文)粗糙集理论中的若干方法研究与应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 粗糙集( r o u g hs e t ,简称r s ) 理论是一种全新的刻划不完整性和不确定性 的数学工具。本文针对粗糙集理论的特点,从其核心问题约简问题以及属性 离散化问题两方面展开探讨。 在认真学习和研究了粗糙集理论基础知识及其特性基础上,从知识表达系统 出发,结合粗糙集理论的依赖度定义,应川遗传算法进行知识的相对约简。同时, 在适值函数的选取上引入了惩罚函数和罚系数,从而保证所求的约简在包含最少 而非零个属性的基础上保持原有的分类能力。通过多个仿真结果可看出,该算法 对求解知识约简问题是快速而有效的,在多数情况下,均能求出最小知识约简。 但是,在代数表示下,粗糙集理论的一些概念与运算的直观性较差,因此本文在 上一阶段工作的基础上,提出了一种综合信息熵和遗传算法的约简方法,其基本 思想是:将条件信息熵的重要性定义融入了适值函数中,使得约简结果不仅能保 持原有的分类能力,而且是众多最小约简集- 卢相对最优的一个。通过实例分析可 以看出,该方法有更广泛的适用性,约简速度也相对较快。 制约粗糙集理论发展和应用的瓶颈是,该理论无法直接用于连续数据,因 此连续数据离散化便成了粗糙集理论研究的另一大热门。p a r z e n 窗方法因其提 供了衡量连续属性离散结果是否稳定的标准,在本文中将其用于搜索最优离散化 结果的标准中,仿真结果表明该方法是有效的。但是综合考虑信息系统的分类精 度发现,p a r z e n 窗方法并不完善,因此将粗糙集理论的分类精度概念运用到数 据离散化上来,利用p s o 强劲的全局搜索能力实现了决策系统的属性离散化。仿 真结果表明,该方法能最大限度地保留数据原有的分类能力。 本文最后将离散化方法及约简方法用于数据的分析和处理中,得到了较好 的结果。 关键词:粗糙集,信息系统,约简,遗传算法,信息熵,离散化,p a r z e n 窗,粒子群算法,断点 江南大学硕士论文 a b s t r a c t r 0 u g hs e t s ) t l l e o r yi san o v e l t o o lt od e a lw i mv a g u e n e s sa i l du l l c e n a i l l 哆i l l “s p a p e lt h er e d u c t i o np r o b l e ma n dt h ea t t r i b u t e sd i s c r e t i z a t i o ni s s u e a r ed i s c u s s e d w i t hs t i l d y i l l gt h er c d u c t i o np r o b l e mw l i i c hi st h ee s s e n c eo f m er o u 曲s e tt h e o r yi i l d e t a i l ,ag e n e t i ca l g o r i t h m ( g a ) r e d u c t i o na p p r o a c hb a s e do nt h ed e f i n i t i o no f d e c i s i o na t t r i b u t ed e p e n d e n c yd e 目_ e ei nr o u g hs e ti sp r o p o s e dh e r e m e a i l w h i l e ,a p l l n i t i v e 如n c t i o na i l dap u n i t i v ec o e f f i c i e n ta r ei n 虹o d u c e di n t of i 恤e s sf i l n c t i o nt o a s s l l r ef 色w e ra t i b u t e sa sw e l la ss 廿o n g e rd e c i s i o na t t r i b u t ed e p e n d e n c yd e g r e ei n r e d u c t i o n t h es i 舢l a t i o nr e s u l t ss h o wt l l a t “s 印p r o a c hi se 旋c t i v ea 1 1 dq u i c ki n m 锄yk n o w l e d g er c d u c t i o n s w h i l e 行o mt l l ea l g e b r ap o i n to fv i e w ,t h ed e f i n i t i o n so f m u g hs e tc a nn o te x p r e s st l l e i rm e a l l i n g sd i r c t l ya n dc o m p l e t e ly o nt h eb a s i so fm e a p p m a c hp r o p o s e da sa b o v c ,an e wr e d u c t i o na l g o r i m mc o m b i i l i n gi 1 1 f o 肌a t i o n e n 仃o p yw 汕g a i s p u tf o n a r d i t sc e n 订a l i d e ai sm a l ( i n gu s eo ft h es i g i l i f i c a n c e d e f i i l i t i o no fi n f o r m a t i o ne n t r o p yi l lt h ef i 虹l c s s 劬c t i o nt of i n dm er e l a t i v e l yo p t i m a l r e d u c t i o n t l l i sa p p r o a c hi sm o r ea v a i l a b l e 恤nt l l a ti na l g e b mv i e w w m c hc a nb e s e e ni nt l l es i m u l a t i o nr e s u l t s o n eo f t l l er o u g l ls e tt l l e o r yd e f e c t sw l l i c hb l o c k si t sd e v e l o p m e n t 柚d 印p l i c a t i o ni s t l l a ti tc 锄n o tb ee m p l o y e do nc o n t i n u o u sv a l u e sd i r e c t l y ,a l l dn a t i l r a l l yd e c i s i o n s y s t e md i s c r e t i z a t i o ni sb e c o i i l i n gt l l er e s e a r c hh o t s p o t p a r z e nw i l l d o w sw l l i c hc a n d e s c m et 1 1 ed a 诅d i s 曲u t i o ns t a t u sp r o v i d e st l l e s 诅b i l i t yi n d e xo fm er e s u l t so f c o n t i n u o u sv a l u e sd i s c r e t i z a t i o n t h e nm es t a b i l i t yi n d e xi su s e dt os e a r c ht h eo p t i m a l d i s c r e t i z a t i o nr e s u l t si nt 1 1 i sp a p e r ,a 1 1 dg ai sm et o o lf o rs e a r c h 访gt 1 1 eo p h m a lg o a l sm c t l l o di se 腩c t i v c ,w h i c hc a l lb e e ns e e ni nt h ec a s es t i l d yb u ta l l o w 堍f o rt h e 9 1 0 b a l l yq u a l 毋o fc l a s s m c a t i o n ,l i sm e t l l o di s n o tp e 疵c t i no r d e rt oa p p l yt h e d i s c r e t i z a t i o nr e s u l t st ot 1 1 er o u 曲s e tt 1 1 e o r yd i r e c t l ya n de 行b c t i v e l y ,an o v e la t 砸b u t e d i s c r e t i z a t i o na p p m a c he m p l o y i n gp a n i c l es w a mo p t i m i z a t i o n ( p s o ) i si n t r o d u e di n t 1 1 i sp a p e lp s ow 1 1 i c hh a ss t r o n gg l o b a ls e a r c l l i n gc a p a c i t yi su s e dt of i n dm i i l i m a l s u b s e to fc u 印o i n t s ,a i l dt l l eq u a l 崎o ft h ec l u s t e r i n gr c s u l t i nm u 曲s e tt l l e o r yi st o 丌 摘要 e n s u r et h ec o n s i s t e n c yo fk n o w l e d g eb a s ec l a s s i f i c a t i o r lt h es i m u l a t i o nr e s u l t so ft h i s a p p m a c ht u mo u tt ob ep r a c t i c a la n ds “s f i e d t h ed i s c r e t i z a t i o n 印p m o c ha n dt h er e d u c t i o na l g o r i t h mp r o p o s e di nt h i sp a p e ra r e a p p l i e dt ot w ol ( i n d so fi n f o m l a t i o ns y s t e m st ot e s t i 母t h e i rv a l i d i t i e s k e yw o r d s :r o u 曲s e t ,i n f o n n a t i o ns y s t e m ,r e d u c t i o n ,g a ,i n f o n n a t i o ne n t m p y , d i s c r e t i z a t i o n ,p a r z e nw j n d o w s ,p s o ,c u t p o i n t s i i i 独创性声明 y9 68 0 2 7 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 本人为获得江南大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名:王雪驻日期:2 。6 年4 月2 5 日 关于论文使用授权的说明 本学位论文作者完全了解江南大学有关保留、使用学位论文的规 定:江南大学有权保留并向国家有关部门或机构送交论文的复印件和 磁盘,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编 入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、 汇编学位论文,并且本人电子文档的内容和纸质论文的内容相一致。 保密的学位论文在解密后也遵守此规定。 签名:三骧导师签名: 日期:2 0 0 6 年4 月2 5 日 第l 章绪论 第1 章绪论 1 1 粗糙集理论的发展历史及研究意义 粗糙集( r o u g hs e t ,r s ) 理论是一利,全新的刻划不完整性和不确定性的数 学工具。它能有效地分析和处理不精确、不完整、不一致等各种不完备信息, 并从中发现隐含的知识,揭示潜在的规律。1 。r s 理论是由波兰学者p a w l a kz 在 1 9 8 2 年提出的。由于最初关于粗糙集理论的研究大部分是用波兰语发表的,因 此当时没有引起国际计算机学界和数学界的重视,研究地域也仅限于东欧一些国 家,直到2 0 世纪8 0 年代末才逐渐引起各国学者的注意。近年来,由于它在机器 学习与知识发现。1 、数据挖掘“、1 、决策支持与分析等方面的广泛应用,研究逐 渐趋热。 1 9 8 2 年p a w l a kz 发表经典论文r o u g hs e t ,宣告了粗糙集理论的诞生 1 9 9 1 年p a w l a kz 出版专著“r o u g hs e t ”,系统全面的阐述粗糙集理论,奠 定了粗糙集理论严密的数学基础,成为粗糙集理论研究的一个里程碑。 1 9 9 2 年在波兰召开了第一届国际粗糙集理论研讨会,极好的总结了这一时 期粗糙集理论与实际的研究成果,也进一步推动了粗糙集理论的发展。 1 9 9 5 年a c mc o m m u n i c a t i o n 将其列为新浮现的计算机科学的研究课题。 1 9 9 6 年在日本东京召开了第五届国际粗糙集理论研讨会,推动了亚洲地区 对粗糙集理论的研究。 1 9 9 8 年国际信息科学杂志还为粗糙集理论出了一期专刊。 2 0 0 1 5 第一届中国粗糙集理论与软计算学术研讨会在重庆邮电学院成功召 开随后每年的研讨会在规模和质量上均呈良好的增长趋势。 2 0 0 3 年成立了中国人工智能学会粗糙集与软计算专业委员会,r o u g h 集的研 究队伍也更加壮大,研究成果在深度和广度上有了更大的发展。 粗糙集理论是建立在分类机制的基础上的,它将分类理解为在特定空间上的 等价关系,而等价关系构成了对该空问的划分。粗糙集理论从一种全新的视觉审 视知识,认为知识与分类相关、知识是有粒度的。知识的这种颗粒状结构通过等 价关系表示。正是由于知识的这种颗粒状,导致了知识表示的粗糙性。与其他方 江南大学硕士论文 法,如统计方法、模糊集方法比较,粗糙集方法处处以知识的颗粒状为其主要特 征处理知识,试图从数据的结构方面着手,挖掘尽可能多的知识。3 。该理论与其 他处理不确定和不精确理论( 如模糊集理论) 的最显著的区别是它无需提供问题 所需处理的数据集合之外的任何先验信息,如模糊隶属度函数和概率分布等,所 以对问题的不确定性的描述或处理可以说是比较客观的。 1 2 粗糙集理论的应用 r s 理论在许多领域都取得了令人鼓舞的成果,从其实用性也可见一斑。 1 )数据发掘( k d d ) ,k d d 是当前人工智能和数据库技术交叉学科的研究热点之 一,r s 方法现已成为k 叻的一种重要方法,其导出的知识精练且便于存储 和使用,文献“”很好的说明了这一点。 2 )模式识别,阻碍模式识别广泛应用的困难之一是复杂的数据集。文 9 应用 粗糙集方法研究手写字符识别问题,提出了特征属性;文 1 0 将粗糙集方 法用于模式识别的特征选择中,得到了很好的应用。 3 )股票数据分析,文献 1 1 给出了用r s 方法分析十年间股票的历史数据,研 究股票价格与经济指数之间的依赖关系,获得预测规则。 4 ) 医疗诊断,文献 1 2 提供了应用r s 理论提取头痛的各种病症,并得到了病 症的模型,结果表明,与专家经验相比,该方法是合理有效的。 5 ) 粗糙控制,在文献 1 3 】中对h v a c 系统的控制器设计分别使用了模糊逻辑 和粗糙集理论,结果表明两种方法各有利弊。文献 1 4 】给出了结合模糊和粗 糙集理论对“小车倒立摆”这一经典问题的控制,从仿真结果可以看出, 该方法比仅用模糊控制要更让人满意。 6 ) 故障诊断,r s 理论在故障诊断上的应用尤为瞩目,利用r s 理论对可能产 生故障的各种情况进行分析约简,得到引起故障的原因。文献 1 5 很好的说 明了r s 理论在故障诊断中的应用。 7 )人工神经网络,粗糙集与神经网络结合已越来越成为研究的热点,粗糙集 特有的对不精确、不一致数据的表达能力,延伸了神经网络对该类数据的 处理能力。粗糙集与神经网络的结合应用大致分为三类:一类是用粗糙集 对数据进行预处理,在不损失源数据的有用信息的同时删除多余属性,从 第l 章绪论 而减少数据集的大小以及噪声的干扰,同时也减少了训练时问,提高了效 率;第二类是将粗糙集引入神经网络的设计中去,设计一种粗糙神经元, 并将其和传统的神经元结合构造粗糙神经网络;第三类是将粗糙集j | = | j 于神 经网络的结构设计,日前该类应用一般是将粗糙集分析用于模糊神经网络 的构造上。 r s 理论的应用领域还包括:图象处理,预测建模、电力系统等。 1 3 粗糙集理论的发展现状和展望 1 3 1r s 理论的研究现状 目前,对r s 理论的研究主要集中在”:粗糙集模型的推广,问题的不确定 性研究,与其他不确定性,模糊性问题的数学理论的关系与互补,纯粹的数学理 论方面的研究,粗糙集的算法研究和人工智能其他方向关系的研究等。 1 3 2 粗糙集模型的推广 粗糙集模型的推广一直是粗糙集理论研究的主流方向,目前主要有两种方 法:( 1 ) 构造性方法;( 2 ) 代数性( 公理性) 方法。 构造性方法是对原始粗糙模型的一般推广,其主要思路是从给定的近似空间 出发去研究粗糙集和近似算子。它是以论域上的二元关系或布尔子代数作为基本 要素,然后导出粗糙集代数系统,该方法所研究的问题来源于实际,所以建立的 模型有很强的应用价值,主要缺点是不易深刻了解近似算子的代数结构。 粗糙集模型的推广形式有三个方向:从论域方向推广的目前只有一种,就是 双论域情形“”;从关系方向推广有四种:一种是将论域上的二元等价关系推广成 为任意得二元关系得到了一般关系下的粗糙集模型“,另一种是基于临域算子“9 1 的粗糙集模型,也有将由关系导出的划分推广成为一般的布尔子代数,以次出发 去定义粗糙集和近似算子的“,更有一般的将普通关系推广成模糊关系或模糊划 分而获得的模糊粗糙集”“模型;从集合和近似空问方向推广是与其他处理不确 定,不精确或是模糊的知识( 如概率论,模糊数学,信息论,证据理论等) 结合 起来,一般有统计( 或概率) 粗糙集模型”、变精度粗糙集模型。”和基于随机集 江南大学硕士论文 的粗糙集模型。“,变精度粗糙集模型将完全精确的包含关系“软化”为某种程度 上的包含,该模型的提出拓宽了粗糙集理论的应用与推广。代数方法也称为公理 化方法,该方法研究的明显优点是能够深刻地了解近似算子的代数结构,但应用 性不够强。 k o w a l c z y k 。”从另一角度提出了粗糙集数据模型的概念,试图通过建立论域 中的等价类到决策类之间的映射关系来描述某一子集概念定义的映射关系不同, 所得到的近似集也不同,粗糙数据模型以其相对简单的算法和很高的模型质量在 e u f i t 9 6 国际会议上的竞赛题目中赢得金奖。 1 3 3 不确定性问题的理论研究 粗糙集理论中知识的不确定性主要由两个原因产生:一个是直接来自于论 域上的二元关系及其产生的知识模块,即近似空间本身。知识的粗糙性与信息熵 的关系比较密切,知识的粗糙性实质上就是其所含信息多少的更深层次的刻画; 另一个原因来自于给定论域里粗糙近似的边界,当边界为空集时,知识是完全确 定的,边界越大知识就越粗糙或越模糊。至今为止,粗糙集刻画概念的不确定性 用正则条件熵和粗糙性测度来实现。但这两种度量并不完善,因此寻求一个合适 的度量来刻画知识的不确定性也是粗糙集理论研究的一个重要方向。 1 3 4 与其他处理不确定性方法的理论结合研究 在粗糙集与其他处理模糊性或不确定性方法的理论研究中,主要集中在它与 概率论、模糊数学、信息论和证据理论的相互补充和融合上。 模糊集和粗糙集理论在处理不确定性和不精确性问题上推广了经典集合论。 虽然有一定的相容性和相似性,但它们的侧重点不同。从知识的“粒度”的描述 上来看,模糊集是通过对象关于集合的隶属程度来近似描述的;而粗糙集是通过 一个集合关于某个可利用的知识库的一对上、下近似来描述的。模糊集的隶属度 函数大多是专家凭经验给出的,往往带有很强的主观性,目前所见的模糊粗糙集 模型就是将粗糙集理论和模糊集理论去弊吸利的结合来描述知识的不确定性和 不精确性。 粗糙集理论与d s 证据理论在处理不确定性的问题方面其产生和研究的方 第1 章绪论 法是不同的,但却有某利t 相容性,粗糙集理论是为开发规则的机器自动生成而提 出的,而证据理论主要用于证据推理,但二者有很强的互补性。 1 3 5 算法研究 目前,粗糙集理论中有效算法研究主要集:p 在导出规则的增量式算法,约简 的启发式算法,粗糙集并行算法,与粗糙集有关的神经网络与遗传算法以及对连 续属性的离散化等。 1 4 论文的研究内容及安排 1 4 1 主要研究内容 鉴于粗糙集理论不需要先验知识、能表达和处理不完备信息、能识别并评估 数据间的依赖关系、建立数据模型等特点,本文所做的主要工作包括: 1 ) 由于粗糙集理论的约简问题已被证明为n ph a r d 难题,针对这一难题,采 用遗传算法解决粗糙集知识约简问题,结果证明了该算法的实用性及可靠 性。 2 ) 从信息熵的概念出发,结合信息论有关知识,给出了粗糙集理论中一些概 念和运算的信息表示,并利用遗传算法作为约简工具,提出了一利嘎口识相 对约简的方法。 3 ) 在粗糙集理论的一致性要求基础上,结合p a r z e n 窗和遗传算法,提出了一 种全局的无监督连续属性离散化方法。 4 ) 利用有强劲搜索能力的粒子群算法,搜索将决策系统最优分类的断点数据。 5 ) 结合离散化方法及约简算法导出决策系统的规则。 1 4 2 论文安排 第1 章绪论 主要介绍粗糙集理论的发展历史、研究现状以及应用背景。 第2 章粗糙集理论的基本概念其特点 内容包括:粗糙集理论的基本概念,比如知识表达系统、粗糙集合、知识约 江南大学硕士论文 简、知识的依赖度、粗糙集理论的特点。 第3 章粗糙集理论詹睦约简方法研究 3 1 基于遗传算法的粗糙集属性约简方法i s r a g a ( i n f o m a t i o ns y s t e m r e d u c t i o na p p r o a c hb a s e do ng e n e t i ca 1 9 0 r i t h m ) 从代数的角度考虑粗糙集属性约简问题,使用粗糙集理论的依赖度函数来定 义遗传算法的适值函数,使得约简后的属性与原属性保持一样的分类能力。 3 2 一种综合信息熵和遗传算法的知识约简算法k r a i e g a ( k n o w l e d g e r e d u c t i o na p p r o a c hb a s e do ni n f o r m a t i o ne n t r o p ya n dg e n e t i ca l g o r i t h m ) 从信息的角度考虑粗糙集属性约简问题并给出粗糙集理论和概念的信息表 示。将条件信息熵的重要性定义融入了适值函数中,保证所求的约简在包含最少 属性的基础上保持原有的分类能力,并能得到相对较优的约简结果。 第4 章用于粗糙集理论的连续属性离散化方法研究 粗糙集理论只适用于离散化的属性,而面对诸多连续属性问题就无从下手, 因此属性离散化也是粗糙集发展的必由之路,该章用两种不同的方法离散化连续 属性。 4 1 基于遗传算法的p a r z e n 窗离散化方法p w d a g a ( p a r z e nw i n d o w s d i s c r e t i z a t i o na p p r o a c hb a s e do ng e n e t i ca 1 9 0 r i t h m ) p a r z e n 窗方法提供了衡量连续属性离散结果是否稳定的标准。将p a r z e n 窗 方法和遗传算法相结合,提出了一种全新的属性离散化方法,该方法在兼顾属性 一致性要求的前提下,达到了较好的离散结果稳定性。 4 2 粗糙集理论中基于二进制p s o 的属性离散化方法i s d a b p s 0 ( i n f o r m a t i o n s y s t e md i s c r e t i z a t i o na l g o r i t h mb a s e do nb i n a r y p a r t i c l es w a r m 0 p t i m i z a t i o n ) p s o 算法是近几年兴起的一种进化算法,可应用于一切g a 能应用的场合, 而且在寻优策略和算法实现上,p s o 要比g a 更加简单、有效。结合粗糙集的分 类精度定义,利用p s o 寻优策略找出最优的断点,得到期望的离散化属性。 第5 章基于粗糙集理论的实例分析 5 1 滚动轴承技术状态诊断数据规则提取 将粗糙集理论用于该决策系统中,通过约简去除冗余属性,并导出分类规则 星! 翌竺堡 5 2 粗糙集理论在聚丙烯腈生产过程数据l = i = 】的应用 将粗糙集理论用于该生产过程的数据分析中,从分析结果发现粗糙集理论能 够在保持原有分类能力的情况下去除冗余信息,所得结果与专家经验一致。 参考文献 参考文献: 1 0 1 2 p a w l a kz r 0 u 曲s e t s i m e m a t i o n a l j o 啪a lo fi n f o 珊a t i o na n dc o m p u t e r s c i e n c e ,1 9 8 2 ,( 1 1 ) :3 4 1 3 5 6 p a w l a l 【ze ta 1 r o u 曲s e t s c o m m u n i c a t i o n so f a c m ,1 9 9 5 ,3 8 ( 1 1 ) :8 9 9 5 p a w l a l ( zr o u 曲s e t s t h e o r e t i c a la s p e c t so fr e a s o n i n ga b o u td a t a a b o s t o n :u w e r a c a d e m i cp u b l i s t l e r s 1 9 9 1 c h a ncc ar o u g hs e t 印p m a c ht oa t t r i b u t eg e n e r a l i z a t i o ni 1 1d a t am i n i l l g 【j f l l z z ys e t sa i l ds y s t e m s 1 9 9 7 ,8 5 :2 3 2 9 t s 啪o t os he ta 1 e x 仃a c t i o no fd o m a i nh o w l e d g e 疗o md a t a b a s e sb a s e do n m u 曲s e tt h e 哆i e e ei n t e m a t i o n a l c o n f e r e n c eo nf u z z ys y s t e m s ,n e w j e r s e y 1 9 9 6 ,7 4 8 7 5 4 a n d r e wk u s i a l 【r o u g hs e tm e o r y :ad a t a1 1 1 i 1 1 i n gt o o lf o rs e m i c o n d u c t o r m a i l u f a c n 】r i n g i e e e a 1 1 s a c t i o n so ne l e c 仃0 l l i c sp a c k a g i n gm a n u f a c t i l r i n v 0 1 ,2 4 ,n o 1 ,j a l l u a r y2 0 0 1 m c s h e r r yd k 皿o w l e d g ed i s c o v e r yb yi n s p e c t i o n j d e c i s i o ns u p p o r t i s y s t e m s 1 9 9 7 ,2 1 :4 3 4 7 苗夺谦,范世栋知识的粒度计算及其应用 j 系统工程理论与实践, 2 0 0 2 1 :4 8 5 6 n e j m a nd ar o u g hs e tb a s e dm e t h o do f h a n d w r i t t e nn 哪e m l so f c l a s s m c a t i o n i n s t i t i i t eo f c o m p u t e r s c i e n c e r e p o r t s ,w a r s a wu n i v e r s i t y o f t e c h n o l o 阱w 缸s a w ,1 9 9 4 r o m a nw s w i l l i a r s l ( i ,a n d r z e js k o w r o n ,r o u g hs e tm e t h o d s i l lf e a t u r e s e l e c t i o na l l dr e c o g i l i t i o n 叨p a 仕c mr e c o 印i t i o n1 e t t e r s ,2 0 0 3 ( 2 4 ) :8 3 3 _ 8 4 9 g 0 1 a r ira i l dz i a r k ow m e m o d o l o g yf o rs t o c km a r k e ta l l a l y s i su t i l i z i n gr o u g h s e tt h e o r y p m c o fi e e e l a f ec o n f b r c n c eo nc o m p u t a t i o n a li n t e l l i g e n c ef o r f i n a n c i a le n g i n e e r i n g ,n e wj e r s e y ,1 9 9 5 3 2 - 4 0 s h u s a l ( i lt s 啪o t oa n dh i r o s l l it 缸a k a ,e x t r a c t i o no fd i a g n o s t i ck n o w l e d g e f 如mc l i n i c a ld a 切b a s eb a s e do nr o u g hs e tt h e o r y ,i e e e ,1 9 9 6 8 u 刁封 哪 习 江南大学硕:l :论文 1 3 】 【1 4 1 5 1 6 1 7 1 8 1 9 2 0 2 1 2 2 】 2 3 】 2 4 】 2 5 m a s a n o r ia r i m a ,e l m e rh h a r a ,j a c kd k a t z b e 唱,af u z z yl o g i ca n dr o u g h s e t sc o n t r o l l e rf b rh v a cs y s t e m s ,i e e e ,1 9 9 5 ,1 3 3 1 3 8 c z o g a l aee t a li d e ao far o u 曲f u z z yc o t r o l l e ra n di t sa p p l i c a t i o nt ot h e s t a b i l i z a t i o no fa p e n d u l u m - c a r s y s t e m s f u z z y s e t s a n d s y s t e m s , 1 9 9 5 ,7 2 ( 1 ) :6 1 7 3 r y s z a r dn o w i c k i e v a l u a t i o no fv i b r o a c o u s t i cd i a g n o s t i cs y m p t o m sb ym e a l l s o f t h er o u 曲s e t st h e o r y j 】c o m p u t e r si ni n d u s t r y ,1 9 9 2 ,2 0 ( 2 ) :1 4 1 - 1 5 2 张文修,吴伟志粗糙集理论介绍和研究综述 j 模糊系统与数 学,2 0 0 0 ,1 4 ( 4 ) :1 1 2 y a oyy ,ad e c i s i o nt h e o 硎cf r a m e w o r kf o ra p p m x i m a t i o n gc o n c e p t s j i n t e m a t i o n a l j o u m a lo f m a n - m a c h i n es t 、l d i e s ,1 9 9 2 ,3 7 :7 9 3 8 0 9 、r a oyy ,l i nty g e m e r a i i z a t i o no fr o u 曲s e t su s i n gm o d a l1 0 9 i c j i n t e l l i g e n t a u t o m a t i o na n ds o f tc o m p u t i n g ,1 9 9 6 ,2 :1 0 3 - 1 2 0 y a oy y ,r e l a t i o n a li n t e r p r e t a t i o n so fn e i 曲b o r h o o do p e m t o r sa n dr o u g hs e t a p p r o x i m a t i o n j i n f o r m a t i o ns c i e n c e s ,1 9 9 8 ,l l l :2 3 9 2 5 9 n a n d a s ,m a j u m d a r sf u z z y r o u g hs e t j f u z z y s e t sa n d s y s t e m s , 1 9 9 2 4 5 :1 5 7 1 6 0 d u b o i sd ,p m d eh ,r o u g hf u z z ys e t sa n dm z z yr o u 曲s e t s j ,i mj ,g e n e r a l s y s t e m s ,1 9 9 0 ,1 7 :1 9 l 一2 0 9 p a w l a kz r o u g hs e t s :t 1 1 e o r e t i c a la s p e c t so f r e a s o n i n ga b o u td a t a 【a b o s t o n : k i u w e ra c a d e m i cp u b l i s h e r s 19 91 z i a r k ow b a r i a b l ep r e c i s i o nr o u 曲s e tm o d e l j j o u n l a lo fc o m p u t e ra i l d s y s t e ms c i e n c e s ,1 9 9 3 4 6 :3 9 5 9 张文修,吴伟志基于随机集的粗糙集模型( i ) j ,西安交通大学学报, 2 0 0 0 ,3 4 ( 1 2 ) :1 5 一1 9 k o w a l c z y kw r o u g hd a t am o d e l :an e wt e c l i l l i q u ef o ra n a l y z i n gd a t a i n :p o l k o w s l 【i l ,s k o w r o na ,e d s :r o u g hs e t s i n k n o w l e d g ed i s c o v e r y 1 :m e t h o d o l o g ya n d a p p l i c a t i o n s h e i d i l b e 唱:p h y s i c a - v 毫r l a g ,1 9 9 8 4 0 0 - 4 2 1 9 第2 章粗糙集理论的基本概念及特点 第2 章粗糙集理论的基本概念及特点 2 1 粗糙集理论基本概念 2 1 1 知识和知识库 设u 是我们感兴趣的对象组成的有限集合,称为论域。任何子集x ( , 称为u 中的一个概念或范畴。中的任何概念族称为关于的抽象知识,简称知 识。一个划分定义为:= x t ,x 2 ,z 。) ;置c u ,置妒,五n x ,= 妒, 对于f j ,f ,= 1 ,2 ,n ;u 置= 【,。 ,= l 上的一族划分称为关于u 的一个知识库( k n o w l e d g eb a s e ) 设斤是上的一个等价关系,叫r 表示亓的所有等价类构成的集合,【x 。表 示包含元素x u 的r 等价类,一个知识库就是一个关系系统足= ( u ,r ) ,其中 u 为非空有限集合,称为论域。 若p r ,且p ,则n 尸也是一个等价关系,称为p 上的不可区分关系, 记为i n d ( p ) ,且有 x k 。即= n m 。 月e , 这样,叫加d ( p ) 表示与等价关系族p 相关的知识,称为k 中关于u 的p 基本知 识。 2 1 2 知识表达系统 定义2 1 四元组p 似,4k ,是一个知识表达系统,其中u 表示对象的 非空有限集合,称之为论域;彳可u 历f 厂7 口= 历f 称为条件属性集,d 成为决策 属性集;矿2 兰吒,圪是属性a 的值域;,表示u 一j 矿的一个信息函数,它为 每个对象的每个属性赋予一个信息值,既v d 爿,x u ,( x ,) 圪。 在粗糙集理论中,知识表达系统又称为信息系统,可以表示成信息表的形 ln 江南丈学硕士论文 式。信息表的列表示属性,行表示对象,每个单元格表示对象的属性值。 2 1 3 不精确范畴,近似与粗糙集 设u ,斤是上的一个等价关系,当x 能表达成某些r 基本范畴的并时, 称x 是r 可定义的,否则称x 为r 不可定义的。r 可定以集是论域的子集,可在 知识库k 中精确地定义,称为r 精确集;r 不可定义集不能在这个知识库中定义, 称为r 非精确集或r 粗糙集。 定义2 2 给定知识库k = ,r ) ,对于每个子集,x u 和一个等价关系 r 加d ( 足) ,定义两个子集:掣= 叭,叫月f y ) ;砑= 叭y 叫月y n x ) , 分别称他们为x 的r 下近似集( 1 0 w e r 印p m x i m a t i 彻) 和上近似集( u p p e r a p p m x i m a t i o n ) 集合加。( x ) = 见r 一点称为x 的r 边界域:p o ( x ) = 称为 x 的r 正域;”e g 。( ) = u 一足称为x 的r 负域。 图l :粗糙集概念示意图 集合的不精确性是由边界域的存在而引起的,集合的边界域越大,精确性 则越低。由等价关系r 定义的集合x 的近似精度为口。( z ) = i 星酬f 砑i ,其中h 表 示集合x 的基数,。o a 月( ) 1 ,当a 。( x ) = 1 时,x 的r 边界域为空 第2 章粗糙集理论的基本概念及特点 集,集合x 为r 可定义的;当( z ) 1 时,集合x 有非空r 边界域,集合x 为r 不可定义的。相应地:x 的r 粗糙度n ) = l 一口。( x ) ,表示集合x 的知 识的不完全程度。 定义2 3 令吼= x 。,x :,x 。) 是u 的一个划分或分类,这个分类独立于知 识r 子集,x 巾= 1 ,2 ,n ) 是划分贸的类,贸的r 下近似和上近似分别定义为: 墨( 贸) = 。,星y :,曼y 。 和尺( 婀) = 兄r ,兄y :,见y 。) 定义两种量度来描述近似分类的不确定性: 一种是根据i 己,吼的近似分类精度,该精度描述当使用知识r 对对象进行分类时, 可能的决策中正确决策的百分比: 州炉喜酬,喜匦 ( 2 1 1 ) 另一种是根据r ,孵的近似分类质量,该质量表示应用知识r 能确切地划入吼类 的对象的百分比: ( 婀) :窆i 甄1 肛i 。 2 1 4 知识的约简及相对约简 ( 2 1 2 ) 定义2 4 令r 为一族等价关系,r r ,如果i n d ( r ) = i n d ( r 一 r ) ) , 则称r 为r 中不必要的,否则称r 为r 中必要的。如果每一个r r 都为r 中必 要的,则称r 为独立的;否则称r 为依赖的。 定义2 5设乒似,4 k ,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论