




已阅读5页,还剩52页未读, 继续免费阅读
(系统理论专业论文)知识的动态推理与识别及知识表达系统的鲁棒性.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山东大学硕士学位论文 摘要 粗糙集理论作为一种处理不精确知识或数据的表达、学习、归纳的理论方法, 由于它在机器学习与知识发现、数据挖掘、决策支持与分析等方面的广泛、成功 的应用而成为当前信息科学等领域的研究热点之一实际系统( 例如金融系统、 风险投资系统、医疗诊断系统等) 的各种问题多为动态的,经典的p a w l a k 粗糙集是 一个静态的粗糙集,对于处理动态问题无能为力,s 一粗集拓展了p a w l a k 粗糙集, 对元素迁移或属性迁移引起的各种动态问题( 如动态数据挖掘、动态知识发现和 系统动态粗特性等) 的研究提供了理论支持 元素迁移与属性迁移、元素动态补充与约简是知识表达系统常涉及到的两个 动态问题元素迁移和属性迁移是s 粗集理论中最基本最重要的概念之一,目前 关于s 粗集的研究均是基于元素迁移或属性迁移的既成事实上,对于其产生的 原因以及对系统的影响的相关研究甚少知识表达系统是各种信息系统的关键, 知识表达系统的元素动态补充和约简的目的是构建一个具有鲁棒性能的知识表 达系统,而目前还没有一个比较令人满意的构建原则可循本文在总结前人工作 的基础上主要作了以下工作: 1 分析元素迁移和属性迁移的原因,利用命题逻辑理论,阐述了当外部因 素干扰系统时,元素迁移和属性迁移的过程,根据干扰效果把干扰因素分为元素 干扰和属性干扰两种类型,给出出元素干扰与系统内部的元素之间的逻辑推理 形式;属性干扰与系统内部的属性之间的逻辑推理形式;在此基础上给出知识的 逻辑推理形式和s 粗集的逻辑推理形式这些结果使得人们能够动态掌握系统 知识的形态变化,识别潜藏在系统中的未知知识、概念;且可以根据冲突理论积 极干扰系统,使系统达到或接近预期的变化这部分的研究为实现系统的动态预 测、动态决策以及动态控制提供了理论依据,是该文的侧重点 2 提出了成熟度、规则重要度和规则频度比的概念,在这些概念的基础上给 出了具有鲁棒性能的知识表达系统的一种构建算法 关键词s 一粗集;元素干扰;属性干扰;知识表达系统;成熟度 山东大学硕士学位论文 a b s t r a c t r o u g hs e t st h e o r y ,a san e wm a t h e m a t i c a la p p r o a c ht ot h ee x p r e s s i o n ,s t u d ya n d i n d u c t i o nf o rv a g u ek n o w l e d g eo rv a g u ed a t a ,h a sb e c o m eo n eo ft h er e s e a r c hf o c u s e s i nt h ef i e l do fi n f o r m a t i o ns c i e n c e s ,f o ri th a sb e e nw i d e l ya n ds u c c e s s f u l l ya p p l i e dt o m a c h i n el e a r n i n g ,k n o w l e d g ed i s c o v e r y ,d a t am i n i n g ,d e c i s i o ns u p p o r ta n da n a l y s i s a n ds oo n p r a c t i c a ls y s t e m ( s u c ha sf i n a n c i a ls y s t e m ,r i s ki n v e s t m e n ts y s t e m ,m e d i c a l d i a g n o s i ss y s t e m ,e t c ) p r o b l e m sa r eo f t e nd y n a m i c ,c l a s s i c a lp a w l a kr o u g h s e ti ss t a t i c a n dh e l p l e s sf o rd e a l i n gw i t hd y n a m i cp r o b l e m s ,s - r o u g hs e t sd e v e l o p e dp a w l a k r o u g hs e t s ,a n dp r o v i d eat h e o r e t i c a ls u p p o r tf o rs o l v i n gv a r i o u sd y n a m i cp r o b l e m s ( s u c ha sd y n a m i cd a t am i n i n g ,d y n a m i ck n o w l e d g ed i s c o v e ra n ds y s t e md y n a m i c r o u g hc h a r a c t e r i s t i c ,e r e ) i n d u c e db ye l e m e n tt r a n s f e r o ra t t r i b u t et r a n s f e r e l e m e n to ra t t r i b u t et r a n s f e ra n de l e m e n td y n a m i ca u g m e n to rr e d u c t i o na r et w o d y n a m i cp r o b l e m si n v o l v e di nk n o w l e d g ee x p r e s s i o ns y s t e m 。e l e m e n tt r a n s f e ra n d a t t r i b u t et r a n s f e ra r et w oo ft h ep r i m a r yc o n c e p t si ns - r o u g hs e t st h e o r y ,b u ta l m o s ta l l t h ec u r r e n tr e s e a r c h e sa b o u ts - r o u g hs e t st h e o r yw e r ep r e s e n t e do nt h ea s s u m p t i o n t h a te l e m e n tt r a n s f e ro ra t t r i b u t et r a n s f e rh a sb e e nm a s t e r e d ,t h er e s e a r c h e sw i t h r e g a r dt ot h er e a s o na n di n f l u e n c eo fe l e m e n to ra t t r i b u t et r a n s f e ra r es c a r c eu n t i ln o w m e a n w h i l e ,k n o w l e d g ee x p r e s s i o ns y s t e mi s ac r u c i a lp a r to fv a r i o u si n f o r m a t i o n s y s t e m s ,t h ea i mo fe l e m e n td y n a m i ca u g m e n to rr e d u c t i o ni s t oc o n s t r u c tar o b u s t k n o w l e d g ee x p r e s s i o ns y s t e m ,b u tu n t i ln o 、,n o n es a t i s f y i n gc o n s t r u c t i n ga l g o r i t h m h a sb e e nf o u n d b a s e do nt h es u m m a r i z a t i o no fp r e d e c e s s o r w o r k s ,t h i sd i s s e r t a t i o n p r e s e n t e dt h er e s e a r c h e sp r i m a r i l ya sf o l l o w s : 1 t h er e a s o n sf o re l e m e n tt r a n s f e ra n da t t r i b u t et r a n s f e rw e r ea n a l y z e d ;t h e nb y e m p l o y i n gt h ep r o p o s i t i o n a ll o g i ct h e o r y , t h ep r o c e s s e so fe l e m e n tt r a n s f e r r i n ga n d a t t r i b u t et r a n s f e r r i n gw e r ea n a l y z e dw h e ns y s t e mi si n t e r f e r e dd y n a m i c a l l yb ye x t e r i o r i n t e r f e r e n c ef a c t o r s ;a c c o r d i n gt ot h ei n t e r f e r e n c ee f f e c t s ,t h ee x t e r i o ri n t e r f e r e n c e f a c t o r sw e r ec l a s s e dt oe l e m e n ti n t e r f e r e n c ea n da t t r i b u t ei n t e r f e r e n c e ;a n dt h e nt h e l o g i ci n f e r e n c em o d e lb e t w e e ne l e m e n ti n t e r f e r e n c e sa n ds y s t e me l e m e n t s ,a n dt h e l o g i ci n f e r e n c em o d e lb e t w e e na t t r i b u t ei n t e r f e r e n c e sa n ds y s t e ma t t r i b u t e sw e r e c o n s t r u c t e d o nt h eb a s i so ft h er e s e a r c h e sa b o v e ,t h el o g i ci n f e r e n c em o d e lo f k n o w l e d g ea n dt h el o g i ci n f e r e n c em o d e lo fs - r o u g hs e t sw e r ep r o p o s e d t h er e s u l t s a b o v ec a nm a k e sp e o p l et om a s t e rt h ec h a n g eo fk n o w l e d g ea n dt or e c o g n i z et h e u n k n o w nk n o w l e d g eo r c o n c e p th i d i n g i n s y s t e md y n a m i c a l l y , m o r e o v e rt o i n t e r f e r e n c es y s t e mp o s i t i v e l ya n dt om a k es y s t e ma p p r o a c ht h ep r o s p e c t i v ec h a n g e t h er e s u l t sa b o v e ,a st h ee m p h a s i so ft h i sd i s s e r t a t i o n ,p r o v i d eat h e o r e t i c a ls u p p o r t i i f o rs y s t e md y n a m i cf o r e c a s t ,s y s t e md y n a m i cd e c i s i o n a n ds y s t e md y n a m i cc o n 仃0 1 2 t h ec o n c e p t so fm a t u r ed e g r e e ,r u l es i g n i f i c a n c ea n dr u l ef r e q u e n c yr a t i ow e r e p r o p o s e d ,a n d t h ec o n s t r u c t i n ga l g o r i t h mf o rr o b u s tk n o w l e d g ee x p r e s s i o ns y s t e m w a s p r e s e n t e do n t h eb a s i so ft h er u l e sc o n s t i t u t e db yt h ec o n c e p t sa b o v e k 哪,o r d s :s - r o u g hs e t s ;e l e m e n ti n t e r f e r e n c e ;a t t r i b u t e i n t e r f e r e n c e ;k n o w l e d g e e x p r e s s i o ns y s t e m ;m a t u r ed e g r e e n i 山东大学硕士学位论文 i v u r u | r i n d m 尺 足( 彳) ,r 一( x ) x , s = 缈,a ,v ,厂) 符号说明 有限非空论域 属性集、二元关系 u 关于等价关系r 的划分 不可分辨关系 对象x 所在的r n d ( r ) 等价类 x 的r 下近似,上近似 x 的补集 信息表其中彳是属性集,y 是属性值域,厂是 u x a 到y 的信息函数 元素迁移或干扰方向 元素迁移簇或干扰方向 元素干扰或属性干扰 受到元素干扰或属性干扰的元素或属性的集合 表示关于集合m “蕴涵”的联结词 表示“或者 的联结词 表示“并且”的联结词 表示“非 的联结词 决策表 】,的成熟度 莎 功 一厂一f 艺 州 力刚尸qv 1 嬲:耄 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进 行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何 其他个人或集体已经发表或撰写过的科研成果。对本文的研究作出重要贡 献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人 承担。 论文作者签名:焦壹蓦 日 期_ 丝! 墨:妊塑 关于学位论文使用授权的声明 本人同意学校保留或向国家有关部门或机构送交论文的印刷件和电子 版,允许论文被查阅和借阅;本人授权山东大学可以将本学位论文的全部 或部分内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手 段保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名:毽! 宣盘导师签名:期:垄盟:丝兰乡 山东大学硕士学位论文 第一章前言 1 1 粗糙集理论的发展概况 经典逻辑中只有真、假二值,但实际上有大量含糊现象存在于真和假二值之 间,因此,长期以来许多逻辑学家和哲学家就致力于研究含糊概念早在1 9 0 4 年, 谓词逻辑的创始人f r e g e g 就提出了含糊( 德文v a g u e ) 一词,并把它归结到边界 线区域,也就是说在论域上存在一些个体既不能在某个子集上被分类,也不能在 该子集的补集上被分类1 9 6 5 年,z a d e h l a 创立了模糊( 用英文词f u z z y 翻译德文 v a g u e ) 集合论,不少理论计算机科学家和逻辑学家都试图通过这一理论解决 f r e g e g 的含糊概念,但模糊集是不可计算的,没有给出数学公式来描述这一模 糊概念,故无法计算出它在边界线上的具体的含糊元素数目2 0 世纪7 0 年代,波 兰学者p a w l a k z 和一些波兰科学院、波兰华沙大学的逻辑学家们一起从事关于 信息系统逻辑特性的研究,正是在这些研究的基础上,p a w l a k z 于1 9 8 2 年针对 f r e g e g 的边界线思想提出了粗糙( r o u g h ) 集( r o u g h 是波兰入对v a g u e 的翻译) , 发表了经典论文r o u g hs e t s 【1 1 ,宣告了粗糙集理论的诞生他把那些无法确认的 个体都归属于边界线区域,而这种边界线被定义为上近似集与下近似集之间的 差集,由于上近似集和下近似集都可以通过等价关系给出确定的数学公式描述, 所以含糊元素数目可以被计算出来,即在真假二值之间的含糊程度可以计算,从 而实现了f r e g e g 的边界线思想粗糙集理论主要兴趣在于它恰好反映了人们用 粗糙集方法处理不分明问题的常规性,即以不完全信息或知识去处理一些不分 明现象的能力粗糙集自提出以来就一直得到z a d e h 的重视,并给予很高评价, 将粗糙集与模糊逻辑、概率推理、信度网络、神经网络、混沌理论、遗传算法及 其他进化优化算法等一起列为他所提倡的软计算的各种基础理论 粗糙集理论作为一种处理不精确、不确定与不完全知识或数据的表达、学习、 归纳的理论方法,到2 0 世纪8 0 年代末才逐渐引起各国学者的关注特别是近来的 十几年中,由于它在机器学习与知识发现、数据挖掘、决策支持与分析等方面的 广泛、成功的应用而成为当前计算机人工智能、信息科学等领域的研究热点之一 在国际上,1 9 9 1 年p a w l a k z 出版了第一本粗糙集学术专著t h e o r e t i c a l a s p e n so f r e a s o n i n g a b o u td a t a 【2 】,系统全面地阐述了粗糙集理论,给出了严密 的数学定义和表达;1 9 9 2 年出版了粗糙集理论的应用专辑,总结了当时的粗糙集 山东大学硕士学位论文 理论和应用1 9 9 2 年,第一届关于粗糙集理论的国际学术研讨会在波兰召开;自 1 9 9 2 年开始至今每年都召开以粗糙集为主题的国际会议,国际上成立了粗糙集 学术研究会;1 9 9 5 年,a c mc o m m u n i c a t i o n 将粗糙集列为新浮现的计算机科学的 研究课题;1 9 9 8 年,国际信息科学杂志( i n t e r n a t i o n a lj o u r n a lo fi n f o r m a t i o n s c i e n c e s ) 为粗糙集理论的研究出了一期专辑;2 0 0 4 年,国际粗糙集协会主办的第 一本粗糙集国际期刊a d v a n c e si nr o u g hs e t s ) ) 出版发行;波兰华沙大学、工业 大学、信息技术与管理大学和加拿大r e g i n a 大学和s t m a r y 大学、英国e d i n b u r g h 大学、u l s t e r 大学和c a r d i f f 大学、意大$ 1 j c a t a n i a 大学、印度统计研究院、美国s a n j o s e 州立大学等对粗糙集理论有着深入研究在国内,第一届粗糙集与软计算学 术研讨会于2 0 0 1 年在重庆邮电学院召开;从2 0 0 1 年开始由中国计算机学会和人 工智能与模式识别专业委员会主办,每年召开一届粗糙集与软计算学术研讨会 中国人工智能学会于2 0 0 3 年正式成立粗糙集与软计算专业委员会;目前,国内研 究粗糙集的学者也越来越多,如曾黄麟、王国胤、刘清、张文修、史开泉等曾 黄麟、王国胤、刘清、张文修、史开泉等先后出了关于粗糙集理论的多本专著【3 。刀; 该理论的主要研究人员大多来自计算机科学领域,也有来自信息科学、数学、系 统科学、管理科学、控制科学等领域的学者从研究地域来看,欧洲国家比较注 重理论研究,北美学者比较注重应用,日本在粗糙集和概率论相结合方面以及在 医学的应用比较突出,我国在知识约简、与信息论的结合、粗糙逻辑、粒计算、 知识的不确定性研究方面取得了较大成功 在粗糙集的研究上,有两个主要的方向,一个方向是将粗糙集作为数学的研 究范畴和领域,把粗糙集当作一种纯粹的数学方法,侧重于构造粗糙集的数学理 论体系主要有以下几个方面: ( 1 ) 粗糙集的数学性质研究方面,包括粗糙集的代数结构和拓扑结构等,与 数学理论的结合使得一些新的概念己经出现,如“粗糙理想”和“粗糙半群”等 ( 2 ) 粗糙集理论拓展的研究,包括: a 关系的推广,如基于相似关系的粗糙集模型,基于一般二元关系的粗糙 集模型,另外将对象所在的等价类看作该对象的一个邻域,从而推广导出基于邻 域算子的粗糙集模型;结合模糊集理论将粗糙集理论进行拓展,如将普通关系推 广成模糊关系或模糊划分而获得模糊粗糙集模型 b 变精度粗糙集和概率粗糙集模型等 另外一个方向则是将粗糙集理论作为人工智能和知识发现的一种实用技术, 2 山东大学硕士学位论文 与其它软计算方法相联系与融合( 包括与模糊集、证据理论,人工神经网络和遗传 算法等) ,运用到生产生活中的各个方面涉及的主要研究内容包括:粗糙集理论 的系统化粗糙集的非参数统计建模和定量分析( 包括专家系统与智能系统) 、基 于粗糙集的非精确推理、粗糙控制理论及系统开发、寻找粗糙集的约简算法等 本文给出的关于粗糙集理论基本概念的描述主要来自于文献【3 1 0 1 2s 一粗集理论的发展概况 从p a w l a k 粗糙集( 足僻) ,r 一) ) 的结构中,我们能够得到下面的事实:如果 给定元素集合xcu ,等价关系r ,则粗糙集( r 一( x ) ,r 一( 彳) ) 就确定,不允许x 之内的元素x 迁移到石之外,也不允许x 之外的元素z 迁入到x 之内我们能 够说:p a w l a k 粗糙集是具有静态特性的集合x 的粗集,或者说p a w l a k 粗糙集是一 个静态粗糙集在工程、经济、金融诸多系统中,人们遇到的集合x ( 信息集合) 多是动态的,经典的p a w l a k 粗糙集对于处理动态问题无能为力 考虑到现实中的问题多为动态的,史开泉教授分析了当讨论的对象集合存 在元素迁移时所产生的问题,于2 0 0 2 年首次在国际上提出奇异粗集( s i n g u l a r r o u g hs e t s ,简称s 粗集) 【l l 】理论;继而分析了当元素论域的属性集存在属性迁移 所产生的问题,提出变异奇异粗集( v a r i a t i o no fs - r o u g hs e t s ,简称变异s 粗集) 理 论 1 2 - 1 3 s 一粗集有三种形式,见文献 7 ,1 4 ,1 5 3 礅 1 6 3 0 给出了关于s 粗集特性 及其分解还原【1 6 朔、遗传【1 鼬o l 、记忆c 2 l - 2 3 1 、知识过滤 2 4 1 、知识分离【2 5 1 特性; 2 6 3 0 】 给出了知识发现和识别的应用 s 粗集对于动态数据挖掘、动态知识发现和系统动态粗特性的研究提供了理 论支持,它们可以与其他学科,例如与系统分析、生命科学、系统管理、经济系 统等交叉、渗透,对于变幻莫测的金融系统,风险投资系统,系统故障预警分析 等有重要的应用价值 1 3 本文的研究内容和结构安排 s 粗集最主要特性就是其动态特性,表现为集合中的元素( 或属性) 以某种方 式迁入或迁出,亦即元素迁移( 或属性迁移) 元素迁移对s 粗集理论的建立起着 至关重要的作用但至今关于元素迁移( 或属性迁移) 这一概念的研究,只是给出 了其公理化定义,目前对s 粗集的研究均是落在元素迁移与属性迁移的既成事 实上,而没有深究引起元素迁移和属性迁移的原因及其对系统的干扰过程,而在 山东大学硕士学位论文 实际应用中,这是不可避免的首要解决的问题,因此需要对其进行深入探讨,这 是本文研究的主要内容之一,其主要研究工具是命题逻辑理论 智能信息处理是当前信息科学理论和应用研究的一个热点领域,随着过去 几十年中人们在专家系统、知识工程、人工神经网络、模糊集合等众多领域的不 断实践和探索,取得了很多很好的成绩信息表知识表达系统是智能信息系统的 关键和基本组成部分,因此建立一个对可能出现的数据或规则覆盖程度较高、规 则比较稳定的信息表知识表达系统是十分重要的目前还没有一种方法对知识 表达系统的这些性质( 知识表达系统的鲁棒性) 作过探讨,这是目前关于知识表达 系统研究的一个缺憾,也是本文致力探讨的另一个主要内容 本文结构安排如下: 第一章前言,主要介绍粗糙集理论、s 粗糙集理论的发展概况 第二章粗糙集、s 粗集与命题逻辑理论基础,主要介绍粗糙集理论中的不 可分辨关系、近似集、知识库与知识表达系统、决策表等概念;s 粗集理论中的 元素迁移、单向s 粗集、双向s 粗集、单向s 粗集对偶等概念;命题逻辑中的 命题、联结词、合式公式、真值函项、命题演算的自然推理系统、命题演算的公 理系统等基本概念这些内容为后续章节做好了铺垫 第三章s 粗集知识的动态推理与识别,主要给出元素干扰和属性干扰的概 念;研究了系统的元素干扰与系统内部关系因子之间的逻辑推理、系统的属性干 扰与系统的属性集之间的逻辑推理;研究了元素干扰和属性干扰与系统知识以 及s 粗集之间的逻辑推理关系;给出了应用 第四章具有鲁棒性能的知识表达系统,给出信息表知识表达系统的成熟 度、规则频度比、规则重要度的概念,指出这些概念在知识表达系统中的重要性, 并给出了根据这些概念构建具有鲁棒性能的知识表达系统的算法 第五章论文的总结和展望 4 山东大学硕士学位论文 第二章粗糙集、s 一粗集与命题逻辑理论基础 2 1 集合理论【4 , s l 集合是现代数学和逻辑学的基本概念之一在上个世纪里,关于集合的理论 一集合论,对现代数学和逻辑学的发展产生了巨大的影响,今天它已成为数学和 逻辑学的一种基础理论集合论的发展、集合的定义和集合的代数运算见文献 4 】 下面重点介绍集合的二元关系 定义2 1 两个元素a ,6 组成的序列记做( 口,6 ) ,称作二元组或序偶 定义2 2 集合彳,b 的笛卡儿乘积记为a x b ,它是二元组集 ( 口,b ) i 口a , b b a xb 的子集叫锨到b 的一个二元关系 关系是一个集合,若月是一个关系,( 口,b ) r 记为a r b ,读做a 和b 有关系r 定义2 3 给定集合a = q ,a 2 ,) 和b = 6 l ,6 2 ,吃) 及一个眦到b 的二元 关系尺,称鸠= 【 是关系r 的关系矩阵,其中: 乃= 器掌 亿, 这里:f = 1 ,2 ,朋,= 1 ,2 ,以 定义2 4 设关系天是集合4 到集合彳的二元关系如果对于v a a ,有( 口,口) r ,则称剐勘上的自反关系;如果对于v a ,b a ,有( 口,6 ) r ,同时( 6 ,口) r , 则称尺翮上的对称关系;如果对v a ,b ,c a ,有( 口,b ) r 和( 6 ,c ) r ,则称尺黝 上的传递关系 定义2 5 设r 是集锄上的二元关系,如果它是自反的,对称的和传递的,则 它勘上的等价关系 定义2 6 设r 是彳上的一个等价关系,对每一个口a ,口关于r 的等价类是集 合 x lx r a ,x a ,记为【口】尺,简记为 a 】,称口为等价类 口】的表示元素 定义2 7 给定非空集御和非空集合簇s = a 1 ,4 ,厶) ,如果 1 a = u4 ; l i l 2 4n 4 = 矽或者4 = 4 ( f ,j = 1 ,2 ,聊) 则称集合簇s 为彳的一个划分 定理2 1 谢是非空集合,r 黝上的等价关系,r 的等价类集合 口】ri 口椰 山东大学硕士学位论文 黝的划分 2 2 知识库与信息表知识表达系统【4 j 通常,我们在对现实问题进行处理时,会将讨论的现实个体( 或元素、对象、 样本) 局限在某一个特定的区域范围之内,这个区域内的所有个体就组成问题的 论域u 给定论域u 和等价关系r ,在等价关系r 下对数据集合u 的划分,称为 知识,记为u r u 上的一簇划分( 对u 的分类) 称为关于u 的知识库关于u 的 一个知识库也可以理解为一个关系系统k = ( u ,r ) ,其中u 为论域,r 是u 上的 一个等价关系根据不同的等价关系就可以对u 进行不同的划分,每种划分将把 u 分为不同的子集( 范畴、基础类) 设u 是一个论域,r 是一个等价关系u r 表示u 上由r 导出的所有等价 类,【x 】j 。表示包含元素x 的r 的等价类,x u 一个知识库就是一个关系系统 k = ( u ,1 1 2 ) 如果尸r 且p 痧,则n 尸( 尸的所有等价关系的交) 也是一个等价 关系,记作i n d ( 尸) 定义2 8 设k = ( u ,p ) 和k = ( u ,q ) 是两个知识库,如果i n d ( 尸) = i n d ( q ) , 则称足和墨( 或尸和q ) 是等价的,记作k 兰q ( 或p 兰q ) 知识库k 和墨等价,意味着k 和k 具有相同的基础类,因而它们具有相同 的表达能力, 在实际应用中对知识进行表达和处理时,知识需要一种可行的、有效的、通 用的原则和方法来表示一知识表示方法目前,常用的知识表示方法有逻辑模式、 框架、语意网络、产生式规则、状态空间、剧本等下面介绍一种基于信息表的 知识表达系统,它是粗糙集理论中对知识进行表达和处理的基本工具 在粗糙集的研究中,一个实例( 现实世界中的一个研究对象、个体) 经常使用 属性一值对的集合来表示,实例集就是这样的实例集合,记为u u 可被划分为 有限个类五,五,瓦,使得 五u ,五痧,置nx ,= 矽( f j ) ( f ,j = l ,2 ,z 且u 置= u ) 信息表知识表达系统的基本组成成分是研究对象的集合,关于这些对象的 知识是通过指定对象的属性( 特征) 和它们的属性值( 特征值) 来描述一般的,一 个信息表知识表达系统s 可以表示为s = 这里,u 是一个非空有限对象集合,也称为论域,u = ,x 2 ,( ,) ,尺 = c u d 是属性集合,子集c 和d 分别称为条件属性集和决策属性集,v = u 而 6 山东大学硕士学位论文 是属性值的集合,形表示属性,r 的属性值范围,即属性,的值域,f :u xg 专v 是一个信息函数,它指定u 中每一个对象x 的属性值:v r 尺,x u ,f ( x ,) 以 信息表知识表达系统也称为信息系统,通常用s = ( u ,r ) 来代替s = ( u ,r ,v ,厂) 在本文中,信息表知识表达系统简称为知识表达系统 为了直观方便,u 也可以写成一个表,纵轴表示实例标记,横轴表示实例属 性,实例标记与属性的交汇点就是这个实例在这个属性的值这个表称为信息表, 是表达描述知识的数据表格,是对客观现象的描述和罗列 对于属性集r ,我们定义一个不可分辨二元关系( 不分明关系) i n d ( r ) ,即 i n d ( r ) = ( 毛y ) i ( x ,y ) u 2 , v r r ,( ,- ( z ) = ,( j ,) ) ) 显然,i n d ( r ) 是一个等价关 系,且 i n d ( b ) = f1 i n d ( ,) ) ,e 日 无决策的数据分析和有决策的数据分析是粗糙集理论在数据分析中的两个 主要应用,一般的,信息表用于无决策的数据分析,而决策表用于有决策的数据 分析 决策表是一类特殊而重要的信息表知识表达系统,也是一种特殊的信息表, 他表示当满足某些条件时,决策( 行为、操作、控制) 应当如何进行 一个决策表是一个信息表知识表达系统s = ( u ,r ,v ,厂) ,r = c ud 是属性 集合,子集c 和d 分别称为条件属性和决策属性,且d 条件属性c 和决策属性d 的等价关系i n d ( c ) 和i n d ( d ) 的等价类分别称为 条件类和决策类 2 3 不精确范畴、近似与粗糙集【4 5 】 粗糙集理论是建立在分类机制的基础之上的,它将分类理解为在特定论域 上的等价关系,而等价关系构成了对该论域的划分粗糙集理论将知识理解为对 论域划分的结果,每一被划分的集合称为概念它的主要思想是利用已知的知识 库。将不精确或不确定的知识用已知的知识库中的知识来近似刻画 令x 【,r 是u 上的一个等价关系当确皂表达成某些尺基本范畴的并时, 黼r 可定义的;否则黼r 不可定义的r 可定义集是论域的子集,它可以在 知识库中精确的定义,而r 不可定义集不能在知识库中精确定义尺可定义集也称 为r 精确集,而r 不可定义集也称为只非精确集或者r 粗糙集 7 山东大学硕士学位论文 对于粗糙集可以近似的定义,我们使用两个精确集,即粗糙集的上近似 ( u p p e ra p p r o x i m a t i o n ) 和下近似( l o w e ra p p r o x i m a t i o n ) 来描述 给定知识库k = ( u ,r ) ,r 是等价关系,对于子集x u ,定义两个子集: 足( x ) = u r u ri 】,彳 ,r 一( x ) = u r u rj 厂n z 办 ( 2 2 ) 分别称它们为瑚r 下近似集和r 上近似集 下近似,上近似也可以用下面的等式表达: 足( x ) = 仁uf x k x ) ,r 一( x ) = 缸ui z 】rn x 矽) ( 2 3 ) 此外,我们还可以从上下近似的概念中得到下列三个子集: p o s r ( x ) = 足( z ) ,n e g r ( x ) = u 足( x ) ,b n r ( x ) = r 一( x ) 足( x ) 其中,p o s 。( x ) 称为瑚r 正域,它表示那些对于知识r 能完全确定属于集合 确对象的集合;n e g r ( x ) 称为确尺负域,它表示那些对于知诎能完全确定不 属于集合彳的对象的集合;b n r ( x ) 称为蹦尺边界域,是那些根据知识r 既不能 判断肯定属于双不能判断肯定属于伽帅的元素组成的集合 定理2 2 设x 矽是u _ h 的集合,r 是u _ k 的等价关系,则 ( 1 ) 肋r 可定义集当且仅当足( x ) = r 一( x ) ( 2 ) 助r 粗糙集当且仅当足( x ) 只一( x ) 我们也可将足( x ) 描述为x 中的最大可定义集,将r 一( x ) 描述为含有哟最 小可定义集 集合的不精确性是由于边界域的存在而引起的集合的边界域越大,其精确 性越低为了更准确地表达这一点,给出如下的近似精度的定义: ( 耻掣c a r d ( 黑 ( 2 4 ) k 五j 这里,c a r d ( x ) 表示集椭基数 近似精度表示利用等价关系尺对概念进行描述的精确程度显然,掀和 x u 有0 ( x ) 1 当a r ( x ) = 1 时,椭尺边界域为空集,集锄r 可定义的; 当( x ) 1 时,集厶贿非空r 边界域,集合劝r 不可定义的 表示集合的不精确性的另一种等价形式是粗糙度,定义为: p r ( x ) = 1 - a r ( x ) ( 2 5 ) 近似精度和粗糙度在基于粗糙集的应用中是两个重要的定性分析尺度 评价一个划分的分类效果时有两个评价标准,分别是近似分类精度和近似 分类质量令驴= 五,五,) 是吐的一个划分,这个分类独立于知识r 子集 山东大学硕士学位论文 五( f = l ,2 ,z ) 是划分驴的类则根据r ,驴的近似分类精度、近似分类质量分 别定义为: 缈) = n f = 1 坩 ,= l c a r d ( r _ ( 置) ) c a r d ( r 一( 置) ) z c a r d ( r _ ( x , ) ) , ( 驴) = 生c 丽a r du ( 2 6 ) i) 近似分类精度描述了当使用知识尺( 用r 确定的对啪一个划分) 时,所有决策 中正确决策的百分比;近似分类质量表示的是应用知识月能确定地划入驴类的对 象的百分比 2 4 决策表与决策规则【4 6 1 决策表是一类特殊而重要的知识表达系统,在决策表中,不同的条件属性可 能具有不同的重要性为了找出某些属性的重要性,可以从表中去掉一些属性, 再来考察没有该属性后分类的变化程度若去掉该属性相应分类变化较大,则说 明该属性重要性高,反之,说明该属性重要性低 定义2 9 设驴是决策属性集d 导出的分类,属性子集c ( c c ) 在属性集c 中的重要性定义为 c r ( c ) = 您( 驴) 一y c - - c ,( 驴) ( 2 7 ) 在决策表中,最重要的是决策规则的产生,下面我们就来对决策规则进行形 式化的描述 定义2 1 0 设s = ( u ,r ,y ,厂) 是一个决策表,r = c ud ,c a d = ,其中c 为 条件属性集,d 为决策属性集令五和r 分别代表u c 与u d 中的各个等价类, d e s ( x 1 ) 表示对等价类五的描述,即等价类置对于各条件属性值的特定取值; d e s ( y ) 表示对等价类巧的描述,即等价类对于各决策属性值的特定取值则 决策规则定义如下: 吩:d e s ( x i ) - - yd e s ( y j ) ,巧n 五 ( 2 8 ) 定义2 1 1 给定决策规则:d e s ( x t ) 专d e s ( y ) ,弓n 五矽,则其可信度( 确定 性因子) 定义为 ( 五,艺) = c a r d ( y jn 五) c a r d ( x ,) ( 2 9 ) 这里,o - ( 置,) 1 u ( x , ,弓) = 1 时,乃是确定的;当o ( z ,y j ) 中,则有属性迁移 厂,它用下面的式子表示: j 层矿,层毛口j 厂( 局) = 耐口 ( 2 1 3 ) 显然有: 口l ,口2 ,口i ) c 口l ,口2 ,口i ,厂( 屈) 口c 口u ( 屈) 定义2 1 5 设石= z l ,x 2 ,x m ) cu 是元素集合,a = ,吼 cr 是 x 的属性集合,】,: y 。,y 2 ,y 卅) 是x 的特征值集合,称 a ,6 】是y 生成的特征 值区间,而且 弘脚,b :舞( 乃) w yy + (214)win(y,)by j r 弘,= 哗( 乃) ,f ,+ ( ,2 对于元素x ,x ,如果存在变换7 户,使得歹( 儿) 乏 口,6 】,则有而乏x ;变 换7 卢称作元素迁移,它用下面的式子表示: xj7 ( 黾) - u 五g x ( 2 1 5 ) 这里:y 工是屯的特征值,y 五尺+ 显然有x 一 7 ( 以) ) = x 7 ( 巧) ) c z 定义2 1 6 ,z 个元素迁移z 构成的集合f ,f 称作元素迁移族,而且 户= z ,元,z 把定义2 1 5 ,2 1 6 的概念应用到属性集口= 口。,口:,吼) 中,则
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年统计学专业期末考试:抽样调查方法与抽样调查数据挖掘结果可视化方法试题
- 2025年中学教师资格考试《综合素质》教育教学能力高效教学试题卷(含答案)
- 2025年安全生产考试题库:事故案例分析及应急救援试题
- 2025年护士执业考试题库-护理伦理学专项与模拟试题
- 2025年医保政策调整与医疗保险报销条件考试题库试卷
- 2025年大学统计学期末考试题库:统计图表制作与应用试题
- 2025年统计学专业期末考试:数据可视化在产品研发中的应用试题
- 2025年护士执业资格考试内科护理学专项护理教学试题
- 2025年大学统计学期末考试题库:数据可视化在生物学中的应用试题
- 2025国际货物销售合同范本(简易)
- 电梯安全总监培训记录课件
- 2025四川省水电投资经营集团有限公司所属电力公司员工招聘6人备考模拟试题及答案解析
- 房地产中介居间服务合同5篇
- 童话中的英雄勇敢的小矮人作文10篇范文
- 康复科的科室介绍
- 公安校园欺凌课件大纲
- 人教PEP版(2024)四年级上册英语全册教案(单元整体教学设计)
- 2025年江苏省南京市中考历史真题卷含答案解析
- 2025-2026学年浙教版小学劳动技术一年级上册教学计划及进度表
- 甲状腺疾病课件
- 数控滚齿机操作指导手册
评论
0/150
提交评论