(机械制造及其自动化专业论文)粒度计算及其在机械故障诊断中的应用.pdf_第1页
(机械制造及其自动化专业论文)粒度计算及其在机械故障诊断中的应用.pdf_第2页
(机械制造及其自动化专业论文)粒度计算及其在机械故障诊断中的应用.pdf_第3页
(机械制造及其自动化专业论文)粒度计算及其在机械故障诊断中的应用.pdf_第4页
(机械制造及其自动化专业论文)粒度计算及其在机械故障诊断中的应用.pdf_第5页
已阅读5页,还剩46页未读 继续免费阅读

(机械制造及其自动化专业论文)粒度计算及其在机械故障诊断中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士论文 摘要 粒度计算是随现代信息处理技术发展而出现的一种新的数据分析概念和计算范式, 目前它已经成为模糊的、不完整的、不精确的和海量的信息处理的重要工具和人工智能 领域研究的热点之一。粒度计算几乎覆盖所有有关粒度的理论、方法、技术和工具的研 究内容,是以模糊集为基础的词计算理论、粗糙集理论和商空闯理论的超集,也是软计 算科学的一个分支。本文主要研究了粒度计算理论中的粗糙集理论和商空间理论在旋转 机械故障诊断中的应朋方法。旋转机械的故障诊断经过多年发震,在现场积累了大量的 数据,本文以从数据中获取诊断规则和对机械故障进行辨识为目的,探讨了将粒度计算 引入到旋转机械的故障诊断领域,得到的主要结论如下: 1 ) 介绍了粒度计算理论的基本原理和三种主要的粒度计算模型,重点阐述了其中 的粗糙集理论和商空间理论,对三种粒度计算模型之间的关系加以介绍,并指 出了粒度计算的一些基本问题。 2 ) 提出了一种改进的划分式离散化算法。该改进算法由数据本身确定划分距离, 故可减少机械故障决策表因离散化而造成的误差。 3 ) 对基于粗糙集理论的诊断规则提取问题进行了研究,重点研究了机械故障决策 表的属性约简闻题,在对基于粒计算的属性约简算法进行分析的基础上,指出 该算法的缺陷,并应用属性相关度的概念对算法进行了改进。 4 ) 基于商空间理论的转子故障辨识结果表明,在粗粒度空闻中不同故障种类的时 域波形图骧显不同,故仅从时域波形就可将故障种类区分开来。并且提出以商 结构【刀值作为故障的量化特征值,为量化特征提取提供了一种新的思路。 粒度计算理论是一个正处于发展中的理论,如何更好将其应蠲在故障诊断领域,是 今后研究的重要方向。 关键词:故障诊断;粒度计算;属性离散化;属性约简;特征提取 本文得到甘肃省翻然科学基众项目( 3 z s 0 4 2 - b 2 5 m 2 5 ) 、甘肃省科技攻关计划( 2 i g s 0 诈a s 舢5 m 2 ) 搬助 i 硕士论文 a b s t l a c t u l a fc o m p u 纽gt h e o 翠i san e wc o n c c p ta n dc 抽陇l a 芏i o 魏m o d e lo fi 芏l _ f o f 懋缴i o n p f ) c c s s i n g i ti sa h o ti s s u ei n 德e 蠡e l do fa i t i i a li n t e l l i g e n c e ,a n db e c o m e s 强i 瑚【p o r t 勰t t o o lo fp r 0 s s i i l gm a s s i v e ,i l l c o m p l e t e ,呻r e c i s e ,蛆d i l l e 百b l ei n f o m a t i o n g r a i l u l a r c o 礅胛妇g 壤e o f yc o v e f sm o s lo ft 董l ec o n c e p l 瑟d 糟s e 砌c o n c e m s 掣翘u l 弧舡a 蠡l 主a t i o no f s o f t _ c o m p u t i n g ,i tc o m b i n e sc 0 m p u t i n gw i t hw o r d st h e o r y q u o t i e n ts p a c et h e o r y 觚dr o u g h s e 终l h e o 谬硼嫩f c s e a k 魏m 蠹醚ys 趣蠢e d 疆e 珏s eq f l l l 勰m p 攘i 魏g 壤巧勰d 唾毽o | 主c 躐 s p a c et h e o r yi l ld i a g n o s i n gr o t a r ym a c h i n e r yf a u l t t h e r ca r en 哪e r o u sd a t ao fd i a g n o s i n g r o l a r ym a c h i 黼f yf a u l la 湖m l l l a t e dd u 幽gt h ed 钾e l o p m e 毅t 醴t k s 把浊n i q u e 。b ya n a l y z i n g t h o s ed a t a ,t h i sr e s e a r c ha j m e dt od i 虢r e n t i a t ea n dr c g u l a t et h ef a u l td i a 弘0 s i su s i n gt h e 乎a n u l a rc o m p u t i n gt h e o r y m a i nc o n t r i b u t i o n sa r e : 1 ) 珏昀d l l e el 魏eb a s i sc o 藏c e p to f 黟跹l l l a f m p u t 主l l g 也f y ;d e s c 矗融e 穗el h f e e 越鑫主n 争a n u l a u rc o m p u t i i l gm o d e l sa n dt h e i rr e l a t i o n s h i p s ;e m p h a s i z et h er o u g hs e t st h e o r y 醒d 印瀵i e 燃印a c c 也e o 翠;p q 溉跚ls o 越e & 纛d a 越e 珏l 采驴o s 基。鲻醴蓼躲糕l 越 c o m p u t i n g 2 ) d e s i j 萨翘蜀c v 主s e dd m s i o nd 主s c 啾i z a 量i o 魏c 俎l a l i o n 。i n 邀则i s e d 黻e m o dd 撕d e t h ep a n i t i o nd i s t a n c eb a s e do nt h ed a t ai t s e l f ,i no f d e rt 0r c m l c et h ee r r o rc a u s e db y d i s c t i z i n gr o t a f ym a d h i n e r yd e c i s i o nt a b l e 3 )s t u d y 氇e 翘u l ld i a 酗o s i n gf c 韶l a l i o nb 舔e do 珏f o 毯曲s e t s 也e o f y ,m a 主n l yr e s e a r c h t h ea t t r i b u t er e d u c a t i o no fm a c h i n em a l n i n c t i o n p o i n to u tt h el i l n i t a t i o no fa t t r i b u t e f e d 毽鼹l i o n 糙p 轻l 诬g 舶毽a 黟雒珏l 越砷硎v e ,瓤通蠢驴v e 也i s 越p 毛l l 纽gb y u s :i i l gt h ef e a t u r ec o r r e l a t i o ni n d e xc o n c c p t 婶 b a s e do nt h e 忿s u l to fq u o 蛙e 藏l 蹲a e e 攮翠i d 弧遗c 醵i o no fr o l a 黟细l 敏毫h c t i m e d o m a i nw a v eo fv a r i o u sf a u l ta r cs i g i l i f i c a n t l yd i a c r c n ta tr o u 曲铲柚u l a r i t y s p a c e , s ow ec o u l dd i s t i n g l l i s ht h ed i 虢r e n tf a u l tb ys p e c 谶cf e 乎o nw a v e ,a n dt h i s f e s e a 嘲lu s e dq u o t i e 珏t 【习a st h ef 如l lq l l 褥t i t a t i v e 绝a l l l r e ,p m v i d ca 簸e wm e t h o do f q u a n t i t a t i v ef c a t u r e g 凇醢l 瑟m p “n g 谯e o 咎主s 鑫d 嚣e l 霹妇g 壕鹅怒钷站羚s e 雒hs k 腿l d 溉s 潍 b e t t c ru s a g ei i lf a u l td i a g n o s i s 】目对w o r d s :】豫u i td i a g n o s i s ; g i 犍n u i a ri c :o m p u 触g ; d i s c r e t 主z 主n ga t t r i b u t i o n ;a t t 以b l l t er 烈薹u 魏蜢d 粥 f e a t i n te x t r 箍c 髓o 兰州理工大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所 取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任 何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡 献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的 法律后果由本人承担。 作者签名:求孽鸟魄2 ,骼乡月7 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即: 学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许 论文被查阅和借阅。本人授权兰州理工大学可以将本学位论文的全部或部 分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段 保存和汇编本学位论文。同时授权中国科学技术信息研究所将本学位论文 收录到中国学位论文全文数据库,并通过网络向社会公众提供信息服 务。 作者签名: 导师签名: 日期:1 - ,o 罾年 日期:p 牌 日日 9厂 月月 硕士论文 第1 章绪论 1 1 选题背景 随着科学技术的进步与发展,现代机械设备日益向大型化、连续化、高速化、高效 化、精密化和自动化的方向发展。现在机械系统有以下几个特点:1 ) 机械系统的功能 增多,各工作单元间的关系日趋复杂,导致影响设备安全和工作性能的因素越来越多; 2 ) 机械系统的结构越来越复杂,规模越来越大,设备的造价越来越高;3 ) 现代机械系统 日益向系统极限效率与速度方向发展,安全隐患增多,使得一旦发生机械故障,则连锁 影响造成的损失十分惊人:现代机械系统在国民经济的发展和社会物质财富的生产 中,扮演着越来越重要的角色,其影响面越来越大【。特别是旋转机械,作为石化、电 力、冶金等行业的关键设备,一旦发生故障,将造成巨大的损失,如1 9 8 5 年镇海石化 总厂机组转子毁坏,事故的损失达数千万元,1 9 8 5 年大同电厂2 号机组,1 9 8 8 年秦岭 电厂5 号机组转子损坏,事故的经济损失各达一个亿左右。故加大对故障诊断技术研究 的力度,特别是对旋转机械的故障诊断技术的研究,有着重要的现实意义和经济价值1 2 , 3 】 o 目前旋转机械普遍安装有各种类型的监控系统,积累了大量的现场数据,而这些数 据中蕴涵有丰富的关于机组故障的诊断资源。本文正是本着如何从大量的数据中提取诊 断知识,提高智能诊断水平为出发点,重点研究了粒度计算在诊断规则提取和对机械故 障进行辨识的方法。 1 2 国内外研究现状 自1 9 6 7 年,在美国宇航局的倡导下,由美国海军研究室住持创建的机械故障预防 小组( m f p g ) ,标志着机械故障诊断进入了有计划的研究和应用阶段以来,国内外对该 领域进行了大量的研究【4 1 。国外如英国的机器保健中心,丹麦的b k 公司,美国的b e n t l y 公司等研制的成套状态监测与故障诊断产品,在冶金、化工、宇航等领域得到了广泛的 应用。国内的故障诊断研究始于7 0 年代末,经过二十多年的发展,取得了一系列的研 究成果并成功的应用于生产实际,如西安交通大学研制的“大型离心式压缩机组在线监 测和故障诊断系统”;清华大学研制的“福建省水电机组状态监测与诊断系统 、“广州 黄埔发电厂3 0 0 m w 机组振动监测及诊断系统 ;华中科技大学研制的“基于w 曲的精 轧f 2 在线监测与故障诊断系统 和“3 0 0 m w 气轮发电机组状态监测与故障诊断专家系 统”等【2 ,3 j ,特别是深圳的创为实公司,开发的状态监测与故障诊断系统s 8 0 0 0 ,已经在 国内石化、电力等多家大型企业得到了广泛的推广应用,取得了十分明显的经济效益和 社会效益【5 1 。 到目前为止,机械故障诊断技术已经成为了一种综合技术,它涉及数学、物理、机 械、电子、计算机、数字信号处理和人工智能等学科,是一个快速发展的交叉学科【“ 7 1 。特别是人工智能引入到故障诊断领域,解决了很多工程实践的难题。如德国的故障 粒度计算及其在机械故障诊断中的应用 诊断专家e m & 鞠k 认为l 羽,故障诊断方法可以划分为基于知识的方法、基于解橇模型 的方法和基于信号处理的方法三种;美国的v e n k a t a s u b r a m a i l i a n 教授则根据所使用的先 验知识类型进行故障诊断方法的分类,分为1 9 d 玎:基于定量模型的方法、基于定性模型 的方法、基于过程历史的方法;我国故障诊断专家屈梁生院士指出:机械故障诊断问题 的实质是模式识别问题,即故障模式的识别与分类问题【1 2 l 。通过三位专家对故障诊断方 法的认识,即“基子知识的方法,基予历史过程的方法、模式识别问题 ,其中都包含 着一个共性的结论,即说明人工智能技术在故障诊断研究中发挥的重要作用。 1 3 智能故障诊断技术在工程应用存在的问题分析 自从研究神经网络开始,人们对人工智能阂题进行了大量的研究并将相关理论引入 到机械故障诊断领域,取得了卓有成效的成果。基于人工智能故障诊断的研究主要分为 两类【7 ,1 3 】: 一、基于神经网络的故障诊断。神经网络是试图模拟生物神经系统而建立起来的自 适应非线性动力学系统,具有可学习性和并行计算能力,可以实现分类、自组织、联想 记忆和菲线性优化等功能。神经网络用于故障诊断领域,可以解决趋势预测和诊断推理 问题。其中,诊断推理可以理解为根据特定的映射关系由故障征兆域到故障原因域的计 算求解闻题。对于复杂的规械系统丽言,这种映射关系一般为菲线性的。盘于神经网络 可以对各种映射进行有效的逼近,因此可以用其解决诊断推理问题。其存在着的问题: 1 ) 训练样本获取困难,2 ) 忽视了领域专家的经验知识,3 ) 连接权重形式的知识表达方式 难子理解。 二、基于知识( 符号推理) 的故障诊断。基于知识故障诊断大致经历了两个发展阶段: 基予浅知识( 规荧l _ ) 的专家系统和基于深知识( 模型知识) 的专家系统。专家系统是一种人 工智能软件系统,利用领域专家的经验知识,根据用户给出的关于问题的信息数据、按 照一定的推理杭铡,从知识库中选择对于闯题的最合理的解释。其主要缺点是:l 、领域 专家的知识主要依靠知识工程师人工移植,“知识瓶颈 问题难于解决,2 ) 系统只能局 限在相当窄的领域内,依靠的主要是浅知识,缺乏常识,即“知识窄台阶闯题;3 、 推 理方式与策略不灵活,缺乏适应性,易产生“组合爆炸、“无穷递归”等问题;钔智能 水平低,缺乏自组织、自学习、联想记忆和类比推理等功能;5 ) 对结构性很差的知识难 以表达和处理;国实时在线诊断性能差。 王4 数据库知识发现与粒度计算 文献【1 4 】全面回顾和总结了故障诊断领域知识发现的过程,并将其总结为三个阶段 1 1 4 l :董、完全“人工”方式;2 、借助知识表达模型接口方式;3 、通过机器学习获得机 器智能方式。但三种知识发现方式存在的问题是,迄今为止关于专家知识的提取与利用 方式始终是一种事后的、集中的知识抽取与利用方式,故目前仍存在着难以达到专家水 平、所实现的机器智能其决策质量无法超越领域专家决策质量的问题。同时也指出数据 2 硕士论文 库的知识发现( k n o w l e d g ed i s c o v e r yi nd 北i b 鹤e ,简称为k d d ) ,为解决诊断知识获取的 瓶颈难题提供了一种新途径。 k d d 就是对海量数据进行去粗取精、去伪存真的技术,自第一次国际人工智能大 会首次提出以来,受到了机器学习、模式识别、统计推理等领域的重视。因为数据被看 作是蕴涵知识的源泉,知识发现就是要从大量的不完全而且含有噪声的数据中,提取出 有用信息的数据处理过程1 7 ,1 5 】。 目前,机械设备现场监测系统积累了大量的数据,如何更好的从现场海量数据中归 纳总结出诊断知识规则;诊断系统如何具有类似人类专家一样给出系统故障结果、预测 故障程度并具有不断的自学习的能力等都是需要努力探索和完善的地方。数据库的知识 发现快速发展,对解决如何从大量现场数据提取出诊断规则并具有自学习的能力提供了 一种思路。但是与此同时,在数据库的知识发现中使用什么样的智能数据分析工具的问 题也摆在了我们的面前。 粒度计算理论主要用于处理不确定的、模糊的、不完整的和海量的信息【蛤1 8 】,而这 正是我们需要在数据库知识发现中需要解决的问题。 粒度计算的研究可以划分为语义的研究和算法的研究。粒度计算的语义研究侧重于 对粒的解释,如为什么两个对象会在同一个粒之中,为什么不同的粒会相关。而粒度计 算的算法研究侧重于如何进行粒化和如何进行基于粒的计算。根据粒度计算在故障诊断 的应用背景,本文偏重于粒度计算在故障诊断中的应用算法研究。 2 0 世纪6 0 年代,美国著名数学家z a d e h 提出模糊集合论,并在1 9 7 9 年,提出了信 息粒度的概念,但是直到1 9 9 6 年,在和美籍华人t y u n 的共同研究下,正式提出“粒 度计算”这个名词并提出“词计算理论”,标志着模糊粒度化理论的诞生,词计算理论 对因特网上的海量信息资源的高效利用有着深远的影响;而“粒度计算 的另一位提出 者t y m 主要是以领域的观点来看待粒度计算,提出了通过二元关系来定义粒,所定 义的粒可将大小不同的粒度分成不同粒度层,并在不同层上进行处理。1 9 8 2 年,波兰数 学家p a w l a k 提出了粗糙集理论,由于其能有效的处理不确定的或不精确的知识,能够 从数据中获取知识,因此得到广泛的应用,特别是在数据挖掘领域,获得了较满意的结 果,成为粒度计算研究的主要方法之一。在我国,张钹院士和张铃教授提出的商空间理 论是另外一种主要的粒度计算模型,商空间理论用子集表示概念,不同粒度的概念体现 为不同粒度的子集,一簇概念就构成空间的一个划分商空间( 知识基) ,不同的概 念簇就构成不同的商空间,而粒度计算问题,等价于研究在给定知识基上的各种子集合 之间的关系和转换【1 6 2 0 】。 以上所述的三种粒度计算模型,包含有粒度计算的一些基本问题,现简述如下【2 l j : 1 ) 粒:一个粒可以被解释为许多小颗粒构成的一个大个体,通常需要考虑粒的三 个基本属性:( 1 ) 反映粒中元素交互作用的内部属性;( 2 ) 揭示一个粒与其他粒交 互作用的外边属性;( 3 ) 表示一个粒在特殊环境下存在的上下文属性。一个粒可 以被同时看作是由内部属性描述的个体元素的集合以及由它的外部属性所描述 3 狡度计算及其在机械故障诊断中的应耀 的整体。一个粒的存在仅仅在一个特定的环境中才有意义。一个粒的元素可_ 以 是粒,一个粒也可以是另外一个粒的元素。 粒度结构:粒度结构给出了一个系统或者一个问题的机构化描述,我们需要确 定一个粒度网中三个层次的结构:( 1 ) 粒的内部结构;( 2 ) 粒集的集体结构;( 3 ) 粒度网的层次结构。粒集的集体结构可以看作是全部层次结构中一个层次或者 一个粒度视图中的结构。它本身可以看作是粒的内部连接网络。对于丽一个系 统或者同一个问题,许多解释和描述可能是同时存在的,所以粒度结构需要被 模型化为多种层次结构以及在一个层次结构中不阏层次。 3 ) 粒化:粒化就是粒度计算基础单元的构建,包括粒、粒视图、粒网和层次结构。 相关的问题包括:( 1 ) 粒化准则;( 2 ) 粒化方法;( 3 ) 粒和粒度结构的表示;( 4 ) 粒和粒度 结构的定性定量描述。 舢以粒为单位计算:粒度计算可以邋过系统的访问粒度结构来解决问题。这包括在 层次结构中向上和向下两个方向的交互,以及在一个层次内的移动。相关的问 题包括:( 1 ) 粒在层次上的投影;( 2 ) 粒度转换;( 3 ) 计算的操作符;( 4 ) 性质保持或者不 变的性质。 以上所述的粒度计算的基本问题,当处理问题时所选用的粒度计算模型不同时,其 侧重点和分析处理方法也有所不同,故需在粒度计算理论在故障诊断领域的应震中,根 据所需达到的目标和处理问题的特点,选择合适的粒度计算模型,重点研究粒度计算基 本问题的某些方愿,并构造相应的算法。 1 5 本研究的意义 在旋转机械故障诊断研究中,知识获取是爨扰智能诊断发展的“瓶颈”难题。其中, 专家知识资源短缺,专家知识表达方式存在的模糊性难以消除等,一直被认为是导致上 述“瓶颈”的主要原因。面生产现场,每天都会存储大量的监测数据,并且还有生产遇 到的疑难故障,现场专家对其做出的判断和解决方法,这其中都隐含有大量的对今后生 产运行和故障判断具有重要意义的知识规则。面对大量的数据,如何从中去伪存真,提 取出对故障判断最具有价值的诊断知识是首要任务,故目前的焦点则成为选择何种理论 工具进行数据挖掘,从海量数据中提取出有用的知识。而粒度计算理论作为信息处理的 一种薪的概念和计算范式,主要应用于处理不确定的、模糊的、不完整的和海量的信息, 故研究粒度计算理论在故障诊断中的应用具有十分重要的意义。 1 6 本文研究内容与结构安排 围绕着粒度计算理论在故障诊断中的应用问题,重点研究了粗糙集理论与商空阀理 论在诊断规则提取和故障类型辨识中的应用,具体内容为: 第一章介绍了选题的背景与依据,概述了相关的粒度计算理论,并在此基础上,阐 述了本文的主要研究内容。 4 硕士论文 第二章对粒度计算理论中的粗糙集理论和商空间理论的基本原理进行了简介,并对 三种粒度计算模型之间的关系进行了分析。 第三章对机械故障决策表进行了介绍,针对运用粗糙集理论进行诊断规则提取其决 策表需由符号型数据构成的要求,研究适用于粗糙集理论的属性离散化算法,并提出一 种改进的划分式离散化算法。 第四章针对基于粗糙集理论的诊断规则提取问题,重点研究了基于粒度计算的属性 约简问题,针对研究中发现的问题,提出了一种基于粒计算的属性约简改进算法,根据 属性约简结果验证了离散化算法和属性约简算法的有效性,并分析了所提出的算法在实 际应用中的局限性。 第五章探讨了商空间理论在机械故障辨识问题中的应用,设计了相应的粒度空间转 换算法,把几种典型故障原始粒度空间时域信号波形与粗粒度空间时域信号波形进行对 比,并说明粒度空间的转换对故障辨识的有效性,进而讨论了商结构值做为量化特征提 取的问题。 最后总结全文,得出结论。 5 粒发计算及其在机械故障诊断中的应用 第2 章粒度计算简介 2 1 引言 粒度计算理论是信息处理的种新的概念和计算范式,覆盖了所有有关粒度的理 论、方法、技术和工具的研究,主要应用于处理不确定的、模糊的、不完整的和海量的 信息 洛谰。粗略地讲,一方面它是模糊信息粒度理论、粗糙集理论、商空闻理论、区闻 计算等的超集,另一方面是粒度数学的子集。具体地讲,凡是在分析问题和求解问题中, 应用了分组、分类和聚类手段的一切理论与方法均属于粒度计算的范畴。对它昀研究, 引起了人们的关注,已成为人工智能领域新近研究的热点方向之一,也是软计算科学的 一个分支。软计算是由模糊集理论的创始入z a d e h 教授所提崽的,榻对于以追求得到精 确解的传统计算不同,软计算以能够得到近似最优解使得近似解能够与现实需求取得相 协调一致为目标【2 2 1 。在旋转机械故障诊断领域,目前一个迫切的任务是处理网常积累下 来的大量的、不精确不完整数据,从中提取出隐含在数据中的知识,故在本章中,就粒 度计算理论中的粗糙集理论和商空间理论分别加以重点介绍,进而分析三种粒度计算模 型之闻的区别与联系,为后续的粒度计算理论在故障诊断中的应用方法研究提供理论基 础。 2 2 粗糙集理论简介n 5 ,2 3 硼 粗糙集理论是波兰数学家z p a w l a k 予1 9 8 2 年提出的一种数据分析理论,该理论作 为一种处理具有信息不确定、不精确、不完善系统的新数学工具,广泛运用予机器学习、 模式识别和专家系统等领域。 2 2 。盖粗糙集理论基本概念 定义2 1 :设u 为所讨论对象的非空有限集合,称为论域;r 为建立在u 上的一个 等价关系,称二元有序组a 譬一妙,足) 为近似空间( a 翔妁x 妇越es p a ) 。 近似空间构成论域u 的一个划分;若r 是【厂上的一个等价关系,以i zl 聍表示x 的r 等 价类,r 表示尺的所有等价类构成的集合,即商集;足的所有等价类构成f 的一个 划分,划分块与等价类相对应。等价关系组成的集合为等价关系族。 定义2 2 :令尺为等价关系族,设p 尺,且p 裤m ,则p 中所有等价关系的交集称 为p 上的不可区分关系,记作砼( p ) ,即有:k k ( ”一班l ,显然d 也是等价 关系。 不可区分关系是粗糙集理论中最基本的概念。若( x ,y ) 毯d ( 聊,则称对象z 与y 是 不可区分的,即x ,) ,存在于不可区分关系心m ( 印的同一个等价类中。依据等价关系族p 形成的分类知识,x ,y 无法区分。我们称u d 妒) 中的各等价类称为p 基本集。 褪糙集理论将分类方法看成知识,分类方法盼族集看成知识库。等价关系对应论域 6 硕士论文 的一个划分,即关于论域中对象的一个分类,所以通过一个等价关系可以形成与之对应 的论域知识( 即等价类的集合一商集) 。 定义2 3 :称论域u 的子集为u 上的概念,约定西也是一个概念,概念的族集称为u 上的知识;u 上知识的族集构成关于u 的知识库。 近似空间对应u 的一个划分,因此近似空间形成关于论域u 的知识。 定义2 4 :设u 为论域,r 为等价关系族,p r ,且p 一中,则不可区分关系矾d ( 一 的所有等价类的集合,即商集u i n d ( p ) 称为u 的p 的基本知识,相应等价类称为知识 p 的基本概念。特别地,若等价关系q r ,则称u q 为u 的q 初等知识,相应等价类 称为q 初等概念。 可以得出,p 基本概念与p 的基本集相对应。给定知识库k = ( u ,尺) ,知识库的 知识粒度由不可区分关系矾d ( 聊的等价类反应。可以证明,对所有p r ,有玳d ( r p ) n d 俾) ,也就是说任给一个r 基本概念( 尺等价类) ,都可以找到一个p 基本概念,包 含给定的欠基本概念。 定义2 5 :设集合x u ,尺是一个等价关系,称蹦= blx u ,且b k x 为集 合x 的尺下近似集;称似;仁i x u ,且b 】rn x 西 为集合x 的尺上近似集。称集合 b n 尺( x ) = 蹦一丛为x 的尺边界域;称p o s r ( x ) = 蟹为x 的r 正域;称 n e g 。( x ) = u 一心为x 的尺负域。 由上述定义可知,下近似麟是由必定属于x 的对象组成的集合;而上近似麟是 由可能属于x 的对象组成的集合;b n 。) 表示既不能明确判断属于x ,也不能明确判 断不属于x 的对象组成的集合;n e g 。( z ) 则表示一定不属于x 的对象组成的集合。以 上概念之间的联系如图2 1 所示: 图2 1 粗糙集理论基本概念之间的相互关系 则粗糙集的定义为:当b n r ( x ) = 时,即肘= 掣,称x 是r 精确集;当 b n r ( x ) m 时,即尺x 丛,称x 是尺粗糙集。 7 粒度计算及其在机械故障诊断中的应用 2 2 2 粗糙集的特征 定义2 矗由等价关积定义牒似的近似精鼬胴。黟,其蝴加, 瞄| 表示集合x 的基数,显然有o 痿嚣悸) s 王。 直观的理解口窿僻) ,反映了知识u r 近似表示x 的完全程度。如上图中表示的那 样,下近似占上近似的比铡就是近似精度。缀显然当8 窟( x ) = 王酎,盖是覆的精确集: 当0 蠕口。( x ) 1 时,x 是尺的粗糙集。 在粗糙集中,表示集合不糖确性的数值是通过现有知识中的两个精确集合定义的。 产生不精确性的原因在于我们对论域的现有知识有限,随着知识粒度的细化,不精确性 会随之降低。 定义2 7 :粗糙隶属函数定义为:至o ) -,显然肛; ) m ,萎o ) 的 值哥以理解为x 隶属予集合x 的不确定程度。 f l 欣;i 定义2 8 :分类质囊定义为:珞妒) 一皇长广,分类质量表示的是应用属性集定能够 pi 确切的划入f 类对象的百分比。 2 2 3 约简与核 定义2 9 :令r 为等价关系族,r 足,如果有矾( 砷= d 僻一 r ) ,则称尺为r 中誉必要麓;否则称穴为震中必要的。如采每一个霆震都为震中必要的,则称永为独 立的;否则称r 为依赖的。 定义2 。1 0 :设q r ,若q 独立的,且癸耐= 公役) ,则称q 是等价关系族p 的一个约简,记作:r e d ( p ) 。p 中所有不必要关系的集合称为等价关系族p 的核,记作: c 锹联p ) 。 定理2 1 1 :等价关系族p 的核等于p 的所有约简的交集,即c 0 唰= n r e d ( p ) 通过这个定理告诉我们约简与核的关系,一方面,核是所有约简的计算的基础;另 一方面,核可以看作知识库中最重要的部分。 在实际应用中,一个分类( 知识) 相对于另一个分类( 知识) 的关系十分重要,因 此需要弓l 入知识的耱对约简和相对核的概念。首先介绍几个相关概念: 定义2 1 2 :设p 和q 为论域上的等价关系,q 的p 难域记作p o s p ( q ) , p o s p ) 拳u 璺 x 氨| f q 定义2 1 3 :设p 和q 为论域上的等价关系族,尺p ,若有 p o s 粕( p ) ( 聃( q ) ) = p o s 聃( p 鼢( 戳d ( q 8 x n r kk e 乙匕 硕士论文 则称r 为p 中q 不必要的,否则称尺为p 中q 必要的。若p 中的任一关系r 都是 q 必要的,则称p 为q 独立的。 定义2 1 4 :设s p ,称s 为p 的q 约简,当且仅当s 是p 的q 独立子族,且 p o s 。( q ) = p o s p ( q ) 。p 中所有q 必要的原始关系构成的集合称为p 的q 核,记作: c o i 通q ( p ) 。 定理2 1 5 :p 的q 核等于p 的所有q 约简的交集,即c o r e q ( p ) = nr e d q ( p ) 。 p 的q 核是知识p 的本质部分。p 的q 约简是p 的子集,且是独立的。它具有与 知识p 相同的分类能力。 一般约简是在不改变对论域中对象的分类能力的前提下消去冗余知识,而相对约简 是在不改变将对象划分到另一个分类中去的分类能力的前提下消去冗余知识。 2 2 4 信息系统与决策表 信息系统是一种知识表达方式,知识的表达方式在智能数据处理中有十分重要的地 位。 形式上,四元组s 一,4 ,y ,) 是一个信息系统,其中: u :对象的非空有限集合,即论域; 彳:属性的非空有限集合; y = u 圪,圪是属性的值域; 矧 厂:u 彳- y 是一个信息函数,它为每个对象的每个属性赋予一个信息值,即 v 矗彳,x u ,g ,口) 圪。 信息系统可以用数据表格来表示,表格的行对应论域中的对象,列对应对象的属性。 一个对象的全部信息由表中一行属性的值来反映。 设p 彳勘西,定义由属性子集p 导出的二元关系如下: 帅( p ) = 戤,) ,) i ,y ) u 阻v a p ,有, ,口) 一,( y ,口) j ,可以证明d m ( p ) 是等价 关系,称其为由属性集p 导出的不可区分关系。 给定一个信息系统s 一缈,彳,y ,厂) ,彳的每个属性对应一个等价关系,而属性子集 对应不可区分关系。信息系统与一个知识库相对应,因此一个数据表格可以看成一个知 识库。 决策表是信息系统的一个特例,它是信息系统中最为常用的一个决策系统。多数决 策问题都可以用决策表形式来表达。它可以根据信息系统定义如下: 设s 一,彳,y ,厂) 是一个信息系统( 知识表达系统) ,彳一c u d ,c u d = ,c 称 为条件属性集合,d 称为决策属性集。具有条件属性和决策属性的信息系统称为决策表。 2 3 商空间基本理论简介口8 ,2 9 1 , 张钹、张铃教授等从仿生学的观点提出了基于商空间的问题求解理论,建立了一种 商结构的形式化体系,给出一套解决信息融合、启发式搜索、路径规划和推理等领域问 9 救度计算及其在机械故障诊断中的赢用 题的理论和算法。基予商空阖的粒度计算认为,概念可以用子集来表示。不同粒度的概 念就体现为不同粒度的予集,一簇概念就构成空间的一个划分商空间( 知识基) ,不 同的概念簇就构藏不同的商空间。 2 3 1 不同粒度世界的描述 用一个三元组n 描述一个问题: x 表示所研究对象的全体,称为论域: 厂表示论域的属性,可用函数,:x - y 表示; ? 是论域结构,指论域盖中各元素的相互关系。 定义2 1 6 :设是兄y 两个集合,x y 是石与y 的积集,尺c 石y 。设v ( x ,y ) x y , 有( x ,罗) 只,则称菇与罗有关系足,记为卿,称定为x y 上的一个关系。 当石- y 时,简称尺是x 上的一个关系。 定义2 。王7 :菇盖,令【舅】一 罗k y ,称其为茗的等价类。 定义2 1 8 :令卜 陋】k 毫x ,卜 罗眵一y ,称暇】是x 关于足的商集。故商 集是将等价类【x 】看成元素而构成的新空间。 不同粒度世界模型:对僻善d 阿题,称放不阉的粒度( 角度、层次) 考察阍题伐善 d ,是指给定x 的一个等价关系r ,并由产生商集冈,然后研究相应问题( 冈,们,【刀) , 其中阴,【明分别表示商集【弼上对应的商属性函数和商结构。 称( 冈,阴,【刀) 为zd 的商空闯,x 的所有不同的商集及其对应的商空间,就构成 了问题伐五幻不同的粒度世界。 2 3 。2 不同粒度世界闻的关系 半序格 设r 是x 主一切等价关系的全体。 定义2 1 9 :设墨,恐r ,x ,y z ,蝇y 净啦y ,则称碍比恐细,记为兄墨。 由以上定义可以得如:r 在上面定义的 驴 类别 o 3 盯o 4 鲈o 9 眵 o 0 5 2 50 0 1 7 4 o 0 2 8 8 0 1 6 3 8o 2 0 8 20 0 4 3 30 1 1 4 8o 3 7 0 2碰摩 1 4 硕士论文 o 0 5 6 50 0 2 0 80 0 0 4 90 1 4 8 9 0 2 1 9 1o 0 2 6 60 0 7 9 8o 4 4 3 4碰摩 o 0 2 5 8o 0 0 8 3o 0 0 0 8o 1 1 8 4 0 2 5 9 1 o 0 6 7 5o 0 6 4 6o 3 9 1 7碰摩 o 0 5 4 5o 0 2 9 9o 0 0 1 3o 1 9 2 1 o 2 7 5 70 0 2 6 7o 1 1 1 9o 3 0 8碰摩 o 0 9 1 50 0 3 3o 0 0 1 70 1 5 6 80 3 1 7o 0 2 4 5o 1 1 2 2o 2 6 3 3碰摩 o 0 2 8 9o 0 0 9 90 0 0 4 1o 1 4 30 4 4 4 10 0 3 8 6 o 1 0 2 1o 2 3 0 4碰摩 o 0 4 9 20 0 2 5 8o 0 0 7 9o 0 9 3 2o 4 5o 0 4 9 90 0 8 3o 2 4 1 1碰摩 o 0 1 8 9o 0 10 0 0 0 70 1 1 1 2 0 4 5 8 6 o 0 5 3 10 1 0 8 6o 2 3 3 5 碰摩 0 0 3 1 40 0 1 1 70 0 0 1 2o 1 1 0 9 0 4 6 8 50 0 3 7 2o 0 6 60 2 7 3 2碰摩 o 0 3 2 90 0 0 8 3o 0 0 0 8o 1 1 3 5 0 4 7 2 50 0 4 8 8 0 1 0 1 9o 2 3 3 6碰摩 0 0 2 6 8o 0 1 2 20 0 0 0 30 1 0 0 7o 4 8 2 9 o 0 3 6 30 0 6 5 6o 2 7 5 3碰摩 o 0 30 0 1 5 9o 0 2 4 40 0 9 6 6 o 4 8 5 70 0 4 4 90 0 8 1 3o 2 2 1 1碰摩 o 0 1 7 60 0 1 0 7o 0 3 1 80 0 9 5 7 o 5 2 0 o 4 0 7o 0 6 4 4o 2 1 9 1 碰摩 0 0 5 4 9o 0 3 5 7o 0 0 90 1 1 2 2 0 5 2 0 5o 0 1 9 8o 0 8 5 80 2 1 8 7碰摩 0 0 1 6 80 0 0 6 4 0 0 0 1 20 1 0 7 7 o 6 6 9 80 0 1 3 5o 0 3 6 2o 1 4 8 3不平衡 o 0 1 6 2 0 0 1 2 2 0 0 0 2 2o 0 7 6 2 o 7 0 5 70 0 1 8 1o 0 4 6 9o 1 2 2 4 不平衡 粳度诗算及冀在机械故障诊断中的应用 o 。0 王7 70 9 20 0 90 0 7 50 7 l 王50 0 王羔o 。笛王6o 王2 3 王不平衡 0 0 2 0 70 0 0 6 3o 0 0 4 6 0 0 8 3 80 7 1 7 4 o 0 0 5 o 0 3 9 10 1 2 3 不平衡 o 0 1 6 6o 0 0 6 7o o o l lo 0 8 5 7 o 。7 1 8 2o 0 0 6 5o 0 4 0 4o 重2 4 6 不平衡 o 0 1 2 30 0 1 0 6o 0 0 1 30 0 8 1 5o 7 1 8 5o 0 1 5 2o 0 3 9 5o 1 2 1不平衡 0 0 1 4 5 o 。0 0 6 80 0 0 1 o 0 8 7 5o 7 2 0 9 o 0 1 5 80 0 3 7 6o 1 1 5 9 不平衡 o o 王8 2o 6 3 o 2 30 1 8o 。7 2 2 2o 0 1 6 lo l lo n 2不平衡 0 0 1 7 50 0 1 0 80 0 0 0 6 0 0 7 7 3o 7 2 40 0 1 2 4o 0 4 2 7o 1 1 4 7 不平衡 o o 董6 60 o 王3 30 。o ( 嬲o 0 7 5 40 7 。4 7 3o 。( ( 洚o 。( 辫3 7o 。0 9 9 5不平衡 0 0 1 2 30 0 0 6 1o 0 0 0 4 0 0 5 6 8o 7 7 4 50 0 0 8 50 0 4 1 10 1 0 0 4 不平衡 o 0 1 6 2o 2 60 。重lo 。1 2o 。7 7 8 6 o 。0 1 2 4o 5 王o 2 8 不平衡 o 0 1 3 5 0 0 0 4 60 0 0 1 4 0 0 5 7 1o 7 8 1 40 0 1 8 5o 0 3 3 4o 0 9 0 1 不平衡 o 0 0 4 2 o 0 0 2 6 0 0 0 0 90 0 7 0 6o 7 8 9 6o 0 0 7 3o 0 4o 0 8 4 8 不平衡 0 7 8 o 2 4o 0 5o 0 4 9 3o 7 9 5 3o 0 1 3 9o 0 2 9 7o 1 0 1 3 不平衡 3 3 决策表属性离散化问题的数学描述 离散化是指按照某种原则,将具有连续属性值的数据表向符号型数据表进行转化的 过程。离散化过程中,位于同一区间内的连续属性值集被认为是近似相等的,故可用同 一符号对这个值集中的元素进行近似的统一表达。 离散化过程的数学描述方式如下1 7 ,嘏3 2 ,矧: 定义3 1 离散化:设决策信息系统s = ( 以c u d ,啪,属性口的值域圪上的一个断 点可以记为瓴d ,其中露乏,c 爱& 。在值域圪= 如】上的任意一个断点集合 句露) , q 4 ) , 钰口) 】定义了圪上的一个划分p 口。 只慧 渤气锯露) ( c 芏气勿勺,鲰气j 露) 屯徽c d 4 旬杯 硕士论文 ( 5 ) o 蜩p 瞳震 这种形式的约筒算法,包含两个步骤,首先是增加属性,赢到属性子集是约简的超 集;再是删除属性,在约筒的超集删除多余的属性。在这两个步骤中,增加属性有一个适 应函数。需要选择,删除属性也有一个适应函数万需要选择。同样地,适应函数选取的 不一样,算法的效率和结果也有所不同。 第

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论