(人机与环境工程专业论文)基于粗糙集和神经网络相结合的故障诊断模型研究.pdf_第1页
(人机与环境工程专业论文)基于粗糙集和神经网络相结合的故障诊断模型研究.pdf_第2页
(人机与环境工程专业论文)基于粗糙集和神经网络相结合的故障诊断模型研究.pdf_第3页
(人机与环境工程专业论文)基于粗糙集和神经网络相结合的故障诊断模型研究.pdf_第4页
(人机与环境工程专业论文)基于粗糙集和神经网络相结合的故障诊断模型研究.pdf_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国民航大学硕士学位论文 a b s t r a c t w i t ht h ei n c r e a s i n gc o m p l e x i t yo ft h em a n u f a c t u r e ,t h er e l i a b i l i t ya n ds e c u r i t yo fc o m p l e x e q u i p m e n th a sb e e nc o n c e r n e dg r e a t l y t h ek e y t os o l v et h i sp r o b l e mi st oe s t a b l i s haf a u l t d i a g n o s i ss y s t e mw h i c hc a nd i a g n o s ea n dp o s i t i o nf a u l t st i m e l ya n da c c u r a t e l y f r o mt h e p o i n to fe n g i n e e r i n ga p p l i c a t i o n ,b a s e do nt h er o u g hs e ta n d a r t i f i c i a ln e u r a ln e t w o r k t h e o r y , t h er e d u c t i o no ff a u l tc h a r a c t e r i s t i cp a r a m e t e r sa n db pn e u r a ln e t w o r ka r es t u d i e dm o s t l yi n t h ed i a g n o s i so fa e r o e n g i n e ,a n da ni n t e l l i g e n tf a u l td i a g n o s i sm e t h o dw h i c hi n t e g r a t e sr o u g h s e tw i t hb pn e u r a ln e t w o r ki sg i v e n s o m ee x p l o r a t i o ni sm a d ei nt h ef o l l o w i n ga r e a s :t ( 1 ) t h ef a u l td i a g n o s i sm o d e l w h i c hi n t e g r a t e sr o u g h s e tw i t hb pn e u r a ln e t w o r ki ss e l e c t e d b a s e do nt h ea d v a n t a g ea n dd i s a d v a n t a g e t h ed a t ad i s c r e t i z a t i o ni sd i s c u s s e d ,a n dt h e r e d u c t i o na l g o r i t h m sa r eg i v e nb a s e do nt h ev a r i a b l ep r e c i s i o nt h e o r ya n dp r o b a b i l i t yt h e o r y o t h e r w i s e ,t h ep r o b l e m sw h i c hi n c l u d ec l a s s i f i c a t i o na b i l i t ya n dd e c i s i o na c c u r a c ya sw e l la s t h eu n c e r t a i n t ym e a s u r e m e n to fk n o w l e d g ea r ea n a l y z e d ( 2 ) b pn e u r a ln e t w o r kt h e o r ya n di t si m p r o v e dm e t h o d sa l es t u d i e d ,a n dt h em a t l a b t o o l b o xo r i e n t i n gn e u r a ln e t w o r ki si n t r o d u c e d ( 3 ) t h ef a u l ts a m p l eo fa e r o e n g i n ei ss e l e c t e d ,a n dc h a r a c t e r i s t i cp a r a m e t e r sa r ea c q u i r e d b yu s i n gt h er e d u c t i o na r i t h m e t i co fv a r i a b l ep r e c i s i o na n dp r o b a b i l i t y c o m p a r i n gt h e c a l c u l a t i o nw i t ht h eb a s i cr e d u c t i o na l g o r i t h m ,t h ep r e f e r a b l er e s u l ti sa c q u i r e db yu s i n gt w o f o r m e rm e t h o d s ( 4 ) a c c o r d i n gt ot h er e d u c t i o nf l o wo fv a r i a b l ep r e c i s i o na n dp r o b a b i l i t yt h e o r y ,t h e c a l c u l a t i o ni sm a d eb yh a n da n dp r o g r a m m e ,a n dt h es a m er e s u l ti sa c q u i r e d ,w h i c hp r o v e s t h ec o r r e c t n e s so fp r o g r a m m em o d u l e ( 5 ) a l g o r i t h mm o d u l e sa r ea d d e dt ot h ep l a t f o r ma b o u tr e m o t ef a u l td i a g n o s i so fa i r c r a f t , a n dr e a le n 酉r ed a t aa b o u ta i rf o r c ea n dc i v i la v i a t i o na r eu s e di nt h et e s t ,t h eg o o dd i a g n o s i s r e s u l t sa r ea c q u i r e d ,w h i c hp r o v e st h ef e a s i b i l i t yo fm o d e l f i n a l l y , t h ee x a m p l ep r o v e st h a t t h ed i a g n o s i sr u l ee x t r a c t e db yu s i n gr e d u c t i o ni sf e a s i b l e k e y w o r d s :f a u l td i a g n o s i s ,r o u g hs e t ,a t t r i b u t er e d u c t i o n ,b pn e u r a ln e t w o r k u 中国民航大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所 知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果, 也不包含为获得中国民航大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志 对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 研究生签名:醢盈 日期:碰丝仍砂 中国民航大学学位论文使用授权声明 中国民航大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件 和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内 容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布( 包括刊登) 论文的全 部或部分内容。论文的公布( 包括刊登) 授权中国民航大学研究生部办理。 研究生签名:磴垫导师签名: 中国民航大学硕士学位论文 第一章绪论弟一早珀下匕 1 1 引言 随着现代化大生产的发展和科技的进步,设备的复杂程度日益提高,如何保证设备 的安全运行,已成为一个十分迫切的问题。如果某台设备出现故障而又未能及时发现和 排除,不仅会导致设备本身损坏,甚至可能造成机毁人亡的严重后果。在连续生产系统 中,如果某台关键设备因故障而不能继续运行,往往会涉及全厂生产系统设备的运行, 而造成巨大的经济损失。例如电力系统的汽轮发电机组、冶金过程及化工过程的关键设 备等等【1 1 。在机械制造领域中,如柔性制造系统( f m s ) 、计算机集成制造系统( c i m s ) 等,故障诊断技术也具有相同的重要性。然而在机械制造工业中,大量的是单件、小批 量生产,在传统的生产环境中,一般机床设备操作与质量控制主要靠人进行,这时故障 诊断技术的地位就没有前述连续生产系统显得那么重要。但对于某些关键机床设备,因 存在故障而导致加工质量降低,不能保证整个机器产品质量,这时故障诊断技术也不能 忽视。设备故障诊断技术是保障设备安全运行的基础措施之一,它能对设备故障的发展 作出早期预报,对出现故障的原因作出判断,提出对策建议,避免或减少事故的发生。 因此,故障诊断技术越来越受到重视。 本文在研究粗糙集和神经网络理论的基础上,尝试将粗糙集约简模块应用于飞机故 障诊断平台,并结合b p 神经网络对飞机发动机故障实例作出诊断。 1 2 故障诊断技术的历史 所谓故障诊断是指系统在一定工作环境下查明导致系统某种功能失调的原因或性 质,判断劣化状态发生的部位或部件,以及预测状态劣化的发展趋势等,它包括故障检 测、故障定位和故障预测i 引。、 设备的故障诊断自有工业生产以来就已经存在,但故障诊断技术作为一门学科是2 0 世纪6 0 年代以后发展起来的,它是适应工程实际需要而形成和发展起来的一门综合学 科。纵观其发展过程,故障诊断可依据其技术特点分为原始诊断、基于传感器与计算机 技术的诊断和智能化诊断等几个阶段。 原始诊断始于1 9 世纪末至2 0 世纪初,由于机器设备比较简单,故障诊断主要依靠 个体专家或维修人员通过感官、经验和简单仪表进行。 基于传感器与计算机技术的诊断始于2 0 世纪6 0 年代的美国。1 9 6 1 年美国在开始执 行“阿波罗计划”以后,出现了一系列由设备故障酿成的悲剧,导致了美国机械故障预防 小组( m f p g ) 于1 9 6 7 年成立,同时也揭开了现代诊断技术的进程。在这一阶段,诊断 技术融合吸收了大量的现代科技成果:传感器技术的发展,使得对各种诊断信号和数据 的测量变得容易;计算机的使用弥补了人类在数据处理上的低效率和不足,从而使各种 诊断方法应运而生,涌现了状态空间分析诊断、对比诊断、函数诊断、逻辑诊断、统计 诊断和模糊诊断等诊断方法。信号检测、数据处理与信号分析的手段和方法构成了这一 中国民航大学硕士学位论文 阶段故障诊断技术的主要研究和发展内容。然而,不论诊断技术本身还是从其发展出的 诊断系统,几乎在诊断过程的每一个阶段都需要专家或专业技术人员的参与,以提供诊 断过程所必需的领域知识和处理问题的策略及最终决策。因此,这一阶段的诊断技术缺 乏智能性。 智能化诊断技术始于2 0 世纪8 0 年代初期。这一阶段的特点是将人工智能的研究成 果应用到故障诊断领域中,以常规诊断技术为基础,以人工智能技术为核心。人工智能 技术的发展为设备故障诊断的智能化提供了可能性,使诊断技术进入了新的发展阶段, 以数值计算和信号处理为核心的诊断过程被以知识处理为核心的诊断过程所代替,对诊 断技术的研究是从知识的角度出发来系统地加以研究。虽然智能诊断技术还远远没有达 到成熟阶段,但智能诊断的开展大大提高了诊断的效率和可靠性。 1 3 故障诊断技术的现状与发展趋势 1 3 1 国内外发展现状 就世界范围来看,美国是最早研究故障诊断技术的国家。1 9 6 7 年,在美国宇航局和 海军研究所的倡导和组织下,成立了美国机械故障预防小组,开始有计划地对故障诊断 技术分专题进行研究。很多学术机构、政府部门以及高等院校和企业公司都参与或进行 了与本企业有关的故障诊断技术研究,并取得了大量的成果。目前美国的故障诊断技术 在航天、军事以及核能等尖端技术领域仍处于领先地位。 英国对故障诊断技术的研究始于2 0 世纪6 0 年代末、7 0 年代初,以r a c o l l a c o t t 博士为首的英国机器保健中心,在宣传、培训、咨询及诊断技术的开发方面做了大量的 工作,并取得了很好的效果。目前,英国在摩擦磨损、汽车、飞机发动机监测和诊断方 面具有领先优势。 日本的诊断技术研究始于2 0 世纪7 0 年代中期,1 9 7 1 年新日铁以丰田利夫教授为首 率先开展对故障诊断技术的研究,到1 9 7 6 年已达到实用的阶段。尽管日本的起步较晚, 但发展很快,其做法是密切注视世界各国的发展动向,特别注意研究美国故障诊断技术 的发展,积极引进消化最新技术。目前,日本在钢铁、化工、铁路等民用工业的诊断技 术处于领先地位。 故障诊断技术的研究在我国起步较晚,在2 0 世纪7 0 年代末期开始。广泛的研究则 从2 0 世纪8 0 年代开始发展起来,随后在各领域分别确定了故障诊断的目标、方向和试 点单位。特别应指出,尽管我国故障诊断技术的研究起步较晚,但发展还是比较快的。 目前,故障诊断技术在我国的化工、冶金、电力和铁路等行业得到了广泛的应用,取得 了可喜的成果【引。 1 3 2 发展趋势 目前,故障诊断领域中的几大研究课题为故障机理研究、信号处理与模式识别的诊 断方法研究、故障诊断专家系统的研究和现代监测与诊断系统的应用开发研究等方面。 基于知识的智能化故障诊断专家系统已成为现代设备故障诊断技术中一个最有前途的 2 中国民航大学硕士学位论文 发展方向。故障诊断技术的发展呈现出以下3 个方面趋势: ( 1 ) 诊断系统智能化。专家系统、模型推理、神经网络、故障树、模式识别和模 糊诊断等方法及不确定性理论正走向成熟,并将在故障诊断系统中得到广泛应用。 ( 2 ) 诊断系统集成化。诊断系统的开发转向现有技术的组合和集成,软件更加规 范化、模块化、硬件更加标准化、专业化。 ( 3 ) 诊断系统综合化。由过去单纯的监测和诊断,向集监测、诊断、管理、咨询 和训练于一体化的综合化方向发展。 1 4 故障诊断基本方法 故障诊断技术是一门综合性技术,它不但与诊断对象的性能和运行规律密切相关, 而且还涉及到多门学科,如现代控制论、可靠性理论、数理统计、模糊集理论、信号处 理、模式识别和人工智能等学科理论。 故障诊断技术发展至今,人们已提出了许多方法。按照国际故障诊断权威德国f r a n k 教授的观点,所有的故障诊断方法可以划分为3 种:基于数学模型的方法、基于信号处 理的方法和基于人工智能的方法【2 。3 1 。 1 4 1 基于数学模型的方法 ( 1 ) 参数估计法 当故障由参数的显著变化来描述时,可利用已有的参数估计方法来检测故障信息, 根据参数的估计值与正常值之间的偏差判定系统的故障情况。 ( 2 ) 状态估计诊断法 通过被控制过程的状态直接反映系统的运行状态并结合适当的模型进行故障诊断。 ( 3 ) 等价空间诊断法 利用系统的输入输出的实际测量值检验系统数学模型的等价性( 即一致性) ,以检 验和分离故障。 基于数学模型的方法是发展最早、研究最系统的一种故障诊断方法,其优点是能深 入系统本质的动态性质和实时诊断;缺点是通常难以获得系统模型,且由于建模误差、 扰动及噪声的存在,使得鲁棒性问题日益突出。 1 4 2 基于信号处理的方法 ( 1 ) 直接测量系统输入输出的方法 在正常情况下,被控过程的输入输出在正常范围内变化,当此范围被突破时,可以 认为故障已经发生或将要发生。另外,还可以通过测量输入输出的变化率是否突破规定 范围来判定故障是否发生。 ( 2 ) 基于小波变换的方法 首先对系统的输入输出信号进行小波变换,利用该变换求输入输出信号的奇异点, 然后除去由于输入突变引起的极值点,则其余的极值点对应于系统故障。 ( 3 ) 输出信号处理法 3 中国民航大学硕士学位论文 系统的输出在幅值、相位、频率、及相关性上与故障源之间会存在一定的联系,这 些联系可以用一定的数学形式( 如输出量的频谱) 表达,发生故障时,则可利用这些量 进行分析与处理,来判断故障源的所在。常用的方法有频谱分析法、概率密度法、相关 分析法及互功率谱分析法等。 ( 4 ) 信息匹配诊断法 此方法引入了类似矢量、类似矢量空间和一致性等概念。将系统的输出序列在类似 空间中划分成一系列的子集,分析各子集的一致性,并按一致性强弱进行排列,一致性 最强的一组子集的鲁棒性也最强,而一致性最差的子集则可能已发生故障。正常情况下 类似矢量值很小,而当故障发生时,类似矢量的值将在此故障相应的方向增大,因此类 似矢量值的增加表明了故障的发生,而其方向给出了故障传感器的位置。 ( 5 ) 基于信息融合的方法 故障诊断实际上是根据检验所获得的某些故障征兆以及系统故障源与故障征兆之 间的映射关系,找出系统故障源的过程。为了充分利用检测量所提供的信息,在可能的 情况下,可以对每个检测量采用多种诊断方法进行诊断,这一过程称为局部诊断。将诊 断方法所得结果加以综合,得到系统故障诊断的总体结果称为全局诊断融合,对局部 全局融合方案的实现,可用模糊推理方法或用m a r y 理论进行决策。 ( 6 ) 信息校核的方法 系统的信息校核是进行故障诊断的比较简单有效的方法,因为信息是进行系统过程 检测的依据,利用错误的信息进行计算和推理是徒劳无益的,而且会得出错误的结论。 可依据物理化学定律及数理统计知识来进行信息的校核。信息的矛盾一般意味着信号获 取上的故障或矛盾。 基于信号处理的故障诊断直接利用信号模型,不需要对象的数学模型,从而回避了 抽取对象数学模型的难点,但是不便于研究。 1 4 3 基于人工智能的故障诊断方法 传统诊断方法,尽管可以通过检测信号的处理,实现对设备工况的监视与故障诊断, 但是当诊断对象变得庞大而复杂的时候,为了能把故障比较细致的区分出来,一方面需 要增加检测手段,另一方面需要大大增加计算量,从而使得诊断时间延长,当调试完毕 后,用传统诊断方法编制的软件系统的功能就确定下来了,不易修改,只局限于某一具 体系统的诊断,很难应用于不同的诊断对象,因而不易推广。智能诊断的优越性在于它 集合了传统诊断方法的优点,实现了人机联合诊断功能。它可以综合多个专家的最 佳经验,实现多故障、多过程、突发性故障的快速分析诊断,甚至预测将要出现的故障。 ( 1 ) 基于专家系统的方法 基于专家系统的诊断方法是故障诊断领域中研究最多、应用最广的智能诊断技术。 它包括基于浅知识的诊断方法、基于深知识的诊断方法和基于浅知识和深知识的混合诊 断方法。近年来发展的基于浅知识和深知识相结合的混合诊断推理方法有,g a u a n t i 和 f i n k 提出的集成诊断模型,p e n g 的层次因果模型等。 4 中国民航大学硕士学位论文 该方法过于依赖专家的经验知识,缺乏对特殊故障的诊断应变能力,容易出现故障 的误判和漏判,同时诊断具有较大的主观性。 ( 2 ) 基于案例的诊断方法 基于案例的诊断方法原理是,对于所诊断的对象,根据其特征从案例库中检索出与 该对象的诊断问题最相似匹配的案例,然后对该案例的诊断结果进行修订作为该对象的 诊断结果。基于案例的诊断方法适用于领域定理难以表示成规则形式,而易表示成案例 形式且已经积累了丰富的案例的领域。在参考文献1 4 】中提出了一种基于案例的电子故障 诊断系统。在参考文献【5 j 中,描述了一个电子自动生产线的电路诊断维护系统:每次诊 断后,根据以前不知道的故障,系统会被更新;经过5 个星期的使用以后,系统的诊断 率可达到9 5 。 这种方法的局限性在于:难以表示案例之间的关系;对于大型案例库进行检索非常 费时,并且难以决定应选择哪些症状及它们的权重;难以处理案例修订时的一致性检索, 难以对诊断结论进行解释。 ( 3 ) 基于人工神经网络的方法 人工神经网络( a r t i f i c i a ln e u r a ln e t w o r k , 砧悄) 是由大量神经元广泛互连而成的复 杂网络系统,它诞生于1 9 4 3 年。a n n 是对人类大脑神经细胞结构和功能的模仿,具有 与人脑类似的记忆、学习、联想等能力。在a n n 中,通过神经元之间的相互作用实现 信息处理,知识与信息的存储表现为分布式网络元件之间的关联,网络的学习和识别取 决于各神经元连接权值的动态演化过程。a n n 是大规模并行结构,信息可以分布式存 储,并且具有良好的自适应性、自组织性和容错性,因此a n n 在故障诊断领域已经得 到广泛应用。很多文献给出了人工神经网络在电力系统故障诊断、智能控制、继电保护 和暂稳态计算、短期负荷预报等系统计算优化中的大量研究成果。在参考文献1 6 j 中,b p 算法的多层感知器用于数字电路的诊断,输入层接受测试矢量的0 1 状态,输出层表示 诊断到的单故障。用故障库训练单故障诊断率显示为1 0 0 ,2 个故障诊断率为7 5 。 在参考文献【7 】中,通过对机载航炮大量故障现象、故障原因、故障样本的收集、分析和 整理,利用b p 神经网络建立了机载航炮智能诊断模型。该网络采用了三层结构、1 7 个 输入量、1 0 个输出量的故障诊断系统,较完善地反映了机载航炮的故障类型。经故障诊 断实例检验,该系统诊断结果正确,有良好的实用价值。 ( 4 ) 基于模糊数学的方法 许多被诊断对象的故障状态是模糊的,诊断这类故障的有效方法是应用模糊数学理 论。该方法不需要建立精确的数学模型,适当运用隶属函数和模糊规则,进行模糊推理 就可以实现模糊诊断。在参考文献【8 】中,报告了利用概率理论( 模糊逻辑一种形式) 提 高模拟电路的诊断精确性的一种系统。在参考文献【9 】中,提出了基于模糊数学的诊断方 法,将模糊数学方法引入内燃机故障诊断中,根据模糊数学理论,实践经验和试验来确 定隶属度的大小;计算出症状与故障种类的隶属度,然后根据隶属度的大小及影响程度 对故障种类进行排除和检修。 5 中国民航大学硕士学位论文 对于复杂的系统,由于具有复杂性、耦合性和非线性,隶属函数形状不规则,只能 用规则的隶属函数形状加以近似,如三角形、梯形等,并且建立正确的模糊规则和隶属 函数非常困难,时间花费太大,诊断结果不理想。 ( 5 ) 基于故障树的方法 故障树方法是由计算机依据故障与原因的先验知识和故障率知识自动生成故障树, 并自动生成故障树的搜索过程。在进行诊断的过程中,有效地使用系统的实时动态数据 将有助于诊断的进行。该方法优点在于类似于人类的思维方式,直观、形象、易于理解, 灵活性、通用性强;缺点在于建树工作量大,易导致错漏,需要与其它方法结合使用。 ( 6 ) 基于粗糙集模型的方法 作为人工智能领域中一种新方法粗糙集( r o u g hs c t ,简称r s ) 理论【l o l ,是继 概率论、模糊集理论、证据理论之后又一种处理不确定性信息的数学方法。这一理论能 有效分析和处理不精确、不完整和不一致等各种不完备数据,并从中发现隐含知识,揭 示潜在规律。粗糙集理论正日益受到重视,已经在决策推理、近似控制、专家系统、过 程控制、机器学习、数据库知识发现和模式识别等许多科学与工程领域中得到了成功应 用。粗糙集理论不仅为信息科学和认知科学提供了新科学逻辑和研究方法,而且为智能 信息处理提供了有效处理技术。 1 5 粗糙集和神经网络在故障诊断中的应用 目前故障诊断处于智能化诊断阶段。这一阶段的特点是将人工智能的研究成果应用 到故障诊断领域中,它以常规诊断技术为基础,以人工智能技术为核心。其研究内容与 实现方法已发生并正在继续发生着重大的变化。此时,以数据处理为核心的诊断过程正 被以知识处理为核心的诊断过程所代替,诊断技术也将从知识的角度出发来系统地进行 研究。将人工智能领域中的各种方法有机结合,可以大大提高故障诊断的水平和效率。 因此,基于知识的智能故障诊断技术是故障诊断领域中最为引人注目的且最有发展前途 的研究方向之一吲。 粗糙集理论是一种新的处理不确定知识的数学工具,它的一个突出优点是具有很强 的定性分析能力,即不需要预先给定某些特征或属性的数量描述,而是直接从给定问题 的描述集合出发,通过不可分辨关系和不可分辨类确定问题的近似域,找出问题中的内 在规律【1 1 】。目前基于粗糙集模型的故障诊断方法主要有:利用基本的r s 理论及其各种 推广模型进行故障诊断知识的提取;利用r s 理论简化故障诊断知识,减小故障特征输 入量的维数,以降低故障诊断系统的规模和复杂性。 神经网络学习算法,因其良好的非线性映射能力和独特的网络结构,现已广泛应用 于模式识别、数据预测、系统辨认、图像处理、语音理解以及函数拟合等各个领域。但 是,利用神经网络诊断发动机故障,存在所选特征参数过多、神经网络规模过于庞大、 学习训练时间超长等问题,严重影响到该模型的实际使用效果和实时性。为了克服其局 限性,我们引入了粗糙集理论。由于粗糙集具有剔除故障诊断决策表中不必要属性的约 6 中国民航大学硕士学位论文 简能力,可以对神经网络结构进行优化【1 2 1 。因此,将粗糙集与神经网络结合是机械故障 诊断领域中一种非常有前途的高效实时诊断方法。 国内外学者在这一领域的研究主要集中在以下几个方面。j i l o n e k 等人和陈遵德提出 了利用粗糙集理论对神经网络的输入数据进行属性优选,确定属性最少的网络输入,以 减少网络规模,提高训练速度【1 3 1 。h a s h e m i 和a h n 等人研究了粗糙集作为神经网络预处 理的二维约简方法,即同时对决策表的水平和垂直方向约简【搏1 5 1 。文献【1 6 l 提出一种基于 粗糙集理论和神经网络的集成化数据挖掘方法,给出一种改进粗糙集属性约简算法和消 除冗余属性方法,进而采用面向对象概念进一步对数据库进行属性约简,最后用相似权 值方法得到产生式规则,并将所得规则用决策树来表示,通过一个完整应用实例演示了 该方法,证实了其有效性。文献【r 7 l 利用神经网络和粗糙集方法构造出一种复合模型,并 用它来对银行资产结构进行预测,获得较好效果。文献【1 8 1 利用粗糙集方法从信息系统中 提取近似正确规则并给出了学习算法,然后再使用基于知识的神经网络技术对近似正确 的规则进行精练,结果表明该方法结合了粗糙集理论与神经网络的优点。文献【1 9 j 在利用 神经网络诊断航空发动机故障的过程中,引入粗糙集理论和方法,对故障诊断特征参数 属性进行属性约简,剔除其中不必要的属性,从而揭示了故障诊断条件属性内在的冗余 性,降低了神经网络构成的复杂性,最后给出了属性约简的结果。文献【硎通过使用粗糙 集理论优化b p 神经网络故障诊断系统,构建了优化的粗集神经网络模型。通过对轴承 故障数据和磨削工况分析表明,其提高了神经网络模型的学习效率和诊断的准确率。 1 6 本文内容 本文在总结已有理论成果的基础上,在以下几个方面作进一步的研究: ( 1 ) 在各种诊断技术的基础上,根据粗糙集和神经网络各自的优缺点,选定基于两 者相结合的故障诊断模型作为研究对象。 ( 2 ) 介绍粗糙集理论的相关概念,并讨论数据的离散化问题,给出基于变精度理论 和基于概率的约简算法,并对其中的分类能力与决策精度以及知识的不确定度量等问题 作了分析说明。 ( 3 ) 根据人工神经网络的特点和基本功能。对b p 神经网络理论及改进方法做相应 分析研究,并引入面向m a t l a b 的神经网络工具箱。 ( 4 ) 选取某一航空发动机的故障样本,应用变精度约简算法和概率的约简算法提取 特征参数,并结合b p 神经网络完成对发动机的故障诊断过程。 ( 5 ) 根据变精度理论和概率的约简算法流程,分别采用手算和程序进行对比验算, 以证明程序模块的准确性。 ( 6 ) 将算法模块加入到飞机远程故障诊断平台,采用某空军和某民用发动机实际数 据进行测试,以证明模型的可行性。最后,通过实例验证约简对于诊断规则提取的可行 性。 7 中国民航大学硕士学位论文 第二章粗糙集理论基础 2 1 概述 当今,社会已进入了网络信息时代,随着计算机科学与技术的飞速发展,特别是数 据库技术的广泛应用,使得各领域中的不确定信息急剧增加。面对如此大量的、杂乱无 章的、强干扰的数据,要从中挖掘潜在的、有利用价值的信息是一件困难的事情。在数 据挖掘( d m ) 和数据库知识发现( k d d ) 的诸多方法中,粗糙集理论对于处理复杂系 统不失为一种较为有效的方法【2 。粗糙集理论以集合论为基础,作为一种处理模糊和不 确定性知识的有力工具,它可以在保持分类能力不变的前提下,通过知识约简,找出问 题的决策或分类规则。 粗糙集理论是波兰数学家z p a w l a k 于1 9 8 2 年提出的一种数据分析理论【捌。由于最 初关于粗糙集理论的研究主要集中在波兰,因此当时并没有引起国际计算机界和数学界 的重视,研究地域仅局限于东欧一些国家。直到1 9 9 0 年前后,由于该理论在数据的决 策与分析、模式识别、机器学习与知识发现等方面的成功与应用,才逐渐引起了世界各 国学者的广泛关注。1 9 9 1 年z p a w l a k 的专著粗糙集一关于数据推理的理论( r o u g h s e t 扣玑e o r e t i c a la s p e c t so fr e a s o n i n ga b o u td a t a ) 的问世【2 3 1 ,标志着粗糙集理论及其 应用的研究进入了活跃时期。1 9 9 2 年在波兰召开了关于粗糙集的第一届国际学术会议。 1 9 9 5 年a c mc o m m u n i c a t i o n 将粗糙集列为新浮现的计算机科学的研究课题。在日本东 京召开的第五届国际粗糙集研讨会以及在我国举行的研讨会都极大地推动了亚洲地区 对粗糙集理论与应用的研究。现在,美国、加拿大、波兰、日本都有粗糙集研究的专门 机构。 粗糙集理论已经成为信息科学最为活跃的研究领域之一,许多国际重要学术会议和 学术研讨班都把粗糙集理论的研究列入会议和研讨班的主要内容之一。至今大约有2 0 0 0 多篇粗糙集理论方面的研究论文发表于国际重要期刊和国际会议刊物上。这种理论在许 多重要的实际生活中都有应用,利用粗糙集理论处理的主要问题包括数据库中的数据约 简、数据的近似分类、数据中的相似性或差异性的发现、数据中范式的发展以及因果关 系的发现。特别地,粗糙集方法在医学、药学、银行、商业、金融、市场研究、工程设 计、气象学、振动分析、开关函数、冲突分析、图像处理、声音识别、并发系统设计、 决策分析、字符识别及其他领域都有重要的应用瞄l 。 不确定性是粗糙集理论的关键词,它涉及集合论定义中的许多实质性内容。集合的 近似定义是现代数学中的重要概念之一,而与布尔逻辑非常相关的经典集合论又是数字 计算机运算的核心。众所周知,许多实践问题不能满足现存计算机的求解条件,特别是 机器学习、模式识别以及某些控制等问题,这种困难常常导致不能建立描述个体的算法。 而粗糙集理论及其扩充为建立此类似个体的近似描述,提供了一种通用的由精确数学语 言支持的哲学框架。一些应用实例充分说明了粗糙集理论已经构成了k d d ( k n o w l e d g e 8 中国民航大学硕士学位论文 d i s c o v e r yi nd a t a b a s e ,数据库中的知识发现) 的一个完备基础,说明了它也是分布式和 多- a g e n t 系统中的数据挖掘的新方法。近来对于大型数据库中的数据挖掘的粗糙集方法 已经提出来了【矧。可以预言,粗糙集方法将在数据挖掘和软计算,特别是处理大型数据 库、动态信息系统以及基本研究工具的开发等方面有极大的发展和应用。 2 2 集合论基础 定义2 1 设尺是集合彳到彳的二元关系,如果对v a e a 有( 口,a ) e r ,则称只是a 上的自反关系。 定义2 2 设尺是集合彳上的二元关系,如果对v a ,b e a ,有( 口,b ) e r ,也必有 p ,a ) e r ,则称r 是a 上的对称关系。 定义2 3 设r 是集合彳上的二元关系,对v a ,b ,c e a ,如果无论什么时候有0 ,b ) e r 和( 6 ,c ) e r ,必有( 口,c ) e r ,则称尺是a 上的传递关系。 定义2 4 设r 是集合彳上的二元关系,如果它是自反、对称和传递的。则它是彳 上的等价关系。 定义2 5 设尺是彳上的一个等价关系,与彳中的一个元素a 相关的所有元素的集 合被称作a 的一个等价类,记成 a i r 。当仅考虑一个关系时,则可以略去下标,而简写 成【口】。形式地,【口k 一矗i ( a ,s ) e r 。 命题2 1 设只是集合么上的一个等价关系,存在下面的等价关系,其中a , b e a : ( 1 ) a r b ; ( 2 ) 【口】= 【卅; ( 3 ) 【a n b 】一西。 现在说明一个等价关系如何划分一个集合i 矧。设尺是集合a 上的一个等价关系,尺 的等价关系类的并是彳的全体元素,因为彳的一个元素a 是在它自身的等价类中,也即 a k 。换句话说,u 剧【口kia 。根据命题2 1 可见,这些等价类或者相等或者分离,所 以有【口】rnp k 1 m ,当【口】月乒【6 】r 时。 由此可见,等价类形成a 的一个划分,因为它们是彳中不相交的子集。更精确地说, 集合s 的一个划分是s 中不相交的非空子集的聚合,使得s 作为它们的并。换句话说, 子集4 ,f e l ( 自然数集) 形成的一个划分,当且仅当 ( 1 ) 对ie l ,a i 中; 9 中国民航大学硕士学位论文 ( 2 ) 当f 一| 时,4n 彳j m ; ( 3 ) u 坩4 - s 。 图2 - 1 说明了集合s 的划分概念。 图2 - 1 一个集合的划分 命题2 2 设r 是集合s 的一个等价关系,那么尺的等价类形成s 的一个划分。因此, 给定集合s 的一个划分伽;l f , ,存在一个等价关系尺使得每个4 j ,作为它的等价 类。 2 3 知识分类的概念 一般来说,把有关的信息关联在一起所形成的信息结构称为知识口7 1 。知识是人类通 过实践认识到客观世界的规律性东西,是人类实践经验的总结和提炼,具有抽象和普遍 的特性。知识是信息经过加工处理、解释、挑选和改造而形成的。知识是命题、规则等 的集合。知识一般可分为说明性知识、过程性知识和控制性知识。说明性知识提供概念 和事实。例如,一个智能检索系统中,说明性知识包括说明具体事实的数据库内容。用 规则表示问题的知识称作过程性知识。智能信息检索系统中利用过程性知识处理说明性 知识。用控制策略表示问题的知识称为控制性知识。控制性知识包含有关各种处理过程、 策略和结构的知识,常用来协调整个问题求解的过程。 从认知科学的一些观点来看,可以认为知识就是将对象进行分类的能力。上述的说 明性知识可以认为是对现实世界客观个体的描述,即是区分客观个体的知识;过程性知 识实质上是通过利用说明性知识对客观个体进行分类的知识;而控制性知识也是关于如 何用过程性知识实现对客观个体进行分类的知识,也可以认为是关于对过程性知识的分 类。 假定我们起初对论域里的个体( 对象) 具有必要的信息或知识,通过这些知识能够 将其划分到不同的类别。若我们对两个元素具有相同的信息,则它们是不可区分的,即 根据已有的信息不能够将其分开,显然这是一种等价关系。通常,我们在对现实问题进 行处理的时候,会将我们讨论的现实个体( 或称元素、对象、样本) 局限在某一个特定 的区域范围之内,这个区域内的所有个体就组成问题的论域u 。以分类为基础,可以将 分类理解为等价关系,而这些等价关系对论域u 进行划分。对于论域中由等价关系划分 出的任意子集z 都可称之为u 中的一个概念。这里我们认为空集,也是一个特殊的 1 0 中国民航大学硕士学位论文 概念。论域u 中的任意概念簇称为关于u 的抽象知识,简称为知识,它代表了对u 中 个体的分类。这样,知识就可以定义为:给定一组数据( 集合) u 和等价关系尺,在等 价关系集合尺下对数据集合u 的划分,称为知识,记为u r 。u 上的一簇划分( 对u 的分类) 称为关于u 的知识库。关于u 的一个知识库也可以理解为一个关系系统,其 中u 为论域,r 是u 上的一簇等价关系,根据这些等价关系就可以对u 进行不同的划 分( 知识) ,每种划分都把u 分为不同的子集( 概念) 。 表2 1 流感表 例2 1 表2 1 所示的个体集合组成论域u ,其中包含6 个个体,每个个体是一个四 元组,元组的每一维表示个体的一个属性信息。这些个体都可以通过其属性知识来描述。 例如一个个体可以代表其是否头疼、是否肌肉疼、体温是否正常、是否是流感。如果我 们按照某一个属性或多个属性来描述这些个体,就可以得到不同的分类知识。 按照头疼来分类: 研头疼= p l ,e 2 ,e 3 , e 4 ,e 5 ,) ) 。 这里,e l ,e 2 和e 3 这三个个体在头疼这个属性上是不可区分的,跟他们一起构成一 个类;e 4 ,e 5 和e 6 这三个个体构成另一个类。 按照头疼和肌肉疼这两个属性来共同分类: 研头疼和肌肉疼= 扣l ,e 2 ,e 3 , e 4 ,e 6 , e 5 ) 。 按照头疼和体温这两个属性来共同分类: 卅头疼和体温= 忙- , e 2 , e 3 ) , p 4 ) ,和5 ) , ) 。 按照头疼和流感这两个属性来共同分类: 研头疼和流感= p l , p 2 ,白) , e 4 ,e 5 , ) ) 。 按照肌肉疼、体温和流感这三个属性分别分类: 帆肉疼= “e 1 ,e 2 ,旬,e 4 ,e 6 , 幻 ) : 研体温= “e 1 ,e 4 , e 2 ,e s , e 3 ,) ) ; 圳流感= p l ,e 4 ,e 5 ) , e 2 ,e 3 ,) ) 。 由此可以看出,我们可以用不同的标准来对论域进行分类,得到不同的概念和抽象。 设u 是一个论域,尺是u 上的一个等价关系。u r 表示u 上由尺导出的所有等价 中国民航大学硕士学位论文 类。【x 】月表示包含元素工的尺的等价类,x e u 。一个知识库就是一个关系系统k = u p ) , 其中u 是论域,p 是u 上的一个等价关系簇。如果qgp 且q o ,贝:jn q ( q 的所有 等价关系的交集) 也是一个等价关系,称为q 上的不可区分( i n d i s c e r n i b i l i t y ) 关系,记 作i n d ( q ) 。 定义2 6 设船 u p ) 和墨= u q ) 是两个知识库。如果i n d ( p ) = i n d ( q ) ,则称k 和局( 或q 和p ) 是等价的,记作kik ( 或p i q ) 。 知识库k 和局等价,意味着k 和蜀具有相同的基础类,因而它们具有相同的表达 能力。 2 4 粗糙集理论的基本概念 2 4 1 决策表 形式上,四元组s = ( u ,a ,乃,) 是一个知识表达系统,其中u :对象的非空有 限集合,称为论域;彳:属性的非空有限集合;皓坠圪,屹为属性口的值域;,:u 则_ y 是一个信息函数。知识表达系统也称为信息系统。通常也用s = ( u ,么) 来代替s = ( u ,彳, 以,) 。其中a = c u d ,c n d - 厂,c 称为条件属性集,d 称为决策属性集。具有条件属 性和决策属性的知识表达系统称为决策表或目标信息系统。 在表2 1 中,u = e 1 ,e 2 ,e 3 ,e 4 ,e 5 ,e 6 ,c = 头疼,肌肉疼,体温) ,d = 流感) , a = c u d = 头疼,肌肉疼,体温,流感 ,y 头疼= 【是,否) ,v s t 黼 - 是,否) ,y 髓= 正 常,高,很高 ,v u = 是,否) ,y = y 头癣,y 肭瘸,y 龃,v u 。 2 4 2 粗糙集和近似 令x u ,尺为u 上的一个等价关系。当石能表达成某些r 基本范畴的并时,称x 是可定义的;否则称x 为尺不可定义的。 尺可定义集是论域的子集,它可在知识库k 中精确地定义,而尺不可定义集不能在 这个知识库中定义。r 可定义集也称为r 精确集,而尺不可定义集也称为尺非精确集或 尺粗糙集( r o u g h s e t ) 。 当存在等价关系r e i n d ( k ) 且x 为r 精确集时,集合x u 称为k 中的精确集;当 对于任何尺i n d ( k ) ,x 都为尺粗糙集,则x 称为k 中的粗糙集。 对于粗糙集可以近似地定义,我们使用两个精确集,即粗糙集的上近似( u p p e r a p p r o x i m a t i o n ) 和下近似( 1 0 w e ra p p r o x i m a t i o n ) 来描述【1 0 】。 给定知识库鼯 u ,r 】- ,对于每个子集x u 和一个等价关系r i n d ( k ) ,定义两个 子集: 1 2 中国民航大学硕士学位论文 一r xl i r a u y u r i y x ) ( 2 1 ) r xn u y u ri y n x 一西 ( 2 2 ) 分别称它们为x 的r 下近似集和足上近似集。 下近似集和上近似集也可用下面的等式表达: _ r xn 仁e

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论