(交通运输规划与管理专业论文)基于神经网络技术的故障诊断模型与方法研究.pdf_第1页
(交通运输规划与管理专业论文)基于神经网络技术的故障诊断模型与方法研究.pdf_第2页
(交通运输规划与管理专业论文)基于神经网络技术的故障诊断模型与方法研究.pdf_第3页
(交通运输规划与管理专业论文)基于神经网络技术的故障诊断模型与方法研究.pdf_第4页
(交通运输规划与管理专业论文)基于神经网络技术的故障诊断模型与方法研究.pdf_第5页
已阅读5页,还剩71页未读 继续免费阅读

(交通运输规划与管理专业论文)基于神经网络技术的故障诊断模型与方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 y8 7 9 8 6 7 随着铁路运输事业的发展,全路装设有信号连锁设备的车站已占 现有营业站的9 9 4 ,电气集中车站占连锁车站的7 2 9 ,而电气集 中连锁道岔占连锁道岔的8 8 7 ,大型编组站、区段站几乎全部实现 了电气集中连锁。因此,确保铁路车站信号设备无故障地良好工作, 对铁路运输安全具有非常重要的意义。利用新技术设备和方法,实现 铁路信号设备状态监铡和故障诊断,是保障铁路运输安全中需亟待研 究的重大课题之一。 本文正是在传统的信号分析方法的基础上,利用现代设备采集的 铁路信号模拟量与开关量,将神经网络和专家系统融入铁路信号故障 诊断之中,形成一个更加完善的趋于智能化的基于神经网络的铁路信 号故障诊断专家系统。 本文分析了铁路信号典型故障的故障机理,阐述了信号分析与故 障诊断的方法,比较了各种方法的特点,针对铁路信号的典型故障特 征,采用b p 神经网络诊断方法,基于w i l l d o w s 平台,利用面囱对象 的s u a ic + + ,开发了基于神经网络的铁路信号故障诊断专家系统。 并且通过采集实际故障信号,对系统所采用的方法进行了功能验证。 实验结果表明,通过神经网络对铁路信号故障诊断,效果良好;提高 了设备诊断、维修的效率,降低了设备的维修成本,具有很好的应用 前景。 关键词:棒经网络,故障诊断,铁路信号,专家系统 a b s t r a c t w i t h 也ed c v e l 哪啪e mo fr a i l w a yt r a n s p o f t a t i o n ,t h e 础w a ys t a t i 咖sw i 也 s i 髓a li n t c r l o c 妇i ge q u j p m e n t 缸e9 9 4 o fm ee x i s “n gb u s i n e s ss t a l i s , a dt l l eo n e sw i t hc l e c m ci n t c r l o c l 【i n ga r e7 2 9 o fm ci i l t c d o c 蚰n g s t a t i o 船,a n d s w i t c h e s w i t hd c c t r i c i n t c f l o c l 【i n ga 糟8 8 7 0 ft l i c i m e r l0 l c l 【i n gr a i ls w i t c h e s 1a 增ey a r d s 粕dd i s 喇c ls t “i o n sa l m o s ta l l 蛐e dc 蛐i n t e r h 蛔n g t h c 他o r e ,i ti sv e r yi m p 0 哟n tf o rr 蛐w a y s t a t i st oc n s u 地9 0 0 dw o r ko fs i 驴a lc q u i p m e n t0 d n d i 咖m 删蜘姗r i l l g a n df 卸1 tm a 掣啪i s0 fs i 弘a l sb yn 哪t c c b n 0 _ l o g ye q u i p m c n t 蛆dm c l l i o d s i so n co ft l l em a j o tr 瞄e 盯c i lt 醛i 【st o 伽衄r et h es 吲时o fl a i l w a y t 瑚s p o n a t i o n o nt i l eg f o 啪do f 姻乒a l 柚a l y s i sm c t h o d ,t h i st l l c s i sp u tn c 删n c m o r k 蜘dn e u t a ln 嘣嘟ki 1 d 脚1 w a ys i 印a lf 粕nd i a g n o s i s ,蛐df o 邶am o r e p e r f 毛c tr a 撕a ys i 弘a lf a u l td i a 星趔晦6 cc q r ts y s t e mt h m u g ht h cr a i l w a y s i 印a lw h i c hi sg a i n e db ym o d e mc q l l i p m e n t t h j st h e s i s 明a l y s e st h ct v p i c “f 矗u l to ft h ef a i l w a ys i 鲫a lf a u l t m e c _ h a n i 锄s ,s c tf o n ht l l cm e t h ) do fs i 2 口1 a l s 蛳a l y s i s 硒d 囱a i l td i a 毋s t k c o m p a f e st h ec h a r a d 【c i i s t i c so fv a r j o u sm c t h o d s a l s o ,u s 如zb pn c u m l n e t w o r k d i a 9 4 吐cm c 血0 d s ,b a s c d 衄w m d d w sp l a 雠b 咖, 璐i n g o b i c c t 删c n t c d s u a lc + + ,t h i st h e s j sd e v c l o pt l l c 瑚d l v 啊ys i l m a l d i a 萨o s t i ce x p c ns y s t c m ,w h i c hh a v cb c 胁v a l i d a t c db yi c a lf a u hs i g n a l e x p e f i m e n t a lr e s l l l t ss h o wt h a tt h ea d o p t i o no fn e u r a ln e ,0 1 kf o r 伯i l w 鑫v s i g 眦lf a u l td i a 掣l o s i sw 舔v c r yg o o d ,柚dj m p r o v 船t h ec 伍c i c c yo f d i 砌邺i sa n dm 柚c n a n c c a n df c d u c ee q u i p m e n tm a i l l t c n a n c ec o s t s 。a n d h a sa9 0 0 da p p l j c a t i o np m s p e c t s k - e y w o r d :n e u r a ln e t 啪r k ,f a u l td i a g o s i s ,r a i l w a ys i g i l a l ,e x p e n ss y s t e m 2 第一章绪论 1 1 论文选题背景及研究意义 铁路运输安全,一直是铁路系统建设和运营管理追求的重要目 标。铁路车站信号控制设备是确保铁路行车安全的重要设施。随着铁 路运输现代化的发展,全路装设有信号联锁控制安全设备的车站已占 现有营业站的9 9 4 ,其中实行电气集中联锁的车站占7 2 9 ,电气集 中联锁道岔达到8 8 7 ,大型编组站、区段站几乎全部实现了电气集中 联锁控制。正如大家所知道的,铁路信号设各遵循故障一安全韵原则, 信号设备装备越完善,在运输安全中起的作用就越大。根据1 9 7 9 年至 1 9 8 9 年间的统计,全路电气集中车站每年平均增加1 0 0 个左右,而全 路墓大、大事故则逐年下降,平均每年减少5 0 多件,这无疑与电务部 门的设备更新改造是分不开的。因此,确保铁路车站信号设备无故障 地良好工作,对铁路运输安全具有非常重要的意义,如何保障铁路信 号设备的正常运转,建立铁路信号的维修和检测系统,是急需研究解 决的重大课题。 为了保证铁路车站信号设备经常处于良好的工作状态,铁道部已建 立并实施了多种维修制度,主要包括年修、大修、中修、厂修、假修 等定期维修,以及不定期维修和日常维修等。这些制度的严格执行, 为铁路行车安全奠定了重要基础。但是,总体而言,这些维修制度均 具有超前或事后维修的特点,缺乏基于设备状态维修的预测性和设备 维修的经济性。因此,面对铁路运输的不断大幅度提速、对安全要求 越来越高的形势,由超前或事后维修向着基于状态修的转变已经成为 维修制度改革的方向。状态修的重要手段是采用先进的故障监测诊断 设备和方法,建立故障监测诊断系统。目前我国铁路信号微机监测系 统已经不同程度得到了推广应用,故障诊断决策支持系统处于亟待研 究开发阶段。 由于铁路车站信号控制设备本身构成的复杂性,尤其是控制电路 的复杂性,以及受设备使用和环境等因素的影响,实际造成设备故障 的原因是很复杂的,具有明显的随机不确定性和模糊性。现场分析、 判断和处理故障,往往需要依赖维修人员对设各故障机理的把握程度 北京交通大学硕士学位论文 和经验,这就很难避免由于经验不足而产生失误,造成设备故薄性行 车事故或延误维修时间。所以,有必要通过研制开发相应的专家系统 进行解决,即基于车站信号监测系统的信息和设备构成原理知识及现 场维修专家的经验知识,采用现代化的技术诊断方法和计算机专家系 统技术,开发相应的应用分析支持软件,建立智能诊断专家系统。 神经网络技术的出现,为建立智能诊断专家系统提供了一种新的 解决途径。特别是对复杂系统,由于基于解析模型的故障诊断方法面 临着难以建立系统模型的实际困难,基于知识的故障诊断方法成为重 要的、也是实际可行的方法,而神经网络的i o 非线性映射特性、信 息的分别存储、并行处理和全局集体作用,特别是其高度的自组织和 学习能力,使其成为故障诊断的一种有效的方法,并以在许多实际系 统中得到了成功的应用。 本论文结合参加导师主持的铁道部科技研究开发计划项目“信号 设备故障安全智能诊断分析软件系统”的研究工作,进行了选题研究。 重点对人工神经网络模型与方法在铁路车站信号设备故障诊断中的应 用算法进行了深入探讨。 1 2 国内外研究现状及发展趋势 国外对设备状态监测与故障诊断技术的研究,始于6 0 年代。各发 达国家都很重视但直到7 0 - 8 0 年代,随着传感器技术、计算机技术、 光纤技术等高新技术的发展与应用,设备在线诊断技术才真正得到迅 速发展。 故障诊断技术发展至今已经历了三个阶段:第一阶段由于机器设 备比较简单,故障诊断主要依靠专家或维修人员的感觉器官、个人经 验几件单衣表就能胜任故障的诊断与排除工作;传感器技术、动态监 测技术及信号分析技术的发展使得诊断技术进入了第二阶段;8 0 年代 以来。随着计算机技术、人工智能技术特别是专家系统的发展,诊断 技术进入第三个发展阶段一智能化阶段。 由于设备状态监测与故障诊断技术的难度,无论是国内,还是国外, 除个别项目以外,大多还不很成熟,仍处于研究发展阶段。纵观所有 在线监测技术的发展过程,尚有许多问题有待进一步解决。主要问题 如下: ( 1 ) 测试精度及其稳定性校验。要求研制专门的在线监测的现场校 验方法和设备是在线监测系统面临的一个重要技术问题。 ( 2 ) 高精度、高稳定、零角差传感器的研制。 ( 3 ) 基准电压抽取。目前抽取基准电压的方法大多是从t v ( 测试电压) 的二次侧抽取。现场实验证明,其误差较大,同时也增加了安装的复 杂性。 ( 4 ) 干扰及防护。 ( 5 ) 积累运行经验,建立专家系统和报警值以及相应的监测标准。 神经网络技术为解决故障诊断问题提供了一种新的途径。1 9 8 7 年 在美国圣地亚哥召开了第一界国际神经网络会议,从此开始,各种类 型的网络模型和算法纷纷出现,应用范围不断扩大;1 9 9 4 年在美国奥 兰多首次召开了删旺全球计算智能大会( w c a ) ,此次会议将模糊 算法、神经f 5 l _ 络和遗传算法三个领域综合在一起,有力的促进了基于 人工神经网络智能诊断技术的发。 1 9 9 0 年n a i d u 等人用人工神经网络进行传感器故障监测,n a i d u 等 人试图用人工神经网络来区分由传感器故障引起的模式和由过程一模 型不匹配、噪声及扰动引起的模式。结果表明,人工神经网络对传感 器故障的预测准确性比其他方法高。1 9 9 1 年北卡罗来纳州立大学的m c h ,和s 0 y e e 等人用人工神经跨络对交流感应电动机进行了故障诊 断,他们建立了一种基于高序神经网络的中小型感应电动机初期故障 诊断方法,这种方法避免了传统初期故障诊断方法中存在的一些闯题。 1 9 9 4 年弘i i r o w a t a n 曲e 等人用混合神经网络诊断多故障,采用的一种 新型网络进行故障诊断,将大量的模式分为很多小的子集以便网络能 够更有效地对故障进行分类。它的优点是即使网络是用单故障硼练的, 但对没学过的多故障也可以检测,并在反应器中得到了应用。我国也 有一些学者对神经网络在旋转机械故障诊断中的应用进行了探讨,取 得了一定的成果。东北大学虞和济教授等对机械设各故障诊断的人工 神经网络法进行了深入的研究,建立了旋转机械神经网络分类系统并 得到了应用,取得了满意的效果。西安交通大学的屈梁生教授等较早 地利用人工神经网络对大型旋转机械的各种故障进行了全面的研究, 研究了如何从现场故障信号中提取故障特征并将全息诊断法用于神经 网络诊断系统中。另外,1 9 9 7 年杨叔子教授提出了集散监测诊断系统 北京交通大学硕士学位论文 的概念,蒋东翔在其学位论文中已体现了这一思想,并在诊断中运用 了基于模糊识别和基于规则推理两种策略用于提高确诊率,其实质就 是用人工神经网络进行诊断集成。 近年来,应用a n n 的智能化诊断技术取得了一定的进展,但仍存 在着许多问题有待研究和解决,如:( 1 ) 诊断神经网络模型的改进,层 数与隐层单元数的设置以及迭代步长选取等,这些问题都不同程度地 影响网络的收敛速度及诊断精度。( 2 ) 多故障同时性诊断问题求解中的 故障组合爆炸问题。( 3 ) 现代设备的特点是复杂化、大型化,一个完善 的系统通常都由若干个子系统组成。系统的分层、分块特性使得需要 监测的部位非常多。 由于铁路车站信号控制设备本身构成的复杂性,尤其是控制电路 的复杂性,以及受设备使用和环境等因素的影响,实际造成设备故障 的原因是报复杂的,具有明显的随机不确定性和模糊性。所以,铁路 信号设备敌障诊断也由原先的传统诊断向智能诊断过渡;前者主要是 基于监测数据处理的诊断方法,后者则是主要基于专家经验及知识处 理的专家系统诊断方法。我国铁路信号设备故障诊断智能专家系统的 开发还处于初期阶段,如何将人工神经网络的模型与方法应用于铁路 信号设各故障诊断智能专家系统中去,仍是一个急需研究的重要课题。 1 3 本论文的主要研究工作 本论文结合参加导师主持的铁道部科技研究开发计划项目“信号设 备故障安全智能诊断分析软件系统”的研究工作,进行了选题研究。 重点对人工神经网络模型与方法在铁路车站信号设备故障诊断中的应 用算法进行了深入探讨。主要完成了如下工作: ( 1 ) 了解、熟悉设备故障诊断的理论方法和铁路信号系统的构造、功 能和典型运行故障。 ( 2 ) 进行了对人工神经网络理论的研究,尤其是对人工神经网络在铁 路信号设备故障诊断中的模型和算法的研究,使人工神经网络的模型 和算法能够应用到铁路信号故障诊断中去。同时,对神经网络的主要 学习算法之一的反向传播算法( b p 算法) 进行了深入的研究,通过对凡 种改进算法的模拟实现和对比综合,构造了适合于对铁路信号设备典 型故障进行识别的学习算法。 4 ( 3 ) 确定了应用神经网络理论对铁路信号设备进行故障诊断的总体 设计思想和步骤。主要包括: a 、确定了监测数据的采集和处理方法; b 、建立了铁路信号典型故障集和典型故障征兆集: c 、确定了学习样本的格式,完成了学习样本的生成; d 、确定了神经网络结构和参数,并对学习样本应用本文的学习算 法进行了学习训练,使误差控制在给定范围内。 e 、提出了由多个神经网络协同构成的多神经网络故障诊断模型,并 论述了其诊断原理。 ( 4 ) 学习了c 语言和数据库编程的基本方法,并以v 汹a la + 6 - o 和s q l 2 0 0 0 为开发工具。进行了铁路信号故障诊断系统软件的编写。在 本文研究的诊断原理的基础上,开发出一套实用的铁路信号故障诊断 系统软件包。 1 4 本章小结 本章介绍了本论文的选题背景及其研究意义,并介绍了人工神经网 络在设备故障诊断中应用的国内外研究现状及本论文的主要研究工 作。 第二章基于神经网络的故障诊断专家系统模 型与方法研究 2 1 神经网络故障诊断专家系统的基本结构 人工神经网络( a r t i f i c i a ln e u r a ln e t w o r k s 简称a n n ) ,或者通 常简称为“神经网络”( n n ) ,是近年发展起来的十分热门的交叉学科。 简单的说,神经网络就是用物理上可以实现的器件、系统或现有的计 算机来模拟人脑的结构和功能的人工系统。它的研究至今已有近6 0 多 年的历史。a n n 是人工智能的一个分支,目前已经渗透到各个领域,并 在信号处理、智能控制、模式识别、机器视觉、非线性优化、自动目 标识另l j 、知识处理、传感器技术等方面取得令人鼓舞的进展。 人工神经网络是由大量简单处理单元( 称为神经元) 广泛的互相 连接而形成的复杂网络,它是对人脑神经网络的某种程度上的简化、 抽象和模拟,而不是真实写照。目前研究开发的神经网络模型具有人 脑功能的基本特征:学习、记忆和归纳,从而解决了过去基于逻辑和 符号处理的人工智能研究中的某些局限性,为人工智能的研究开辟了 崭新的途径。 我们知道所谓的故障诊断就是对诊断对象的故障模式进行分类和 识别或根据现有的知识和一定的推理机制推断出其故障的所在部位和 严重程度。虽然传统的诊断专家系统在很多领域( 如机械、计算机等) 中得到广泛的应用而且取得了不少成果,并且显示出了相当出色的工 作能力,在某些方面甚至超过了人类专家的工作水平,然而在开发研 制过程中也碰到不少问题,并且是难以克服的问题,如:知识获取瓶 颈问题,知识难以维护,推理能力弱,实用性差,不精确推理不适合 解决模糊问题等。由于神经网络具有处理复杂多模式及进行联想、推 测和记忆的功能。因而,它非常适合应用于各种系统的故障诊断。 另外,以前的故障诊断方法是局部监测,局部诊断,即只在某些关 键的部位进行监测和诊断。各部位、各设备之间互不干扰。随着技术 的进步,这种方式己不适合生产的实际。它一方面造成监测设备的重 复设置,另一方面又很难使各监测信号之间形成有效的结合。取而代 之的是进行全方位的监测,即对设备、车间,甚至整个企业形成统一 6 基于神经网络的故障诊断专家系统模型与方法研究 的监测诊断网络,这就是集散监测诊断系统。集散监测诊断系统的特 点是形成分布式的监浏网络,各监测点的数据统一由诊断中心进行处 理和诊断。它可以提供一个统一的开放式框架,使各监测点易于加入 这一系统,便于管理,提高确诊率。集散监测诊断系统总的目标是分 散监测、集中管理和诊断。来自不同设备,不同设备部位的数据,势 必要求由不同的子神经网络来处理和诊断。这种不同的子神经网络所 组成的大神经网络系统我们可称之为集成神经网络。集成神经网络充 分利用了各种类型的信息,有利于提高确诊率。开放式的网络结构使 子网络的加入和撤出都很容易。每个部件形成一个子网络也有利于故 障的定位。同时,子网络结构简单,可单独训练,有利于提高诊断速 度。 神经网络专家系统是由神经网络与专家系统的结合体。神经网络 与专家系统的结合有两种方法:一种是使用神经网络来构造专家系统, 即把传统专家系统的基于符号的推理变成基于数值运算的推理,以提 高专家系统的执行效率,并解决专家系统的自学习问题;另一种方法 是将神经网络理解成一类知识源的表达与处理模式,这类模式与其他 知识表达方式,如规则、框架等一起来表达领域专家的知识,并面向 不同的推理机制。 在大型复杂设备的故障诊断中,通常要涉及到不同的知识源、信 息源,这就要求有不同的知识表达方式、不同的知识组织模型和不同 的诊断推理策略。研究符号推理与非符号推理相结合,生成既具有形 象思维又具有逻辑推理能力的集成专家系统,将是人工智能研究的一 个必然方向。在本论文中我们将基于第一种结合方式,即把传统专家 系统的基于符号的推理变成基于数值运算的推理方式,构造神经网络 故障诊断专家系统,系统的基本结构如图2 1 所示。 图中给出的只是神经网络故障诊断专家系统的一般结构,其实际 的诊断系统中可根据具体情况而有所改变,或增或删一些内容。 与传统专家系统相比,基于神经网络的故障诊断专家系统具有如下 几个优点:具有统一的内部知识表示形式,任何规则都可通过对范例 的学习处于同一个神经网络的各连接权重中,便于知识库的组织和管 理,通用性强;知识容量大,可把大量的知识规则存储于一个相对小 得多的神经网络中。便于实现知识的自动获取,能够自适应环境的变 7 化。推理过程为并行的数值计算过程,避免了以往的“匹配冲突”、“组 合爆炸”和“无穷递归”等问题:推理速度快。具有联想、记忆、类 别等形象思维能力,克服了传统专家系统中存在的“知识窄台阶”问 题,可以工作于所学习过的知识以外的范围。实现知识表示、存储和 推理三者融为一体,即都由一个神经髓络来实现。 原始知识库:它相当于只是工程师的大脑,其职责就是原始知识 的输入,即通过人机界面一规则形式保存到浅知识库:参与知识的再 维护和更新,因为该系统是在使用中完善的,该智能系统还没有发展 到完全脱离人类的控制的地步,当系统运行过程中新知识和新故障模 式出现的概率达到了一定的阐值,就由系统操作人员反馈给知识工程 师,由知识工程师确认后,在经操作者或知识工程师本人更新知识库, 从而实现机器的再学习。 人机界面:由两部分组成,水平部分的人机界面是知识工程师与系 统交互的界面;垂直部分的人机界面是用来实现操作者( 维修人员、与系 统的交互。两个界面可在一起开发,但作为操作者在系统初运行阶段 一般是不能私自更改知识库的。 8 基于神经网络的故障诊断专家系统模型与方法研究 浅知识库:包括被测铁路信号的功能描述,结构组成,元器件的性 能描述和工作参数说明:基于专家经验的诊断规则,即表示故障、征兆 和原因等直接相联系的专家启发式经验知识;维修策略以及故障机理解 释。 深知识库:在人工智能领域对深知识还没有明确的定义,对于电路 的故障诊断来讲,深知识是指从自动测试设各采集的具体征兆数据。 量化处理:主要针对浅知识库中的逻辑描述来进行计算机可以识 别的量化编码处理。 数据处理:该模块是为神经网络的输入数据做归一化处理,神经网 络处理的数据必须经过归一化处理,因为b p 算法是根据梯度下降法调 节连接权值。从而使误羞函数最小,当网络输入量较大时,下一层节 点转移函数的输入比较大。其输出有可能达到饱和即接近于1 ;其导数 接近0 ,导致加权修正量接近o ,这样网络间的权值将无法达到最优。所 以,为了满足对b p 算法的要求,必须对数据进行归一化处理。 系统数据库:系统工作所需要的全部数据存储区,包括初始信息, 故障征兆的对应编码,诊断推理过程中的中间结果等信息。其内容是 动态的,随着系统的不同工作状态在不断变化。 神经网络模块:本系统结构的核心。a n n 模块完成知识获取、知 识库的组建、以及在知识库的基础上,利用知识进行推理等工作。它 相当于将上述系统数据库中的无序的知识有序化的一个过程,它需要 在系统开发人员的指导下进行离线学习。网络经过学习,根据输入和 期望输出的对应关系建立起自身的权重体系。在线工作时,根据系统 提供的实际数据输入网络,网络内部根据这些数据携带的信息寻找与 训练样本中楣似的集合,然后输出计算结果。 主要包括以下四个步骤: ( 1 ) 初始化网络知识,在系统数据库中链接样本集; ( 2 ) 根据输入、期望输出的信息量,确定网络结构,如网络的输入层和 输出层神经元数目,将全部权值与节点的闭值预置为一个小的随机值: ( 3 ) 训练神经网络,达到误差精度或循环次数后,停止训练,存储网络 结构: ( 4 ) 神经网络测试。 多层前馈神经网络模型是有导师学习的典型网络,样本经过归一 化处理后,组成数值化的样本集。在学习过程中,对整个训练样本集, 9 北京交通大学硕士学位论文 根据神经网络的实际输出值和期望输出值之间的误差调整网络的权 值,直到误差的均方值小于某一预定的极小值,网络达到稳定。此时, 神经网络就从这些数值化的偶对所表示出来的经验中获得了知识,并 将知识分布存储在网络中。 输出模式验证模块:在本论文的前言部分提到“作为一个具有较强 鲁棒性的智能故障诊断系统,必须对以下四个问题作出明确的反应”, 其中的两个问题是“若有救障存在且为己知( 己经学习过的) 故障,是 否能够给出正确的诊断结果;若有故障存在但为未知( 未曾学习过的) 故障,是否能够识别出这是一种新的故障模式:”故障验证模块的设计 正是基于以上原因的考虑,试图对神经网络的输出进行验证,如果是 已经学习过的故障模式,就将该结果输入到反量化模块,否则,记录 这种新情况,送统计分析模块备案。 反量化模块:将神经网络的数值型信息进行反量化编码,即将知识 还原,以便解释系统直观的向用户反映。 统计分析模块:系统开放性的一个具体体现,它通过记录网络未曾 学习过的新的故障模式,为系统的荐学习提供理论依据和事实性指导, 当某种故障类型发生次数达到规定的阐值后,该模块将该信息送给解 释系统反映给操作者或知识工程师。 解释系统模块:负责系统和用户之间的交互,该模块性能的好坏直 接关系到系统的使用性能,专家系统中设置解释系统是专家系统与普 通的计算机程序系统不同的一个重要特色,其目的是使用户更容易的 接受系统的推理过程和所得出的结论,同时为系统的维护和专家经验 知识的传授提供接口。 2 2 人工神经元模型 神经网络是对人脑神经系统的数学模拟,其目的是学习和模仿人 脑的信息处理方式。人们对神经系统的研究已经有了很长段历史,旱 在1 9 世纪末,人们就开始认识到,人脑包含着数量大1 0 艋一1 0 1 3 之间的 神经元,这些神经元存在着复杂的联接,并成为个整体,使得人脑 具有各种智能行为。尽管在外观形状上,这些神经元各不相同,然而 它们都由三部分组成:细胞体、树突、轴突如图2 2 所示是最简单最 具代表性的模型: 1 0 基于神经嘲络的故障诊断专家系统模型与方法研究 从图中我们可以看出:一般的神经元有多个树突,它们起感受作 用即接受外部( 包括其它神经元憔来的信息。轴突只有一条,与树突相 比它显得长而细,用于传递和输出信息神经元之间通过突触联结,突 触是一个神经元轴突的末梢与另一个神经元的细胞体或树突相接触的 地方,每个神经元大约有1 0 1 乙l o 坫个突触,正是因为这些突触才使得 全部大脑神经元形成一个复杂的网络结构。 图2 2 神经元模型 从图2 2 可以看出人脑神经系统的工作原理:外部刺激信号或上级 神经元信号经合成后由树突传给神经元细胞体处理,最后由突触输出 给下级神经元或作出晌应。生物神经元具有“兴奋”和“抑制”两种 工作状态:当传入的神经冲动是细胞膜电位升至高于其阀值时,细胞 进入兴奋状态,产生神经冲动,由轴突输出。反之,若传入的神经冲 动使细胞膜电位下降至低于其阀值时,细胞进入抑制状态,就没有神 经冲动输出。 基于生物神经元的上述结构及工作特性,为了模拟生物神经元, 可以将其简化为图2 - 3 的人工神经元( 以下简称为神经元) ,其中各变 量的下标i 表示神经网络中的第i 个神经元,该神经元是个多输入( 设 为n 个) 、单输出的非线性表示,其输入输出关系可描述为 i j 一厂t “二7。i ; if ( s ) 乙l , ; :。7 ,w 、l l 7 图2 3 人工神经元模型示意圈 1 l 北京交通大学硕士学位论文 - 善。,一b ( 2 2 - 1 ) * - ,( 暑) ( 2 2 2 ) 其中:x ,( ,。1 ”) 为来自其他神经元的输入信号:b 为该神经元 的阀值;表示从神经元j 到神经元i 的连接权值;墨表示神经元的状 态。, 为某种非线性函数,它将神经元的状态墨变换成神经元的输出 m ,所以称为神经元的输出函数或者传递函数。为了便于统一处理, 式( 2 - 2 1 ) 有时又表示为 暑。k - ( 2 2 3 ) 上式中w i o 一埘,一l 。 神经元模型中的传递函数,固可以有多种不同的形式。常用的有 以下几种: ( 1 ) 阀值单元模型 ,- h ) 或者: ,o ) 一知o ) 一1 ( 2 2 4 ) ( 2 2 5 ) 其中“”表示单位阶跃函数。 这两个函数分别如图2 4 ( a ) 和图2 _ 4 ( b ) 所示。阀值单元模型 的特点是其传递函数为二值函数,神经元的输出为o ,l 或者1 。感知 器、m p 模型以及最初的h o p 丘e l d 模型都采用了这种类型的传递函数。 ( 2 ) 限幅线性函数 f 戤1 工l b m 卜1 。磊吣6 q 卫6 其中a o 。该传递函数如图2 _ 3 ( c ) 所示。 ( 3 ) s i g m o i d 型函数 常用的s i g m o i d 型函数有以下两种: ,o ) 一专 ( 2 ) 基于神经网络的故障诊断专家系统模型与方法研究 m 卜事等 ( 2 z 8 ) 分别如图2 - 4 ( d ) 和图2 - 4 ( e ) 所示。s i g m o i d 型函数由于其连续 性、可微的性质,得到了较广的应用。例如,在b p 网络中就采用了这 种类型的函数。 f 幢,j 1 f ( x j l 厂 o 5 f u jo l o ( b ) r t x j l i 厂一 o , 3 夕。 一z 一一l 图2 4 神经元典型传递函数图示 ( 4 ) 高斯函数 rl x j。 c 、 _ , 0b x 一 f ( 。) 。l j 一 基本的高斯型函数如下: ,o ) 一e x p ( 一专 ( 2 2 9 ) ( f ) 见图2 4 ( f ) 。在r b f ( 径向基函数) 神经网络中即采用这种类型 的传递函数。 ( 5 ) 概率神经元模型 北京交通大学硕士学位论文 在概率神经元模型中,神经元的状态s 只有0 或1 两个数值,它对 输出y 的作用以概率分布形式表示: m 一1 ) - 磊未而 q 2 1 0 ) 其中t 为模拟网络“温度”的参数。采用这种神经元模型的典型 网络是b o l t z m a 尬随机神经网络。 2 3 神经网络的拓扑结构 神经网络是由大曩神经元相互连接而构成的网络。根据连接方式 的不同,神经网络的拓扑结构通常可分成两大类:层状结构和网络结 构。 层状结构的神经网络由若干层组成,其中一层为网络的输入层, 另一层为网络的输出层,其余介于输入层和输出层之间的则为网络的 隐含层。每一层都包含一定数量的神经元。在相邻层中神经元单向连 接,而同层内的神经元相互之间无连接关系。根据层与层之间有无反 馈连接,层状结构的神经网络可进一步分为“前馈网络”与“反馈网 络”两种类型。 前馈网络又称为前向网络,其特点是在前后相邻的两层之间神经 元相互连接,在各神经元之间没有反馈。每个神经元可以从前一层接 收多个输入,并产生一个输出传递给下一层的各个神经元,信息只能 从输入层开始逐层向前依次传递。前馈网络可以包括许多层,但已经 证明三层前馈网络就足以满足实际应用的要求。图2 5 为三层前馈网络 的结构图。它包括三个单层的输入层、隐含层和输出层。神经网络中 有计算功能的结点称为计算单元,因此,前馈网络的隐含层和输出层 节点属于计算单元。 反馈网络在输出层与隐含层、或者隐含层与隐含层之间具有反馈 连接,即相应的阶段同时接收来自前面一层单元的输入和来自后面节 点的反馈输入。h o p & i d 网络就是一种最典型的反馈神经网络。此外递 归神经网络( r c c l l r r e n t n e u m ln e t 、粕r k i u 酣) 也是目前常见的一种常用 的反馈网络,它利用网络内部的状态反馈来描述系统的非线性动力学 行为。构成递归神经网络模型的方法很多,总的思路是通过对前馈神 1 4 x x 2 x n 基于神经网络的故障诊断专家系统模型与方法研究 经网络中引入一些附加的内部反馈通道来增强网络的信息处理能力。 根据状态信息的反馈途径,可以构成两种基本的r n n 结构型:j o r d 蛆 型和e l m 蛆型,如图2 - 6 所示。 网状结构的神经网络又称为互联网络,其特点是任何两个神经元 之间都可能存在双向的连接关系,所有的神经元既作为输入节点,又 作为输出节点示。因此,输入信号要在所有神经元之间反复传递从某 一初始状态开始,经过若干次的变化,直到收敛于某一稳定状态或进 入周期振荡等状态为止。随着神经元数日的增加,互联网络结构会迅 速复杂化,从而大大增加网络的计算量。 圈2 _ 5 三层前馈网络 2 4 印神经网络 y y m訇鱼 ( a ) j o r d a n 型( b ) e l m 8 n 型 朗2 6 基本洲结构 b p ( b a d k - p p a g a t i 蚰) 神经网络,即反向传播神经网络,是多层前馈 神经网络( m u l t i - l a y e rf e e d 莉r w 缸dn c u r a ln 雠w o r k ) 结构中最常用的一 类网络t 也是人们研究最多,认知最清楚的一类网络,其结构如图2 7 所示。b p 神经网络是包括一个输入层、一个输出层和一个或多个隐层。 每一层上包含了若干个节点,每个节点代表一个神经元。同一层上的 各节点之间无耦台连接关系,信息从输入曾开始在各层之间单向传播, 依次经过各隐含层节点。设b p 网络接受的输入数据为个,以向量x 表示: z ;瓴,恐,而) 7 ( 2 4 1 ) 网络产生m 个输出数据,用向量y 表示: y 。( y 1 ,y 2 ,y 。) 7 ( 2 4 2 ) 北京交通大学硕士学位论文 则网络将对应地有n 个输入节点、m 个输出节点。这样b p 网络可视为 从n 维输入空间到m 维输出空间的非线性映射,即 ,:p 一f ,o ) 一_ ) , ( 2 4 3 ) 输入层卜一隐含层叫 输出层 图2 7b p 网络 对于一组给定的样本输入和样本输出 一,y ,( f - 1 一 f ) ,m 为样本数, 假若存在一个连续函数g ,使 g ) 一y 1 ,( f 。1 朋) ( 2 4 4 ) 则以下定理表明,b p 网络的映射关系f 可以任意逼近该函数。 定理2 4 1 给定任一连续函数厂:0 ,1 1 - 一胪,f 可以精确的用一个三层b p 网络 实现,该网络的第一层即输入层有n 个神经元,中间层有( 2 n + 1 ) 个 神经元,第三层即输出层有m 个神经元。 该定理又称为k o l m 0 9 0 帕v 定理,它表述了映射网络的存在性。 定理2 4 2 给定任意 o ,对于任意的厶连续函数厂:f o ,1 r 一只”,存在一个 三层b p 网络,它可在任意平方误差精度内逼近l 该定理的证明见 参考文献f 2 0 1 。 以上两个定理袭明,只要三层的b p 网络就可实现厶型连续函数。 基于这一结论,三层b p 网络已成为应用最广泛的b p 网络。然而,对 于一些具体的实际问题,有时仍然需要使用多层的b p 网络。如何选取 b p 网络的隐含层数及其节点数,目前尚无准确的理论和方法,针对特 定的问题,通常要作出反复多次的研究后确定。例如,以下是几个确 1 6 基于神经网络的故障诊断专家系统模型与方法研究 定的三层b p 网络隐含层节点数h 的经验参考公式: ( 1 ) 栉+ ,打+ 口 ( 2 4 5 ) 其中:n 为输入神经是救;m 为输出神经元数;a 为1 1 0 之间的常数。 施黼亲溉定c 怕。q a 6 ( 3 ) 矗苫l o g ,n , ( 2 4 7 ) b p 网络中计算单元( 隐含层、输出层的神经元) 的传递函数通常取 s i 舯o i d 型函数。输出层节点又是也可取线性函数作为其传递函数。 b p 网络的学习采用b p 算法,即“误差反向传播算法”。考虑图2 6 的 b p 网络,设b p 网络共有m 层( 不包含输入层) ,第f 层节点数为n , 蚶表示第l 层节点k 的输出,则拶由下两式确定: 一蔓硝1 ) ,p - 硝y 卜” ( 2 4 8 ) y ,一,硝) ( 2 4 9 ) 其中s p 为第l 层神经元k 的状态,神经元的状态按式( 2 2 - 3 ) 方式表 示,即y 哪一1 皑- 一罐“。上式采用了向量表示法,皑为由网络权值 组成的系数行向量,“为第l 一1 层的输出列向量。输入层作为第。 层处理,因此y ( o ) 一x ,x 为网络输入向量。 给定样本模式 盖,y 后,b p 网络的权值将被调整,使如下的误差目标 函数达到最小: e c 忉- 三l l y 一铷2 一三薹暇一t ,2 c z 4 ,。, 上式中l ,为网络的输出,w 表示b p 网络中所有的权值。h 。为最后一 层( 输出层) 的节点数,因此= m ,且k = y 。 根据梯度下降最优化方法,可以通过e ( 们来修正权值。连至第l 层第i 个神经元的权值向量彬”的修正量由下式确定: 形“) 1 1 器等t 叩彭”y 卜” ( 2 4 1 1 ) 对于输出层( 第m 层) ,上式中的彭。为: 5 = 西一i ) 厂研) ( 2 4 1 2 ) 1 7 北京交通大学硕士学位论文 对于隐含层: “ 6 1 0 = 薹6 博) ( 2 4 1 3 ) 以上的学习方法就是著名的b p 算法。对于给定的输入输出样本,按照 上述过程反复调整权值,最终使网络的输出接近期望的输出。 由于权值的修正是在输入所有样本并进行总体误差后进行的,所以b p 算法属于批处理的方法。整个处理过程分为两个阶段。第一个阶段是 从b p 网络层的输入层开始逐层向前计算,根据输入样本计算出各层的 输出,最终求出网络输出层的输出,这是前向传播过程。第二个阶段 是对权值的修正,从网络的输出层开始逐层向后进行计算和修正,这 是反向传播过程。两个过程反复交替,知道收敛为止。 b p 算法的实质是梯度下降法,因而可能存在陷入局部最小以及收 敛速度慢的问题。为了解决这些问题,通常采用全局最优化算法与b p 算法相结合的方法,例如:模拟退火算法、遗传算法等,同时还可以 采取以下措施: ( 1 ) 选择合适的初始权值; ( 2 ) 给权值加以扰动。在学习的过程中给权值加以扰动,有可能使网 络脱离当前局部最小点的陷阱。 ( 3 ) 在网络学习的样本中适当的加些噪声,可避免网络依靠死记的办 法来学习。 ( 4 ) 当网络的输出与样本之间的差小于给定的允许误差范围时,则对 此样本神经网络不再修正其权值,以次来加快网络的学习速度。 ( 5 ) 适当选择网络的大小,可能使用三层网络,这样可避免因层数多、 节点数多、计算复杂化儿可能导致反向误差发散的情况。 基本的b p 算法是定步长的,有时候这不利于计算的快速收敛。一种改 进的方案是采用变步长的方法。在式( 2 3 1 1 ) 中,叩是与步长有关的 参数,则变步长b p 算法的主要思想如下: 当a e 1 ) ; 当a e 伽寸:叩;声叩( o ( 卢 1 ) ; 其中妒,卢为步长增大、缩小的因子。 1 8 基于神经网络的故障诊断专家系统模型与方法研究 2 5b p 算法的几种改进算法 r u m e l h a r t 等人最早提出的b p 算法,称之为经典b p 算法,后来又有 人提出了改进算法。但是算法的基本思想没有变化,只是在提高网络 的学习速度、减小误差、避免陷入局部极小以及网络单元设置上做了 些有意义的工作。改进b p 算法的目的是在最短的学习时间内修正权值, 以达到最小的输出误差。误差函数作为网络权值的函数是多维空间( 对 n h m 节点的三层网络,是h ( n + m ) 维的一个曲面,这个曲面是比较平 坦的,存在一些局部谷地( 即局部极小点) 。因此,学习的过程可以看 成是在这个曲面上找一条下降最快的路线,以逼近全局最小点。 b p 算法的改进形式有很多种,下面只对可为本文提出的改进算法 所借鉴的一些改进b p 算法进行介绍。 2 5 1m b p 算法 鹏p 算法通过改变作用函数, ) 的值域加入个增益因子c 改变作 用函数陡度,在训练过程中,增益因子c 随权值w 和闭值b 一起发生变化, 以达到改善算法的收敛特性,加快收敛速度的目的。为此在节点净输 入 魄前加入一个常数因子口,这样输出函数 ”一,) ( 2 5 1 ) 变为 ”一,( 掣f ) ( 2 5 2 ) 这里”是第m 层的第i 个节点的输出。 这时经典算法中的各参数变为: 网络隐含层的训练误差: 带- ( 一叼咖) ,科吖片( 2 5 3 ) 网络输出层的训练误差: e :_ 一o t y v 姬? n e l ? k : t 2 。5 j4 ) 再计算误差e 对增益常数c 的梯度: 嚣一( 辜唧1 w ,埘) 啊( 2 - 5 5 ) 1 9 北京交通大学硕士学位论文 掣一n 彳翮,( 2 5 6 ) 其中以是增益的学习步长。 鼢p 算法经用于仿真结果表明,与经典b p 算法相比,选用相同的 学习斗4 练步骤条件下,姆p 算法的精度远远高于b p 算法的精度( 至少高 三个数量级) 。若对于相同精度要求,则l l b p 算法可在很少步数内达到 精度要求,收敛特性、收敛速度即系统的泛化特性都得到了改善。 2 5 2 改进初始权值选取的改进算法 经典b p 算法中,初始权值是随机选取的,这样做可以提高误差函 数e 取得全局最优的概率,但仍具有一定的盲目性和随机性。在b p 算法 中由于采用s i 邸o i d 函数,( x ) - l ( 1 + e 。) ,实际输出值在 o ,1 之间。 因而初始权值不宜太大,一般都选在 _ 1 ,1 之间。采用逐步搜索法, 即先将初始权值区域( 记为功n 等分。在这n 个区域内分别随机产生初始 权值进行学习,选取对应误差函数e 最小的那个区域

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论