(计算机应用技术专业论文)网络故障定位与检测技术研究.pdf_第1页
(计算机应用技术专业论文)网络故障定位与检测技术研究.pdf_第2页
(计算机应用技术专业论文)网络故障定位与检测技术研究.pdf_第3页
(计算机应用技术专业论文)网络故障定位与检测技术研究.pdf_第4页
(计算机应用技术专业论文)网络故障定位与检测技术研究.pdf_第5页
已阅读5页,还剩58页未读 继续免费阅读

(计算机应用技术专业论文)网络故障定位与检测技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士论文网络故障定位和检测技术研究 摘要 随着信息技术的快速发展,计算机网络已经成为人们工作、生活必不可少的基础 设施。与此同时网络的规模和复杂性出现了爆炸性的增长。这使得传统的依靠人工 方式进行的网络故障诊断陷入了困境高效、准确的智能化网络故障诊断技术成为人 们的迫切需要本文对网络故障诊断中的故障定位和故障检测两个问题进行了相关的 研究。 。 由于网络的互联性,网络故障之间存在着一定的关联关系,单一的网络故障可能 导致大量的故障现象。而每一个故障现象都会作为独立的事件被网络故障诊断系统所 捕获。网络故障定位就是要根据事件关联关系,从多个故障事件中定位故障源本文 在现有技术的基础上,给出了一种基于关联图和案例库的故障定位算法该算法使用 有向图表示故障间关联关系,并利用图的性质进行定位其特点是能够处理多故障间 复杂的关联关系。同时添加了案例库的支持,提高了定位效率实验表明,该算法具 有良好的效果。 故障检测的职责就是要利用已有信息,建立故障特征参数和故障原因之间的欧射 关系。当网络发生故障时,通过分析实时故障特征参数找出故障发生的可能原因。本 文研究了若干种现有的网络故障检测方法。针对b p 神经网络故障检测方法中神经网 络规模大、训练慢等问题,将粗糙集理论应用于神经网络训练样本集的约简。为了保 证约简的效果和速度,选择了一种基于属性重要性的启发式约简算法仿真实验结果 表明,改进后的方法缩小了神经网络的规模,提高了检测的准确率。 关键词:网络故障诊断,故障定位,故障检测,关联图,神经网络, 粗糙集,启发式算法 硕士论文舟络故障定位和检测技术研究 a b s t r a c t w i t h t h er a p i d d e v e l o p m e n t o f i n f o r m a t i o n t e c h n o l o g y , c o m p u t e r n e t w o r k h a s b e c o l n c a l le s s e n t i a li n f r a s t r u c t u r ei np e o p l e sl i f e a tt h es a m ct i m e ,s i z ea n dc o m p l e x i t yo ft h e n e t w o r ki i k z 黜e x p l o s i v e l y t h i ss i t u a t i o nn m 止e st h et r a d i t i o n a lw a yo f n e t w o r kf a u l t d i a g n o s i sr e l y i n go i lm a n u a lw o r ki n 仃o b l e p e o p l en e e dt h ei n t e l l i g e n tn e t w o r kf a u l t d i a g n o s i st e c h n o l o g yu r g e n t l y t h i sp a p e rr e s e a r c h e st w oi m p o r t a n ti s s u e sa b o u tn e t w o r k f a u l td i a g n o s i s :f a u l tl o c a t i o na n df a u l td e t e c t i o m b e c a u s eo f t h ec o n n e c t i v i t yo f n e t w o r k , t h e r ea f es o m cc o r r e l a t i o n sb e l 阳,啪n e t w o r k f a u l t s s i n g l en e t w o r kf a u l tm a y c a u s el o t so f p h e n o m e n o n a n de v e r y p h e n o m e n o n w i l lb e c a p t u r e db yn e t w o r kf a u l td i a g n o s i ss y s t e ma sa l li s o l a t e de v e n t n e t w o r kf a u l tl o c a t i o n s h o u l df i n dt h es o u r t 汜f a u l tf r o ms e v e r a lf a u l te v e n t s i nt h i sp a p e r , af a u l tl o c a t i o n a l g o r i t h mb a s e do nc o r r e l a t i o ng r a p ha n dc a s eb a s ei sp r o p o s e d t h i sa l g o r i t h mc a np r o c e s s t h ec o m p l i c a t e dc o r r e l a t i o nb c t w c e nm u l t i - f a u l t s ,a n di m p r o v e st h el o c a t i o ne f f i c i e n c yb y c a b a s e e x p e r i m e n td e m o n s t r a t e st h a tt h ea l g o r i t h mh a sg o o de f f e c t f a u l td e t e c t i o ni sr e s p o n s i b l ef o re s t a b l i s h i n gm a p p k u gr e l a t i o n s h i pb e t w e e nf a u l t c h a 哺a 【e r sa n dr e a s o n s a n dw h e nt h e r eh a v ea f a u l t , f i n dt h ep o s s i b l er e a s o nb ya n a l y m g t h er e a l - t i m ef a u l tc h a r a c t e rp a r a m e t e r s i nt h i sp a p e r , w er e s e a r c hs e v e r a lk i n d so f e x i s t i n g t e c h n i q u e so nf a u l td e t e c t i o n t os o l v et h ed i s a d v a n t a g e so f t h ef a u l td e t e c t i o nu s i n gb p n e u r a ln e t w o r k , s u c ha sl a r g es i z ea n ds l o w 订a i n i n g ,w er e d u c et h et r a i n i n gs e tt h r o u g h r o u g hs e ta p p r o a c h a n dw ec h o o s eah e u r i s t i ca l g o r i t h mt oe n s u r et h ee f f e c t i v e n e s sa n d s p e e do ft h er e d u c t i o n s i m u l a t e de x p e r i m e n td e m o n s t r a t e st h a tt h ei m p r o v e dm e t h o d r e d u c e st h es i z eo f t h en e l l r a ln e t w o r ka n di m p r o v e sa c c u r a c yr a t eo f t h ed e t e c t i o n k e y w o r d s :n e t w o r kf a u l td i a g n o s i s ,f a u kl o c a t i o n , f a u l td e t e c t i o n , c o r r e l a t i o ng r a p h , n e u r a ln e t w o r k , r o u g hs e t , h e u r i s t i ca l g o r i t h m 声明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在 本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发 表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学 历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均 已在论文中作了明确的说明。 研究生签名: 。年6 月伊 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅 或上网公布本学位论文的部分或全部内容,可以向有关部门或机构送 交并授权其保存、借阅或上网公布本学位论文的部分或全部内容。对 于保密论文,按保密的有关规定和程序处理。 研究生签名: 顼士论文 同络故障定位和检铡技术研究 1 绪论 1 1 论文的背景和意义 在过去的几十年问,计算机网络的规模经历了爆炸式的增长。网络的应用已经深 入到人们生活、工作的每一个角落,成为必不可少的基础设施。随着对网络依赖性的 加强,人们对网络的可靠性也提出了更高的要求:有稳定、高效、安全的网络环境: 当网络发生故障时,能够及时的检测出故障原因并修复。可以看出,网络故障诊断 对保持网络的健康状态具有重要的意义然而在当今网络环境下,网络故障诊断遇到 了前所未有的困难,其主要表现在以下几个方面; ( 1 ) 计算机网络无论从规模上,还是从网络复杂性和业务多样性上都有了巨大的 发展。大规模网络的故障关系错综复杂,故障原因和故障现象之间的对应关系模糊, 大大提高了故障诊断的难度; ( 2 ) 网络设备的复杂性也提高了故障诊断的难度。网络设备的复杂性有两个含义 【8 1 :第一是新的网络设备不断推出,功能越来越多,越来越复杂;第二是设备提供商 数量众多,产品规格和标准不统一; ( 3 ) 随着h t e m e t 的广泛应用,计算机技术和网络通信技术得到迅速发展,新的 数字通信网络不仅拥有多种业务流量,而且采用了多种融合的网络传输技术【2 】不断 采用的网络新技术对网络故障诊断提出了越来越高的要求; 正是由于上述困难的存在,传统的依靠网络专家以人工方式进行的故障诊断已经 不能满足需要了当代网络呼唤智能化的故障诊断技术,以实现网络故障诊断的自动 化,将人从繁重的诊断工作中解放出来。研究智能化网络故障诊断技术,发展与时代 相适应的信息化保障体系,确立高效的故障定位理念和推动网络故障诊断精确化,已 成为信息化建设的迫切需求【1 1 】 智能化网络故障诊断技术有下列四个方面的难点f 删【l l l ; ( 1 ) 故障发现问题。网络故障发生的不确定性和网络软硬件构架的动态变化,使 得包括专家在内的知识受到了局限。同时,由于网络信息的海量性,使得从海量的信 息中提取出有用的知识,较为困难; ( 2 ) 故障定位问题。一个设备产生故障会影响很多和它相连的设备或子系统,甚 至会导致网络的瘫痪,这种现象就叫做故障关联。故障的关联性使故障诊断变得很困 难。网络管理员很难从成千上万的告警中很快确定故障源,也就很难快速排除故障; ( 3 ) 故障检测问题。常规的故障检测方法需要建立数学模型,而数学模型的复杂 碗士论文 网络故障定位和检测技术研究 性和精确性难以满足高速网络的实时需求;简化的数学模型又导致实际控制效果不能 令人满意。同时,常规方法需要首先了解一组表征( 如峰值比特率、平均比特率、突 发长度等) 然而这些表征不能完全描述网络不同层次的相关性和突发性,从而难以 实施有效的控制; ( 4 ) 故障表示问题。由于网络应用的多样性与不断更新,现在还不能找到一个明 确的函数能表示所有的应用层故障。 本文要研究的就是网络故障的定位问题和检测问题。这两个问题是网络故障诊断 技术中的关键。 1 2 国内外研究现状 我国计算机网络故障诊断水平相对落后,虽然在故障诊断专家系统方面开展了一 定的研究,但专门针对网络故障智能诊断技术的研究还雕j f l f j 开始。从国际上看,网络 故障诊断经历了从无到有的过程,正从初级向高级、从不完善向完善、从分散向集中 的目标发展嘲【1 1 1 网络故障诊断的具体发展目标为 6 - 8 1 : ( 1 ) 标准化。符合国际标准化组织的相关标准,以利于网络系统的可持续性建设 和发展; ( 2 ) 集中化。随着计算机网络的日趋成熟,故障诊断方面的研究将会朝着尽量集 中的方式发展,集中监视、集中控制、集中配置、集中调度,以加快响应速度,提高 效率; ( 3 ) 智能化。随着人工智能、专家系统的发展,网络故障的智能诊断成为研究的 重点方向; ( 4 ) 可扩展。计算机网络的管理内容、管理方式是变化发展的,因此,故障诊断 建设是持续、长期的,应该注意可扩展性 目前用于故障定位的方法有很多,它们的理论基础来自人工智能、图论、神经网 络、信息论等计算机科学领域【1 4 1 。例如基于规则推理的定位方法、基于案例推理的定 位方法、基于密码本模型的定位方法、基于数据挖掘的定位方法等等一些故障定位 方法已经应用到实际的产品中例如【4 1 ,h p 公司的o p e n v i e w 中提供了基于规则的 故障定位服务:c a b l e t r o n 的s p e c t r u r a 是一个基于案例推理的网络管理系统;s m a r t s 公司提供了一个基于密码本方法的定位产品i n c h a r g e 。还有其它的产品如a t & t 贝尔 实验室的e c x p e r t ,s e a g a t e 公司的n e r v e c e n t e r 等 目前常用的故障检测方法有 9 1 : ( 1 ) 基于解析模型的检测方法。如故障树的方法、参数估计方法、状态估计方法 和等价空间方法等; 2 颈士论文 网络故障定位和检铡技术研究 ( 2 ) 基于信号处理的检测方法。如相关分析、频谱分析、小波分析等; 0 ) 基于知识的检测方法。如基于事例的推理、模糊推理、粗糙集方法、人工神 经网络、支持向量机算法以及信息融合故障检测方法等。 其中基于知识的方法是网络故障检测技术的主流 随着越来越多的新技术和新方法的应用,智能化网络故障诊断将会有一个全新的 发展 1 3 课题来源 本课题来源于总装备部。十五”武器装备预先研究重点项目。野战指挥自动化网 的故障诊断技术”( 编号:4 2 0 0 1 0 7 0 1 ) 。课题利用专家系统、知识自动生成、数据挖 掘和神经网络技术,探索网络故障检测方法,设计实现方案,构建网络故障诊断系统, 最大限度地增加网络的可用时间,提高网络设备的利用率、网络性能、服务质量和安 全性,简化混合网络环境下的管理和控制网络运行成本,提供网络的长期规划。保证 各指挥层次之间无缝隙通信的可行性和操作性,从而达到提高我军通讯网络的质量和 快速恢复能力的目的 1 4 论文的主要工作 ( 1 ) 研究了若干种现有的网络故障定位技术。结合现有技术的优缺点,考虑到故 障关联关系的复杂性,给出了一种基于关联图和案例库的网络故障定位算法。该算法 中的关联图是对普通故障因果图的改进,它除了能够表示故障之间一对一的因果关系 外,还能表示多个故障间带。并且”、“或者”等逻辑语义的复杂关联关系,增强了算 法的适用性。算法能够根据故障关联关系自动生成关联图。当发生故障时,直接利用 关联图就能定位出故障源。同时加入了案例库的支持,将已有的定位案例作为知识保 存下来以供再利用,避免了重复的定位计算,提高了定位的效率; ( 2 ) 设计和实现了网络故障诊断原型系统中的故障定位功能在系统中,使用基 于关联图和案例库的定位算法进行故障定位。将故障定位功能和系统中的其它模块有 机的结合起来,使得用户能够在得到故障告警后方便的定位故障源; ( 3 ) 对基于关联图和案例库的网络故障定位算法进行了实例检验。使用网络模拟 软件建立一个虚拟的网络环境,用网络故障诊断原型系统对其进行监控人为制造一 些网络故障,当系统检测到故障后,利用其中的定位功能进行故障源定位。实验结果 表明,算法能够进行准确的故障定位; ( 4 ) 研究了若干种现有的网络故障检测技术。对基于b p 神经网络的网络故障检 测方法进行了改进。针对实际应用中出现的神经网络规模过大、训练慢等问题,将粗 糙集理论应用于神经网络训练样本集的约筒。为了保证约简的效果和速度,选择了一 3 颈士论文同络故障定位和检测技术研究 种基于属性重要性的启发式约简算法。该算法能够在较低的时间和空间复杂度下,得 到较好的约简结果,具有较高的实用价值。同时给出了使用改进方法进行故障检测的 具体步骤; ( 5 ) 使用v c + + 和m a t l a b 神经网络工具箱实现了改进后的b p 神经网络故障检 测方法利用m a t l a b 神经网络工具箱实现神经网络的功能。使用v c + + 编程实现 了训练样本集约简的启发式算法。并通过与m 蝴a b 的交互完成神经网络的训练、 故障检测等流程; ( 6 ) 通过仿真实验将b p 神经网络故障检测改进方法和原方法进行对比。利用同 一组训练样本和检测数据,分别使用原方法和改进方法进行故障检测比较神经网络 的规模、训练时间以及检测准确率等指标。实验结果表明,改进算法有效的缩小了神 经网络的规模,提高了检测的准确率。 1 5 论文的章节安排 本文对网络故障诊断中的敌障定位和故障检测两个问题进行了研究。全文分为五 章: 第l 章:介绍了网络故障诊断的基本概念和原理,论证了其重要性分析了故障 定位和检测在网络故障诊断中的重要地位。介绍了网络故障定位和检测技术的国内外 研究现状、论文的主要工作以及章节安排 第2 章:研究了若干种现有的网络故障定位和检测技术,讨论了各种技术的优缺 点,分析了其适用性。 第3 章:在现有技术的基础上,给出了一种基于关联图和案例库的网络故障定位 算法。首先给出了算法的详细描述和基于该算法的故障定位模型然后给出算法在网 络故障诊断原型系统中的实现。最后用实验证明了算法的有效性 第4 章:针对b p 神经网络故障检测方法的不足之处,给出了基于租糙集启发式 约简的改进方案,并给出了使用改进方法进行故障检测的具体步骤。然后给出了方法 的程序实现。最后使用仿真实验将改进方法和原方法进行比较。 第5 章:对论文的研究工作和成果进行了总结,明确了下一步研究的方向和目标。 4 硕士论文网络故障定位和检测技术研究 2 现有网络故障定位和检测技术研究 2 1 引言 由于网络的互联性和开放性,网络故障之间存在着一定的关联关系,单一的网络 故障可能导致大量的故障现象。而每一个故障现象都会作为独立的事件被网络故障诊 断系统所捕获多个故障同时发生时情况更加复杂。这种故障的传播特性使得故障诊 断陷入了困境,因为我们不能独立的看待这些事件,而是要将事件联系起来才能找到 故障真正的源头。网络故障定位就是要根据事件关联关系,从多个故障事件中定位故 障源。 故障检测是网络故障诊断中的又一重点问题。由于网络的复杂性,各种设备的性 能参数众多。当故障发生时,管理人员很难以人工方式快速的找到故障的原因同时, 故障性能参数会存在不精确、不一致等问题,这更增加了找到故障原因的难度网络 故障检测的职责就是要利用各种手段和已有信息,建立故障特征参数和故障原因之间 的映射关系当网络发生故障时,通过分析实时故障特征参数找出故障发生的可能原 因。 目前,故障的定位和检测是网络故障诊断中的热点问题,并取得了大量的研究成 果。本章的第二节和第三节将分别介绍几种现有的网络故障定位和检测技术,并分析 它们各自的优缺点和适用性 2 2 网络故障定位技术 2 21 概述 故障定位是网络故障诊断中的关键问题,它的难点是如何在大量的相关故障事件 中找到故障源。事件关联技术( e w tc o r r e l a t i o n ) 是重要的故障定位工具,长期以来一 直是研究的热点【1 2 1 。其基本思想是通过关联多个事件为一个单一概念事件,过滤不登 要的或不相关的信息,将故障的来源隔离出来,减少呈现给网络管理员的信息数量【1 2 1 。 根据采用的关联技术的不同,网络故障定位技术主要有以下几种: 2 2 2 基于规则推理的网络故障定位方法 基于规则的推理( r u l e b a s e dr e a s o n i n g ,p a r ) 又称为基于规则的专家系统、专 家系统、产生式系统和黑板系统等,它是最简单的关联技术形态基于规则的推理系 统一般由一个工作内存、一个推理引擎和一个知识库组成。这三部分分别描绘了系统 的数据层、控制层和知识层。 1 2 1 如下图所示: 5 硕士论文 网络故障定位和检铡技术研究 工作内存中包含了通过具体的网络管理协议,如s n m p 、c m 口收集到的关于网 络对象的各种信息。工作内存通过分析这些信息识别出网络是否发生故障【1 2 1 知识库中包含从人类领域专家那里得到的专家知识,其中包括两部分内容【1 】; 关于网络中问题定义的专家知识:当某一特定闯题发生时,系统所要执行的动作。 知识库中的专家知识是基于规则的,即所有知识都采用“i f t h e n ”或者“c o n d i t i o n a c t i o n ”两个形式的规则。 推理引擎与知识库合作,将目前网络的状态与知识库中规则的条件部分进行比 较,以决定该规则是否被采用。当条件满足时,输出规则的后项在最简单的情况下, 一条规则就可以判断出网络故障的根源。实际上这种情况十分少见,多数时候推理引 擎需要将当前得到的结论作为条件在知识库中进行多次推理,最终得出故障结论。【1 2 】 基于规则推理的网络故障定位系统结构简单,比较容易实现。但它存在以下缺陷 i s 2 1 : 1 ) 规则必须精确匹配如果当前的网络状态与规则的条件不匹配,那么系统将 退出整个推理过程。但是预先为一个大型网络确定所有的故障规则是非常困难,甚至 是不可能的。 2 ) 一般情况下,确定故障根源需要分析与多个相关网络对象有关的规则,规则 数量随网络规模指数递增,存储规则的数据库将越来越大。 3 ) 规则不易维护。由于知识特定于网络配置,无论何时,网络变更都需要开发 新的规则。 4 ) 事件发生时,每次都必须执行有关的规则,系统比较慢,性能比较低。 因此可以看出,基于规则推理的网络故障定位方法只能应用于不易变化的小型网 络环境。 6 硕士论文 网络故障定位和检测技术研究 2 2 3 基于案例推理的网络故障定位方法 基于案例推理( c a s e b a s e dr e a s o n i n g ,c b r ) 的网络故障定位方法和前一种方法 有较大的区别,其思想来源于现实生活在现实生活中,一些事件总是重复发生,处 理某一事件的方法也能用于处理类似的事件。而这些类似的事件不一定要与该特定事 件完全一致。因此现实生活中,当我们试图解决一个问题时,都是从曾经经历过的类 似案例出发。根据这一思想,将过去故障定位的成功案例存入案例库。遇到新故障时, 在案例库中寻找类似的案例,利用类比推理方法得到近似解答再根据新故障与案例 中故障之间的差异对答案加以适当修改,使之完全适合新问题。1 1 2 1 基于c b r 的故障 定位系统的体系结构如下图所示: 图2 2 3 1 基于案例推理的故障定位系统结构图 从上图可以看出,c b r 故障定位系统由五个部分组成,其中包括一个案例库和 四个功能模块。四个功能模块分别是输入模块、检索模块、修正模块和处理模块1 1 2 】。 首先输入模块接收网络故障的描述。接着由检索模块到案例库中寻找与之匹配的案 例,如果能找到完全匹配的案例,那么该案例的故障源就是要找的答案;如果找不到 完全匹配的案例,检索模块就在案例库中找一个最近似的案例然后由修正模块根据 故障间的差异对该案例的解作适当的修改就可满足当前问题的要求,其结果是得到一 个完整的解。一旦故障源被找到,则处理模块将新故障及其故障源作为一个新的案例 加入到案例库中,供以后故障定位时使用。 1 2 1 检索模块根据故障检索案例时有多种匹 配方式例如确定参数匹配、概括,多重特殊化匹配、基于鉴定的匹配等【u 基于案例推理的故障定位方法克服了基于规则推理方法的许多不足【1 2 l :在规则推 理方法中,知识的单元是规则,而在案例推理方法中知识的单元是案例;在规则推理 方法中,检索是基于对规则的完全匹配,而在案例推理方法中,检索是基于对案例的 部分匹配。值得注意的是,在基于案例推理的故障定位系统刚开始运行的时候,一般 很少能找到完全匹配的案例,但随着案例库的增长,这种巧合会越来越多,因此系统 的效率也会逐渐提高另外,由于新问题的解可以自动加入到案例库中去,以后如果 再遇到同样的问题,系统就不会重复上述步骤,而是直接得到一个完全匹配的解,因 此基于案例推理的系统具有自学习的能力。但是在一个复杂的网络环境下,要能够正 确的检索匹配案例,并对匹配案例的解做适当的修正是很困难的。总的来说,r b r 颈士论文 网络故障定位和检翻技术研究 故障定位方法适用于微小故障事件的精确定位,而c b r 方法适用于问题的总体解决 方案【1 1 2 2 4 基于密码本关联模型的网络故障定位方法 与前面几种方法不同,基于密码本关联模型( c o d e b o o kc o r r e l a t i o nm o d e l ) 的故障 定位是基于算法的,不需要专家知识来将故障源和故障事件联系起来。它把由故障源 引发的事件集视作标志故障源的。密码”,因而定位故障源的整个进程就是对捕获到 的一系列故障事件进行“解码”,即判定哪个故障源的密码最大限度地匹配故障事件 集合。【i 】 1 2 1 密码本方法中,故障事件被看作网络产生的消息并被编码成为它们导致的警报 其中关联器的功能是对这些信息进行解码以识别出问题。因此,密码本技术分为两个 阶段【1 2 l :第一阶段州做密码本生成阶段被监控到的故障源被确认并将故障源产生的 每一个故障现象或警报与问题相联系。这个过程的结果被称作密码本,其实是一个“问 题现象”矩阵。第二阶段叫做解码阶段。关联器将事件流和密码本进行比较和分析。 找出最接近故障现象的问题代码。从而定位问题发生的位置。 为了产生密码本,需要使用故障因果关系图。它描绘了故障事件间的因果关系 例如图2 2 4 1 所示图中每一个节点代表一个故障事件。因果事件的节点问有指示 线相连,起源于起因事件,结束于结果事件图中入度为零的节点可以确定为问题节 点,其它节点为故障现象节点从图2 2 4 1 中去掉故障现象节点间的指示线,得到 一个新的标注过的故障因果图2 2 4 2 。 图2 2 a 1 故障因果关系图示例图2 2 a 2 标注过的故障因果关系图 a ta 2a 3 ,l l1o p 2 olo p 3 oll 图2 2 a 3 根据图2 2 4 2 生成的密码本 8 颈士论文 网络故障定位和检涓技术研究 根据图2 2 4 2 可以生成图2 2 4 3 所示的密码本 密码本技术的核心思想是将故障事件和由该故障事件导致的故障事件形成关联 矩阵通常,在一个网络中可能产生的故障事件的数目会有很多,因此这样的矩阵 会很庞大,其中包含大量的冗余信息。为了运行时快速检测,需要应用有效的算法来 降低它的大小,使其缩小到能够惟一标志问题源的最小征兆集,即最优密码本 1 2 1 例如可以将图2 2 4 3 中的p l 行去掉,p 2 、p 3 两个症状仍能区分故障源。得到的新的 密码本仍然有效。 a t23 p 2 ol0 p 3 oll 图2 2 4 4 最优密码本示例 基于密码本关联模型的故障定位方法,其最大的优点就是不需要通过专家知识来 进行故障定位。同时该方法在速度上有一定的优势,因为定位时只需要进行比较操作, 降低了运算的复杂度。但是对于一个大型的网络来说,生成故障因果关系图是一个比 较困难的过程,仍然需要一定的专家知识。 除了上述三种方法以外,应用于网络故障定位的技术还有数据挖掘、有限状态机、 贝叶斯网络、p e t r i 两等【1 4 1 2 3 网络故障检测技术 2 31 概述 现有的网络故障检测方法概括起来可分为三大类【s l 嗍; 1 ) 基于信号处理的方法。该方法通常是利用信号模型,如相关函数、频谱、自 回归滑动平均、小波变换等,直接分析可测信号,提取诸如方差、幅值、频率等特征 值,从而检测出故障: 2 ) 基于解析模型的方法。该方法在明了诊断对象数学模型的基础上,按一定的 数学方法对被测信息进行处理诊断。它可分为状态估计法、等价空间法和参数估计法 目前此种方法得到了深入的研究;但在实际情况中,常常难以获得对象的精确数学模 型,这就大大限制了基于解析模型诊断方法的使用范围和效果; 3 ) 基于知识的检测方法。近年来,人工智能技术的飞速发展,为网络故障诊断 技术提供了新的理论基础,产生了基于知识的网络故障诊断方法,此方法由于不需要 对象的精确数学模型,而且具有某些“智能”特性,因此是一种很有生命力的方法。 9 硕士论文 同络故障定位和检测技术研究 基于知识的故障检测方法主要可以分为:专家系统故障检测方法、模糊故障检测方法、 故障树故障检测方法、神经网络故障检测方法和数据融合故障检测方法等。 随着计算机网络的快速发展,网络的规模不断扩大,简单的故障检测方法已经不 能满足大型复杂网络的故障检测需要。基于知识的智能检测方法成为网络故障检测的 主流方法阴下面是几种主要的基于知识的网络故障检测方法: 2 3 2 专家系统故障检测方法 专家系统故障检测方法将专家的诊断经验或历史数据以规则的形式组织起来,存 放在知识库中当网络对象发生故障时,系统综合运用知识库中的各种规则( 专家经 验) ,对被检测对象的性能参数进行一系列的推理、分析,从而快速的找到可能的故 障原因。 7 1 1 9 1 专家系统的故障诊断方法由数据库、知识库、人机接口、推理机等部分 组成。如下图所示: 图2 3 2 1网络故障检测专家系统模块图 其各部分的功能为1 7 】 9 1 : 1 ) 知识库:知识库是系统的核心,其中存放着专家关于故障检测的专业知识、 领域内的原理性知识和以往成功诊断的历史数据等等。这些知识都被用来故障推理; 2 ) 故障信息数据库:故障信息数据库中存放着待检测对象的各种性能参数,是 故障检测的事实依据。这些数据可能由系统实时采集得到,也可能由用户输入; 3 ) 推理机:推理机运用知识库中的知识对故障信息数据库中的故障特征数据进 行推理分析。从而得到相应的故障原因; 4 ) 知识获取模块:知识获取模块负责将专家的经验知识转化为系统可以利用的 形式,并保存到知识库中; 5 ) 解释模块:解释模块负责回答用户提出的各种问题,根据推理路线、推理结 l o 硬士论文同络故障定位和检测技术研究 论给出清晰的解释,使用户了解推理过程,这是实现推理透明性的主要模块; 6 ) 人机接口:人机接i :1 是用户以及专家与系统交互的窗口 专家系统网络故障检测的思想在于利用专家的领域知识、经验为故障检测服务。 但专家系统的应用依赖于专家领域知识的获取。知识获取被公认为专家系统研究开发 中的。瓶颈”问题;另外,在自适应能力、学习能力及实时性方面也都存在不同程度 的局限。目前。专家系统通常和其它检测方法相结合以提高检测能力r 7 】 2 3 3 模糊故障检测方法 网络故障检测是通过研究故障与其征兆之间的关系来判断被检测对象的状态。由 于网络的复杂性,故障与征兆之间的关系很难用精确的数学模型来表示,而某些故障 状态也是模糊的。这就不能用“是否有故障”的简易诊断结果来表达,而要求给出故 障产生的可能性及故障位置和程度如何。这类问题很难用二值逻辑来解决,而模糊逻 辑则能解决它们。【9 】伫5 】 模糊故障检测典型方法是模糊故障向量识别法。其检测过程分为以下几步f f l : 1 ) 建立故障与征兆之问的模糊关系矩阵r ,也叫隶属度矩阵矩阵中的每个元 素的大小表明了它们之间相互关系的密切程度。 r = 【 ,乃) h 凰y je 珂 ( 2 3 3 1 ) 式中:】,= y l ,y 2 ,肋,e o o9 朋) 表示可能发生故障的集合,刀为故障总数;彳= x j , 磁,勋,砀 表示由上面这些故障所引起的各种特征元素( 征兆) 的集合,m 为各种 特征元素总数; 2 ) 测试待诊断对象待检状态的特征参数,提取特征参数向量矩阵咒 3 ) 求解关系矩阵方程y ;x r ,得到待检状态的故障向量y ,再根据一定的判 断原则,如最大隶属度原则、阙值原则或择近原则等,得到诊断结果 检测过程如下图所示唧; - - - - - - - - - 数据流 图2 3 3 1 模糊故障检测过程 颈士论文 网络故障定位和检测技术研究 模糊故障检测方法是利用模糊集合论中的隶属函数和模糊关系矩阵的概念来解 决故障与征兆之间的不确定关系,进而实现网络故障的检测。这种方法计算简单,应 用方便,结论明确直观。在模糊故障检测中,构造隶属函数是实现故障检测的前提, 但由于隶属函数是人为构造的,含有一定的主观因素;另外,对特征元素的选择也有 一定的要求,如选择得不合理,检测精度会下降,甚至失败嘲 2 3 4 b p 神经网络故障检铡方法 神经网络起源于2 0 世纪加年代,它是由大量的、简单的神经元广泛的互相连接 而形成的复杂网络系统,是一个具有高度非线性的超大规模连续时间动力系统,其主 要特征为网络的全局作用、大规模并行分布处理能力、高度的鲁棒性和学习联想能力 4 1 。对于网络故障检测而言其核心技术是故障模式识别,而人工神经网络的上述特性 使其能够出色地解决那些传统模式识剐方法难以圆满解决的问题嘲,所以故障检测是 人工神经网络的重要应用领域之一而b p 网络是最常用的人工神经网络模型。 2 3 4 1 b p 网络模型与学习算法【1 9 - 2 1 】 在神经网络中,含有隐层的多层前馈网络能大大提高网络的分类能力,而误差反 向传播( b a c k p r o p a g a t i o n ,b p ) 算法很好的解决了多层前馈网络中权值调整的难题。 人们通常把多层前馈网络直接称为b p 网络。 1 b p 网络结构 b p 网络是至今为止应用最广泛的神经网络,下图是一个典型的三层b p 网络结 构: 输入层隐含层输出层 图2 3 4 1 三层b p 网络结构图 从图2 3 4 1 可以看出,b p 网络通常包含输入层、输出层和隐含层,相邻层之间 通过全互联方式连接。同层神经元之间没有连接。信号通过输入层进入神经网络,经 1 2 硕士论文同络故障定位和检测技术研究 过处理后从输出层输出。隐含层位于输入层和输出层之间,虽然不和外界直接连接, 却是影响输出的关键因素。隐含层可以是一层,也可以是多层单隐含层的三层b p 网络能够满足大多数应用的需求。 2 b p 网络数学模型 对于三层b p 网络,设输入向量为z = g t ,匏,硝t 隐含层输出向量为l ,= 9 l ,y 2 ,j d 7 ;输出层输出向量为d ;( d l ,0 2 ,0 1 ) t ;期望输出向量为d ;( e l , 西,西。;输入层到隐含层之间的权值矩阵用矿表示,矿= ( 乃,圪,) ,其 中列向量巧为隐含层第_ ,个神经元对应的权向量;隐含层到输出层之间的权值矩阵用 驴表示,;( ,耽,彤) ,其中列向量取为输出层第_ | 个神经元对应的权向 量。 对于输出层: o t = f ( n e t k ) k = 1 ,2 , ( 2 3 4 1 ) 七= 1 ,2 ,1 ( 2 3 4 2 ) j ;1 ,2 ,埘 ,= 1 ,2 ,m ( 2 3 4 3 ) ( 2 3 4 4 ) 以上两式中,转移函数( 力均为对数s i g m o i d 函数 l ,= 二l + e - x ( 2 - 3 4 5 ) 或双曲线正切s i g m o i d 函数 1 一, j ,( 力= 三l 二+ e 二- x ( 2 3 4 6 ) 三层b p 网络的数学模型由以上公式表示。 3 b p 学习算法 b p 算法的基本思想是:学习过程由信号的正向传播与误差的反向传播两个过程 组成正向传播时,输入样本从输入层传入,经各隐含层逐层处理后,传向输出层。 若输出层的实际输出与期望的输出不符,则转入误差的反向传播阶段。误差反传是将 输出误差以某种形式通过隐含层向输入层逐层反传,并将误差分摊给各层的所有单 元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。这种 信号正向传播和误差反向传播的各层权值调整过程,是周而复始的进行的权值不断 调整的过程,也就是网络的学习j l l 练过程。此过程一直进行到网络输出的误差减少到 可接受的程度,或进行到预先设定的学习次数为止下图为学习过程示意图。 硕士论文 同络故障定位和检铡技术研究 误差反传 图2 3 4 2b p 学习算法示意图 对于权值的调整,b p 学习算法采用非线性规划的最速下降方法,即按误差函数 的负梯度方向修改权值,这类算法常被称为误差的梯度下降算法对于三层b p 网络, 当网络输出与期望输出不等时,存在的输出误差e 定义为: 1, e = 寺( d 一0 ) 2 = ( 五- o k ) 2 ( 2 3 4 7 ) i q 隐含层到输出层之间的权值调整公式为: 蛳i k = q 5 :y j = q q k o k ) o k ( 1 一o k ) y j q 3 4 8 输入层到隐含层之间的权值调整公式为; 上 a = 叩( 娣) 乃( 1 一y j ) x s ( 2 3 4 9 ) k - i 其中群= ( 以- o d o 。( 1 一q ) 公式中各变量的意义见式2 3 4 1 - 2 3 4 6 对于三层b p 网络,b p 学习算法的步骤如下; 1 ) 初始化。对权值矩阵阪矿赋随机数,将样本模式计数器p 和训练次数计数 器g 置为0 ,误差e 置为0 ,学习率玎设为0 到1 之间的小数,网络训练后达到的精 度e 矗设为一正的小数。共有p 个训练样本; 2 ) 输入训练样本对,计算各层输出用当前样本f 、矿对向量数组鼠d 赋值, 用式2 3 4 3 和式2 3 4 1 计算】,和d 中各分量; 3 ) 计算网络输出误差。根据式2 3 a 7 计算当前样本f 产生的误差f ,并计算 网络总误差臣可以用各样本产生误差中的最大值代表总误差,也可以用 作为总误差; 4 ) 调整各层权值。根据式2 3 4 8 和式2 3 4 9 调整形和v 中各分量: 5 ) 检查是否对所有样本完成一次训练若p 尹,p = p + l ,q = g + 1 ,转到2 ) , 否则转6 ) ; 6 ) 判断网络总误差是否达到精度要求。如果e 故障事件o 1 ,a 2e 扩,q = 口:,即4 l 、口2 为同一种故障事件,其有向图表示为: 2 ) 故障事件口j ,a :u ,a l ,a 2 是独立的,即没有关系,其有向图表示为: 硕士论文 同终故障定位和检测技术研究 3 ) 故障事件q ,a 2e u ,a 1 一心,即a le j i 起ta 2 的发生,其有向图表示为: 4 ) 故障事件口i ,a 2 ,a 3 u ,a i a a 2 一a 3 ,即口l 、a 2 同时发生时引起a t 3 的发生。因为 有向图中无法表示与的关系,我们添加了一个事件集合a 1 2 ,a 1 2 = a 。,a 2 ,口1 2 发生表示a l 、a 2 都发生。这样a ia a 2 一a 3 转化为a 1 2 峥a 3 在有向图中,在保留 节点a l 、a 2 的同时添加一个表示a 1 2 的节点。有向图表示为: 5 ) 故障事件口l ,a 2 ,a 3 u ,a l v a 2 斗嘞,即a l 或4 2 发生时引起a 3 的发生。其有向 图表示为: 在有向图中,一个节点代表一个故障事件集合,弧表示弧头节点代表的故障事件 能够引起弧尾节点代表的故障事件。虽然用上述五种基本关系的组合可以表示任意复 杂的事件关联关系,但是过度复杂的关系难以理解也不便于用关联图表示因此我们 规定在一个关联关系中最多出现一种逻辑符号,且关系的后件只有一项。即个关联 关系的形式必须为下列三种之一; 口哼b a i a a 2 a a 3 a a 一b a i v 口2 v a 3 v v a 月哼b ( 3 2 2 1 a ) ( 3 2 2 t b ) 在网络故障诊断中,常用故障问的关联关系都可以分解成上述三种形式。例如关 联关系口lv ( a 2 a a 3 ) v q 4 a 5 ) 专6 可以分解成口l 专6 ,口2 a a 3 哼6 ,a a a 5 专6 三 个关系。0 iv a 2 ) ( 口3v a 4 ) 专6 经过运算后可以分解成a l a 3 _ 6 ,口ia a 4 6 , a ,a a l 一b ,a ,a a 寸b 四个关系 在一个故障事件序列中,各个事件之间存在多个关联关系,可以将这些关系用一 个有向图来表示如以下例子: 2 0 硕士论文同络故障定位和检测技术研究 例3 2 2 1 有故障事件集合u = a l ,a 2 ,a 3 ,a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论