谈SDH传输网络故障的处理与维护方法.doc_第1页
谈SDH传输网络故障的处理与维护方法.doc_第2页
谈SDH传输网络故障的处理与维护方法.doc_第3页
谈SDH传输网络故障的处理与维护方法.doc_第4页
谈SDH传输网络故障的处理与维护方法.doc_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

谈SDH传输网络故障的处理与维护方法【摘要】随着SDH光传输网的不断升级和发展,以及网络规模不断扩大,对维护人员维护能力的要求越来越高。如何在实践中根据设备网管告警及利用仪表等,在最短时间内定位并处理故障是每一位维护人员应该具有的业务素质。本文主要讲述了传输故障处理的一般原则以及SDH设备一般故障的判断、定位、处理方法。【关键词】故障处理、故障定位、处理方法【正文】传输系统的日常维护工作经常要求我们对各类故障进行定位并及时排除。故障定位最关键的是将故障点准确地定位到单站,然后排除故障。这就需要对故障产生的原因、处理的思路及方法有一个清晰的认识,这样才能够达到事半功倍的效果。一、传输故障定位的基本原则传输故障定位一般应遵循以下原则: 先抢通后修复; 先外部后传输; 先单站后单板; 先线路后支路; 先高级后低级。 1先抢通后修复在出现故障时,系统维护者要首先抢通业务然后进行故障修复。如果存在影响业务情况下的传输网络告警故障,如在2Mbit/s业务通道出现LOS(信号丢失)告警,因外线原因导致的收无光告警,单元盘故障产生的UnitFailure(单元失效)告警等情况下产生的故障,必须首先抢通业务。不过要想先抢通业务需要一个先决条件,那就是网络中有与故障通道相同起始点的可用通道资源或与故障板件相同的可用备板。 2先外部后传输在处理故障时应先排除外部的可能因素,如断纤、终端设备故障、电源或机房环境配套故障等,而后进行传输系统原因查找。当可能存在外界因素影响而产生传输网络告警故障时,如设备温度告警、光路告警、网元失效告警,也需照此原则处理。3先单站后单板 指在查找传输设备故障原因时,需要先定位到站点再定位到板件。一般设备故障时,不会只是一个站点出现告警,而是在很多站点同时上报告警。这时就需要通过分析和判断缩小范围,快速、准确地定位是哪个单站的问题,而后尽可能准确地将故障定位到单站后再具体定位到单板。如处理光路误码、光功率异常等告警处理时,需要结合业务信号流,对告警与性能事件一起进行分析。可采用环回法、替代法、数据分析法、仪表测试法来判断告警及故障产生的原因,将其定位到单板。 4先线路后支路 在处理故障时,如果支路出现了大量AIS告警,这时需要先排除线路板故障再查看支路板故障。由于传输系统线路板的故障常常会引起支路板的异常告警,在处理告警时,应按“先线路后支路”的顺序,排除网管告警;如支路出现大量AIS则首先查看线路板是否出现LOS告警或其他异常告警,再查看支路板告警。 5先高级后低级在进行告警分析时,先分析高级别告警再分析低级别告警。特别是当高、低级别告警同时存在时,应首先分析级别高的告警,如紧急告警、主要告警,然后再分析低级别的告警,如次要告警、一般告警。处理告警时,系统维护者先处理影响业务的告警。如果这些告警是由更高一级的告警引起的,则先处理更高一级的告警,如AIS、LOP等。如果是由LOS引发的,要先处理LOS告警。二、常见故障分类在实际维护工作中,我们会遇到各种各样的故障,总体来说,可以归纳为以下几类:1光缆线路故障。包括光缆线路中断,光缆线路总衰耗过大等。 2尾纤故障。包括尾纤断,尾纤弯曲半径过小,法兰盘接头有灰尘及尾纤头脏等。 3单盘故障。包括线路板、2M板、时钟板、交叉板、主控板等器件损坏及由于环境、温湿度等影响板子正常工作等情况。 4电缆故障。包括2M电缆中断,DDF架侧2M接口输入/输出端口脱落或松动而造成的接触不良及VDF架卡线松动等。 5电源系统故障。包括交流停电,设备直流掉电及熔断器故障等。 6网管系统故障。包括网管与设备之间的网线故障或系统异常而造成的ECC通道中断,死机等情况。 三、故障处理思路在遇到故障时,系统维护者应该不慌不乱,仔细查看故障现象并分析可能原因,从而做到有的放矢,迅速处理。故障处理一般应遵循“先看,再问,然后思考,最后动手”的思路。在设备的实际维护过程中,故障告警不是一个一个孤立地出现的,某一设备的故障往往引发相关设备的连锁告警反应,因此,在分析故障告警时,不要仅对某一个告警进行孤立的分析,要从网络系统的角度去分析告警现象,以便正确定位故障点。 系统维护者到达现场后首先查看故障的现象,包括故障出现的位置,有哪些告警,故障的严重程度,造成的危害等,这样才能够明白故障的本质。 查看完现象后,系统维护者应询问各阶段现场人员,该现象是由何种原因造成,比如是否有人修改了数据,删除了文件,更换了电路板;是否遭遇停电或雷击,是否存在操作不当现象。根据以上结果,系统维护者再结合自己的知识思考、分析,判断何种原因可能引起该种故障等,做出较为正确的判断。最后根据故障定位原则找出故障点,通过修改数据、更换单板等方法排除故障。四、故障定位1故障定位的关键SDH设备的故障定位SDH设备的故障定位中,最关键的一步就是将故障点准确定位到单站。由于传输设备自身的应用特点站与站之间的距离较远,因此在进行故障定位时,首先将故障点准确地定位到单站,是极其重要和关键的。在将故障点准确的定位到单站后,就可以集中精力,通过数据分析、硬件检查、更换单板等手段来排除该站的故障。2故障定位的一般原则在定位故障时,应先排除外部的可能因素,如光纤断、交换故障或电源问题等,再考虑传输设备的问题;在定位故障时,要尽可能准确的定位出是哪个站的问题,再将故障定位到单板;线路板的故障常常会引起支路板的异常告警,因此在故障定位时,先考虑线路,再考虑支路;在分析告警时,应先分析高级别告警,再分析低级别告警。3定位故障的一般过程 (1) 检查光纤、电缆是否接错、光路和网管系统是否正常,排除设备外的故障。(2) 检查各站点业务配置是否正确,排除配置错误的可能性。(3) 通过告警性能来分析故障的原因。(4) 通过逐段环回来进行故障的区段定位,将故障最终定位到单站。(5) 通过单站自环测试来定位故障板。(6) 通过更换单板来定位故障板。五、常见传输故障处理方法在SDH设备的维护过程中,为了快速准确的发现问题和解决问题,因此,有必要对发生的故障及时定位,定位越准确越有利于故障的排除,比如定位到单板。这这也对维护人员除了更高的要求,首先,必须了解各故障的表现;其次要了解各故障的成因;再次,要了解问题处理的原则;最后,要掌握常见故障的处理方法,这也是重中之重,下面我们就详细介绍各种故障处理法。我们将常见的SDH设备故障排除的方法简单的归纳为7种。分别称为告警性能分析法、环回测试法、插拔法、替换法、配置数据分析法、仪表测试法和经验处理法等。 1.告警性能分析法系统故障时一般会伴有相应的告警信息。通过观察告警灯运行情况,可以及时发现故障。故障发生时,网管上也会记录非常丰富的告警事件和性能数据信息,通过分析这些信息,并结合SDH帧结构中的开销字节和SDH告警原理机制,初步判断故障类型和故障点的位置。 2.环回测试法有时观察分析法不能解决问题,如组网、业务以及故障信息相当复杂的情况和无明显告警和性能信息上报的特殊故障情况。系统维护者可以利用网管提供的维护功能进行测试,判断故障点和类型。最常见的方法是环回。环回有多种方式,如内环回与外环回,远端环回与本地环回,线路环回与支路环回等。进行环回操作时,首先应进行环回业务通道采样,即从多个有故障的站点中选择其中的一个站点,从所选站点的多个有问题的业务通道中选择其中的一个业务通道;然后画出所采样业务的一个方向的路径图,图中要标出该业务的源和宿及所经过的站点、所占用的VC4通道和时隙等;最后逐段环回,定位故障站点及单板。环回法可分为硬件环回与软件环回。其中硬件环回彻底,但是不能远程操作,也不方便。软件回环则恰恰相反,方便也可以远程操作,但是对故障的定位不如硬件回环准确。环回是定位故障点最有效和常用的方法,它不需要对告警和性能做太深入的分析,缺点是会影响业务,一般在业务量小的时候使用。 3.插拔法 当发现某种电路板有故障时,系统维护者可以通过插拔一下电路板和外部接口插头的方法,排除因接触不良或处理机异常产生的故障。在插拔时,系统维护者要注意遵循单板插拔的操作规范,以免导致其它问题甚至损坏板件。 4.替换法当用插拔法不能解决问题时,可以考虑替换法。替换法就是使用一个正常的备件去替换一个被怀疑工作不正常的元件,从而实现故障的定位和排除。 替换法适用于排除传输外部设备的问题,如光纤、中继电缆、交换机、供电设备等。或故障定位到单站后,用于排除单站内单板的问题。 替换法的优点在于方法简单,对维护人员要求不高,比较实用,但对备件有要求。另外替换插拔电路板时,需要按照操作规范执行。 5.配置数据分析法 配置数据分析法是指通过开销字节配置及状态分析、更改交叉连接等手段对告警进行辅助判断和处理的故障排除方法。 配置数据分析法的优点是不影响业务,不需要仪表,能够正确识别硬件连接错位,处理效率高。但是故障定位的时间相对较长,且对维护人员的要求非常高。一般只有对设备非常熟悉且经验非常丰富的维护人员才能使用。在使用该方法时,应尽量选择J0/J1/V3等不影响业务的踪迹字节和其他状态字节。 6.仪表测试法 仪表测试法一般用于排除传输设备外部问题以及与其它设备的对接问题。传输设备常用测试仪表包括2Mbit/s误码测试仪、SDH测试仪、光谱分析仪等。 通过仪表测试法分析定位故障比较准确。缺点是对仪表有需求,同时对维护人员的要求也较高。 7.经验处理法 在一些特殊的情况下,如由于瞬间供电异常,低压或外部强烈的电磁干扰,致使传输设备某些单板进入异常工作状态。此时的故障现象,如业务中断、ECC通信中断等,可能伴随相应的告警,也可能没有任何告警,检查各单板的配置数据可能也是完全正常的。经验证明,在这种情况下,系统维护者通过复位单板,网元掉电重启,重新下发配置或将业务倒换到备用通道等手段,可有效地及时排除故障、恢复业务。建议系统维护者尽量少使用该方法来处理,因为该方法不利于故障原因的彻底查清。遇到这种情况,除非情况紧急,一般还是应尽量使用前面介绍的几种方法,或通过正确渠道请求技术支援,尽可能地将故障定位出来,以消除设备内外的隐患。 六、典型案例分析为了更深入地理解传输故障的处理思路和方法,现针对实际案例,结合以上方法原则进行分析探讨。案例:横沙站V-NODE设备2M业务误码故障处理1故障现象:横沙站为新装设备,新开通的2M业务有误码,业务不能正常运行;2故障定位处理步骤:(1) 先作光路收发光端口自环,配置2M业务至光口上,使用2M误码测试仪测试环回,测试结果表明有误码,判断故障原因就在本站点;(2) 现场V-NODE设备有2块光盘,把业务配置到另一块光盘,并同样做光口环回2M测试,仍有误码,说明故障原因与光盘无关;(3) 现场V-NODE设备有主备共2块交叉盘,更换后测试仍有误码,判断故障原因与交叉盘无关;(4) 2M单元盘更换插槽,由原第3槽更换至第4槽,重新配置业务后,使用2M误码测试仪测试环回,测试结果表明环回正常,判断2M单元盘正常;3故障结论与处理结果:由以上过程判断故障发生在V-NODE机框背板第3槽与交叉盘之间的背板总线上。处理结果为把2M单元盘改插到第4槽,开通业务,并上报设备管理部门,申请更换V-NODE主框。4分析:此次故障处理遵循先单站后单板、先抢通后恢复的原则,结合

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论