复用段保护倒换故障处理_第1页
复用段保护倒换故障处理_第2页
复用段保护倒换故障处理_第3页
复用段保护倒换故障处理_第4页
复用段保护倒换故障处理_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、目 录第7章 复用段保护倒换故障处理7-17.1 背景知识7-17.1.1 复用段保护分类及保护原理7-17.1.2 optix 155/622设备复用段倒换的实现7-37.1.3 k字节7-67.2 常见故障现象及原因7-97.3 故障定位方法与步骤7-107.3.1 常用定位方法7-107.3.2 故障定位步骤7-107.4 分类故障定位与排除7-137.4.1 检查并分析外部原因7-137.4.2 检查aps协议和复用段参数7-137.4.3 其他7-147.5 常见故障处理案例7-157.5.1 复用段节点倒换状态不正确的处理7-157.5.2 复用段节点参数设置错误导致倒换失败7-1

2、67.5.3 网元处于安装态复用段倒换异常7-177.5.4 光路误码复用段未倒换7-187.5.5 下插了ms_rdi告警导致复用段倒换异常7-19插图目录图7-1 二纤双向复用段共享保护环7-1图7-2 复用段模块7-3图7-3 复用段倒换算法和网元侧/单板侧的关系7-3图7-4 aps状态迁移的过程图7-4图7-5 k1字节的比特安排7-6图7-6 k2字节的比特安排7-7图7-7 复用段故障定位流程7-11图7-8 系统组网图7-15图7-9 系统组网图7-16图7-10 系统组网图7-17图7-11 系统组网图7-18图7-12 系统组网图7-19表格目录表7-1 复用段协议控制器的

3、状态7-4表7-2 aps状态迁移的过程7-5表7-3 桥接请求码的定义7-7表7-4 长路径/短路径标示码的含义7-8表7-5 状态标示码的含义7-8表7-6 复用段保护倒换故障的常见原因7-9第7章 复用段保护倒换故障处理复用段保护(msp)是实现sdh传输网自愈功能的重要方法之一。本章描述复用段保护倒换故障的处理方法。7.1 背景知识这里只介绍与复用段相关的一些原理知识和技术要点。7.1.1 复用段保护分类及保护原理复用段保护可以分成以下4种:l 二纤双向复用段共享保护环;l 二纤单向复用段保护环(专用环);l 线性复用段1+1/1:1 保护;l 四纤双向复用段保护环。下面对最常用的二纤

4、双向复用段共享保护环作一简单介绍:1. 二纤双向复用段共享保护环的原理二纤双向复用段共享保护环的保护倒换过程如图7-1所示。图7-1 二纤双向复用段共享保护环在二纤双向复用段共享保护环中,将每个传输方向光纤的容量一半分配给业务通道,另外一半分配给保护通道。正常情况下,图(a)所示,从节点a进环以节点c为目的的业务信号沿s1/p2光纤按顺时针方向传输;而从节点c进环以节点a为目的的业务信号则沿s2/p1光纤按逆时针方向传输。当节点b、c间两根光纤同时被切断,图(b)所示,节点b与节点c的倒换开关将s1/p2光纤与s2/p1光纤沟通。在节点b将从节点a进环沿s1/p2光纤送来的业务信号时隙转移到s

5、2/p1光纤的保护时隙,传送到节点c。在节点c将从本节点进环沿s2/p1光纤送出的业务信号时隙倒换至s1/p2光纤的保护时隙,传送到节点a。因为二纤双向环中每个方向的业务时隙和保护时隙在同一条光纤上传输,即在一条光纤上既传输业务信号又传输保护信号。这时,无论是接收机、发送机、光缆或节点发生故障,总是会同时影响工作通道和保护通道。2. 二纤双向复用段共享保护环的特点环上最大可保护的业务容量为kstmn/2,k为环上节点数。对于节点之间业务分布均匀的情况可以大大提高传输容量,而对于集中型的业务分布则体现不出它的优越性。对于stm-4级别的二纤双向复用段共享保护环,第一、二个vc-4是工作信道,第三

6、、四个vc-4是保护信道。由于k1、k2字节中分别用四个bit表示节点号,所以环上最大节点数为16个。中继站(reg)不需占用节点号。不带额外业务的环,在没有先前的桥接请求以及短于1200km光纤的情况下,倒换完成时间应少于50ms。3. 倒换过程二纤双向复用段保护是利用光纤容量的一半作为工作信道,另一半作为保护信道,对于两根光纤来说,一根光纤的保护信道用于保护另一根光纤的工作信道。还可以用来传送额外业务,在发生倒换时,额外业务将被抛弃。它的保护倒换属于双端倒换,即故障两侧的节点要同时倒换,所以需要协议来完成。我们用的是复用段开销中的k1、k2字节来传送aps协议。由于需要协议,所以倒换时间比

7、通道倒换要长,而且对设备的软硬件要求都很高。在工作信道恢复正常后,倒换并不马上恢复,而是要等待一段时间,这段时间称为wtr(等待恢复时间),这是为了避免线路不稳定而引起频繁倒换,wtr一般为512分钟。7.1.2 optix 155/622设备复用段倒换的实现1. 复用段保护遵循的标准optix 155/622遵循itu-t关于sdh保护倒换的标准建议: g.803/ g.782/ g.783/ g.8412. 复用段倒换的实现optix 系统的复用段保护倒换是由复用段模块实现,该模块的结构和接口关系如图7-2所示。图7-2 复用段模块复用段倒换算法和网元侧/单板侧的关系如图7-3所示。图7-

8、3 复用段倒换算法和网元侧/单板侧的关系在线路上出现故障时,由线路板检测到sd(信号劣化)或sf(信号失效)条件,然后上报到主控板,主控板根据aps(自动保护倒换)协议产生k字节并通过线路板发送出去,其它节点的线路板收到k字节后上报主控板,由主控板完成aps协议。最后主控板根据协议确定各节点的倒换状态,然后下发命令到交叉板进行业务的倒换。sf包括r_los、r_lof、ms_ais、au_lop;sd包括b2sd和b2over。线路板用b2_over和b2_sd两个告警来监测线路的误码,出现b2_over的条件为误码率超过10-3,出现b2_sd的条件为误码率超过10-6。主机软件缺省状态下,

9、sd启动复用段倒换的功能为关闭状态。复用段倒换控制器(apsc)可以通过网管进行启动、停止。配置完成后(2分钟后)自动启动复用段倒换控制器。3. 复用段控制器的状态迁移复用段协议控制器共有6种状态,如表7-1所示。表7-1 复用段协议控制器的状态状态表示协议停止态stop(0)协议正常态idle(1)暂倒换态sa(2)倒换态s(4)等待恢复态wtr(5)穿通态pass(6)协议的作用就是根据线路板检测到的通信质量信息、接收到的k字节或外部命令,控制这些状态之间的转移。aps状态迁移的过程如图7-5所示。图7-5 aps状态迁移的过程图表7-2 aps状态迁移的过程过程编号转移条件常见情况事件过

10、程接收到协议启动命令。主控复位;重新下发配置数据;由网管下发协议启动命令。各站在协议正常的情况下,复位其中一个站的协议的启动过程。略接收到协议停止命令下发协议停止命令,交叉、时钟板不在位。协议停止过程。略接收到短径来的无请求码。故障恢复。断纤恢复过程。接收到短径来的无请求码;取消k字节穿通;向两侧发送无请求码;协议恢复到正常状态。收到其它站点间的桥接倒换确认命令其他站点间出现故障。断纤倒换过程。收到其它站点间的桥接倒换请求后,执行k字节穿通;收到其它站点间的桥接倒换确认后,执行业务穿通。接收到短径来的桥接恢复请求。故障恢复。断纤恢复过程。检测到sf或sd消失,向长径和短径发送桥接倒换恢复请求;

11、收到短径来的桥接倒换恢复请求,进入等待恢复态wtr。等待设定的时长后,进入idle状态。接收到长径来的桥接倒换请求或桥接倒换确认。检测到sf或sd;接收到外部强制倒换命令。断纤倒换过程。检测到sf或sd后,进入倒换暂态sa;接收到长径来的桥接倒换请求或桥接倒换确认后,进入倒换态。当前倒换侧接收到非本节点的长径桥接倒换请求。整环依次启动协议过程。倒换侧节点协议启动过程。略接收到长径来的桥接倒换请求或桥接倒换确认。穿通站点一侧检测到sf信号。再断掉已处于倒换状态站点的另一侧光纤,其光纤相连站点由pass状态转移到s状态。检测到sf信号,发送短径、长径倒换请求,启动t1定时器,进入倒换暂态sa;接收

12、到长径来的桥接倒换请求或桥接倒换确认后,进入倒换态,命令交叉板进行页面切换。4. 复用段倒换的方式通过网管和命令行可以实现强制倒换、人工倒换、锁定倒换等功能。强制倒换是指强制使业务从工作信道倒换到保护信道,不管保护信道的状态是否正常;另外强制倒换之后,无论工作信道是否正常,系统将不会倒换回工组信道,也就是说执行了强制倒换后,系统将一直处于倒换状态下,不会自动恢复,除非再人为解除这一倒换操作。人工倒换是指命令将业务从工作信道倒换到保护信道,如果保护信道处于正常状态,则倒换将发生,若保护信道处于失效或正在满足一个更高级别的倒换,则倒换不会发生;如果工作信道是好的,那么这次倒换动作将在恢复时间到了之

13、后又自动回到最初的正常状态;这一操作主要是设备维护时用来测试网络目前是否还具有保护能力。锁定倒换只是对相邻两点之间链路进行设定。如果原系统都处于正常状态,那么锁定倒换的作用将是,让这两点之间发生的断纤、坏板故障不再引起倒换动作,通过这段路径传送的业务将会中断,但不影响不通过这段路径传的业务;但是如果正常时,发生的断纤不是这段被锁定的链路,还是能实现全环的保护。 如果已经断纤并倒换后,下发锁定倒换命令,然后恢复断纤,到达恢复时间后,倒换会恢复(如果不恢复断纤,倒换不会恢复)。故锁定倒换只是在应倒换时锁定不让发生倒换,但是允许恢复。7.1.3 k字节以下关于k1、k2字节的解释只涉及在复用段维护中

14、所需要的内容,其详细解释可参见g.841建议。k1、k2字节位于复用段开销字节中,主要完成复用段倒换时信息的传递。1. k1字节k1字节的14比特位用来传送桥接请求码,58比特位用作桥接请求码的目的节点id的传送。k1字节的比特安排如图7-6所示:图7-6 k1字节的比特安排桥接请求码(14比特位)的定义如表7-3所示。表7-3 桥接请求码的定义比特码十六进制码含义1111f对区段的保护闭锁(lp-s)或信号失效保护(sf-p)1110e区段强制倒换(fs-s)1101d环强制倒换(fs-r)1100c区段信号失效(sf-s)1011b环信号失效(sf-r)1010a保护通路信号劣化(sd-p

15、)10019区段信号劣化(sd-s)10008环信号劣化(sd-r)01117区段人工倒换(ms-s)01106环人工倒换(ms-r)01015等待恢复(wtr)01004区段演习(exer-s)00113环演习(exer-r)00102区段反向请求(rr-s)00011环反向请求(rr-r)00000无请求(nr)目的节点标示码(58比特位):由于只有四个比特位,因此一个复用段保护环上的网元数最多不能超过16个。2. k2字节k2字节的比特安排如图7-7所示。图7-7 k2字节的比特安排长路径/短路径标示码(第5比特位)的含义如表7-4所示。表7-4 长路径/短路径标示码的含义比特码含义0短

16、路径1长路径状态标示码(68比特位)的含义如表7-5所示。表7-5 状态标示码的含义比特码含义111ms_ais110ms_rdi101保留100保留011在保护通路有额外业务010桥接和保护001桥接000空闲7.2 常见故障现象及原因保护倒换故障,是指在全网正常状态下突然发生不明原因的倒换,或者在应该发生保护倒换时,全网未进入保护倒换状态,或进入保护倒换后,全网或部分业务发生中断的情况。复用段保护倒换的常见故障现象是如表7-6所示,可分为外部原因、数据配置原因以及设备故障原因三大类。复用段保护倒换故障可能是其中的某一故障引起的,也可能是由于其中某些故障共同引起的。所以要根据具体的情况,采用

17、基本的故障定位方法逐个分析。表7-6 复用段保护倒换故障的常见原因故障类别故障原因外部原因光纤连接错误倒换协议异常人为插入了ms_ais、ms_rdi告警数据配置全网业务配置不正确复用段参数配置不正确设备原因线路板故障交叉板故障scc板故障母板故障7.3 故障定位方法与步骤7.3.1 常用定位方法l 环回法l 配置数据分析法7.3.2 故障定位步骤复用段故障定位流程如图7-9所示。图7-9 复用段故障定位流程1. 检查复用段参数、状态对复用段保护环,业务异常时应先检查各个节点的复用段状态是否正常;并检查线路质量、确认引起复用段倒换的原因。对复用段保护环,日常维护时应注意检查环上各个网元的节点参

18、数设置是否正确,节点号是否按主环方向递增,协议是否已启动,各个网元的协议状态是否为正常状态。2. 按照链型网,逐段环回定位故障如果aps协议的状态正常,但业务仍然不通,可以通过分析业务中断时的业务流向,将复用段环当作一条环型的链来进行故障定位。这种方法定位故障起来比较简单,可以迅速定位出故障点。将复用段环当作一条环型的链之后,可以用逐段环回的方法来定位故障。这里逐段环回时aps协议仍保持启动状态,逐段环回的手段和前面讲述的所有区别:因为倒换发生后业务可能不但要经过主用通道,还要经过备用通道,因此我们环回的vc-4可能既有主用通道的vc-4,也有备用通道的vc-4,视业务经过的路径而定。环回第一

19、个vc-4会影响ecc,要注意。3. 强制倒换,先恢复业务比如某段光路有大误码,我们可以通过拔纤或下发强制倒换命令,使业务先恢复正常,然后再处理故障。7.4 分类故障定位与排除7.4.1 检查并分析外部原因在处理故障时,首先应该检查设备外部的情况,例如是否人为停止了aps协议,错误设置了强制倒换,人为插入了ms_ais、ms_rdi告警;同时应检查是否供电系统出现了问题,如电源故障,蓄电池故障等。在排除外部原因后,如果故障仍然存在,可采用其他方法进行故障定位。7.4.2 检查aps协议和复用段参数1. 保护倒换协议正常启动,但保护倒换不成功检查复用段协议是判断故障时必须进行的步骤。通过网管对各

20、个网元的当前的状态进行查询,若整个网络中有两个相邻网元的状态为“倒换态”(s),而其他网元均为“穿通态”(p),则说明aps协议正常启动。若各网元的状态正确,aps正常启动,但业务仍然中断,首先可以考虑通过网管重新启动协议;如果重新启停协议后,业务仍然中断,则须考虑是否是单板存在问题,这时可以按一般的业务中断故障进行处理。2. 保护倒换协议异常,保护倒换不成功aps协议异常通常有两种现象:(1) aps协议不能正常启动/停止;(2) 部分/全部网元的站点状态异常;aps协议异常,会引起k字节的穿通和上报出现问题,从而导致保护倒换不成功。此时可以先检查各网元的复用段参数是否配置正确,是否有的网元

21、的复用段参数丢失;如果参数设置没有异常,可以检查光板和主控板是否工作正常。参数设置时需要注意:(1) 线路板要求使用对偶板位/通道复用段组网对网元的板位有要求,要求光板所用的板位或通道必须对偶。对偶板位或通道提供的板间通信功能,可以完成k字节的穿通。进行复用段组网时,应确认所用光口的板位或通道是否对偶。(2) 逆时针方向、主环方向逆时针方向为主环方向。将网元上相邻光板的左边板位称为西向,右边板位称为东向。逆时针组环要求环上各节点的东向板位光板与下游站西向板位的光板相连,西向板位的光板与上游站网元东向板位的光板相连。(3) 复用段环的数据设定复用段参数包括:逻辑系统号、复用段节点号、最大节点号、

22、等待恢复时间。复用段参数设置必须准确,否则可能导致复用段倒换失败。 【逻辑系统号】optix 设备为多adm(madm)设备,可同时支持多个复用段保护环,逻辑系统号用以区分不同的复用段保护环。【复用段节点号】环上复用段节点号,可任选一个网元从“0”开始,按主环方向逐站递增,最大节点号为15。属性为reg的网元不需节点号。【最大节点号】最大节点号:为复用段节点总数1。【等待恢复时间】一般设置为600秒。7.4.3 其他k2字节的状态标示码(68比特位)是反映aps协议的状态,如果人为的改变这3个比特位,将会影响的网元对k字节的正常判断和处理。在平时的维护、测试时,可能会人为的对设备插入ms_ai

23、s、ms_rdi告警,这些告警将直接影响到k2字节,因此必须在使用完毕后取消这些告警,否则会影响aps正常工作,全网不能正常倒换。7.5 常见故障处理案例7.5.1 复用段节点倒换状态不正确的处理1. 系统概述某传输组网如图7-10所示。5个站组成的一个stm-4复用段保护环,1号站为网关网元,1号站到其它各个站有业务。图7-10 系统组网图2. 故障现象环上2号网元与3号网元之间断纤后,环上业务出现中断。3. 故障分析及排除断纤复用段倒换后业务应能正常保护倒换,出现业务中断的原因可能是复用段倒换失败,各节点的倒换状态不对。查询3、4、5、1、2号网元的复用段倒换状态,不是s、p、p、p、s态

24、。倒换状态不正确。通过网管“维护”菜单下的“复用段维护”,将复用段协议控制器停止后重新启动,业务出现正常。4. 结论及建议在业务中断的情况下,及时恢复业务很重要。由于复用段协议复杂,受各种因素的影响可能导致倒换失败。在这种情况下可以重新启停协议,试一下倒换能否恢复正常。遇到复用段倒换失败,应查明原因。optix 提供了复用段倒换事件记录的功能,复用段倒换失败应及时通知华为公司的维护工程师,以便收集数据进行分析。7.5.2 复用段节点参数设置错误导致倒换失败1. 系统概述某传输组网如图7-11所示。5个站组成的一个stm-4复用段保护环,1号站为网关网元,1号站到其它各个站有业务。图7-11 系

25、统组网图2. 故障现象2号和3号网元之间断纤后,部分业务中断。查询3、4、5、1、2号网元的复用段倒换状态,不是s、p、p、p、s态,倒换状态不正确。 重新启动复用段协议,也不能进入正常的复用段倒换状态。3. 故障分析及排除重新启动协议不能恢复正常,可能与复用段节点参数设置有关。查询环上各个网元的复用段参数,结果为:站名1号2号3号4号5号查询返回的复用段节点号04321从上表中可以看出,复用段节点参数未按逆时针方向设置,设置的方向与逆时针方向相反。在网管上按逆时针方向重新设置复用段节点参数后,重启协议恢复正常。4. 结论及建议复用段节点参数设置错误导致了倒换出现异常。如:2号网元复用段模块处

26、理时,默认为西向光板对应的网元节点号比本身小1,东向光板对应的网元节点号比本身大1。如果复用段节点参数设置不正确,必将导致协议处理出现异常。复用段参数的设置必须按逆时针方向从“0”逐站递增,最大节点数为环上节点数-1。复用段参数的设置和修改要仔细。7.5.3 网元处于安装态复用段倒换异常1. 系统概述某传输组网如图7-12所示。5个站组成的一个stm-4复用段保护环,1号站为网关网元,1号站到其它各个站有业务。图7-12 系统组网图2. 故障现象某日,2号网元与3号网元之间断纤后,网上部分业务中断。查询全网倒换告警,发现4号网元无保护倒换告警,查询倒换状态4号网元未进入穿通态。3. 故障分析及排除网元未进入倒换状态,可能与配置有关。查询各网元的复用段参数,发现4号网元复用段参数丢失。查询4号网元的网元运行状态,为“安装态”。重新配置数据后,启动协议正常。4. 结论及建议由于网元进入安装态,配置和复用段节点参数丢失,导致复用段倒换不正常。由于复用段倒换协议涉及到主控板、线路板、交叉板,环上此类单板任何一块工作不正常都可能导致复用段倒换失败。在日常维护中,如果发现网元进入安装态或者有单板不在位,应及时处理。7.5.4 光路误码复用段未倒换1. 系统概述某传输组网如图7-13所示。5个站组成的一个stm-4复用段保护环,1号站为网关网元,1号站到其它各个站有业务。图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论