




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、MSAPMSAP故障定位、处理原则、故障定位、处理原则、技巧及案例分析技巧及案例分析讲师讲师 孙振禹孙振禹n故障定位基本原则故障定位基本原则n故障处理手段故障处理手段n故障处理技巧故障处理技巧n案例分析案例分析主要内容主要内容故障定位基本原则故障定位基本原则 先外线,后设备先外线,后设备 在定位故障时,在定位故障时, 应先排除外部的可能因素的影响,如光纤应先排除外部的可能因素的影响,如光纤断、电缆断、用户设备故障或电源问题、电缆虚接、不共断、电缆断、用户设备故障或电源问题、电缆虚接、不共地等地等 先单点,后网络先单点,后网络 尽快准确的把故障定位到单点尽快准确的把故障定位到单点 先群路,后支路
2、先群路,后支路 首先排除交叉板故障;首先排除交叉板故障; 然后再确认支路然后再确认支路 先高级,后低级先高级,后低级 分析告警时,应首先分析高级别的告警,然后再分析低级分析告警时,应首先分析高级别的告警,然后再分析低级别的告警别的告警 分析告警时,应首先分析高阶的告警,然后再分析低阶的分析告警时,应首先分析高阶的告警,然后再分析低阶的告警告警n故障定位基本原则故障定位基本原则n故障处理手段故障处理手段n故障处理技巧故障处理技巧n案例分析案例分析主要内容主要内容告警、性能数据分析法:告警、性能数据分析法: 利用传输设备网管的告警、性能数据,利用传输设备网管的告警、性能数据,可帮助我们随时了解全网
3、设备的运行情况,甚可帮助我们随时了解全网设备的运行情况,甚至能检测到故障的先兆,将故障解决在萌芽期。至能检测到故障的先兆,将故障解决在萌芽期。故障发生时可知道当前设备存在什么告警,什故障发生时可知道当前设备存在什么告警,什么时间发生的,以前曾发生过什么告警,性能么时间发生的,以前曾发生过什么告警,性能不好时将给出误码有多少等。从而分析可能发不好时将给出误码有多少等。从而分析可能发生故障的原因和部位。生故障的原因和部位。 故障定位的常用手段故障定位的常用手段(一一)排除法:排除法: 有时出现负载过重,电源过流保护,有时出现负载过重,电源过流保护,或或SDH设备没有告警,但全部业务都不通设备没有告
4、警,但全部业务都不通的情况,可以用逐块拔单元盘的方法来确的情况,可以用逐块拔单元盘的方法来确定故障盘位。定故障盘位。故障定位的常用手段故障定位的常用手段(二二)环回法:环回法: 在故障处理中有时出现大量的告警性能事件,在故障处理中有时出现大量的告警性能事件,使维修人员无从着手分析。环回法是传输设备定使维修人员无从着手分析。环回法是传输设备定位故障最常用的方法之一,它的最大特点就是依位故障最常用的方法之一,它的最大特点就是依次逐段定位故障,最终将故障定位到单站或单盘。次逐段定位故障,最终将故障定位到单站或单盘。这种方法也有它自身的缺陷,就是可能会影响正这种方法也有它自身的缺陷,就是可能会影响正常
5、的业务,并要求维护人员必须清楚设备的硬件常的业务,并要求维护人员必须清楚设备的硬件连接,如纤芯的连接方向、连接,如纤芯的连接方向、DDFDDF架的分配、业务通架的分配、业务通道的组织等,以免误操作延误故障的及时排除。道的组织等,以免误操作延误故障的及时排除。传输设备的环回操作又分为软件环回和硬件环回,传输设备的环回操作又分为软件环回和硬件环回,硬件环回相对于软件环回要更彻底,但它的操作硬件环回相对于软件环回要更彻底,但它的操作不是很方便,需到现场才能操作。网管系统提供不是很方便,需到现场才能操作。网管系统提供了软件环回功能,在电路开通和处理单个业务时了软件环回功能,在电路开通和处理单个业务时十
6、分方便。但在做光路环回和群路环回时要十分十分方便。但在做光路环回和群路环回时要十分小心,应避免环回后发生远端站数据通信通路中小心,应避免环回后发生远端站数据通信通路中断。断。故障定位的常用手段故障定位的常用手段(三三)替换法:替换法: 替换法就是使用一个正常的物件去替换替换法就是使用一个正常的物件去替换一个被怀疑工作有异常的物件,从而达到故障一个被怀疑工作有异常的物件,从而达到故障定位的目的。替换法适用于及时排除光纤、中定位的目的。替换法适用于及时排除光纤、中继电缆、单盘等故障。此法要求维修人员规范继电缆、单盘等故障。此法要求维修人员规范操作,避免正常物件的受损而造成不必要的损操作,避免正常物
7、件的受损而造成不必要的损失。失。故障定位的常用手段故障定位的常用手段(四四)配置参数修改法:配置参数修改法: 更改配置适用于故障定位到单站后,通更改配置适用于故障定位到单站后,通过修改设备的交叉配置数据、单板参数等排过修改设备的交叉配置数据、单板参数等排除故障。如怀疑某一槽位有问题时,可通过除故障。如怀疑某一槽位有问题时,可通过更改板位配置进行排除。更改配置法操作起更改板位配置进行排除。更改配置法操作起来比较复杂,对维修人员要求较高,一般不来比较复杂,对维修人员要求较高,一般不提倡使用,使用此方法前必须对原配置数据提倡使用,使用此方法前必须对原配置数据进行备份,同时对所进行的操作进行记录,进行
8、备份,同时对所进行的操作进行记录,以便故障定位。以便故障定位。故障定位的常用手段故障定位的常用手段(五五)1、以尽快恢复业务为原则,但同时一定要做好故障记录,、以尽快恢复业务为原则,但同时一定要做好故障记录, 留作分析,防止潜在问题的遗留。留作分析,防止潜在问题的遗留。2、在解决问题过程中,尽可能少地进行掉电、拔盘等危险、在解决问题过程中,尽可能少地进行掉电、拔盘等危险 操作,避免因为操作不当而导致问题扩大化。操作,避免因为操作不当而导致问题扩大化。3、尽量通过分析解决问题,避免盲目换盘。、尽量通过分析解决问题,避免盲目换盘。4、在自身无法解决问题的情况下,应向单位负责人汇报,、在自身无法解决
9、问题的情况下,应向单位负责人汇报, 请求技术支援。请求技术支援。5、设备维修人员应注意对维修知识的学习,从故障处理过、设备维修人员应注意对维修知识的学习,从故障处理过 程中吸取维修经验。程中吸取维修经验。6、处理完故障要写维修报告。、处理完故障要写维修报告。故障处理的基本原则故障处理的基本原则n故障定位基本原则故障定位基本原则n故障处理手段故障处理手段n故障处理技巧故障处理技巧n案例分析案例分析主要内容主要内容设备指示灯设备指示灯 城网直通车设备接口城网直通车设备接口 光接口光接口LOSLOS或者或者OLOSOLOS,灯灭表示正常,红灯光,灯灭表示正常,红灯光缆故障缆故障 E1E1接口接口E1
10、 LOSE1 LOS,灯灭表示正常,红灯电缆故障,灯灭表示正常,红灯电缆故障; ;红灯慢闪表环回;红灯快闪表红灯慢闪表环回;红灯快闪表AISAIS。有些设备。有些设备(LMXE)(LMXE)没有没有E1E1接口指示灯,需要从网管及对端设接口指示灯,需要从网管及对端设备判定备判定 V.35V.35接口接口V.35 LOSV.35 LOS,灯灭表示正常,红灯电缆,灯灭表示正常,红灯电缆故障故障 10/100Base-T10/100Base-T接口接口处绿灯表接口接口处绿灯表LINKLINK状态,黄状态,黄灯表示全、半双工状态灯表示全、半双工状态 10/100Base-Fx10/100Base-Fx
11、接口灯灭表示正常,红灯光缆接口灯灭表示正常,红灯光缆故障故障n城网直通车设备通用告警指示灯城网直通车设备通用告警指示灯n紧急告警紧急告警 ALM-Pn一般告警一般告警 AML-Dn城网直通车设备个性告警指示灯城网直通车设备个性告警指示灯nH9MO-LMA的的Err灯指示光接口有误码灯指示光接口有误码nH9MO-LMXE的的BER3、BER6指标光接口指标光接口误码误码设备指示灯设备指示灯n故障处理技巧故障处理技巧n利用设备指示灯判定故障利用设备指示灯判定故障n利用开销字节判定故障利用开销字节判定故障n板卡及设备故障简易判定板卡及设备故障简易判定n对对MSAP告警的理解告警的理解故障处理技巧故障
12、处理技巧利用设备指示灯判别故障利用设备指示灯判别故障 城网直通车设备接口城网直通车设备接口 光接口光接口LOSLOS或者或者OLOSOLOS,灯灭表示正常,红灯光,灯灭表示正常,红灯光缆故障缆故障 E1E1接口接口E1 LOSE1 LOS,灯灭表示正常,红灯电缆故障,灯灭表示正常,红灯电缆故障; ;红灯慢闪表环回;红灯快闪表红灯慢闪表环回;红灯快闪表AISAIS。有些设备。有些设备(LMXE)(LMXE)没有没有E1E1接口指示灯,需要从网管及对端设接口指示灯,需要从网管及对端设备判定备判定 V.35V.35接口接口V.35 LOSV.35 LOS,灯灭表示正常,红灯电缆,灯灭表示正常,红灯电
13、缆故障故障 10/100Base-T10/100Base-T接口接口处绿灯表接口接口处绿灯表LINKLINK状态,黄状态,黄灯表示全、半双工状态灯表示全、半双工状态 10/100Base-Fx10/100Base-Fx接口灯灭表示正常,红灯光缆接口灯灭表示正常,红灯光缆故障故障利用设备指示灯判别故障利用设备指示灯判别故障n城网直通车设备通用告警指示灯城网直通车设备通用告警指示灯n紧急告警紧急告警 ALM-Pn一般告警一般告警 AML-Dn城网直通车设备个性告警指示灯城网直通车设备个性告警指示灯nH9MO-LMA的的Err灯指示光接口有误码灯指示光接口有误码nH9MO-LMXE的的BER3、BE
14、R6指标光接口指标光接口误码误码n故障处理技巧故障处理技巧n利用设备指示灯判定故障利用设备指示灯判定故障n利用开销字节判定故障利用开销字节判定故障n板卡及设备故障简易判定板卡及设备故障简易判定n对对MSAP告警的理解告警的理解故障处理技巧故障处理技巧更改更改J0字节跟踪光纤连接字节跟踪光纤连接 适用场景适用场景 设备多光方向连出时设备多光方向连出时 组环时组环时 使用方法使用方法 改变改变J0字节为约定字符,在接收侧观察是否在字节为约定字符,在接收侧观察是否在对应光口收到该字节。反之亦然。对应光口收到该字节。反之亦然。 思考问题?思考问题? 出现出现RS-TIM告警如何处理?告警如何处理?更改
15、更改J1字节跟踪高阶通道字节跟踪高阶通道 适用场景适用场景 VC-4、VC-3高阶业务时高阶业务时 使用方法使用方法 改变改变J1字节为约定字符,在接收侧观察是否在字节为约定字符,在接收侧观察是否在对应光口收到该字节。反之亦然。对应光口收到该字节。反之亦然。 思考问题?思考问题? 出现出现HP-TIM告警如何处理?告警如何处理?更改更改J2字节跟踪低阶通道字节跟踪低阶通道 适用场景适用场景 多通道绑定的以太网业务,无低阶告警,怀疑多通道绑定的以太网业务,无低阶告警,怀疑时隙未一一对应时隙未一一对应 与其它与其它MSAP厂家或者自己产品跨网对通时厂家或者自己产品跨网对通时 使用方法使用方法 改变
16、改变J2字节为约定字符,在接收侧观察是否在字节为约定字符,在接收侧观察是否在对应通道收到该字节。反之亦然。对应通道收到该字节。反之亦然。 多通道绑定的以太网业务中可用些方法逐个核多通道绑定的以太网业务中可用些方法逐个核对时隙;对时隙; 跨网对通时,可检查时隙对应否正确跨网对通时,可检查时隙对应否正确 思考问题?思考问题? 出现出现LP-TIM告警如何处理?告警如何处理?正确利用以太网端口包统计正确利用以太网端口包统计 适用场景适用场景 具有端口数据包统计功能的板卡及设备在开通具有端口数据包统计功能的板卡及设备在开通以太网业务以太网业务 使用方法使用方法 从网管上查询板卡或者设备的以太网端口包的
17、从网管上查询板卡或者设备的以太网端口包的收、发统计数是否在同比增加。增加表明以太收、发统计数是否在同比增加。增加表明以太网业务正常;收增长、发不增长或者发增长、网业务正常;收增长、发不增长或者发增长、收不增长都表明业务不正常,需要查明原因。收不增长都表明业务不正常,需要查明原因。 思考问题?思考问题? 端口发包统计是来源于那个方向?端口发包统计是来源于那个方向? 端口收包统计是来源于那个方向?端口收包统计是来源于那个方向?正确利用以太网端口正确利用以太网端口CRC包统计包统计 适用场景适用场景 具有端口具有端口CRC错包统计功能的板卡及设备在开通以太网错包统计功能的板卡及设备在开通以太网业务业
18、务 使用方法使用方法 网管上查询到有网管上查询到有CRC错包数,可能是连接的网线或者光错包数,可能是连接的网线或者光纤纤100BASE-FX有问题。网线的问题表现为网线质有问题。网线的问题表现为网线质量问题、量问题、RJ45水晶头问题、网线与水晶头不搭配问题水晶头问题、网线与水晶头不搭配问题比如五类线用了比如五类线用了6类头)、错误用了三类线等等;类头)、错误用了三类线等等; 网管上查询到有网管上查询到有CRC错包数,也可能是网线连接的两个错包数,也可能是网线连接的两个端口一端强制、一端自协商造成的。端口一端强制、一端自协商造成的。 思考问题?思考问题? LMXE的以太网盘端口的以太网盘端口C
19、RC错包统计是来源于那个方向?错包统计是来源于那个方向?n故障处理技巧故障处理技巧n利用设备指示灯判定故障利用设备指示灯判定故障n利用开销字节判定故障利用开销字节判定故障n板卡及设备故障简易判定板卡及设备故障简易判定n对对MSAP告警的理解告警的理解故障处理技巧故障处理技巧板卡及设备故障简易判定板卡及设备故障简易判定 E1端口或者端口或者PDH接口板故障判定接口板故障判定 H9MO-LMXE、H9MO-LMFIT设备在交叉矩阵环回,设备在交叉矩阵环回,观察网管低阶通道告警消失,用观察网管低阶通道告警消失,用2M误码仪测试误码仪测试E1端口端口能测通,表明能测通,表明PDH接口板没有问题。接口板
20、没有问题。 其它城网直通车设备用硬件拔子做相应环回,用用其它城网直通车设备用硬件拔子做相应环回,用用2M误码仪测试误码仪测试E1端口能测通,表明端口没有问题。端口能测通,表明端口没有问题。 备注:也可以用光端机备注:也可以用光端机2M连接的终端设备连接的终端设备2M端口状态端口状态来判定来判定 V.35端口或者端口或者V.35接口板故障判定接口板故障判定 设备在交叉矩阵环回,观察网管低阶通道告警消失,用设备在交叉矩阵环回,观察网管低阶通道告警消失,用V.35误码仪测试误码仪测试V.35接口口能测通,表明接口口能测通,表明V.35接口板没接口板没有问题。有问题。 备注:也可以用光端机备注:也可以
21、用光端机V.35接口连接的终端设备来判定,接口连接的终端设备来判定,需要终端设备支持需要终端设备支持板卡及设备故障简易判定板卡及设备故障简易判定 以太网电接口或者以太网电接口板故障判定以太网电接口或者以太网电接口板故障判定 设备在交叉矩阵环回,内端口做通道捆绑,观察网管设备在交叉矩阵环回,内端口做通道捆绑,观察网管GFPGFP告告警消失,表明以太网内部没有问题;警消失,表明以太网内部没有问题; 用计算机网口自协商连接至以太网电接口,端口绿灯和用计算机网口自协商连接至以太网电接口,端口绿灯和黄灯亮,表明外端口没有问题;黄灯亮,表明外端口没有问题; 以上都正确,表明设备或者板卡没有问题。以上都正确
22、,表明设备或者板卡没有问题。 留意,以太网环回后,不要接入网络交换机,否则会造成桥留意,以太网环回后,不要接入网络交换机,否则会造成桥环路环路 对于对于H9MO-LMXEH9MO-LMXE和和H9MO-LMFITH9MO-LMFIT的通道型板卡,一般有四个独的通道型板卡,一般有四个独立通道端口,可以把一端口和其它剩余的三个端口中任意一立通道端口,可以把一端口和其它剩余的三个端口中任意一个端口设置业务相通,用两台计算机相个端口设置业务相通,用两台计算机相PINGPING,PINGPING通表明板通表明板卡没有问题。卡没有问题。板卡及设备故障简易判定板卡及设备故障简易判定 以太网光接口或者以太网光
23、接口板故障判定以太网光接口或者以太网光接口板故障判定 设备在交叉矩阵环回,内端口做通道捆绑,观察网管设备在交叉矩阵环回,内端口做通道捆绑,观察网管GFP告警消失,表明以太网内部没有问题;告警消失,表明以太网内部没有问题; 以太网光接口环回,接口指示灯灭,表明外端口没有问以太网光接口环回,接口指示灯灭,表明外端口没有问题;题; 以上都正确,表明设备或者板卡没有问题。以上都正确,表明设备或者板卡没有问题。 留意,以太网环回后,不要接入网络交换机,否则会造留意,以太网环回后,不要接入网络交换机,否则会造成桥环路成桥环路 对于对于H9MO-LMXE和和H9MO-LMFIT的通道型板卡,一的通道型板卡,
24、一般有四个独立通道端口,可以把一端口和其它剩余的三般有四个独立通道端口,可以把一端口和其它剩余的三个端口中任意一个端口设置业务相通,相应以太网光接个端口中任意一个端口设置业务相通,相应以太网光接口外接两个光纤收发器,再用两台计算机相口外接两个光纤收发器,再用两台计算机相PING,PING通表明板卡没有问题。通表明板卡没有问题。板卡及设备故障简易判定板卡及设备故障简易判定 如何做交叉矩阵环回即源、宿盘位选择同盘位同时隙如何做交叉矩阵环回即源、宿盘位选择同盘位同时隙交叉矩阵环回会导致原有业务重新设置板卡及设备故障简易判定板卡及设备故障简易判定 SDH光接口或者光接口或者SDH光接口板故障判定光接口
25、板故障判定 光口用跳纤环回,观察网管光接口告警消失,接口指示光口用跳纤环回,观察网管光接口告警消失,接口指示灯灭。表明灯灭。表明SDH光接口或者光接口或者SDH光接口板没有问题。光接口板没有问题。n故障处理技巧故障处理技巧n利用设备指示灯判定故障利用设备指示灯判定故障n利用开销字节判定故障利用开销字节判定故障n板卡及设备故障简易判定板卡及设备故障简易判定n对对MSAP告警的理解告警的理解故障处理技巧故障处理技巧AIS与与RDI AIS AIS 告警全告警全1 告警):对下一级电路插全告警):对下一级电路插全1 ,告知,告知该信号不可用。常见的该信号不可用。常见的AIS告警有告警有MS-AIS、
26、AU-AIS、TU-AIS 和和E1-AIS 等。等。 业务配置正确后不会出现业务配置正确后不会出现MS-AIS、AU-AIS、TU-AIS 告警。告警。 信道空闲会发信道空闲会发E1-AIS。 RDI RDI告警远端接收缺陷指示):用于指示对端站告警远端接收缺陷指示):用于指示对端站检测到检测到LOS信号丢失)、信号丢失)、AIS、TIM追踪识别追踪识别符失配等告警后,而传给本站的对告。常见的告符失配等告警后,而传给本站的对告。常见的告警有警有MS-RDI、HP-RDI 和和LP-RDI等。等。 RDI出现后应该是对端收或者本站发故障。出现后应该是对端收或者本站发故障。B1、B2、B3与与R
27、EI B1、B2、B3 B1、B2或者或者B3误码计数:误码计数: B1是再生段误码计是再生段误码计数、数、B2是复用段误码计数、是复用段误码计数、B3是高阶误码计数。是高阶误码计数。 出误码后首先要检查光缆衰减。出误码后首先要检查光缆衰减。 出误码后然后检查对端发或者本站收故障,可出误码后然后检查对端发或者本站收故障,可用环回法判定。用环回法判定。 REI REI告警远端误码指示):对端站接收到告警远端误码指示):对端站接收到B1、B2或者或者B3误码,而传给本站的告警。常见的告误码,而传给本站的告警。常见的告警有警有RS-REI、MS-REI 和和HP-REI等。等。 出误码首先要检查光缆
28、衰减出误码首先要检查光缆衰减 REI出现后应该是对端收或者本站发故障,可用出现后应该是对端收或者本站发故障,可用环回法判定。环回法判定。TIM与与SLM TIM TIM 告警追踪识别符失配):本站与对端站告警追踪识别符失配):本站与对端站低阶通道追踪识别符配置不一致。常见的低阶通道追踪识别符配置不一致。常见的TIM告警有告警有RS-TIM、HP-TIM、LP-TIM 等。等。 国内厂商设备出现国内厂商设备出现TIM告警一般不会影响业务。告警一般不会影响业务。 国内厂商设备出现国内厂商设备出现TIM告警会下插全告警会下插全1。 SLM SLM告警信号标记失配):本站应收信号标告警信号标记失配):
29、本站应收信号标记与对端站应发信号标记配置不一致。常见的记与对端站应发信号标记配置不一致。常见的告警有告警有HP-SLM 和和LP-SLM等。等。 一般厂家设备出现一般厂家设备出现SLM告警会在通道下插全告警会在通道下插全1。 我公司设备不会下插全我公司设备不会下插全1,如果通道净荷相同,如果通道净荷相同,不会影响业务。不会影响业务。TDM电路告警一电路告警一TDM电路告警二电路告警二 低阶无告警表明电路正常 低阶无告警表明电路正常透传型以太网电路告警透传型以太网电路告警 低阶无告警和GFP不失步表明电路正常 低阶无告警和GFP不失步表明电路正常1、电路是否对应,可用J2跟踪2、多电路绑定时隙是
30、否一一对应,也可用J2验证3、检查通道绑定4、检查上下加扰是否一致5、检查LCAS是否设置一致6、检查板卡及设备注:设备不支持J2时,可去激活电路查看对端告警。顺顺序序排排查查透透传传电电路路汇聚型以太网电路告警汇聚型以太网电路告警 低阶无告警和GFP不失步表明电路正常 低阶无告警和GFP不失步表明电路正常1、电路是否对应,可用J2跟踪2、多电路绑定时隙是否一一对应,也可用J2验证3、检查通道绑定4、检查上下加扰是否一致5、检查LCAS是否设置一致6、检查VLAN设置,包括VLAN ID、端口属性Tag、Untag)、VLAN使能与否、VLAN业务控制7、跨板汇聚时检查汇聚侧端口是否使能8、检
31、查板卡及设备注:设备不支持J2时,可去激活电路查看对端告警。顺序顺序排查排查交换交换电路电路n故障定位基本原则故障定位基本原则n故障处理手段故障处理手段n故障处理技巧故障处理技巧n案例分析案例分析主要内容主要内容案例一案例一(1)n 故障现象故障现象: :n 妥宁网通分公司妥宁网通分公司SCDMASCDMA的基站北京信威的产品,的基站北京信威的产品,BSCBSC设在成设在成n 都网管系统显示南涪小区基站业务都网管系统显示南涪小区基站业务6 6月月1515日从日从PDHPDH割接至华环割接至华环SDHSDHn 环网后基站频繁告警,并出现基站系统复位,最终造成业务瞬断。环网后基站频繁告警,并出现基
32、站系统复位,最终造成业务瞬断。n 妥宁网通分公司曾经怀疑基站妥宁网通分公司曾经怀疑基站GPSGPS时钟模块有问题基站时钟模块有问题基站时钟同时钟同n 步于步于GPSGPS),更换),更换VCCVCC板,故障依旧。怀疑在用的通道有问题,在板,故障依旧。怀疑在用的通道有问题,在n 华环公司设备华环公司设备n 上重新换一个上重新换一个n 2M2M,问题还,问题还n 是存在。是存在。n 网络拓扑网络拓扑: :案例一案例一(2)n处理过程处理过程n 查阅基站网管系统历史告警信息,并从中找到可能的故障查阅基站网管系统历史告警信息,并从中找到可能的故障原因。网管中告警多显示原因。网管中告警多显示E1的的CR
33、C4校验错和校验错和RAI对告,其中隔对告,其中隔一段时间出现基站复位,业务瞬断。和妥宁网通分公司负责大一段时间出现基站复位,业务瞬断。和妥宁网通分公司负责大灵通基站的工程师沟通,说以前灵通基站的工程师沟通,说以前PDH链路很正常,更换华环链路很正常,更换华环SDH后故障频繁。询问基站设备复位原因,设备本身时钟同步后故障频繁。询问基站设备复位原因,设备本身时钟同步问题,链路误码等都会使基站设备自动复位。网通工程师更换问题,链路误码等都会使基站设备自动复位。网通工程师更换过基站设备上的过基站设备上的VCC板,排除了基站设备本身有问题。从故障板,排除了基站设备本身有问题。从故障发生时间分析,最有可
34、能是基站设备至华环发生时间分析,最有可能是基站设备至华环SDH段链路误码造段链路误码造成基站复位,业务瞬断。成基站复位,业务瞬断。n 为确定误码产生在那一段,在妥宁网通王工陪同下,我们到为确定误码产生在那一段,在妥宁网通王工陪同下,我们到了射洪县新阳机房。首先测试以前用过出问题的了射洪县新阳机房。首先测试以前用过出问题的2M通道从南通道从南涪小区涪小区LMXE的的2M端口做软件环回二个小时,没有误码,华端口做软件环回二个小时,没有误码,华环的传输设备没有问题。然后到南涪小区基站,查看在用的电环的传输设备没有问题。然后到南涪小区基站,查看在用的电路,发现此电路在路,发现此电路在DDF架上有一条电
35、缆的外皮虚焊并断开,随架上有一条电缆的外皮虚焊并断开,随后检查基站设备信威的后检查基站设备信威的CW95-18B已接地、已接地、LMXE设备没有设备没有接地、接地、DDF架也没有接地,测量基站设备架也没有接地,测量基站设备2M接口外皮和地有感接口外皮和地有感应的应的33.3V直流电压,由此我确定故障点就在南涪小区直流电压,由此我确定故障点就在南涪小区2M线缆线缆这一段。焊好虚焊点,这一段。焊好虚焊点,LMXE、DDF架接地。从基站设备架接地。从基站设备2M处处接误码仪,新阳站接误码仪,新阳站DDF架上硬环回,测试一个小时没有误码。架上硬环回,测试一个小时没有误码。最后拉直电路长时间观察,业务没
36、有问题,基站工作正常。最后拉直电路长时间观察,业务没有问题,基站工作正常。n结论结论n 由于基站设备和华环传输设备由于基站设备和华环传输设备LMXE的不共地,两点出现电的不共地,两点出现电位差,造成南涪小区传输设备和基站设备之间位差,造成南涪小区传输设备和基站设备之间2M线缆产生误码。线缆产生误码。从而导致基站复位,业务瞬断。从而导致基站复位,业务瞬断。案例二案例二n故障现象故障现象:nH9MO-LMFIT与与ECI设备设备XDM-16测试通道保护,业务的测试通道保护,业务的通道保护设置正确。通道保护设置正确。ECI设置通道保护业务也正确。设置通道保护业务也正确。ECI自己环回业务能通,自己环
37、回业务能通,FIT自己环回业务也能通。自己环回业务也能通。FIT和和XDM-16光口互联后,业务不通,更谈不上测试通道保护。光口互联后,业务不通,更谈不上测试通道保护。n原因分析原因分析:nECI和和FIT自己环回业务能通,说明业务设置没有问题。自己环回业务能通,说明业务设置没有问题。问题应该出在不同厂家光口的一些参数设置。问题应该出在不同厂家光口的一些参数设置。n查看查看FIT网管光口没有任何告警,但查询网管光口没有任何告警,但查询ECI网管在对应网管在对应FIT的光口的光口J0、J1失配告警。把失配告警。把ECI的的J0、J1字节禁止,字节禁止,业务马上开通。业务马上开通。n根据协议根据协
38、议J0、J1失配失配SDH设备会下插全设备会下插全1,所以通道不会,所以通道不会通。禁止通。禁止J0、J1字节后注意不是屏蔽),字节后注意不是屏蔽),ECI设备不在设备不在下插全下插全1,业务开通。通道保护也顺利测试通过。,业务开通。通道保护也顺利测试通过。FIT缺省缺省不检测不检测J0、J1,也不能设置,也不能设置J0、J1,所以不会有告警。,所以不会有告警。n知识点:知识点:nJ0-再生段踪迹标识,英文再生段踪迹标识,英文RS-TIM;J1-高阶通道踪迹标识,高阶通道踪迹标识,英文英文HP-TIM案例三案例三n故障现象故障现象:nH9MO-LMFIT与与ECI设备设备XDM-16测试测试E
39、1及以太网业务互通及以太网业务互通性,性,XDM-16设设n 置时隙置时隙1-4,FIT也设置也设置1-4。除第一时隙通以外,其它时。除第一时隙通以外,其它时隙业务不通。隙业务不通。n原因分析原因分析:n第一时隙业务能通起来,说明直接相连第一时隙业务能通起来,说明直接相连ECI XDM-16和和FIT之之间的光口参数设间的光口参数设n 置正确。第一时隙的业务配置也正确。置正确。第一时隙的业务配置也正确。n其它时隙不能通,是因为不同厂家对于其它时隙不能通,是因为不同厂家对于TUG时隙的编号不一时隙的编号不一致造成的。致造成的。n根据测试,根据测试,XDM-16设置的时隙设置的时隙1,2,3,4时
40、隙对应时隙对应FIT编号为编号为1,4,7,10的时隙。的时隙。n FIT设置业务时把时隙对应好后业务开通,测试成功。设置业务时把时隙对应好后业务开通,测试成功。n知识点:知识点:n华为、华环、格林威尔、瑞士康达等厂家华为、华环、格林威尔、瑞士康达等厂家TUG时隙编号一致,时隙编号一致,叫叫TS方式。方式。nECI、朗讯、烽火、中兴、朗讯、烽火、中兴TUG时隙编号一致,叫时隙编号一致,叫TRIBUTARY方式。方式。n摩托罗拉又是另一种摩托罗拉又是另一种TUG时隙编号方式。时隙编号方式。n如果不能明白以上时隙编号如何换算,可以接合网管判断,如果不能明白以上时隙编号如何换算,可以接合网管判断,在
41、网管上可以看在网管上可以看n 到到FIT直接与其它厂家相连的光口的直接与其它厂家相连的光口的TU告警。其它厂家的告警。其它厂家的时隙调配后,时隙调配后,FITn 的光口相对的时隙会显示的光口相对的时隙会显示TU-AIS。案例四案例四n故障现象故障现象:n两端两端H9MO-LMFIT通过城网通过城网ECI设备提供设备提供VC-4通道提供通道提供以太网专线,在接上一端以太网专线,在接上一端H9MO-LMFIT设备后发现连接设备后发现连接光口复帧失步告警。光口复帧失步告警。n原因分析原因分析:n先来看一下复帧失步是由那个先来看一下复帧失步是由那个SDH帧结构中那个字节表示帧结构中那个字节表示的,复帧
42、失步检测的是高阶通道中的的,复帧失步检测的是高阶通道中的H4字节,字节,H4字节用字节用来指示来指示VC-12复帧位置指示。复帧位置指示。n和和FIT连接的连接的ECI设备提供的设备提供的VC-4通道,不可能有通道,不可能有VC-12复帧,所以复帧,所以FIT光口会出现复帧失步告警,准确点说复帧光口会出现复帧失步告警,准确点说复帧失步应该叫支路单元复帧失步,就好理解一些。失步应该叫支路单元复帧失步,就好理解一些。n两端两端FIT都连接到都连接到ECI设备组成的城网后,复帧失步自然设备组成的城网后,复帧失步自然消失。消失。n知识点:知识点:n可以用复帧失步是否消失来判定提供可以用复帧失步是否消失
43、来判定提供VC-4通道是否开通。通道是否开通。n一端一端FIT连入城网,对方如果提供连入城网,对方如果提供VC-4通道,可让提供通道,可让提供VC-4通道的另一端端口做环回,看通道的另一端端口做环回,看FIT光口的复帧失步是光口的复帧失步是否消失,来判定否消失,来判定VC-4通道是否调通。通道是否调通。案例五案例五n故障现象故障现象:n北京电信试用北京电信试用H9MO-LMFIT设备,单端直接与电信阿尔卡特设备光口连接,设备,单端直接与电信阿尔卡特设备光口连接,并与阿尔卡特的以太网板实现业务互通,为北京电信大客户提供以太网专线。并与阿尔卡特的以太网板实现业务互通,为北京电信大客户提供以太网专线
44、。FIT配置配置FE201板卡,业务配置不通。板卡,业务配置不通。n处理过程处理过程:n查证双方设置的时隙是否一致,阿尔卡特设备时隙编号方式与我公司的不同,查证双方设置的时隙是否一致,阿尔卡特设备时隙编号方式与我公司的不同,可根据公司网管软件提供的可根据公司网管软件提供的TUG换算表进行换算,找到正确的时隙。也可换算表进行换算,找到正确的时隙。也可以直接把以直接把FIT设备时隙编号直接设置为设备时隙编号直接设置为TRIBUTARY方式,编号就会与阿尔方式,编号就会与阿尔卡特设备一致。时隙提供在卡特设备一致。时隙提供在1-1-1,也就是第一时隙,没有错误。,也就是第一时隙,没有错误。n检查检查L
45、CAS是否使能。是否使能。FE201卡由于各种原因不在支持卡由于各种原因不在支持LCAS,支持,支持LCAS板板卡定义为卡定义为FE201L,FE201L板卡的硬件与板卡的硬件与FE201卡是通用的。卡是通用的。LCAS如果不如果不支持,互通的阿尔卡特设备也要设置成禁止支持,互通的阿尔卡特设备也要设置成禁止LCAS。经检查阿尔卡特设备设。经检查阿尔卡特设备设置置LCAS禁止。禁止。n检查是否检查是否GFP封装、上、下加扰设置是否一致。经北京电信工程师查阿尔卡封装、上、下加扰设置是否一致。经北京电信工程师查阿尔卡特上板卡是采用特上板卡是采用GFP封装,不过它采用的是封装,不过它采用的是GFP-T
46、封装,也就是透明映射方封装,也就是透明映射方式。不能与我公司的设备互通。后更换成支持式。不能与我公司的设备互通。后更换成支持GFP-F,帧映射方式板卡,业,帧映射方式板卡,业务顺利开通。务顺利开通。n原因分析:原因分析:nGFP封装有两种类型的映射:帧映射封装有两种类型的映射:帧映射GFP-F和透明映射和透明映射GFP-T)。帧)。帧映射方式是将收到的一个客户信号帧完整地映射到一个映射方式是将收到的一个客户信号帧完整地映射到一个GFP帧中。帧中。ITU定义定义GFP-F支持映射以太网、支持映射以太网、PPP、MAPOS、RPR和光纤通道和光纤通道FC-BBW。透明。透明映射方式将客户端信号中的
47、对客户端信号的单个字符进行解码,然后将其映映射方式将客户端信号中的对客户端信号的单个字符进行解码,然后将其映射至固定大小的射至固定大小的GFP帧中。适用映射帧中。适用映射GBE、光纤通道、光纤通道、ESCON、FICON和和DVB-ASI。n两种映射方式不能互通。两种映射方式不能互通。案例六案例六n故障现象故障现象:n两端两端LMFIT设备跨在设备跨在ECI的城网两头开以太网业务,监控通的城网两头开以太网业务,监控通过光口过光口62、63时隙传送。时隙传送。ECI给的时隙正确,以太网业务正给的时隙正确,以太网业务正常,监控不能上报。常,监控不能上报。n处理过程处理过程:n网管上观察监控通道上无
48、告警,表明时隙连接正确。网管上观察监控通道上无告警,表明时隙连接正确。n为确认为确认ECI监控用时隙是否开通,可以用此时隙设置在以太监控用时隙是否开通,可以用此时隙设置在以太网业务上,结果表明以太网业务能通。网业务上,结果表明以太网业务能通。n在时隙正确、网管设置在时隙正确、网管设置E1监控正确情况下,我们怀疑监控正确情况下,我们怀疑FIT上上在硬件或者软件上对在硬件或者软件上对E1时隙监控有什么特殊设置。时隙监控有什么特殊设置。n原因分析:原因分析:n通过和开发部确认,通过和开发部确认, E1时隙监控的监控帧有两种时隙监控的监控帧有两种SIZE,一种一种是是16Byte,另一种是,另一种是3
49、2Byte。如果两端。如果两端FIT设备设置此帧长不设备设置此帧长不一致会导致通过一致会导致通过E1时隙监控不能上报。时隙监控不能上报。n现场查证一端现场查证一端FIT设置设置16Byte,另一端设置为,另一端设置为32Byte。都改为。都改为32Byte监控正常上报。监控正常上报。n设置为设置为16Byte是为了和是为了和LMX设备设备E1监控通道互通。监控通道互通。案例七案例七n故障现象故障现象:n浙江省联通杭州分公司采用浙江省联通杭州分公司采用EOE方案为中国银行开以太网业务,方案为中国银行开以太网业务,中心站配置一台中心站配置一台FIT设备光直接连入设备光直接连入ECI城网,用户站点用
50、城网,用户站点用LMC+LME,LMC的的2M接入接入ECI城网。简单关系图如下:城网。简单关系图如下:nFIT光光ECI城网城网E1LMC光光LMNEn中心站中心站FIT对应下面九个站点。开通时发现每条专线都有丢包。对应下面九个站点。开通时发现每条专线都有丢包。n处理过程处理过程:n首先测试通道是否有误码,选择一个点在首先测试通道是否有误码,选择一个点在FIT上光做环回,下上光做环回,下面面LMNE把时隙下到把时隙下到2M端口测试端口测试2个多小时没有误码。可以排个多小时没有误码。可以排除线路误码。除线路误码。n在网管上发现中心站在网管上发现中心站FIT设备隔几分钟一直在报设备隔几分钟一直在
51、报GFP失步。查失步。查找找GFP失步原因,设置都正确,后到中心站机房,发现此台失步原因,设置都正确,后到中心站机房,发现此台FIT设备在继电器频繁跳动,告警指示灯同时闪烁。怀疑此设设备在继电器频繁跳动,告警指示灯同时闪烁。怀疑此设备出了问题,换了一台后故障消失。备出了问题,换了一台后故障消失。n原因分析:原因分析:n在金华市开有相同的链路,同样的版本,没有出现丢包。说明在金华市开有相同的链路,同样的版本,没有出现丢包。说明设备版本没有问题。而且九个站点对一个设备版本没有问题。而且九个站点对一个FIT设备,都出现丢设备,都出现丢包。说明问题应该出在中心站的包。说明问题应该出在中心站的FIT设备
52、上。设备上。案例八案例八n故障现象故障现象:n金华市联通公司采用金华市联通公司采用LMXE、FIT、LMNE设备为中国银行开以设备为中国银行开以太网专线业务,网络如下所示:太网专线业务,网络如下所示:nFIT-LMXE=双光一主一备)双光一主一备)ECI城网城网FIT光光FITn下面节点共有八个相同业务站点。调测发现有二个站点业务能通,下面节点共有八个相同业务站点。调测发现有二个站点业务能通,其它几个站点业务不通。其它几个站点业务不通。n处理过程处理过程:n经过反复确认,经过反复确认,ECI分配时隙正确,自己业务设置正确。在远端分配时隙正确,自己业务设置正确。在远端设备上看不到告警,局端设备也
53、看不到任何告警。其中有二个站设备上看不到告警,局端设备也看不到任何告警。其中有二个站业务是通的,其它站点以太网就是业务是通的,其它站点以太网就是PING不通。不通。n由于没有任何告警,我们怀疑中间有环回的地方,经过查找发现由于没有任何告警,我们怀疑中间有环回的地方,经过查找发现ECI设备在与设备在与LMXE连接的光纤做了环回。撤消环回,全部站点连接的光纤做了环回。撤消环回,全部站点能够能够PING通。业务开通通。业务开通n原因分析:原因分析:nLMXE与与ECI设备做设备做SNCP保护,由于开业务时有一条光纤还没保护,由于开业务时有一条光纤还没有铺好,只连接了一个光口。但业务有铺好,只连接了一
54、个光口。但业务ECI和和LMXE都做成了都做成了SNCP保护业务,只等光纤到位直接连接就可以了。保护业务,只等光纤到位直接连接就可以了。n金华网维工程师在与金华网维工程师在与LMXE准备连接的另一个准备连接的另一个ECI光口做了环回,光口做了环回,并且是在主用通道上。这是造成业务调不通的原因。并且是在主用通道上。这是造成业务调不通的原因。n有二个站点能通是因为那二个站点恰好业务倒换到备用通道上,有二个站点能通是因为那二个站点恰好业务倒换到备用通道上,正好与正好与LMXE已连接的光口业务对接,所以能通。已连接的光口业务对接,所以能通。案例九案例九n故障现象故障现象:n上海公安局采用华环上海公安局
55、采用华环FIT设备和朗讯设备和朗讯MetroPolis设备以太设备以太网直接对通,开以太网专线业务,网络如下所示:网直接对通,开以太网专线业务,网络如下所示:nETHFIT设备设备 MetroPolis设备设备ETHn双方设备上没有告警,但就是双方设备上没有告警,但就是PING不通。不通。n处理过程处理过程:n确认确认WAN口设置,上、下加扰及口设置,上、下加扰及FCS等设置一致;等设置一致;n确认确认LCAS功能,相互设置禁止;功能,相互设置禁止;n确认双方设置都是透传模式,不存在设置确认双方设置都是透传模式,不存在设置VLAN导致不通导致不通的情况;的情况;n确认封装协议同为确认封装协议同
56、为GFPF,不存在,不存在GFP封装不一致情况;封装不一致情况;n后来朗讯工程师到现场,发现在其设备以太网端口有一个后来朗讯工程师到现场,发现在其设备以太网端口有一个CID设置为设置为100,更改为,更改为0后,业务后,业务PING通。通。n原因分析:原因分析:nGFP协议有基本帧和扩展帧之分,朗讯协议有基本帧和扩展帧之分,朗讯MetroPolis设备在设备在以太网设置以太网设置CID,确认是加了扩展帧头。一侧是基本帧,确认是加了扩展帧头。一侧是基本帧,一侧是扩展帧导致业务不通。一侧是扩展帧导致业务不通。案例十案例十n故障现象故障现象:n上海公安局采用华环上海公安局采用华环LMXE设备和朗讯设
57、备和朗讯MetroPolis设备光口直设备光口直连,为其它分局提供电路,网络如下所示:连,为其它分局提供电路,网络如下所示:nE1LMXE设备设备 MetroPolis设备设备E1nLMXE设备光口没有告警,朗讯设备光口检测有误码。设备光口没有告警,朗讯设备光口检测有误码。n处理过程处理过程:n到达用户现场,检查故障现象确实如用户所述;到达用户现场,检查故障现象确实如用户所述;n两端光端设备位于一个大楼中,一个在四层、一个在二十一两端光端设备位于一个大楼中,一个在四层、一个在二十一层;层;n检查双方光端设备光器件都为单模光口,并且发光功率在检查双方光端设备光器件都为单模光口,并且发光功率在10
58、dBm左右;左右;n检查连接尾纤,发现用户连接的跳纤,和朗讯设备侧用的是检查连接尾纤,发现用户连接的跳纤,和朗讯设备侧用的是单模光纤,华环单模光纤,华环LMXE侧用的是多模光纤;侧用的是多模光纤;n换多模尾纤为单模尾纤,故障排除。换多模尾纤为单模尾纤,故障排除。n原因分析:原因分析:n朗讯设备侧单模光纤发向多模光纤,信号可以耦合,所以华朗讯设备侧单模光纤发向多模光纤,信号可以耦合,所以华环设备侧检测没有误码;华环设备侧多模光纤向单模光纤信环设备侧检测没有误码;华环设备侧多模光纤向单模光纤信号不能很好的耦合,所以在朗讯设备上测有误码。号不能很好的耦合,所以在朗讯设备上测有误码。案例十一案例十一n
59、故障现象故障现象:n故障持续的时间比较长,大部分时间内表现为三个故障持续的时间比较长,大部分时间内表现为三个LMXE的的节点有大量连续的闪告节点有大量连续的闪告GFP失步告警,间隔时间不等,每次失步告警,间隔时间不等,每次告警持续告警持续1-3秒,会自行结束。还有另外一些表现为:在网管秒,会自行结束。还有另外一些表现为:在网管上并无任何告警,但是用笔记本通过上并无任何告警,但是用笔记本通过FE01接口接口ping用户路由用户路由器有丢包。网络如下所示:器有丢包。网络如下所示:nFELMXE1光纤光纤LMXE2光纤光纤LMXE3光纤光纤LMXE4 FEn处理过程处理过程:n首先查询光路是否存在误
60、码,在网管上查询首先查询光路是否存在误码,在网管上查询B1、B2和和B3,均,均无增长;无增长;n通过环回测试,定位在三个接入路由器的节点的通过环回测试,定位在三个接入路由器的节点的FE01自环收自环收到到GFP失步告警,更换失步告警,更换FE01板卡,在短暂的观察期内表现正板卡,在短暂的观察期内表现正常,但是几天之后又有常,但是几天之后又有GFP失步告警,由此可见未必跟板卡失步告警,由此可见未必跟板卡有关。有关。n偶然间在处理春城煤矿偶然间在处理春城煤矿LMXE设备无任何告警情况下丢包,设备无任何告警情况下丢包,仔细检查发现西乌旗机房仔细检查发现西乌旗机房LMXE与华为与华为6506R设备连
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网络安全的防护措施总结计划
- 2024年上海市珠峰中学教师招聘笔试真题
- 2024年广东省交通运输厅下属事业单位真题
- 学习如何进行软件项目的风险评估试题及答案
- 2024年湖州房地产交易有限公司招聘笔试真题
- 2024年河南省事业单位联考笔试真题
- 前景分析的年度方法计划
- 2024年广东深圳小学全国选聘教师笔试真题
- 仓库内耗管理的有效对策计划
- 团队目标与个人目标的统计划
- 《自动瓷砖切割机的结构设计》12000字(论文)
- 中医经络穴位与按摩疗法展示
- 推箱子课设报告
- 网络系统建设与运维(中级) 5.1.1-基于PAP认证的公司与分部安全互联v1.2
- 2025年《电泳涂装生产线安全操作规程》符合安全标准化要求
- 【MOOC】游戏开发程序设计基础-中国传媒大学 中国大学慕课MOOC答案
- 【MOOC】百年歌声-中国流行音乐鉴赏-中国矿业大学 中国大学慕课MOOC答案
- 2024年工艺美术研究报告
- 《民航服务与沟通学》课件-第18讲 儿童旅客
- 儿科发热护理常规
- 《临床药学》课件
评论
0/150
提交评论