[计算机硬件及网络]11 epon设备常见故障处理2_第1页
[计算机硬件及网络]11 epon设备常见故障处理2_第2页
[计算机硬件及网络]11 epon设备常见故障处理2_第3页
[计算机硬件及网络]11 epon设备常见故障处理2_第4页
[计算机硬件及网络]11 epon设备常见故障处理2_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

EPON设备常见故障处理,V1.1,PO_SM01_C1_P1,ZXA10EPON常见疑难故障处理,基本维护流程,EPON设备相关,PON设备的应用,常用命令,Ping 192.168.0.4 option 1000 100 1Trace 192.168.0.4Show cardShow running-configShow verInterface epon-olt_0/5/1Show olt alarm-info epon-olt_0/4/1Show onu typeAdd-card rackno 0 shelfno 0 slotno 3 epfcDel-card Show terminaltelnet,常用命令,WriteShow onu authentication epon-olt_0/3/1,EPON设备相关,EPFAS板 接收光功率: 124 (1310nm) 发送光功率: 23 (1490nm)EPFC/EPFAL板 接收光功率: 627 (1310nm) 发送光功率: 72 (1490nm)ONU: 发送光功率: 4 1 (1310nm) 接收光功率: 824 (1490nm)EC4G板 发送光功率: 9.53 接受灵敏度: 20dBm,EPON设备相关,ODN光指标,EPON设备相关,ODN光指标,由于EPON设备采用了无源光分路器设备接入各种类型的ONU,所以ONU是否可以在OLT上注册和无源光网络中的光功率关系极大。所以需要注意以下几点:EPON OLT的输入光功率必须小于8dBmw,ONU不能不通过分光器或者衰减器直接和OLT连接(特别是测试时要注意),否则会造成OLT光模块损坏;在OLT上电的情况下,最好能测试一下ONU处的接收光功率,要保证接收光功率在 24DB 以上;如果没有 PON功率计,要测试一下每个ONU处的光衰减, ODN的衰减不能大于25DB(OLT的发光功率在1-4DB);,EPON设备相关,故障处理注意事项处理过程中如遇到难以定位解决的问题,可尽快联系厂家进行处理。在紧急故障处理时,要及时、准确记录必要的信息和处理步骤,以供后续分析故障原因所用;需要收集的信息包括:1版本信息,包括系统软件的版本,ONU版本,相关单板版本。2提供现场设备的组网图,且特别说明上联口的情况,光口还是电口,半双工还是全双工,自适应还是强制方式;VLAN划分情况,tagged还是untagged。3描述设备基本配置情况,包括ONU数目,单板类型和数量, VLAN划分,端口tag方式。4详细描述故障现象。5提供相关的告警。,ZXA10EPON常见疑难故障处理,基本维护流程,EPON设备相关,PON设备的应用,EPON组网介绍-上联组网,PON设备的应用,宽带上网业务,宽带上网业务的实现,是通过用户基于IPoE 和PPPoE方式的高速互联网接入,用户通过ONUOLTSR(BRAS)骨干网络 的链路来实现高速上网。,PON设备的应用,VOIP业务,ZXA10EPON常见疑难故障处理,基本维护流程,EPON设备相关,PON设备的应用,基本维护流程,EPON 业务常用组网图,基本维护流程,重启系统 ZXAN#reboot(主备用主控板和线卡都将自动加载新版本,以新版本开始运行)ZXAN#show card /查看单板状态,确认板卡都工作正常ZXAN#show version-running /查看运行版本,确认所有板卡运行版本为所更新版本如果EPFC显示版本不是新的版本,则还需要update-boot一次: ZXAN(version)#update-boot slotno 1 local -(从本地升级boot) ZXAN(version)#show update-status - (boot升级正常,注意查看状态) ZXAN#reset-card slotno 1 - (重启EPFC板) ZXAN#show version-running -(查看运行的版本,注意日期与大小)对于MDU的ONU升级流程与OLT基本一样,这里不在列举,基本维护流程,EPON终端的升级方法:登陆后,在Tools-Update Gateway-选择升级文件(d400ver或d500ver),点击Update Gateway按钮 ;,基本维护流程,在平时的维护中,首先要备份网管及网元数据,以便在出故障的时候可以即使恢复.备份的方案在网管操作维护中会给出.EPON网络的日常维护中,主要包含网管的维护,OLT网元的维护,ONU的网元维护 网管的维护包括网管服务器维护,磁盘空间整理,防火墙的安装,病毒的查杀等;数据库的维护;网管告警的清理;操作日志的清理等. OLT网元的维护包括网管通道的检查,单板运行状态的检查,端口流量的检查,CPU利用率的检查,MAC地址学习情况的检查等. ONU网元的检查除了OLT上的常规检查还包括窄带业务的检查.故障分类按照产生的原因来分,一般都分为硬件故障,软件故障,人为故障。 硬件问题,单板硬件故障或连接线损坏。 软件问题,通过升级某些单板的程序版本来解决相关问题。 人为故障,由于人为原因如连错线、配错数据、用错版本等造成的工程故障。,18,故障处理注意事项,处理过程中如遇到难以定位解决的问题,可尽快联系厂家进行处理。在紧急故障处理时,要及时、准确记录必要的信息和处理步骤,以供后续分析故障原因所用;需要收集的信息包括:1版本信息,包括系统软件的版本,ONU版本,相关单板版本。2提供现场设备的组网图,且特别说明上联口的情况,光口还是电口,半双工还是全双工,自适应还是强制方式;VLAN划分情况,tagged还是untagged。3描述设备基本配置情况,包括ONU数目,单板类型和数量, VLAN划分,端口tag方式。4详细描述故障现象。5提供相关的告警。,基本维护流程,EPON网络的基本应用模式如图 所示: (包含可能出现的故障点),基本维护流程,在实际应用中,EPON系统的总体故障表现,最突出的就是用户业务不通,根据业务不通的几种情况,可以基本按照如下的方式来进行故障检测和定位: 1业务全阻: 表现为整个系统业务全断,主要的故障分析和检测如下: (1)检测 故障点A, 主要进行如下的测试: 1)通过 C200/C220主控板或上联板上空余网口, 对上联网络进行检测,主要手段采用ping 一个已知地址的方式或者拨号上网方式进行检测; 2)或者通过上联网络对 C200/C220的网管地址进行 ping测试; 3) 如果发现上层网络不通,则故障定位; 否则进一步对系统进行检测; (2)检测 系统运行情况,作如下测试: 1)观察 主控板和线卡的运行灯状态, 看run灯运行是否正常; 2)通过网管 或 CLI 命令查看系统所有单板 CPU占有率, 检测有无单板运行异常; 3)通过网管或CLI查询 ONU在线情况,确定是否 ONU正常注册并在线; 4)通过 OLT 的空余网口,对ONU 的设备进行ping测试,检测 PON网络链路是否正常; 2单个PON口业务故障,表现为单个PON口下所有业务全断,而其他PON口正常: 针对故障点B, 主要进行如下的测试:,基本维护流程,(1)观察 线卡的运行灯状态, 看run灯运行是否正常;(2)观察 线卡的PON 灯状态, 看PON 灯运行是否正常,如果亮红灯,表示存在物理链路故障,需要检测物理线路和所有光接口(法兰盘);(3)通过网管 或 CLI 命令查看系统所有单板 CPU占有率, 检测单板是否有正常返回;(4)通过网管或CLI查询 ONU在线情况,确定是否 ONU正常注册并在线;(5)通过网管或CLI查询 线卡的配置,确定配置是否存在异常或被修改的情况;3单个用户业务故障,表现为单个PON口下某个ONU业务全断,而同一PON口下其他ONU业务正常:具体检测和测试方式如下:(1)确认ONU的电源情况,是否断电或去注册:1)可以通过网管查看 历史告警信息,看是否有ONU 去注册 消息;2)通过网管查看历史告警信息,看是否有ONU dying gasp消息;3)如果有去注册,而无 dying gasp消息, 则光纤或ONU故障;4)如果有去注册,且同时存在 dying gasp消息, 则ONU 掉电;(2)确认ONU在线情况,主要进行如下的测试:1)通过网管或CLI查询 ONU在线情况,确定是否 ONU正常注册并在线;2)通过网管或CLI查询 ONU 的配置,确定配置是否存在异常或被修改的情况;,基本维护流程,(3)针对故障点C/E, 主要进行如下的测试:1)可以通过网管查看 历史告警信息,看是否有误码告警消息,如果有则表示分支光纤链路存在物理性故障;2)检测 光纤和光纤接口(法兰盘)的连接情况,并进行ONU出光功率检测,确定ONU处光功率处于正常范围;3)观察 线卡的PON 灯状态, 看PON 灯运行是否正常,如果亮红灯,表示存在物理链路故障,需要检测物理线路和所有光接口(法兰盘);,ZXA10EPON常见疑难故障处理,基本维护流程,EPON设备相关,PON设备的应用,典型故障维护,24,ONU注册意义,ONU注册是XPON业务开通的基本步骤,ONU的注册分为两个部分,首先是物理上OLT发现ONU,其次是在OLT上注册ONU。与ONU相关的故障可以分为ONU不能发现(或注册后状态不正常)和ONU注册后状态不稳定。,故障现象描述,ONU注册不上有两种表现:1已经配置的ONU不能进入在线状态。2未配置的ONU接在PON口下的光网络中发现不了。,25,可能原因分析,ONU注册不上原因很多,可能包括: 光路问题(比如光纤连接错误、光纤中断、光纤距离过长、光纤衰减过大/小)。 光模块问题(比如光模块损坏、光模块接收灵敏度过低、光模块分光功率过强/低、有ONU长发光或者下面接有长发光的其它设备)。 数据配置问题(OLT PON口被禁用、OLT的认证模式)。 OLT或ONU的其它故障。,26,工程处理步骤,ONU注册不上原因很多,可能包括:所有ONU不能注册查看OLT PON口是否关闭;检查OLT的认证模式,如启用了硬件认证,则需关闭;检查实际的光纤距离和光功率;接到其它槽位或PON口上,看是否能搜索到。在断开OLT的情况测试上行光功率,看是否上行长发光,27,工程处理步骤,个别ONU不能注册检查是否启用了硬件认证:如果是的话,关闭硬件认证看能否发现ONU。如果只有一个ONU能够注册,其它ONU无法注册,有可能是某个ONU长发光。测试ONU处下行/上行光功率,看是否过高或者过低:在断开OLT的情况测试上行光功率,看是否上行长分光更换光纤分支,看是否光纤问题。更换ONU,看是否ONU的问题。,28,ONU注册不稳定,故障现象描述ONU注册不稳定表现为ONU状态不稳定,频繁上下线。可能原因分析光路问题(光纤距离过长、光纤衰减过大/小)。硬件问题(光模块损坏、光模块接收灵敏度过低、光模块分光功率过强/低)。网络风暴引起CPU忙。OLT或ONU其他故障。,29,工程处理步骤,所有ONU不稳定。查看历史告警和历史时间,看伴随ONU上下线是否还有误码告警, 如果有误码告警检查光路和更换光模块。查看OLT上接口统计,看总流量、广播、组播流量是否存在异常。测一下OLT发光光功率是否在合理范围在断开OLT的情况测试上行光功率,看是否上行长分光,在ONU处理检测光功率,,30,工程处理步骤,个别ONU不稳定。查看历史告警和历史时间,看伴随ONU上下线是否还有误码告警, 如果有误码告警检查光路和更换光模块。在ONU处理检测光功率.,31,上行光信号干扰的说明,故障现象描述1、如果故障ONU的光功率较弱,对其他ONU的光信号功率而言可以作为噪声,OLT侧通过调整接收器的AGC可以正常获取到其他ONU信号,此时出ONU1会出现故障外,不会影响系统中其他ONU的工作。2、如果故障ONU的光功率较强,则对其他ONU的光信号功率会形成强干扰噪声,使得OLT无法获取其他ONU的测距和数据信息,从而影响系统中其他所有ONU的工作。,32,工程处理步骤,1、通过持续的光功率监测,在OLT上检测到某个ONU的时隙内光功率突变,可以确认该ONU时隙内出现激光器异常。2、通过对ONU的掉线情况,结合光功率的检测情况来判断是否存在长发光的ONU存在;在光路出现长发光的情况下,该PON口下所有的ONU都会掉线,而一旦将故障ONU剔除出ODN网络,业务就会恢复。由于ONU被动发光的特性,对于一个光模块正常的ONU来说,直接使用光功率计是测不出功率的(只有将PON光功率计串入光路上才能正常测试功率,也就是只有ONU收到光后才能发光),如果直接使用光功率就能测到光,那么就说明ONU的光模块长发光了。3、如果使用了以太网交换机或是SDH设备的光口错误接入EPON网络,就会导致这样的结果。,33,数据自动下发故障处理,EPON OLT对ONU的数据配置有两种方式:通过带内网管方式进行ONU本地配置;或通过OAM扩展方式进行ONU的远程配置。带内网管方式进行ONU本地配置,是指建立ONU的带内网管通道,然后登录到ONU上进行本地配置,这种方法配置数据在ONU上,配置后需要在ONU上本地保存数据。EPON技术本身提供OAM 通道方式远程配置数据,在这种方式下不需要配置带内网管,只需ONU注册认证成功即可。 如果ONU上采用的数据配置模式不对,可能会导致ONU在重启后数据丢失:可能的情况有两种,数据存在ONU本地,OLT上数据自动下发打开;数据通过OAM扩展通道下发,但OLT上数据下发开关关闭。,34,语音不能注册上软交换,检查步骤:1检查F820的VOIP单板ALM灯是否红灯常亮,红灯常亮表示没有注册上。2检查ONU侧数据配置正确性,同时和软交换侧确认数据配置是否正确。3信令跟踪或者抓数据包分析。(1)如果ONU发送注册消息给软交换,软交换不做回应。检查VOIP单板到SS之间的网络是否可达。网络不通时ONU发的注册消息没有抵达SS,因此ONU侧收不到SS的回应。(2)ONU未发送注册消息给软交换。如果ONU终端没有发送注册消息出去,可以确定问题肯定处在ONU终端侧。首先排查VOIP单板运行是否正常,如果单板运行不正常需要检查是否硬件故障。,35,摘机忙音,检查步骤:1通过检查F820的ALM等是否红灯常亮初步判断F820是否成功注册到SS上。时可以根据信令跟踪来确认。2如果没有注册上,请参考6.2.1节。ONU没有注册,那么摘机忙音应该为终端自己放的。首先需要解决终端未注册的问题,处理的步骤同上节排查思路。3、查看ONU已注册ONU已经成功注册,摘机为忙音,这时的忙音一般情况下是软交换下发忙音的信令给终端,终端再放的。需要首先检查相关的数据配置,同时软交换侧也需要检查数据配置。确认双方数据配置没有问题时,在提供抓包进行分析,抓包时提供MGCP或者H248协议即可。D42x终端有时支持SIP协议,需要提供SIP协议。对于T7P2以后版本的F820支持信令跟踪,可以不进行现场抓包,远程进行信令跟踪即可。,36,摘机无音,检查步骤:1故障现象:摘机后听不到拨号音。2摘机后电话机没有馈电。ONU下接电话机摘机无音,首先需要检查电话机的指示灯是否亮,即检查话机是否有馈电。如果没有馈电首先要检查用户线或者用户线电缆和话机以及ONU终端是否正确连接。如果正确连接,需要检查线是否是好用的。如果是电话线可以考虑更换电话线进行尝试确认是否好。如果对于F820的用户电缆,需要检查线序使用是否准确。上述现象都排查后,如果依然不能解决问题,F820需要考虑更换V16B或者V08B单板,D系列终端需要更换设备。,37,摘机无音,摘机有馈电摘机如果有馈电,参照以下步骤进行排查:上报摘机信令。用户摘机上报了摘机信令,就需要根据软交换回复的信令进行分析。1可能存在语音吊死,这时候可以使用其他号码拨打该故障号码看是否可以解决,如果不行建议找合适的时间复位单板尽快恢复业务。如果要彻底排查故障。这就需要提供抓包文件和打印Udpwatch进行分析。2pon和SS之间链路不通,导致pon上报的摘机消息SS没收到,所以就不会下放拨号音消息,这种情况应该检查网络是否有问题。3pon和SS上的TidName配置是否一致,如果不一致摘机上报后SS会给pon回错。,38,呼叫失败,检查步骤:1未拨完号失败。拨完号码后失败ONU终端用户拨号后,号码没有拨完,就失败了。1更换话机进行测试。2信令跟踪或者抓包查看号码图表(DIGITMAP)是否存在语法问题。3检查号码图表容量是否超大。4检查ONU终端的长定时和短定时配置。针对华为或者中兴SS需要修该长短定时器参数。5缺省情况下长定时2000ms,短定时500ms。需要分别更改成500ms和300ms。,39,呼叫失败,2 拨完号码失败拨完号码后失败,这类故障应该和F820的关系不大,主要原因在于软交换。进行信令跟踪或者抓包进行分析。3、二次拨号,失败用户拨号某一语音平台,听提示音拨入1,或者2等按键选择,切不断语音。这类主要在于F820的收号方式和语音平台的匹配问题。此类问题,主要是依靠抓包进行分析。(1)修改ONU上的DTMF 参数,进行尝试。例如:ZXAN(config-voip)#rtp par dtmf dtmf ? 0:redundancy; 1:RFC2833; 2:voice coding; 3:no use(2)进行镜像抓包,不做任何过滤。同时进行udpwatch打印日志。,40,语音质量问题,检查步骤:判断语音质量的故障现象。1通话正常接续,但是语音断续。2通话正常接续,杂音。3通话正常接续,串音4回音。语音质量问题首先应从外线角度处理,外线员持我方电话机至ONU设备语音线处测试是否存在语音质量问题。,41,语音断续,此类问题主要是丢包引起。遇到此类问题可以先从网络上进行排查。1可以登录终端的语音地址,然后ping作为被叫的网关的IP地址,用以判断是否存在丢包。 同时也可以依据抓包进行分析,将抓到的RTP包,使用ethreal工具进行RTP分析,是否丢包,哪个方向丢包。抓包时不做过滤。必要时需要在ONU和OLT侧同时抓包,进行对比分析,确认故障点。2故障进行抓包时,如要确定丢包的故障点,必要时需要一段段排查。当然首先要排除是ONU和OLT的问题,如果确认是承载网络的问题,可以协调局方数据维护人员一起排查故障。丢包还有可能因为设备内部丢包引起,这类故障的解决主要依靠升级终端版本,或者更换设备硬件。,42,杂音,首先需要排除外线,话机等问题,杂音问题较多的和这些有关。尤其需注意设备接地。另外,对于F820,接地也会影响语音质量,如果具备接地条件,都要求接地。最后要排除风扇电源的问题,处理故障时可以优先考虑将风扇的电源线拔掉,进行对比测试。确认上述方法无法解决后,需要进行抓包分析,抓包时不做过滤。必要时需要在ONU和OLT侧同时抓包,进行对比分析,确认故障点。,43,单通,单通问题主要原因是网络引起。1可能是承载网络问题引起单通这类故障需要从两个方向检测网络通断。2还有可能是OLT上同时启用了P2P和ARP Proxy。,44,回音,回音问题首先要排除是否为现场环境造成回声,判断方法可以考虑更换环境进行拨打对比测试。如果确认不是环境问题造成的,应该就是设备内部造成的回声,这类问题需要首先明确回声的方向,同时需要进行抓包。抓包时不做过滤。,45,1.6VOIP吊死,现象:一般情况下,摘机有馈电,无音。打完电话,拨完号后无音,再次摘机无音。重启能好。不定期出现,不固定某台设备出现。,46,1.6.1整个VOIP单板吊死,整个VOIP单板下的用户都不能打电话。首先要判断VOIP单板和软交换之间是否还正常交互,可以telnet到VOIP单板上去,ping软交换地址通不通。然后进行单板复位,看是否可以恢复业务。如果不能恢复业务,查看单板运行是否正常。如果复位单板可以恢复业务,就需要进行观察此类故障是否可以复现。此类故障需要进行全程抓包分析,抓包需要包含单板运行正常到整个单板吊死的全过程。必要时需要采用udpwatch进行打印日志供研发人员分析。,47,1.6.2个别端口吊死,个别端口吊死,首先检查终端的命令配置是否正确。特别是和其他厂家设备对接时,链路检测等开关是否正确设置。个别端口吊死,主要存在于不同厂家设备对接时出现,此类故障解决方法是全程抓包,抓包需要包含端口状态正常到吊死的全过程。同时需要采用udpwatch进行打印日志供研发人员分析。,48,1.7POS, modem拨号,传真,智能公话问题,检查步骤:1详细描述故障现象。2提供现场组网图,反馈POS机,传真机等型号。3现场ONU的版本号。4有可能的话需要反馈Xpon以及TG的传真、modem控制方式5进行进行镜像抓包。6提供主控板上show card命令,show mg net,show rtp命令输出结果。7Udpwatch打印。,49,1.7.1POS,modem拨号,首先判断是否存在丢包,设备内部丢包还是外部丢包。可以采用telnet到VOIP板上再ping的方法进行初步测试。必要时还需要在ONU和OLT侧同时抓包,确定丢包点在什么地方。排除丢包的可能性后抓包分析,抓包不要设置过滤条件,必要时还需要采用udpwatch进行打印日志供研发人员分析。提供信息步骤如下:1检查信令上是否有正常的modem事件上报。2检查信令上是否有语音到modem的切换过程。3检查现场网络是否有丢包,传真、modem等业务对网络的要求比较高。4如果上面都没有问题,需要抓tdm trace、ip包和udpwatch进行分析。,50,1.7POS, modem拨号,传真,智能公话问题,同时需要提供udpwatch日志,T7P2及以上版本可以进行远程抓包,方法见下面文档,其他版本需要到现场使用udpwatch进行抓包,udpwatch使用方法见下面文档;Voipcli 34000 0 运行udpwatch工具的机器ipVoipcli 34001 0 1Voipcli 34003 0 3Voipcli 34012 0 1Voipcli 34006 0 2如果现场有时候正常,有时候有问题,最好可以出问题的时候抓一次镜像包和udpwatch,正常情况下也抓一次镜像包和udpwatch,以便进行对比分析。,51,1.7.2智能公话,需要抓包供研发人员分析,抓包不要设置过滤条件,必要时还需要采用udpwatch进行打印日志供研发人员分析。排查步骤如下:1如果是打电话过程中有问题,参照4.14.4中的方法排除。2其他情况则要确认信令上是否有问题。3抓tdm trace、ip包和udpwatch进行分析。,52,1.8传真问题,传真应用较少,且故障较为复杂请尽快联系厂家处理。,53,2指示灯说明-F820,MS8E,EI8E单板,EPUA单板,54,2指示灯说明-F820,VOIP单板,电源板,55,2指示灯说明-D400A/D402A,56,2指示灯说明-D420/D421/D422/F425A,57,宽带、管理故障分类,网管类故障网管ping不通网元网管能ping通网元,但通过NetNumen管理不到能管理到,但有些功能使用不正常业务类故障所有业务全断上网速度慢或掉线能上网但不能打电话,58,网管不通时的检查步骤,带外网管:检查网线。检查IP地址设定是否正确。带内和带外网管的IP不能设置在同一个IP地址段arp内容错误,用ARP D清除arp条目。带内网管:在带外基础上,进一步检查网管VLAN配置,59,故障案例2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论