10_EPON设备故障处理交流_第1页
10_EPON设备故障处理交流_第2页
10_EPON设备故障处理交流_第3页
10_EPON设备故障处理交流_第4页
10_EPON设备故障处理交流_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

综合 &宽带接入 D&T团队 EPON设备常见故障处理 V1.1 PO_SM01_C1_P1 2 本章学习目标 通过本章的学习,你可以获得以下收获: 了解 EPON 设备故障处理方法 3 故障处理注意事项 处理过程中如遇到难以定位解决的问题,可尽快联系厂家进行处理。 在紧急故障处理时,要及时、准确记录必要的信息和处理步骤,以供后续分析故障原因所用;需要收集的信息包括: 1版本信息,包括系统软件的版本, ONU版本,相关单板版本。 2提供现场设备的组网图。 3描述设备基本配置情况,包括 ONU数目,单板类型和数量, QINQ配置。 4详细描述故障现象。 5提供相关的告警。 6. 提供故障影响范围 4 EPON系统故障定位 根据用户申告和网管告警判断故障的范围有多大,是单个 ONU的问题,还是所有 ONU业务中断,是一个 PON口下的 ONU,还是所有 PON口的 ONU。然后依此判断可能的故障点。 OLT侧故障 上联网络出现故障 ODN网故障 单个 ONU故障、具备某种相同属性 ONU发生故障 . 5 常见故障处理 无源分光器 ONU ONU OLT ONU IP数据网 用户 A B C D E 6 ONU无法注册处理流程 ONU是否在所查看的 PON下?可以通过网管查看整个OLT的未注册 ONU,其会标识未注册的 ONU是从哪个PON口上报的。 测量 ONU侧接收光功率是否大于 -24db。如果小于 -24db,那么应逐级检查光路跳接点是否正常。 查看 ONU对应的 PON口灯是否亮或闪烁 光路距离是否超过 20KM:系统缺省仅支持 20KM,超过 20KM的 ONU即使接收光功率正常,也无法注册。 ONU光模块或硬件故障,更换 ONU试试 常见故障处理 7 上网业务故障处理流程: 首先 查看 ONU是否能正常在线? 检查 ONU业务 vlan设置是否正确。 通过 show mac查看 ONU子接口能否学习到电脑或路由器 mac。如果学习不到,应确认 ONU是否能稳定在线?是否有频繁掉线告警? 通过 show mac vlan pvlanid查看是否能从上联口 pvlan学习到网关mac。如果无法学习到网关 mac,可能是上联设备 Pvlan没有透传。检查上联设备 VLAN配置和 bas上数据配置。 常见故障处理 8 IPTV业务故障处理流程 如果同一个 ONU其他业务正常,那么首先确认是单播业务(点播、回看)不通还是组播业务(频道直播,也有可能采用单播方式,取决于 IPTV平台设置) 如果是单播、组播均不正常,那么首先 vlan数据配置是否正常; 再次检查 ONU上联带宽分配,缺省 ONU带宽为 2000kbps,对于视频业务可能带宽不足; 检查 mac表学习正常( ONU学习机顶盒 mac、 OLT或 ONU上联口学习网关 mac。 如果是只组播业务不通,详见下面的组播业务故障处理流程 常见故障处理 9 VOIP业务故障处理流程 查看 IAD注册状态,是否正常注册成功 ; 如果 IAD注册状态不正常,逐段 ping iad所在网关 IP、 SS IP,检查整个网络通路是否正常。 如果能 ping通,还是注册不上,核对双方配置的对接参数是否正确,特别是域名; 终端可以注册成功,但是用户无法正常呼叫,首先需要查的就是 USER TID和 RTP TID在终端和软交换上是否配置一致 ; 如果是业务时通时断,首先 ping包测试网络是否丢包,然后检查双方 RTP TID设置是否一致? 抓包和信令跟踪分析故障原因。 常见故障处理 10 IPTV组播业务故障处理流程 查看上联端口是否可以从组播 vlan学习到 mac 检查 OLT上是否将该 ONU添加到组播接收端口? Show igmp mvlan 29 检查 ONU子接口是否正确透传组播 vlan 29 ? Show run interface epon-onu_0/x/x:x 对于通过远程下发配置的,检查是否已经对组播报文剥离 tag使能? Show onu run con epon-onu_0/x/x:x multicast vlan tag-strip port eth_0/2 enable 查看 OLT上组播表是否已经建立。 show igmp dynamic-member 对于 MDU,还需要登录 ONU,进一步检查 ONU上的组播配置 常见故障处理 11 故障现象 某局反映 F822下挂用户观看 IPTV时点播业务正常,组播业务很卡。 故障处理 检查 ONU带宽没有问题; 组播很卡说明不是没有组播信号,而是组播带宽受到限制。于是检查 ONU上的组播设置,发现 F822上联口系统缺省的组播报文限速为 100pps F822-1(config)# show interface gei_0/3/1 Interface : 3/1 MulticastRateLimit : 100pps 修改上联口的组播限速 F822-1(config-if)# eth-switch multicast 2048 修改后测试业务正常。 典型故障案例 组播业务故障处理一例 12 故障现象 某局新开 ONU注册不上,在 ONU侧测量光功率为 -21db,在允许范围,但 OLT上一直无法发现该 ONU。 故障处理 了解组网情况:该 PON口为一个新开的 PON口,只挂这个 ONU; 将 ONU拿到 OLT近端的一个光交节点测试,发现可以注册,判断可能原先光路距离过长了,向现场了解光路情况,得知该 ONU到 OLT光路超过 20KM,估计有 25KM左右,为了避免光衰过大,特意使用了一个 1: 4分光器。 故障原因已经清楚: PON系统目前支持的最远注册距离是 20KM,超过 20KM后,即使光衰在 ONU的接收范围内,依然是无法注册的。 OLT上可以临时调整最长距离,但一般不建议这样操作 C220(config)#interface epon-olt_0/1/4 C220(config-if)#maxrtt ? Default value is 13524(TQ). C220(config-if)#maxrtt 16905 /25KM: 25*13524/20 = 16905 该设置最大距离建议不超过 30KM,同 PON下不同 ONU之间光路距离差距不要超过 10KM 典型故障案例 光路距离太长导致 ONU注册不上故障 13 故障现象 某局 modem用户从原先 PSTN网络中换到 F820下, modem拨号不成功。 故障处理 现场使用的 modem支持 V92协议,出现问题时通过修改增益、 tdm与 ip编码的一致性等都没有解决该问题。通过芯片产家的分析,建议将 modem降速。 相比 V90协议增加了 3个功能,一个是提高上行速率到 48k;一个是拨号过程中可以支持语言通话;再一个就是快速连接。快速连接就是将第一次拨号成功的一些协商配置项保存为文件,以后再拨号时可以默认调用这些配置项而省略协商过程。对于线路没发生变化的 modem可以提高协商速度,但对于六安这种从 PSTN切换到 F820的 modem,如果还用之前的配置项,则会影响 modem拨号的成功率。现场将 modem使用的协议从V92改成 V90,也就是去掉新增的 3个功能后,拨号能够成功 。 这个问题主要是由于设备使用环境发生变化后,相关的配置未做相应的修改,通过修改 modem的相关参数就可以解决 典型故障案例 modem拨号不成功问题分析 14 故障现象 某局 F820同华为 SS对接,用户提机通话约 2分钟左右就断话。 故障处理 从信令上通话过程中会占用 F820上的物理终结点和 rtp终结点,默认的配置中 rtp终结点会每隔一段时间给 SS发审计消息,以确认该 rtp终结点的占用是否正常,但华为的 SS并不支持这样的检测机制,会给 F820回错,因此将该 rtp释放,从而影响话路。 对于与华为 SS通过 H248协议对接的地方,都需要将 rtp的心跳检测功能关闭。修改命令如下: ZXAN(config-voip)#mgc h248tid link-kept-flag 0 0表示关闭心跳检测; 1表示打开心跳检测。 典型故障案例 F820语音通话 2分钟左右断话问题 15 故障现象 某局一个 C220下挂的所有 9806H用户均无法获取到 IP地址 故障处理 该 OLT下用户业务原先都是好的,经了解,昨晚上层 IPTV承载网设备做了割接,割接后其他设备(包括该 C220下挂的其他 ONU设备)用户 IPTV均正常,只有 9806H的用户反映无法获取到 IP地址。 故障定位应该是和 9806H的配置有关系,登录 9806H查看,发现上联口设置了禁止广播转发 9806H-1(cfg-if-ge-5/1)# show interface 5/1 Interface : 5/1 FloodForWard : disable BroadCastRateLimit : disable 典型故障案例 9806H下挂用户获取不到 IP地址故障 16 故障处理(续) 该设置后,如果 DHCP server响应报文是以广播方式下发的,将导致机顶盒无法收到响应报文。之前业务正常是因为其 DCHP报文都是采用单播方式下发的,而昨晚上层设备刚好做过割接,可能方式产生改变,于是修改配置。 9806H-1(cfg-if-ge-5/1)# rate-limit broadcast 2048 /单位 pps 测试机顶盒能正常获取到 IP了。证实了上述推断。 典型故障案例 9806H下挂用户获取不到 IP地址故障 (续) 17 典型故障案例 9806H无法配置语音 IP 故障现象 配置 ip subnet voip时提示冲突 conflict。 故障处理 经检查,发现分配的语音 IP地址为 10段的,而 9806H缺省的带外 ip host是 01/,因此所有 10网段都会产生冲突,将带外掩码改成 24位后即可 。 数据规划需要保证带内、带外、语音 IP不在同一个网段,避免产生冲突。 18 典型故障案例 9806H个别用户数据无法删除 故障现象 使用 9806( ag) # del-slctermid begin slot 3 num 48 命令删除用户时提示“ DB: Error delete 。 故障处理 如果窄带端口处于被占用状态 (Seize/LineBusy),该端口的 TID数据是不能被删掉的,会提示 DB: Error delete,此时应先 get-slcstatu 查看一下相应端口是否被占用(也可能外线接触不好)。 在这种情况下,可以拔掉外线 /或者复位用户板后迅速删除。 /如果外线或话机没挂好,过一会儿仍然会导致端口状态占用。因此动作要快,建议写好删除脚本。 19 典型故障案例 IAD用户拨打 1000号无法挂断 故障现象 某局 IAD出现 10000号无法挂断的问题,试了其他固话号码都可以正常挂断包括 114, 95588等,手机也可以正常挂断。但是拨打 10000号后始终挂不断,到 20多秒时估计电话超时而挂断。 故障处理 跟踪信令发现挂机时 ONU正确上报了 al/on挂机消息 , 但是 SS没有下发指令释放资源与电路;最后查出 , SS设置了 , 只有被叫挂机才结束通话 。SS侧修改数据后正常 20 典型故障案例 POS机刷卡不成功问题 故障现象 用户的农行金穗支付通 POS机拨号后,屏幕显示先是“连接中心。”再是“接收数据。”,接着过一会儿就断线,无法正常连接操作。正常时应该是在“接收数据。”后显示操作界面能实现转帐等功能 故障处理 该 IAD用户拨打电话业务正常 。 在软交换平台上给此 POS机所拨的接入号码配置“ 业务控制媒体 ” 数据 , 使得在软交换上能够优先处理保证稳定建链 。 但此数据配置后 POS机故障现象依旧 。 进一步抓包分析 , 发现从软交换到 C220的两次丢包率为 2.1%和 3.4%。 确认是C220上层 IP承载网的 RTP丢包率过大 。 MODEM和传真业务的丢包率要求一般不能超过 0.5%; POS业务一般不能超过 1% 解决方案 解决网络丢包问题 配置冗余: mod-rtppar parid 1 g711redundancy 13 /1-3可以试着修改,但配置冗余只能解决一般较轻丢包,严重丢包还需解决网络问题。 21 典型故障案例 IAD用户电话时好时坏 故障现象 某 9806H下挂用户使用一段时间后就出现电话不能用,当被叫能振铃,提机就听忙音。 故障处理 经过信令跟踪,发现是 MG与 MGC的 RTP termid不一致导致无法拨通。 MG发的: Record 12 时间 =11:45:32 =!/1 :2944 P=688181764C=21A=A2,A=RTP/000056MLv=0 c=IN IP4 t=0 0 m=audio 10110 RTP/AVP 8 a=ptime:20 22 典型故障案例 IAD用户电话时好时坏(续) 故障处理(续) SS发的: Record 15 时间 =11:45:32 =MEGACO/1 :2944 T=695915016C=21MF=A2MOMO=SR, RV=OFF, RG=OFF,tdmc/ec=ON, E=688249347ctyp/dtone, al/*, SG,MF=RTP/56MOMO=SR, RV=OFF, RG=OFF, Rv=0 c=IN IP4 m=audio 26048 RTP/AVP 8 a=ptime:20 23 典型故障案例 IAD用户电话时好时坏(续) 故障处理(续) 所以 MG回 error: Record 16 时间 =11:45:32 =!/1 :2944 P=695915016C=21MF=A2,MF=$ER=410Incorrect identifier 将 MG与 MGC的 RTP termid修改成一致,故障解决。 小结:本例是由于双方 RTP设置不一致导致( AG侧设置为RTP/00056,SS侧设置为 RTP/56)。实际上如果双方的 RTP资源数量不相符也会出现单通现象。 24 典型故障案例 9806H用户电话无法使用 故障现象 9806H下所有用户电话摘机忙音,有时有拨号音,但拨号后中断出现忙音 故障处理 查看 H.248状态,发现有时是 ok,一两分钟后 break,不断重复此过程。 查看 ips、 slc的 termid与 ss一致并且状态都正常, ping软交换不丢包。 更换语音 ip、语音板、主控板进行测试,仍然没有解决故障。 由于 9806H采用域名进行注册,怀疑可能是域名冲突。 联系 SS核对数据,发现该节点配置的域名错误,同另外一个节点产生冲突,修改后正常。 有一例类似故障 SS上抓信令发现 9806H不断在上报重新注册消息,但在 9806H上抓信令却没有看到该消息,经确认另有一台设备设置了同样的窄带 IP但未带业务,不断上报注册请求消息。 h.248协议不断瞬断,主要是由语音 ip或者域名冲突造成,当发生冲突时, ss回应的消息,会在两个冲突的 mg之间不停转换,因此造成 h.248协议时断时续。 因此数据规划一定要严格,更换语音域名、 IP一定要求核对清楚,避免冲突。 25 端口 A 端口 B 管理员 A和 B通信 端口镜像把端口 B收到的流量也发给端口 C 端口 C 端口镜像 端口镜像使得管理员在不影响交换机正常通信的情况下,能够对网络流量进行监控和调试。 维护技巧 -抓包 26 配置范例 ZXAN(config)#monitor session 1 创建一个镜像(只能创建一个) ZXAN(config)#interface inner-port_0/3/1 进入内联口或上联口模式 ZXAN(config-if)#monitor session 1 source direction both 设置源端口以及数据流方向 ZXAN(config)#interface gei_0/4/1 进入上联口模式 ZXAN(config-if)#monitor session 1 destination 设置目的端口 ZXAN(config-if)#show monitor session 1 显示镜像配置 Session 1 - Source Ports: Port: inner-port_0/3/1 Monitor Direction: both Destination Port: Port: gei_0/4/1 维护技巧 -抓包 27 Wireshark的功能简介 撷取网络封包 分析网络封包 分解网络封包 Wireshark(前称 Ethereal)是一个网络封包分析软件 维护技巧 -抓包 28 撷取网络报文 维护技巧 -抓包 29 分包撷取 30 数据分析 网络丢包 网络抖动 单向媒体流 广播包 媒体流还原 31 数据过滤 megaco.termid=USER00600800031|megaco.termid=RTP00200300060 32 根据用户端口号过滤 udp.port=6120|udp.port=6121 33 根据 ip地址过滤 34 35 网络丢包 针对网络丢包可以在两端配置冗余来规避 36 Seq从 23412跳变到 23414 37 网络抖动 我们这里所说的网络抖动在 WireShark中可以通过 Delta的值来衡量, Delta是相邻两个媒体包之间的间隔值。 因为网关发送媒体包时的打包间隔是固定的,在没有网络抖动的情况下,接收侧网关收到的媒体流的 Delta也应该是一个定值。当有网络抖动时, Delta的值会随着网络抖动而变化。 Graph 38 笔记本电脑抓 tag报文配置 笔记本电脑网卡驱动默认会在接收数据包的时候过滤 vlan tag,使得用 wireshark抓到的数据包中不含 vlan tag,此时需要通过修改注册表让驱动保留 vlan tag。 Intel PRO/1000或 PRO/100网卡,对于此类网卡需要将注册表: HKEY_LOCAL_MACHINESYSTEMControlSet001ControlClass4D36E972-E325-11CE-BFC1-08002BE1031800xx,如果该目录下有多个子项,需要找到 Intel(R) PRO/100 S网卡对应的子项(其中 DriverDesc是设备类型): 其他维护技巧 39 笔记本电脑抓 tag报文配置 对于 Broadcom千兆网卡,需要在注册表里增加一项 PreserveVlanInfoInRxPacket=1,类型为 string。位置与 TxCoalescingTicks相同,后者可以在HKEY_LOCAL_MACHINESYSTEMCurrentControlSet下搜索到。 其他维护技巧 40 批量工具使用 批量工具能够脱离网管独立运行,通过 TELNET连接实现对我司 PON节点(包括 OLT和 ONU)实现批量版本下载和命令执行功能,方便对 PON节点进行批量维护,特别是没有安装中兴网管的点。批量工具实际上是一个 TELNET客户端和 FTP服务器端(当然也可以启动第三方 FTP服务器端软件,这样会提示 FTP端口已经被占用,继续执行即可),可以顺序批量 telnet到若干个 PON节点顺序发布命令。 以下以 F820为例,说明批量工具的使用 其他维护技巧 41 批量工具使用 -认识工具 批量工具是一个免安装的绿色软件,解压缩后有以下文件: 其中主要是 bachtool.ini这个文件,可以修改其中的配置,以达到对不同设备的操作和设置 其他维护技巧 42 批量工具使用 -配置文件 Bachtool.ini打开后,其中主要是前面一部分的配置 UpdateBootCmd_WaitSeconds=30 /升级线卡 BOOT等待时间,单位为秒; UpdateVersionCmd_WaitSeconds=180 /升级线卡版本等待时间,单位为秒; FtpPort=21 /ftp端口号; FtpTimerOut=29 /ftp超时时长,单位为秒; FtpWri

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论