交换机二层环路问题处理指引设计_第1页
交换机二层环路问题处理指引设计_第2页
交换机二层环路问题处理指引设计_第3页
交换机二层环路问题处理指引设计_第4页
交换机二层环路问题处理指引设计_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实用标准文案目录1 介绍 22 网络业务故障,如何确认存在环路? 32.1 第一步:是否可以通过端口流量发现数据风暴? 32.2 第二步:是否可以通过 MAC-Flapping检测漂移? 52.2.1 框式交换机 52.2.2 盒式交换机 72.3 第三步,是否可以通过环路检测发现环路? 82.3.1 Loop Detection(框式) 92.3.2 Loopback Detection(盒式) 103 环路问题发生后,如何快速破环? 113.1 第一步:是否理解网络业务并明确拓扑? 113.2 第二步:是否需要用影响最小的方法破环? 113.2.1 方法一:端口退出成环 VLA酸环 113

2、.2.2 方法二:shutdown成环端口破环 113.2.3 方法三:通过拔出成环光纤破环 113.3 第三步:操作后确认业务是否恢复? 124 环路问题发生后,如何定位问题根因? 124.1 第一步:是否由于近期施工操作引入环路? 124.2 第二步:是否由于近期修改配置引入的环路? 124.3 第三步:是否典型的常见环路问题? 134.3.1 交换机自环出现环路 134.3.2 交换机下游设备自环出现环路 134.3.3 环形组网链路震荡导致环收敛震荡 144.3.4 环形组网寄存器下发失败无法破环 144.3.5 链路单通引入RRP啊络单向环 154.3.6 协议堵塞的端口 L2PT

3、(bpdu-tunnel )协议报文成环16文档大全实用标准文案4.3.7 下游设备报文转发异常导致疑似环路 164.4 第四步:收集信息返回研发分析 175 环路问题解决后,网络是否需要优化? 185.1 第一步:是否需要部署适当的破环协议? 185.2 第二步:是否需要提升链路质量和可靠性? 185.3 第三步:是否需要部署广播抑制提升网络健壮性? 185.4 第四步:是否需要部署 Qo晖证协议报文优先转发? 196 结束语 191介绍以太网链路由于各种原因,导致数据或协议报文环形转发,导致网络形成数据风暴, 最文档大全实用标准文案终影响正常业务。本文档仅介绍二层网络的常见环路问题识别和处

4、理。本指导手册按照如下思路进行二层环路问题分析和处理:1、网络业务故障,如何观察确认存在二层环路?2、环路问题发生后,如何快速破环恢复业务?3、如何排查环路问题的根本原因,是否已知案例?。4、针对问题原因,对网络进行适当的优化。处理二层环路问题,您首先需要准备如下:1、整网的拓扑图,包含设备名称、登陆方式、系统 MAC2、登陆软件,记录全部的操作记录。准备好这些,我们开始二层环路问题的处理之旅。2网络业务故障,如何确认存在环路?网络业务故障后,如发生二层环路,通常会存端口流量数据风暴和反复大量的MAC(移现象。因此,在骨干链路所在的节点,通过如下三步操作:第一步:Display interfa

5、ce brief | inc up端 口 流里旦L- feXT 业务1 .一H否f- 第一步:全局或VLAN部署 MAC漂移检测口_一一是否存在反复的、一/ 可能 f大量MAC漂移?, h 1_环五仕 路1第三步: VLAN或端口部署 LDT环路检测一一1 j . -旦 不八刷 痴I位!?攵、.a1不存在二刁1、止口 1-八匕层划、路)图1:环路排查流程图可以判断网络是否可能存在二层环路。2.1第一步:是否可以通过端口流量发现数据风暴?通过display interface brief命令,查看所有接口下的流量,存在环路的接口上InUti和OutUti两个计数会逐步增加:第一次查询:文档大全实

6、用标准文案151disp interface Ethernet brief | in upPHY: Physical*down: administratively down(l): loopback(b): BFD downInUti/OutUti: input utility/output utilityInterfacePHY Auto-Neg Duplex Bandwidth InUti OutUti100M 0% 0.01% -1000M 0.56% 0.56%1000M 0.56% 0.56%TrunkGigabitEthernet0/0/2 up enable fullGigabi

7、tEthernet0/0/16up enable full1GigabitEthernet1/0/12up enable full1MEth0/0/1up enable half 100M 0.01% 0.01% -最后一次查询:151disp interface Ethernet brief | in upPHY: Physical*down: administratively down(l): loopback(b): BFD downInUti/OutUti: input utility/output utilityInterfacePHY Auto-Neg Duplex Bandwid

8、th InUti OutUtiMEth0/0/1Trunkupenablefull100M 0% 0.01%upenablefull1000M 76% 76%upenablefull1000M 76% 76%GigabitEthernet0/0/2GigabitEthernet0/0/16GigabitEthernet1/0/1211up enable half 100M 0.01% 0.01% -一般情况下,查询只能看到网络的当前流量结果, 此时需要和网络的正常业务流量进行比较,业务流量的带宽可以从客户的网络流量监控图获取。如果只有一台设备的一个端口出入方向流量较大,可能是单端口环回。如果只

9、有一台设备的两个端口流量较大,可能是本设备两个端口环回;如果某端口只有单方向流量,只有出或者只有入,需要重点排查,因为环路有可能在该端口的上下游设备。通常情况下:如果当前网络流量远大于正常业务,可能存在二层环路。如果当前网络流量正常,没有部署广播抑制,没有二层环路。如果当前网路流量比正常流量稍大,且部署了广播抑制,需要继续后面的第二步和第三步操作。文档大全实用标准文案2.2第二步:是否可以通过 MAC-Flapping检测漂移?MAC地址漂移即设备上一个接口学习到的MACM址在同一 VLAN中另一个接口上也学习到,后学习到的 MAC%址表项的覆盖原来的表项。导致MAC*址漂移的因为包括网络存在

10、环路、或者非法用户进行网络攻击。例如下图,当Switchl向两个方向同时发报文时,在Switch2上的两个不同端口都会收到该报文,从而出现MACM址漂移。当Switch2的两个端口出现了 MACfe址漂移时,说明交 换机的两个端口间可能出现了环路。LSW2LSW3图 2: MAC-Flapping 示意图MACM址漂移,交换机所有形态和版本均默认支持漂移,具体的MAB移配置主要是指漂移后是否告警,漂移后是否设置端口堵塞的功能。由于框式交换机和盒式交换机MAC(移检测的命令行和检测存在差异,我们分别介绍:2.2.1 框式交换机V1R2版本,在非S系列单板上支持全局使能的MAC-Flapping检

11、测功能(全局使能,只支持发送TRAP。在V1R2上,开启MACM址漂移检测:Quidwaymac-flapping alarm enableV1R3及以后的版本,在 V1R2版本的基础上,新增了基于 VLAN的MACM址漂移检测、 检测到MAC*址漂移后执行对应的动作策略。在V1R3及以后的版本上,开启MACCfe址漂移检测(下面两个命令均可使用):系统视图下: Quidwayloop-detect eth-loop alarm-onlyVLANW 图下:Quidway -vlan1001loop-detect eth-loop alarm-only各个版本的告警信息存在一定的差异,样例如下:

12、版本告警信息文档大全实用标准文案V1R1不支持V1R2全局检测L2IF/4/MAC_FLAPPING_ALARM:OID136.1.4.1.2011525.4221712Themac-addresshasflapvalue.(BaseTrapSeverity=0,BaseTrapProbableCause=0,BaseTrapEventType=4,L2IfPort=549,entPhysicalIndex=1,MacAdd=0000-0000-002b,vlanid=1001,FormerIfDescName=Ethernet3/0/2,CurrentIfDescName=Ethernet3

13、/0/3,DeviceName=S9306-169)VLAN佥测不支持V1R3全局检测L2IFPPI/4/MAC_FLAPPING_ALARM:OID136.1.4.1.2011525.4221712Themac-addresshas flap value . (L2IfPort=0,entPhysicalIndex=0,BaseTrapSeverity=4,BaseTrapProbableCause=549,BaseTrapEventType=1,MacAdd=00e0-fc00-4447,vlanid=1001,FormerIfDescName=GigabitEthernet6/0/6,C

14、urrentIfDescName=GigabitEthernet6/0/7,DeviceName=9306-222.159)VLAN佥测L2IFPPI/4/MFLPVLANALARM:OID1.3.6.1.4.1.2011.5.25.160.3.7Loop exist in vlan1001, for mac-flapping.V1R6全局检测L2IFPPI/4/MAC_FLAPPING_ALARM:OID1.3.6.1.4.1.2011.5.25.42.2.1.7.12Themac-addresshas flap value.(L2IfPort=0,entPhysicalIndex=0,Ba

15、seTrapSeverity=4,BaseTrapProbableCause=549,BaseTrapEventType=1,MacAdd=0025-9e6e-1c55,vlanid=1001,FormerIfDescName=GigabitEthernet2/1/23,CurrentIfDescName=GigabitEthernet2/1/22,DeviceName=9303-222 .157)VLAN佥测L2IFPPI/4/MFLPVLANALARM:OID1.3.6.1.4.1.2011.5.25.160.3.7 Loop exists in vlan1001, for flappin

16、g mac-address 0025-9e6e-1c55between port GE2/1/23 and port GE2/1/22.文档大全实用标准文案2.2.2盒式交换机盒式交换机(不包括 23、27系列)V1R3及以后版本,不支持全局使能的 MACM址漂移 检测,只支持基于 VLAN的MACfe址漂移检测,同时支持卞测到漂移后的发送 TRAP阻塞端 口等动作。开启MACfe址漂移检测:VLANW 图下:Quidway -vlan1001loop-detect eth-loop alarm-only各个版本的告警信息存在一定的差异,样例如下:版本告警信息V1R3L2IF/4/MFLPPO

17、RTRESUME:OID 1.3.6.1.4.1.2011.5.25.160.3.7Loopexistinvlanfor(hwMflpVlanId:”1001”;hwMflpVlanCfgAlarmReason:"for flapping mac-address 0000-0000-002b between port GE0/0/24 and port GE0/0/23”)V1R3L2IFPPI/4/MFLPVLANALARM:OID 1.3.6.1.4.1.2011.5.25.160.3.7Loopexists in vlan 1001, for flapping mac-addr

18、ess 0000-0000-002b between port GE0/0/24 and port GE0/0/23.V1R6L2IFPPI/4/MFLPVLANALARM:OID 1.3.6.1.4.1.2011.5.25.160.3.7Loopexists in vlan 1001, for flapping mac-address 0000-0000-002b between port GE0/0/24 and port GE0/0/23.文档大全实用标准文案2.3第三步:设备作为三层网关,是否存在大量CPCAK包记录?ARP报文被<dgg62aslhwug>disp clo

19、ck2011-11-30 20:04:32WednesdayTime Zone : BJ add 08:00:00<dgg62aslhwug>disp cpu-defend arp-request statistics slot 3CPCAR on slot 3Packet Type Pass(Bytes) Drop(Bytes) Pass(Packets) arp-request 91720644 610013391561348833Drop(Packets)897078517<dgg62aslhwug>disp cpu-defend arp-reply statis

20、tics slot 3CPCAR on slot 3Packet Type Pass(Bytes) Drop(Bytes) Pass(Packets) arp-reply 381073700 469254845405604025Drop(Packets)690080655<dgg62aslhwug>disp clock2011-11-30 20:04:35WednesdayTime Zone : BJ add 08:00:00<dgg62aslhwug>disp cpu-defend arp-request statistics slot 3CPCAR on slot

21、3Packet Type Pass(Bytes) Drop(Bytes) Pass(Packets) arp-request 91728872 610017599401348954Drop(Packets)897084705<dgg62aslhwug>disp cpu-defend arp-reply statistics slot 3CPCAR on slot 3Packet Type Pass(Bytes) Drop(Bytes) Pass(Packets) Drop(Packets) arp-reply 381082540 46925484540560415569008065

22、5通常情况下,ARP勺交互是有序进行,短时间内不会出现超多报文的丢弃。问题一般发生在9300作为汇聚网关场景,出现上述,情况后,可能的原因是ARP的广播报文在物理环形的网络中转发,形成协议报文的风暴,当前设备上送CPU被交换机CP邛艮速丢弃。文档大全实用标准文案2.4第四步,当前是否可以增加配置环路检测发现环路?框式交换机和盒式交换机都支持检测环,框式交换机的环路监测称为Loop Detection ;盒式交换机的环回监测称为Loopback Detection 。2.4.1 Loop Detection(框式)框式交换机端口配置 Loop Detection 功能以后,设备会从该端口发送环路

23、检测报文, 在端口所属且使能 Loop Detection功能的VLAN内进行环路检测,如果设备接收到自己发送 的检测报文,网络上存在环路。框式交换机上的环路监测能检测到下面两种情况下的端口环路:1、设备上端口收到本端口发送的检测报文。2、设备上端口收到非本端口发送的检测报文。开启了 Loop Detection 以后,用display loop-detection命令可以查看当前环路检测的状态,用 display loop-detection interface命令可以查看具体某一个端口的状态。<Quidway> display loop-detection Loop Detec

24、tion is enable. Detection interval time is 5 seconds.Following vlans enable loop-detection: vlan 556Following ports are blocked for loop: NULLFollowing ports are shutdown for loop: NULLFollowing ports are nolearning for loop: NULL<Quidway> display loop-detection interface gigabitethernet 1/0/0

25、The port is enable.The port's status list:Status WorkMode Recovery-time EnabledVLANNormal Shutdown 200556告警示例如下:文档大全实用标准文案版本告警信息V1R2LDT/4/DetectLoop:OID:1.3.6.1.4.1.2011.5.25.174.3.11nteface1ndex:12 1ntefaceName:Ethernet3/0/1以也也刈VlanListHigh:, The port detected loop!V1R3LDT/4/DetectLoop:OID:1.3.

26、6.1.4.1.2011.5.25.174.3.1nterfaceIndex:7InterfaceName:GigabitEthernet6/0/1VlanListLow: 1000 VlanListHigh: none, The port detected loop!V1R6LDT/4/DetectLoop:OID:1.3.6.1.4.1.2011.5.25.174.3.1The portdetectedloop.(InterfaceIndex:14InterfaceName:GigabitEthernet1/0/1 VlanListLow: 1000 VlanListHigh: none)

27、2.4.2 Loopback Detection(盒式)盒式交换机端口配置Loopback Detection功能以后,设备会从该端口发送环路检测报文,一个 untagged报文和指定 VLAN Tag报文。盒式交换机的 Loopback Detection ,只能 针对设备上端口收到本端口发送的检测报文的环路。开启了 Loop Detection 以后,用display loop-detection命令可以查看环路检测功能的配置信息和接口状态信息。<Quidway> display loopback-detectLoopback-detect is enabled in the

28、system viewLoopback-detect interval: 30Loopback-deteck sending-packet interval: 5InterfaceProtocolID RecoverTime Action StatusGigabitEthernet0/0/2 60230 block NORMAL盒式交换机告警示例如下:版本告警信息V1R3LDT/4/Porttrap:OID1.3.6.1.4.1.2011.5.25.174.3.3Loopbackdoes exist on interface(27)GigabitEthernet0/0/22( VLAN1000

29、 ) , loopback detect status: 2.(1:normal; 2:block;3:shutdown; 4:trap; 5:nolearn)V1R6LDT/4/Porttrap:OID1.3.6.1.4.1.2011.5.25.174.3.3Loopbackdoes exist on interface(27)GigabitEthernet0/0/22( VLAN1000 ) , loopback detect status: 2.(1:normal; 2:block;3:shutdown; 4:trap; 5:nolearn)文档大全实用标准文案3环路问题发生后,如何快速

30、破环?以太网的环路,会在短时间内形成数据风暴,当端口的流量达到带宽的最大负荷,会形成链路拥塞,影响网络业务。因此,在确认网络发生数据环路后,请按照如下步骤处理:3.1 第一步:是否理解网络业务并明确拓扑?环形网络拓扑一般较为复杂,可以向客户寻求网络拓扑结构全图,具体到网络的VLAN规划信息,每台设备名称、系统 MAC管理IP,本端端口名称、对端端口名称。完整的拓扑信息是解决环路问题的首要条件,如果没有拓扑图,需要从发现环路的设备,通过逐跳登陆,记录设备信息、端口信息和VLAN言息,手动绘制完整的拓扑。3.2 第二步:是否需要用影响最小的方法破环?紧急破环又称手动破环,当网络风暴严重影响正常的业

31、务时,需要在尽快恢复业务。可以通过如下三个方法紧急破环:(注意紧急破环不要影响远程 telnet路径所在的设备、端口和 VLAN避免无法登陆。)3.2.1 方法一:端口退由成环VLAN破环将成环的网络上,其中一个端口退出成环VLAN,属于影响面最小的方法。端口命令行备注Accessundo default vlan可能影响卜游业务。Trunkundo port trunk allow-pass vlanid无Hybridundo hybrid vlanid不区分 tagged 和 untagged备注:需要注意不要 shutdown远程telnet路径所在的端口,避免无法远程登陆。3.2.2

32、方法二:shutdown成环端口破环Shutdown成环的物理端口,也可以达到破环的效果。此时,需要保证 shutdown的端口两端在全部 VLAN内能够通信。3.2.3 方法三:通过拔生成环光纤破环通过拔出成环的光纤,可以紧急破环。备注:该方法可以使用 shutdown端口代替,只有在设备无法登陆时才使用。文档大全实用标准文案3.3 第三步:操作后确认业务是否恢复?通过ping等测证网络通信质量,并和客户一起观察现网业务是否已经恢复。环路拓扑存在冗余链路和配置, 环路破除后业务会自行恢复, 特殊情况在此不一概而论。4环路问题发生后,如何定位问题根因?4.1 第一步:是否由于近期施工操作引入环

33、路?如果环路问题是由于近期施工操作引入,可以和施工方确认, 了解施工的过程, 特别是新增线路连接的细节,结合拓扑结构,确认后排出物理环路。4.2 第二步:是否由于近期修改配置引入的环路?常见的容易配置引入环路的命令行如下:特性命令行成坏原因应对方案接口管理Undo shutdown端口进入转发引入环路。关闭端口或者部署 破环协议STPBpdu enable盒式交换机端口下需要使能 bpdu enable 命令才能接收并 处理STP报文。配置命令(V1R6及 以后版本已默认使 能)框式交换机端口下需要去使能 该命令,交换机才不会透传STP 报文。删除命令bpdubridgeenable使能该命令

34、会导致 STP报文透 传,无法上送处理。删除命令bpdu-tunnelstpbridgeroleprovider使能该命令会导致 STP无法处 理报文。删除命令RRPPRrpp enable全局不配置 rrpp enable ,无法 计算堵塞端口破环。配置命令SmartLin kSmartlink enableSmartLink 组模式卜小使能该命令,无法计算堵塞端口。配置命令文档大全实用标准文案4.3 第三步:是否典型的常见环路问题?4.3.1 交换机自环由现环路LSW1图3:设备自环出现环路前置条件:交换机未配置 STP和LDT问题现象:端口出方向和入方向流量持续增加。问题原因:端口自环或

35、者链路环回。处理方法:1、首先在端口下去使能 loopback internal 。2、设备由于链路引入环路有两种:一种是单端口收发环回。第二种是设备上两个端口环路。此类环路造成的原因是光纤或者网线误接,需要拆除连线。4.3.2 交换机下游设备自环由现环路LSW1LSW2图4:下游设备自环出现环路前置条件:设备未部署 STP和LDT,本设备未环回。问题现象:端口入方向和出方向流量持续增大,环回链路在下游。问题原因:下游链路环回或者自环。处理方法:1、首先逐跳向下游寻找环路的链路。1、然后在端口下去使能 loopback internal 。2、设备由于链路引入环路有两种:一种是单端口收发环回。

36、第二种是设备上两个端口环路。此类环路造成的原因是光纤或者网线误接,需要拆除连线。文档大全实用标准文案4.3.3 环形组网链路震荡导致环收敛震荡LSW2O理论上的堵塞端口计算的堵塞端口图5:环路堵塞端口存在振荡前置条件:设备部署 STR RRPP SEP或者SML。破环协议。问题现象:环路一段时间收敛正常,一段时间收敛失败,或者持续震荡。问题原因:网络上链路存在震荡,导致环网协议报文转发失败,反复超时震荡。如:1、链路存在错包,协议报文被丢弃。2、未知单播抑制、不合理的 qos等配置丢弃协议报文。处理方法:1、如因为错包丢弃,建议更换问题网线、光纤或者光模块。2、如因为被抑制丢包,建议修改单播抑

37、制和不合理的Qos配置。3、观察当前网络带宽,确认是否是网络流量拥塞,导致协议报文丢失,超时放开堵塞 端口导致临时环路,此类问题需要进行网络优化。4.3.4环形组网寄存器下发失败无法破环LSW2文档大全实用标准文案图6:环形网络无法破环前置条件:物理环路,协议已经破环。问题现象:网络数据风暴问题原因:软件计算堵塞端口正确,但是芯片下发失败。处理方法:此类问题极其少见,可以通过 shutdown、undo shutdown期望的堵塞端口, 观察协议是否收敛成功。4.3.5链路单通引入RRPPW络单向环LSW1LSW2故障的单通端口图7:链路单通造成的 RRPPW前置条件:RRPP1网问题现象:R

38、RPPI塞端口超时放开问题原因:RRPPH、跳检测方向,链路单通。处理方法:解决单通链路问题。该问题有两个规避方法:1、链路自协商,链路质量较差的情况下,链路单通无法协商UP无单通问题。2、通过在链路上部署 DLDP佥测协议,检测到链路单通后,会完全 shutdown两侧的端 口,解决单向环环路问题。文档大全实用标准文案4.3.6 协议堵塞的端口 L2PT (bpdu-tunnel )协议报文成环LSW2LSW1计算的堵塞端口LSW3图8:已经破环的网络协议报文成环前置条件:二层网络环路收敛正常,堵塞端口状态下发正常问题现象:disp l2protocol-tunnel statistics查

39、看到报文增加很快,软转发成环。问题原因:由于堵塞端口软件转发L2PT (bpdu-tunnel )协议报文,未判断端口是否堵塞,从堵塞端口发送 L2PT报文,引起的L2PT报文成环,处理方法:R6以前版本需要加载最新的补丁解决问题。V1R6C00SPC900军决该问题。4.3.7 下游设备报文转发异常导致疑似环路LSW1LSW2计算的堵塞端口图9 :报文转发异常导致环路前置条件:二层网络环路收敛正常,堵塞端口状态下发正常问题现象:在LSW呢成频繁的MAC-Flapping ,出现疑似环路问题。问题原因:二层网络的边缘设备,由于个别厂家实现差异,对于无法处理的报文,会反文档大全实用标准文案弹转发,常见的设备有机顶盒等。处理方法:由于报文反弹,此类问题需要更换边缘设备解决。4.4第四步:收集信息返回研发分析如果问题还没有解决, 那么问题可能是由于交换机的软件或者硬件故障导致环路,您需要收集信息返回研发进行分析。相对其他单台设备问题,环路问题涉及多台设备或者整网。相关信息参考价值、收集方法以及细节要求如下表。序 号环路相关是否必选?信息价值?如何收集

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论