华为交换机网络环路识别和问题定位_第1页
华为交换机网络环路识别和问题定位_第2页
华为交换机网络环路识别和问题定位_第3页
华为交换机网络环路识别和问题定位_第4页
华为交换机网络环路识别和问题定位_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、交换机网络环路识别和问题定位,诊断工具 display工具 如何快速识别环路 定位思路 第一步:通过端口流量发现环路风暴 第二步:通过持续MAC漂移判断环路 第三步:通过大量的CPCAR丢包判断环路 第四步:通过LDT功能检测环路 如何快速恢复环路 如何快速破环 如何分析环路的成因 典型环路场景 破环后网络优化,目录,loop-detect eth-loop alarm-only,Quidway-vlan100loop-detect eth-loop alarm-only ? ,Quidwaydisplay loop-detect eth-loop vlan 100 VLAN Block-ti

2、me RetryTimes Block-action - - - - 100 0 0 alarm-only Total items:1,框式设备默认全局已经使能,盒式设备需要在vlan下使能,Vlan下使能后通过此命令查看,框式设备默认已经使能,如果有漂移打开terminal debugging 、 terminal monitor就可以查看。,MAC漂移检测命令 用于检测设备上MAC地址漂移信息。框式设备默认全局开启,盒式设备默认未能使,需要在VLAN视图下使能。,loop-detect eth-loop alarm-only,L2IFPPI/4/MFLPVLANALARM:OID 1.3.

3、6.1.4.1.2011.5.25.160.3.7 Loop exists in vlan 1001, for flapping mac-address 0025-9e6e-1c55 between port GE2/1/23 and port GE2/1/22.,L2IFPPI/4/MAC_FLAPPING_ALARM:OID 1.3.6.1.4.1.2011.5.25.42.2.1.7.12The mac-address has flap value. (L2IfPort=0,entPhysicalIndex=0, BaseTrapSeverity=4, BaseTrapProbableC

4、ause=549, BaseTrapEventType=1, MacAdd=0025-9e6e-1c55,vlanid=1001, FormerIfDescName=GigabitEthernet2/1/23,CurrentIfDescName=GigabitEthernet2/1/22,DeviceName=9303-222.157),框式设备的告警信息如下:,盒式设备的告警信息如下:,display interface brief | include up,Quidwaydisplay interface brief | in up PHY: Physical *down: adminis

5、tratively down (l): loopback (b): BFD down InUti/OutUti: input utility/output utility Interface PHY Auto-Neg Duplex Bandwidth InUti OutUti Trunk GigabitEthernet0/0/2 up enable full 100M 0% 0.01% - GigabitEthernet0/0/16 up enable full 1000M 76% 76% 1 GigabitEthernet1/0/12 up enable full 1000M 76% 76%

6、 1 MEth0/0/1 up enable half 100M 0.01% 0.01% -,对于流量出入都异常大的端口,需要特别关注,可能都是网络异常环路上的端口。,display cpu-defend statistics,Quidwaydisp cpu-defend arp-request statistics slot 3 CPCAR on slot 3 - Packet Type Pass(Bytes) Drop(Bytes) Pass(Packets) Drop(Packets) arp-request 91720644 61001339156 1348833 897078517

7、-,disp cpu-defend statistics ? all CPCAR information of all boards. slot Specify the slot number | Matching output Quidwaydisp cpu-defend statistics packet-type arp-request ? all CPCAR information of all boards mcu CPCAR information of main board slot Specify the slot number,针对单板或全局看出各个cpcar的丢包情况,也可

8、以指定特定cpcar查看,大量的协议报文被丢弃,Drop比Pass多很多,这种情况要怀疑由协议报文在网络异常环路中风暴导致的,需要排查网络环路。,诊断命令行 display工具 如何快速识别环路 定位思路 第一步:通过端口流量发现环路风暴 第二步:通过持续MAC漂移判断环路 第三步:通过大量的CPCAR丢包判断环路 第四步:通过LDT功能检测环路 如何快速恢复环路 如何快速破环 如何分析环路的成因 典型环路场景 破环后网络优化,目录,如何快速识别环路,第一步:通过流量异常发现环路风暴,1. 如果只有一台设备的一个端口出入方向流量较大,可能是单端口环回。 2. 如果只有一台设备的两个端口流量较大

9、,可能是本设备两个端口环回,如上所示。 3. 如果某端口只有单方向流量,需要重点排查,该端口下设备可能存在环路。,Quidwaydisp interface Ethernet brief | in up PHY: Physical *down: administratively down (l): loopback (b): BFD down InUti/OutUti: input utility/output utility Interface PHY Auto-Neg Duplex Bandwidth InUti OutUti Trunk GigabitEthernet0/0/2 up e

10、nable full 100M 0% 0.01% - GigabitEthernet0/0/16 up enable full 1000M 76% 76% 1 GigabitEthernet1/0/12 up enable full 1000M 76% 76% 1 ,第一步:通过流量异常发现环路风暴,还可以通过CPCAR丢包来发现网络异常环路。 通常情况下,ARP报文的交互是有序进行,短时间内不会出现大量ARP报文的丢弃。 当交换机作为汇聚网关时,出现上述情况后,可能是ARP广播报文在网络物理环路中转发,形成ARP广播风暴冲击交换机,进而被交换机CPU限速(CPCAR)丢弃。 如下所示,arp

11、-request大量丢弃,可能存在网路环路:,display cpu-defend arp-request statistics slot 3 CPCAR on slot 3 - Packet Type Pass(Bytes) Drop(Bytes) Pass(Packets) Drop(Packets) arp-request 91728872 61001759940 1348954 897084705 -,第二步:通过持续MAC漂移判断环路,对于端口配置了广播抑制,或者单环、半环场景,流量无法产生风暴,则还可以通过MAC漂移检测来判断是否存在环路。任何二层环路都会伴随着持续MAC地址漂移。

12、如下所示,如果设备一直打印该告警,GE2/1/23和GE2/1/22端口之间可能存在环路。,L2IFPPI/4/MAC_FLAPPING_ALARM:OID 1.3.6.1.4.1.2011.5.25.42.2.1.7.12The mac-address has flap value. (L2IfPort=0,entPhysicalIndex=0, BaseTrapSeverity=4,BaseTrapProbableCause= 549, BaseTrapEventType=1, MacAdd=0025-9e6e-1c55,vlanid=1001, FormerIfDescName= Gig

13、abitEthernet2/1/23,CurrentIfDescName=GigabitEthernet2/1/22,DeviceName=9303-222.157),MAC-Flapping示意图,第三步:通过LDT发现环路,对于单端口网络环路,还可以通过LDT(loop-detection)进行发现。,Quidwayloop-detection enable Quidwayloop-detection enable vlan 100 Quidwaydisplay loop-detection Loop Detection is enabled. Detection interval tim

14、e is 5 seconds. Following vlans enable loop-detection: vlan 100 Following ports are blocked for loop: ,使能某个VLAN下所有接口的环路检测功能,查询该VLAN下是否有接口存在环路,成环的端口会在此显示出来,注:LDT可以发现单端口环回,并默认将该端口做DOWN处理,具体配置可参考用户手册。,查询命令行 display工具 如何快速识别环路 定位思路 第一步:通过端口流量发现环路风暴 第二步:通过持续MAC漂移判断环路 第三步:通过大量的CPCAR丢包判断环路 第四步:通过LDT功能检测环路

15、如何快速恢复环路 如何快速破环 如何分析环路的成因 典型环路场景 破环后网络优化,目录,如何快速破环,以太网的环路,会在短时间内形成数据风暴,对业务质量有严重影响。在确认网络发生异常环路后,可以通过如下方式快速破环恢复业务。 1 端口退出成环VLAN破环 2 shutdown成环端口破环 3 直接拔出成环光纤破环,如何分析环路的成因,网路环路一般都很网络变动相关,需要先从近期的网络变动排查起。 1. 是否由于近期施工或者客户操作操作引入环路。 如果环路问题是由于近期施工操作引入,可以和施工方确认,了解施工的过程,特别是新增线路连接的细节,结合拓扑结构,确认后排出物理环路。 2. 是否由于近期修

16、改配置引入的环路,重点检查如下几类端口或环路相关的操作命令:,典型环路场景:本设备自环路,前置条件:交换机未配置STP和LDT 问题现象:端口出方向和入方向流量持续增加。 问题原因:端口自环或者链路环回。 处理方法:此类环路造成的原因是光纤或者网线误接,需要拆除连线。,图3:设备自环出现环路,典型环路场景:下游设备自环路,前置条件:设备未部署STP和LDT,本设备未环回。 问题现象:端口入方向和出方向流量持续增大。 问题原因:下游链路环回或者自环。 处理方法: 1. 首先逐跳向下游寻找环路链路(可以通过接口异常流量逐端口排查)。 2. 设备由于链路引入环路有两种:一种是单端口收发环回,另一种是

17、设备上两个端口环路。此类环路造成的原因是光纤或者网线误接,需要拆除连线。,下游设备自环出现环路,典型环路场景:网络环路,前置条件:设备部署STP、RRPP、SEP或者SMLK等破环协议。 问题现象:环路一段时间收敛正常,一段时间收敛失败,或持续震荡。 问题原因:环网协议报文转发失败,反复超时震荡。 处理方法: 1. 检查环路各接口错包情况,如果有建议更换问题链路或者光模块。 2. 检查环路各接口是否有流量抑制配置,如果有建议修改流量抑制配置。 3. 检查环路各接口网络流量,确认环路各接口是否存在Discard拥塞计数,如果有则建议部署QoS。,图:环路堵塞端口存在振荡,典型环路场景:报文转发异常导致环路,前置条件:二层网络环路收敛正常,堵塞端口状态下发正常 问题现象:在LSW3形成频繁的MAC-Flapping,出现疑似环路问题。 问题原因:二层网络的边缘设备,由于个别厂家实现差异,对于无法处理的报文,会反弹转发,常见的设备有机顶盒等。 处理方法:由于报文反弹,此类问题需要更换边缘设备解决。,图:报文转发异常导致环路,破环后网络优化,1. 部署破环协议 如果当前的环路问题是由于物理环路引入,且没有配置破环协议,请按照网络规划合理部署破环协议。以太网交换机常见的破环协议为STP/RSTP/MSTP、RRPP、SEP等。 2. 提升链路质量和可靠性 如果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论