BSCIv3.0—2-1_第1页
BSCIv3.0—2-1_第2页
BSCIv3.0—2-1_第3页
BSCIv3.0—2-1_第4页
BSCIv3.0—2-1_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、BSCI v3.02-1园区交换网络的维护和排障交换机性能问题的排障定义性能问题 性能问题可以使用几方面的期望和需求来定义: 用户期望和需求 业务期望和需求 技术期望和需求 性能问题的排障包括: 评估问题是否是技术本身的特性 隔离性能问题到设备、链路或组件 在组件级别诊断并解决性能下降问题示例:定义性能问题 示例:交换机下挂20个用户,均使用100Mbps端口连接,一台文件服务器连接到同一台交换机的1Gbps端口。一般情况下,用户在不同时间访问文件服务器,因此只要不超过一半的用户同时访问文件服务器,那么他们访问文件服务器可获得100Mbps的速率。 假设某个时刻所有用户都访问文件服务器,每个用

2、户平均只能获得50Mbps的访问速率,若用户还期望获得100Mbps的访问速率,则从用户期望来说是一个性能问题,但是从技术层面来看网络性能是在预期范围内。 从另一个方面来看,如果某个用户从来没有获得超过50Mbps的访问速率,即便只有该用户在访问文件服务器,那么从技术层面来看就是一个性能问题。但是从用户来看,他甚至不认为是性能问题,因为他从来就没有获得超过50Mbps的访问速率。交换机性能 交换机性能主要包括: 数据平面 入接口 转发硬件 出接口 控制平面 CPU 内存检查接口错误 交换机的show interface命令支持一些特定的选项,能够显示报文和错误统计 通常在100万个数据帧中发现

3、超过1个FCS错误就必须进行检查。检查接口错误(续)show interface counters errors里面输出的信息包括: Align-Err:数据帧alignment error(校准错误)的数量,即数据帧并非整数字节而是多出17比特并且CRC检验错误。这通常是物理问题,例如线缆、端口坏、网卡坏等,也可能是双工不匹配导致的。 FCS-Err:数据帧FCS(帧校验和)错误的数量,这通常是物理问题(线缆、端口坏、网卡坏或者双工不匹配等)。 Xmit-Err和Rcv-Err:表明内部的端口发送(Tx)或接收(Rx)缓冲区满。可能原因是从高速端口收到流量并交换到低速端口。 Undersiz

4、e:小于64字节(最小的IEEE 802.3帧)的数据帧数量,它的CRC是正确的。检查发送出这些数据帧的设备。 Single-Col:端口成功发送一个数据帧前发生一次冲突的次数。若该值显著增加,意味着链路使用率高或双工不匹配。 Multi-Col:端口成功发送一个数据帧前发生多次冲突的次数。若该值显著增加,意味着链路使用率高或双工不匹配。 Lat-Col:迟冲突次数,可能原因是双工不匹配或以太网线缆太长;全双工端口不应该看到冲突。 Excess-Col:由于冲突次数太多(16次)导致发送失败的数据帧数量,可能原因是双工不匹配。 Carri-Sen:载波侦听,在半双工链路上正常。 Runts:小

5、于64字节且CRC错误的数据帧,可能原因是双工不匹配或物理问题(线缆、端口、网卡) Giants:超过1518字节(最大的IEEE 802.3帧)的数据帧,通常是由于网卡故障造成的。双工不匹配 在以太网网络中,最常见的导致性能问题的原因是链路两端的双工不匹配。 双工配置的指导: 点到点Ethernet链路应该始终配置工作在全双工模式。 半双工不再常用,通常只有在使用Hub时才会使用。 推荐自动协商速率和双工。 若自动协商失败,在链路两端手工设置速率和双工。 链路两端都工作在半双工模式比两端双工不匹配的性能更好。案例学习:双工问题 PC1的用户通常需要在他的PC和服务器之间传输大文件(每个文件为

6、几个G字节)。他抱怨在他的PC上传输这些文件需要花费几个小时而不是几分钟。 开始你怀疑该故障是否由于网络拥塞导致。但是当你检查平均带宽使用率,你发现在过去几个小时内,路径上没有任何一条链路的负载超过50%。 你接着检查路径上的链路进行排障。 问:该用户正常情况下传输1G字节文件大约需要多少时间?双工不匹配:Full-Duplex侧 双工不匹配的典型症状是: 工作在Full-Duplex模式一侧将有大量的FCS错误双工不匹配:Half-Duplex侧 双工不匹配的典型症状是: 工作在Half-Duplex模式一侧将有大量的冲突(Collision),特别是迟冲突Auto-MDIX和Duplex

7、Auto-MDIX特性能够检测一个连接需要的线缆连接类型(直连线或交叉线),并且自动配置。 这种特性使得你可以使用直连线或交叉线来连接设备,接口将自动调整使得不正确的线缆正常工作。 支持Auto-MDIX特性的交换机默认开启该特性。 Auto-MDIX依赖于速率和双工的自动协商。如果禁用速率和双工协商,Auto-MDIX也被禁用。配置Auto-MDIX 本例显示如何启用接口的Auto-MDIX特性 从Cisco IOS软件12.2(20)SE版本开始,默认启用mdix auto命令。 速率和双工必须设置为auto,这样Auto-MDIX才正常工作。查看Auto-MDIX 使用show inte

8、rface transceiver properties命令查看接口的Auto-MDIX、速率和双工状态(包括管理的和工作的)。转发硬件 交换机的转发硬件包括: 决策逻辑,它执行: 二层交换动作 三层交换动作 访问列表处理 QoS处理 在接口间传输数据的背板(Backplane)TCAM(三重内容可寻址内存) 控制平面(Control Plane)中影响报文转发的信息(例如MAC地址表/路由信息/访问列表/QoS等信息)被编码到TCAM中,用于硬件转发 TCAM无法处理的报文将交由CPU完成转发 目标地址为交换机IP地址的报文(例如发送给交换机的Telnet/SSH/SNMP等报文) 控制平面

9、协议的组播和广播报文(例如STP或路由协议) 由于硬件不支持某个特性,TCAM无法转发的报文 由于TCAM没有必要的信息,无法通过硬件转发的报文TCAM使用率的排障 检查TCAM使用率的命令是平台相关的。 本例中采用Catalyst 3560和3750交换机,展示TCAM利用率排障的原则检查TCAM的使用率 使用show platform tcam utilization命令查看当前TCAM的利用率 比较“Used”一列和“Max”一列,显示TCAM总体使用情况TCAM分配错误 对于特定类型的TCAM条目,可查看是否发生TCAM分配失败。 例如,使用show platform ip unica

10、st counts命令显示TCAM为某个长度的前缀(即路由)分配时是否出现失败的情况。流量转发到CPU 流量交由CPU转发可能是TCAM分配失败或使用硬件不支持的特性的间接证据。 show controllers cpu-interface命令显示交由CPU转发的报文统计信息显示交换机的CPU负载 show processes cpu命令显示交换机CPU使用情况 交换机通过硬件转发报文,因此CPU在中断模式不会花太多时间 (少于10%)CPU在中断(报文交换)花费的时间CPU在进程和中断花费的时间上述输出显示在过去5秒内交换机花费23%的CPU时间,其中18%CPU时间用于中断处理,而只有5%用于控制平面进程的处理。对于路由器来说,这样的CPU使用是正常的,因为CPU转发报文;但是对交换机来说,就需要进行进一步查看,因为它花费过多的时间在中断处理(即报文交换)。CPU问题的排障 首先,确定导致CPU负载上升的主要原因是否是中断或进程 若由于中断导致CPU负载上升,则排障报文转发和TCAM使用率 若由于进程导致CPU负载上升,则隔离对应的进程并根据结果进行排障 在本例中,“IP I

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论