




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、TB002301以太网单板故障分析与处理,1.0,课程目标,以太网故障定位的思路 以太网故障定位的常见方法 以太网常见故障的处理,通过本次课程,学员应掌握以下内容:,课程内容,以太网故障定位基本知识 以太网故障定位的思路与常见方法 以太网常见故障的处理,基本知识,CSMA/CD 端口工作模式 帧格式 以太网各种错帧 以太网流控 VLAN,功能、实现与引入的问题?,以太网是面向非连接、尽力传送的一种网络技术,从MSTP产品应用角度来看,以下几个知识点需要重点了解 : 一、以太网基础知识,基本知识,CRC校验错 以太网帧的最末部分为4个字节的帧校验序列字段,接收端通过CRC(循环冗余校验)来校验帧
2、在传送过程中是否发生差错(误码)。对于CRC校验出错的帧,一律丢弃。 超短帧 小于64字节的帧,认为是信号碰撞产生的残片,一律丢弃。 超长帧 超过端口允许的最长长度的帧,一律丢弃,MSTP系列产品端口默认最长帧为1522字节(可设置)。 若全双工VS半双工,大量碰撞的会导致端口接收到不完整的帧,如果残片小于64字节,则认为是超短帧,直接丢弃;如果残片不小于64字节,则进行CRC校验,但由于帧校验序列字段错误,则认为是CRC错帧,也会丢弃。 Alignment 字节对齐错,比较少见,一般为硬件故障引起,碰撞也可能引起该类错包。,以太网各种错帧(Ethernet ),基本知识,目前各种设备主要实现
3、的是全双工以太网的显式流量控制:在发生拥塞的时候,端口发送特定的流控帧(PAUSE帧)到对端,对端接收到流控帧后便停止数据发送一段时间,从而减缓端口的拥塞压力。 PAUSE帧是一种标准的以太网帧,其类型域的值为0 x8808,净荷的主要内容为slot time(表明需要对端暂停数据发送的时间,若slot time为0,则表示对端可以立即恢复数据发送)。 对于MSTP产品系列以太网单板而言,都支持在自身拥塞的情况下向对端发送流控帧,但slot time一般为固定值(产品不同、版本不同,则取值不同)。对于接收到的流控帧,不同的单板处理方式不完全相同: ET1V1/ET1V2:响应但不透传 EGT:
4、既响应也透传,以太网流控,基本知识,对于ET1V1版本而言,VLAN的作用在于业务汇聚功能时用作路由标志,即通过配置VLAN路由实现以太网业务的汇聚功能,此时,有如下要求: 中心网元ET1的以太网端口设置为TAG属性; 中心网元ET1对接的宽带数通设备必须具备3层功能,即可以进行VLAN的划分(一般根据目的IP地址划分不同的VLAN)。 其他网元不做要求,根据实际情况灵活配置。 其他场合,一律建议配置端口路由。 对于ET1V2版本而言,VLAN的作用在于隔离,即通过VLAN过滤表实现端口的隔离,再在VLAN过滤表内通过二层交换实现帧的转发。,以太网VLAN,基本要求,基于不同平台的单板的共性与
5、特征 封装协议、封装颗粒、接口类型、功能实现、版本特征、配置方法 单板的性能指标 吞吐量、时延、背靠背和交换容量 单板可支撑故障定位的功能 环回、测试帧、流量统计、黑匣子、SDH类告警与性能、以太网类告警与性能(RMON) 同SDH相比,以太网特性单板规格更多、配置和应用更复杂,需要多花精力来学习和记忆!当然,理解是记忆的基础。,二、以太网特性单板知识,基本知识,ET1系列单板的处理方式:发端首先将以太网帧拆成N个64字节长度的分片,然后采用ML-PPP协议对各个分片进行封装并依次轮循映射到绑定的VC12中,其中每个分片对应一个VC12。接收端首先从VC12中恢复出完整的分片,然后再将N个分片
6、合成一个完整的以太网帧。 EGT/EMS/EFS系列单板的处理方式:发端不对以太网帧进行拆片,而是采用LAPS/GFP协议将整个以太网帧进行封装,然后以字节流依次轮循映射到绑定的VC中。接收端首先从VC中取出数据,然后去掉封装恢复成一个完整的以太网帧。,以太网单板对数据帧的处理方式,基本知识,吞吐量(Throughput):网络不丢帧情况下的最大速率,是最直接反映“带宽”的一个性能指标; 时延(Latency):设备的处理过程引入的延时; 丢帧率(Frame Loss Rate):在网络稳定状态下由于网络资源缺乏造成的不能转发的数据帧和总数据帧的百分比,理论上,吞吐量+丢帧率100%; 背靠背
7、( Back-to-Back ):网络允许的无帧丢失通过的、以最小的合法帧间隙出现的连续数据帧的最大长度,反映系统对数据突发的容忍能力。 由于吞吐量和丢帧率具有互补的关系,一般情况下只需要关注吞吐量和时延这两项性能指标。当然,在故障定位时,要综合考虑以上几种性能指标对业务带来的影响。 另外,长期稳定性测试能反映出系统在一定负荷下长期工作的可靠性,对于反映业务有少量丢包的故障,最终可通过背靠背测试来判断是否为MSTP产品故障引起,以太网单板常用的性能指标,基本知识,各种错包 FCSErrors :CRC错和超短帧,首先排除端口模式不匹配的问题,其次是网线质量(干扰)的可能性,最后定位是否为网口硬
8、件故障。 AlignmentErrors:对齐错误,首先排除碰撞的可能性,如错包数量较多,建议更换硬件(对端设备故障可能性较高)。 发送错包:一般为本端FIFO处理能力瓶颈引起或硬件故障,如错包数量较多且频繁,建议更换单板。 碰撞与退避 表明本端口工作在半双工模式下,建议查询对端是否也工作在半双工模式。 流控帧 表明网络流量过大,建议用户适当调整业务负载或进行流量整形。 硬件异常 DropEvents:由于FIFO溢出而导致的丢包。若数量较大,则先硬复位单板,如现象持续,则更换单板。,性能事件RMON,基本知识,数据通信的发展 了解数据通信技术的发展历史,加深对各项数通技术的理解,把握数据通信
9、发展的趋势。 高层协议 初步掌握TCP/IP协议族主要内容,了解交换、路由等方面基础理论知识。 业务内容与实现 解应用层业务内容与高层协议的关系,了解业务与底层技术的联系。 目的:建立一套系统的数据通信知识体系,并同已有的传输知识体系有机结合,站在业务的角度、网络的角度来思考问题、理解网络。,三、数据通信理论基础知识,基本知识,产品的功能与分类 了解数通宽带产品的基本功能与分类,掌握与其对接的要点。 常见主流网络产品 了解常见主流数通产品的主要功能与网络地位,学习其基本的配置方法。 混合组网与测试 备根据业务和对接数通设备需要设计MSTP网络的能力,具备根据对接数通设备特点筹划联合组网测试的能
10、力。 了解一些数通宽带产品知识,有助于提高处理对接问题时的速度效率,四、数通宽带产品知识,基本要求,以太网的工作模式 以太网业务信号在Metro 1000/3000上的处理过程 固定模式和自协商模式 :自协商需要选择的内容主要包括双工模式、运行速率和流控等 VLAN模式与Tag标签 以太网业务的配置参数 流控 绑定及绑定通道 :绑定后的业务有一条发生故障,所有绑定在一起的业务整体倒换。 端口使能 Tag端口,对ET1等以太网单板的常见故障处理,需要理解掌握以下知识点:,基本要求,Vctrunk通道配置: 一个Vctrunk对应N个E1,N148,每个E1不能重复配置; 每个Vctrunk可以分
11、配多个E1,配置给同一个Vctrunk的E1,建议业务尽量沿同一路径配置在同一个VC4中,因为单板在倒换时,不是以某一个E1为单位来倒换,而是以Vctrunk为单位来倒换,会将该Vctrunk通道上的所有的E1同时倒换。沿一路径配置在同一个VC4就可以尽量避免了因通道保护,各E1之间不同的延时,导致的数据错误和告警 。,基本要求,以太网业务的配置参数 传输速率 半双工和全双工 自协商方式 端口缺省VLAN:在汇聚组网方式下,如果非汇聚端口设置为Access属性,则要求设置VLAN ID,且要求各个端口设置的缺省VLAN各不相同 静态路由 :静态路由的索引号不能相同,小结,问题1:如果数据在传输
12、过程中,即SDH侧出现误码,单板如何处理?,无论是何种封装协议,在封装时都会加入CRC校验,接收端在恢复成完整的以太网帧时,会对数据进行相应的CRC校验,如果校验错,则直接丢弃相关数据,不会将产生错误的以太网帧发送出去。,问题2:为何吞吐量测试时,测试用的帧长度不同,则测试结果不同?,主要是帧间间隔、前导码等不需经过SDH传送(由对端直接重生),即不占用通道绑定的带宽。,系统的方法论,必须建立在对传送网、数据通信、网络产品等知识全面、系统的了解之上,从网络整体角度来分析、解决问题。,课程内容,以太网故障定位基本知识 以太网故障定位的思路与常见方法 以太网常见故障的处理,以太网故障定位的思路,判
13、断是否真的发生了故障 判断故障的严重程度 判定故障界面 定位故障原因,MSTP产品以太网故障定位的难点:,发生事故时该查询哪些数据,一直是困扰以太网板维护的一个问题,以太网故障定位的思路,以太网故障定位也遵循 先外部、再内部; 先软件、再硬件; 先单板、再系统”的原则。 充分利用性能事件、环回、测试帧等技术手段,结合工具软件、测试仪表进行有计划有步骤的定位 。,以太网故障定位的思路,首先需要对于事故做一下初步的定位,排除SDH层面的问题,通过查询相关的告警和性能,确认SDH层面没问题后,转入以太网层面的定位。 对于以太网业务的故障定位,首先检查有无和ET1板相关的告警,主要集中在一些低阶的告警
14、。比如BIP-EXEC,TU-LOP,LP-SLM等等 。如果存在低阶业务告警,可以再对SDH层面进行一些相应的检查,否则就需要定位一下是否是对接的路由器或者以太网交换机的故障造成 。,首先需要检查、确认SDH层的配置和通道没有问题,才能集中精力来排查以太网数据层面的问题。,以太网故障定位的方法,以太网性能分析RMON:不同以太网特性单板提供了不同的性能监视功能,具有RMON特性的单板还可以提供相关性能值越界告警,在日常维护和故障定位中,性能事件(RMON)是一个很好的辅助工具。,错包 碰撞与退避 流控 硬件异常,重点分析RMON,以太网故障定位的方法,以太网性能分析RMON 以下性能事件需要
15、重点关注,以太网故障定位的方法,Ping:配置一条连接,两端端口的Tag属性设置为Access,然后在两端用户接入端口分别接入一台PC,将两台PC设置在同一网段内,然后使用ping命令,用其中一台PC ping另一台PC的IP地址。 要求ping包长为6410000byte之间的不同包长的包,如果都能够ping通,则可以确认设备工作正常。 当只有一台PC的时候,可采用如下方法: 将本站以太网板的一个端口连接PC; 将对端站以太网板的一个端口连接到该站主控板的以太网接口; 在本站使用不同的包长ping对端站的IP地址。 注意:此时以太网板要设置为10Mbit/s半双工或自协商。,以太网故障定位的
16、方法,环回法:通常按照“MAC层环回”、“E1支路环回”、“VC-4外环回”、“光口环回”的顺序依次进行环回操作。 首先根据需要,设置端口的环回,然后使用ping命令任意ping一个IP地址;通过端口统计的性能事件来查看数据包的增长,如果性能事件中的某一数据包的接收和发送数据没有同步增长,则说明环回处有问题。 一般多用PING+环回手段来定位故障点。比如通过ET1网口PING对端路由器或者交换机的IP地址,能够PING通基本证明我们这边正常,建议采用如下的格式PING包: ping xxx.xxx.xxx.xxx l 1500 (或2000)t l 1000代表是1000字节的包长,-t代表是
17、持续ping包。可以变换多种包 长,同时多开几个ping窗口试试。,注意:ping包正常也不能完全排除metro设备的问题,因为在端口工作模式不正确的时候,小流量的ping也是可以ping通的。它更多意义上是证明我们以太网链路的配置没问题,SDH层面也是没有问题的。,以太网故障定位的方法,对比法:使用相同的配置在同一时间,同一地点进行相同的操作,以确定是传输设备的问题还是以太网对接设备的问题。 1、将本地两台PC通过交叉网线直接相连,进行ping测试,并记录ping的结果。 2、在传输设备上配置两条以太网路由;然后在传输设备远端站点将这两条路由串接(即配置一条VC-Trunk至VC-Trunk
18、的路由或者将以太网端口硬件环回)。 3、在本端将步骤1使用的两台PC,分别连接到已在步骤2完成配置的两个以太网端口;然后进行与步骤1同样的ping测试; 4、比较步骤1和步骤3 ping测试的结果;如果比较结果丢包率有数量级上的差异,则说明传输设备有问题。,以太网故障定位的方法,工具软件 ServU:FTP服务器端软件,可基于WIN98/2000/XP平台,利用FTP可在一定条件下近似反映出通道带宽。 Sniffer:简明实用的抓包工具,可基于WIN98/2000/XP平台,处理疑难杂症时推荐使用,缺点是发包功能较弱。 Solar Winds:功能纷繁复杂,适合数通专业人员使用,附带的Ping
19、工具功能强大,并可输出log文件,缺点是部分功能不够准确,会对用户产生误导。 测试仪表 SmartBits:主流以太网测试仪表(又名数据分析仪),主要功能:1、性能指标测试;2、构造并发送各种类型报文;3、收、发包统计;4、抓包并解码分析。 IXIA:常用功能和SmartBits基本相同。,工具软件与仪表使用,以太网故障定位的步骤,MSTP产品以太网故障定位的步骤 弄清故障现象 查询伴随的告警和性能 难点/关键点:判定故障界面,一旦判定了故障界面,则整个定位工作完成了70%,课程内容,以太网故障定位基本知识 以太网故障定位的思路与常见方法 以太网常见故障的处理,以太网常见故障的处理,网络业务中
20、断类,案例1:某传输网采用OptiX 2500+和OptiX 155/622H组成,其中心站OptiX 2500+与环上另一站OptiX 155/622H各绑定配置102Mbit/s的以太网业务。 故障现象:用户反映不能上网。有的时候使用QQ等软件没有问题,但是不能浏览网页。没有任何告警信息。使用两台PC互相ping测试,发现ping包长较小的时候,没问题;当ping包长较长的时候,发现对端设备不可达。,以太网常见故障的处理,故障分析及排除 : 查询全网告警,发现无任何异常告警,说明2M业务侧无问题。 检查业务不通两端传输设备和交换侧的以太网端口工作模式与属性的设置,均设置正确。 将中心站的O
21、ptiX 2500+连到交换侧,在本站使用便携PC连到OptiX 155/622H上,ping对端交换机的IP,可以ping通;ping域名DNS也没有问题。 经过以上步骤可以断定网络是通的,用户业务不通可能是由于以太网业务的传输速率过低导致的。逐步增大Ping的报文长度,经过多次ping包发现,超过890字节则ping不通,即短包通而长包不通 。 在确认两端网线无质量问题后,怀疑业务配置。经过检查业务配置,发现中心站OptiX 2500+侧的绑定通道为112M,而本站OptiX 155/622H侧的绑定通道为102M。将两端绑定通道统一设置为102M后,故障排除。,以太网常见故障的处理,结论
22、及建议: 一般情况下,以太网业务不通通常有以下几种原因: 以太网口的工作模式与路由器或交换机侧的工作模式不匹配; ET1板的以太网端口或绑定通道口的Tag属性设置不正确; 交换机侧的Tag属性设置不正确; 网线制作不规范导致高速率的业务不通; 业务配置问题,两侧绑定的虚通道不一致。,绑定的任意一个VC12出现异常或两端虚通道绑定的VC12没有一一对应,都会导致业务出现有规律的损伤或引起业务中断,以太网常见故障的处理,问题总结:处理此类问题,首先完成故障界定,即判断故障点在传输侧还是数通侧,因此第一步隔离数通产品,采用PC直连,如问题依旧,则说明问题很有可能出在传输侧。其次,要了解实际网络业务的
23、特点,充分利用已有工具进行各项测试,找出问题点。再次,理解以太网特性单板的工作原理,进而分析故障原因。 业务开通后Ping测试的时候应加上包长的参数,建议参数为1500,即 Ping IP地址 l 1500 -t; 如果两端MP绑定的VC12不能一一对应,则必然导致业务异常; 引深一步可知,对ET1单板,如果Vctrunk绑定的任意一个或多个VC12异常,则会导致整个Vctrunk的以太网业务异常;,以太网常见故障的处理,案例2:某传输网络采用OptiX 2500+组成2纤双向复用段环,组网图如图所示,1号站为业务中心站。各站均配置有ET1板,集中型业务,即各站只与1号站有业务,故障现象:环上
24、3号站的用户反映在上网时,时通时断;网页有时能打开,有时打不开。在网管上查询告警,发现3号站的ET1板上有大量瞬时性LP_RDI告警上报,对端1号站的ET1板上有大量瞬时性TU_AIS告警上报;每次告警只持续1到2秒,间隔大约12分钟。3号站和1号站的2M支路板、STM-1接口板都没有异常告警,整个网络只有Ethernet业务受影响。,以太网常见故障的处理,故障分析及排除: 通过比较网元时间,告警产生及结束时间,可以肯定故障站点的LP_RDI告警是由于中心站点的TU_AIS引起。 1号站ET1板的端口分别对应环上各站点的ET1板端口,各站点的业务使用同一个VC-4汇接到1号站;而且1号站的2块
25、ET1上不是所有2M都有TU_AIS,其中有5个2M没有TU_AIS,这5个2M和其他2M唯一不同的就是这5个2M都来自1站东向板位的S16,其它有TU_AIS的2M业务都来自1站西向板位的S16。即1站ET1报TU_AIS的通道,其业务都来自1站西向S16,估计是该VC-4的业务没有穿通过来。 故障很可能是1站或西向相邻站点故障; 首先对1站XCS板进行主备倒换,结果故障现象依然存在;然后倒换西向相邻站点的XCS,故障现象消失,告警结束;观察1个小时,仍然正常。复位该站点原主用板位的XCS板后,再将该XCS板设置为主用板,故障重现;可以定位为该XCS板故障。,以太网常见故障的处理,结论及建议
26、: 由于XCS板故障导致某个VC-4业务无法穿通,业务中断。 在定位以太网业务故障时,先要观察SDH的告警和性能事件,在确保SDH无误的前提下,再进行以太网的故障定位。,SDH侧故障引起业务中断,以太网常见故障的处理,案例3:某传输网采用2台OptiX 2500+组成链形网,各站配置了一块ET1板;与ET1对接的设备为:1号站连接B公司的ATM交换机,2号站连接A公司的二层八口交换机。如图所示,故障现象:对接设备通过OptiX 2500+后无法上网,业务不通。无任何告警。将A公司交换机的第3口通过标准网线连接到OptiX 2500+的ET1板第一端口上,将便携机连接到该交换机的第5口上,进行p
27、ing测试,业务不通 。,以太网常见故障的处理,故障分析及排除: 检查网线没有问题。 将A公司的交换机通过UPLINK口使用标准网线直接连接到B公司的交换机上,然后A公司的交换机连接便携机,上网正常。 将A公司的交换机连接到2号站OptiX 2500+设备ET1板第一口上,将B公司的交换机连接到1号站OptiX 2500+设备ET1板第一口上,在交换机两端分别连接便携机,互ping能通。 1号站连接B公司的交换机,2号站连接便携机能够ping通,设定正确的IP地址后也能够正常上网。 通过逐段ping B公司交换机确定各段网线没有问题,怀疑A公司交换机设定有误。 检查OptiX设备的业务配置及端口属性设置,没有问题。 通过和A公司技术人员联系,了解到该公司的交换机出厂时八个口分别独立设定为一个VLAN,各端口是隔离的,无法进行相互通信。只有通过UPLINK口才可以和其它口通信。 将连接OptiX设备与A公司交换机的网线改为交叉网线,通过UPLINK口相连,便携机连接到该交换机2-8口的任何一个口,都可以正常上网,以太网常见故障的处理,结论及建议: 在将便携机直接连接到2号站OptiX设备ET1板的第一口上时,可以通过OptiX设备正常连接到1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 IEC 62198:2025 EN-FR Managing risk in projects - Application guidelines
- 【正版授权】 IEC 62840-2:2025 FR Electric vehicle battery swap system - Part 2: Safety requirements
- 单位义务消防员培训课件
- 河北四升五数学试卷
- 桂林中考最难数学试卷
- 2025届安徽合肥市华泰高中物理高一下期末综合测试模拟试题含解析
- 中国沸腾式全自动开水器行业市场前景预测及投资价值评估分析报告
- 中国微电子行业市场调查研究及投资前景预测报告
- 2025年中国石墨电极行业市场调查研究及投资前景预测报告
- 健康知识科普讲座课件下载
- 师德师风建设领导小组职责及活动安排
- 2025深圳辅警考试真题
- 诊所中药饮片清单
- Soul app用户体验分析市场调研分析报告PPT模板
- 计划生育门诊工作制度
- 三年级数学《两位数乘两位数口算题(共100道)》专题训练
- 甲级写字楼服务标准
- 《圆》导学案
- 开工前施工单位需提供安全资料
- 门窗验收单(共1页)
- Python程序设计循环结构程序设计ppt课件
评论
0/150
提交评论