版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、宽带网络故障定位指导书文档密级:内部宽带网络故障定位指导书修订记录日期修订版本描述作者第1章 网络故障概述11.1 常见故障分类1第2章 上网速度慢故障分析22.1 用户客户端问题22.2 网络服务器(web站点或其他网络服务器)问题22.3 网络侧具体网络设备问题32.3.1 案例一:某网络公司反馈用集团帐号上网速度始终很慢,ping 网关时延很大并有丢包。但使用网通出口的用户网络速度正常。32.3.2 案例二:BAS下用户上网速度慢的问题一般定位方法32.4 网络结构问题42.4.1 带宽分析42.4.2 案例:不能点拨VOD的问题处理方法62.4.3 以太网络(内网)62.4.4 IP
2、网络(外网)72.5 网络攻击问题82.5.1 网络攻击案例一:82.5.2 检测网络攻击手段之一:LANSWITCH端口镜像的应用8第3章 用户端口掉线103.1 LAN用户掉线103.2 用户打游戏“掉线”和“卡壳”问题10第4章 数据包丢失124.1 Ping程序参数说明124.2 Ping大包不通134.3 Ping大包丢包134.4 Ping小包丢包134.5 Ping包时延过大14第5章 其他问题引起的网络故障145.1 NAT问题145.1.1 案例一:NAT应用层网关不支持某些协议引起的网络不通问题145.1.2 案例二:NAT转换时使用IP POOL中不同IP引起的问题155
3、.1.3 案例三 NAT对分片(Fragmentation)IP报文的处理155.2 没有保存数据,设备重启引起部分用户数据丢失16第六章 常见故障案例分析176.1 PPPOE拨号出现的错误代码以及常用解决方法176.2 用户使用路由器,因路由器设置不当问题导致上网速度慢206.3 用户使用路由器,因连接线不当问题导致上网速度慢,并影响其他用户216.4 用户电脑使用了冰点还原软件,导致所有设置失效,每次重启电脑都需要再次设置网卡参数216.5 由于病毒广播报文影响集团用户上网速度慢而网通出口无问题。226.6 故障现象:无法登入公司用户管理平台24附录一:通过ACL过滤防范网络攻击24关键
4、词:故障处理 宽带产品 网络摘 要:本文针对宽带网络中常见网络故障现象和故障定位方法进行了描述。本文侧重点是网络运行过程中的网络故障处理,针对单个厂家产品的故障请参考各厂家的产品故障定位指导书。此指导书仅做参考,具体故障还需具体问题具体分析。缩略语清单:参考资料清单:宽带网络故障定位指导书文档密级:无第1章 网络故障概述1.1 常见故障分类针对目前网上问题和常见故障,根据故障现象等因素作了以下分类。1)上网速度慢l 用户客户端问题(含客户端机器问题和客户端组网问题);l 网络服务器问题(WEB/DNS服务器问题);l 网络侧具体网络设备问题;l 网络结构问题(网络侧组网、流量问题);ü
5、; 带宽分析ü 以太网络ü IP网络l 网络攻击问题2)用户端掉线l 拨号用户掉线l 以太端口协商问题3)数据包丢失l ping大包不通l ping大包丢包l ping小包丢包(超时网络速度慢引起,端口协商问题)4)部分业务中断案例l NAT部分业务不支持l 没有保存数据,设备重启引起部分用户数据丢失。2022/3/1第27页, 共31页第2章 上网速度慢故障分析上网速度慢是一个比较复杂问题(从用户PC到他需要访问的目的网站,中间任何一个环节出现了问题都将出现网速慢的现象)。对于我们用户来说,最关心的是如何解决这个问题;而对于设备供应商来说,主要需要定位问题是否由其自身的设
6、备问题所引起还是由于网络其他原因所致。是以遇到这类问题时需要有一个定位问题的基本思路,这样能帮助我们在日常维护中有条不紊地找到问题的真实原因,我们大致可以从以下几个方面着手:(1)用户客户端问题(含客户端机器问题和客户端组网问题);(2)网络服务器问题(WEB/DNS服务器问题);(3)网络侧具体网络设备问题;(4)网络结构问题(网络侧组网、流量问题);(5)网络攻击问题。2.1 用户客户端问题该类问题定位思路如下:1)若只是用户局域网(企业内部和网吧内部)内部个别机器出现上网速度慢的问题,主要从该问题机器本身找原因(机器硬件原因、软件原因等等)。2)若整个局域网内所有机器均出现上网速度慢的问
7、题,适当的时候可以断开局域网组网,将广域网入口处直接挂一台好的PC做上网测试。如果此时问题解决,则证明问题可能出在局域网内部组网上(代理服务器原因,内部路由器原因,内部交换机硬件原因等等。)3)情况中若用户广域网入口处接一台好的PC做上网测试也存在同样上网慢的问题,则需要排除用户侧的问题进一步向网络侧找原因。2.2 网络服务器(web站点或其他网络服务器)问题明确用户反应的上网速度慢的具体情况如何。1)出现以下情况者,可高度怀疑是个别网站的WEB服务器问题:1、打开某个网站的网页十分慢,或根本打不开,而打开其它网站网页(特别是一些大型的门户网站)正常;2、从多处PING该WEB服务器的IP地址
8、不通或丢包严重。2)出现下列故障,可高度怀疑是DNS服务器问题:1、浏览器的状态条中长时间提示“正在连接站点XXX.”(其中XXX为连接的URL名称);2、直接输入网站的IP地址,可迅速打开网页;3、可以PING DNS服务器来确定到底是不是DNS服务器的网路出现了问题。现在电信的DNS服务,有些由于安全原因禁止PING了,那我们可以通过nslookup来进一步定位问题。2.3 网络侧具体网络设备问题如果发生用户网速慢的问题被定位在网络侧(主要是局端的网络设备),要想验证此类问题比较理想的手段是在局端上行设备(从接入层设备到汇聚层设备)上依次分别直接挂接一个FTP服务器,然后再分别在用户端直接
9、用计算机进行FTP下载来测试速度。这样哪层设备出了设备上的硬件问题可以被进一步准确定位。为了更进一步证明不是接入层或汇聚层设备问题,也为了更进一步定位问题,可以在连接的上层设备上(一般是L3)连接一台FTP或HTTP服务器,并在用户端进行下载或浏览测试,倘若正常,则说明接入层或汇聚层设备和上层设备都没问题,倘若在L3上就比较慢,则考虑下列可能出现故障的地方:1)接入层或汇聚层设备与上层连接的设备之间的链路问题,如果为以太网链路,可以考虑协商是否有问题;2)可以通过下列手段进一步确认问题到底出现在哪方面:1、在用户端PING接入层或汇聚层设备上行端口IP地址(可以变换PING的延迟和数据包尺寸)
10、,倘若不正常,可怀疑接入层或汇聚层设备问题,这时候往往是产品局部问题,可以向产品厂家工程师寻求解决;2、倘若PING接入层或汇聚层上行端口IP地址正常,而PING接入层或汇聚层设备连接的上层设备接口IP地址有问题(不通或丢包严重),则可以初步断定是上层设备问题(过度拥塞或受到攻击)。业务需求紧急时立即恢复方法,可以尝试下列手段:1、在接入层或汇聚层连接的上层设备上(一般是L3)的接口进行复位(如果是以太网接口,确认双方配置的协商模式);2、倘若接入层或汇聚层设备连接的上层设备业务量不是很大,可以考虑复位整机;3、倘若接入层或汇聚层设备连接的上层设备业务量很大,可以考虑复位连接设备的单板。注意:
11、在做上述任何一种操作前,一定保存配置信息和告警信息。2.3.1 案例一:某网络公司反馈用集团帐号上网速度始终很慢,ping 网关时延很大并有丢包。但使用网通出口的用户网络速度正常。如果出现这种情况,到网通的出口速度正常,到集团网络出口不正常;则从融合网关往集团出口的这一条链路当中,每一个环节都可能存在问题。我们首先建议检查交换机的CPU占用率,以及各端口的流量情况。防止广播报在集团网络内部蔓延。另外,用户的终端问题也会导致上网速度慢,比如 病毒、MODEM故障等问题。2.3.2 案例二:BAS下用户上网速度慢的问题一般定位方法如果BAS下用户可以上网,但是上网的速度达不到正常的速度,比如:点播
12、VOD不连贯、下载文件的速度很小等等,此时可能的原因有如下几种:1) BAS对用户做了流量控制及优先级控制(CAR)2)用户到目的网站之间存在其它网络瓶颈3)线路原因4)客户自身设备限制5)其它设备对用户做了流控6)工作模式协商不一致BAS可以对用户进行流量控制,从而提供差异化的服务,当用户的上网速度比较慢时,我们首先应当确认BAS为用户提供的CAR值。对BAS下的用户,其CAR值可能在用户名中限制,也可能在域下限制,而且只要域下面的流控是打开的(默认流控),无论在用户属性中设置的CAR值是多少都以默认的流控为准。在实际网络的使用中,用户的速度往往达不到理论的速率,这是正常的,因为从BAS到用
13、户这一段的带宽是独占的,可以达到10-100M,而从BAS到目的网站之间要经过多级路径,这些路径的带宽是共享的而且是有限的,因此会随用户数的多少而有所不同,因此,在遇到上网速度慢的时候,我们还应当确认是否是网络中的其它瓶颈的问题。简单的判断方法可以访问一个近端的服务器,比如直接挂在BAS下面的服务器,看看速度是否正常。对于BAS通过光纤上行时,我们应当注意是否距离过长,如果传输的距离超过了自身类型所能达到的距离,会因为线路的质量而导致速率下降。同时,即使传输距离在允许的范围内,我们可以测量光纤接口的光功率是否正常来判断线路的质量。当与其它设备对接时,如果两端的设备允许不同的工作模模式,比如BA
14、S的FE口就有自协商、10M全双工、10M半双工、100M全双工、100M半双工五种工作模式,GE口也存在自协商、1000M全双工、1000M半双工等工作模式,当两端设备对接的端口工作模式不一致时也会导致网络性能的急剧下降。我们可以查看两端端口的协商模式,一般来说,两端的端口只要工作于自协商状态就会协商允许的最高速率,例外时如果协商的速率太低,我们可以强制把端口都设置为更高速率,比如把FE口设置为100M全双工,把GE口设置为1000M全双工。如果BAS上行还相联其它设备如8808、8805等,因为这些设备也可以对用户或端口做流量限制,此时我们也应当了解这些设备对流量控制的设置情况。除了以上的
15、原因外,客户自身的硬件也是一个值得关注的地方。不同的硬件可以达到的速度是有区别的,一个10M的网卡是如何也跑不出100M的速率的。2.4 网络结构问题2.4.1 带宽分析网络带宽瓶颈是影响上网速度主要原因之一。如下图所示,宽带城域网组网模型,网络带宽可能成为瓶颈,对于不同运营商有所不同。对于网通和中国电信Internet出口不是瓶颈,对于广电和铁通等出口带宽有可能形成瓶颈。对是在骨干层、汇聚层、接入层是否形成瓶颈或某两台设备之间是否形成带宽瓶颈,可以通过网管系统进行流量统计监控,如果带宽利用率超过了50就应该考虑扩容了。图2-1 城域网组网示意图网络受到DoS攻击也是引起上网速度变慢的一个主要
16、原因,这是流量带宽被大量占用造成上网速度显著变慢甚至造成整网中断。对此问题最好通过网管系统对各端口流量进行实时监控。接入层(EOC-LAN接入)考虑到宽带应用与窄带的不同,宽带应用以IP应用为主,不面向连接,所以主要考虑的因素是流量和带宽的占用,但是由于ONU和EPON等接入用户方面的考虑,他们所带用户数量限制也是考虑的因素;与普通局域网不同的是宽带应用给用户限制了带宽和时长,这些都是计算设备负载能力和确定流量模型要考虑的基本因素。设备和网络负载能力:连接数量:每个ONU建议带50户以下;每个EPON建议带1500户一下;上面的计算是设备不考虑收敛比的设备极限能力,下面综合分析一下各种接入业务
17、的流量类型:A、专线用户,主要是网吧用户目前,用户的开通一般采用UBR业务,账号限速,网吧一般为8M、10M、100M等,每个网吧30-60台计算机不等(主要业务包括上网和打游戏),粗略计算可以认为在高峰期(晚18:00-24:00)按平均40台有人上机计算(考虑网吧内部打游戏不占出口带宽,玩QQ基本不占带宽,按照10台有上网流量),所以估算时可以用每个网吧10*0.1M=1M。例如一个ONU下有5个网吧,那么占用带宽5M;其他的公司用户较少,而且其上网时间为白天,带宽利用率不高,可以不考虑。B、个人用户,通常采用PPP拨号接入。一般开通流量2M、4M等。一般用户上网浏览时平均带宽100K即够
18、,即使考虑下载和游戏等应用,按照150K应足够。目前,一般计费采用包月制,同时上线用户平常高峰期(晚上)约40%,极限情况70%。所以这些用户的总的带宽可以按下面公式计算:1)同时上线用户比例:402)平均带宽:150K3)总带宽=(用户数×同时上线用户比例×平均带宽)C、VOD应用的用户通常开通带宽高的用户只是下载文件时突发流量较大,但用户不会总在下载,单次下载的时间不会太长,所以一般不考虑下载等应用,但VOD点播占用流量比较大,而且时间长,对网络负载有影响。主要从以下几个方面考虑:VOD是流媒体应用的一种,目前主要有基于REALPLAY和WINDOWS MEDIA等文件
19、开发方法,不同的媒体数据流速率不同,适用不同范围,如在广域网上的REALPLAY流,可能只要400-480K就可以,但不很清晰,而且易掉线,可以做为上网应用的一种,暂不考虑。在城域网内部(运营商开通的)的VOD服务器上实现的流媒体服务一般只要有1.5M左右,图像就可以比较流畅,能满足用户,这种应用比较普遍,主要制约在于服务器支持的媒体流的个数(成本很高),一般为100个以内。占用带宽可以这样计算:服务器支持的媒体流个数*1.5M例如50个流,占用75M带宽,但这个流量不会上到骨干网上,一般在汇聚层的缓存服务器可以旁路掉。综合上面的因素,接入侧应不会是瓶颈,用户占用带宽计算方式如下:峰值总带宽=
20、(个人用户数*同时上线用户比例0.4*平均带宽0.15M)+专线网吧用户数*网吧平均带宽+服务器支持的媒体流个数*1.5M。2.4.2 案例:不能点拨VOD的问题处理方法当用户反馈不能点播VOD的时候,建议用户在距离最近的网站下载一个大文件(20M以上),观察可以达到的最快下载速度。如果此时用户下载速度很快,可以达到150K Byte/s(2Mbps)左右。则基本定位是VOD服务器的问题。如果下载速度很慢,则考虑以下方面:A、Ping 网关延时是不是太大?如果延时很大,超过60ms,建议检查内部网问题B、看一看是不是有很多的广播报文或者未知单播报文。有的时候,PC终端软件问题也可能会导致VOD
21、不能点播或出现严重断帧现象,更换PC可解决问题。2.4.3 以太网络(内网)在本地网中,网络慢往往是广播风暴引起的,这时候可以查看网络中是否存在物理的环路(比如,有人不小心把交换机的两个端口用网线连接起来,整个网络上的交换机形成了环路,比如,交换机A连接交换机B,交换机B连接交换机C,交换机C又连接交换机A等),如果发现,消除环路一般可以解决问题。平时维护过程中,在网络的每台交换机上都启动生成树协议功能,这样可以避免环路发生。广播网络广播风暴或冲突域过大引起上网速度慢。冲突域过大和广播风暴是影响以太网速度的主要因素之一,其检测办法是在其广播域或冲突域的某个以太端口上接入测试设备。可以是装有Sn
22、iffer/Netxray等软件的笔记本,也可以是一些网络专用仪器,如Aglient Advisor等。通过检测统计系统功能可以方便检测出网络是否有广播风暴存在及影响的大小。以太端口协商 以太端口协商出现不一致,是引起上网速度慢的另一个原因,下面是以太端口显示的信息。Ethernet0 is up, line protocol is up Hardware address is 00-e0-fc-04-14-bf Auto-Negotiation is enabled, Full-duplex, 100Mb/s Description: Quidway Router, ethernet int
23、erface IP Sending Frames' Format is Ethernet_II the Maximum Transmission Unit is 1500 5 minutes input rate 41413.66 bytes/sec, 132.53 packets/se 5 minutes output rate 226645.20 bytes/sec, 192.15 packets/ Input queue :(size/max/drops) 0/1000/0 Queueing strategy: FIFO Output Queue :(size/max/drops
24、) 0/75/0 83818888 packets input, 1246105516 bytes, 0 no buffers 110401210 packets output, 2378652212 bytes, 0 no buffers 0 input errors, 0 CRC, 0 frame errors 0 overrunners, 0 aborted sequences, 0 input no buffers通过显示出的设置和协商信息出的信息可以判断两端是否一致。如协商出速率和全双工或半双工等参数。同时还可以产看出是否产生CRC错误等信息。2.4.4 IP 网络(外网)我们按照范
25、围的不同对IP网络中上网慢的问题分类:1、单个用户上网慢(一台设备下的单个用户);2、整台设备下的用户上网慢;3、一批设备下的用户上网慢;4、整个城域网都慢。第四个问题一般是出口问题,可以通过访问内部网站来判断,如果访问内部网站非常快,而访问出城域网的网站很慢,则肯定是出口问题,可以查看出口链路是否故障,路由是否丢失等,在这里不进行详细讨论。针对单个用户上网慢的问题,我们可以从下列几个方面入手:1、用户计算机问题,可以查看用户计算机的网络属性设置是否正确,并确定硬件配置是否跟实际符合等;2、查看用户连接到设备的链路是否有问题(对于以太网链路,查看协商方式等);3、可以在用户计算机上PING网关
26、,看延迟是否正常(如果不正常,可以改变PING的延迟和数据包长度);4、最后查看是否受到攻击,可以通过用户计算机的网卡指示灯查看,倘若网卡受到攻击(接收到大量的数据),则指示灯闪烁频率将非常高。针对一台设备下的用户上网慢问题,我们可以从下列方面入手:1、首先查看该设备的上行链路是否通畅,可以在设备上PING大量的大包来查看响应时间,如果大量丢包或响应时间太慢,则可能是链路问题,可以针对不同的链路类型进行进一步测试,比如是光纤,则测试其误码率,GE或FE链路,则查看其协商方式等;2、倘若上行链路通畅,则可以怀疑设备是否有问题,可以在设备上连接一台计算机来模拟服务器,然后下载或浏览该服务器上的数据
27、,看是否正常,倘若正常,则可以怀疑是否是上行接口板有问题,如果备件足够,可以更换上行单板;3、如果上述检查都正常,则可怀疑是否是上层设备问题,这时候需要仔细检查上层设备,包括链路状况,路由状况等。针对一批设备不能上网的问题,一般是汇聚这些设备的上层设备问题,可以查看上层设备的告警信息等来定位。MTU配置问题引起故障故障现象为:某些网页不能打开,Ping大于1500bytes IP包Ping不通。MTU的设置问题通常会出现在PPPOE的虚接口,IPOA,POS PPP等接口上,由于对接接口MTU值不一致,打开网页时显示很慢且有些图片不能打开,这是因为,通常HTTP协议传送图片时数据报文不允许分片
28、,造成丢包所以表现为网页打开很慢。通常通过检查两端设备设置,此类问题可以规避。2.5 网络攻击问题旨在给出针对网络出现的异常情况进行分析判断和处理的过程。2.5.1 网络攻击案例一:手段:专业测试仪或sniffer软件的使用;端口镜像捕获报文?点评:该案例的处理过程中,我们利用了LANSWITCH的端口镜像功能成功地在不中断业务的情况下准确地捕获了网络攻击报文。以下就常见LANSWITCH端口镜像应用给以指导。2.5.2 检测网络攻击手段之一:LANSWITCH端口镜像的应用利用镜像端口可以将被镜像端口上全部的数据流镜像到监控端口上,这样在对于一个端口的业务无法中断时想查看此端口上的报文是十分
29、有用的。举个简单的例子来说,A端口如果正在使用,而且无法把A端口的业务中断,我们又想查看A端口上的报文,我们可以使用镜像端口,把A镜像到B(A称为被镜像端口,B称为镜像端口或监控端口),这样所有发给A的报文都会复制一分到B端口。在做端口镜像时,我们要注意,源端口的速率一定不能高于目的端口的速率。而且目的端口不能参加端口聚合。通过端口镜像的设置,我们在目的端口上连上一台设备,就可以监控经过源端口的所有数据报文。第3章 用户端口掉线上网掉线与端口掉线区别,某些用户申告用户上网掉线,首先确认对“用户掉线”是所谓某些游戏网站掉线还是用户LAN端口掉线。这里讨论的是用户端口掉线。3.1 LAN用户掉线固
30、定IP地址用户当用户为固定IP地址,当上网出现故障的时候,用户可以通过PING网关来基本判定问题故障的原因。(1) 如果能PING通网关,但是上不了网,则基本可以判定是上层设备、接入服务器或者出口路由器有问题。(2) 如果不能PING通网关,则有可能是接入设备或者计算机设置、LAN线路方面的问题,可以参照本手册进行故障查找。PPPoE方式接入(1) 首先请观察是否能到达PPPoE的认证阶段,如果能到达认证阶段但是认证失败,或者认证成功但不能正常上网浏览,则问题可能出现在接入服务器上(后续,可由数管局处理查看其他端口是否也有类似问题)。(2) PPPoE认证成功,不能上网,更换不同网站,如果都不
31、能上,则为接入服务器问题或者为网站问题。(3) 如果不能正常开始PPPoE拨号,一般为用户拨号软件问题,请重新安装软件,并正确设置计算机后再试。用户计算机有以下几个典型的使用问题:TCP/IP属性设置错误,IP地址应为<自动获取IP地址>;拨号帐号格式以及密码是否正确;拨号软件安装有问题。如果找不到接入服务器,则可能是接入设备或者计算机设置、LAN线路方面的问题。3. 上网不稳定经常断线能上网,但是上网速率不稳定,经常断线。这种问题一般是线路质量不好或线路过长、线路噪声过大、线路接触不好等导致高频衰减过大的原因造成,可根据以下几个方面,进行问题判定。先判断线路是否超过100M,如果
32、超过,则可能线路过长;或对比周围用户是否也存在此现象。断线时,是否同时在使用其他电气设备,判断是否有干扰设备。检查入户线线路的接头等是否接触可靠,检查入户线质量。检查接入设备上设置的连接约束条件。检查接入设备上该端口的连接参数。利用维护人员到用户家,分析测试数据。3.2 用户打游戏“掉线”和“卡壳”问题主要表现是,一个ONU多个计算机同时打互动网络游戏时,游戏画面停顿,有时将“玩家”踢出。但是此时同一个ONU的其他上网用户使用正常。这个问题主要有两种原因:A、网络游戏需要比较大的上行带宽,若上行带宽已经接近极限。建议增加带宽。B、游戏服务器饱和。游戏的服务器有限,如果比较多用户同时使用,可能会
33、出现这个问题。建议可以登录到其他服务器试一试。经常有网民也反馈,到其它服务器登录,效果可能会好一些。 第4章 数据包丢失通常在检测网络过程中会遇到Ping包丢失故障现象,以下是对该现象的一些分析。4.1 Ping程序参数说明关于windows系统ping程序作如下说明。Usage: ping -t -a -n count -l size -f -i TTL -v TOS -r count -s count -j host-list | -k host-list -w timeout target_nameOptions: -t Ping the specified host until sto
34、pped. -a Resolve addresses to hostnames. -n count Number of echo requests to send. -l size Send buffer size. -f Set Don't Fragment flag in packet. -i TTL Time To Live. -v TOS Type Of Service. -r count Record route for count hops. -s count Timestamp for count hops. -j host-list Loose source route
35、 along host-list. -k host-list Strict source route along host-list. -w timeout Timeout in milliseconds to wait for each reply.Pinging 05 with 32 bytes of data:Reply from 05: bytes=32 time=39ms TTL=120Reply from 05: bytes=32 time=64ms TTL=120Reply from 05: byte
36、s=32 time=48ms TTL=120Reply from 05: bytes=32 time=36ms TTL=120Ping statistics for 05:Packets: Sent = 4, Received = 4, Lost = 0 (0% loss),Approximate round trip times in milli-seconds:Minimum = 36ms, Maximum = 64ms, Average = 46ms这里着重介绍一下L 这个参数,设置发出ICMP Echo Request报文的负载长度。默认为32
37、bytes,因此可以计算出在windows系统中默认发出ICMP Echo Request IP报文总长度为32 bytes负载+8 bytes ICMP头部 + 20 bytes IP首部=60 bytesping -l 1472 则IP报文长度为1472 bytes负载+8 bytes ICMP头部 + 20 bytes IP首部=1500 bytes,正好是以太网最大报文长度。如果Ping -l参数值大于1472 时在以太网上产生IP分片。其中,PING的-i选项也很重要,该选项指出了最大的等待时间。有的情况下,PING不通(或丢包)是因为超时造成的,而不是实际的丢包,比如链路带宽比较低
38、,而网络又很繁忙的情况,这时候就可以使用该选项,增大PING的超时间隔,来具体判断到底是实际丢包呢,还是链路慢。4.2 Ping大包不通所谓ping大包不通,首先要给大包作一个定义,这里我们将大包定义为整个IP包大于 8000 bytes的数据包。故障想象:Ping大包不通,某些网页不能顺利打开。可能的故障因素及处理方式:1. 确定Ping大包不通范围。首先确定从终端到Ping大包不通最近的一跳的设备位置,检查在哪一段网络上大包不能通过。2. 对于PPPOE的虚接口,POS接口及IPOA接口等检查设备MTU值对接设备两端是否一致。对于PPPOE需接口建议设置为1492,其他接口建议设置为150
39、0。更改设置重新测试。3.对于ATM网,流控参数设置也是引起该问题的一个因素之一,具体处理方式请参照前面介绍。4.对于Ping接口地址进行确认,确定是主机还是网络设备接口。如果Ping接口为网络设备则要确认,该设备队IP分片报文是否能正确重组。某些网络设备对乱续IP分片报文重组能力比较差。建议进行Ping检测时候最好Ping Windows或Unix主机的地址。4.3 Ping大包丢包故障现象:Ping大包有丢包,网页打开很慢。可能的故障因素及处理方式1. 确定Ping大包丢包的范围。首先确定从终端到Ping大包丢包最近的一跳的设备位置,检查在哪一段网络上大包丢包。2. 对于PPPOE的虚接口
40、,POS接口及IPOA接口等检查设备MTU值对接设备两端是否一致。对于PPPOE需接口建议设置为1492,其他建议设置为1500。更改设置重新测试。3. 对于ATM网,流控参数设置也是引起该问题的一个因素之一,具体处理方式请参照前面介绍。4.4 Ping小包丢包故障现象:Ping 64 bytes IP包有大量丢包现象存在。打开网页非常慢,同时此类现象还伴随有用户上某些游戏网站掉线的情况发生。可能的故障因素及处理方式1. 确定Ping包丢失网络范围。首先确定从终端到Ping包丢失最近的一跳的设备位置,检查在哪一段网络上Ping 包丢失。2. 检查带宽是否负荷过大,如果为带宽问题,请参照前面相关
41、说明进行处理。3. 对于ATM网络应检查接口告警判断对接线路质量问题,如果为ATM网络问题请参照前面相关说明进行处理。4.对于以太网络检查协商方式是否正确。 如果为以太端口对接问题请参照前面相关说明进行处理。 4.5 Ping包时延过大ping包时延大其实就是ping包丢包的轻度症状。故障现象:Ping 包时延大,上网网页打开缓慢。可能的故障因素及处理方式:用户Ping上端服务器和网络接口 时延过大,此数值一般超过100ms则比较大。此问题涉及到了用户线路和参数设置等多方面因素。在传统DDN或FR网络中利用路由器进行互联常会产生此类问题。这里就不作过多介绍,通常在宽带网络中此问题不常见。注意:
42、长时间ping 包,有些厂家的低端以太网交换机,因其处理性能限制会产生一些丢包现象,在诊断网络问题时应避免此类现象的影响。第5章 其他问题引起的网络故障5.1 NAT问题5.1.1 案例一:NAT应用层网关不支持某些协议引起的网络不通问题某些协议在去除IP包头后的数据区中携带发送主机的源IP地址,在目的主机上的协议或应用程序需要用到这个携带的IP地址,如果NAT应用网关不能识别这种协议,将无法转换其中携带的IP地址。例:某地有如下组网,采用NAT进行地址转换。出现内网的主机(私网地址)HOST无法点播位于外网的Video server(公网地址)提供的视频流格式的影片。尝试将NAT路由器上的N
43、AT取消,主机HOST暂时采用公网地址,这时可以顺利点播影片。可以判断,是采用NAT后造成的问题。进一步的测试后了解到,应用NAT的路由器暂不支持对H.323协议内容的转换,因此视频流报文无法正常传送到主机。图8 NAT ALG不支持某些协议支持的协议种类越多,NAT路由器应用的范围越广。HTTP/TFTP/Telnet/.ICMP/FTP(including PORT and PASV)/H.323/DNS/IP Multicast/Routing table updates/SNMP5.1.2 案例二:NAT转换时使用IP POOL中不同IP引起的问题故障现象:某地的组网外部网络有A网站提
44、供WEB EMAIL服务。内网的用户反映可以访问A网站的WWW页面,但无法成功登录访问A网站的WEB EMAIL服务。工程师小L通过跟踪NAT转换后的报文发现,在第1次登录A网站WWW首页时,新建了1个TCP连接,并在IP报文(TCP的HTTP报文)中观察到记录有识别用户身份的cookie。在随后的登录WEB EMAIL服务页面时,又建立了一个TCP连接,所不同的是,这次对源IP(私网地址)转换采用的公网IP不同于第1次,随后出现无法登录WEB EMAIL服务页面的情况。为测试不采用NAT IP POOL的方式,而是只配置1个公网IP做地址转换,同样测试WEB EMAIL服务,这次登录成功。可
45、以推测,A网站的WEB EMAIL服务对访问的用户进行了源IP地址的鉴别,如果登录WWW页面和登录WEB EMAIL页面IP报文的源IP地址不同(可以对HTTP报文中的cookie来判断2次连接均属同一个用户所为),则拒绝登录。为解决这个问题,NAT软件做了修改,保证从同一个采用私网地址的主机IP报文经过NAT转换后,使用相同的公网IP地址进行转换,以避免上述的问题(或者将基于地址池地址的NAT转换改为基于接口地址的NAT转换,如EASY IP方式)。5.1.3 案例三 NAT对分片(Fragmentation)IP报文的处理故障现象:经过NAT转换后,ping大包不通。在复用(Overloa
46、ding)转换类型的NAT地址转换中,NAT除了对IP地址转换外,还使用到TCP/UDP报文的端口号、ICMP报文的ICMP头中的Identifier字段信息。以ICMP报文为例,说明NAT对分片的IP报文进行的处理。在ICMP报文分片后,只有在第1片ICMP报文中包含ICMP头的Identifier字段,在第1片报文到达NAT路由器后,根据正常的转换流程,根据源IP地址和Identifier信息生成转换表项并转发出去,在第2个及后续分片到达后,由于只包含IP地址却无Identifier信息,可能因此无法进行NAT转换。解决的办法有2种:1)先重组,再进行NAT,最后重新分片转发出去。即在第1
47、个分片到达后,先进缓存,等属于(可以根据IP报头中的Fragment ID字段识别)这个IP报文的其他分片到达后进行重组,再进行NAT地址转换。最后将NAT转换完成的IP报文重新分片后发送。2)在第1个分片到达并转换后,NAT程序记录保存转换第1个分片使用的IP及Idnentifier信息,并在后续分片到达后应用同样的转换表项进行转换。说明:NAT对分片报文的处理情况是比较复杂的。在对分片报文的NAT转换中,可能存在转换前NAT中已有相应转换表项存在的情况,也可能存在后续分片先于第1个分片到达的情况。在不同的情况下,NAT对分片报文的处理存在差别:有可能所有分片报文NAT转换成功,到达对方可以
48、重组;有可能处理后的几个分片报文的源IP地址、Identifier出现不一致,无法到达目的或无法进行重组。5.2 没有保存数据,设备重启引起部分用户数据丢失1故障现象:设备重新启动后部分业务不通。首先确认在设备重新启动以前是否进行了配置保存的操作。如果没有则应首先检查出现中断的业务配置数据是否存在,确定故障是否是因为配置数据没有保存引起业务中断。2故障现象:设备数据修改后部分业务不通。 由于自己设备数据修改错误,上行端口没有透穿业务VLAN。导致部分业务中断。通过把数据修改以后业务恢复。第6章 常见故障案例分析6.1 PPPOE拨号出现的错误代码以及常用解决方法 错误 602 the port
49、 is already open 问题:拨号网络由于设备安装错误或正在使用,不能进行连接 原因:拨号软件没有完全和正确的安装 解决:卸载干净任何pppoe软件,重新安装。或用计算机自带的程序,重新创建宽带连接。 网 上连接(属性)-创建一个新的连接- 下一步-连接到Internet-手动设置我的连接-用要求用户名和密码的宽带连接来连接-ISP名称随便输入-输入正确的用户名和密码,-在我的桌面上添加一个到此连接的快捷方式。则在桌面上可以找到这个快捷方式,拨号上网。错误 605 cannot set port information问题:拨号网络网络由于设备安装错误不能设定使用端口 原因:拨号软件
50、没有完全和正确的安装 解决:卸载干净任何pppoe软件,重新安装。 错误 606 the port is not connected问题:拨号网络网络不能连接所需的设备端口 原因:拨号软件没有完全和正确的安装,连接线故障解决:卸载干净任何pppoe软件,重新安装,检查网线。 错误 608 the device does not exist问题:拨号网络网络连接的设备不存在 原因:拨号软件没有完全和正确的安装 解决:卸载干净任何pppoe软件,重新安装。错误 609 the device type does not exist问题:拨号网络网络连接的设备其种类不能确定 原因:拨号软件没有完全和正
51、确的安装 解决:卸载干净任何pppoe软件,重新安装。 错误 611 the route is not available/612 the route is not allocated问题:拨号网络网络连接路由不正确 原因:拨号软件没有完全和正确的安装,isp服务器故障 解决:卸载干净任何pppoe软件,重新安装。错误 617 the port or device is already disconnecting问题:拨号网络网络连接的设备已经断开 原因:拨号软件没有完全和正确的安装,isp服务器故障,连接线错误 解决:卸载干净任何pppoe软件,重新安装,检查网线。 错误 619 问题:与i
52、sp服务器不能建立连接原因: isp服务器故障, 解决:是否所有用户均不能拨号出现此类错误,若个别错误,请检查帐号。错误 621 cannot open the phone book file 错误 622 cannot load the phone book file 错误 623 cannot find the phone book entry 错误 624 cannot write the phone book file 错误 625 invalid information found in the phone book 问题:windows nt或者windows 2000 serve
53、r网络ras网络组件故障 原因:卸载所有pppoe软件,重新安装ras网络组件和拨号软件。错误629,已经与对方计算机断开连接。 请双击此连接,再试一次。如果出现这个问题,情况比较复杂,因为有多种情况可以导致错误629,多数情况是因为同时拨入的人数过多造成的。另外,在您的拨号连接设置中应该全部采取默认设置,如启用软件压缩、登陆网络都需要选上。一般来讲,此种情况也有可能是由于您所用的网线的性能和质量原因,。错误 633问题:拨号网络网络由于设备安装错误或正在使用,不能进行连接。 原因:拨号软件没有完全和正确的安装。 解决:卸载干净任何pppoe软件,重新安装。 错误 638问题:过了很长时间,无
54、法连接到isp的宽带接入服务器 原因:isp服务器故障;在拨号软件所创建的不好连接中你错误的输入了一个电话号码 解决:运行其创建拨号的拨号软件检查是否能列出isp服务,以确定isp正常;。 错误 645问题:网卡没有正确响应 原因:网卡故障,或者网卡驱动程序故障 解决:检查网卡,重新安装网卡驱动程序。 错误 650问题:远程计算机没有响应,断开连接 原因:isp服务器故障,网卡故障,非正常关机造成网络协议出错 解决:检查网卡信号灯是否正常;检查网卡,删除所有网络组件重新安装网络。 错误 651问题:拨号报告发生错误 原因:windows处于安全模式下,或其他错误 解决:出现该错误时,进行重拨,
55、就可以报告出新的具体错误代码。 错误676,占线。 请稍后再试。错误678,拨入方计算机没有应答,无法完成拨号网路连接。原因:1、连接交换机与网卡之间的连接网线出现问题,以致系统无法与交换机连接。2、帐号问题3、用户家的路由器或交换机本身有问题,以致未有讯号4、局端问题解决:1、检查连接线是否正常,如果必要更换网线;2、通过营帐系统,检查用户帐号状态,如果必要,将用户帐号解绑定,然后再重试拨号;3、检查用户家的路由器或交换机设置正确。4、检查是否出现这种情况为多数还是个别现象。若是同一ONU或者同一PON下用户均为此现象,应着重检查局端设备。5、若是开户的时候出现此类情况,检查局端VLAN数据等,也是必须的。错误680没有拨号音。错误 691问题:输入的用户名和密码不对,无法建立连接 原因:用户名和密码错误,isp服务器故障;账户绑定;解决:1、确认使用正确的用户名和密码,并且使用正确的isp账
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教版八年级上册第二章 声现象第2节 声音的特性教学设计
- 语文综合实践活动教学设计-2025-2026学年中职语文拓展模块高教版
- 2025年CAAC无人机理论考试题库(含答案)
- 2025年全国专利代理人资格考试专利代理实务考试真题及答案
- 药品追溯管理培训试题附答案
- 2025年水利安全员c证考试题库及答案
- 2025年药品不良反应培训试题附答案
- 护士执业资格2025年笔试题库附答案
- 唐代贡举选士机制与社会流动
- 2025年汽车维修工程师职称考试试卷及答案
- 建设工程项目部各级安全生产责任书
- 2023学年完整公开课版耐波性
- 军队文职公共基础知识100题
- 医院临床研究备案表
- GB/T 5976-2006钢丝绳夹
- GB/T 3883.311-2019手持式、可移式电动工具和园林工具的安全第311部分:可移式型材切割机的专用要求
- 机械制造工艺学王先逵-课后答案
- 临床常用药物及其合理应用
- 票据法课件完整版
- 初中地理星球地图八年级下册第九章 青藏地区 区域特征PPT
- 有机光化学反应课件
评论
0/150
提交评论