华为数通操作手册-VRP全系列-VRP故障处理手册-路由器-01-第1章-故障处理技术概述_第1页
华为数通操作手册-VRP全系列-VRP故障处理手册-路由器-01-第1章-故障处理技术概述_第2页
华为数通操作手册-VRP全系列-VRP故障处理手册-路由器-01-第1章-故障处理技术概述_第3页
华为数通操作手册-VRP全系列-VRP故障处理手册-路由器-01-第1章-故障处理技术概述_第4页
华为数通操作手册-VRP全系列-VRP故障处理手册-路由器-01-第1章-故障处理技术概述_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

通用路由平台VRP 故障处理手册入门篇目 录目 录第1章 故障处理技术概述1-11.1 故障处理综述1-11.2 网络故障的分类1-11.2.1 连通性问题1-11.2.2 性能问题1-21.3 故障处理常用方法1-21.3.1 分层法1-21.3.2 分块法1-41.3.3 分段法1-41.3.4 替换法1-61.4 故障处理技能的培养1-61.4.1 加强技术理解1-61.4.2 了解当前网络1-71.4.3 详细记录故障信息1-81.4.4 及时总结经验1-101.4.5 做好日常维护1-101.5 故障处理的帮助资源1-101.5.1 客户服务中心1-111.5.2 华为技术支持网站1-111-11通用路由平台VRP 故障处理手册入门篇Error! Reference source not found.Error! Reference source not found.第1章 故障处理技术概述1.1 故障处理综述当今的网络环境日趋复杂,主要表现在以下方面:l 越来越多的应用需要因特网提供支持,包括数据、语音、视频以及它们的集成传输。l 新业务发展使对网络带宽的需求不断增长,新技术的不断出现。例如:十兆以太网向百兆、千兆以太网的演进;MPLS技术的出现;QoS能力的整体部署等。l 新技术在应用的同时还要兼顾传统的技术。而网络环境越复杂,网络故障发生的可能性越大,引发故障的原因也越发难以确定。由于人们越来越多的依赖网络处理日常工作和事务,一旦网络故障不能及时修复,可能带来很大损失,甚至造成灾难性后果。如何使所维护的网络尽量不出现故障,出现故障之后迅速、准确地定位并排除故障,对网络维护人员和网络管理人员来说是很大的挑战。这不但要求他们对网络协议和技术有着深入的理解,更重要的是要建立系统化的故障处理思想,并合理应用于实际中,以将一个复杂的问题隔离、分解或缩小错误发生的可能范围,从而及时修复网络故障。本书为网络维护人员和管理人员提供以下两方面的帮助:l 有条理的将所掌握的知识应用于诊断和排除网络故障的过程中;l 针对各种网络环境中的常见故障现象进行定位和解决。1.2 网络故障的分类网络故障一般可以分为两大类:l 连通性问题l 性能问题1.2.1 连通性问题对于连通性问题,需要关注以下方面:l 硬件、媒介、电源故障l 配置错误l 不正确的相互作用1.2.2 性能问题对于性能问题,需要关注以下方面:l 网络拥塞l 到目的地不是最佳路由l 供电不足l 路由环路l 网络错误1.3 故障处理常用方法本节对常用的故障处理方法进行介绍,故障处理的整体思路请参见“第2章 故障处理的思路和原则”。常用的故障处理方法包括:l 分层法l 分块法l 分段法l 替换法1.3.1 分层法1. 层次化的故障处理思想过去的十几年,因特网络领域的变化是惊人的,但有一件事情没有变化:论述因特网络技术的方法都与OSI模型有关,即使新的技术与OSI模型不是精确对应,但所有的技术都仍然是分层的。因此,培养层次化的网络故障分析方法非常重要。分层法思想很简单:所有模型都遵循相同的基本前提当模型的所有低层结构工作正常时,它的高层结构才能正常工作。因此,在确认所有低层结构都正常运行之前,解决高层结构问题完全是浪费时间。例如:在一个帧中继网络中,由于物理层不稳定,帧中继连接反复丢失。这个问题的表面现象是到达远程端点的路由反复出现间歇性中断。如果维护工程师由此判断是路由协议问题,并对路由协议进行故障诊断,必然是事倍功半。2. 各层次的关注点(1) 物理层物理层主要实现以下功能:l 通过某种介质提供到另一设备的物理连接;l 进行端点间二进制流的发送与接收;l 完成与数据链路层的交互操作。在物理层,维护工程师需要关注的因素包括:电缆、连接头、信号电平、编码、时钟、组帧方式。这些都可能导致端口状态不能变为UP。(2) 数据链路层数据链路层主要实现以下功能:l 在网络层与物理层之间进行信息传输;l 规定介质如何接入和共享;l 规定如何对站点进行标识;l 规定如何根据物理层接收的二进制数据建立帧。数据链路层故障的最常见原因是封装不一致。如果display interface命令显示的端口物理状态和协议状态均是UP时,通常可以认为数据链路层工作正常;但如果端口物理状态是UP而协议状态是DOWN,则数据链路层存在故障。另一个常见的数据链路层故障原因是链路的利用率,如果链路带宽被过度使用,也可能引起间歇性的连接失败或网络性能下降。(3) 网络层网络层主要实现以下功能:l 对数据进行分段、打包、重组;l 发送差错报告;l 寻找通过网络的最佳路径来发送信息。网络层故障常见的原因包括:l 地址错误和子网掩码错误;l 因特网络中的地址重复;l 路由协议错误。排除网络层故障的基本方法是:沿从源节点到目的节点的路径,查看各路由器上的路由表,同时检查这些路由器接口的IP地址。通常,如果路由没有在路由表中出现,应该检查是否已经配置了适当的静态路由、缺省路由或动态路由,然后,手工配置丢失的路由或排除动态路由协议选择过程的故障以使路由表更新。1.3.2 分块法通过display current-configuration可以了解NE系列路由器配置文件的组织结构,该文件以全局配置、物理接口配置、逻辑接口配置、路由配置等方式编排的。还可以从另一个角度看待这个配置文件,将配置分为以下几部分:l 管理部分(路由器名称、口令、服务、日志等)l 端口部分(地址、封装、cost、认证等)l 路由协议部分(静态路由、RIP、OSPF、BGP、路由引入等)l 策略部分(路由策略、策略路由、安全配置等)l 接入部分(主控制台、Telnet登录、拨号等)l 其他应用部分(VPN配置、Qos配置等)上述分类为故障定位提供了一个粗略的框架,当出现一个故障现象时,可以把它归入上述某一类或某几类中,从而缩小故障定位范围。例如:执行display ip routing-table命令,显示结果中只包含直连路由,那么问题可能发生在哪里呢?从上述的配置文件分块中可以看到,有三类原因可能引起该故障:l 路由协议:如果没有配置路由协议或配置不当,路由表可能为空;l 策略:如果访问列表配置错误,可能导致路由不能正常更新;l 端口:如果端口的地址、掩码或认证配置错误,也可能导致路由表错误。1.3.3 分段法1. 分段处理的思路如果两台路由器跨越电信部门提供的线路而不能通信时,可以采用分段故障处理法。例如,依次考察以下区段是否发生故障:l 主机到路由器的LAN接口l 路由器到CSU/DSU接口l CSU/DSU到电信部门接口l WAN电路l CSU/DSU本身l 路由器本身2. 一个实际的例子下面结合路由器与传输设备连接的例子,介绍分段故障处理法的应用。通过ATM链路接入传输设备是路由器的常见应用,问题多容易出在路由器和传输设备的配合上。以Error! Reference source not found.为例。图1-1 ATM接入组网图路由器Router通过传输设备DeviceA和DeviceB连接到ATM交换机,DeviceA和DeviceB上分别提供一块ATM板,与Router和ATM交换机相连。在Router上配置IPoEoA业务。连接完毕并完成配置后,Router的ATM接口与PC应可以相互ping通。如果无法ping通,可按照以下步骤进行检测:(1) 在Router上执行display interface atm命令查看ATM接口,物理层的状态是Up的,说明Router到传输设备DeviceA之间的物理链路正常;(2) 依次检查传输设备DeviceA到DeviceB、DeviceB到ATM交换机之间的物理链路,确认物理连接是否正确;(3) 如果物理链路检查无误,再逐段检查配置。查看Router上的ATM接口和Virtual-ethernet接口状态,发现链路层协议状态都是Up,由此推断Router的ATM接口和DeviceA上ATM板接口的PVC数值一致,经检查,两端的PVC数值是一致的,VPI/VCI都是26/100、因此,Router到DeviceA的配置无误;(4) 检查DeviceB上ATM板接口的PVC数值,发现传输B的的PVC配置成了16/100。将DeiveB ATM板上的PVC值改为26/100后,PC就能够ping通路由器ATM接口的IP地址了。1.3.4 替换法替换法是判断硬件故障时最常用的方法。例如,当怀疑网线问题时,更换一根确定是好的网线;当怀疑是接口模块问题时,更换一个接口模块。1.4 故障处理技能的培养故障处理技能的培养包括以下方面:l 加强技术理解l 了解当前网络l 详细记录故障信息l 及时总结经验l 做好日常维护1.4.1 加强技术理解对协议准确而深入的理解有助于快速确定故障原因,并能够减少和避免由于网络规划不当导致的故障。案例:RIPv1和OSPF相互路由引入的问题在地址空间为的网络中配置OSPF,某些子网的掩码配置为24位,另一些子网的掩码配置为26位;同时,在该网络中配置一个24位子网掩码的RIP域。在OSPF域和RIP域间相互进行路由引入。配置完成后,RIP域中的路由器不能ping通OSPF域中的某些接口。为什么会出现这样的结果?RIPv1不支持VLSM,因此,RIP域中的子网必须使用相同长度的子网掩码,并且,子网必须连续;而OSPF支持可变长度子网掩码,也不要求子网连续。相互进行路由引入时,OSPF能够识别所有的RIP路由,而RIP不能识别所有的OSPF路由,这就出现了上述故障现象。了解了RIP和OSPF协议的原理和特点后,也就找到了两种解决办法:在OSPF域内进行路由聚合、或在RIP域中采用RIPv2协议。设想如果网络维护和管理人员对RIP和OSPF协议不了解,不知道RIP和OSPF所适用的子网化规则和相互路由引入的规则,遇到上面的故障时,很可能无从下手,就更不用提找到切实可行的解决方案了。1.4.2 了解当前网络诊断复杂的网络问题,不仅需要技术人员具备一定的专业技能,如精通各种协议知识、熟悉各种配置命令和诊断工具,更重要的在于对该网络的熟悉程度。只有充分了解自己维护的网络,才能够迅速、有效地与网络管理所涉及的关键人员以及受故障影响的人员进行沟通;才能够对网络的变动做出明智的决策;才能够尽快、尽可能有效地排除故障。对网络的了解主要包括:网络拓扑、网管设备、使用的特性、设备性能和规格、各设备上的数据等。为确定是否已充分了解自己所维护的网络,请尝试回答下列问题:l 你是否清楚所管理和维护的网络物理布局,即,网络设备的位置与它们间的连接关系;l 你是否清楚所使用的网管系统,包括设备与网管工作站的连接情况、哪些设备由网管系统管理、哪些信息将被输出到日志服务器、是否使用网管系统进行业务配置;l 你是否清楚网络各段在链路层使用了哪些技术,以太网、专线、帧中继、X.25还是其他;对于每一技术,是否清楚它们的相关配置;l 你是否清楚网络所运行的全部网络协议,IP、IPX或是其他;对于每一协议,是否清楚相关的网络地址、子网地址、区域以及其他信息;l 你是否清楚网络中运行了哪些路由协议;对于每一路由协议,是否记录了路由器的配置信息;l 你是否清楚网络上层主要运行的业务类型;是否清楚网络中访问列表、防火墙、IPSec、Qos等机制的应用情况;l 你是否清楚网络与外部网络(如Internet)的所有连接点,每一连接点使用的路由协议类型;l 你是否清楚最近十天对网络做了哪些变动,如,增加了哪些新设备或软件、重新进行了哪些配置;l 你是否定期制定自己网络的基线。如果不能对上述问题做出肯定的回答,请立即行动,将所有信息查询清楚并进行详细记录。& 说明:网络基线是指在网络运行正常时,对网络性能进行评估并记录,作为将来评估网络性能提升或下降的标准。当网络性能下降时,网络基线可以作为确定故障严重程度的参照。制定网络基线有很多方法。可以使用专门的网络管理工具,如华为公司的Quidview产品;也可以使用ping的响应时间和display显示信息来建立一个提供基本信息的基线。网络基线的评估是管理员的例行任务。1.4.3 详细记录故障信息在多数情况下,客户求助时只会说出一个常见问题。例如,客户说:“我的机器不能够访问FTP服务器了”。此时,网络维护和管理人员就必须以系统的、渐近的、有序的一系列问题引导客户,以得到解决问题所需的所有相关信息。网络维护和管理人员定位网络问题的过程,实质上是一个不断向客户或自己提出问题的过程,提问通常应当以这样一个顺序进行:Who? 谁出了问题?What? 是什么问题?When? 何时产生的?Where? 何处出现的?以上问题可以反复提出,当你提出一个问题的时候,应能够根据用户对该问题的回答继续提问,直到对整个问题有了准确的了解为止。1. 谁出了问题?是单个用户、一组存在共性的用户还是网络中的所有用户?对于单个用户的问题,提问可关注以下方面:l 物理层问题,包括连接该用户的网络电缆问题;l 该主机的硬件问题;l 该主机的软件问题,尤其是网络协议方面;l 该主机的IP地址或子网掩码问题;l 默认网关问题。对于一组用户问题或所有用户问题,提问可关注以下方面:l 网络设备问题,比如Hub或交换机;l 路由器接口问题;l 服务器问题;l 访问列表设置问题;l VLAN配置问题;2. 是什么问题?是连通性问题,还是性能差的问题?如果是连通性问题,是完全连通性问题?还是部分连通性问题?对于完全连通性问题,提问可关注以下方面:l 硬件故障l 远程通信服务故障l 路由协议故障对于部分连通性问题,提问可关注以下方面:l 访问列表问题l 子网掩码问题l 路由协议不兼容问题对于性能问题,提问可关注以下方面:l 网络拥塞l 路由环路l 供电不足l 非最佳路由3. 何时产生的?是间歇性问题,还是经常发生的问题,或者是刚刚发生的问题?对于间歇性问题,提问可关注以下方面:l 网络拥塞或广播风暴l 路由环路l 远程通信服务故障l 网络介质质量差对于刚刚发生的问题,提问可关注以下方面:l 新的硬件故障或介质故障l 新增设备或拓扑改变l 访问列表配置改变l 路由协议发生变化4. 何处出现的?故障发生在核心区域、边缘区域还是接入区域?对于核心区域的故障,提问应关注以下方面:l 路由协议变更l 重新进行路由引入边缘区域的故障,通常与访问列表有关。接入区域的问题,可能与上述所有问题都有关。1.4.4 及时总结经验网络管理和维护人员必须养成及时对故障处理进行文档记录和经验总结的习惯。在发现异常情况时,应依次记录使用的软件版本、模块化插卡的版本、display current-configuration显示等信息。这一方面是网络维护工作的基本要求,另一方面也是提高自身排错技能的需要。& 说明:可以使用display diagnostic-information命令一次

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论