




免费预览已结束,剩余7页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 . OSPF故障处理1.1 OSPF故障处理综述1.1.1 OSPF协议介绍OSPF是Open Shortest Path First(即“开放最短路由优先协议”)的缩写。它是IETF组织开发的一个基于链路状态的自治系统内部路由协议。在IP网络上,它通过收集和传递自治系统中的链路状态来动态地发现并传播路由;OSPF协议支持IP子网和外部路由信息的标记引入;它支持基于接口的报文验证以保证路由计算的安全性;OSPF协议使用IP Multicasting方式发送和接收报文。每个支持OSPF协议的路由器都维护着一份描述整个自治系统拓扑结构的数据库这一数据库是收集所有路由器的链路状态广播而得到的。每一台路由器总是将描述本地状态的信息(如可用接口信息、可达邻居信息等)广播到整个自治系统中去。在各类可以多址访问的网络中,如果存在两台或两台以上的路由器,该网络上要选举出“指定路由器”(DR)和“备份指定路由器”(BDR)。“指定路由器”负责将网络的链路状态广播出去。引入这一概念,有助于减少在多址访问网络上各路由器之间邻接关系的数量。OSPF协议允许自治系统的网络被划分成区域来管理,区域间传送的路由信息被进一步抽象,从而减少了占用网络的带宽。OSPF使用4类不同的路由,按优先顺序来说分别是:l 区域内路由l 区域间路由l 第一类外部路由l 第二类外部路由区域内和区域间路由描述的是自治系统内部的网络结构,而外部路由则描述了应该如何选择到自治系统以外目的地的路由。一般来说,第一类外部路由对应于OSPF从其它内部路由协议所引入的信息,这些路由的花费和OSPF自身路由的花费具有可比性;第二类外部路由对应于OSPF从外部路由协议所引入的信息,它们的花费远大于OSPF自身的路由花费,因而在计算时,将只考虑外部的花费。根据链路状态数据库,各路由器构建一棵以自己为根的最短路径树,这棵树给出了到自治系统中各节点的路由。外部路由信息出现在叶节点上,外部路由还可由广播它的路由器进行标记以记录关于自治系统的额外信息。OSPF的区域由BackBone(骨干区域)进行连接,该区域以0.0.0.0标识。所有的区域都必须在逻辑上连续,为此,骨干区域上特别引入了虚连接的概念以保证即使在物理上分割的区域仍然在逻辑上具有连通性。在同一区域内的所有路由器都应该一致同意该区域的参数配置。因此,应该以区域为基础来统一考虑,错误的配置可能会导致相邻路由器之间无法相互传递信息,甚至导致路由信息的阻塞或者自环等。1.1.2 OSPF排错步骤由于OSPF协议自身的复杂性,在配置的过程中可能会出现错误。OSPF协议正常运行的标志是:在每一台运行该协议的路由器上,应该得到的路由一条也不少,并且都是最优路径。排除故障的步骤:(1) 配置故障处理:检查是否已经启动并正确配置了OSPF协议。(2) 局部故障处理:检查两台直接相连的路由器之间协议运行是否正常。(3) 全局故障处理:检查一下系统设计(主要是指区域的划分)是否正确。(4) 其它疑难问题:路由时通时断、路由表中存在路由却无法PING通该地址。需要针对不同的情况具体分析。2. 协议基本配置是否正确在排除故障之前,应首先检查基本的协议配置是否正确。(1) 是否已经配置了Router ID使用命令router id Router-idRouter-id可以配置为与本路由器一个接口的IP地址相同,需要注意的是:不能有任何两台路由器的Router ID是完全相同的。(2) 检查OSPF协议是否已成功地被激活使用命令router ospf enable启动协议的运行。该命令是协议正常运行的前提。(3) 检查需要运行OSPF的接口是否已配置属于特定的区域使用命令network address wild-mask area area_id 将接口配置属于特定区域。可通过命令 show ip ospf interface interfacename来查看该接口是否已经配置成功。(4) 检查是否已正确地引入了所需要的外部路由。实际运行中可能经常需要引入自治系统外部路由(其他协议如BGP或静态路由)。如果需要,是否已经通过命令redistribute 配置了引入。3. 邻居路由器之间的故障由于OSPF协议需要整个自治系统中所有路由器的协调工作,所以任意两台相邻路由器之间的故障都会导致网络中全部或部分路由错误。如何判断相邻的路由器之间运行正常:在两台路由器上分别执行show ip ospf neigbor命令,查看在相应的接口上是否已发现对端路由器为自己的邻居,并且邻居状态机达到Full状态。 需要注意的是:在Broadcast和NBMA类型的网络中,两台接口状态是DROther的路由器之间邻居状态机停留在“2-Way”状态,这是正常的,但都应该与DR之间达到Full状态。两台路由器之间达到Full需要一定的时间,一般在几秒钟至3分钟之间为正常。如果超过这段时间仍旧没有发现邻居或没有达到Full状态,则可以判断为出现故障。若出现故障可按下列几点来检查:(1) 检查物理连接及下层协议是否正常运行。OSPF正常运行需要下层协议来发送和接收报文,所以必须确保下层协议运行无误。可通过ping命令测试,若从本地路由器Ping对端路由器不通,则表明物理连接和下层协议有问题。但需要注意的是:ping命令发送的是单播报文,而OSPF除了在NBMA类型的接口之外,都发送多播报文。所以除了能够ping通对端之外,还必须具有能够收发多播报文的能力。(2) 检查双方在接口上的配置是否一致如果物理连接和下层协议正常,则检查在接口上配置的OSPF参数,必须保证和与该接口相邻的路由器的参数一致。这些参数包括 hello-interval, dead-interval和authentication。区域(area)号必须相同。网段与掩码也必须一致(点到点与虚连接的网段与掩码可以不同)。这些错误可以通过命令show ip ospf error来查看。(3) hello-interval与dead-interval之间的关系按照协议规定,接口上的dead-interva的值必须大于hello-interval,并且至少在4倍以上。否则的话会引起邻居状态之间的震荡。(4) 若网络的类型为广播或NBMA,至少有一台路由器的priority应大于零。协议规定,接口的priorty = 0 的路由器没有被选举权,即不能被选为DR或BDR。而在广播或NBMA类型网络中所有的路由器只与DR之间交换路由信息,所以至少应有一台路由器的priority应大于零。(5) 区域的STUB属性必须一致如果一个AREA配置成STUB AREA,则在与这个区域相连的所有路由器中都应将该区域配置成STUB AREA。(6) 接口的网络类型必须一致两台直接相连的路由器,它们之间的接口的网络类型必须一致。否则可能无法正确计算出路由。查看接口的网络类型可以使用命令show ip ospf interface,如果发现双方类型不一致,可使用接口配置模式下的命令 ip ospf network 来修改。需要特别注意的是:当两台路由器的接口类型不一致时,双方的邻居状态机仍旧有可能达到Full状态,但无法正确计算路由。(7) 在NBMA类型的网络中是否手工配置了邻居协议规定在NBMA类型的网络中发送单播报文,这样就不能通过发送多播报文来动态发现邻居,所以必须手工指定邻接点的IP地址。4. 系统规划的故障系统规划中的故障主要体现在区域化分中的错误。协议中对区域划分的要求是: 如果自治系统被划分成一个以上的区域,则必须有一个区域是骨干区域,并且保证其它区域与骨干区域直接相连或逻辑上相连,且骨干区域自身也必须是连通的。区域划分错误的表现形式是:在一个区域内通常路由都是正常的,但无法得到区域外部的路由。图1-1 系统规划错误图(1)这是从全局规划的角度来看的,如果落实到具体的配置上,可以这样认为:如果在一台路由器上配置了两个以上的区域,则至少应该有一个是骨干区域,或者配置了一条虚连接。在上图中用此方法判断,配置了两个以上区域的是RTB和RTC,其中RTB符合要求,RTC上由于没有配置骨干区域,所以是错误的配置。表现的形式可能是在RTD上无法得到RTA和RTB的路由,同理,RTA和RTB上也无法得到RTD的路由。修改的方法是将Area0和Area1互相调换一下位置,或者在RTB和RTC之间配置一条虚连接。但这种判断方法只是配置正确的必要条件,而非充分条件。图1-2 系统规划错误图(2)例如在上图中,每台路由器的配置都符合上面的条件,但配置仍旧是不正确的。错误在于骨干区域自身没有连通。改正的方法是:在RTB与RTC之间配置一条虚连接。5. 其它疑难杂症如果经过以上分析之后,仍无法定位错误产生的原因,可继续按以下步骤查找。(1) 路由表中丢失部分路由:可以查询一下是否本路由器配置了路由过滤。可查看是否配置了命令distribute list in(在OSPF协议配置模式下)。如果配置,再查询access-list中的访问规则,是否丢失的路由恰好是访问列表中所过滤的。(2) 路由表不稳定,时通时断:表现形式为:路由表中的部分或者全部路由表现不稳定,一会儿加上了,一会儿又丢失,且变化很快。这种错误不太好分析,可能由以下几种原因产生:l 网络中线路质量不好,导致线路时通时断,造成OSPF的路由随之不停的更改。可以通过检查相应的链路层协议是否正常来定位问题的原因。l 在拨号的情况下,如果是多台路由器同时拨一台路由器时,应将所有的这些拨号的接口类型改为point-to-multipoint。因为缺省的网络类型是point-to-point,如果不加更改的话,当有多台路由器同时拨入时,接入方会在这些拨入的路由器之间不停的选择其中的一个并建立邻接关系。导致路由不稳定。l 有可能是自治系统中有两台路由器的Router ID相同了。协议中规定,一台路由器的Router ID应该在整个自治系统中唯一。如果有两台路由器的Router ID相同,协议运行就会出现故障。这两台路由器如果是邻居的话,在相互接收对方的hello报文时会检测到这一错误,导致无法建立邻接关系。如果这两台路由器不是直接相连,而是分别位于自治系统中的两个不同的地方,则表现出的现象是部分路由时断时通。可以通过查看这部分不正常的路由所属的路由器来定位此问题。(3) 无法引入自治系统外部路由:某台路由器引入了自治系统外部路由后,却无法在其它路由器上发现这些路由。则很可能是由于本路由器处于一个STUB区域之内,因为按照协议规定,STUB区域内不传播Type5类型的LSA。所以这种类型的LSA即不能由区域外传播进来,也同样不能由区域内传播出去。实际上即使是同一个区域内的其它路由器也无法获得这些路由信息。(4) 区域间路由聚合的问题:通过在ABR上配置路由聚合可以大大减少自治系统中的路由信息,但如果配置不当,也会出现如下问题:l 某个区域配置了聚合之后,在其它区域中虽然有聚合后的路由,但未聚合前的路由仍旧存在。出现这种现象的原因多半是因为该区域有两个以上的ABR,用户只在其中一台ABR上配置了聚合命令,而没有在其它的ABR上配置相同的命令。在下图中,Area1内有两个网段10.1.1.0/24、10.1.2.0/24,在其中的一个ABR(RTA)上配置了聚合命令,将这两条路由聚合为一条10.1.0.0/16 的路由。而在另一个ABR(RTB)上,由于没有配置聚合命令,所以仍旧向Area 0发送两条未经聚合的路由10.1.1.0/24、10.1.2.0/24。所以在Area 0中会有3条路由同时出现。图1-3 区域间路由聚合配置错误(1)l 配置了路由聚合之后,路由表显示正常,但却无法PING通某些目的地址。l 可能是由于聚合命令配置错误导致。例如在下图中,Area1中内有两个网段10.1.1.0/24、10.1.2.0/24,被ABR(RTA)聚合成一条10.1.0.0/16的路由后发送到Area 0;同时在另一个区域Area 2中有两个网段10.1.3.0/24、10.1.4.0/24,也被ABR(RTB)聚合成一条相同的路由10.1.0.0/16后发送到Area 0中。这样RTA和RTB同时发布一条相同的到达10.1.0.0/16的路由。RTC由于距离RTA较近(花费值为5,而到RTB为10),所以选择RTA为到达此目的地址的下一跳。如果此时在RTC上PING10.1.3.0/24网段中的某个地址,则报文会被错误的发送给RTA,导致不可达。修改的方法是去掉某台ABR上的路由聚合。图1-4 区域间路由聚合配置错误(2)1.2 与OSPF故障相关的show、debug命令介绍作为一个复杂的动态路由协议,OSPF在实际的应用是很复杂的,这里列举了OSPF实际运用过程中经常使用的几个调试和监控命令,以及经常会遇到的几个问题,并加以简单分析,希望会对大家有所帮助。1.2.1 show ip ospf【用法说明】显示OSPF路由选择进程的主要信息。【语法】show ip ospf【参数说明】无【输出实例】Quidway(config)#show ip ospfRouterID: 10.11.3.254 Border Router: ASRouting selection preference: Inter/Intra: 10 External: 150Default ASE parametres: Metric: 1 Tag: 1 Type: 2SPF computation count: 529Area 0.0.0.0:Authtype: none Flags: SPF scheduled: Interface: 129.9.181.252 (Ethernet1)Cost: 10 State: DR Other Type: BroadcastPriority: 1Designated Router: 129.9.181.253Backup Designated Router: 129.9.181.11DoNotAge lsa allowedAuthentication: noneTimers: Hello: 10 Poll: 0 Dead: 40 Retrans: 5AS Border Routes:10.11.3.254 Area 0.0.0.0 Cost 0 AdvRouter 10.11.3.254Nexthop: 129.9.181.253 Interface: 129.9.181.252(Ethernet1)Area Border Routes:192.168.4.1 Area 0.0.0.0 Cost 10 AdvRouter 192.168.4.1Nexthop: 129.9.181.11 Interface: 129.9.181.252(Ethernet1)【输出关键点说明】该命令主要显示一些OSPF协议的全局信息,包括router id,划分的区域,已发现的ABR,ASBR等等。1.2.2 show ip ospf error【语法】show ip ospf error1.2.3 show ip ospf interface【用法说明】显示OSPF接口信息。【语法】show ip ospf interface interface-type interface-number【参数说明】interface-type:接口类型。interface-number:接口编号。【输出实例】Quidway(config)#show ip ospf interface Ethernet0Interface: 202.38.160.1 (Ethernet0)Cost: 1 State: DR Type: BroadcastPriority: 1Designated Router (DR): 202.38.160.1Backup Designated Router: 129.9.181.11DoNotAge lsa allowedAuthentication: noneTimers: Hello: 10 Poll: 0 Dead: 40 Retrans: 5 【输出关键点说明】通过本命令查看一些接口的信息,包括接口的花费、状态、类型、优先级、本网段中的DR,BDR,以及接口上所配置的定时器的值。1.2.4 show ip ospf neighbor【用法说明】显示OSPF邻居信息。【语法】show ip ospf neighbor【参数说明】无【输出实例】Quidway(config)#show ip ospf neighborInterface: 129.9.181.252 Area: 0.0.0.0Neighbors:RouterID: 192.168.3.1 Address: 129.9.181.10State: Full Mode: None Priority: 1DR: 129.9.181.253 BDR: 129.9.181.11Last Hello: 0 Last Exchange: 0【输出关键点说明】本命令主要用来查看与邻居路由器之间的关系,两台路由器之间LSDB达到同步的标志是邻居状态机达到Full状态(在Broadcast和NBMA类型的网络中,两台接口状态是DROther的路由器之间邻居状态机停留在“2-Way”状态,但都通过与DR之间达到Full状态来同步LSDB)。1.3 OSPF典型案例分析1.3.1 不能建立邻居关系(一)1. 现象描述图1-5 邻接关系的建立华为路由器与Cisco路由器通过HDLC相连,基本配置如上图所示。在两台路由器的S1口上启动OSPF协议后,使用show ip ospf neighbour命令查看邻居,发现两台路由器之间没有建立邻居关系。打开debug开关,发现每台路由器都没有收到对方发来的Hello报文。2. show信息或debug信息显示分别在两台路由器上查看接口状态:Quidway#show ip ospf interface serial 1 Interface: 220.0.0.1 (Serial1) Cost: 1562State: WaitingType: NBMA Priority: 1 .Cisco#show ip ospf interface serial 1 . Internat Address : 220.0.0.2/24 , Area 1 Process ID 100 , Router ID 220.0.0.2 , Network Type POINT_TO_POINT, . .3. 原因分析可以看到,两台路由器都使用了HDLC封装下接口的缺省类型:在HDLC的默认情况下,华为路由器的接口类型是NBMA,而Cisco路由器的接口类型是PTP。在接口类型为NBMA和PTP的情况下,Hello报文的发送地址是不同的,致使RTA与RTB无法收到对方的Hello报文,从而无法建立邻居关系。4. 处理过程将RTA的s1接口类型配置为PTP,则问题解决:Quidway(config-int-Serial1)#ip ospf network point-to-point5. 其它HDLC封装下的接口缺省类型为NBMA,与其它系列路由器或者Cisco路由器对接时,可能会产生无法建立邻居的问题。在配置路由器时,任何情况下都应该手工配置接口的网络类型,而不应该使用缺省值。1.3.2 不能建立邻居关系(二)1. 现象描述图1-6 不能正确发现邻居当一台路由器收到HELLO包,他会检查Area id,Authentication,Network Mask,HelloInterval,RouterDeadInterval以及Options是否与自己配置的这些参数的值相匹配,如果有不匹配的参数,该HELLO报会被丢弃。问题描述:如图所示,我司路由器与Cisco路由器相连时,初始时能够正常建立邻居关系,并达到full状态,但是当改变双方的接口类型为broadcast时,双方不能正确发现邻居。2. 原因分析从互相发hello报文发现邻居开始,会检查一些参数,而netmask是其中一个,当双方的netmask不一致时,收到对方发来的hello报文不会接受,直接丢弃,从而导致不能正确建立邻居关系。那为什麽初始时能够建立正确的邻居关系并达到full呢?是因为:如果网络类型是point-to-multipoint,quidway和Cisco路由器都不会对netmask进行检查。3. 处理过程修改netmask,使双方的一致则问题解决:如下:Cisco(config-if-Serial1)#ip address 133.1.1.1 255.255.255.01.3.3 邻居状态不能到达FULL状态 1. 现象描述图1-7 邻接关系的建立在建立起邻居关系后,邻居之间是否建立起邻接关系,邻居状态是否达到full状态,取决于邻居状态机迁移的条件是否满足。问题描述:如上图,我司路由器与Cisco路由器相连时,初始时能够正常建立邻居关系,并达到full状态,但是运行一段时间以后,如果接口闪断,再重新恢复时(shutdown/no shutdown),邻居状态不能再达到full,而是停留在ExchS
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第二届海棠节活动方案
- 禁毒宣传摆摊活动方案
- 石家庄民法宣传活动方案
- 线下展播活动方案
- 知恩于心活动方案
- 社团英语互动活动方案
- 端午笔会活动方案
- 社工演出排练活动方案
- 端午诗词活动方案
- 示范模仿法活动方案
- 护理技师考试题及答案
- 生物医药专利布局策略-洞察及研究
- 果树栽培技术课件视频
- 乡镇护路员管理制度
- 2025至2030中国海洋涂料市场发展趋势及前景预测分析报告
- 红领巾观察题目及答案
- 江西省第二届职业技能大赛智慧安防技术赛项-模块B-公开样题
- CJ/T 528-2018游泳池除湿热回收热泵
- 2023-2024学年江苏省苏州市高三(上)期初调研物理试题及答案
- T/CSWSL 021-2020饲料原料大豆酶解蛋白
- 《水利工程生产安全重大事故隐患清单指南》解读与培训
评论
0/150
提交评论