(计算机科学与技术专业论文)ospf平稳重启技术的研究与实现.pdf_第1页
(计算机科学与技术专业论文)ospf平稳重启技术的研究与实现.pdf_第2页
(计算机科学与技术专业论文)ospf平稳重启技术的研究与实现.pdf_第3页
(计算机科学与技术专业论文)ospf平稳重启技术的研究与实现.pdf_第4页
(计算机科学与技术专业论文)ospf平稳重启技术的研究与实现.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

(计算机科学与技术专业论文)ospf平稳重启技术的研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

里堕型兰茎查奎鲎竺壅竺堕茎焦笙苎 摘要 随着互联网业务越来越依赖于i p 网络,业务中断所造成的损失越来越难以接受,网 络的高可用性也就越来越重要。在网络边缘,由于用户很少能够通过冗余链接接入网络, 接入路由设备达到“9 9 9 9 9 ”的可用性尤为重要。 为了提高网络可用性,i e t f 提出了对路由协议( 如b g p 、0 s p f 、l d p ) 的扩展来减少 路由协议失效导致的业务损失。在网络边缘路由器和其邻居路由器都支持o s p f 平稳重 启情况下,即使控制平面失效,数据平面也能够继续处理和转发报文。由于减少了路由 抖动,平稳重启能够增加网络稳定性并减少控制平面资源的消耗。从而不单单增强了单 台路由器的可用性,更提高了整个网络的可用性。 本文的主要内容是0 s p f 平稳重启的研究和实现。在平稳重启过程中,o s p f 路由域 中可能有两种角色的路由器,分别是重启路由器和其邻居路由器,其中邻居路由器必须 协助重启路由器以保证重启平稳进行。我们讨论了这两种角色的路由器的行为,分析了 i g p 和e g p 平稳重启的关系,以及协议平稳重启的优势和缺点。 基于开源路由软件q u a g g a ,我们设计并实现了o s p f 平稳重启扩展。采用多次发送 g r a c e l s a 保证能力通告的可靠传送:改进了r f c 中的拓扑变化处理机制,设计了一种 自适应的拓扑变化处理机制,提高了平稳重启在拓扑变化频繁的大规模网络中成功运行 的概率;通过扩展o s p f 的h e l l o 协议,加快了平稳重启后邻居发现和网络汇聚的过程。 搭建了一个原型系统对我们的0 s p f 平稳重启实现进行测试。测试结果表明,我们 的原型系统满足了r f c 3 6 2 3 所规定的基本功能,系统可用性得到了提高。 关键字:高可用性,平稳重启,o u a g g a 里堕型兰垫查奎兰竺壅竺堕堂堡垒茎 a b s t r a c t a sb u s i n e s s e sb e c o m em o r ed e p e n d e n to ni pn e t w o r k s ,o u t a g e sa r em o r ec o s t l yt h a ne v e r a n dh i g ha v a i l a b i l i t vi nn e t w o r k sh a sb e c o m ei n c r e a s i n g l yc r i t i c a l t h i sr c q u i r e m e n tf o r “n v e n i n e ”a v a i l a b j “t yi sm o r ep r e s s i n ga tt h en e t w o r ke d g e ,w h e r er e d u n d a n tu s e ra c c e s si i n k s a r es c a r e 7 i bh e l pm e e tt h eg o a l so fh i g ha v a 订a b i l i t y ,t h ei n t e m c te n g i n e e r i n gt a s kf o r c eh a sb u i l t e x t e n s i o n st or o u t i n gp r o t o c 0 1 ss u c ha sb g p ,0 s p f ,l d pt h a tm i n i m i z et h eo u t a g ea s s o c i a t e d w i t haf h i l e dm u t i n gp r o t o c 0 1 w i t ho s p fg m c e f u lr e s t a ne n a b l e do na ne d g ed e v i c ea n di t s p e e lt h ed a t ap l a n ec a nc o n t i n u et op r o c e s sa n df b r w a r d i n gp a c k e t se v e ni f t h ec o n t r o lp l a n ef h i l s b ya l s or e d u c i n gr o u t i n gn a p , g r a c e f u lr e s t a ns t a b i l i z e st h en e t w o r ka n dr e d u c e st h e c o n s u m p t i o no f c o n t r 0 1p l a t l er e s o u r c e s g r a c e m ir e s t a r to 丘b r sh j g ha v a i l a b i l i t yf o rt h en e t w o r k , w h i c hg o e sb e y o n dh i g ha v a 订a b i l i t yo n l yf o ra ni n d i v i d u a l r o u t e r t h i st h e s i sf o c u s e so nt h er e s e a r c ha j l di m d l e m e n t a t i o no ft h eo s p fg r a c e f u lr e s t a n d u r i n gg r a c e f u lr e s t a n ,t h e r ea r et w or o l e sb e i n gp l a y e db yo s p fm u t e r s f i r s tt h e r ei st h e m u t e rt h a ti sb e i n gr e s t a r t e d t h e nt h e r ea r et h er o u t e ,sn e i g h b o r s ,w h i c hm u s tc o o p e m t ei n o r d e rf o rt h er e s t a nt ob eg r a c e f u l t h eo p e r a t i o n so ft h et w or o l e sa r ed i s c u s s e d a d d i t i o n a l l y , t h er e l a t i o n s h i pb e t w e e ni g pa 1 1 de g pg m c e m lr e s t a r ta n dt h ea d v a m a g ea sw e l la s d j s a d v a l l t a g eo f p r o 把c 0 1g f a c e f u lr e s i a r ta r ea n a l y z e d b a s e do nt h eo p e ns o u r c er o u t i n gs o f t w a r eq u a g g a ,t h eo s p fg r a c e 如lr e s t a r te x t e n s i o ni s d e s i g n e da i l di m p l e m e m e d g r a c el s a sa r es e n ts e v e m lt i m e st oi n s u r et 1 1 er e l i a b l et r a l l s m i s s i o n o fc 印a c i t ya d v e n i s e m e n t a na d a p t i v et o p 0 1 0 9 yc h a l l g ep r o c e s si sg i v e ni n t h i st h e s i s ,w h i c hc a i l i n c r e a s et h ep r o b a b i l “yo ft h es u c c e s s 如le x e c u t i o no fg r a c e f i l lr e s t a r ti n1 a r g en e t w o r kw h e r e t o p o l o g yc b a n g e so c c u ro f t e n b ye x t e n d i n gm eh e u op r o t o c o li n0 s p f ,t h en e i g h b o rd i s c o v e r y a n dn e t w o r kc o n v e r g e n c ep r o c e s s e sa r eq u i c k e n e d ap r o t o t y p ei s i m p l e m e n t e dt oe x p 翻m e n tt h e 向n c t i o n a 】j t ya n dp e r f o m l a n c eo fo u r i m p l e m e n t a t i o no fo s p fg r a c e f u lr e s t a n 0 u rp r o t o t y p eh a sb e e nc o n s i d e r e dt of u l f i l lt h eb a s i c f u n c t i o n a l i t yi nr f c3 6 2 3 ,a n dt h ea v a i l a b i l i t yo f o u rp r o t o t y p eh a sb e e ni m p r o v e d k e y w o r d s :h i g ha v a i l a b i l i t y ,g r a c e f u lr e s t a r t ,q u a g g a 里堕型兰垫查奎兰堕茎竺堕堂垡笙苎 图目录 系统可靠性分析金字塔5 服务属性的重要性5 影响网络可用性的主要因素一7 0 s p f 报文首部1 3 l s a 首部1 5 o s p f 报文选项字段1 6 平稳重启中路由器的角色划分2 0 平稳重启的时序过程2 1 q u a g g a 体系结构3 1 q u a g g a 中各模块的关系3 5 平稳重启的总体设计3 6 s t r e 锄缓冲机制3 8 自适应的拓扑变化处理流程4 6 控制可扩展路由器c e r 4 9 测试案例一5 0 测试案例二5 1 测试案例三5 2 测试案例四5 3 测试案例五5 4 心粥弛粥”他眈”硒 图图图图图图图图图图图图图图图图图图图 里堕型堂垫查奎兰竺茎兰堕兰焦笙苎 表目录 表3 一l 网络故障的来源1 7 表4 1 o s p f _ 掣结构体3 2 表4 2t l v 首部3 2 表4 3t l ,v 中的参数3 3 表4 4g r a i :e - 肟a s o n 参数3 3 表4 5 平稳重启命令设计3 4 表4 6 拓扑变化监测的触发4 1 独创性声明 本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已 经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它教育机构的学 位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文 中作了明确的说明并表示谢意。 学位论文题目:q ! 堕壬煎重启挂查的盟楚生塞理 学位论文作者签名:量亟曼日期:锻年亿月,7 日 学位论文版权使用授权书 本人完全了解国防科学技术大学有关保留、使用学位论文的规定。本人授权国 防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子文档,允 许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检索 可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密学位论文在解密后适用本授权书。) 学位论文题目:! s 堕壬煎重扈垫盔曲盟筮皇塞趣 学位论文作者签名 作者指导教师签名: 研究了0 s p f 协议和实现机制,对q u a g g a 中o s p f 协议的运行机制作了深入分析。 研究了高可用网络的关键技术,在对可靠性、可用性的基本理论进行研究的基 础上,分析研究了高可用网络单元的关键技术、网络层的可靠性技术。在网络 层的可靠性技术中,着重论述了路由协议的平稳重启技术。 对i e t f 提出的o s p f 平稳重启技术【5 j 进行了分析和研究,分析了o s p f 平稳重 启的提出背景、运行机制、与e g p 平稳重启的关系、优势以及局限性。 深入分析了开源路由软件q u a g g a 的实现代码,设计了模块化的0 s p f 平稳重启 的软件结构,对各模块进行了详细设计并实现。 在设计与实现过程中,我们在原有的r f c 基础上,采取了若干优化措施,其中 包括g r a c e 一1 s a 的可靠传输、优化的平稳重启。 搭建了原型系统,并通过测试仪对原型系统进行了测试,测试结果表明原型系 统满足了平稳重启的基本功能,可用性得到了提高。 1 3 论文的结构 论文的内容是对硕士阶段学习和研究成果的总结和升华,本文的结构如下: 第一部分,绪论。简单介绍了课题背景、课题研究内容及取得的成果。 第二部分,高可用网络的关键技术。首先介绍可靠性、可用性技术的基本概念、系 统可用性的指标,然后介绍高可用网络的关键技术,重点介绍高可用路由单元和网络层 的可靠性技术,课题的主要研究内容0 s p f 平稳重启技术便是一种重要的网络层可靠性 技术。 第三部分,o s p f 平稳重启研究。对i e t f 提出的0 s p f 平稳重启技术进行了全方位 的研究。首先分析了0 s p f 协议的工作机制,然后重点分析了o s p f 平稳重启提出的背景、 支持0 s p f 平稳重启的路由器的行为模式,详细分析了各模式下路由器的行为;另外还 对i g p 与e g p 的平稳重启的关系、路由协议平稳重启技术对提高网络可用性的作用进行 了分析和评价。 第四部分,o s p f 平稳重启的设计与实现。主要介绍我们在q u a g g a 中的0 s p f 平稳 重启实现。q u a g g a 是一个开源的路由软件,我们采取了模块化的设计方案,本章介绍了 总体设计方案和详细设计。 第五部分,实现中的关键技术。研究了0 s p f 平稳重启技术涉及的关键技术,包括可 靠的能力通告机制、自适应的拓扑变化处理机制及平稳重启后的快速恢复机制。 第2 页 国防科学技术人学研究生院学位论文 第六部分,原型系统测试。我们采用自行研制的控制可扩展路由器( c e r ) ,对其中 的路由控制软件q u a g g a 进行了0 s p f 平稳重启扩展,形成了原型系统。使用测试仪对其 进行一致性测试,测试结果表明,原型系统实现了r f c 规定的基本功能,可用性得到了 提高。 第七部分,总结和展望。 第3 页 国防科学技术大学研究生院学位论文 第二章高可用网络的关键技术 下一代i p 网络的可用性和q o s 是区分与传统i p 骨干网的明显特征,而路由的稳定 性和高可用性需要明显提高,这需要技术、设计、网络设备等的多方面配合。高端路由 器通常是网络核心,即使位于边缘也通常连有大量用户。所以高端路由器可用性通常要 求达到9 9 9 9 9 。目前对于高端路由器而言,网络的增大导致软件控制系统越来越复杂, 不单单是面临协议性能的问题,同样面临着软件可靠性的问题。 在网络中引起网络通信中断和可用性降低的事件包括路由器故障、线路故障和维护 操作等,而维护操作( 软件升级、配置改变、更换板卡等) 实际上在中断分布中的份额 很大。从硬件来看,路由器要有一个很好的体系架构,各种冗余非常完善。关键部件如 路由引擎和交换矩阵要有冗余;从软件来看,路由器软件自身要有较好的鲁棒性,另外 在遇到更换硬件、系统升级、增加板卡和改变链路等网络调整时,软件要有能力保证整 个网络业务不受局部调整的影响,要保证路由引擎进行不丢包的切换,让整个网络体现 出非常高的可用性。 2 1 高可用网络技术概述 2 1 1 可靠性技术 对可靠性技术的研究源于三、四十年代,人们用概率论来分析机器维修问题。德国 人最初用概率论分析了v 1 与v 2 型导弹的可靠性。4 0 年代,美国人开始用概率论对军用 电子设备的可靠性进行研究。从此,可靠性问题的研究进入高速发展时期。我国从6 0 年代也开始了可靠性理论的研究,并取得了许多重大成果。目前,可靠性研究已经进入 到所有的工程领域。 可靠性主要分为单元可靠性和系统可靠性。单元可靠性也称作部件可靠性。单元可 靠性的研究于本世纪3 0 年代末开始,当时,概率论已经发展成型。经过6 0 多年的研究 发展,已经形成以概率论为基础的完善的可靠性理论体系和成熟的工程技术。目前,以 其他非确定理论为基础的可靠性理论也在不断的发展和完善之中,如论据理论,模糊理 论等。 单元可靠性是系统可靠性的基础。5 0 年代,有人总结了单元可靠性与系统可靠性的 关系( 参见图2 一1 ) 。我们所讨论的网络设备属于其中的整机或者分系统。 第4 页 国防科学技术大学研究生院学位论文 图2 1系统可靠性分析金字塔 系统可靠性最早在1 9 5 2 年由v o n u m a n n 在一个演讲中提出,演讲的题目是 “p r o b a b i l i s t i cl o g i ca n dt h es y n t h e s i so fr e l i a b l eo r g a n i s m sf r o mu n r e l i a b l e c o m p o n e n t s ”,他在该演讲中提出了有关整体性能大于部件性能的技术公式。1 9 5 6 年, m o o r e 和s h a n n o n 发表了一片论文,提出更具说服力且更加有效的数学模型,证明通过 冗余技术可以建立起一个整体性能超过部件性能的交换电路( r e l a yc i r c u i t ) ,并推导 出了沿用至今的可靠性多项式。 从用户的角度看,由于视频、语音等实时业务的发展,敏感业务( m i s s i o n c r i t i c a l ) 的比例也越来越高,图2 2 给出的是对用户关于服务重要性的调查结果,从中可见服务 的可靠性被看作是最重要的因素【6 】。 崩舞扁挂的熏蟹性 甜撼牲tj 舳) 性暇( 8 肆) 宣叁性( 7 钟;) 葱单性( ,9 , 爱活忭( 5 ,) i 疆提供牲4 7 ) 图2 - 2 服务属性的重要性 第5 页 国防科学技术大学研究生院学位论文 2 1 2 高可用技术 对于可维修的系统,衡量其可靠性的指标叫做可用度,相应的理论又叫做可用性理 论。路由器就是一个可维修的系统。根据系统的可靠度,从高到低可以分为四个档次: 连续可用性系统( c o n t i n u o u sa v a i l a b i l i t ys y s t e m ) 。 容错系统( f a u l tt o l e r a n c es y s t e m ) 。 高可用系统( h i g ha v a i l a b “i t ys y s t e m ) 。 容灾难系统( d i s a s t e rt 0 1 e r a n c es y s t e m ) 。 前两种一般用于航天和军工等领域,对于路由器,要求达到高可用系统。系统可用 性是指在容许的故障数目内,系统成功运行的概率。 2 1 3 系统可用性指标 平均故障间隔时间( m t b f ) :在规定的条件下和规定的时问内,系统累计运行时间与 故障次数之比。 平均修复时间( m t t r ) :在规定的条件下和规定的时间内,产品在任一规定的维修级 别上,修复性维修总时间与在该级别上被修复产品的故障总数之比。 可用度:a ( a v a i l a b i l i t y ) ,指可维修产品在规定的条件与时间内,维持其规定功 能的能力,它综合反映可靠性和维修性。可用度的计算方法是,产品能工作时间与能工 作时间、不能工作时间的和之比。 年停机时间:d t ( d o w n t i m e ) ,在一年内,产品由于故障维修而处于不能工作的全部 时间之和。停机时间跟可用度之间换算关系为:年停机时间= ( 卜a ) 8 7 6 0 6 0 ( 分钟) 。 通常所指的产品可用性包括可靠性和可维修性两个方面。可靠性用m t b f 来衡量,可 维修性用m t t r 来衡量,而可用性则用可用度a 来衡量。 目前存在着多种衡量网络设备可用度的工业标准,例如n e b s ( n e t w o r k e q u i p m e n t b u i l d i n gs y s t e m ) 的第三级认证和e t s i ( e u r o p e a nt e l e c o ms t a n d a r d ) 等。 它们对可用性的描述主要使用两种方法:百分比法和百万小时故障时间数法。关于网络 可用性的描述,经常使用到术语“五个9 ”( 9 9 9 9 9 ) ,这就是百分比法。可用性百分比 的重要用途在于预测将来一段时间的停机时间量。百万小时故障时间数法( d p m ) 描述的 是设备或者网络在一百万小时运行时间内发生故障的时间数。该方法一般用于现成的大 型网络,可以报告百分比法难以追踪的问题。 上述两种方法都用到m t b f ( m e a nt i m eb e t w e e nf a i l u r e ,平均故障间隔时间) 和 m t t r ( m e a nt i m et or e p a i r ,平均修复时间) 数据。m t b f 描述一个特定的设备在两个 第6 页 国防科学技术大学研究生院学位论文 故障之间的小时数,类似的有m t t f ( m e a nt i m et of a i l u r e ,平均故障时间) ,它描述 了把设备投入运行到产生故障的时间总量。m t t r 是网络发生故障到恢复正常工作状态之 间所消耗的平均时间,组成这个时间的过程包括三个阶段:监测、诊断和修复。在可用 性理论中,常常使用概率的方法来分析系统的可用度参数,经常用到的概率有 和u 。 其中 是一个节点出现故障的到达率,在数值上等于1 m t b f ,p 是某个故障节点恢复正 常的到达率,在数值上等于1 m t t r 。 2 1 4 高可用网络技术 根据i t uy 1 5 4 0 的定义,网络可用性是指网络节点之间在能够保证质量要求的前提 下传输数据的时间占总时间的百分比,是衡量网络质量的重要的指标之一。决定网络可 用性的关键技术包括路由快速收敛技术、快速重路由( f r r ) 【7 1 技术、软硬件在线升级技 术、协议平稳重启技术、设备自身可靠性技术,另外还与传输网络的可用性有关。 评估和建设一个高可用性的网络是一个庞大的系统工程,需要对设备可靠性、网络 介质的可靠性、网络拓扑结构、设备运行环境、管理和服务等多方面进行综合分析和改 进。一般在确定网络模型之后,影响整个网络可用性的几个主要因素如图2 3 所示。 图2 3 影响网络可用性的主要因素 2 2 高可用网络单元 路由器和传输链路的可用性是i p 网络可用性的基础。路由器的可靠性不是靠简单地 增加备用板就能解决的,而是一种设计原则,从一开始就需要纳入产品的体系架构中。 硬件可靠性的主要改进措施包括从单平面交换向多平面交换演变;关键部件采取冗余设 计;控制平面与数据转发平面分离等。软件可靠性的主要改进措施包括采用轻型k e r n e l 第7 页 国防科学技术大学研究生院学位论文 核心软件;软件功能模块化设计,使每个软件模块在不同的运行空间中运行不同的协议, 改进软件系统的稳定性和可用性;进程最佳化以实现快速故障恢复;数据最佳化以减少 子系统间必须传送的数据量,改进系统整体性能等。高可用路由器的设计原则就是采用 关键系统部件的冗余设计和高效的故障管理。这里包含软件和硬件两个层次的概念,硬 件的冗余结构作为软件进行故障管理的支撑平台和对象。 新一代的路由技术通过一系列关键技术来支持路由器的高可用性,这些关键技术包 括控制与转发分离、路由协议多进程实现、热备份路由处理器等。 ( 1 ) 控制与转发分离 将控制功能与转发功能分离后,两者由不同的处理器分别处理。专用的控制处理器 负责根据从邻居收集的拓扑信息进行路由计算,将路由载入转发表中。转发可以集中于 单个处理器也可以分布在多个线卡中进行。负责路由控制功能的部件常称为控制平面, 负责转发功能的部件称为转发平面。 控制与转发分离后,转发平面从由于路由控制信息泛滥导致的网络稳定问题中隔离 出来,路由器的转发行为将不会受到路由软件稳定性的影响,由于网络中的不稳定性往 往导致产生大量过载的路由控制信息,而这种功能模块上的划分使得转发平面与网络中 潜在的不稳定性隔绝开来,同时也减弱了路由协议失效可能带来的影响,使无中断转发 ( n o n s t o pf o r w a r d i n g ) 成为可能。 ( 2 ) 路由进程分离 使不同的路由协议由不同的操作系统进程执行,可以进一步保护路由协议以免相互 影响。由于每个进程都有自己的存储空间,一个协议出现问题不会影响其他协议的运行。 而且,可以对单独的路由进程进行终止、重启或升级操作,开发人员也更容易对路由协 议进行修改或扩展。 ( 3 ) 热备份路由处理器 热备份路由处理器作为活跃路由处理器的备份,可以避免单点失效问题。热备份处 理器随时监控活跃处理器,并与活跃处理器的配置保持同步。如果热备份处理器监测到 活跃处理器失效,它就接管活跃处理器的所有工作。如果路由器同时支持控制与转发分 离,则单个路由处理器的失效将不会影响报文的转发。在处理器切换的过程中,转发状 态一直保持,在这段时间内需要保持转发表的完整性。 要达到整个路由器系统乃至整个网络系统高可用的性能指标,网络设备系统软件可 靠性的设计还是一个难点,它不只要解决软件本身设计中存在的缺陷,同时还要根据网 络协议的特点进行相应的处理。上述关键技术是支持高可用网络的关键技术,但它们都 第8 页 国防科学技术大学研究生院学位论文 只适用于单台路由器。要支持整个网络的高可用性,就需要对上层软件进行高可用设计。 以高可用的硬件平台作为基础,软件的设计应能够快速地检测到软硬件故障并尽快恢复, 尽可能的避免系统恢复过程中的会话阻塞。通过设置路由协议的定时器,在保留路由、 转发表和会话的前提下,实现系统的快速平稳恢复,有助于消除对网络服务和应用的显 著影响。i e t f 对路由协议的扩展( 如o s p f 平稳重启) 使得高冗余的硬件平台与快速无 缝的软件恢复技术相结合,从而提高了网络的可用性。 2 3 网络层的可靠性技术 路由器的可靠性体现在以下两个方面,一个是设备层的可靠性,另一个是网络层的 可靠性。上一节我们论述了路由器硬件支持高可用性的关键技术,这一节我们重点介绍 网络层的可靠性技术。 网络可靠性是路由器可靠性保障的一个重要内容,由于传统的路由器协议收敛比较 慢( i g p 在秒级,b g p 在分钟级) ,不能满足承载实时业务的需求。网络可靠性也是路由 器新技术比较活跃的领域。 目前新出现的网络层可靠性技术主要有i p 路由快速收敛【8 l 、端到端l s p 备份、m p l s 快速重路由、路由协议的平稳重启、r p r i p s 等。 ( 1 ) i p 路由快速收敛 i p 动态路由是最基本的网络层可靠性保障机制,是i p 路由网络与生俱来的功能。 i p 动态路由协议负责进行网络层i p 转发路径计算,在链路或者节点发生故障导致原数 据转发路径中断时,路由协议对数据转发路径进行动态重新计算,虽然各种路由协议通 过采用不同的机制,其响应时间有差别,但是平均水平在秒一级。对于传统i p 业务这个 恢复时间可以接受,但是对于承载实时业务等多业务的电信级i p 网来说要求毫秒级恢复 响应时间,传统i p 动态路由技术和这一要求有很大差距。 在传统路由协议的基础上,进行改进可以缩短i p 路由协议的故障响应时间,这些措 施主要是加快路由协议的收敛。加快路由协议收敛速度可以分为链路故障检测、路由重 计算、路由信息更新等几个方面考虑。通过加快链路之间h e l l o 消息的发送频率,加快 s p f 计算速度和为路由更新消息设定高优先级,路由协议可以快速发现、处理故障,并 且准确快速地进行路由更新,加快路由协议的收敛。 另一种加快路由协议收敛的方法是采用i g p 和e g p 对网络进行合理的层次规划,i g p 进行域内设备的路由,e g p 承载外部路由,两种路由之问进行有效隔离。i g p 和b g p 的合 理分工,形成了一个层次化的路由结构,域内和域问路由协议的收敛相互独立,互不影 第9 页 国防科学技术大学研究生院学位论文 响,可以实现最快速度收敛。 ( 2 ) l s p 保护切换 保护切换是i t u t 采用的术语,保护切换技术对于提高m p l s 网络的可用性和稳定 性具有关键意义。保护切换一般对受保护l s p 路由的预计算和资源的预分配,所以可以 保证在l s p 连接失效或者中断后可以快速重新获得网络资源。 目前技术的发展只可以支持对点到点l s p 的保护切换,保护可以采用两种方式:1 + 1 保护和l :1 保护。 l + 1 保护使用一条专用的备份l s p 作为主l s p 保护,在i n g r e s s l s r 处,主l s p 和 备份l s p 桥接在一起,主l s p 上的流量复制到备份l s p 上同时传送到e g r e s s l s r , e g r e s s l s r 根据故障指示参数的取值,选择接收主备l s p 上的流量。 1 :1 保护时也使用专用的备份l s p 作为主l s p 的保护,但是主备l s p 不同时传送相 同的流量,备份l s p 在主l s p 工作正常的前提下可以传送其他流量,流量的保护切换裁 决在i n g r e s s l s r 进行。 ( 3 ) i p l s 快速重路由( f r r ) 为了满足诸如像视频会议电视这一类业务的实时应用,必须对这些流量提供类似于 传统s d h a p s 毫秒级的l s p 保护能力。 l s p 保护切换技术,需要信令协议的介入,故障点到恢复点的故障指示信令传递引 入了不必要的网络恢复延时。m p l s 快速重路由技术可以实现在没有信令介入情况下,由 故障检测点直接对故障链路流量根据预先设定的保护路径进行重定向,恢复点即为故障 点。多数的快速重路由方案依赖预先建立的备份通道,当网络恢复点检测到网络故障时, 它要做的工作就是简单地更新l s p 交换表,使流量从故障端口的l s p 切换到预先在正常 端口建立的l s p 内。 快速重路由的优势除了可以提高保护恢复的速度外,通过有选择的在网络薄弱环节 配置保护能力,避免了在可靠网络重复保护、无谓消耗核心网络资源。m p l s 快速重路由 技术提供5 0 m s 内的保护切换,可以作为s d l a p s 保护机制的替代。 ( 4 ) 路由协议的平稳重启 引起控制平面重启的可能因素包括:软件升级、软件b u g 或者硬件故障。无中断重 启可以做到控制平面重启时,数据平面无间断转发。但是如果控制平面故障,对等路由 器将重新计算路由,旁路故障路由器,数据平面的不间断转发就没有意义,而且故障路 由会扩散到整个网络范围。 控制平面平稳重启技术可以有效解决这个难题,采用该技术的路由器在控制平面发 第1 0 页 国防科学技术大学研究生院学位论文 生故障时,可以通知邻居路由器继续使用原路径进行数据转发,同时重启路由器重新和 邻居路由器建立路由状态,保证在重启过程中业务可用性,最小化单个设备重启对整个 网络的影响。在平稳重启的过程中路由器不保存相关的协议状态,所以引起的重启软件 故障不会延续到重启后。 平稳重启是新特性,很多旧设备无法支持,所以可以在局部子网内支持该特性的设 备上使用。在网络边界,运营商边界路由器面对众多客户,而且一般都没有冗余措施, 最适合使用平稳重启技术。网络核心一般都采用冗余路径进行保护,而且带业务重启容 易造成路由循环或转发黑洞,所以不建议在网络核心采用平稳重启技术。 i e t f 提出了针对i s i s 、o s p f 、b g p 、l d p 、r s v p 等协议的平稳重启协议。平稳重启 就是在路由器控制平面故障重启、软件升级、主备切换等情况下,数据转发平面正常工 作,尽量不影响业务的正常提供。平稳重启技术是在网络稳定也就是拓扑没有变化的情 况下,尽量保证业务提供。如果在协议重启期间网络拓扑发生变化,由于控制引擎不能 及时进行路由计算和更新,可能造成网络路由不同步,产生路由循环或转发黑洞。协议 平稳重启与快速路由收敛从不同的出发点减少业务的中断,但是存在一定的矛盾,所以 在实际网络设计中要谨慎使用,在3 4 节我们详细的比较了两者的优缺点。 2 4 本章小结 下一代i p 网络的可用性和q o s 是区分与传统i p 骨干网的明显特征,而路由的稳定 性和高可用性需要明显提高,这需要技术、设计、网络设备等的多方面配合。高端路由 器通常是网络核心,即使位于边缘也通常连接着大量用户。所以高端路由器可用性通常 要求达到9 9 9 9 9 。 本章我们对高可用网络技术的主要方面做了简要论述,首先论述了可靠性技术、可 用性技术的概念和性能指标、高可用网络技术设计的若干方面,然后从高可用网络结点 和网络层的可靠性技术两个方面重点论述了高可用网络中的关键技术。高可用的网络结 点是提高网络层可靠性的前提。 我们着重论述了与本课题相关的网络层可靠性技术,目前被广泛研究的网络层可靠 性技术主要有i p 路由快速收敛、端到端l s p 备份、m p l s 快速重路由、路由协议的平稳 重启、r p r i p s 等。在本课题中我们研究并实现了0 s p f 路由协议的平稳重启技术,在下 一章对o s p f 协议的平稳重启技术进行了全方位的深入研究。 第1 1 页 里堕型堂垫查奎主婴窒生堕堂垡堡壅 第三章0 s p f 平稳重启技术研究 o s p f 协议是目前大规模网络广泛应用的路由选择协议。作为一种链路状态协议,其 稳定性有待提高。o s p f 协议的平稳重启技术使路由器的转发行为不受协议失效的影响, 是提高网络可用性的有效途径。 3 1o s p f 协议 3 1 1o s p f 协议概述 路由选择策略的实质是如何确定数据传送的最佳路径,它是通过建立并维护路由表 来实现的。典型的路由选择策略有两种:静态路由和动态路由【旧。 实现动态路由选择策略有三种广义上的动态路由选择协议: 距离矢量路由选择协议,典型的有r i p 、b g p 。 链路状态路由选择协议,典型的有0 s p f 。 混合路由协议。 随着2 0 世纪8 0 年代的结束,距离矢量路由选择协议收敛速度慢和跳数限制等的局 限性变得更加明显,于是出现了基于链路状态的路由选择协议,以扩展网络规模。 开放最短路径优先( o s p f ) 协议是一种基于链路状态的动态路由选择协议,是 r f c 一1 3 4 7 中推荐的内部网关协议( i g p ) 。现在i p v 4 网络中使用的o s p f v 2 一般遵从 r f c 2 3 2 8 【9 】。 o s p f 由两个相互关联的主要部分组成:呼叫( h e l l o ) 协议和可靠泛洪机制。呼叫 协议使得o s p f 可以检测邻居并确认它们始终存在。呼叫协议操作在每个活跃的0 s p f 接 口上,它使用的多点传送地址使得这些流量不会对非o s p f 的路由器造成影响。可靠泛洪 算法可以确保o s p f 区域内的所有路由器的链路状态数据库保持一致。 0 s p f 最早由j o h nm o y 开发,p r o t e o n 使得这个由内部开发的路由协议在i e t f 内得 到了标准化。i e t f 为了响应建设越来越大型基于i p 网络的需求,成立了专门工作组, 负责开发用在大型的、混合的i p 网络中一个开放的链路状态路由选择协议( 1 0 1 。包括i e t f 的0 s p f 在内,所有s p f 路由选择协议都是基于d i j k s t r a 算法。该算法支持基于链路状 态的路由选择,而不是距离矢量。 第1 2 页 里堕型兰垫查盔堂竺壅竺堕兰堡笙茎 3 1 2o s p f 报文 3 1 2 。1 报文首部 0 s p f 协议直接运行在i p 协议之上,其i p 协议号为8 9 。0 s p f v 2 报文都有一个2 4 字 节的首部( 图3 1 ) ,紧跟在i p 首部后面。 3 1 2 2 报文类型 隘木q 一镕p f l b # m一 一。目掘l n d一 桡骧稀 一 女 一 图3 - 10 s p f 报文首部 ( 1 ) 呼叫报文 呼叫报文用来建立和维护节点的邻接关系。通过呼叫报文,0 s p f 节点发现本区域内 的其他o s p f 节点,决定是否建立邻接关系,从而建立通信和交换链路状态信息。 呼叫协议有两个关键参数,对这两个参数,0 s p f 区域内的所有路由器都要使用相同 的值: 呼叫间隔( h e l l o j n t e r v a l 通常为1 0 秒) o s p f 路由器以呼叫间隔周期性地向其他路由器发送呼叫报文,通知其他路由器 自己是活跃的。 瘫痪时间( r o u t e r d e a a _ i n t e r v a l ,通常为4 0 秒) 如果在瘫痪时间的间隔内没有收到某个路由器的呼叫报文,则认为该路由器已 第1 3 页 国防科学技术大学研究生院学位论文 经瘫痪。除了用于确定路由器的活跃状态之外,呼叫协议还用于进行指定路由 器( d r ) 和备份指定路由器( b d r ) 的选举。 ( 2 ) 数据库描述报文 数据库描述报文用来在两个邻接的路由器之间进行初始的链路状态数据库内容的交 换。 数据库描述报文并不传送链路状态数据库的内容,而只是传送链路状态数据库中 l s a 的首部,邻接路由器根据所收到的报文内容得知自身链路状态数据库中缺少哪些 l s a ,从而决定下一步的链路状态请求报文的内容。数据库描述报文的引入,克服了r i p 协议不断向邻居发送部分或整个路由表的缺陷,以较小的网络代价达到了网络的快速聚 合。 ( 3 ) 链路状态请求报文 链路状态报文请求邻居路由器链路状态数据库的特定部分。基于上述数据库描述报 文的结果,路由器可以确定自己需要邻居路由器的链路状态数据库的哪些内容,从而向 邻居路由器发出链路状态请求报文。 其中每个请求的包含了三个主要的数据: 链路状态类型号 链路状态i d 通告路由器 如果要请求多个l s a ,则需要继续加入这样三个数据构成的首部。 ( 4 ) 链路状态更新报文 链路状态更新报文是向邻居路由器发送l s a 的关键机制。 ( 5 ) 链路状态确认报文 链路状态确认报文是确保l s a 可靠泛洪的机制。泛洪的可靠性要求对收到的l s a 进 行确认,否则源节点就不知道该l s a 是否确实到达了其目的地。 链路状态确认报文使用包含在l s a 首部中的l s 序号和通告路由器来唯一地标识它确 认的报文。为了提高效率,可以用单个确认报文对多个l s a 进行确认。 3 1 2 3l s a a s 内的每一个路由器都要生成一种或几种l s a 。路由器的l s a 组成了链路状态数据 库。r o u t e r l s a 和n e t w o r k l s a 描述了路由器之间、路由器和网络之间的互连情况,而 s u m m a r y l s a 则描述了其他区域的经过汇聚了的路由信息,a s e x t e r n a 卜l s a 提供的是 第1 4 页 国防科学技术大学研究生院学位论文 a s 外部的路由信息。 所有的l s a 都有统一的首部格式( 图3 2 ) ,其中l s 类型、l si d 及通告路由器三个 字段一起就可以唯一地标识一个l s a 。 l s 年壮 进蛹 撼黉犁 一 链龉提卷 一 一日l 茜姥拄翮d一 搭序刊峙 l s 啦啦和 长瞳 图3 - 2l s a 首部 0 s p f 共有5 种类型的l s a ,按其l s 类型从1 到5 分别为: ( 1 ) r o u t e r l s a :描述路由器链路到某区域的状态和代价。路由器必须为它所属 的每个区域产生一条l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论