已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第5期王贤茜等:串行同源故障通告机制及其在ASON中的应用87串行同源故障通告机制及其在ASON中的应用王贤茜,王淼,陆月明,纪越峰(北京邮电大学 光通信与光波技术教育部重点实验室, 北京 100876)摘 要:提出了基于串行同源的故障通告机制,针对相同源节点的连接进行故障通告,并引入串行机制,在网络故障恢复率和故障恢复时间2个指标取得理想的折衷。通过扩展RSVP-TE协议实现该机制,搭建了15个节点的自动交换光网络仿真实验平台。实验数据表明,与传统的故障通告机制相比,该机制在一定程度上避免了网络恢复过程中资源预留冲突的问题,在5 000条连接的网络中,网络故障恢复率提高21%,故障恢复时间缩短近15%。关键词:自动交换光网络;故障通告;基于流量工程的资源预留协议;故障恢复率中图分类号:TN929.53 文献标识码:A 文章编号:1000-436X(2009)05-0082-06Failure notification mechanism based on serial communication andsame source and its application in ASONWANG Xian-xi, WANG Miao, LU Yue-ming, JI Yue-feng(Key Laboratory of Optical Communication and Lightwave Technologies Ministry of Education, Beijing University of Posts and Telecommunications, Beijing 100876, China)Abstract: By extending the functions of RSVP-TE, a new mechanism of failure notification based on serial communication and same source was proposed. Since serial communication mechanism was introduced, it could achieve failure notification according to source of connections affected by failure, and made contribution to failure recovery rate and failure recovery time. Experiments were implemented in a 15-node-ASON test-bed. And the results show that, compared with traditional failure notification mechanism, the new mechanism can avoid the conflicts of resource reservation in the process of network failure recovery to a certain degree. With this new mechanism, network failure recovery rate is effectively increased by 21% and network failure recovery time is shortened by 15% in the testing network with 5 000 connections.Key words: ASON; failure notification; rsvp-te; failure recovery rate1 引言收稿日期:2007-12-25;修回日期:2008-11-20基金项目:国家高技术研究发展计划(“863”计划)基金资助项目(2007AA01Z252);国家自然科学基金资助项目(60772024,60711140087);国家重点基础研究发展计划(“973”计划)基金资助项目(2007CB310705);教育部创新团队项目(IRT0609);教育部新世纪人才计划项目(06-0090)Foundation Items: The National High Technology Research and Development Program of China (863 Program) (2007AA01Z252), The National Natural Science Foundation of China (60772024, 60711140087); The National Basic Research Program of China (973 Program) (2007CB310705); PCSIRT (IRT0609); NCET (06-0090)自动交换光网络与传统的传送网最大的不同在于智能化控制平面的引入1。ASON(automatically switched optical network)的控制平面依靠标准化的信令能够实现网络的动态控制,可以动态地完成业务路径的建立、修改、维护、拆除和故障恢复,端到端电路快速调度,从而实现了光网络动态的业务提供、带宽分配和智能化生存性机制,大大减少了新业务的配置时间并降低了网络的运营成本。故障恢复率和故障恢复时间是评价ASON网络的2个重要指标。当传送平面的链路或节点发生故障并且本地保护方式无效时,控制平面检测到故障的节点需要基于分布式的信令控制对该故障影响到的连接做出一系列的故障处理操作2,3,包括故障通告、重路由、建立恢复路径、业务倒换和拆除故障工作路径等4,5。在建立恢复路径中,每个源节点独立进行光通道的选择,因此与正常光通道的建立情况一样,有可能2个源节点在其各自选择的替代光通道上使用了同一个网络资源,造成了网络资源冲突。这种网络资源冲突将降低替代光通道的建立成功率,降低故障的恢复成功率,延长了恢复时间,恶化了网络生存性6。考虑在故障通告时引入延时,解决同一时间同一资源的占用冲突问题,错开建立恢复路径的时间,因而一定程度上可以避免资源冲突。为了提高网络的故障恢复率,缩短故障恢复时间,本文在传统的故障通告机制的基础上,提出一种新的故障通告机制基于串行的同源故障通告机制,该机制在通告过程中引入时延,通告消息串行发出,避免同一时间对同一资源的占用;同时,同源通告机制可以提高通告效率,减轻节点的信息处理负担,在一定程度上避免资源预留冲突,从而提高了网络性能指标。最后,本文搭建了一个15个节点的ASON实验平台,采用RSVP-TE(resource reservation protocol-traffic engineering)作为信令协议。通过对RSVP-TE的扩展,实现了串行同源故障通告机制,并与传统的故障通告机制和同源故障通告机制分别进行了性能的比较。实验结果表明,串行的同源故障通告机制有效地提高了网络故障恢复率,降低了网络恢复时间。2 传统的故障通告机制当传送平面发生故障(节点故障或链路故障)时,控制平面节点将会探测到该故障,并通过分布式信令协议中的通告消息进行故障通告。RSVP-TE作为IETF建议的ASON信令协议之一,得到了设备厂商广泛的支持,可以实现连接的建立、拆除、维护以及故障通告等功能7。在RSVP-TE中,Notify消息被用来进行连接的故障通告。当节点探测到故障后,将会为每一个受到故障影响的连接发送Notify消息。RSVP-TE采用了快速通告机制,即Notify消息被直接发送到连接的源节点,而不经过中间节点的转发,这样能够大大地提高故障通告的速度,使得受到故障影响的连接得到及时的处理。如图1所示,在ASON网络中存在6条连接,分别从节点A,节点B和节点C到节点H。在本文中,分别用D、E、F表示图中连接的第一个中间节点,用G表示发生故障的中间节点。路径A-D-G-H上承载了3条连接:C1、C2和C3;路径B-E-G-H上承载了2条连接:C4和C5;路径C-F-G-H上承载了1条连接:C6。当节点G发生故障时,将会为这些连接进行故障通告,图1显示了传统的故障通告机制流程图。图1 传统故障通告机制流程图当网络发生故障时,传统的故障通告机制将会连续地向受故障影响的连接的源节点发送故障通告消息,大大增加了网络中同时进行恢复的连接数,使得多条连接同时选择相同网络资源的概率增加,从而降低了网络的恢复率。为了提高网络的恢复率,引入串行故障通告机制。该机制在2个相邻Notify消息之间引入了延时。该机制降低了网络连接恢复时的并发性,减少了资源预留冲突的概率,从而提高了网络恢复率。如图2显示了串行故障通告机制流程图。串行故障通告机制与传统故障通告机制的不同就在于引入通告间隔时延。图2 串行故障通告机制流程图3 基于串行同源故障通告机制从上节中可以看出,虽然传统的串行故障通告机制可以避免网络恢复中的资源预留冲突的问题,从而提高网络的恢复率,但是由于引入了延时机制,使得故障网络的恢复时间增长。为了提高网络的故障恢复率及降低网络的恢复时间,本节基于传统的故障恢复机制,提出了基于串行的同源故障通告机制。3.1 同源故障通告机制从传统的故障通告机制中可以看出,故障连接数与Notify消息发送次数是相等的。当网络中存在大量的故障连接时,故障节点需要为每一条连接进行故障通告,即使有些连接的源节点是相同的,这样不仅增加了故障节点处理的负担,需要为每一条连接产生一个Notify消息,而且也增加了收到故障通告消息的源节点的处理负担,有可能会收到多条Notify消息,需要对每一个消息进行处理。为了减少节点处理负担,并提高故障通告的处理时间,本文对传统的故障通告机制做出改进,提出了一种新的基于同源通告的故障通告机制。该机制使Notify消息与连接的源节点相对应,而不是与连接相对应,即一个Notify消息可以为多条具有相同源节点的连接进行故障通告,大大减少了故障通告的次数,从而减少了故障通告的处理时间。在与上节相同的网络情况下,图3显示了同源通告机制的消息流程。从图3中可以看出,当节点G发生故障后,它会根据连接的源节点进行故障的通告。C1、C2和C3的源节点为A,所以直接向节点A发送一个Notify消息进行通告。当节点A收到该Notify消息后,由于Notify消息中包含了故障节点或故障链路的信息,节点A将会为所有经过该节点或链路的连接进行故障处理。同样,节点G分别向节点B和节点C分别发送Notify消息进行故障通告。可以图3 同源故障通告机制流程图从图1和图2中看出,传统的故障通告机制需要发送6次Notify消息,而同源通告机制只需发送3次Notify消息。3.2 串行同源故障通告机制同源故障通告机制与传统的通告机制相比较,在发送通告消息的处理上有很大的简化,在网络存在大量故障业务连接的时候,可以大量减轻故障业务源节点的操作负担。但是,同源通告机制提高了故障通告的速度,使得故障连接的并发性增大,从而使网络恢复时的资源预留冲突更加严重8,9。因此,为了进一步提高网络性能,尤其是在故障恢复率与故障恢复时间2个指标中取得较好的折衷,在同源故障通告机制中引入了延时,本文提出串行同源故障通告机制。该机制减少了故障通告次数,又提高了恢复路径建立的成功率,减缓了由资源预留冲突所带来的恢复率的下降,图4显示了串行同源通告机制的消息流程。从图4中可以看出,当节点G发生故障后,它会根据连接的源节点进行故障的通告。C1、C2和C3的源节点为A,C4和C5的源节点为B,C6的源节点为C,所以直接向节点A发送一个Notify消息进行通告。当节点A收到该Notify消息后,由于Notify消息中包含了故障节点或故障链路的信息,节点A将会为所有经过该节点或链路的连接进行故障处理。然后,节点G处于等待状态,即暂停进行故障通告,引入合适可调的时延之后,再向节点B发送Notify消息进行故障通告,同样引入时延后再通告节点C。结合图2和图3中看出,串行同源通告机制很好地结合了串行和同源通告的优势,提高了网络的生存性。图4 串行同源通告机制为了支持基于串行的同源故障通告机制,本文扩展了RSVP-TE的功能,增加了用于存放连接源节点的数据结构Snode_list,如图5所示。图5 Snode_list数据结构Snode_list中存放着connection_list中连接的源节点,主要用来在发送Notify消息时进行源节点的比较,从而识别出不同的源节点,引入串行机制,由函数Delay(time_delay)实现。时延构造函数如下D表示引入通告过程间的时延,N为Connection_list中的属于同一源节点的连接数目,为数量级调谐常量,与实际网络建立一条LSP的平均时间保持相同数量级(微秒级)。Snode_list在故障通告之前为空,在故障通告时,才进行源节点的存放。串行同源故障通告的具体步骤如下。1) 当节点检测到故障发生后,将会启动故障通告程序。首先读取Connection_list中的第1条连接记录,向该连接的源节点发送Notify消息,并将该连接的源节点存放在Snode_list中,局部变量同源连接计数器N=1,即属于当前源节点的连接有1条。2) 读取Connection_list中的下一条连接记录,并将该连接的源节点与Snode_list中的节点进行比较。3) 如果二者相等,那么证明这2条连接具有相同的源节点,并已向该节点发送过Notify消息,然后读取Connection_list的下一条连接记录,更新同源连接计数器N=N+1。4) 如果二者不相等,证明没有向该节点发送过Notify消息,那么先引入延时因子函数Delay (time_ delay),再向该连接的源节点发送Notify消息,并将该节点存放在Snode_list中,更新N=1。5) 重复步骤2)到步骤4),直到遍历完Connection_list中的所有受故障影响的连接。4 实验平台介绍实验平台主要功能是在分布式的网络环境下对ASON的控制平面技术进行仿真。该平台可以独立地对ASON网络的路由、信令、故障保护倒换等关键技术进行仿真,最终完成对网络性能的评估。该实验平台每个节点运行一套仿真软件,每个节点作为1个物理节点+1个控制平面。该平台由15台高性能的机架式计算机(作为15个ASON节点)、6台台式机(作为5个客户端节点及1个网络管理器)及1个交换机组成,如图6所示。15个ASON节点中运行着ASON控制平面的协议,包括RSVP-TE、OSPF-TE、LMP等协议。在网络管理器上可以对15个节点的邻居关系及链路进行配置,以构成一个完整的网络拓扑。图6 ASON实验平台5 性能分析与实验在性能分析比较中,本文主要对基于串行的同源故障通告机制的网络故障恢复率和网络故障的恢复时间进行分析并与传统的故障通告机制、串行故障通告机制、同源故障通告机制进行了比较。对于仿真网络中的单故障情况,故障恢复成功率和故障恢复时间的定义如下:故障恢复成功率是指被成功恢复的连接与被故障影响的连接总数之比;故障恢复时间是指从故障通告发出到受影响的连接被成功恢复过程所经历的时间。5.1 网络拓扑参数介绍(NSFnet)本文采用NSFNET骨干网,共14个节点,21条容量为10G的链路,如图7所示。图7 NSFNET网络拓扑实验网络中忽略信令包的传输时间和处理时间,建立一条LSP的平均时间为20ms。因此,实验中数量级调谐常量取值为0.11ms。为了模拟现实网络负载,本实验网络LSP请求依据Poisson过程动态生成,并在源宿节点间均匀分布,LSP请求的到达间隔时间和持续时间都满足参数为和的负指数分布。5.2 恢复率当网络进入稳定状态后,实验系统在网络中随机产生一个故障状态,并对网络故障恢复率以及平均恢复时间进行统计。考虑到实验结果具有随机性,对于每一个数据点,使用了不同的随机数种子进行100次仿真,然后得出该数据点的平均值以及其95%置信区间。考虑大规模网络存在资源冲突的前提下,网络故障的恢复主要经历故障通告与资源冲突后的信令折回2个过程,其中信令折回过程就包括资源冲突情况下连接的建立与拆除。由于网络资源足够多,即使存在网络资源冲突,最终连接一定可以建立成功。为了避免网络恢复过程中,信令无限制地折回,本文将信令折回次数上限定为3次,即当某条连接已经折回3次,还无法建立成功,则定义该次故障恢复失败。图8对比了4种机制的网络故障恢复率。从图8可以分析得出,随着网络连接数的增多、网络结构的复杂化,网络中故障的恢复率是呈下降趋势的。在网络连接数相同的情况下,采用传统串行故障通告机制的网络故障恢复率是最高的,引入时延后,避免了资源冲突带来的失败,以牺牲网络恢复时间为代价从而保障了网络的可靠性;采用同源故障通告机制的网络恢复率是最低的,由于具有相同源宿图8 4种机制的网络故障恢复率比较节点的业务恢复时存在资源冲突,造成连接建立的失败;采用串行同源故障通告机制的网络,故障恢复率仅次于串行传统故障通告机制,且大于90%,远远优于传统故障通告机制。5.3 恢复时间图9给出了4种机制网络恢复时间的比较。从图9中可以看出,随着网络业务规模的增大、连接数的增多,网络中的故障恢复时间是呈增长趋势的。其中,传统串行故障通告机制的网络故障恢复时间随连接数的增多,增长速度最快。主要原因是除第一条连接外,每条受故障影响的连接在进行故障通告之前,均设定了一定的时延,所以故障通告的时间是随连接数的增加而线性增加的,总的恢复时间呈现增长的趋势。同源故障通告机制是4种机制中恢复时间随连接数增长最为缓慢的,这主要是因为故障通告的时间只与通告的次数有关,采用同源故障通告机制之后,通告次数与受故障影响的连接的源节点的个数相关,恢复时间的增长主要是因为恢复的连接数增多引起资源冲突的概率增大,从而导致恢复时间的增加。从图9可以看出,由于同源故障通告机制中引入时延,在相同的网络连接数的前提下,串行同源通告机制的恢复时间大于传统通告机制,但优于传统串行机制。图9 4种机制的网络故障恢复时间比较6 结束语串行机制会带来时延,但避免资源冲突,提高了故障恢复率;同源机制节省恢复时间,但资源冲突的弊端又会大大影响恢复的成功率。综合考虑网络的有效性和可靠性,串行同源故障通告机制的恢复率大于90%,且在网络业务规模很大的情况(实验网络中连接数大于3 000)下,恢复时间与传统的故障通告机制也相差不大。在重载网络中,当发生故障,可用网络资源紧缺且故障的同源平均连接数(表征从同一源节点发出的连接数密集程度,可由属于各源节点的受故障影响的连接总和与源节点的个数的比值来定义)较高时,串行同源故障通告机制是4种机制中的最优选择。参考文献:1International Telecommunication Union, ITU-T Recommendation G.8080, Architecture for Automatically Switched Optical Network (ASON)S. 2001.2PERELLO J, AGRAZ F, SPADARO S. Assessment of LMP-based recovery mechanisms for GMPLS control planesA. GMPLS Performance: Control PlaneC. Resilience, 2007 Workshop, 2007.1-6.3JAJSZCZYK A, ROZYKI P. Recovery of the control plane after failures in ason/gmpls networksJ. IEEE Network, 2006, 20(1): 4-10.4International Telecommunication Union, ITU-T Recommendation G.7713.2, Distributed Connection Management-GMPLS RSVP-TES. 2003.5赵继军, 雷蕾, 纪越峰.一种基于ASON的新型动态恢复路径建链协议J. 通信学报, 2003, 24(5): 85-93.ZHAO J J, LEI L,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 论坛交友活动方案
- 街舞烧烤活动方案
- 观摩韵律活动方案
- 蓝天志愿活动方案
- 营地水枪大战活动方案
- 街头新年音乐会活动方案
- 装修公司举办活动方案
- 餐饮员工手册计划
- 小学生童话故事写作技巧精讲
- 街道交通整治活动方案
- 三年级语文上册第五单元【教材解读】
- 第四章聚合物在加工过程中的降解课件
- 内分泌科运用PDCA提高糖尿病患者自我注射胰岛素的正确率品管圈(QCC)活动成果报告书
- 佛山轨道交通号线一期工程·透水坍塌重大事故案例分析专题培训课件
- 突发公共卫生事件流行病学-暴发调查(流行病学课件)
- 国家电网考试历年真题(附答案)
- 普通高中课程标准2020修订版电子版
- 铁路基础知识考试题库500题(单选、多选、判断)
- 军乐团项目长城杯汇报(确认)
- 微创外科理念及未来发展
- GB/T 12771-2019流体输送用不锈钢焊接钢管
评论
0/150
提交评论