(信号与信息处理专业论文)大型voip网络故障特征发现及其对业务影响的分析和研究.pdf_第1页
(信号与信息处理专业论文)大型voip网络故障特征发现及其对业务影响的分析和研究.pdf_第2页
(信号与信息处理专业论文)大型voip网络故障特征发现及其对业务影响的分析和研究.pdf_第3页
(信号与信息处理专业论文)大型voip网络故障特征发现及其对业务影响的分析和研究.pdf_第4页
(信号与信息处理专业论文)大型voip网络故障特征发现及其对业务影响的分析和研究.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(信号与信息处理专业论文)大型voip网络故障特征发现及其对业务影响的分析和研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独创性。或创新性,声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 , 本人签名: 令车鑫 日期: 邋厶2 :墨! 12 一 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借 阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它 复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论 文注释:本学位论文不属于保密范围,适用本授权书。 一 电 、。 本人签名: 导师签名: 日期:堕f ! :i :! l 日期: 垒里f ! :兰:12 - 八 3 - l 大型v o i p 网络故障特征发现及其对业务影响的分析和研究 摘要 随着对于网络性能和网络提供增值服务的要求越来越高,人们对 网络的稳定性和可获得性要求也越来越苛刻。同时,随着网络容量的 迅猛扩大,网络的结构更为复杂,网络中往往包括以各种复杂形式互 联的子网络,网络故障的情况变得更加复杂。根据网络理论知识推知 网络故障的特征很难满足网络故障管理的需要。 本课题选取对网络运行状况要求较为严格的v o i p 业务,构建常 见大型网络拓扑,建立典型设备故障模型,通过仿真方法得到不同网 络条件、不同故障设定下的端到端业务性能数据和设备流量数据,与 非故障情形下相应数据进行对比,总结一般故障在不同条件下的业务 层和设备层表征,分析面向业务的故障定位规律。 网络性能可以视为随时间变化而变化且不同时间状态间相互关 联的时序数据。因此可将处理时序数据的一些方法如统计聚类和挖掘 技术应用于网络性能数据处理中,从而归纳出故障条件下较为典型且 易于采集的关键性能及其特征,并以经过处理提炼的网络性能特征来 描述故障。 通过仿真获取故障特征相关规则能够解决样本数据获取困难的 问题;从业务出发,根据业务性能以及时延、流量等网络信息得到主 要网络故障的基本特征可能使故障修复将更有针对性、更迅速:通过 故障管理与性能管理相结合,减轻网络管理系统承担一套完备的故障 系统的负担。 关键词:网络故障故障特征网络性能网络仿真 b e c a u s eo ft h ei n c r e a s i n gr e q u i r e m e n to fn e t w o r kp e r f o r m a n c ea n dv a l u e a d d e d s e r v i c e s ,t h es t a b i l i t ya n da v a i l a b i l i t yo fn e t w o r ka r ea l s oi n c r e a s i n g l yi m p o r t a n t m e a n w h i l e ,w i t ht h er a p i de x p a n s i o no fc a p a c i t ya n dm o r cc o m p l e x i t yo fs t r u c t u r e , n e t w o r k su s u a l l yi n t e r c o n n e c tv a r i o u st y p e so fs u b n e t w o r k s t h en e t w o r kc o n d i t i o n w i t h i nf a u l t sh a sb e c o m em o r ec o m p l e x i n f e r r i n gt h ef e a t u r e so fn e t w o r kf a u l t s a c c o r d i n gt on e t w o r kt h e o r yi sd i f f i c u l tt om e e tt h en e e d so ff a u l tm a n a g e m e n t v o i ps e r v i c et h a tr e q u i r e sm o r es t r i n g e n tn e t w o r kc o n d i t i o n si ss e l e c t e di nt h i s d i s s e r t a t i o n w i t hc o m m o nl a r g e - s c a l en e t w o r kt o p o l o g i e sd e s i g n e d ,v a r i o u st y p i c a l m o d e l so fe q u i p m e n tf a u l t se s t a b l i s h e d ,s i m u l a t i o no fd i f f e r e n tn e t w o r ka n df a u l t s c o n d i t i o n sf e t c h e st h ep e r f o r m a n c ea n df l o wd a t ao fe n d t o e n d a p p l i c a t i o na n d e q u i p m e n t s t h ec o n t r a s tw i t hc o r r e s p o n d i n gd a t ao fn o n - f a u l tc a s e ss u m su pt h e g e n e r a lf a u l tf e a t u r e so nt h ea p p l i c a t i o na n dn e t w o r kl a y e r su n d e rd i f f e r e n tn e t w o r k c o n d i t i o n s ,a n da n a l y z e sa p p l i c a t i o n - o r i e n t e dl a wo ff a u l tl o c a t i o n n e t w o r kp e r f o r m a n c ei sr e g a r d e da st h et e m p o r a ls e q u e n c e sw h i c h c h a n g eo v e r t i m ea n di n t e r r e l a t eb e t w e e ns t a t e sa td i f f e r e n tt i m e s t h e r e f o r e ,t h em e t h o d sf o r t e m p o r a ld a t as u c ha ss t a t i s t i c a lc l u s t e r i n ga n dm i n i n gt e c h n o l o g i e sc a nd e a lw i t h n e t w o r k p e r f o r m a n c e d a t a p r o c e s s i n g t h u s t h e k e yp e r f o r m a n c e a n dt h e i r c h a r a c t e r i s t i c ss u m m e d u pu n d e rf a u l tc o n d i t i o n sw i l ld e s c r i b et h ef a u l t sw e l l t h es i m u l a t i o nf o rr u l e sr e l a t e dw i t hf a u l t sf i g u r e sw i l lo v e r c o m et h ed i f f i c u l t yt o o b t a i nt h e s a m p l ed a t a t h en e t w o r kf a u l tf e a t u r e sr e c o g n i z e df r o ma p p l i c a t i o n p e r f o r m a n c es u c ha sd e l a y , t r a f f i ca n do t h e rn e t w o r ki n f o r m a t i o nm a yl e a dt om o r e t a r g e t e da n dr a p i dn e t w o r kf a i l u r er e c o v e r y t h ec o m b i n a t i o no ff a u l tm a n a g e m e n t a n dp e r f o r m a n c em a n a g e m e n ti sac o m m i t m e n tt or e d u c et h eb u r d e no fn e t w o r k m a n a g e m e n tp l a t f o r mr a t h e rt h a nac o m p l e t ef a u l tm a n a g e m e n ts y s t e m k e yw o r d s :n e t w o r kf a u l t s ,f a u l t sf e a t u r e s ,n e t w o r kp e r f o r m a n c e , n e t w o r ks i m u l a t i o n l 3 4 网络性能门限分析1 3 3 5 网络性能相似性发现1 4 3 6 辅助挖掘分析1 5 3 6 1 网络性能序列关联规则挖掘。1 5 3 6 2 网络性能序列分类算法1 5 3 6 3 网络性能序列聚类算法1 5 3 6 4 其他挖掘方法1 7 第四章大型v o i p 有线网络的故障特征发现及其对业务影响的分析1 8 4 1 网络和业务建模1 8 4 1 1 业务需求1 8 4 1 2 网络架设1 8 4 1 3 仿真建模。2 0 4 2 业务设置2 3 4 3 仿真数据收集2 4 4 4 故障特征理论及图形分析2 4 4 4 1 核心设备故障2 4 4 4 2 端口故障2 5 4 4 3 链路故障2 5 4 4 4 路由协议故障2 6 4 5 仿真数据处理及故障特征分析2 7 第五章大型v o i p 无线网络的故障特征发现及其对业务影响的分析3 1 5 1 网络和业务建模3 1 5 1 1 业务需求。3 1 5 1 2 网络架设。3 1 5 1 3 仿真建模3 4 5 2 业务设置3 5 5 3 故障特征理论及图形分析3 6 5 3 1 信号干扰3 6 5 3 2 信号过弱3 7 5 3 3 接入点故障3 8 5 3 4s s i d 配置错误3 9 5 4 仿真数据处理及故障特征分析4 0 第六章总结与展望。4 1 6 1 总结与结论4 1 6 2 下一步工作4 1 参考文献4 3 1 i ! i :谢4 5 攻读学位期间发表的学术论文目录4 6 图目录 图2 - 1 不同网络情境下性能数据的图形化表示7 图2 2 时延主要模式8 图3 - 1 多种仿真情境下性能数据图形对比1 2 图3 2 仿真结果报告示意。1 2 图3 3o p n e t 导出性能数据1 3 图3 4 基于服务器时延和网络平均时延的聚类 1 3 1 1 6 图4 。l 骨干网核心层和汇聚层拓扑1 9 图4 2 骨干网核心节点部署1 9 图4 。3 汇聚节点和接入节点示意图2 0 图4 4 核心层拓扑图2 l 图4 5 汇聚层拓扑图2 1 图4 6 接入层拓扑图2 2 图4 - 7 有线网路由器故障仿真结果2 5 图4 8 有线网端口故障仿真结果2 5 图4 9 有线网链路故障仿真结果2 6 图4 1 0 有线网路由协议配置故障仿真结果2 7 图4 1 1 核心路由器收包在不同故障条件下的类型2 8 图4 - 1 2 最大父节点数为1 的b a y e s i a n 网络模型2 9 图4 1 3 最大父节点数为2 的b a y e s i a n 网络模型2 9 图5 1v o w l a n 主要网络元素3 2 图5 2v o w l a n 模型拓扑3 3 图5 3 无线网络w i a n 模型拓扑3 4 图5 - 4 无钱网络w l a n 模型接入子网拓扑3 5 图5 5 无线网高传输速率终端及低传输速率终端被干扰时性能3 7 图5 6 无线网接入点信号过弱时无线终端及相邻接入点性能3 7 图5 7 无线网接入点故障时无线终端及相邻接入点性能3 8 图5 - 8 无线网s s i d 配置错误时无线终端及所属无线接入点性能4 0 表目录 表3 1 仿真收集的网络性能指标1 1 l 大型v o i p 网络故障特征发现及其对业务影响的分析和研究 1 1 研究背景 第一章绪论 国际标准化组织( o s l ) 对网络管理功能进行了领域划分,定义了性能、配置、 故障、安全和计费五个管理功能域【1 】。其中故障管理的作用是迅速发现和纠正 网络故障,动态维护网络的有效性,从而确保网络的可靠性和可获得性。 随着对于网络性能和网络提供增值服务的要求越来越高,人们对网络的稳定 性和可获得性要求也越来越苛刻。同时,随着网络容量的迅猛扩大,网络的结构 更为复杂,网络中往往包括以各种复杂形式互联的子网络,网络故障所带来的损 失也越来越大。由于故障具有传播性,单个故障会产生大量的网络告警,在多个 故障同时发生时,情况变得更加复杂。网络系统的崩溃可能会造成灾难性的损失。 因此,一旦网络出现故障,就必须要排除故障,确保网络正常运行,从这个意义 上讲,网络故障管理是网络管理的基础工作,也是最重要的网络管理任务。 网络故障管理一般包括故障的发现、故障的标志和故障的修复三个步骤,主 要功能包括:故障的检测,检测偏离正常行为的问题状态发生以及标志其性质; 故障的诊断,确定故障检测阶段所发现问题的根本原因。故障的修复、解决问题 的一组动作,或用事前配备的备用资源迅速替换故障资源。网络故障管理的难点 在于故障的诊断,即确定故障的根源。 1 2 相关技术 网络故障诊断第一步是获取网络资源的状态信息,即网络监视。要发现网络 故障,需要收集各种网络信息。一般来说,网络发生了故障是指网络设备或网络 服务处于不正常的状态,通过监视网络设备和各种网络服务及应用的状态信息, 就可以及时发现网络中出现的问题。 目前网络监视一般有两种方法实现:一种是在发生故障时,由发生故障的设 备主动向网络管理系统发送告警信息,称为异步告警;另一种是由网络管理系统 定期查询网络设备的状态是否正常,称为主动轮询。这两种方法中,异步告警在 网络监视中居于更为重要的地位,它可以及时地发现端口故障、连接失败、设备 重新启动、接收不到某一设备的应答,服务器进程异常等网络故障或重要事件, 占用带宽和资源消耗也较主动轮询为少。 当然,这种方法也有其局限性:当网络设备由于故障或被攻击等原因与网络 管理系统失去联系而无法发送告警信息,网络管理系统会认为故障设备运行良 好。因此,网络管理系统定期或在关键时间如网络管理系统启动时对被 管理网络设备进行轮询是必不可少的。 1 大型v o l p 网络故障特征发现及其对业务影响的分析和研究 总之,目前大型网络采取的网络监视手段和故障诊断方法多针对于具体设 备,或进一步根据一组设备的网络监视情况进行故障诊断。这种方法是认为当所 有网络设备运转良好时,网络运行状况也应当令人满意,网络业务性能可以满足 需求。即故障管理较多关注设备故障,故障管理与性能管理是分离的,网络故障 管理不能直接面向业务,对于提高网络用户s l a 的满足程度和提高网络服务性 能没有直观意义这种故障管理方式存在下述问题: 这种故障管理方式要求掌握大量可靠的网络设备信息。要获得这样的信息, 一种可靠的办法就是不断地监视网络运营状态及其参数。对于网管系统是较大的 负担; 网络监视信息流量叠加在正常的网络流量之上,增加了网络负担,特别是对 于像移动a d h o c 、传感器网络一类带宽受限的网络,监视数据的流量直接影响了 网络的性能;随着网络规模的不断增加,设备类型和数目也越来越复杂繁多,无 论是主动轮询还是异步告警都可能导致网络流量特别是管理者端的流量增大,这 样,一方面会造成以管理者为端点的链路拥塞;另一方面,当网络出现故障现象 时,需要获得更多的数据做进一步的推理判断,过多的管理数据会进一步恶化网 络性能; 复杂的网络系统每天都会产生大量的告警消息,系统告警信息的不完整以及 网络故障的扩散性都加大了故障诊断的难度,传统的网络管理系统和网络管理员 面对因突发故障而引发的告警风暴往往显得束手无策,网络管理员只能依靠自身 有限的经验和网络管理系统有限的功能。 1 3 研究内容 当前,网络管理的范围和关注点已经从单纯的网络层配置、性能和故障管理 转变为以业务为中心的综合管理。若能从业务出发,根据直接影响用户体验的端 到端业务性能以及流量信息定位和诊断故障,使网络监视从网络设备层升级到业 务层,对于网络故障管理功能领域有如下意义: 1 网络故障管理与客户的业务体验直接联系,具有较高的工程价值;故障 修复将更有针对性、更迅速。 2 故障管理与性能管理相结合,减轻网络管理系统承担一套完备的故障管 理系统的负担; 3 无须大量告警信息的获取,网络设备对于自身的监视要求降低,减低网 络成本: 4 通过分析端到端性能进行故障管理无须向网络中叠加大量的轮询和告警 信息,减少网络管理系统对网络资源的需求和对正常业务流量的影响; 5 一定程度上避免了复杂的海量告警信息分析。 本课题选取对网络运行状况要求较为严格的v o 口业务,构建常见大型网络 2 广 大型v o l p 网络故障特征发现及其对业务影响的分析和研究 拓扑,建立典型设备故障模型,通过仿真方法得到不同网络条件、不同故障设定 下的端到端业务性能数据和设备流量数据,与非故障情形下相应数据进行对比, 总结一般故障在不同条件下的业务层和设备层表征,分析面向业务的故障定位规 律。 以上所述对于业务性能和网络故障问题的研究包括以下方面: 针对v o l p 业务的需要,设计出若干个不同类型、不同协议配置、不同网元 类型、大型网络,采用网络仿真软件o p n e t l 4 5 开发实现这些网络仿真环境。 从不同故障类型、不同故障点布局和不同网络故障组合等几个方面来设计网 络故障情境,并完成故障仿真模型的实现。 根据不同网络故障条件和不同网络条件,设计出多种组合,通过完成多组仿 真试验,收集不同组合仿真条件下端到端业务性能、网络流量、设备状态等信息。 在每次仿真试验中,我们将根据仿真网络的不同,重点监控端到端业务性能 指标数据,包括如端到端时延、时延抖动、帧擦除、失序,以及网络接通率、应 呼比、呼损率、应答率、成功率等等。并采集网络和各设备、各链路主要业务性 能指标作为仿真结果数据作为对比和分析依据,主要包括呼叫成功率、吞吐量及 每个网元的包丢失、延迟、延迟抖动等等。 通过仿真试验,可得到不同网络仿真情境下的仿真数据,通过统计分析技术 等手段对这些仿真数据进行处理,得到必要的统计特征以进行分析,如不同仿真 情境下某性能参数的时间变化趋势图、均值、最大最小值的对比;不同仿真情 境下某性能参数变化与网络中故障发生时间的映射关系等。总结出不同网络条件 下各类典型故障特征,分析其对端到端业务性能的影响。最后考虑能否根据这些 特征和规律建立面向业务的故障诊断专家系统。 1 4 论文结构 第二章主要介绍了网络故障管理的相关技术及存在问题。 第三章提出仿真故障特征分析方法。包括部署v o l p 业务以得到故障对业务 的影响,应用仿真工具及环境,完成网络仿真建模、主要网络设备、网络故障类 型、网络性能参数的选取等内容。 第四章和第五章分别建立了有线大型网络和无线大型网络的故障仿真模型 并进行故障特征分析。分别介绍了这两个网络模型的网络拓扑结构、网络性能特 征、网络业务配置、网络流量估计以及多种网络故障场景的仿真试验。然后介绍 了相应故障特征分析结论,以及根据该结论快速定位网络故障的方法。 3 大型v 0 i p 网络故障特征发现及其对业务影响的分析和研究 第二章网络故障管理研究综述 故障管理是网络管理中最基本的内容之一。故障管理的目的在于确保网络系 统的高稳定性 2 1 网络故障 网络故障通常可按网络故障的性质、对象或出现的区域等进行分类。网络故 障通常有以下几种可能:物理层中物理设备相互连接失败或者硬件及线路本身的 问题;数据链路层的网络设备的端口配置问题;网络层网络协议配置或操作错误: 传输层的设备性能或通信拥塞问题;o s i 上三层或网络应用程序错误f 2 1 。 跟据网络故障的不同对象可分为线路故障、路由器故障、主机故障等。线路 故障最常见的是线路不通、路由器配置错误。线路故障中很多情况都涉及路由器, 因此也可以把一些线路故障归结为路由器故障。 从网络故障的性质来划分,常见的网络故障可以分为物理故障和逻辑故障; 物理故障是指设备或线路损坏、插头松动、线路受到严重电磁干扰等情况比如 说,网络中某条线路突然中断。逻辑故障的一种常见情况就是配置错误,就是指 因为网络设备的配置原因而导致的网络异常或故障。配置错误可能是路由器端口 参数设定有误,或路由器路由配置错误以致路由循环或找不到远端地址,或者是 网络掩码设置错误等。 本论文中关注的主要网络故障包括: 链路故障网线故障、网卡和端口硬件故障或安装错误、链路运行协议配 置不正确、v l a n 设置问题等等。统计表明,链路故障在网络故障总量中约占 8 0 ,因此链路故障是网络中最常发生的故障之一。 核心设备硬件故障如电源故障、部件损坏、系统资源不足、网络负载过高、 存在端口瓶颈、线缆故障如回环等;软件故障比如配置的网段、协议类型、端口 错误等;或由于系统漏洞和数据错误,在条件合适时,会导致交换机满载、丢包、 错包等情况的发生;端口故障如串口端口传输的通信量超过端口所能处理的通信 量、端口管理性关闭、线路协议关闭等l 以太口带宽的过分利用、碰撞冲突次数 频繁、使用不兼容的帧类型l 异步通信口故障造成与远端调制解调器通信失败。 安全故障是由于病毒或者黑客攻击以及引起的广播风暴等情况的存在,端口 可能收到发送大量数据包,造成交换机处理器过分繁忙,致使数据包来不及转发, 进而导致缓冲区溢出产生丢包现象。 主机终端故障一般是由管理员或用户对主机的配置不当比如,主机配置的 i p 地址与其他主机冲突,或口地址根本就不在子网范围内,这将导致该主机不 4 大型v o l p 网络故障特征发现及其对业务影响的分析和研究 能连通。无线网络中服务集( s e r v i c es e t ) i d 配置问题类似。 协议故障的原因主要有以下两点:1 网络协议安装错误。所谓网络协议安装 错误,是指没有安装相应的网络协议。例如,w i n d o w s9 8 操作系统默认只安装 n e t b e u i 协议,而要想实现i n t e m e t 访问,就必须再添加t c p i p 协议。而有些 网络游戏和网管软件,则要求用户安装i p x ) ( p x 协议。2 网络协议配置错误。 t c p i p 协议的配置其实就是指计算机的l p 地址信息,包括口地址、子网掩码、 默认网关和d n s 服务器l p 地址 2 2 网络故障管理 计算机网络的可靠性是实现网络系统功能的基础。故障管理是网络管理中最 基本的内容之一。故障管理的目的在于确保网络系统的高稳定性。当网络中某个 组成部分失效时,故障管理必须迅速查找到故障并能及时给予排除。故障管理的 日常工作包含对所有节点动作状态的监控、故障记录的追踪与检查,以及平常对 网络系统的测试。故障管理功能以监视网络设备和网络链路的工作状况为基础, 包括对网络设备状态和报警数据的采集、存储,可以实现报警信息通知、故障定 位、信息过滤、报警显示、报警统计等功能。故障管理可以统一不同网络设备的 警报格式,并将其显示在图形界面上,通过对报警信息进行相关性处理,确定报 警发生地的管理归属等;除此之外,故障管理还可根据用户需要保存所有报警信 息,同时可产生各种故障统计、分析报告。 由于通常网络故障产生的原因都比较复杂,特别是故障的产生是由多个网络 共同引起时。在传统网络管理中,要求网络管理员必须具备较高的技术水平及业 务素质,同时还应该积累了丰富的实践经验,以应对不同类型的网络故障。其工 作负担很重,当前网络故障管理一直试图减轻网络管理员的工作负担,通过引入 人工智能和数据挖掘技术实现网络故障的学习、鉴别和检测。故障排除后必须认 真分析网络故障产生的原因。分析故障原因是防止类似故障的再次发生的基本环 节,相当重要。在智能网络故障管理中,历史故障原因分析是故障决策系统的信 息资源库构建的核心环节。智能网络故障管理已经出现了很多比较成熟的技术和 系统,如网络告警关联【3 】【4 】和移动代理等5 1 。 在网络管理系统中网络故障管理包括故障检测、隔离和纠正三个方面,主要 包括以下内容: 网络维护及错误日志检查功能:( 1 ) 使用多种网络故障监控方式监控网络的 整体运行情况。( 2 ) 检查网络设备的错误日志,分析错误原因。( 3 ) 对于网络中的 重要机器、设备进行运行状态的重点监视。 网络故障报告功能:( 1 ) 通过各种途径报告网络故障,报告方式包括使用告 警、日志、触发等。( 2 ) 通过邮件、声音等通知管理员( 3 ) 根据网络故障的危害程 度将故障告警分级,并命令系统其他功能模块根据故障级别做出不同反应。 5 大型l p 网络故障特征发现及其对业务影响的分析和研究 跟踪、辨认故障( 1 ) 进行故障追踪定位。( 2 ) 使用各种故障诊断工具,确认 类型及性质。( 3 ) 启用备用线路或设备,进行故障隔离。( 4 ) 分析设备故障情 制定排错方案。 故障分析预测根据网络系统故障的类型及发作频度,分析故障产生的原因, 将来网络故障的发作趋势。 具体来说,对网络故障的检测,是依据对网络组成部件状态的检测。不严重 单故障通常被记录在错误日志中,并不作特别处理。而严重一些的故障则需 知网络管理员,即所谓的“故障报警。一般情况下,网络管理员应根据有 息对报警进行处理、排除故障。当故障比较复杂时,网络管理员应执行一些 测试来辨别故障原因。 第一步是获取网络资源的状态信息,即信息获取。要发现网络故障,需要收 种网络信息。一般来说,网络发生了故障是指网络设备或网络服务处于不正 状态,通过获取网络设备和各种网络服务及应用的状态信息,就可以及时发 络中出现的问题。本文在2 4 节中根据研究内容具体讨论网络信息的收集。 本文主要关注如何从这些网络状态信息中得到网络故障的特征。这些故障特 于及时发现网络中出现的问题具有重要的意义。网络故障隔离和处理不在本 的讨论范围内。 2 3 网络性能与网络故障 理论上通过获取网络设备和各种网络服务及应用的状态信息,就可以及时发 现网络中出现的问题【6 1 。目前大型网络收集状态信息多针对于具体设备,或进 一步根据一组设备的网络状态进行故障管理。本节中分析网络故障以网络性能方 式表示的方法。因为网络性能数据能够直接影响网络业务的感受,对业务提升具 有直观意义。 2 3 1 网络性能 网络性能是评价网络运行状态好坏的重要指标。主要关注流量和时延两类性 能指标由于网络的流特性和收敛性,可以分析网络性能的主要特点如下: 1 网络性能数据量庞大且随时更新 由于网络经常是以2 4 * 3 6 5 的方式进行监控,并且网络设备众多,收集的网 络数据一般都极其庞大。这要求数据处理的方法必须高效迅速,否则不仅达不到 实时的标准,而且可能会造成大量数据的堆积。 2 网络性能数据是多维度的 网络性能数据包括流量、时延、呼损等等内容,处理时常常需要结合起来才 能得到需要的结论可以将网络性能数据看做多维度的随时间变化而变化的变 6 大型v o 口网络故障特征发现及其对业务影响的分析和研究 量,在图形化显示上也要考虑到这一特性,将主要的维度都表现出来,如下图所 不: r 图2 - 1 不同网络情境下性能数据的图形化表示 该图在二维空间中表现了三个维度的性能数据。一条线段的长短表示一种性 能数据的大小,具有直观的特点。 3 很多网络性能数据在不同情境下也具有相似的特征 例如在网络负载较轻但因为其他原因存在丢包的情况下,时延并不会发生变 化;当一个子网中因故障造成性能数据变化时,其他距离较远的子网数据流量特 征不变。 轧 4 由同一或临近设备上检测到的网络性能数据具有一定关系 由于数据包在传输过程中一定会经过相邻设备的相连链路。因此相邻链路的 性能数据会具有一定关系。如路由器的背板总流量是所有链路的和。在挖掘中可 以首先对全网部分数据挖掘,根据结果选择子网进行挖掘。 5 网络性能数据量级和变化趋势的种类较少 虽然网络性能数据量庞大,但无论是从通话质量还是故障角度来说,都可以 划分为很少的类:如稳定和振荡,递增或递减,设备故障和链路故障等。 6 网络性能数据随时间变化,取样周期可以表述为颗粒度,部分粗颗粒 度数据可以综合细颗粒度数据得到 取样周期较大称为粗颗粒度,取样周期较小称为细颗粒度。有些粗颗粒度的 数据可以综合细颗粒度数据得到。例如一天的总发包量可以由每个小时的总发包 量相加得到。在挖掘可以先挖掘粗颗粒度,根据挖掘结果定位细颗粒度进行挖掘。 7 网络业务的流特性和收敛性保证了非故障条件下,网络性能数据的平 稳和可预测性。另一方面,可预见的故障在故障导致的业务异常发生前会产生 瞬态性能变化f 7 1 。 2 3 2 网络性能与网络故障的关系 网络业务的流特性和收敛性保证了非故障条件下,网络性能数据的平稳和可 预测性。另一方面据观察,可预见的故障在故障导致的业务异常发生前会产生瞬 态性能变化【7 】。这些包含在流量等网络性能数据瞬态变化中的短信号可以作为 7, 大型v o i p 网络故障特征发现及其对业务影响的分析和研究 辨识的特征,嵌入正常的网络管理系统。在这项工作中,可以依靠m i b 库中存 储的变量如z p l n r e c e i v e s ,i p l n d e l i v e r s 和i p o u t r e q u e s t s 等或直接收集业务相关 的网络性能变量。每个变量的瞬态变化可以说明一些故障问题的行为。反过来在 故障情况下,也可以通过仿真或实际观测等手段收集到m i b 变量相关或业务相 关性能的瞬态变化。因此,可分析特征故障的定义如下:其之前或期间的网络故 障发生后,流量、时延等有关的性能数据变量出现了相关的短暂变化有时候如 流量等性能会出现持续长时间的变动,可作为另一种性能变化的性能特征模式。 持久性的网络性能特征变化常常用来作为网络故障的告警依据。 根据不同网络数据的特性,我们可以总结出每种性能数据可能会出现的模 式:如时延可能为等值稳定于8 0 m s 以下,测不到,大斜率增长到s 级,突变到更高 并稳定,突变到更低并稳定等。如下图所示: 一 吣一 一 - # 4 kj _ -协h 图2 - 2 时延主要模式 第一张图为非故障条件下的端到端时延,表现为稳定;第二张图为核心路由 器出现资源不足时,端到端时延会出现线性增长,第三张图为全网时延当呼叫开 始建立时存在突变。 与之类似时延趋势可以归类为同样的性能模式。这样虽然网络数据量很大, 但类别很少。总结相应故障条件下的关键性能模式作为故障特征,可以按此模式 作为网络故障监控和告警的依据。 2 4 网络性能监控在网络故障管理中的应用 收集网络信息一般有两种方法:一种是异步告警,在发生故障时,由发生故 障的网络对象主动向网络故障管理系统报告,如s n m p t r a p 消息;另一种是主动 轮询,由网络故障管理系统定期查询网络对象的状态。由发生故障的网络对象主 动向网络故障管理系统报告是一种十分有效的故障发现机制,它可以及时地发现 端口故障、连接失败、设备重新启动、接收不到某一设备的应答,服务器进程异 常等网络故障或重要事件,而且只需要有限的网络带宽,但这种方法并不总是可 靠的。 网络性能数据的获取一般采用主动轮询的方法,可以分为主动测量和被动测 量两种方法。主动测量是在选定的测量点上利用测量工具有目的地主动产生测量 流量注入网络,并根据测量数据流的传送情况来分析网络的性能被动测量是指 8 广 大型v o l p 网络故障特征发现及其对业务影响的分析和研究 在链路或设备( 如路由器,交换机等) 上对网络进行监测,而不需要产生流量的 测量方法。在实际网络管理中常常将这两种方法结合使用,称为混合测量。采取 何种测量方法取决于被采集网络数据的特性,从而对数据处理和网络故障实时检 测定位具有一定要求。 收集到的网络性能数据利用分析系统,与故障库中各种网络故障的性能特征 作比较,从而实现对故障原因的判断。分析系统一般可分为存储区,故障库和分 析引擎。存储区存放关于被管网络的拓扑结构信息以及一些实时的性能信息,从 而形成对被管网络的实时监控;在故障库存放已知的故障和故障特征;分析引擎部 分实现对故障特征的比较。 该系统的重要价值在于,在发现了以网络性能表示的故障特征后,一方面当 监控到网络性能发生变化时,可根据这些已知故障特征推断出网络故障的发生, 以实现网络故障的快速定位和恢复,从而减少业务不能正常运行的第一个症状到 确认所需要的故障修复所需要的时间。对于提高客户满意度来说,减少问题解决 时间具有极其重要的价值。另一方面,当网络发生故障时,通过故障特征提取实 现影响分析,可以确认受该故障影响的相关业务和相关客户。 9 大型v o 口网络故障特征发现及其对业务影响的分析和研究 第三章基于仿真的网络故障特征分析 基于仿真的网络故障模型分析将依赖于典型网络仿真结果与实际网络收集 性能数据的相似性,通过仿真方法得到典型网络故障的主要特征。 3 1 典型网络模型的建立 为了使仿真得到的网络故障特征更为明显,方便实验和分析,选择在网络中 部署对于网络性能要求较为苛刻的语音业务,建立v o i p 网络模型。因为其要求 较低的时延和较少的误码率,且占用较多的资源。添加相关的终端和业务设备并 配置合理的业务流量后,仿真网络将与实际应用网络更为相近。 一个典型的v o l p 8 i 网j 络结构一般包括可以提供话音服务的i p 接入子网、i p 传输骨干网或电路交换p s t n ( 公共电话交换网) 骨干网及接入网,i p 终端可以 通过网关与p s t n 互联,实现与普通电话终端的通信;同时支持对已有的p s t n 终端设备。主要v o i p 设备一般包括:呼叫代理( c a l la g e n t ) 、应用服务器 ( a p p l i c a t i o ns e 南e r ) 、边界路由器( e d g er o u t e r ) 、信令网关( s i g n a l i n gg a t e w a y ) 、 接入汇集器( a c c e s sc o n c e n t r a t o r ) 、用户端设备等。 呼叫代理是v o i p 网络中的主要设备,负责通话前逻辑连接的建立与控制, 并维护每一通通话的连接状态。呼叫代理通过其上运行的信令协议来交换有关设 备与连接的控制信息,目前主要的信令协议有s i p ,h 3 2 3 。其它增值业务如语 音信箱,电话会议等则由应用服务器来提供。应用服务器为每一增值业务提供业 务逻辑与应用支持,增值业务将不能支持的业务转向应用服务器。边界路由器负 责在各个口网络之间,包括用户网络与供应商网络之间,不同的供应商网络之 间,以及供应商的不同子网之间的路由与基于策略的连接控制。信令网关是v o i p 网络与p s t h 连接的接口设备之一,负责在呼叫代理的信令协议与p s t n 的s s 7 信令协议之间进行转换,以保证口网与p s t n 网的兼容。另外,信令网关还 可以完成不同包交换网络之间必要的信令转换。接入汇集器是业务供应商的v o i p 网络边界设备,负责对用户端的网关或路由器设备提供接入。用户端设备主要包 括边界路由器以及负责进行用户汇集和连接转换的用户网关( s u b s c r i b e r g a t e w a y ) 等。由于应用协议和网络规模的不同,以上设备可能不会使用到,或 者嵌入到路由器、交换机等已有网络设备中。 在仿真模型设计中,根据具体网络应用环境的不同,上述设备有不同的表现 形式,也可能被合并使用或直接忽略使用。比如仿真网络中,呼叫代理和应用服 务器结合使用;在只运行端到端通话业务的网络中,省略媒介服务器;路由器中 内置带宽管理、网关、防火墙等功能:使用专用i p 电话或计算机终端时不需要 1 0 - , 大型v o i p 网络故障特征发现及其对业务影响的分析和研究 接入网关;接入汇集器可以是i pp b x ( 用户级交换机) 、p b x 、接入交换机、 d s l a m ( 数字用户线路接入复用器) 、接入控制器( a c ) 等,用户终端也可以是 电话、手机、计算机、p d a 等等 3 2o p n e t 建模与仿真 本项目中采用的网络仿真工具为o p n e t l 4 5 。运行的硬件环境为c p u : p e n t i u m ( r ) 43 o g ,内存1 5 g :运行的软件环境为操作系统w i n d o w sx p 。 o p n e t 的m o d e l e r 是专门用于可视化原型设计和仿真的软件 9 1 0 1 ,方便 网络建模,减少了编程工作量,提供多种编辑器帮助用户完成网络建模和仿真运 行。包括:网络编辑器、节点编辑器、进程编辑器、包格式编辑器、探针编辑器 等。 一般仿真过程包括配置网络拓扑、配置业务、收集结果统计量、运行仿真、 调试模块再次仿真、发布结果和拓扑报告【1 1 】。 根据实际的需要,第四章和第五章分别建立不同类型的网络拓扑,对于每种 拓扑结构,进行o p n e t 建模。在建模时考虑对具体的模型库中的设备根据实际 需要进行修改,必要时构造模型库中不存在的设备。 在运行仿真过程中,按照要求,可能需要充分改变模型库中的设备和仿真时 所用的参数,模拟不同的故障条件,收集一般较为常见的仿真网络性能指标( 如 表3 1 所示) ,并对结果进行比对和分析。这些指标包括从s i p 服务器和客户端 获得的业务性能和从路由器及链路获得的网络层设备性能。 表3 - 1 仿真收集的网络性能指标 网络设备名称 相关性能参数 s i p 服务器s i p

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论