(计算机软件与理论专业论文)不确定性网络故障管理.pdf_第1页
(计算机软件与理论专业论文)不确定性网络故障管理.pdf_第2页
(计算机软件与理论专业论文)不确定性网络故障管理.pdf_第3页
(计算机软件与理论专业论文)不确定性网络故障管理.pdf_第4页
(计算机软件与理论专业论文)不确定性网络故障管理.pdf_第5页
已阅读5页,还剩141页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 不确定性网络故障管理 摘要 随着网络系统的规模扩大,网络的异构性、应用的广泛性和复杂性,以及网络 服务等方面的增长,网络系统的有效管理变得越来越重要,也越来越困难。就网络 系统的故障管理功能而言,管理者不得不面对不稳定的、不确定的和不完整的管理 信息。单个硬件故障或软件故障或不同系统组件的不同故障的组合都可能导致网络 其它组件( 有时是远程) 的服务退化,甚至会由于管理对象间的功能或结构依赖关 系引起整个网络系统的崩溃。同时,动态变化在复杂的网络系统中是不可避免的。 这种情形给网络系统故障管理带来更大的挑战。因此,需要有效的故障检测机制来 支持网络系统管理的快速决策及网络系统复杂环境中的故障管理的自动化。 目前,现有的故障诊断技术和商用的网络管理软件在面临网络系统中不确定和 不完整的管理信息,以及动态变化时还不能提供有效解决方案来进行故障管理。针 对以上问题,本文主要研究网络管理系统中的不确定性故障管理。其创新性研究成 果土要有以下几方面: 1 对网络管理的历史和发展现状进行综述与分析,特别是对现有的网络故障管理 中的故障定位和诊断进行了深入的分析。为解决网络管理中的不确定和不完全 信息,引入贝叶斯网络来解决网络故障定位和渗断,并且提出了如何在真实网 络管理系统中构建贝叶斯网络模型。 2 提出了基于贝叶斯网络模型的不确定性的逆向推理算法( s d r 算法) ,以计算 在故障证据和故障原因之间的最强依赖路径。本研究运用贝叶斯网络将管理对 象问的依赖关系模型化,从而提供有效的方法来定位由不确息| 生管理信息引起 的故障源。最强依赖路径的获取使管理者能从故障症状追溯到可能的故障源, 并且能提供潜在故障n n 的序列,这样有助于首先检修最可能的故障原因,从 而提高网络故障诊断和恢复的效率。 3 提出了不确定动态网络系统中的故障预测方法。通过把时间因素引入到标准贝 叶斯网络里来,可以研究系统退化或系统改善过程中不可避免的动态变化。网 一t 一 上海交通大学博士学位论文 络系统管理运用动态贝叶斯网络来引入时间维,把管理组件的动态变化和它们 间依赖关系的更新模型化。 4 提出了针对故障管理的贝叶斯网络及动态贝叶斯网络仿真设计及仿真过程的实 施细节和实验结果,用以评估网络故障管理的逆向推理技术及预测措施。该仿 真模型可以用于一般意义上的贝叶斯网络仿真和模拟。 关键词:网络故障管理,贝叶斯网络,逆向推理,故障预测 一i i 英文摘要 p r o b a 8 l l l s t l cn e t 焖穴k 飘u 臻a n a g e e n t a b s t r a c t w i t ht h eg r o w t ho f d i s t r i b u t e ds y s t e m si ns i z e ,h e t e r o g e n e i t y , p e r v a s i v e n e s s ,a n dc o r n p l e x i t yo f a p p l i c a t i o n sa n dn e t w o r ks e r v i c e s ,t h ee f f e c t i v em a n a g e m e n ti nd i s t r i b u t e ds y s t e m s b e c o m e sm o r ei m p o r t a n ta n dm o r ed i f f i c u l t m a n a g e r sh a v et ol i v ew i t hu n s t a b l e ,u n c e r t a i n a n di n c o m p l e t em a n a g e m e n ti n f o r m a t i o n i n d i v i d u a lh a r d w a r ed e f e c t so rs o f t w a r ee r r o r so r c o m b i n a t i o n so f s u c hd e f e c t sa n de r r o r si nd i f f e r e n ts y s t e mc o m p o n e n t sm a yc a u s et h e d e g r a - d a t i o no f s e r v i c e so f o t h e r ( r e m o t e ) c o m p o n e n t si nt h en e t w o r ko re v e nt h e i rc o m p l e t ef a i l u r e d u et of u n c t i o n a ld e p e n d e n c i e sb e t w e e nm a n a g e d o b j e c t s 。m e a n w h i l e ,d y n a m i cc h a n g e sa r e u n a v o i d a b l ei nc o m p l e xd i s t r i b u t e ds y s t e m 姐1 i sb n n g sm o r ec h a l l e n g e si nf a u l tm a n a g e m e n to fd i s t r i b u t e ds y s t e m s h e n c ea ne f f e c t i v ed i s t r i b u t e df a u l td e t e c t i o nm e c h a n i s mi s n e e d e dt os u p p o r tr a p i dd e c i s i o nm a k i n gi nd i s t r i b u t e ds y s t e m sm a n a g e m e n ta n da l l o wf o r p a r t i a la u t o m a t i o no f f a u l tc o r r e c t i o ni nc o m p l e xe n v i r o n m e n t so f d i s t r i b u t e ds y s t e m s c u r r e n t l y , a v a i l a b l et e c h n i q u e si nf a u l td e t e c t i o na n dc o m m e r c i a l sm a n a g e m e n ts o f t - w a r ea r eu n a b l et op r o v i d ee f f e c t i v es o l u t i o n sf o rf a u l td e t e c t i o ni nf a c eo ft h eu n c e r t a i na n d i n c o m p l e t em a n a g e m e n ti n f o r m a t i o na n dd y n a m i cc h a n g e si nd i s t r i b u t e ds y s t e m s 。 t h em a j o rc o n t r i b u t i o n so ft h i st h e s i sa r e : t h et h e s i sp r o v i d e sad e t a i l e da n a l y s i so ft h e ”s t a t eo ft h ea r t i nt h em a n a g e m e n to f d i s t r i b u t e ds y s t e m sa n dt h ef a u l tm a n a g e m e n t t or e s o l v et h eu n c e r t a i na n di n c o m - p l e t em a n a g e m e n ti n f o r m a t i o ni nd i s t r i b u t e ds y s t e m s ,b a y e s i a nn e t w o r k sa r ea p p l i e d t of a u l tm a n a g e m e n ti nd i s t r i b u t e ds y s t e m st h et h e s i si n v e s t i g a t e st h ep m b a b i l i s t i c c h a r a c t e r i s t i c si nt h ef a u l tm a n a g e m e n to f d i s t r i b u t e ds y s t e m sa n db a y e s i a nn e t w o r k s c o n s t r u c t i o nf o rf a u l tm a n a g e m e n t 2 ,i nt h i st h e s i sb a y e s i a nn e t w o r k sa r ea p p l i e dt om o d e ld e p e n d e n c i e sa m o n gm a n a g e d o b j e c t sa n dt op r o v i d ee f f i c i e n tm e t h o d st ol o c a t et h er o o tc a u s e so ff a i l u r es i t u a t i o n s a r i s i n gf r o mi n a c c u r a t em a n a g e m e n ti n f o r m a t i o n as t r o n g e s td e p e n d e n c er o u t e ( s o r ) a l g o r i t h m f o r b a c k w a r d i n f e r e n c e i s o f f e r e d o n t h eb a s i so f b a y e s i a nn e t w o r k s , t h es d ra l g o r i t h mw i l la l l o wm a n a g e r st ot r a c et h es t r o n g e s td e p e n d e n c yr o u t ef r o m e f f e c t sa n d t o i d e n t i f y t h es e q u e n c e o f p o s s i b l e c a u s e s ,s o t h a t t h e m o s t p r o b a b l e c a u s e s a r ei n v e s t i g a t e df i r s t l y 一f 娃 上海交通大学博士学位论文 3 t h eu n a v o i d a b l ed y n a m i cc h a n g e sf r o mt h es y s t e md e g e n e r a t i o no ri m p r o v e m e n ta r e i n v e s t i g a t e db yi m p o r t i n gt h et e m p o r a lf a c t o rt os t a n d a r db a y e s i a nn e t w o r k s d y n a m i c b a y e s i a nn e t w o r k s ( d b n s ) i sa p p l i e di nd i s t r i b u t e ds y s t e m sm a n a g e m e n ti no r d e rt o a d d r e s st h et i m ed i m e n s i o nf a c t o r sa n dt om o d e lt h ed y n a m i cc h a n g e so fm a n a g e d e n t i t i e sa n dt h ed e p e n d e n c i e sb e t w e e nt h e m f u r t h e r m o r e ,t h ep r e d i c t i o nc a p a b i l i t i e s a r ei n v e s t i g a t e db ym e a n so f t h er e l e v a n ti n f e r e n c et e c h n i q u e sw h e nt h ei m p r e c i s ea n d d y n a m i cm a n a g e m e n ti n f o r m a t i o no c c u r si nt h ed i s t r i b u t e ds y s t e m 4 i m p l e m e n t a t i o nd e t a i l so f t h es i m u l a t i o ni nb a y e s i a nn e t w o r k sa n dd y n a m i cb a y e s i a n n e t w o r k sa r ep r o v i d e df o rt h em e a s u r e m e n to fb a c k w a r di n f e r e n c ea n dp r e d i c t i o n s t r a t e g i e si nd i s t r i b u t e df a u l tm a n a g e m e n t t h es i m u l a t i o nm o d e l c a nb eu s e di ng e n e r a ls i m a t i o nf o r t h es i m u l a t i o na n dt e s ti nb a y e s i a nn e t w o r k s k e yw o r d s :n e t w o r kf a u l tm a n a g e m e n t ,b a y e s i a nn e t w o r k s ,b a c k w a r di n f e r e n c e , f a u l tp r e d i c t i o n 上海交通大学博士学位论文 插图 2 1 故障管理技术的分类 2 2 专家系统功能图+ 。,。 2 3 因采嘲, 2 4 一个贝叶斯f 5 4 络示例, 3 1 贝叶斯网络的基本模烈 3 2 一个贝时簸网络中蛉因暴关系 3 3 序列涟接, 3 4 分叉遴接。+ 。+ 3 5 会聚连接+ , 4 一个数障簧攒模型。, 4 2 哈根大学校园网络示例 4 3 与图4 2 相对藏躲贝时颠暇络模型 4 4贝叶斯网络逆向推理基本模裂 4 ,5 s d r 冀法证明, 5 1 时间序列的趋势,周期及不规则变化 5 2 蘸态爨时蘩燧终模囊。, 5 3 动态贝叶斯网络逆向推理的錾本模型 6 1具有2 2 个节淼豹受盱焱疆络的仿真筷黧,。 6 2 以t 为根的修翦树。 , 6 3圈6 ,2 中运瑶s d r 算法螽,爨,淹禳静生残橱。 6 4 以矿为根的修剪树。, 6 ,s在蚕6 4 幸运鬻s d r 算法轰,潋汐受鬏熬生或褥。, 6 6 以v 为根的修剪树, 6 7 銎6 6 中运曩s 转r 算法,戳y 梵援戆生成薅,。,。 6 8 在图6 1 中运用s d r 算法,以r ,u 和y 为根的擞成树 6 9 对f 粒原因节患鲍检溅。+ ,。+ ,+ ,。 6 1 0 对 ,的原因节点的检测 6 1 l 对y 的原因节点斡检测,。,。 一v i i i 一 挎孔筋 ”跖 鼹弛 鞋拍钉祁钌 “繇 龊跸弱跖裙窨g髂如虬蛇蛇 插黼 6 ,1 2 对掣,u 秘y 的艨溺节点斡捡溯,。+ 、,。、。、9 3 6 1 3 燕叶斯网络( 阐6 1 ) 中节点矧扮渤态变化+ ,9 4 6 ,t 4 贝时额嬲络( 溪s + 1 ) 孛苇点廖瓣麓态变化、。,。、,9 5 6 i 5 簌强6 - 3 中,黻为结栗节点,s d 疑算法帮绫诗数据嚣魄较,。粥 6 1 6 农图6 5 中,趴u 为结果节点,s d r 算法和统计数据的比较9 7 6 1 7 在圈6 7 中,戳矿为结果节点,s d r 算法积绽计数糖静 & 较,。,。,9 7 6 + 1 8 蕊强6 8 巾+ 浚t 。u 察矿蠢络鬃繁点,s 蛰袋簸法懿缝诗数攥翡毙较。+ 9 8 6 1 9s d r 算法翻统计黢据静斟髓魄较,+ 。+ ,$ 9 6 2 0 总节点数改变时s d r 算法结聚和统计结果的m s e i = l 较。,1 0 0 6 。2 l 萋绫果节点数发燮致交翳,s d r 箨法结聚敷绫诗数蕹翡m s e l 较。1 0 1 6 2 2 当原因节点数发懋改变辨,s d r 葬法缩巢私统计数据静m s e 毙较,1 0 2 一i x 上海交通大学博士学位论文 表格 4 1 灵哮耢网络躲遂蠢攘理演冀。,。 5 1 贝校园网终横型( 豳4 。3 ) 巾鳆缝转d 戆敬障率数据集 6 1 6 2 6 ,3 6 4 6 。5 6 6 s d r 检澳i 率和随机或穷举梭测率的比较。 s d r 算法逆向推理结果和统计数据的结果比较 s d r 算法结果秘统诗结果戆m s e 魄较,。, 总节点数发生改变时。s d r 算法结果和统计数据的m s e 比较 绪粱节焘鼗发生改交辩,s d 蹲滚结果帮统诗数据静m s e 魄较 原因节点数发生改变时,s d r 舅 法结果和统计数据的m s e l b 较 x 一 簿 强 舛鳄班吆 上海交通大学学位论文答辩决议书 一:= 二= 一= = := ;= = = = = = = = := = = = = = 二= = = = = = = = = 二二= = 二= = = = = _ _ = = = = = = = = = 二= = = = 二= = 二= = = = 二:= 二= = = = = 二二 申请者i 丁建国 所在学科( 专业) 计算机软件与理论 论文题目 不确定佳回络故障管理 答辩日期l2 0 0 5 一0 8 苜 答辩地点 净趴9 5 嚣擎通大学薪 评语和决议: 论文主要针对不确定和动态网络系统中的故障管理问题进行研究,选题具有理论意义和实 用价值。论文的创新性研究成果有以下几方面: 第一、提出引用贝叶斯网络来解决不完整管理信息情况下的网络故障定位和诊断,并且给 出了在真实网络管理系统中如何构建贝叶斯网络模型。 第二、提出了基于贝叶斯网络模型的不确定性的逆向推理算法( s d r 算法j ,以计算在故 障证据和故障原因之间的最强依赖路径。运用贝叶斯网络烙管理对象闻的依赖关系模型化, 从而提供有效的方法来定位由不确定性管理信息引起的故障源,可方便地检修最可能的故障 原因。 第三、提出了不确定动态网络系统中的故障预测方法。通过把时间田素引入到标准贝1 1 斯 网络中来研究系统退化或系统改善过程中不可避免的动态变化。网络系统管理运j ;= | j 动态贝n 1 斯网络来引入时间维,有利于建立管理组件的动态变化及其干| 它们间依赖关系的数学模犁。 此外,针对网络故障管理系统,实现了基丁贝时嘶网络及动态贝h f - 斯网络的仿真,并给出 r 实验结果,f ! ;j 以评估网络故障管理的逆向推理技术及预测措施。 论文结构合理,条理清晰,行文流畅,论证严谨,反映作者具有坚实宽r 的理论基础年j i 系 统深入的专业知识,独立科研j :作能力强。 表决结果: 答辩过程中讲述清晰,回答问题正确。经答辩委员会无记名投票,一致同意通过 建国同: 学的博十学位论文答辩,建议授予其工学博士学位。 于,南f 答辩委员会主席舀笔辨( 签名) ,锻广年月三r 目 上海交通大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工 作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何他个人或集体 已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在 文中以明确方式标明。本文完全意识到本声明的法律结果由本人承担。 学位论 日期 上海交通大学学位论文版权使用授权书 本学位论文作者完全了解上海交通大学有关保留、使用学位论文的规定,同意 学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和 借阅。本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库 进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 ( 保密的论文在解密后应遵守此规定) 言纂? 文赠一 日期:础年乒月上确日孵年衫房乒曰 第一章绪论 第一章绪论 随着网络系统的迅猛发展,网络规模的增大,网络不断扩充的异构性,复 杂应用和网络服务的增加以及无所不在的网络计算,有效的网络管理系统变得 尤为重要,管理难度也大为增加。网络系统中,由于网络系统组件问的相互依 赖性,一个网络组件的硬件故障或一个软件错误会导致网络系统中其他组件的 功能和服务性能的降低。因此一个有效的网络故障管理机制应该能够在系统管 理中实行快速决策并最终实现管理的自动化。 虽然o p e ns y s t e mi n t e r c o n n e c t ( o s l ) 管理标准为异构开放系统的故障管理提 供了一个框架,但o s i 没有给故障检测和诊断提供具体的方法描述。为了填 补这个空白近十多年来很多研究者在网络故障管理的领域作出大量有价值 的研究,并有效地提高了网络的故障管理效能。基于规则( r u l e b a s e d ) 的专 家系统是主要用来解决故障检测中的警报相关性的重要方法 f g t 9 1 h s 9 1 j k m + 8 9 。这种方法比较适合于相对稳定的系统环境,故障问题比较确定情况 下的故障管理。有限状态机( f i n i t es t a t em a c h i n e s :f s m s ) 方法常被用来模 型化故障的传播和延续行为 b h s 9 2 r h 9 5 c y l 0 1 w s 9 3 。基于案例的推理 ( c a s e b a s e dr e a s o n i n g ) l e w 9 3 年h 基于代码( c o d i n g b a s e d ) 的方法为故障识 别和故障隔离提供了潜在的解决办法 y k m 十9 6 l c l 0 0 。k g t k e r * l l g e i h s 提出 的模式穿越技术( m o d e lt r a v e r s i n gt e c h n i q u e s ) 为分布式系统中的故障隔离提 供了有效的方法 k g 9 7 。 但大多的解决方案是基于确定性的机制并且对系统“噪音”( 如信息丢 失,信息延滞) 异常敏感。也就是说,现有的方案不能很好地处理网络管理中 的不完全,不确定的管理信息。因此不确定性推理是另一个用来解决网络管理 中故障检测的一个有效办法 d l w 9 3 【h j 9 7 b s s 0 1 【d k b + 0 4 a 。 从应用角度来说,目前大多数的商用的网络管理软件,比如i b m t i v o l i ,h po p e n v i e w ,s u ns u n n e tm a n a g e r ,n o v e l ln m s 及c i s c o 系列网络管 理软件它们均能在网络管理中发挥效能,特别是在集成不同的管理域,收集 网络管理信息,进行网络远程监控及管理信息统计方面效能明显。然而,这些 软件仍然在故障的准确定位、故障管理的自动检测和恢复上有缺陷。网络管理 的经验告诉我们,通常情况下准确的故障识别和定位准确度为9 5 ,其余的5 上海交通大学博学位论文 的故障不能由现有的办法检测出来 h i l 0 1 。因此在具有数千网络组件的大规模 网络系统中去寻找未识别的故障源是相当耗时耗资的,有时甚至还会中断重要 的网络服务来实施地毯式搜索。 由于网络系统的复杂性,不是总能给出确定而准确的故障管理办法。有时 因为网络自身连接故障,一些故障管理信息不能及时获取,或者丢失;有时因 为暂时的故障而导致一系列相关的警报。所以一个比较理想的故障管理系统应 该能够在信息不确定、信息不完全和信息冗余时也能有效地执行故障诊断和管 理任务。 在网络系统中,由于故障信息的不确定和不完全,就很难获取完全和确定 的管理信息。此外由于被管网络组件间的复杂依赖关系及故障和警报间的因果 关系,使得完全准确理解网络内部运行机理变得相当困难。 在日常的网络管理中,专业技术人员和专家的知识在网络管理中起着相当 重要的作用。一般来说专家知识的表达也不是以准确的方式来表达的,比如, “很高”,“正常”,“有时”之类。当专家知识被集成到网络管理系统中 他们的知识也必须以不确定性的量化方式来表达。 在现实的网络系统中,由于系统性的提高或退化而导致的系统不可避免的 变化是网络管理系统必须考虑的另一重要因素。如何理解并获得这种变化趋势 对故障管理来说也非常重要。 本论文着重研究拥有不确定和不完全的管理信息的非稳态网络系统的不确 定性故障管理以及网络的动态变化及其预测机制。 1 1 论文研究目标 本论文引入贝叶斯网络来模型化网络系统中的被管对象间的相互信赖关 系,并提出有效的故障定位办法来解决不确定和不完全管理信息,以最终实现 日常管理中部分自动化网络管理。 贝叶斯网络是模拟不确定知识的有效方法,并能用以表示网络管理系统中 的关键网络组件间的因果依赖关系。贝叶斯网络模型还能在不确定的情景中对 将来潜在的故障进行预测并为管理任务提供相关的决策机制。 在网络管理中,一个通常的操作就是根据网络故障的症状( 证据) 来推测 故障的源头( 原因) 。因此逆向推理技术( 由结果到原因) 是实现网络系统自 第一章绪论 我管理的一个基本步骤。本文提出了在不确定网络背豢中基于贝叶斯网络的由 结栗到原因戆逆趣推理簿法,跌舞决网络管理中的故辕定位和诊断。 在不断扩展的网络系统中,网络的结构、拓朴和组件间的依赖必系在不断 交纯更薪之孛,瓣络警瑾系绕必须逡应这稽持续缒交纯并麓农秘态变纯熬耀络 系统中提供适当的解决方案以助于实现健康的网络管璁系统。在基于贝叶斯网 络的阿络管理模型中,各组件闻依赖关系的时交特性必须在考虑之硪。但标准 的贝时裁穗终撰型没蠢直接提供表示蔹赖关系豹漪态交他规划 a c 9 6 】【y s 9 6 1 。 本论文迸一步引入动态贝叶斯网络( d y n a m i cb a y e s i a nn e t w o r k s :d b n ) 来刻 西潮络系统中缀件闺依羰关系浆对洚交琵特征,并遴一步磅究动态瓣络系绞中 的嫩障推理与预测方法。论文使用阐归分析理论 w g 9 4 来分析并获取网络系 统中单个组件的变化趋势以及组件阉依赖关系的变亿麓势,落为动态不确定网 络系统的赦障警理提供切实可行的办法。 1 2 论文主要贡献 本文主要研究网络管理巾的不确定性敞障管理。提出了谯网络管理中存在 不确定帮不完全管理信患时魏俺进行青效辩敌障管理的策略。雨时氇对霹络系 统的动态变化特性作了深入的研究,并给出了动态系统的预测和推理方法。 1 对网络管理的历史和发展现状进行综述与分析,特别是对现有的网络故障 管理中的放障定位和诊断迸行了深入的分轿。 2 为黪决嬲终管理中熬不确定黧不完全信息,弓 入贝时凝嬲终来瓣决网络数 障定位和诊断,并且深入探讨了如何在真实网络管理系统中构建贝叶斯网 络横鳌。 3 提出约修剪算法( p r u n i n ga l g o r i t h m ) 运周于贝时斯网络,以结果( 证 据) 节点为起点剪除不相关的节点和链路。在大规模的贝叶斯网络中,修 赘搽佟酶缭栗楚袋或一个烫蛰戆子溺,这蕊劲予剿除冗余信息,健缮进一 步的推理工作更为简化。 4 为了进行有效的故障源定位,本文提出了一个最强依赖路径算法 ( s t r o n g e s td e p e n d e n c er o u t e :s d r ) 班避雩亍盘结果( 诞撰) 到原因( 故 障源) 的逆向推理。s d r 算法使网络管理者能够根据最强依赖路径遗溯故 障静源头。并虽簿法结果产生个候选故瓣漂枣麴,霞得网终管理鬻在薮 上海交通大学博士学位论文 障检测时,最有可能的故障源能被最先检测到。这就大大提高了故障的检 测率。论文也提供了严格的算法证明。 5 对网络系统中的动态特性进行了深入的分析,并且引入了动态贝叶斯网络 来弥补传统贝叶斯网络模型中缺少的时间维,使得进一步研究动态网络系 统的管理成为可能。 6 给出了基于动态贝叶斯网络的故障预测策略,能够对网络系统组件的动态 变化趋势及其依赖关系的变化趋势进行预测,并提供潜在故障的预警。 7 建立了一个针对网络故障管理的贝叶斯网络仿真模型,以及仿真方法的设 计和实现,以验证所提出的网络故障推理及预测机制的有效性和实际效 率。 1 3 论文总览 论文结构及基本内容如下: 第一章对所研究的领域及其相关问题作了简要的介绍,并给出全文的内容 概要。 第二章对网络管理及故障管理进行了详尽的综述,并对当前故障管理所面 临的挑战进行了深入探讨,由此引出本文的研究主题。 第三章针对不确定性推理,对本文所引用的概率论及贝叶斯网络的相关背 景知识作了描述。 第四章提出了基于贝叶斯网络的逆向推理及其算法。所提出的s d r 算法是 用来解决在不确定网络环境中进行故障定位和诊断。这一逆向推理机制能有效 地提高网络的不确定性故障管理。同时也给出了相关的理论证明。 第五章深入探讨了网络管理系统中的动态特征并引入进动态贝叶斯网络来 分析系统变化的时序特性,并给出了相应的预测机制,这对于前瞻性的故障管 理很有帮助。 第六章建立了针对故障管理的贝叶斯网络的仿真模型及仿真程序,并提供 了详细的仿真建立过程及仿真验证结果分析。 第七章对全文进行了总结,并提出了开放的研究问题及将来进一步的研究 方向。 附录部分包含了部分的仿真程序代码及部分仿真数据结构。 d 第= 章捌络故障管理 第二耄网络故障管理 溺络管理有五个功能域:敞障篱理,性能管理,安全管理,记帐管理及配 置管理。故障管理是网络管理中非常重要的一个部分。敌障管理包括一系列漪 管理功能:对历监管熬网终进行救障梭测,隔离和故障修复 a n s 9 4 1 。 由于不断增齑的应用需求,现今两络的规模稻菱杂性都太大地增船了,新 的网络服务| 和应用也不断集成到现有的网络中。网络越来越成为人们生活不可 分割静一部分。困噩笔,糯应的瓣络系统需要有离效可靠躬管理系统来维持运 营。有效的故障管理楚维持可靠网络运行的一个关键因素。 2 1 网络管理的现状及综述 十多年前,传统的i i 上代理管理为中心的管理架构占主爵遗位。o s i 参考模 型,篱单鄹终管理协议( s i m p l e n e t w o r k m a n a g e m e n t p r o t o c o l :s n m p ) ,通信 管理网络框檠( t e l e c o m m u n i c a t i o n sm a n a g e m e n tn e t w o r k :t m n ) 都悬典型的 代表 h a n 9 9 。不断增加的网络规模,复杂性及网络服务使得这楚管理架构不 能充分黉亟满足王觅在的潮络管理需要。【m a r 9 9 对网络管理静趋势进行了较为详尽 的讨论。 另一方霹,在l t 工业界,不断增加的网络维护费用跟不断增加的网终计算 授术相关。传统的手工操作的网络管逢技术有时甚至楚破坏两络系统 爵不是改 进网终系统。由于网络系统的不断异构化,复杂化,持续增加的网络控制以维 护健康的网络系绞实际上茨两弱他了系统黪性熊 s t u 0 3 。辨以网络管理系统应 该向自我管理( s e l f - m a n a g i n g ) 的方向发展。 2 。1 网终管理的黩蛎及挑战 h e g e r i n g h a n 9 9 】定义网络管理为:所有确傈有效利用网络资源并进行两 络操作兹活璐。力达到阚络管理款旦灼,网络管理系统应该能有效地控制网络 资源,协湄陌络服务,隘税网络状态并对掰络的非芷常状态提出报告帮警报。 网络管理系统的曩标跫: 隧络的资源和服务管溪:包括控剑、监视、更毅、网络状态报告及网络 服务。 上海交通大学博士学位论文 - 简化网络管理:能够将网络系统的管理信息转化为管理者可以理解和管 理的形式,同时网络管理系统应该能够将管理者的高层的管理目标转化为 网络管理系统中的具体功能。 可靠性服务:为网络提供高效的服务质量,尽量减少网络故障。并能及时 检测和恢复网络故障。同时也要为网络提供很好的安全保护,免受安全攻 击。 - 资源使用记录:网络管理系统应该能够追踪网络用户对网络资源使用和 完整记录网络服务,并给出系统报告。 o s i 对网络管理参考模型给出了很详尽的定义,并对网络管理架构提出了 设计上的指导 h a n 9 9 1 。o s i 管理模型从功能上将网络管理分为五大功能块: 故障管理( f a u l tm a n a g e m e n t ) :故障管理是网络管理中最基本的功能 之一。用户需要一个可靠的计算机网络。当网络中某个组件发生故障时, 网络管理系统必须迅速找到故障源并及时排除。分析网络故障的原因是网 络故障管理的核心内容。网络故障管理包括故障检测、隔离和纠正三个方 面,应具有以下典型功能: 一维护并检查错误日志 一接收跟踪检测报告并作出相应反应 一跟踪,辨认错误 一纠正错误 配置管理( c o n f i g u r a i t o nm a n a g e m e n t ) :配置管理是初始化网络,并配 置网络,使其提供用户所要求的网络服务。配置管理是一组功能包括辨 别、定义、控制和监视网络组件,目的是为了实现某个特定功能或使网络 性能达到最优。配置管理还包括创建和删除网络管理对象。配置管理的任 务包括: 一设置开放系统中有关路由操作的参数 一被管对象和被管对象组名字的管理 一初始化或关闭被管对象 一根据要求收集系统当前状态的有关信息 第二章网络故障管理 一获敬系统重要变化的储息 一更改系统配爨 性能管理( p e r f o r m a n c em a n a g e m e n t ) :性能管理的主要任务悬估计系 统资源的运行状况、通信效率和系统性能,其能力包括监视和分析被管网 络及其所提供服务。,陡能分析的绪暴可能会触发菜个诊断测试过程或羹新 配置两络鞋维护阙络的性麓。毂髓管理收集分辑袁关被管耀络当藩状态兹 数据绩愚,势维持移分提矬能蜀悫。一些典型的功能包括: 牧嶷绞诗落患 维护著检查蓉统状态黩志 一确定自然和人工状态下系统灼性能 一改变系统操作模式以避行系统性能管理的操作 计帐管理( a c c o u n t i n gm a n a g e m e n t ) :计费管理记录网络资源的使用, 目的是控制和检测网络操作的费用和代价。它对一擅公共网络尤为重要。 它可以信算瞄用户使用网络资源可熊需要付出的费用和代价,以及己缀使 丽的两络资源。黼络管理爨还可敬裁定焉户爵戳使耀静最大费丽,获舔限 嚣l 雳户过多占曩瓣终炎添,这瞧从贯一个方嚣提裹耀终的效攀。 安全管理( s e c u r i t ym a n a g e m e n t ) :安全蚀壹是嘲终的薄弱环节之 一,而网络的安全性又是用户最注熏的性能之一,网络安全管理融经网益 成为网络管理的重点。网络中主要裔以下几大安全问题:网络数据的私有 性( 保护丽络数据不被侵入者非法获得) ,授权( a u t h e n t i c a t i o n ( 防出 侵入者在霹络土发送错误僖惠) ,访| 、蠢控露l ( 控铡瓣网络资源兹谚翊) 。 翅应越嬲终安全管理应包括对授龊机制、访阕控制、加密和加密嫩钥的管 理,另外还要维护和检查安全曰志。 近年来,两络管理架构开始转商黻露离服务为中心。所良良上提溺静黼络 管蓬嚣标及o s i 管理模型翳须要逶斑这释耨静霈求:鼹务鉴粼,鼹务建徽及服 务灵活多样他。 将来的网络篱理架构浆会极大地改变现有网络管理的方式并为网络管理提 出新的挑战。 上海交通大学博士学位论文 首先,网络规模的逐渐扩大,需要有可扩展的管理方式来维护大量的网络 设备和网络组件。因此管理者的目标会从底层的细节管理渐渐走向更抽象的高 层,并且要在管理任务和管理目标之间提供比较有效的相互协调和解释机制, 以更好地提供管理决策。 第二,网络系统中各种不同设备,系统软件,及异构性网络的并存,要求 网络管理能提供很好的无缝集成,提供统一的服务接口,向用户隐藏系统和技 术上的异构性。 第三,由于网络系统成为另一个经济竞争的领域,网络管理系统必须能够 实现自我规划,自我管理,以获取最大的经济效益。同时,在大规模的网络系 统中,包括i n t e r n e t 在内的网络应用和服务,小巧而灵活的管理方案越来越显出 优势。 最后,网络设备的功能和计算处理能力越来越强,网络管理系统需要更好 地维护和增加设备层的管理。 2 1 2 网络管理中的相关研究 传统的基于代理的网络管理,比如基于s n m p 的管理,代理方越小越好, 只要能进行简单的设备状态的报告和更新即可,主要的管理负担在管理者一 方。九十年代早期,研究者发现这种方式越来越不适应不断扩展的网络系统及 网络应用,所以必须对传统的网络管理架构作重新思考。 s n m p v 2 是改进了的网络管理协议。s n m p v 2 是基于1 9 9 2 年出版的r f c ( r e q u e s tf o r c o m m e n t s ) 1 4 4 1 1 4 5 2 。s n m p v 2 弓i 入了中介代理的概念。在管理 者和代理之间,信息传递是借助中介代理完成的,管理者和代理之间不进行直 接的数据交换。这样中介代理可以适当承担管理者部分的数据处理功能,而且 在没有管理者干预的情况下进行部分的管理操作,比如周期性的从代理中获取 系统状态信息等。 1 9 9 5 年,互联网工程任务组( i n t e r n e te n g i n e e r i n gt a s kf o r c e :i e t f ) 提出 了远程监视( r e m o t em o n i t o r i n g :r m o n ) 的概念 w a l 9 5 。r m o n 在网络设 备中或是独立设备中提供探测功能。探测的任务是对本地的网络流量及网络异 常情况进行检测并报警。通过对警报的类型和门限的设置,管理者可以将部分 的管理任务( 比如数据收集,事件过滤及决策) 下载到探测器中。而且探测器 在向管理者提交最终报告之前,可以进行相关的预处理。 一r 一 第二章网络敌障管理 般来说,早期的嘲络管理系统是弱分布性。管理任务主要集中予管理者 一方,一些初步的管理工作,比如攀件过滤,提示及数据预处理可以通过中介 篱理组 孛完成,但总体的网络管理系统缺少自铐理机制,因此网络管理系统本 身的负荷相当大。 2 13 用于网络警瑾白哿技术 以下是一些可能用于网络管理的一些技术瀚描述及分析,包播它 f j 静应焉 箍围及优缺点。 1 基于策略( p o h c y b a s e d ) 的管理 基于策略的管理开始予9 0 年代初 m s 9 3 】 k g a r 9 5 。燕然基于策略的 思想最先主要用于特别的管理领域,比如安全管t ! j d m 8 9 ,但这种思想 能很自然地用于网络管理的其他领域。 在基于策略的网络管理中,策略( p o l i c i e s ) 定义为管瑾网络系统 状态和行为的一系列规则。管理系统的任务是将人的管理目标转化为 机器可以理解的语义及可操作的规则,以进行系统状态和功能的管 理这种策略和机器理解和执行之间的转换和映射机制是依赖于对网 络管理组件的配置。基于策略的网络管理模型怒大舰模的管理者一代理 模式,它包括策略决策元( p o l i c yd e c i s i o np o i n t s :p d p ) 和策略执行元 ( p o l i c ye n f o r c e m e n tp o i n t s :p e p ) i e t 9 9 】【i e t 0 0 a 。i e t f 的资源分配协 议( r e s o u r c ea l l o c a t i o np r o t o c o l :r a p ) 在基于策略的网络管理中担当重 要的角色 i e t o o b 【c d g + 0 0 。近年来一些相关的研究包括如何将商业化 的祷理规则转换为网络层的规则 c b g 0 0 以及策略冲突解决机$ 1 l s 9 9 1 。 基于策略的管理一个最重要的优势就是目够在大规模的网络管理中提 高管理目标的自动化。系统管理者和网络系统之间通过提供抽象的高层管 理策略进行交蕊。这种策略是独立于设备并且易于人机交亘的。 基于策略的网络管理能

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论