(通信与信息系统专业论文)ipv6环境下的网络故障管理.pdf_第1页
(通信与信息系统专业论文)ipv6环境下的网络故障管理.pdf_第2页
(通信与信息系统专业论文)ipv6环境下的网络故障管理.pdf_第3页
(通信与信息系统专业论文)ipv6环境下的网络故障管理.pdf_第4页
(通信与信息系统专业论文)ipv6环境下的网络故障管理.pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

(通信与信息系统专业论文)ipv6环境下的网络故障管理.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要:随着i n t e m e t 技术的迅猛发展和规模的不断扩大,庞大而复杂的网络使得 v 4 不再适合当代网络的需要,i p v 6 的提出解决了地址资源耗尽等问题,但是目 前还没有成熟的针对i p v 6 的网络管理软件,鉴于这样的背景,本文分析了可能发 生的网络故障,对i f v 6 新增的m m 与i p v 4 原有的m m 加以比较、分析和总结, 制定出快速定位的智能发现方法,从而提出了在v 6 环境下的网络故障管理。 i p v 6 环境下的网络故障管理主要包含了四个模块:故障告警模块;网络连通 性故障发现模块;接口故障发现模块:故障分析和隔离模块。其中故障告警模块 负责网络故障管理中告警信息的处理需求;网络连通性模块对网络连通状态进行 管理:接口故障发现模块对与其相关的i p v 6 m i b 节点的关联进行研究;故障分析 和隔离模块对可能发生的网络故障进行分析,从而提出了故障管理模块各功能的 实现方法。 在提出i p v 6 环境下故障管理的同时,作者利用j a v a 实现了一个i p v 6 环境下 网络故障管理的原型,并在此原型的基础上与传统网络故障管理模型进行了网络 开销的比较,从而得出了该故障管理系统在现代网络中的可行性和高效率,在现 有网络环境下具有实际意义。此外,本文还提出并实现了模拟i p v 6 协议栈的模拟 器,为创造i p v 6 环境提供了便利、真实的工具。 最后,关于进一步工作的方向进行了简要的讨论。 关键词:i p v 6 ;简单网络管理协议;管理信息库;故障管理 分类号:t 玛9 3 0 r 7 a b s t r a c t b s i r c n w i t ht h e 蛔i n go ft h ei n t e r a c tt e c h n o l o g y , t r a d i t i o n a li p v 4n e t w o r kh a sb e e n h a r d l ys a t i s f y i n gp e o p l e sd e m a n d sf o r t h em a s s i v e n e t w o r ka p p l i c a t i o n s t h e i n t r o d u c t i o no f i p v 6h a sr a i s e du sq u e s t i o n ss u c ha st h ee x h a u s t i n g 口a d d r e s s ,b u tt h e r e i sn op e r f e c tn e t w o r km a n a g e m e n ts y s t e mw h i c hc a nb eu s e do nm a n a g e m e n tw i t ht h e n e w p r o t o c 0 1 t h u st h ep a p e rn o to n l yr e s e a r c h e st h ef a u l tw h i c hm a y b eo c c u r r e da n d p u t so nah e wm e t h o dt ol o c a t et h ef a u l ti nd e t a i lt h r o u g ha n a l y z i n gt h ei p v 6m i b s r e l a t e dt ot h es p e c i f i cf a u r b u ta l s ot r i e st oi n t r o d u c eal l e wa r c h i t e c t u r ea b o u tt h ef a u l t m g e m e n t i nt h ei p v 6n e t w o r k t h en e w a r c h i t e c t u r ec o n s i s t so ff o u rm o d u l e s :a l a r m sm o d u l e ;l i n k sm o d u l e ; i n t e r f a c e sm o d u l e ;a n a l y s i sa n ds e p a r a t i n gm o d u l e ;t h ea l a r m sm o d u l ep r o p o s e sa n e x t e n s i b l er e q u e s to fa l a r m - p r o c e s s i n gi nt h ef a u l tm a n a g e m e n t t h el i n k sm o d u l ea n d i n t e r f a c e sm o d u l ei n t r o d u c et h em e t h o dt ol o c a t et h ef a u l ti nd e t a i lt h r o u g ha n a l y z i n g t h ei p v 6m i b sr e l a t e dt ot h es p e c i f i cf a u l t t h ea n a l y s i sa n d s e p a r a t i n gm o d u l ea n a l y z e s a n yk i n do ff a u l tw h i c hm a y b eo c c u r r e da n ds h o wt h ec o n s t r u c t i o no ft h ef a u l ts y s t e m a n dh o w e v e r ym o d u l ew o r k sw i t he a c ho t h e r i nt h es a m et i m e ,t h et h e s i sa c c o m p l i s h e sam o d u l eo ft h ea r c h i t e c t u r ew i t hj a v a i t f o c u s e so nt h er e s e a r c ho ft h ei m p l e m e n t a t i o nf o ras o f t w a r es y s t e mi na ni p v 6n e t w o r k m a k i n gu s eo ft h es e c u r i t yp o l i c i e so fb o t hu n i xo p e r a t i o ns y s t e m s ( s u c ha sl i n u x , s o l a r s ,f r b s d ) a n dt h ej a v av i r t u a lm a c h i n e s ,i ti ss u r et h a tt h ea r c h i t e c t u r ei s e f f e c t i v ea n dw o r k a b l et h r o u g hc o m p a r i n gt h ea c c o m p l i s h e dm o d u l ew t hc u r r e n tf a u l t m a n a g e m e n to nt h ec o s to fn e t w o r kc o m m u n i c a t i o n i na d d i t i o n ,a ni p v 6s i m u l a t o ri s i n t r o d u c e dt om a k et h en e t w o r km o r er e a l l y h o w e v e r , t h ep r o b l e m sr e q u i r i n gf u r t h e r s t u d i e sa r ed i s c u s s e d k e y w o r d s :i p v 6 ;s n m p ;m i b ;f a u l tm a n a g e m e n t c l a s s n o :t p 3 9 3 0 7 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国 家有关部门或机构送交沧文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者躲1 祷 导师签名:善 签字日期:1 年p 月们眉 签字日期:劢7 年,2 月7 z 日 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研 究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或 撰写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确的说明并表示了谢意。 学位论文作者躲1 璐 签字日期 w 7 年m 杪日 6 1 1 绪论 1 1 研究背景及意义 2 0 世纪9 0 年代以来,互联网像一匹挣脱缰绳的黑马突飞猛进。在短短6 、7 年 内全球互联网用户数突破5 亿,如今已经趋近7 亿,所以互联网无论在技术上还是 在发展速度上均获得了巨大成功,这是世人公认的一个事实。 当前,对于网络设备故障管理的研究已经非常成熟,但由于i p v 6 的高速发展, 如何处理i p v 6 环境下的设备故障,如何在i p v 6 的环境下传送故障事件已经成为不 可忽视的问题。为了开展对于i p v 4 到i p v 6 过渡问题和高效无缝互连问题的研究, 国际上己经出现了多种过渡技术和互连方案,这些技术各有特点,用于解决不同 过渡时期、不同环境的通信问题。在过渡的初期,要解决的问题可以分成两大类 第一类就是解决i p v 6 之间互相通信的问题;第二类就是解决i p v 6 与i p v 4 之间通 信的问题。针对这两类问题已经提出了很多方案,有一些已经相当成熟并形成了 r f c 。 虽然时至今日,仍然没有一家公司宣布实现了商用的i p v 6 网络管理平台或推 出商用网络管理软件。但在自由软件领域,i p v 6 协议栈已经被大面积实现,有很 多自由软件也已经进入了口v 6 网络管理的研究和开发i l 】。著名的项目组有( 如表 1 1 ) : 表1 1i p v 6 网络管理项目研究情况 t a b l e l 1 s t a t e s o f l p v 6 n e t w o r k m a n a g e m e n tr e s e a r c h 项目组名称研究成果 欧洲6 n e t 项目组 实现了s n m p 协议 n e s n m p 项目组 推出了n e t - s n m p 5 0 a d v e n t n e t n m s 项目组颁布了w e b n m s 4 7 欧洲6 n e t 项目组的设计人员在2 0 0 2 年3 月声称实现了s n m p 协议,为商业 化的 6 网络管理铺平了道路。 n e t - s n m p 项目组i 2 j 开发人员推出n e t - s n m p 5 0 之后,声称已经提供了在l v 6 上的u d p s n m p v 3 的网络管理。 a d v e n t n e tn m s 项目组【3 j 在新发布的w 曲n m s4 7 后,声称已经提供了对 i p v 6 的支持,可以提供在i p v 4 i p v 6 双栈设备和纯i p v 6 设备之间进行通信。此外 该版本还提供了网络管理系统对i p v 6 设备发送的t r a p ,状态轮询和网络性能数据 采集接受功能的实现。由于其本身的j a v a 开发语言具有跨平台的特性,在l i n u x , u n i x 上的突出表现,本文的故障管理系统在前期准备中,通过对该版本的试用, 吸取了不少值得借鉴的方法和经验,在整个系统的开发中起到了一定的作用。 本文将i p v 4 网络下的故障管理系统的架构和设计应用到了i p v 6 环境下,对于 复杂的网络环境,通过对新增m m 的分析,很好地做到了对i p v 6 网络设备数据的 选择性读取,并对设备发送的t r a p ,采集的轮询数据进行分析,有效地对发生的网 络故障进行管理。此外,针对网管系统软件开发环境的欠缺,本文设计了i p v 6 网 络设备的模拟,不仅可以模拟各种网络设备,并可以模拟大型的f l v 6 网络,为网 络故障管理软件的开发提供了坚实的基础,也为以后的研究工作提供了便利之处。 由于该功能是n g n 大型网络管理系统软件的一个子功能,应该充分考虑到对大规 模网络的支持,因此在故障管理功能设计上充分考虑到了应用于大规模网络时的 效率情况,争取做到发现故障的效率随被服务的网络规模的增大呈缓慢的线性下 降。本研究不仅具有重要的学术意义,而且也具有实用价值。 1 2i p v 6 网络管理的发展概况 现在的互联网是在i p v 4 的基础之上运行的,它已经取得了很大的成功。然而 随着网络规模的持续膨胀和新型网络需求的不断增长,目前的互联网在可扩展性、 口地址空间、安全、服务质量控制、移动性、运营管理和盈利模式等诸多方面面 临着挑战,尤其是口地址空间匮乏、可扩展性差等方面严重制约了互联网的发展, 需要探索新的技术来解决这些问题。从2 0 世纪9 0 年代初以来,国际上已经开始 讨论下一代的口协议了,经过多年的讨论,各种方案的比较权衡,下一代的口协 议( v 6 【4 】) 目前已经基本制定完成,6 通过采用1 2 8 位的地址空间【5 】替代皿v 4 的 3 2 位地址空间来扩充互联网的地址容量,使得口地址在可预见的时期内不再成为 限制网络规模的一个因素,同时在端到端( i p 连接) 、服务质量( o o s ) 、安全性 以及移动性方面有了很大的改进,使互联网能够承担更多的任务,为以p 为基础 的网络融合奠定了坚实的基础。 在国外,全球下一代互联网实验网络规模不断扩大。i n t e m e t 2 主干网a b i l e n e 正在升级到1 0 g b p s 和i p v 6 ,美国启动n u t ( 国家光纤铁路) 研究计划,欧盟下一代 学术主干网g e a n t 进展迅速,同时6 n e t 和f u m 6 立i p v 6 下一代互联网骨干网 正在形成g i r n 。国际的i p v 6 试验网6 b o n e 在1 9 9 6 年成立。现在,6 b o n e 己经 扩展到全球5 0 多个国家和地区,成为i p v 6 研究者、开发者和实践者的主要平台。 在国内,c e r n e t 国家网络中心于1 9 9 8 年6 月加入6 b o n e ,同年1 1 月成为其 骨干网成员。a 明舰以现有的网络设施和技术力量为依托,建立全国规模的i p v 6 2 试验床,为致力于向2 1 世纪网络技术的个人和团体提供全真的网络平台。用于研 究同下一代互联网有关的网络技术,特别是安全、服务质量和移动计算,开发新 型的网络应用。 我国的i p v 6 已进入实质性发展阶段,但要想i p v 6 网络顺利的大规模推广,必 需有一套稳妥、严密、渐进的i p v 4 到i p v 6 迁移策略及方案【6 j 。目前的对于通过i p v 4 连接i p v 6 孤岛的研究较多,但对于i p v 6 部署过程后两个阶段,即共存阶段和i p v 6 占主导地位时的网络部署方案研究较少。目前整合i p v 4 和i p v 6 协议之间的过渡冲 突有以下几种策略:双栈技术,s k i ,n a t - it ,d s t m ,s o c k s 6 4 ,传输层中继, b l s ,b i a 。 n a t - f f :不必修改已存在的h v 4 网就可以访问外部i p v 6 网,且通过上层协 议映射使大量的i p v 6 主机使用同一个i p v 4 地址,节约i p v 4 地址。但是属于同一 会话的请求和响应必须通过同一个n a t - p t 路由器,否则无法正确通信。 双栈技术:通信节点为双协议栈,与i p v 4 网通信使用i p v 4 协议,与i p v 6 网 互通则使用i p v 6 协议。m 4 s 提供对口v 4 “a ,、i p v 6 “a 6 a a a a 类记录的解析 库,并根据需要对返回的地址类型做出决定。 s o c k s 6 4 :移植通用软件包的基本技术主要从基于s o c k s 的1 v 4 向l l v 6 过 渡技术的三个方面入手: 1 ) 移植4 程序的方法( 使用介于i p v 4 ,i f v 6 中间的地址结构;采用条件 编译或者重新编写通用函数) 2 ) 数据结构的修改( 对a p i 中的地址表示的数据结构进行修改) 3 ) 区分i p v 4 i p v 6 专用函数( 尽量避免使用、r 4 专用函数) 现在这方面的研究重点在于如何将基于s n p 的i p v 6 网络设备故障管理和 i p v 4 向i p v 6 过渡技术相结合以及如何运用i p v 4 下的成熟软件进行移植来克服新协 议下可能出现的数据传输冲突,格式错误等。 随着网络技术的高速发展,网络管理的重要性也越来越突出,按照国际标准 化组织( i s o ) 的定义,网络管理是指规划、监督、控制网络资源的使用和网络的 各种活动,以使网络的运行达到优化合理,一般而言,网络管理有五大功能:故 障管理、配置管理、性能管理、安全管理和计费管理,传统的最具有影响力的网 络管理协议是c m i p ( c o m m o nm a n a g e m e n ti n f o r m a t i o np r o t o c 0 1 ) 和s n m p ( s i m p l e n e t w o r km a n a g e m e n tp r o t o c 0 1 ) 。这两种协议在以前和现在的网络系统建设中都发 挥了及其重要的作用。在新一代网络的特点和管理需求下,传统的优势不复存在, 探索新的管理方法、构筑新的管理体系结构、应用新的管理技术成为网络管理领 域的研究热点和迫切需要解决的任务。随之,对应新的i p 协议版本的网络管理概 念也被提出:n g i ( n e x tg e n e r a t i o ni n t e m e t ) 网络管理1 7 j 。在传统i p v 4 网络中通 过基于s n m p 的网络管理工作站实现的网络故障监控、性能管理和部分配置管理 功能,随着过渡到n g i 网络,需要克服原有口v 4 网络管理系统所存在的问题,在 此基础上部署和完善基于i p v 6 的n g i 网络管理系统,使之成为可管理、可控制的 新型网络体系。随着纯l l v 6 协议的n g i 网络的部署,为了满足简化用户配置和统 一设备配置的要求,其他一些网络管理方面的协议应该得到更多的应用,诸如 w b e m 删l 等。 目前网络管理系统正朝着综合分布化和智能化的方向快速发展。综合化是指 网络系统能够和企业信息系统相结合,运用先进的软件技术将企业商务层的应用 整合到网络管理系统中,网络管理模块的接1 3 趋向统一;分布化是指网络管理系 统的功能不再集中于一个单点的统一操作平台上,而是分布在网络各处;智能化 是指网络管理中引入专家系统,不仅能实时监视网络,更为重要的是能进行趋势 分析,提供建议,真实反映系统运行的问题。操作界面进一步向基于w e b 的模式 发展,便于用户的使用,也降低了维护成本和培训费用。另外,网络管理系统的 可塑性将增强,企业能够根据自身的需要定制特定的网络管理模块和数据视图。 1 3故障管理系统发展概况 在当今的网络管理中,故障一直是出现频率最高而且最难解决的问题。故障 管理作为网络管理重要的组成部分,起着至关重要的作用。面对越来越复杂,越 来越重要的网络,如何确保其尽可能长时间的正常运行,或当网络出现故障时尽 可能快地发现和修复故障,使其最大限度地发挥其应有功能和效益的过程,就成 为了网络管理者普遍关注的问题。这些问题的解决可以使得网管入员能及时了解 用户业务存在的问题,进而及时采取相应的措施,减少其可能产生的影响。如果 没有一个高效的管理系统对网络系统进行管理,就不能保证网络的稳定运行和有 序发展,就很难保证向用户提供令人满意的服务。 传统的网络故障管理是基于i p v 4 基础之上的,由于1 p v 6 的地址空间巨大,传 统的基于p i n g 的故障管理因时延和开销巨大将变得不可行:i p v 6 环境下故障信息 将是海量信息,因此故障管理中如何建立有效的故障分析模型、迅速有效地从中 分析出有用数据将是个巨大挑战;考虑到效率和开销问题,很多传统的故障管理 工具在1 p v 6 环境下显得力不从心,而需要利用i f v 6 协议的特点,开发基于i p v 6 的故障管理工具,这些都是故障管理模块需要解决的问题。因此合理的故障管理 策略以及强大的管理工具和系统对于网络管理者实现网络智能化管理有着很大的 帮助。 故障管理是检测和确定网络环境中异常操作所需要的一组设施,完成网络系 4 韭塞銮亟太堂鳕堂僮监塞缝监 统中故障的发现、定位、修复的功能。故障的日志记录则提供了诊断和分柝的依 据。 故障管理系统通过收集与故障检测目标相关的数据,再将收集到的这些数据 与所设置的阙值比较,可以检测出网络瓶颈、拥塞、网络病毒等网络故障。对于 支持s n m p 的路由交换设备还可以直接查询其各个接口的管理状态和工作状态,系 统启动时问等参数获得该设备当前的运行情况。对于不支持s n m p 的设备,可以通 过网络发现及p i n g 工具来检测该设备的状态。 故障数据的采集方式分为主动轮询和被动接收两种方式,主动轮询是管理站 以一定的时间间隔定期查询被管设备的状态,适用于周期性数据的收集;被动接 收是被管设备利用s n m p 的t r a p 机制,向网络管理服务器报告关键的网络事件。被 管设备主动报告网络事件,这样能极大地提高故障发现的实时性,并且能够节省 设备正常工作时对其故障检测所消耗的网络带宽。 图1 1 故障管理系统 f i g u r e l 1f a u l tm a n a g e m e n ts y s t e m 故障管理系统分为四个模块( 见图1 1 k 故障的告警模块;网络连通性故障发 现模块;接口故障发现模块;故障的分析和隔离模块。i p v 6 环境下的网络故障管 理也主要包含了这四个模块;故障的告警模块提出了i p v 6 环境下的网络故障管理 中的告警信息的处理需求,报告网络管理员网络故障所在,例如管理员可以从报 警窗口里得到故障类另q ( 网络连接失败、端口故障等) 和出现故障的设备的l p 地址 等信息;网络连通性模块对于网络的连通状态进行管理,如果网络某处连通失败, 向报警模块发送消息,以便报警模块向管理员产生报警信息;接口故障发现模块 对与其相关的1 p v 6 m i b 节点的关联进行研究,监测管理路由器的端口的开关状态, 如连通端口出现故障( 端口处在d o w n 状态) ,向报警模块发送消息。故障的分析和 隔离模块对可能发生的网络故障进行分析,其目的是迅速找到网络故障确切原因, 对可能发生的网络故障进行分析,为下一步的排除故障指明方向。 但在i p v 6 网络环境下,故障管理的发展却存在的一些实际的困难,具体问题 表现为:在目前的条件下,缺失真实的大型i p v 6 网络环境,哪怕是l p v 6 ,i p 、r 4 并 存环境也只是停留在小范围内的试验阶段,其主要原因是因为虽然目前f r e e b s d , s o l a r i s ,i a n u x ,u n i x 上都已经有了i p v 6 协议栈的实现,同时许多大厂商也宣称, 即将在产品中支持,v 6 ,如c i s c o ,i i p ,s u n 等。但由于 v 6 的出现很大程度上 是由于口地址空间的匮乏,而这一情况在全球网络领域占有霸主地位的美国并不 突出。此外,对于i p v 6 协议栈的支持,习惯了i p v 4 网络的客户,也不愿意冒风险, 随意改变原有的协议栈,这就导致了i p v 6 网络管理研究的停滞不前:l p v 6 协议栈 中引入的新m m ,在基于s n m p 的网络故障管理中,如何处理网络故障,其根本 方法是从被管设备的a g e n t 主动获取节点信息,或者被动接收a g e n t 发送的t r a p 来分析和判断故障的类型、位置、级别和发生的原因,可以说,在现有的网络故 障管理中,m m 是占有举足轻重的作用的。但由于某些网络管理功能在v 6 协议 栈上的实现发生了改变,对于相应的i p v 6m i b 也较之前发生了很大的改变,这对 于如何分析,处理网络故障管理,会产生很大的影响;i p v 6 环境下的网络拓扑发 现的困难。在网络故障管理中,故障定位的作用是极其关键的,但对基于拓扑发 现的故障定位功能却面临着一个非常重要的问题,在i p v 6 利用邻居发现机制代替 原有的a r p 的拓扑后,如何让一个软件在出现故障时,能够准确、及时地定位故 障的位置,让网络管理员有效地解决对应的问题,不给网络用户造成更大的损失, 这些都是急需解决的问题。 1 4 本文的主要工作 本文是研究v 6 环境下的网络故障的管理,对v 6 新增的m m 与i p v 4 原有 的m m 加以比较、分析和总结,最后开发出针对v 6 环境下的网络故障管理功能 软件,并完成该软件发现i p v 6 网络拓扑的测试。 由于上节中提到的种种问题,在系统的实际开发中确实遇到了很多问题,经 过前段时间的研究和开发,我们最终借鉴t u n i x a p l l 8 j 【9 】的编程思路,在f r e e b s d 平台上完成了该软件,在测试中取得了较好的效果。 本文的主要工作如下: 1 ) 本文首先简要的介绍了网络故障管理的具体理论以及故障管理系统数据 处理的方法,并分析了故障监测技术和r m o n 技术,比较了故障管理中基 于s n m p 的主动轮询机制和异步告警机制的优缺点。 2 1 介绍t i e r 6 协议相对与i p v 4 协议的不同之处,包括它的地址格式和结构、 地址配置等特点,并分析了i p v 6 环境下网络管理遇到的一些新问题。 3 ) 进一步详细分析了,v 6 协议栈中出现的新m i b ,介绍了其作用以及详细的 6 处理流程,为更好的建立故障管理系统模型提供了保障。 4 ) 针对大型i p v 6 网络环境的缺失,本文还根据a d v e n t n e t 模拟软件的思路, 自主开发出了l p v 6 设备的模拟器,可以模拟出大规模的w v 6 网络,为本 系统的实验环境提供了保障。 习在以上的基础上,提出了i p v 6 环境下的网络故障管理系统中的告警信息的 处理需求,并对本项目中可能发生的网络故障进行分析,并就其具体故障 和相关m m 进行研究,制定出快速定位的智能发现方法,也就此具体说明 了故障管理系统各模块的架构和实现方法,分析了故障管理对网络通信的 开销和实际意义。 我们的实现主要具有以下特点; 1 ) 效率高:使用基于s n m p 的网络故障管理,不仅很好的延续了其在i p v 4 网 络中的良好表现,更是在 v 6 环境下,快速、有效的对网络故障进行管理; 该软件是用j a v a 开发的,可以跨平台运行,无论在u n i x 系列平台上还是在 w i n d o w s 操作系统上都可以运行; 能支持较大规模的网络的故障管理而不会导致严重的性能下降。 7 2i p v 6 环境下的网络故障管理 目前对于网络设备故障管理的研究已经非常成熟,但由于i p v 6 的高速发展, 如何处理6 下的设备故障。如何在v 6 的环境下传送故障事件已经成为不可忽 视的问题。网络管理主要实现璐o 定义的五个标准的功能中,故障管理是最重要 的功能,网络管理最本质的任务是保障网络的正常运作,如果不能够发现网络故 障,网络管理也就失去了其自身的意义。 本研究采用m v 4 网络设备故障管理机制,并提出了i p v 6 环境下通过s n m p 的获取事件信息以达到故障管理的方案。在故障管理系统设计方面,决定采用i p v 4 下原有的结构。但在i p v 6 网络中仍需解决几个主要问题,如:网络中的设备根据 功能的不同在物理上如何划分,怎么划分:l p v 6 中修改的1 2 8 位地址对于实际网 络故障中触发的告警如何定位,分析。下面将就v 6 环境下的网络故障管理中的 几个主要问题进行分析。 2 1 故障管理概述 故障管理【l o l 是网络管理功能中与检测设备故障、故障设备的诊断、故障设备的 恢复或故障排除等措施有关的网络管理功能,其目的是保证网络能够提供连续、 可靠的服务。故障管理功能可以分解成以下五个模块: 1 ) 检测管理对象的差错现象,或接收管理对象的差错事件通报; 2 ) 当存在空余设备或迂回路由时,提供新的网络资源用于服务; 3 ) 创建和维护差错日志库,并对差错日志进行分析; 舢进行诊断测试,以追踪和确定故障位置和故障性质; 5 ) 通过资源的更换或维修或其它恢复措施使其重新开始服务。 故障管理是所有故障事件通报的接收者,是纠正动作的发起者,但纠正动作 一般是通过配置管理功能域的设置或通过操作员干预实现的。另外,故障管理设 施还要通过操作员接受人工的故障报告r 由用户发现并用口头或书面形式报告的故 障现象1 并在内部形成差错事件,及时与操作员交换信息。 网络服务的意外中断会影响网络用户的利益,因而故障管理历来就是非常重 要的网络管理功能,并受到网络运营部门的重视。随着网络承载的业务越来越多, 分布式处理应用和远程访问对网络服务可靠性的要求也越来越高,故障排除时间 也要求越来越短,因而故障管理工作就显得越来越重要。另一方面,这些要求也 促使网络管理系统引入人工智能技术,使得故障管理成为应用专家系统最早的网 8 络管理功能域。大多数研究网络管理的机构和团体对故障管理都比较重视,已经 形成比较成熟的故障管理服务定义和标准。 故障管理功能域可以细分成故障检测、故障诊断、故障排除( 或恢复) 和故障控 制四个部分,这些部分处理故障的具体流程如下“: 图2 1 故障管理功能模块 f i g u r e 2 1f a u l tm a n a g e m e n tf u n c t i o nm o d u l e s 故障管理涉及到许多其它管理功能,如故障恢复措施可能就要启动备用资源。 故障管理可能用到的其它管理功能有1 1 2 1 : 1 1 事件报告:支持事件的传送和差错的报告: 2 ) 查证和诊断测试:用于确定一个管理对象是否可以继续执行它的功能; 3 ) 日志控制:这是一个常用的功能,可以用于管理事件日志,限制对管理对 象的访问等; 4 ) 告警报告:用于报告管理对象中出现的告警指示。 国际标准化组织l s o 己经对网络管理的故障管理部分制定了一系列有关标准, 按照i s o 的定义,故障管理的内容包括差错日志的维护、检测到差错后采取一定的 动作、进行诊断和测试以便追踪和识别故障以及排除故障。在o s i 的网络管理标准 文本中,差错管理活动只分成三大类: 1 ) 故障检测:故障可以通过对管理对象的监视或者从管理对象产生的差错报 9 告中检测到; 萄故障诊断:故障诊断是通过启动诊断序列来实现的。诊断序列的作用是可 以设置一定的运行环境让管理对象产生同样的差错,诊断过程包括分析差 错、接收来自管理对象的报告等; 故障恢复:发现故障并经过诊断知道故障的原因后,采取适当的措施去排 除故障。 2 2 故障管理的功能 网络性能管理是网络管理的基础,在网络性能监测与分析的基础上,可以进 行网络的故障管理。由于故障差错可以导致不可接受的网络性能下降甚至整个系 统的瘫痪,所以故障管理在网络管理中具有重要的作用。性能管理和故障管理有 着密切的关系。 故障管理的目标是自动检测网络硬件和软件中的故障并通知用户,以便网络 能有效地运行。当网络出现故障时,要进行故障的确认、记录、定位,并尽可能 排除这些故障。故障管理的功能包括:接收差错报告并做出反应,建立和维护差 错日志并进行分析;对差错进行诊断测试;对故障进行过滤,同时对故障通知进 行优先级判别;追踪故障,确定纠正故障的方法措施。 在各个网络管理系统中对于网络故障的定义不尽相同。在网络系统的运行中, 会有各种各样的情况出现,某些事件的发生可能对系统的性能造成影响,有些会 妨碍网络通讯顺畅,更有甚者可能导致网络系统崩溃。路由器宕机是一个故障, 由于某种原因造成的网络拥塞一般也被认为是一种网络故障。虽然严格来讲,网 络拥塞这样的事件是属于性能管理范畴的,然而大多系统都认为严重的网络拥塞 同样也是一个故障。究竟对系统造成多大的负面影响才将其称为一个故障,对性 能要求不同,网络系统可能是不相同的。虽然故障的定义不尽相同,但是网络故 障状况可以分为以下几类:系统反应迟钝,节点问连接丢失,文件系统不可存取, 节点进程挂起,会话断开。 故障管理应该能对上述的几种故障进行监控,故障可实时定位到具体路由器、 交换机、服务器、工作站、网关、个人计算机及发生故障设备的链路端口,管理 的故障类型包括:接口流量超过警戒水平、设备关机、设备启动、链路故障、链 路故障恢复、链路管理状态改变等。 故障管理最大的作用在于通过提供工具快速地诊断和初始化修复后的过程, 增加了网络的可靠性。用户通常都希望能够随时使用网络,然而,希望网络不出 现问题或没有延时是不现实的。当一个网络出现问题时,管理人员应起码要保证 用户和网络之间的完全的和不间断的连接。从用户的角度看,这样的网络才是可 靠的。 故障管理提供了一系列的工具以获得关于网络当前状态的必要的信息。当有 故障发生时,这些工具可以准确地定位,并将信息立即交给管理员,管理员可以 在用户还没意识到有故障的情况下处理故障。使用故障管理就打破了一个破坏接 着另一个破坏的循环,从而提高了网络的性能和管理员的工作效率。 2 3故障管理系统数据处理方法 对于一个网络故障管理系统而言,在经过轮询采集到来自管理信息库的数据 之后,应该有能力综合解释这些底层信息,得出高层的信息和概念,并基于这些 高层的信息概念对网络系统进行管理和控制。来自m m 的信息通常只是一些统计 值,这些统计值在r f c 中都有明确的定义。然而对于这些统计值可能反映出的问题 以及如何基于这些信息对网络进行管理控制却没有任何文档对此进行描述。这主 要是由于在不同的网络环境下,同样的m m 信息可能指示的问题却不相同,任何一 篇文档都无法准确定义m m 库的信息可能暗示的网络故障原因。和管理系统的分析 能力一样,系统的推理能力也很重要。一个理想的故障管理系统应当有能力根据 已有的信息( 这些信息往往并不完全。不精确) 来作出对网络故障的判断。如当 网络系统中的某台路由器出现故障时,这台路由器以及通过这台路由器连接与网 络管理器通信的设备都会失去与网络管理器的联系,当网络管理器轮询这些设备 时,它们都不会响应,这时网络管理系统应当有能力判断出哪些设备真的出了故 障,哪些是正常的。 轮询m m 信息库是故障管理最基本的功能。晟简单的故障管理系统并不提供 m m 信息的分析,而是对m i b 进行基本的搜索报错。系统管理员可以为每个可能指 示故障的m i b 库对象规定门限值( 上限或是下限) 。当故障管理系统轮询到某个管理 代理上的某个m m 对象值越过了门限值,则向管理员报告一个故障信息。这种故障 报告仅仅给出了在哪个m i b 上( 口地址) 的哪个m i b 对象越界了,而不对这种越界情 况作任何的分析处理。把剩余的管理工作( 分析错误原因,修复故障) 的任务全部交 给管理员来完成。这种故障管理实现成本比较低,管理能力比较弱,对管理员的 要求比较高。由于现代计算机网络结构和规模日趋复杂,网络管理因素的实时性 和瞬变性,即使有丰富经验的网管人员也有力不从心之感,为此现代网络管理需 要朝着网管智能化方向发展。智能化网络不只是简单的响应底层的一些孤立信息, 它应有能力综合解释底层信息,得出高层的信息概念,并基于这些高层的信息概 念对网络进行管理和控制。同时,智能化网管能够根据已有的不很完全,不很精 确的信息对网络的状态锨出判断。 这种网络故障管理结构是基于规则的,能在网络性能分析的基础上进行故障 的处理,而且具有智能性。它具有处理不确定性的能力、适应系统变化的能力和 解析推理能力。 图2 , 2 网络故障智能管理模型 f i g u z e2 2n e t w o r ki n t e l l i g e n tf a u l tm a n a g e m e n tm o d u l e 为此,本文提出一种智能化的网络故障管理模型。图2 2 为网络故障智能管理 模型。下面简要的介绍该结构中各个模块的功能。控制核心是这个管理系统的核 心。监测模块负责接收所有网络资源传来的信息,监测模块以轮询方式对网络进 行监测。采用这种方式可以保持与s n m p 的一致,实现简单,代价小。控制模块管 理系统发出控制命令。网络事实库存放有关网络的事实信息,如网络系统的拓扑 结构,其中的设备类型,状态等等。这个信息库是可以自动生成的,它随着系统 的变化而不断更新,总是反映网络系统的当前状态。规则库存放着以规则形式描 述的网络管理专家的知识。控制核心通过推理模块将需解决的管理任务在规则库 中进行匹配,找出可能的解决方案。推理模块接收控制核心传来的管理任务,在 规则库中进行匹配,然后向控制核心返回可能的解决方案。解释模块响应用户的 问题,向用户报告网络系统的状况,解释发生的某些事件等等。 2 4 故障监测技术 故障监测的目的是及时发现网络中已经发生和将发生的故障,要发现网络故 障,需要搜集各种网络状态信息,收集网络状态信息有两种方法: 1 ) 异步告警,即在发生故障时,由发生故障的设备或服务器( 被管对象) 主动 向网络管理系统报告; 主动轮询,即由网络管理系统定期查询各设备、被管对象和服务器的状态。 由发生故障的设备或服务器主动向网络管理系统报告网络故障是一种十 分有效的故障发现机制。它可以及时发现端口故障、连接失败、主机无应 答、服务进程异常等网络故障和重要事件,而且只需要极其有限的网络带 宽。但有时候,这种方法并不可靠。例如,如果一个网络设备突然因为断 电而造成网络故障,这时它将不能向网络管理站点发送事件。因而,这就 需要依赖由网络管理系统主动轮询来发现故障事件。所以,在接收代理发 出的告警信息的同时,故障管理系统还必须主动监测被管设备的运行状 态,及时有效地发现更多的网络异常行为。有些设备对于整个网络的运行 至关重要,如路由器、交换机、d n s 服务器等,必须重点监测这些网络节 点。监测的信息包括端口的状态、线路质量、环境参数、服务的日志信息 等。在故障管理系统中,对于这些网络节点进行监测时,通常采用为各种 故障分配不同的优先级。具有高优先级的网络故障将被优先报告和处理, 较低级别的故障延时处理,或忽略。这样可以确保更加有效的处理高优先 级的网络故障,减少的网络带宽的占用率,同时也符合大型网络的分级管 理的特点。在确定网络故障管理的优先级时,应从以下几个方面来考虑: a 1 所管理的网络范围; b 1 所管理的网络大小; c ) 网络的带宽; d 1 不同的网络故障对网络正常运行的影响程度。 2 4 1基于s n m p 的主动轮询机制 主动轮询即由管理者定时查询各网络设备( 被管对象) 的状态。s n m p 协议提供 一种轮询机制来访问管理信息库m i b ,通过获得m m 变量的状态来检测故障。轮询 m m 是通过若干s n m p 报文操作原语完成,如:g e t r e q u e s t ,g e t n e x t r e q u e s t , g e t r e s p o n s e ,g e t b u l k 。 这些操作原语被封装在s n m p 报文中进行传送,虽然主动轮询方法可以帮助故 障管理系统可靠地发送网络故障,但同时也会消耗大量的网络带宽。这就需要网 管人员在故障发现速度与网络带宽消耗问进行权衡。故障响应速度越快,所占用 的网络带宽就越大。可以根据网络设备的重要性确定不同的优先级,根据不同的 优先级设置刁i 同的设备轮询周期。 2 4 2基于s n m p 的异步告警机制 在s n m p 协议中,发送t r a p 报文是代理向管理者通知重要事件的方法。当网络 管理站收到一个s n m p 仃a p 报文后,会通过网络管理系统将特定的网络事件通知网 络管理员。这是一种有效的故障发现机制。它可以及时发现端口故障、连接失败、 设备重启、服务进程异常等网络故障和重要事件,而且只需要极其有限的网络带 宽。但此方法并不完全可靠,例如,当一个设备断电时,将不能发送事件。因此, 需要和主动轮询机制配合使用。在r f c l l 5 8 中给出t t r a p 消息定义,和m i b 对象相 比,t r a p 报文所指示的故障原因是相对确定的。以下给出了七种不同类型t r a p 消息 所指示的故障原因: 1 ) o l d s t a r t ( 冷启动) t r a p 表示传送协议实体本身重新启动,代理的配置或协议 实体的实现可能被改变; 2 ) w a r m s t a r t ( 热启动) t r a p 表示传送协议实体本身重新启动,而代理的配置或 协议实体的实现不会发生变化; l i n l d 3 0 w a ( 链路中止) t r a p 表示传送协议实体搜索到在代理配置信息中的通 信链路的一种故障: 4 ) l i n k u p ( 铥t 路启动) t r a p 表示传送协议实体搜索到在代理配置信息中的一个 通信链路恢复正常: 5 ) a u t h e n t i c a t i o n f a i l u r e ( 访问权限失败) t r a p 表示传送协议实体成为某个未正 确设置权限

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论