(计算机系统结构专业论文)工作流在网络管理系统中的应用.pdf_第1页
(计算机系统结构专业论文)工作流在网络管理系统中的应用.pdf_第2页
(计算机系统结构专业论文)工作流在网络管理系统中的应用.pdf_第3页
(计算机系统结构专业论文)工作流在网络管理系统中的应用.pdf_第4页
(计算机系统结构专业论文)工作流在网络管理系统中的应用.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

(计算机系统结构专业论文)工作流在网络管理系统中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师和指导老师的指导下, 独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任 何其他个人或集体已经发表或撰写过的科研成果。对本文的研究做出重要贡献 的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。 学位论文作者:刮红垧 r 期:训年珀 拥 学位论文使用授权声明 本人在导师指导下完成的论文及相关的职务作品,知识产权归属郑州大学。 根据郑州大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部 门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权郑州 大学可以将本学位论文的全部或部分编入有关数据库进行检索,可以采用影印、 缩印或者其他复制手段保存论文和汇编本学位论文。本人离校后发表、使用学 位论文或与该学位论文直接相关的学术论文或成果时,第一署名单位仍然为郑 州大学。保密论文在解密后应遵守此规定。 学位论文作者:白f 盈桷 日期:沙辞移月) , e l 摘要 摘要 网络管理涉及的问题很多,管理的范围很广,随着网络规模的扩大和网络复 杂性的提高,网络管理的难度也同益增加。网络管理业务是有一定流程的,尽 管不同的功能域可能存在不同的流程。为了使结构复杂的网络高效运行,迫切 需要对各种面向业务的网络管理过程进行规范化的定义,提高全网的维护管理 效率。 故障管理是网络管理的核心功能,故障处理的重点在于及时、有序地发现故 障点、查出故障原因,以利于最快的速度进行修复。本文通过对网络应用系统 的通用结构分析,总结出一般性的网络应用系统的结构模型,从而得出通用的 网络应用系统故障排查流程,并用p e t r i 网对其进行工作流建模,结合w e b 服务 和工作流技术详细设计了网络故障管理系统,并实现了其中关键的部分。 取得的主要成果:本文根据网络应用系统的特点,对网络应用系统进行结构 建模,其模型为网管人员提供一个全面清晰的系统视图;根据网络应用系统的 结构模型,总结出通用的网络应用系统故障排查流程,提出了相对完整的基于 p e t r i 网的故障排查工作流模型,并给出完备性分析;采用w e b 服务和工作流技 术设计了网络管理系统的体系结构。 关键词:网络管理故障管理工作流p e t r i 网 a b s t r a c t a b s t r a c t n e t w o r km a n a g e m e n ti n v o l v e saw i d er a n g eo fi s s u e sa n dm a n a g e m e n t ,w i t ht h e e x p a n s i o no f t h es i z eo fn e t w o r ka n dt h ei n c r e a s i n go ft h ec o m p l e x i t yo fn e t w o r k ,t h e d i f f i c u l t yo fn e t w o r km a n a g e m e n ti si n c r e a s i n g n e t w o r km a n a g e m e n tb u s i n e s sh a sa c e r t a i np r o c e s s ,d e s p i t et h ed i f f e r e n tf u n c t i o n a ld o m a i n sm a ye x i s td i f f e r e n tp r o c e s s e s i no r d e rt oo p e r a t i o nac o m p l e xs t r u c t u r en e t w o r kh i g h l ye f f i c i e n t ,t h e r ei sa u r g e n t n e e dt os t a n d a r dt h e d e f i n i t i o n f o rn e t w o r km a n a g e m e n tp r o c e s so fk i n d so f b u s i n e s s - o r i e n t e dn e t w o r km a n a g e m e n t ,t oi m p r o v et h ee f f i c i e n c yo fm a i n t e n a n c e a n dm a n a g e m e n to ft h ew h o l en e t w o r k f a u l t m a n a g e m e n t i st h ec o r ef u n c t i o no fn e t w o r k m a n a g e m e n t ,t h e t r o u b l e s h o o t i n go fn e t w o r km a n a g e m e n tf o c u so nt i m e l ya n do r d e r l yt of i n dt h e m a l f u n c t i o n ,f i n do u tt h ec a u s eo fm a l f u n c t i o n , i no r d e rt or e p a i ra ss 0 0 1 1a sp o s s i b l e t i l i sp a p e rs u m m e du pat r o u b l e s h o o t i n gp r o c e s so fm a l f u n c t i o nb ya n a l y s i st h e s t r u c t u r eo fw e b a p p l i c a t i o ns y s t e m ,a n dm a k ei t sw o r kf l o wm o d e l i n gu s i n gp e t r i - n e t , c o m b i n a t i o no fw e bs e r v i c e sa n dw o r k f l o wt e c h n o l o g i e sd e s i g n e dn e t w o r kf a u l t m a n a g e m e n ts y s t e mi nd e t a i l ,a n da c h i e v eac r i t i c a lp a r to f i t m a i na c h i e v e m e n t s :a c c o r d i n gt ot h ec h a r a c t e r i s t i c so fw e ba p p l i c a t i o ns y s t e m , m a k ei t ss t r u c t u r a lm o d e l i n g ,a n di t sm o d e lp r o v i d i n gac o m p r e h e n s i v es y s t e mv i e w f o rt h en e t w o r km a n a g e m e n t ;a c c o r d i n gt ot h es t r u c t u r a lm o d e lo ft h en e t w o r k a p p l i c a t i o ns y s t e m , s u m m e du pac o m m o nt r o u b l e s h o o t i n g p r o c e s s o fw e b a p p l i c a t i o ns y s t e m ,p r e s e n t e d a r e l a t i v e l yc o m p l e t e w o r k f l o wm o d e lo f t r o u b l e s h o o t i n gb a s e dp e t r in e t ,a n dg i v e sac o m p l e t e n e s sa n a l y s i s ;d e s i g n e dt h e a r c h i t e c t u r eo fn e t w o r km a n a g e m e n ts y s t e mu s i n gw e bs e r v i c ea n dw o r k f l o w t e c h n o l o g y k e yw o r d s :n e t w o r km a n a g e m e n t f a u l tm a n a g e m e n tw o r k f l o w p e t r i n e t n h 录 目录 摘要i a b s t r a c t i i 第一章引言1 1 1 研究背景1 1 2 研究目的和意义2 1 3 研究现状3 1 3 1 网络故障定位技术研究现状3 1 3 2 工作流技术研究现状4 1 4 本文的主要工作5 1 5 本文的组织结构5 第二章网络管理系统中的工作流程7 2 1 网络管理业务流程概述7 2 2 业务流程细化一网络故障管理流程。8 2 3 工作流技术1 l 2 3 1 工作流的执行与工作流管理系统1 2 2 3 2 工作流管理系统参考模型1 3 第三章网络故障管理建模与分析1 6 3 1 网络应用系统结构模型1 7 3 1 1 网络应用系统的特点1 7 3 1 2 结构模型元素的定义1 7 3 1 3 网络应用系统结构建模2 0 i i i 日录 3 2 故障排查工作流程2 1 3 3p e t r i 网定义2 4 3 4 工作流网的定义2 5 3 5p e t r i 网系统表示的网络应用系统排障过程工作流模型2 5 3 6 工作流模型结构的性能分析2 6 第四章网络故障管理系统的设计2 9 4 1 系统体系结构2 9 4 2 网络管理系统中故障管理模块的结构设计3 l 第五章网络故障管理系统的实现3 6 5 1 系统使用的应用程序框架3 6 5 5 1s p r i n v g n e t 3 6 5 5 2n h i b e r n a t e 3 8 5 5 3n h i b e m a t e 与s p r i n g n e t 的整合4 0 5 2 三层架构矗4 l 5 3 系统的使用流程演示4 4 5 4 实验效果评估4 7 第六章总结与展望4 9 6 1 论文的工作总结一4 9 6 2 展望5 0 6 2 1 下一步的工作计划5 0 6 2 2 对网管系统的展望5 0 参考文献5l i v 图索j 图索引 图2 1 网络管理的业务流程7 图2 2 网络故障管理细化流程图1 0 图2 3 工作流管理系统功能图1 3 图2 4 工作流参考模型1 4 图3 1 对等层次上通信实体之间的顺序串行关系1 8 图3 2 垂直方向通信实体之间的关系1 9 图3 3 网络应用系统的结构模型示例2 l 图3 4p e t r i 网系统表示的网络应用系统垂直方向上排障过程工作流模型2 6 图4 1 系统的体系结构2 9 图4 2 系统的框架模型3 0 图4 3 网络故障管理系统结构设计3 2 图4 4 网络应用系统结构建模流程图。3 2 图4 5 故障告警流程图3 3 图4 6 故障定位流程图 。3 4 图4 7 故障处理流程图3 5 图5 1s p r i n g n e t 框架功能模块图3 6 图5 2 依赖注入示例。3 8 图5 3n l l i b e r n a t e 架构图。3 8 图5 4h i b e r n a t e 的主配置文件4 0 图5 5h i b e r n a t e 的一个资源配置文件4 0 图5 6 电子邮件系统的结构图4 5 图5 7t 0 0 3 为故障源时的故障日志4 6 图5 8t 0 0 1 为故障源时的故障日志4 7 图5 9r 0 0 2 为故障源时的故障日志4 7 表索引 j 良5 1 4 2 v 第一帝j i 击 第一章引言 在网络系统同益复杂的今天,网络出现故障的可能性以及故障所带来的破 坏的灾难性,使得网络维护管理工作显得愈发重要而又困难重重。网络管理系 统中的故障管理功能帮助网管人员轻松定位故障从而尽快修复,保证网络的高 效运行。本章主要介绍研究背景;研究目的和意义;研究现状:以及本文的主 要工作和内容安排。 1 1 研究背景 本节主要介绍了网络管理现状、工作流在m i s 系统中的应用状况、本文作 者参与开发的河南省教育科研网网络管理系统、以及该系统所依托的河南省教 育和科研计算机网( 简称h e l 州e t ) 。 随着网络规模的不断扩大,网络管理同益复杂,网络出现故障的概率也随 之增大。网络中的负荷分布不均匀会造成整个网络性能下降;某些i p 地址和 m a c 地址的非法绑定;服务器出现故障,无法连接;交换机、路由器等设备的 端口意外断开等等;网络系统一旦发生故障给用户所带来的破坏是灾难性的, 在这种情况下网络管理与维护显得尤其重要而又高难度。 网络管理涉及的问题非常多,包括网管基本理论、管理模型和体系结构、 网络管理协议及其标准化,以及基于网络管理五大功能的各种单元管理技术等 1 1 】。网络管理的功能集定义于o s i ( o p e ns y s t e mi n t e r a c t ,开放系统互联) ,该 功能模型包括五个基本领域,即:配置管理、性能管理、计费管理、故障管理 以及安全管理,其中故障管理是最基本也是最重要的一个领域。 现有网络管理方案面临的一个问题是缺乏统一的管理流程,包括功能流程 和业务流程【l 】。为了使结构复杂的网络高效运行,迫切需要对各种面向业务的网 络管理过程进行规范化的定义,提高全网的维护管理效率。 工作流是针对工作中有固定程序的常见活动提出的一个概念,目前已经成 为计算机应用领域的一个研究热点,工作流管理联盟( 简称w f m c ) 给出的工 作流定义剧2 】:工作流是一类能够完全或部分自动执行的经营过程,它根据一系 列过程规则、文档、信息或任务能够在不同的执行者之间进行转递与执行。 l 第一章,j i 苦 工作流的概念起源于生产制造业与办公自动化领域,并首先在这些领域得 到有效的应用。近年来,工作流技术被引入到m i s 系统中。而将工作流技术与 网络管理过程结合起来,这方面的研究目前还处于起步阶段。 河南省教育科研网网络管理系统是依托于河南省教育科研网而产生一个项 目。主要功能有:资源管理包括节点管理、链路管理、设备管理、用户管理; 状态监控包括全局层次、节点层次、设备层次、链路层次:事务管理;系统管 理;网络故障管理等。本文作者作为一个开发人员,参与了该项目资源管理、 状态监控以及网络故障管理三个功能模块的设计和实现。 河南省教育和科研计算机网( 简称h e r n e t ) 是中国教育和科研计算机网 ( c e l e t ) 在河南省的省级网络,主要负责连接省内的教育和科研机构接入 c e r n e t ,进而与i n t e m e t 连接。目前已建立起连接全省1 8 个地市的高速主干 网,以及部分地市的高速城域网,入网院校8 0 余所,网络用户2 0 0 余万。本文 是基于河南省教育科研网网络管理系统项目产生的,从流程化的网络管理需求 出发,以网络应用系统作为被管单位,着重研究了一般性的网络应用系统故障 排查流程,在此基础上设计了一个基于工作流的网络故障管理系统,并予以实 现。 1 2 研究目的和意义 对现代的网络管理来说,网络规模的扩大和网络设备的多厂商化,使网络 故障的管理与维护的难度提升: ( 1 ) 一个小故障可能会引起网络中其他部分的连锁故障,从而形成大范围的 网络故障。在互联网分层体系结构模型中,这个小故障越是在底层,引起的故 障范围可能越大。一个简单的实例是,网络中某一条线路的断开可能导致整个 网络都受影响:请求在该线路上传输的应用超时;无法与该线路上的主机建立 连接的错误报告产生;由于路由表自动进行刷新,使该线路上的网络业务量转 移到其他线路上,从而导致其他线路产生负载过重现象并报告性能降低。最终 的结果是大量来自网络中不同地理位置的各种错误报告急剧增多。 ( 2 ) 不同的网络故障可能会以非常相似的症状表现出来。在上述实例中,如 果不是线路断开而是一台主机出现故障,导致的错误仍然可能是:应用超时: 无法建立新的连接。两个完全不同的问题却具有非常相似的征兆,因此,网络 2 第一帝j i 苦 故障的定位变得更加复杂。 ( 3 ) 网络设备在地理位置上的分散性也增加了故障定位的复杂性。现在的大 部分网络应用系统都是分布式结构,系统的功能由分布在网络中的多个用户共 同实现,这些用户往往分布在不同的区域,增加了故障定位的难度。 ( 4 ) 由于网络设备的多厂商化,网管人员需掌握各厂商的网络设备的相关知 识,才能对网络设备进行有效设定来避免或修复故障。 综上所述,现代网络故障管理与维护的成本逐渐增加,甚至超过网络设备 本身的投资。同时,网管人员的工作变得更具有挑战性:不仅要具备丰富的网 络设备知识,而且必须在尽快短的时间内迅速定位故障源,并作出合适的修复 决策。 工作流技术目前正在迅速发展,工作流技术与工作流管理系统得到广泛重 视的一个重要原因是它能够较好地控制业务流程的变化问题,可以实现不同自 动化程度的规范化业务管理功能,具有很好的适应性。因此,工作流技术在办 公自动化、工业制造等领域得到了广泛的应用。 从而可见,如果将工作流技术引入到网络故障管理系统中,不仅能有效减 少网络管理和维护成本,具有一定的经济意义;而且,目前国内外这方面的研 究都还处于理论研究阶段,也是本课题具有迫切的研究必要性。 1 3 研究现状 1 3 1 网络故障定位技术研究现状 故障管理是网络管理五大功能模块之一,而故障定位是故障管理的核心。 网络故障定位是根据故障事件关联关系,从多个故障事件中定位故障源【3 】。目前 常用的网络故障定位技术主要有以下几种。 基于规则的推理( m l e b 弱e dr e a s o n i n g , r b r ) 基于规则的推理又称为基于规则的专家系统。它用“i f t h e n 的规则形式 捕获人类问题求解的行为特征,并通过“认识行动的循环过程求解问题,求 解过程符合人的认知过程,它最大的优点是符合人的思维,便于理解。但它存 在以下缺陷:规则数目越多,规则库的维护越困难;规则主要是从专家那里获 取的,没有自学习功能;在演绎推理过程中没有利用过去经验,即使遇到相同 3 第一市j i 苦 情况也要从规则库中查找,降低了系统性能【4 1 。 基于案例的推理( c a s e - - b a s e dr e a s o n i n gc b r ) 基于案例的推理源于认知科学记忆在人类推理活动中所扮演的角色,目前 c b r 已经成为一种主要的人工只能的推理技术。基于案例推理的故障定位方法 克服了基于规则推理方法的许多不足:案例库比知识库容易构造;c b r 比r b r 有更快的执行速度;c b r 系统具有自学功能。但c b r 系统也存在不少缺陷:因 为基于案例推理需要对比新旧案例的相似度,而相关的评估函数是特定于应用 的,由于i n t c m e t 服务的多样性,很难确定一个通用的评估方案;当案例的数目 非常巨大时,c b r 不适合大型系统【3 l 。 基于密码本关联模型 网络故障之间是有关联的,密码本的核心思想是在处理由故障源引发的其 他故障的方法是把故障表征看成一个标志故障源的密码,相关性分析的过程就 是对故障表征进行解码的过程。这种方法的优点是:编码过程只进行一次,效 率高;只进行比较操作,运算复杂度低。缺点是:当网络的拓扑结构发生变化 时需要重新产生密码本【3 1 。 此外还有数据挖掘,有限状念机、p e t r i 网等网络故障定位的方法。这里不 再一一介绍。 1 3 2 工作流技术研究现状 工作流技术于1 9 世纪7 0 年代中期起源于办公自动化领域,但工作流思想 出现的更早,1 9 6 8 年f r i t zn o r d s i e c k 就提出了利用信息技术实现工作流程自动 化的想法。1 9 7 0 年代与工作流有关的研究工作很多,其中最著名的是宾夕法尼 亚大学我顿学院的m i c h a e ld z i s m a n 开发的原型系统s c o o p 和施乐帕洛阿尔托 研究中心的c l a r e n c ea e l l l i s 等人开发的o f f i c e t a l k 系统,不仅标志着工作流技术 的开始,也是最早的办公自动化系统。 9 0 年代,相关技术条件日渐成熟,工作流系统的研究与开发进入了一个新 的高潮。随着i n t e r a c t 应用的不断普及和计算机网络技术的发展,w e b 技术也迅 速发展。w e b 应用程序跨平台、开放的特性使得基于w e b 的工作流管理系统已 经成为一种必然的发展趋势。 在新技术背景下,i n t e r n e t 服务、移动式计算、电子邮件、文件管理系统等 已经应用到工作流管理系统之中。推动了工作流管理的进一步发展。 4 第一章- j i 吉+ 一些著名的工作流商业软件供应商不断推出新产品,比较著名的企业级工 作流产品有i b m 的h o l o s o f x 与m q s e r i e s 工作流,b e a 的w l i ,s a p d n e t w e a v e r ,s o n i c 的o r c h e s t r a t i o ns e r v e r ,f u j i t s u 的i f l o w 。而通过w w w 实现 任务的协作的基于w e b 的工作流系统,已经成为一种发展趋势,代表产品有 u l t i m u s 的业务流程管理产品等【5 j 。 国内比较著名的商业化工作流系统丌发公司包括:上海东兰的d l f l o ;杭州 信雅达的s u n f l o w :西北大学和西安协同软件公司合作开发的s y n c h o f l o w ,其 流程定义已经达到了业界领先的水平【6 l 。 国内对工作流技术的研究相比国外仍有一定的差距,在此情况下,国内高 校相继将工作流技术作为研究课题。浙江大学研制了工作流过程描述语言 w p d l ,实现了工作流建模支撑平台。清华大学范玉顺教授提出了c i m f i o w 工 作流模型,设计开发了c i m f l o w 工作流管理系统。都取得了一定的研究成梨5 1 。 1 4 本文的主要工作 根据互联网体系结构分层模型,通过对网络应用系统的通用结构的研究分 析,总结出一般性的网络应用系统的结构模型;根据网络应用系统的结构模型, 总结出通用的网络应用系统故障排查流程,提出了相对完整的基于p e t r i 网的排 障工作流模型,并给出完备性分析;根据网络管理中故障管理的基本功能以及 网络应用系统故障排查工作流程,设计出了网络管理系统的框架模型,并对其 中的网络故障管理模块进行了具体的设计包括数据库设计、主要功能的算法设 计;结合w e b 服务和工作流技术实现了网络管理系统中网络故障管理系统中的 关键部分。 1 5 本文的组织结构 本文的内容组织如下: 全文共分为六章: 第一章:主要介绍了研究背景;研究目的和意义;研究现状;以及本文的 内容安排和主要研究成果。 第二章:主要介绍网络管理的工作流程,包括网络管理业务流程概述以及 5 第一章0 l 高 网络故障管理流程的详细描述;工作流技术,包括工作流的执行与工作流管理 系统,工作流管理系统参考模型。 第三章:通过分析一般网络应用系统的结构特点,得出一般性网络应用系 统的结构模型,给网管人员提供一个全面清晰的系统视图。在此基础上,总结 出通用的网络应用系统故障排查流程,并对流程提出了相对完整的基于p e t r i 网 的故障排查工作流模型,并给出完备性分析。 第四章:结合w e b 服务和工作流技术设计了网络管理系统的体系结构,并 在此基础上对其中的故障管理模块进行了具体的数据库设计和算法设计。 第五章:详细介绍了网络故障管理系统的架构和实现技术、系统的使用流 程演示以及实验效果评估。 第六章:总结与展望。 6 第_ 二市删络管理系统中的t 作流程 第二章网络管理系统中的工作流程 本章主要介绍网络管理的工作流程,包括网络管理业务流程概述以及网络 故障管理流程的详细描述;工作流技术包括工作流的执行与工作流管理系统, 工作流管理系统参考模型。 2 1 网络管理业务流程概述 网络管理本身是有一定流程的,尽管不同的功能域可能存在不同的流程, 如网络故障监控及排查等,此外,大规模网络的运行及管理往往会涉及多个部 门的协同工作,这类协作的管理需求和工作流技术的传统应用领域的协作管理 需求是相同的。本文试图在网络管理活动中引入工作流技术。 网络管理追求的一个目标是尽量使网络管理过程自动化,从而在降低管理 成本的同时向网络用户提供最优质的服务。网络管理论坛n m f 试图从抽象的层 次上对电信业务处理过程进行标准化,在其t e l e o a mo p e r a t i o n sm a p 7 】中提出了 业务模型b p m ,在模型中网络管理服务被分成时间和空间两维坐标,从水平方 服务规划与开发服务配置服务问题管理服务质量管理 【费率与折扣管理1l 服务开发与运营过程 网络规划与开发网络配置 网络设备管理i 网络维护与恢复: 网络数据管理 网络与系统管理过程 服务实施和配置 服务管理和监控 : 服务计费 图2 1 网络管理的业务流程 7 第一二审嗍络管理系统中的t 作流程 向时间坐标上看,服务被分为服务实施与配置、服务的管理与监控和服务计费 三个阶段。若将每个阶段的管理服务看作是一个过程的话,则服务实施和配置 过程负责迅速配置客户的服务请求;而服务管理和监控过程负责维护及确保服 务的正常运行;服务计费过程负责及时准确的收集网络计费数据。 从垂直方向空间坐标上看,从上往下依次是:客户支持服务、业务的丌发 及运营服务、网络和系统管理服务等如图2 1 所示。 2 2 业务流程细化一网络故障管理流程 故障管理的相关概念: 故障:被管理网络及其部件出现硬件或软件上的紊乱,使之不能提供j 下常 的服纠引。根据网络故障持续时间的区别可将故障分为3 类:永久性故障:间 歇性故障;瞬时性故刚引。其中永久性故障只有对它进行了修复才会消失;间歇 性故障是问断的、周期性发作的,但由于其频繁发作,可能会使网络服务的性 能显著降低;瞬时性故障会引起网络服务性能暂时的轻微的下降【8 】。通常情况下, 一个故障可能是另一个故障的根源。 告警:告警是指被管对象出现状态异常时,由被管对象发出的一种事件报 告。告警通常包含被管对象的信息、故障的征兆和产生告警的时间等,但并不 明显包含产生故障的根本原因。告警只是反映网络状况发生改变的征兆,一个 告警仅仅表示有可能发生故障,并非一定发生故障【9 】。 网络管理的功能包括五个基本领域,即:配置管理、性能管理、计费管理、 故障管理以及安全管理,其中故障管理是最基本也是最核心的一个领域。 网络故障管理是对网络中的故障进行定位的过程,故障管理的主要任务是 发现和排除网络故障。主要包括三个步骤:发现故障;分离故障,找出故障源; 处理故障,恢复网络的正常运行。第一步是确定网络故障范围,第二步分离故 障,找出故障源是最关键的一步,必须确定出最重要最根本的故障,因为不同 的故障影响力是不一样的。最后一步,故障管理系统或者自动排除故障或者以 某种方式通知用户如何排除故障。下面分别讲述这三个方面: ( 1 ) 发现故障为了确定故障的存在,需要收集与网络状态相关的数据。收集 信息有两种方法:设备向网络管理系统报告关键的网络事件,关键网络事件比 如连接失败、设备重新启动或从一个主机来得响应无法收到等。但在有些情况 第一二章嗍络管理系统中的丁作流程 下,只依赖这些事件不能获取必需的有效信息,比如一个网络设备完全失效了, 它将不能发送事件。这样仅依赖于重要网络事件的管理工具将不能总是拥有每 个网络设备的最新状态;第二个方法是网络管理系统定期地查询网络设备,这 种方法可以帮助网络故障管理系统及时地发现故障,但是需要代价:所需的发 现时间越短,所消耗的带宽量就越大。这两种方法通常互为补充地同时使用。 ( 2 ) 分离故障在网络管理中,故障类型很多,但有些故障之间可能是有关联 的,就是说一些故障可能是由其他的故障引起的,我们称后者为故障源,显然 对网管人员来说,这些故障的优先级是不一样的。网管人员要做的工作是在一 个大的故障范围内,面对不同的故障类型,逐步排查缩小故障范围最后找出故 障源。这是分离故障的大致思路,但在网络管理系统中我们当然不希望每一步 都有网管人员亲自去做,而是根据故障的优先级,有一些故障通知网络管理员, 而另一些应该让系统自动去管理甚至可以完全忽略掉。 ( 3 ) 处理故障分离出故障源后,进一步的分析故障源的哪些方面可能存在问 题,分析出几个任务,并根据这些任务之间的关系分别将这些任务指派给某些 角色去完成。 综上所述,网络故障管理的工作流程可以简略的总结为:首先信息采集发 现故障以及故障范围;由中央处理模块保存信息并将较重要的故障以某种形式 告警呈现给网管人员,完成故障定位:根据故障类型和规则库中事先定义好的 规则对故障进行处理,并保存结果。 对网络管理业务流程来说,每个过程都包括若干子过程,每个子过程又包 括一个或多个活动,因此将网络管理业务流程划分为三个过程是很粗粒度的, 实际上在各过程和活动之间还存在大量的控制流和数据流。详细地刻画出每个 过程和活动及它们之间的控制流和数据流是实施基于工作流技术的网络管理的 基础。限于篇幅,本节只给出网络故障管理的细化流程。 图2 2 给出了一个典型的网络故障管理的处理流程,它表示的是当一个网络 9 第一二市嗍络管理系统中的t 作流程 过程 活动 一 过科接口 图2 2 嘲络故障管理细化流裎图 管理系统发现网络故障后所采取的响应活动序列。图中给出了两个检测故障的 方法,一个是来自网络数据管理过程,即图中的箭头l 。系统通过对所采集的数 据进行分析,从而检测潜在的故障隐患和网络性能的下降。所采集的数据主要 包括和故障相关的数据、和性能相关的数据以及流量数据等。另一个是网络管 理系统本身的故障告警,即图中的箭头2 ,网络管理系统中的每个网元都有可能 产生告警如设备、软件模块或子系统等。告警即网元在发生故障时发出的消息, 这些消息通常描述了一些异常情况,但无法显示出故障的根本原因,所以在检 测故障时,这两种方法通常结合使用;网络维护与恢复过程则通过一些列的活 动:故障检测、故障定位、故障隔离最后做出故障单及修复决策;故障处理过 程对故障进行修复并给出处理报告。 l o 第_ 二市网络管理系统中的t 作流程 2 3 工作流技术 工作流是从英文单词w o r k f l o w 翻译而来。w o r k f l o w 是由单词w o r k 和f l o w 组成。单词w o r k 表示工作或任务,单词f l o w 的含义是流动、流程或者流量等。 在企业应用中,f l o w 则表示价值流、决策流、控制流等概念【1 0 1 。 工作流的概念起源于生产组织和办公自动化领域。是针对工作中具有固定 程序的活动提出的一个概念。工作流技术是近年来在计算机应用领域中发展最 快的技术之一,其本身还处于不断发展阶段。工作流管理联盟( 简称w f m c ) 给出的工作流定义剧2 】:工作流是一类能够完全或部分自动执行的经营过程,它 根据一系列过程规则、文档、信息或任务能够在不同的执行者之间进行转递与 执行。 工作流的主要特征是实现人和计算机交互事件结合过程中的自动化【i 】。简单 地讲,工作流就是不同角色的人按照特定的规则完成一项任务,根据不同的条 件和规则得出不同的完成过程。 工作流的目的是通过将工作分解成定义良好的任务、角色,按照一定的规 则和过程来执行这些任务并对它们进行监控,以达到提高办事效率、降低生产 成本、提高企业生产经营管理水平和企业竞争力【1 0 l 。实际上,自从进入工业化 时代以来,企业管理的主要研究内容之一就是过程的组织管理与流程的优化工 作。只是在没有引入计算机的支持以前,这些工作是有人来完成的,在计算机 网络技术和分布式数据库技术迅速发展的基础上,工作流技术为企业更好地实 现经营目标提供了先进的手段【l i 】。 工作流技术的相关概念: 流程定义:业务过程的形式化描述,可被计算机直接处理,用于支持系统 建模以及运行过程的自动化。可分解为一系列的活动。主要定义流程的起始条 件、活动的调度规则和次序,以及一些关于个体行为的信息等。 “活动 :是指业务过程中的每一个步骤,一般分为人工操作和自动处理, 是工作流执行工程中可被处理的最小工作单元。 “工作参与者 :工作流实例的资源,一般有人员、组织、角色和资源四 类。 “工作流实例 :是指工作流的一次执行过程; “工作流引擎 :是一个为工作流实例的执行提供运行服务环境的软件, 第_ 二章i 】c 】9 络管理系统中的t 作流程 它是工作流执行服务的核心,负责解释过程定义、控制过程实例的执行、控制 工作流中各个活动的执行顺序、并完成与其它工作流引擎的交互与通讯等【1 1 。 “工作项:活动实例的表示,一个活动实例可以产生一个或多个工作项。 “工作列表”:工作流参与者所用的流程工作项的列表,是工作列表处理 器和工作流引擎的接口。 2 3 1 工作流的执行与工作流管理系统 近年来随着计算机的广泛应用,人们的许多工作都是由计算机协助完成的。 工作流技术的历史可以追溯到7 0 年代术的办公自动化及任务批处理【1 2 】,操作 系统中的j c l 语- 言 ( j o bc o n t r o ll a n g u a g e ) 本就带有工作流思想,第一次使用工作 流术语可追溯到8 0 年代初【1 3 】。早期的工作流管理系统将传统的办公自动化功能 结合在一起,以形成支持某些业务流程的一种综合软件包【1 3 】。这还不是真正的 工作流管理系统,只是工作流管理系统的一个雏形。随着计算机的普及和网络 的飞速发展,这种普及应用给人们带来便利的同时也给早期的工作流管理系统 提出了新的挑战。随着c o r b a 、j a v a 以及w w w 等分布式处理技术的成熟和 广泛应用,为开发和研制标准的、通用的一体化工作流管理体系结构模型奠定 了良好的基础【l 】。 如果说工作流是业务过程的一个计算机实现,那么工作流管理系统则是实 现它的一个软件环境,也就是说工作流的执行是由工作流管理系统来完成的, 它和工作流执行者交互,协同推进工作流实例的执行,并监控其运行状态。 w f m c 定义了工作流管理系统:工作流管理系统是一个软件系统,它完成 工作流的定义和管理,并按照在计算机中预先定义好的工作流逻辑,推进工作 流实例的执行。 工作流管理系统一般提供三个主要功f i g 1 构建阶段的功能:主要包括工作流过程和该过程所包括的活动的定义和 建模功能。 2 运行阶段的控制功能:在一定的运行环境中,执行工作流过程,完成每 个工作流过程中活动的安排和调度功能。 3 运行阶段的人机交互功f i g 在各种活动的执行过程中,实现用户与i t 应用工具的交互。 工作流管理系统的特征以及主要功能之间的关系如图2 3 所示: 1 2 第_ 二章嘲络管理系统中的t 作流程 图2 3t 作流管理系统功能图 其中,构建阶段的功能主要是指业务过程的计算机定义。通过分析、建模、 定义将一个实际的业务过程转变成计算机可处理的形式化定义。 综上所述,工作流的执行由工作流管理系统实现,工作流管理系统是在工 作流的形式化表示驱动下,通过软件的执行而完成工作流的定义、管理及执行 的。其主要目标是对业务过程中活动和资源进行调度和管理,从而实现业务过 程的半自动化或自动化。 2 3 2 工作流管理系统参考模型 工作流管理联盟( w f m c ) 通过发掘工作流管理系统的共同特点,对其定 义了标准的体系结构和接口,于1 9 9 4 年1 1 月发布了工作流管理系统参考模型 1 3 第一二章i ) c ) 9 络管理系统中的t 作流程 如图2 4 【i o 】所示。 图2 4 工作流参考模型 模型描述了工作流管理系统体系结构中的主要功能模块以及模块间的接 口。从图中可以看出,工作流执行服务是工作流管理系统的核心,为工作流的 执行提供了一个运行环境。 该模型定义了一个工作流管理系统所需要的六个基本模块,并制定了各模 块之间的接口标准,其基本的模块功能如下: ( 1 ) 过程定义工具:用于描述和分析工作流过程定义,为用户提供一种对实 际业务过程进行分析、建模的手段,且生成业务过程的可被计算机处理的形式 化描述。大多数工作流过程定义工具可以在图形界面上可视化的定义工作流过 程。 ( 2 ) i 作流执行服务:它借助于一个或多个工作流引擎,激活并解释过程定 义,并同外部的应用程序交互以完成工作流过程实例的创建、执行与管理,为 工作流程提供一个运行环境。 ( 3 ) 其他工作流执行服务:在大型的工作流管理系统中,工作流在有些情况 下可能需要有多个工作流引擎共同完成,这时会涉及到工作流管理系统之间的 交互和通信。 1 4 第_ 二帝叫络管理系统中的下作流程 ( 4 ) i 作流客户应用软件:用户通过工作流客户应用软件和工作流管理系统 进行通信,它给用户提供一种手段,以处理过程实例运行过程中需要人工干预 的任务。工作流管理系统为每一个用户维护一个工作项列表,工作流客户应用 软件使用工作项列表,它表示当前需要该用户处理的所有任务。 ( 5 ) 被调应用程序:是指工作流执行服务在过程实例的运行过程中调用的、 用以对应用数据进行处理的程序。 ( 6 ) 管理与监控工具:其功能是对工作流管理系统中工作流运行的状态进行 监控与管理。 五类接口分别是: 接口1 :工作流执行服务与过程定义工具之问的接口,主要完成工作流模型 的解释和读写。 接口2 :工作流执行服务与工作流客户应用软件之间的接口,约定的所有客 户应用软件与工作流服务之间的功能操作方式,是最重要的接口规范。 接口3 :工作流引擎和直接调用的应用程序之间的直接接口。 接口4 :工作流管理系统之间的互操作接口,通过这个接口工作流管理系统 之间可以实现互操作。 接口5 :工作流执行服务与监控管理工具之间的接口。 w f m c 为这些接口定义了一系列公共的a p i 及相关数据交换的格式。 w f m c 提出的有关工作流管理系统的标准都是建议性的,在实际开发过程中, 并非一定要完全按照标准来实现。 1 5 第三章网络故障管理建模与分析 本章通过分析一般网络应用系统的结构,得出一般性网络应用系统的结构 模型,给网管人员提供一个全面清晰的系统视图。在此基础上,总结出通用的 网络应用系统故障排查流程,并对流程提出了相对完整的基于p e t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论