(计算机科学与技术专业论文)基于过程模型的it系统自修复框架研究.pdf_第1页
(计算机科学与技术专业论文)基于过程模型的it系统自修复框架研究.pdf_第2页
(计算机科学与技术专业论文)基于过程模型的it系统自修复框架研究.pdf_第3页
(计算机科学与技术专业论文)基于过程模型的it系统自修复框架研究.pdf_第4页
(计算机科学与技术专业论文)基于过程模型的it系统自修复框架研究.pdf_第5页
已阅读5页,还剩135页未读 继续免费阅读

(计算机科学与技术专业论文)基于过程模型的it系统自修复框架研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江大学博士学位论文 摘要 r r 系统管理复杂性问题是目前r r 业面临的最大挑战之一。该问题最明显的 症状就是r r 系统故障频发,对运营维护管理人员的技术要求越来越高,相应的 运营管理成本也持续增加。软件工程对软件系统运营阶段的重视程度和研究深度 明显不能满足需要,1 1 r 运营管理流程的标准化也不能降低系统管理复杂性。自 主管理作为自治计算的核心技术,是应对上述挑战的主流研究方向,自修复是自 主管理的一项关键功能,其主要思想是通过提高系统自动处理故障以及适应环境 变化的能力,解决r r 系统管理复杂性问题中“系统故障频发”这一最明显的症 状。由于r r 系统对企业运营的影响越来越大,“自修复”这一新兴研究领域已经 成为一个很有前景的研究方向。本文对提高i t 系统自修复能力的框架及其支持 技术进行了研究: 提出基于过程模型的i t 系统自修复框架( p m s f ) ,作为解决和预防系统异 常的管理技术框架。通过由定义、度量、关联以及改进四个阶段组成的过程改进 循环,去实现i t 系统在运营阶段面向异常的逻辑抽象、度量体系、关联模型以 及改进方法,过程模型可有效提高系统的自修复能力。作为一个开放的技术框架, p m s f 旨在通过发现并控制引发系统异常的关键少数影响因素,去指导系统改进 以消除系统异常。这是一种标本兼治的异常管理方法,能在提高系统可靠性和服 务质量的同时降低人工干预的需要,它的研究扩展了以软件开发为焦点的传统软 件工程方法。本文实现两个能处理不同类别异常的具体过程模型,一个是处理随 机性能异常的扩展统计过程控制模型,另一个是处理系统功能异常的功能点切片 模型。 提出扩展统计过程控制模型( e s p c ) 指导随机性能异常的预防和自修复。 e s p c 改进了统计过程控制的度量体系,能根据系统负荷变化动态地调节判别性 能异常的阈值,对性能数据进行动态分类;它引入“过程性能指数”,从统计意 义上计算过程性能符合用户期望的程度,不同过程能根据该指数比较性能优劣。 e s p c 还建立了性能异常与影响因素间的关联模型,根据动态分类后的性能数据 以及各影响因素的同步数据,自动确定引发性能异常的关键少数影响因素。e s p c 能有效地从用户使用体验角度度量和分析性能,并发现性能管理所需要的领域知 识,指导系统改进自动修复并预防性能异常。e s p c 的两个应用案例分别实现网 络代理服务和组合优化算法的性能异常自修复。 收集了2 1 个应用系统长达三年多的改正性维护数据,在这些数据的基础上, 对影响维护工作量的主要因素、系统功能异常的增长特征、功能异常的主要类别 及解决途径三个方面进行实证研究。主要结果有:第一,维护工作量和变更数量、 浙江大学博士学位论文 修改数据文件数量有着强的线性关联关系;第二,大规模业务系统的累积异常增 长是一个以运营时间为底数、以“系统稳定指数”为指数的幂函数,系统稳定指 数代表着系统可靠性的变化趋势;第三,改正性维护通过数据更改能解决近5 0 的功能异常,而代码更改仅占2 0 左右。实证研究结果表明需要研究以数据 ( 而不是以代码) 为中心的功能异常管理工具,这也是功能点切片模型研究的动 机。 建立一种新的功能异常分析模型功能点切片模型( f p s ) ,可提高异常 分析和处理的自动化水平。f p s 采用功能点分析方法将r r 系统分解为基本事务 组件和文件组件,并进一步构建基本事务间以文件属性和依赖关系类型为约束的 依赖关系模型,即功能点依赖图,在该图上应用切片算法,能实现系统功能异常 的原因定位、变更影响分析以及方案匹配的自动化。f p s 还提供评估异常对业务 影响程度的异常事务风险指标,以及估计异常解决方案规模的异常事务功能点指 标。实验表明应用f p s 能建立r r 系统的关联信息,有效地提高系统的可靠性并 降低运营成本。 关键词:自修复,过程模型,扩展统计过程控制,功能点切片 u 浙江大学博士学位论文 a b s t r a c t o n eo ft h eg r a n d e s tc h a l l e n g e sf a c e db yi ti n d u s t r yi st h es y s t e mm a n a g e m e n t c o m p l e x i t yp r o b l e m f r e q u e n ts y s t e mm a l f u n c t i o n ,m o r ed e m a n d i n g s k i l l so nt h e s u p p o r ts t a f f , a n di n c r e a s i n go p e r a t i o nm a n a g e m e n tc o s ta r et h es a l i e n ts y m p t o m so f t h i sp r o b l e m s o f t w a r ee n g i n e e r i n gd i d n 。tp a ye n o u 曲a t t e n t i o nt ot h er e s e a r c ho f s o f t w a r es y s t e mi no p e r a t i o np h a s e i to p e r a t i o nm a n a g e m e n tp r o c e s ss t a n d a r d i z a t i o n c a l ln o tr e d u c es y s t e mm a n a g e m e n tc o m p l e x i t ya sw e l l s e l f - m a n a g e m e n t ,a st h ek e y t o w a r da u t o n o m i cc o m p u t i n g ,i st h em a i nr e s e a r c ha r e ai nd e a l i n gw i t ht h i sg r a n d e s t c h a l l e n g e “s e l f - h e a l i n g ”i so n eo f t h em o s ti m p r o t a n tf u n c t i o ni ns e l f - m a n a g e m e n t i t a i m st oi m p r o v et h ec a p a b i l i t yo fas o f t w a r es y s t e mi nd e a l i n gw i t hb u g sa n da d a p t i n g t oc h a n g e si ni t se n v i r o n m e n t i tc a ne l i m i n a t es a l i e n ts y m p t o m so f1 ts y s t e m m a n a g e m e n tc o m p l e x i t yp r o b l e m s e l f - h e a l i n gf o r m sa l la r e ao fr e s e a r c ht h a ti s i n t u i t i v e l ya p p e a l i n ga n di sg a r n e r i n gi n c r e a s e da t t e n t i o n t h i sp a p e rp r o p o s e sa ni ts y s t e ms e l f - h e a l i n gf r a m e w o r kb a s e do np r o c e s s m o d e l p r o c e s sm o d e ls u p p o r t ss e l f - h e a l i n gb yi m p l e m e n t i n gp r o c e s si m p r o v e m e n t l o o p t h el o o pi sc o m p o s e do ff o u rp h r a s e si n c l u d i n gd e f i n e ,m e a s u r e ,c o r r e l a t e ,a n d i m p r o v e t h e s ep h a s e si m p l e m e n t et h el o g i c a la b s t r a c t ,m e t r i c sp r o g r a m ,c o r r e l a t e m o d e l ,a n di m p r o v e m e n tm e t h o dr e s p e c t i v e l y a sa no p e nt e c h n i q u ef r a m e w o r k , p r o c e s sm o d e li m p r o v es y s t e mt h r o u g hi d e n t i f ya n d c o n t r o lt h ev i t a lk e yf a c t o r s w h i c hc a nc a u s ee x c e p t i o n t h u si tc a ni m p r o v et h es y s t e mr e l i a b i l i t ya n ds e r v i c e q u a l i t yw h i l er e d u c et h en e e do fh u m a ni n t e r v e n t i o n r e s e a r c ho np r o c e s sm o d e l e x t e n d e st h es o f t w a r ee n g i n e e r i n gm e t h o dw h oi sf o c u s i n go ns o f t w a r ed e v e l o p m e n t t h i sp a p e ri m p l e m e n t e dt w op r o c e s sm o d e l sw h i c hp r o v i d es e l f - h e a l i n gc a p a b i l i t y t o w a r dd i f f e r e n tt y p e so fe x c e p t i o n o n ei se x t e n d e ds p c ( e s p c ) m o d e lw h i c hd e a l s w i t hr a n d o mp e r f o r m a n c ee x c e p t i o n t h eo t h e ri sf u n c t i o np o i n ts l i c i n gm o d e l w h i c hm a n a g e ss y s t e mf u n c t i o n a le x c e p t i o n e s p cm o d e li si n t r o d u c e dt op r e v e n to rs e l f - h e a lp e r f o r m a n c ee x c e p t i o n e s p c e n h a n c e st h em e t r i c sp r o g r a mo fs t a t i s t i c a lp r o c e s sc o n t r o l ( s p c i i tc a nd y n a m i c a l l y a d j u s tt h et h r e s h o l do fp e r f o r m a n c ee x c e p t i o ni na c c o r d a n c ew i t hs y s t e ml o a d t h u si t c a nc l a s s i f yp e r f o r m a n c ed a t ad y n a m i c a l l y i no r d e rt om e a s u r ep r o c e s sp e r f o r m a n c e f r o mu s e re x p e r i e n c ep e r s p e c t i v e ,e s p cp r o p o s e dam e t r i c sc a l l e dp r o c e s s p e r f o r m a n c ei n d e x 佃p i ) p p ic a ns t a t i s t i c a l l yc a l c u l a t et h ep e r c e n t a g eo fp r o c e s s p e r f o r m a n c ew h i c hm e e t su s e r se x p e c t a t i o n d i f f e r e n tp r o c e s s e sc a nc o m p a r et h e i r p e r f o r m a n c eb a s e do np p i c o r r e l a t i o nm o d e li ne s p cc a l li d e n t i f yt h ev i t a lf e w f a c t o r sw h i c hc a u s ep e r f o r m a n c ee x c e p t i o n ,b a s e do nt h ec l a s s i f i e dp e r f o r m a n c ed a t a a n dt h es y n c h r o n o u sd a t ao fv a r i o u sf a c t o r s t w op e r f o r m a n c ee x c e p t i o ns e l f - h e a l i n g c a s es t u d i e s ,i nt h ed o m a mo fn e t w o r kp r o x ys e r v i c ea n dc o m b i n a t o r i a lo p t i m i z a t i o n a l g o r i t h mr e s p e c t i v e l y , a r ep r o v i d e d t h e s et w oc a s es t u d i e ss h o wt h a te s p cc a r l m e a s u r ea n da n a l y z ep e r f o r m a n c ef r o mu s e r sp e r s p e c t i v e ,a n dc a nd i s c o v e rd o m a i n k n o w l e d g et os u p p o r ts e l f - h e a l i n gi m p r o v e m e n t 1 1 1 浙江大学博士学位论文 t h i s p a p e rc o l l e c t e dc o r r e c t i v em a i n t e n a n c ed a t ao f2 1a p p l i c a t i o ns y s t e mo v e r3 y e a r s b a s e do nt h e s ed a t a ,t h r e ee m p i r i c a ls t u d i e sa r ec o n d u c t e d ,i n c l u d i n gk e y i m p a c t i n gf a c t o r so nm a i n t e n a n c ee f f o r t ,g r o w t hr a t eo fs y s t e mf u n c t i o n a le x c e p t i o n , m a j o rc l a s so ff u n c t i o n a le x c e p t i o na n di t ss o l u t i o n t h e r ea r et h r e em a i nf i n d i n g s f i r s t ,m a i n t e n a n c ee f f o r th a ss t r o n gl i n e a rc o r r e l a t i o nw i t hn u m b e ro fc h a n g er e q u e s t a n dd a t af i l eu p d a t e s e c o n d ,t h ec u m u l a t i v en u m b e ro ff u n c t i o n a le x c e p t i o nc a nb e d e s c r i b e db ya l le x p o n e n t i a lf u n c t i o n t h eo p e r a t i o ne l a p s et i m ea n ds y s t e ms t a b i l i t y i n d e x ( s d i ) a r et h eb a s ea n dp o w e r o ft h i sf u n c t i o n s d ir e p r e s e n t st h ew o r s e n i n g t r e n do fs y s t e mr e l i a b i l i t y t h i r d ,a r o u n d5 0 o ff u n c t i o ne x c e p t i o ni ss o l v e db yd a t a u p d a t ew h i l eo n l y2 0 b yc o d eu p d a t e t h e s er e s u l t si n d i c a t et h en e e do fs e l f - h e a l i n g t o o lf o c u so nd a t af i l ei n s t e a do fc o d e i tm o t i v a t e su so nt h er e s e a r c ho f f u n e t i o n p o i n ts l i c i n gm o d e l t h i sp a p e rp r o p o s e df u n c t i o np o i n ts l i c i n g ( f p s ) m o d e la san e wf u n c t i o n e x c e p t i o na n a l y s i sa n dp r o c e s s i n gm e t h o d b yu s i n gf u n c t i o np o i n ta n a l y s i sm e t h o d , f p sb r e a k sd o w nt h es y s t e mi n t oe l e m e n t a r yt r a n s a c t i o nc o m p o n e n t sa n df i l e c o m p o n e n t s i tt h e nc r e a t et h ed e p e n d e n c yr e l a t i o n s h i p s ,w i t hc o n s t r a i n to nf i l e a t t r i b u t e sa n dd e p e n d e n c yt y p e ,a m o n ge l e m e n t a r yt r a n s a c t i o n s t h e s ed e p e n d e n c y r e l a t i o n s h i p si sc a l l e df u n c t i o np o i n td e p e n d e n c eg r a p h ( f p d g 、a sw e l l b ya p p l y i n g s l i c i n ga l g o r i t h mo nf p d gf p sc a na u t o m a t et h ec a u s a la n a l y s i so fe x c e p t i o n , i m p a c ta n a l y s i so fe x c e p t i o nh a n d l i n ga n ds o l u t i o nm a t c h i n g f p sp r o p o s e d “e x c e p t i o n a lt r a n s a c t i o nr i s kn u m b e r ”t og a u g et h ei m p a c to fe x c e p t i o n o nb u s i n e s s i ta l s or e c o m m e n d st h em e t h o do ne s t i m a t i n gt h es i z eo f e x c e p t i o n a lt r a n s a c t i o n e x p e r i m e n tr e s u l ti n d i c a t et h ea p p l i c a t i o no ff p sm o d e lc a ni m p r o v es y s t e m r e l i a b i l i t ya n dr e d u c et 1 1 eo p e r a t i o nc o s t k e y w o r d s :s e l f - h e a l i n g ,p r o c e s sm o d e l ,e x t e n d e ds t a t i s t i c a l p r o c e s sc o n t r o l , f u n c t i o np o i n ts l i c i n g 浙江人学博士学位论文 第1 章引言 “我们是财富前1 0 强的公司,我们的r r 系统就像是高速奔跑的破车。” 某r r 维护支持人员 1 1 课题的背景和意义 r r 行业在过去的数十年中一直通过开发日益复杂的系统来解决多种不同的 业务问题,给人们的生产和生活带来了极大的便利。但这并不意味着人们步入了 一个高枕无忧的时代,因为在各种信息系统越来越庞大之时,人们陷入如何有效 管理自己的r r 系统的困境 1 【2 】【3 4 。加州大学在2 0 0 2 年3 月发布的研究结果 表明,根据系统类别的不同,运营管理的人员成本已经是软硬件购买成本的3 到1 8 倍 5 】。从商业系统运营过程中的主要问题来看,管理复杂r r 系统存在以 下挑战:首先,随着i t 系统的规模和异构性的加大,系统组件间的依赖关系越 来越复杂。第二,系统为了适应业务环境的变化需要进行频繁变更,导致i t 系 统的可靠性持续降低。第三,t 1 r 系统运营对管理人员的数量和技能提出了更高 的要求,r r 系统的运营成本特别是人员费用持续增长。这些管理问题形成了计 算机领域目前面临的重大挑战“1 1 r 系统管理复杂性问题”。 i t 系统管理复杂性问题晟明显的症状就是r r 系统故障频发,对管理人员技 术要求越来越高,相应的运营管理成本持续增加。人们之所以如此关注各种频发 的r r 故障,一方面是因为人们已经很难将r r 从日常业务中剥离出去,即使一个 很小的r r 子系统都包含着许多与之相关的各种组件,任何局部性的组件故障都 会制约集成化程度越来越高的r r 系统的整体运作:另一方面是由于在如此庞杂 的r r 系统中,探寻故障的根源或者分析变更的影响绝非易事,许多问题只能采 用临时的应急方案来解决,系统管理对人员要求越来越高,而且每次故障处理都 可能对系统产生其他副作用,这导致r r 系统故障发生频度越来越高,逐渐成并 发之势。 应对r r 系统管理复杂性问题需要从全新的角度考虑系统建模、度量和分析 方法。软件工程的工具、理论和分析设计模型等都是在高度认识到软件开发问题, 而对软件运营维护问题认识不足的环境下发展起来的。虽然r r 系统运营维护阶 浙江丈学博士学位论文 段的费用占了系统总拥有成本的7 0 一9 0 ,但是软件系统的运营维护领域并 没有得到学术界应有的重视,与之相关的论文占软件相关论文的比例不到1 6 7 【8 9 。支持软件开发的分析设计模型不能有效地在运营阶段继续得到应 用。实体关系图、数据流图、控制流图、状态转换图、u m l 等在开发阶段形成 的文档是面向用户需求的,不能在这些开发文档基础上直观地进行故障分析。而 且,这些文档包含的是非结构化的信息,有些是自然语言的形式,很难在这些文 档基础上自动进行故障的关联分析。此外,软件过程管理测重于从开发者角度改 善项目管理,较少考虑用户运营管理的需求,缺乏支持运营管理决策和异常分析 的度量体系以及持续改进运营状况的工程方法f 1 0 1 。 计算领域近期提出的以自主管理为核心的自治计算,是应对r r 系统管理复 杂性问题挑战的主流研究方向。“自修复”是自主管理的一项关键功能,其主要 思想是通过提高系统处理故障能力以及适应环境变化的能2 1 1 1 ,来缓解和解决 r r 系统管理复杂性问题最明显的症状。自修复“异常”的范围包括功能故障以 及由于环境变化引发的系统异常行为。如果说软件开发是“技术管理生产活动”, 实现生产活动管理的自动化,那么自修复则是“技术管理软件系统活动”,实现 的是软件系统异常管理的自动化。由于r r 系统对企业运营的影响越来越大,如 何提高r r 系统服务的连续性、维持系统的可靠性及降低其运营管理成本,已经 成为计算机领域研究的重要内容【2 【4 】,“自修复”这一新兴研究领域也相应地成 为一个很有前景的研究方向。 本文主要研究提高r r 系统自修复能力的框架及其支持技术,提出基于过程 模型的r r 系统自修复框架,并实现两个能处理不同类别异常的具体过程模型, 一个是处理随机性能异常的扩展统计过程控制模型,另一个是处理系统功能异常 的功能点切片模型。 t 本节对论文的研究背景、意义进行阐述;下节将介绍本文的相关领域研究现 状;第三、四节简述本文研究目标以及所取得的主要研究成果;最后一节介绍论 文组织。 1 2 相关研究 1 2 1 软件工程 自上个世纪6 0 年代开始,“软件危机”、“人月神话”、“需求管理”以及“项 目管理”等词语便成为企业界和r r 人关注的焦点。i t 界创造了“o o a & o o d ”、 “c m m ”、“i t 项目管理”等我们耳熟能详的软件工程方法【8 1 2 】 1 4 】 1 5 。 s t a n d i s h 研究组调查发现上述方法改善了开发项目的成功率( 如图1 - 1 ) 1 6 1 7 1 。 浙江大学博士学位论文 2 0 0 a r 件项目成功串 项目成功率 图1 1 软件项目的成功率 虽然软件工程的进展能改善软件项目的成功率,但是并没有显著改善软件系 统的运营状况,因为r r 系统生命周期的大多数成本都用于最初的交付以后 1 2 1 。 维护和演化软件的相对成本一直稳定增长,上世纪9 0 年代后占到整个拥有成本 的7 0 - - 9 0 1 8 1 9 2 0 ,而且大部分是针对突发事件的非计划性维护【2 1 。r r 界对r r 系统运营维护阶段的特征和规律的研究非常缺乏,运营维护管理过程一 般是随着时间进化而形成的,本质上是复杂的而且在混乱的边缘运转 2 2 2 3 1 。 i t 系统项目一般被看为技术投资,i t 运营管理的自动化带有很强的主观性, 缺乏理性的、量化的分析和控制【6 】【1 0 1 2 【1 3 。根据g a r t n e rg r o u p2 0 0 0 年公布 的调查结果,在导致服务不可用的非计划性宕机问题中,源自技术或产品方面其 实只占2 0 ,流程过程失误占了4 0 【1 2 】。 l e h m a n 定律描述了软件维护、变更的难题 2 4 1 。l e h m a n 第一定律描述说: “一个大型程序在不断变更中得到应用,或者逐步变得没有什么用处 2 4 1 ”。 l e h m a n 第二定律描述对一个系统变更的结果:“由于一个大型系统不断地变化, 它的复杂性增加了,这反映不断恶化的结构,除非进行维护或者化简它的工作。” 除了表明软件系统需要动态变化之外,l e h m a 定律也表明系统在运行过程中常 常处于恶化状态中。传统软件工程所强调的严格评审和测试并不能保证系统的正 确运行,就像最好的程序员不能保证程序无缺陷一样,利用最新技术建造的再好 的系统也无法保证在实际运行过程中能处理所有问题 2 5 。 软件工程的工具、理论和分析设计模型都是在高度认识到软件开发问题,而 对软件运营维护问题认识不足的环境下发展起来的。这体现在各种主流软件工程 书籍对相关领域的定义,例如, 1 5 定义“软件过程”为“制造高质量软件所需 要的任务框架”,通过实施过程管理,软件开发机构可以逐步提高其软件过程能 力,从根本上提高软件生产能j 3 1 2 6 :【2 7 定义“软件性能工程”为“一种系统 的、定量的方法,用于构建能够符合性能目标的软件系统”,软件性能工程要求 在软件开发过程中,从性能角度考虑基本体系结构以及其他设计因素,系统地规 划和预测正在形成的软件性能;f 2 3 1 1 2 8 定义“软件可靠性工程”为“针对软 件开发和测试的一门学科,它关注产品的可靠性、上线日期以及成本”,软件可 靠性模型是软件可靠性定量分析的基础,可以对各种软件开发技术的优劣作出定 3 浙江大学博:t 学位论文 量评估;在测试阶段,它能及时评估软件的开发水平,为评估开发进程提供定量 的、客观的依据,支持项目开发进度和资源消耗的决策。软件工程虽然也包含软 件维护活动的研究,如程序理解、维护过程模型、逆向工程等,但是这些领域的 研究所得到的关注比开发新系统少得多,也缺乏得到实际商业应用的工具和模 型。 从以上分析可以看出,传统的软件工程关注于如何构建无缺陷的系统。但是, 软件系统投入运营后,对软件系统进行修正、维护是必然的。软件工程还需要继 续发展,对软件系统运营阶段的重视程度和研究深度明显不能满足需要,有必要 研究软件系统运营阶段所需要的工程方法和模型。 1 2 2i t 服务管理 由于i t 系统生命周期的大部分成本都用于最初的交付以后 1 2 】,所以,1 1 r 系统运营维护阶段的标准化流程管理越来越得至口人们的重视,。目前已经形成r r 系统运营维护的服务管理框架r r i l ( i ti n f r a s t r u c t u r el i b r a r y ,i t 基础设施 库) 。i t i l 是有关r r 系统运营的管理流程的最佳实践。经过多年发展,于2 0 0 1 年形成了如图1 2 所示的框架【1 2 】【1 3 2 9 。 图1 - 2f i l l 的整体框架 按照i t i l 要求,系统问题的定位、分析和解决由服务支持流程框架来完成。 服务支持的主要内容是有关如何确保客户获得满意的i t 服务以支持组织的业务 运行。它包含事故管理、问题管理、配置管理、变更管理、发布管理5 个流程以 及一个管理职能服务台( 如图1 3 ) 。 i t i l 服务支持流程框架内各流程和管理功能的关系如下:厘釜台作为i t 服 务提供方与r r 服务客户或用户之间的统一联系点。一方面当客户或用户提出服 务请求或报告事故、问题时,服务台负责记录这些请求、事故和问题,并尽量解 决它们。不能解决时可以转交给相应的支持小组,并负责协调各小组和用户的交 浙江大学博士学位论文 互。另方面服务台根据支持小组的要求进一步联系客户,了解有关情况,并把 支持小组的处理进展及时通报给用户。当服务台碰到不能处理的事故时,便提交 给塞垫筐堡小组。事故管理小组要尽可能减少或消除r r 服务中断对业务的影响, 确保用户能够正常工作。闻星笪堡墨防止事故重复发生的过程,问题是导致一 起或多起事故的潜在原因。问题管理与事故管理有明显的不同,前者的主要目的 是找出事故产生的根本原因,而后者是尽可能快地恢复服务。变更是指在维护过 图1 - 3 服务支持流程框架 程中对系统或服务所做的各种改变,包括增补、移除和其他修改。銮夏笪堡包 括变更处理和变更控制,该流程旨在将有关变更对服务级别产生的冲突和偏离减 小到最低程度。事故管理、问题管理以及变更管理是i t i l 服务支持流程框架的 三个最重要的过程 3 0 l ,具体步骤如图1 - 4 所示。 问题管理变更管理 图1 4 事件管理、问题管n i , ;t n t 变更管理流程 i t i l 提供了i t 系统运营阶段所要遵循的服务管理流程,各大支持自治计算 5 一 惑一 篡,纛嘲 拳 浙江大学博士学位论文 或者类似于自治计算思想的厂商如s u n ,h p ,i b m ,m i c r o s o f t 等都宣称其新计 算框架与i t i l 兼容 3 1 】。i t i l 是管理标准而不是技术标准,它清楚讲述了各大 流程的基本概念、职责和功能、主要活动、成本效益等,但作为一个描述性的内 容体系,它没有阐述企业如何具体实施r r 服务管理,也没有说明流程在细节、 技术以及操作层面的具体实现 1 2 1 。 i t i l 在i t 外包领域得到了长期应用,但是长期的外包合作并不能使企业的 r r 系统达到“稳定状态”,即r r 系统运营质量并未得到持续改进,维护需求也 没有减少的态势,r r 外包的高开销没有得到缓解。g a r t n e r 调查研究表明,企业 座旦! ! ! l 建童处鱼蟹翌佳丞:量签丝这羞运萱鉴迅:但星羞丕篮隆堡暨垄复苤 廑【3 2 】【3 3 】。 1 2 3 自治计算 自治计算( a u t o n o m i cc o m p u t i n g ) 是美国i b m 公司于2 0 0 1 年1 0 月提出的 一个新概念,其灵感来自人体复杂的自主神经系统。在人无意识的情况下,自主 神经系统控制着体温、呼吸、心率等,使人的大脑从这些低级但是很重要的功能 中解放出来。自治计算期望能以同样的方式预测r r 系统的需求和清除故障,使 r r 系统在无需人工干预的情况下“聪明”地运行 1 】 2 】【3 【4 。i b m 将自治计算定 义为“能够保证电子商务基础设施服务水平的自主管理技术”,它开辟了一个新 的研究领域。自治计算所倡导的自主管理已经成为目前研究r r 系统管理复杂性 问题的主流。 图1 5 自主单元结构 自治计算的主要研究内容是使软件能够自动采取行动为基础设施提供自主 管理功能。m m 主张在网络服务( w e bs e r v i c e ) 的基础上,采用多个低级自主 单元组成更高级别的自主单元,建立类似于多a g e n t 系统的自主系统( 如图1 5 ) 3 4 3 5 3 6 。自主单元有两个主要组件:可管理组件和自主管理器。可管理组件 是将被管理的资源,可能是单一资源,也有可能是多个资源集合。自主管理器和 浙江大学博士学位论文 可管理组件通过传感器和效应器进行交互。传感器提供收集组件状态信息的机 制,效应器提供改变组件状态的机制。传感器和效应器为自主管理器提供检测和 执行界面。自主管理器是一个实现自主管理功能的控制环路组件,由监视 ( m o n i t o r ) 、分析( a n a l y z e ) 、计划( p l a n ) 以及执行( e x e c u t e ) 四个步骤( 简 称m a p e ) 组成。各个步骤的内容为: 1 ) 监视负责收集、汇总、过滤、管理和报告从一个组件那里收集到的 详细信息( 规格、拓扑等) 。 2 ) 分析负责对复杂的情况进行建模( 时间序列预测,队列建模) 。它 们使自主管理器能够了解1 1 r 环境并帮助预测未来可能发生的情况。 3 ) 计划负责设计实现目标所需采取的行动。计划机制使用政策信息来 指导自己的工作。 4 ) 执行负责控制计划的执行,同时考虑到过程中的更新。 自主管理器的m a p e 控制环路包含自配置、自恢复、自优化和自保护四个 类型,分别实现四个自主管理功能( 如表1 1 ) ,它们所使用的数据和信息存放 在自主管理器的知识部件中,并在这里实现这些数据和信息的共享。 表1 1 自主管理功能 属性内容 自配置能够在运行中动态地对自身进行配置,当在一个计算机系统环境中部 署薪组件或发生变化时,基础设施能够进行调整在人工干预最小 的情况下。 自修复基础设施能够检测到计算机系统组件的故障,然后修复或绕过这些故 障,提供不问断的业务应f f n - - f 用性。 自优化指计算机系统环境能够在人工干预最小的情况下高效地分配资源和提 高使用率。 自保护当敌意或入侵行为发生时,一个自保护环境能够检测到它们并采取自 主措施,使自己不易受到未经授权的访问和使用、病毒、拒绝服务性 攻击及一般故障的破坏。 自治计算是计算机领域的一个远景目标或者是一种计算思想 3 9 ,它是一 个全新的领域,它的实现需要全新的i t 系统基础设施,需要企业、学术界甚至 政府用全新的模式来分析、设计、开发和管理i t 系统 1 2 1 1 4 0 。自治计算的基础 w 曲s e r v i c e 的广泛应用也需要一段很长的时间【4 0 1 1 4 1 】。自治计算的研究还 处在起步阶段,这一新计算思想的实施在实际应用上和基础理论研究上都面临着 许多悬而未决的问题和挑战【4 2 】 4 3 ,需要多学科交叉研究试验、或者需要新兴学 科取得突破,而且关键的技术突破项目没有明确的量化目标和时间表 4 4 4 5 1 。 自治计算在应用领域取得了一些进展,各大厂商优先对其传统管理软件加入 浙江大学博士学位论文 自主管理功能,管理软件管理的对象往往仅局限于各厂商的产品,虽然出现许多 原形实验系统,但还缺少增强实际运行的复杂商业系统自主管理能力的案例。例 如,i b m 在提出自治计算以来的四年多里,在t i v o l i 平台下实现了i b m 一部 分产品间、以及i b m 产品与一些开源软件( 如a p a c h e ) 间的互连和综合管理的 改进。h p 也在其o p e n v i e w 软件中嵌入了提高h p 管理软件自主管理能力的功 能。但是有评论指出,i b m 提出自治计算的真正目的是提高其服务器产品以及 高端服务的能力,为客户构建更有弹性的r r 基础设施,并将基础设施作为r r 与业务流程的接口,而不仅仅停留在单个业务系统的建设和竞争上【4 4 】。 1 2 4 自修复技术 随着“自治计算”的提出,软件自修复技术的研究开始兴起,但是对自修复 的定义、范围以及作用,不同的学者有着不同的观点【3 7 】【3 8 】。在a c m s i g s o f t w o r k s h o po ns e l f - h e a l i n gs y s t e m s ( w o s s 0 2 ) 会议上,研究人员对容错技术和自 修复的关系、自修复的范畴等进行进一步的讨论,认为自修复萱左量指丕统处堡 昱堂的能左:墓达是堂丕筮适厘巫缝变丝数篚左 ! ! 】。 当前学术界和企业界进行的自修复的相关研究很多,它们往往和容错( f a u l t t o l e r a n c e ) 技术、可靠性系统( d e p e n d a b l es y s t e m ) 、软件形式化方法( f o r m a l t e c h n i q u e ) 、分布式智能系统( d i s t r i b u t e di n t e l l i n g e n ts y s t e m ) 普适计算 ( ( u b i q u i t o u sc o m p u t i n g ) 、网格计算( g r i dc o m p u t i n g ) 等紧密联系。下面将 介绍近期自修复技术的研究进展。 p h i l i pk o o p m a n 对自修复技术的相关研究进行整理,认为自修复技术在可靠 性系统( d e p e n d a b l es y s t e m ) 中已经得到研究,例如采用冗余措施的容错技术等 【3 7 。p h i l i p 整理并提出了自修复的问题空间,他认为自修复包含了故障模型 ( f a u l tm o d e l ) 、系统响应( s y s t e mr e s p o n s e ) 、系统完整性( s y s t e mc o m p l e t e n e s s ) 以及设计环境( d e s i g n c o n t e x t ) 这四部分。p h i l i p 还将自修复的三个研究项目 ( r o b u s ts e l f - c o n f i g u r i n ge m b e d d e ds y s t e m s ,s e m a n t i c a n o m a l yd e t e c t i o n , a m a r a n t hq o s ) 的内容进行分解,分配到上述四部分问题空间中。 m m 提出公共事件基础架构( c o m m o ne

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论