(计算机软件与理论专业论文)基于集群和分区技术的高可用性系统的研究和开发.pdf_第1页
(计算机软件与理论专业论文)基于集群和分区技术的高可用性系统的研究和开发.pdf_第2页
(计算机软件与理论专业论文)基于集群和分区技术的高可用性系统的研究和开发.pdf_第3页
(计算机软件与理论专业论文)基于集群和分区技术的高可用性系统的研究和开发.pdf_第4页
(计算机软件与理论专业论文)基于集群和分区技术的高可用性系统的研究和开发.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(计算机软件与理论专业论文)基于集群和分区技术的高可用性系统的研究和开发.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西北工业大学硕士论文 摘要 随着网络的发展,多层分布式集群体系逐渐成为应用趋势,不仪具有更高 性能价格比,而且还提供了良好的可扩展性。在过去,高可用性一般就是需 要系统能够提供不问断的服务,系统能够及时的处理硬件故障就可以了。但是, 由于全球经济的不断发展,企业对系统的高可用提出了更高的要求。要求系统 不但能提供不问断的服务,还要求系统提高在资源管理方面的有效性,不断加 强系统在管理上的灵活性。如今在高可用性的基础上自律计算的概念被提了出 来。通过自律计算,机器可以自我管理、自我恢复、自我保护、自我优化。换 句话说,机器能够像人的神经系统一样工作,在不需要外界的干涉的情况下, 控制自己的各项功能。这样的系统能够自我运行,并根据外界的条件及时纠正 自己的行为,在各种负载情况下最有效的工作。 本文作者参加了一个高可用系统一虚拟操作环境系统的开发工作,该系统 主要用到集群技术,为用户提供了图形化的资源管理工具,实现系统的高可用 性和自律计算。在开发过程中,作者对资源的动态分配作了深入的研究。在实 现方面,作者就自己参与的策略管理模块,进行了详细的阐述。最后,对系统 中存在的问题和后续工作进行了简单的总结。完成了本论文。 虚拟操作环境系统的丌发基于可分区服务器灵活的资源配置机制。结合集 群管理软件控制服务器,管理共享硬件资源的分区。通过虚拟操作环境系统, 服务器之问可以共享硬件资源,并根据需要重新分配或添加新的硬件,使系统 资源得到了高效的利用并使系统具有高可扩展性;当硬件发生故障时,虚拟操 作环境系统可提供灵活、及时的系统恢复,提高了系统的可用性。 本文首先对分区和集群技术进行了深入的研究,然后根据多层分布式集群 体系的思想,在此基础上设计并实现了虚拟操作环境系统,对虚拟操作环境系 统的体系结构,功能模块,理论基础,设计和实现进行了阐述,主要研究了系 统的设计和实现。最后,对系统中存在的问题和后续工作进行了简单的总结。 虚拟操作环境系统以随可分区服务器一起投入市场,获得了用户的好评, 并取得了良好的经济效益。 关键字: 高可用性;分区;虚拟操作环境:自律计算;集群: 西北工业大学硕士论文 a b s t r a c t t ht h ec o m m u n i c a t i o na n dc o m p u t e rt e c h n o l o g y d e v e l o p i n gr a p i d l y t h ee n t e r p r i s em o r ea n dm o r e d e p e n do n t h e c o m p u t e rs y s t e ma n dt h e n e t w o r kt e c h n o l o g y s i n c et h ee n t e r p r i s e sa li o v e rt h ew o r l dt h i n km u c h o ft h ec o m b i n a t i o no fc o m p e t i t i o na n dc o o p e r a t i o n ,t h e r ei s m o r ea n d m o r er e q u e s tf o rt h e s y s t e mh i g ha v a i l a b i l i t y i nt h ep a s t ,t h eh i g h a v a i l a b i l i t yn e e d st h es y s t e mp r o v i d et h ec e n t i n u a b l es e r v i c ea n d d i s p o s et h e s y s t e mh a r d w a r ef a u lti nt i m e a st h ew o r l de c o n o m v d e v e l o p i n g a n dt h e c o m p e t i t i o n p i c k i n gu p ,h i g ha v a i l a b i l i t y h a st h en e w m e a n i n g i tm e a n s n o t o n l y t h ec e n t i n u a b l es e r v i c e b u ta l s ot h eh i g hr e s o u r c e m a n a g ee f f i c i e n c y a n d t h e c o n v e n i e n c e f a c ili t y s y s t e mm a n a g e m e n t b u tn o w a u t o n o m i cc o m p u t i n g h a sb e e n p r e s e n t e db a s e d o f h i g ha v a i l a b i i i t y t h ea i m so fa u t o n o m i e c o m p u t i n g a r es e l f m a n a g i n g ,s e l fc o n t r o l ,s e i fo p t i m i z e & s e i f r e c o y e r y 。 t h ea u t h o ro ft h i sa r t i c l eb eam e m b e ro ft h e d e s i g n i n ga n d i m p l e m e n t i n gt h eh as y s t e mv i r t u a lo p e r a t i o ne n v i r o n m e n t ,w h i c hb a s e d o nt h ec l u s t e r ,p o l i c yb a s e da n da u t o n o m i cc o m p u t i n g ,p r o v i d i n gg r a p h i c t o o l st om a n a g e rt h eh a i nt h ep r o c e s so fd e v e l o p m e n t ,t h ea u t h o rd e e p l y s t u d i e dt h es y s t e m ,a n dt h e nf i n i s h e dt h ep a p e r f i r s t l y ,t h ep a p e re x p l a i n sh i g ha v a i l a b ii ii t ya n dp a r t i t i o n a b l e s e r v e r ,t h e nd e s c r i b e dt h e s t r u c t u r ea n dt h ef o u n d a t i o nm o d u l e s o fv i r t u a l o p e r a t i o n e n v i r o n m e n t s y s t e m ,a n a l y s e st e c h n o l o g y c o n d i t i o n st or e a l i z ev i r t u a lo p e r a t i o ne n v i r o n m e n ts y s t e m ,a n dm a i n l y s t u d i e sd e s i g na n dr e a l i z a t i o no ft h es y s t e m i nt h er e a l i z a t i o no ft h e s y s t e m ,t h ea u t h o rd e s c r i b e dt h ed a t a b a s em o d u l e ,p o l i c y m o d u l ea n d t h ec o m p o s i t i o nc h a n g em o d u l ei nd e t a i l ,w h i c h m a i n l yd e v e l o p e db y h e r s e l f a t1 a s t ,a n a l y s e st h ed e f i c i e n c yo ft h es y s t e ma n dt h ew o r k i nt h ef 1 1 t t l r e k e y w o r d s h i g ha v a i l a b i l i t y :v i r t u a lo p e r a t i o n e n v i r o n m e n t p a r t i t i o n a b l es e r v e r :s n m p ;c l u s t e r 西北工业大学硕士论文 1 1 研究目的及意义 第一章绪论 在过去的半个世纪里计算机技术取得了惊人的进步,这是在其它工业中是前所未 有的。随着计算机,网络及通信等技术发展,全球的经济n - n 了飞速的发展。同时, 企业组织和集团组织之间的竞争也日趋激烈。随着企业需求的不断变化,为了在市场 中保持竞争力,企业对信息技术( i t ) 策略的依赖进一步加强了。当今的企业依赖信息 技术( i t ) 来取得竞争优势。无论是以何种形式,如提高效率与生产率:完善产品质量 与服务,缩短产品面市时间等等,i t 已经成为企业密不可分的一部分,它已经成为高 投资返还与使企业受益的关键。计算机系统和通讯系统的陛能直接影响着企业在市场 上的表现。同时,客户对系统的可用性要求不断提高,以及客户应用系统尤其是关键 领域的关键陛应用对可用性要求的不断增加,如何建立并且应用真正高可用性的系统 方案,已成为广大用户的一个迫切需求。 在这个信息无所不在的社会旱,计算机系统和通信系统所面临的最关键问题是如 何建立并维持系统的稳定陛和运行的持续眭。“高可用性”这个概念主要是用来描述 主机眭能的。例如,一些公司的数据库内包含了公司的关键数据,这些公司在使用数 据摩恢复软件的同时也使用事务处理系统来保护企业的数据。但是,现今企业的关键 性数据变得越来越难以保护了,这是因为大量的数据变得更加多样、更自1 1 随机且更为 复杂。高可用性并不仅仅意味着避免故障,对于一些企业关键应用来说,足够的响应 时间变得和系统正常工作时间同样重要了。 综上所述,我们可以看到,高可用性已经成为计算机系统和通汛系统设计所追求 的目标之,同时也是评价一个系统的质量的一个重要标准。高可用性的问题已经成 为当前网络管理系统的研究热点。目前,已经有很多技术的采用来实现系统的高可用 性,像集群技术,基于策略的资源分配等等。将已有的技术运用到系统的设计中,使 系统达到高可甩眭的研究和实践是非常必要的。 1 2 研究工作概述 本论文是按照作者承担的研究和开发工作来安排的,论文的重点在对高可用性 的虚拟操作环境系统进行的理论研究和设计实现两方面 第1 页 西北工业大学硕士论文 论文的主要工作 1 )对高可用性系统进行了深入,全面的探讨。 2 )对支持高可用系统的集群,自律计算,基于策略的动态资源分配技术进行 了探讨。 3 )对虚拟操作环境系统的理论进行了研究和分析,介绍了系统的设计思想与 结构,对系统的总体功能进行了概要的说明,并详细阐述了系统与用户界面部分的设 计与实现。在实现中,主要运用了面向对象的设计模式思想,考虑了系统的可复用性 和可扩展性。事件处理主要采取了o b s e r v e r 模式对象行为型模式,定义对象| 自j 的 一种一对多的依赖关系,当一个对象的状态发生改变时,所有依赖于它的对象都得到 通知并被自动更新,可以在不改动目标和其它的观察者的前提下增加观察者,增加了 代码的可扩展性。 论文的结构和章节安排 本文共分五章。 第一章绪论 简要介绍了本文的研究背景和研究意义,以及论文内容的安排。 第二章高可用性的概述 阐述了系统的高可用性的概念和需要解决的问题。介绍和高可用性相关 的自律计算概念以及自律计算概念提出的背景,自律计算的含义。 第三章虚拟操作环境系统概述 对虚拟操作环境系统的应用背景,体系结构,主要功能进行介绍。 第四章虚拟操作环境系统的理论基础 对支持虚拟操作环境系统的计算机技术进行了分析。对虚拟操作环境系 统的硬件基础,系统特点,系统高可用性的实现进行了概述。 第五章虚拟操作环境系统的设计和实现 给出了虚拟操作环境系统的总体设计,并对作者担当的策略管理模块, 构成变更履历模块c e l l 追加删除中的具体方法和关键技术进行了描述。 第2 页 西北工业大学硕士论文 第六章结束语 总结了论文的研究成果,并展望了后续的研究工作。 第二章高可用性系统概述 2 1 何谓高可用性系统 高可用性系统主要用在大型的计算项目和控制项目上,人们评价一个系统是否是 高可用性系统,主要的判断方面就看该系统的持续工作时间。持续工作时间越长,就 说明系统越接近于高可尉胜。基本的高可用系统主要的评价目标是: 能够提供不问断的服务。这里的不间断的含义就指的是系统的连续运行时间, 对用户来说,这个时间越长越好,如果能够达到全年的3 6 5 天,每天2 4 小时不间断眼 务是最好的。 系统不会出现硬件故障而宕机。当系统中的某更件出现故障时,系统迅速的 解决掉故障,保证系统能正常的运行下去。 高可用性具体定义如下: 计算机系统的可用性( a v a i l a b i l i t y ) 是通过系统的可靠性( r e l i a b i l i t y ) 和可维 护性( m n i n t a in a b int y ) 来度量的。工程e 通常用平均无故障时间( m t t f ) 来度量系统的 可靠性,用平均维修时间( m r ) 来度量系统的可维护性。于是可用性被定义为: m 1 t f ( m 丌f + m t r ) * 1 0 0 业界根据可用性把计算机系统分为如下几类: i 佣比例年停机时间 可用性分类 ( p e ic e n ta v a i l a b i l i t y )( d o w n t i m e y e m - ) ( a v a i l a b i l n y ) 9 9537 天常规系统( c o n v e n t i o n a l ) 9 998 8 小时 i 佣系统( v a i l 曲1 e ) 9 9 9 95 2 6 分钟离一 用系统 第3 页 西北工业大学硕士论文 nrvu_p ; ; ( h 1 曲l 。a v 8 1 l a b l 。)j fl “u _ 一u _ _ _ 一u _ u _ _ _ _ u _ 一_ _ _ _ _ - 一_ _ _ _ _ _ u _ n _ u _ lu _ t f f i l l tr p e l l i p n t 。 表2 卜i 计算机系统分类 现在,随着计算机技术的应用面越来越广,它的应用领域已经深入到了各行各业, 人们对系统的高可用性也提出了更高的要求。特别是自律计算概念的提出将高可用性 系统提升到更高的层次。2 0 0 1 年1 0 月,i b m 正式提出了一种称为自律计算( a u t o n o m y c o m p u t i n g ) 的概念。自律计算的灵感来自人体复杂的自主神经系统,而所要解决的则 是日益复杂的运算环境所面临的管理与成本问题。i b m 将自律计算定义为“能够保证 电子商务基础结构服务水平的自我管理( s e l fm a n a g i n g ) 技术”。之后惠普、富士通、 s u n 等公司均发表了自律计算构想。n e c 于2 0 0 3 年1 0 月2 2 日发表了旨在实现自律计 算的新构想“w & b w l o ”。n e c 将自律计算所需的功能定义为3 个方面,即“自律”、“虚 拟化”和“分散”。n e e 将按照v a l l i m o 构想,在2 0 0 4 年内在产品中嵌入必要的功能。 自律是一种当系统出现故障时能够自动恢复的功能。包括处理负荷过高时,自动分散 负荷的功能等。虚拟化是种在连接多个服务器的环境中,逻辑上能够将多台服务器 作为l 台服务器运用的技术。可提高扩展性能及降低运用负荷。分散是一种在网络环 境中确保信启连动的功能。有助于在异地建立灾害对策站点等。 2 2 自律计算概念的含义 自律计算指的是像生物一样能够自行控制自身状况,使信息系统本身具备维持整 个系统最佳工作状态的功能。i b m 副总裁阿兰卡耐克为一个自律计算系统定义了八 个关键的特征: 1 系统应该实现管理的一元化。因此,系统为了管理自己,应该能够得到各 个组件的详细信息,现在的状态以及于别的系统的连接状况。 2 系统可以根据变化的和不可预测的条件,完成自身的设置或重新设置。例 如,在自率的系统中,由运行的适应算法可以得到当自口的条件下的最佳配置,从而使 系统达到最佳的性能。 3 系统将持续地优化其自身行为。 第4 页 西北工业大学硕士论文 4 系统应该可以在不失去数据和不需要处理上显而易见的地延迟上实现恢 复。 j 系统必须可以保护自身。自律系统必须运用各种技术去发觉和阻止来自病 毒和黑客的攻击。 6 系统应该感知并目适应它所处的环境。这个需要系统能够根据特制的格式 提供实施的信息。 7 系统应该在基于个开放的标准的异构系统中仍能发挥功能。 8 系统能够在隐藏其复杂f 生的前提下,实现各种各样的功能。这也是自律计 算最主要的目的。 2 3 自律计算对可分区服务器的意义 分区技术可以提高服务器的可靠性,提高服务器的利用率,提高服务器的性能,。 但是同时也增n y 系统的使用难度。本来机器的硬件就复杂为了合理的利用资源控制 的复杂程度就更大了。 就可分区服务器的各个分区而言仍然需要进行各自独立的系统管理。各分区运行 着不同的工作任务。所以各个分区的操作系统版本、应用程序或者用户等各个方面都 不同。这类分区会要求获得几乎等同于独立系统的管理水准。 在多分区的j 隋况下,如何跟踪各个硬件和软件资源的状态,实行高效的资源管理 和利用。如某个分区由于负载过大需要从闲置的或从别的作业优先级较低的分区中加 入部件,某个分区如果出现错误,需要启动另外一个分区等等。这些无疑加大了系统 的使用难度。 如果将自律计算的概盎睫| 用到这些可分区服务器上,根据这些服务器的特点设计 一种自治系统,以实现这些可分区的服务器的自我管理。这无疑会大大提高这些可分 区的服务器的使用效率和高可用性。本文后面的篇章将朝着这个方向的展开讨论,并 给出一个称为虚拟操作环境的具体的软件的实现过程。 第5 页 西北工业大学硕士论文 第三章虚拟操作环境系统概述 本章将对一个称为虚拟操作环境的软件的设计思想进行讨论。陔软件是针对可分 区的服务器的一个自律计算软件。其主要目的是在对用户隐藏其复杂性的前提下,实 现服务器的各种各样的功能。让系统实行一定程度的自我管理,从而降低服务器管理 的复杂| 生,提高服务器的使用效率。 3 i 术语简介 为了后面的讨论方便,这里先对一些后面要用到的术语进行说明。 如前章所述,支持虚拟操作环境的可分区的服务器系统中,硬件资源如c p u 、 内存和i 0 等被组织为一个物理单元,这样的物理作为可分区的服务器分配资源的 最小单元。这样的物理单元称为“c e l l ”。因现在的硬件技术限制,一个f s b ( f o n t s i d eb u s ) 最多可接4 个c p u ,因此一个c e l l 中最多有四个c p u 。如果要得到4 位 以上的系统,则需要将多个f s b 接到一块。 下图是一个c e l l 的示意图。 2 分区 图3 1 - 1c e l l 可分区服务器可将一个服务器分成若干个分区,每一个分区都成为一个独立的服 务器。因此通过分区技术,一个高端服务器成为了若干个小的服务器。在物理分区 第6 页 西北工业大学硕士论文 的服务器中,使用。个c e l l 运行一个操作系统映像就成为了一个分区。电可以使 用几个这样的c e l l 组合在起运行一个操作系统映像,成为一个功能更强的分区。 在硬件技术和操作系统技术的支持下,这样的分区可以在不停止运行作业的情况下 动态地增加或册4 除一个c e l l 。 3 2 虚拟操作环境系统的体系结构 图3 2 1 虚拟操作环境系统的体系结构 在进行虚拟操作环境的设计之前,我们有必要了解一下虚拟操作环境的硬件基 础。虚拟操作环境的开发,是基于某型号的可分区服务器。在服务器为了实现高可用 性,在硬件基础上已经采用了某些提高可用性的方法。 该可分区服务器是由一些筐体组成。每一个筐体为一个3 2 路可分区的s 艘( 对称 多处理器) 服务器,它拥有八个c e l l ,每个c e l l 中有四个c p u ,通过对硬佑拄行分区, 每一个分区可以运行一种操作系统( h p - u x w i n d o w sx e l i n u x ) ,每个分区至少有一 个c e l l ,所以个筐体能够有八个操作系统。 浚可分区服务器可以由1 6 个这样的筐体组成,总共有1 2 8 个分区,5 1 2 个c p u 。 虚拟操作环境可以控制可分区服务器来管理共1 2 8 个共享硬件资源的分区,通过有效 地控制5 1 2 - w a y 硬件资源,虚拟操作环境可以把这个5 1 2 一w a y 的服务器当作简单的1 2 8 个4 - w a y 系统节点来处理。这是一种巩固服务器的新形式,我们把它命名为“服务器 集群”。 该可分区服务器是下一代的服务器产品( n e x tg e n e r a t i o ns e r v e r ) 。它是一个和 第7 页 西北工业大学硕士论文 可以组装3 2 或者5 1 2 个 n t e l 的m c k i n i e y 处理 该服务器有以下高可用特征: 可以控制5 1 2 路实现系统的高可用性,节点通过高速的c r o s s b a r 相连 通过各个服务器和c r o s s b a r 的自由组合来支持节点问的高速通信 允许逻辑的配置来实现无单点故障 使用分区的概念来管理硬件资源,每一个分区可以运行一个o s ,可以对外提供 一个服务,也称为一个s e r v e r 提供了更高的可靠性和更好的r a s 功能 实现了5 1 2 路的统一的系统管理 虚拟操作环境是为了自动灵活的控制可提供分区服务的计算机的分区构成变化而 设计的软件。在虚拟操作环境系统中可以同时运行多个不同的操作系统,这些操作系 统通过虚拟操作环境对可分区的硬件进行管理。硬件的配置管理完全由软件系统来完 成。虚拟操作环境系统实际上是位于硬件系统和操作系统之间的配置控制管理模块。 而该系统采用和实施的所有管理和配置控制都是基于策略来完成的。这样使得系统的 各项实施动作部是基于策略库中所定义的策略来完成的,从而保证了系统运行的科学 性,提高了整个系统资源的利用率。 3 3 虚拟操作环境系统的主要构成 虚拟操作环境由以下的模块构成。 虚拟操作环境s e r v e r 虚拟操作环境g u i 筐体内的集群通信驱动器 i s p ( i n t e g r a t e ds e r v i c ep r o c e s s o r ) 虚拟操作环境管理控制台 下图是各个功能模块的配置图: 第8 页 的容兼 x叫u 胪s洲州毗畎 俨瓢 西北工业大学硕士论文 图3 3 - 1 虚拟操作环境系统的模块配置图 i s p 是内置的小型处理器,为了强化服务型计算机的r a s 等功能。以i n t e l 为代 表的各个代理商共同决定了i a - 3 2 和i a - 6 4 两种体系结构计算机的s p 和本体的接口, 以及和外部的管理者的接口,这些被定义为i p m i ,智能平台管理接口。 拥有独立的o s 和外部接口,通过独立的l a n 和外部的管理者( c o n s o l e ) 进行通讯。 虚拟操作环境a g e n t 存在于管理对象的可分区服务的分区中,实际上是这个分区 中运行的操作系统中的一个后台守护进程。 筐体内通信驱动器存在于管理对象的可分区服务的分区中,实际上是这个分区中 运行的操作系统内核中的驱动器。 控制f w 是i s p 的f w 的部分,它作为管理对象,在可分区服务器的i s p 中操作, 也是对系统处理器进行管理操作的固件的一部分。尽管它主要是虚拟操作环境管理控 制台的一一个接口,但是它是整个固件的一部分,提供般的系统管理功能。 虚拟操作环境管理控制台就是所谓的管理对象系统,由独立的计算机构成,通过 n e t w o r k ( 通常是l a n ) 连接。管理对象系统通过网络连接各个分区和i s p ,这种构成,使 虚拟操作环境管理控制台可以直接与各个分区中的虚拟操作环境代理通信,也可以直 接与i s p 通信。 下图描述了虚拟操作环境系统的详细功能: 第9 页 西北工业大学硕士论文 图3 3 - 2 虚拟操作环境的详细功能图 3 4 虚拟操作环境系统的实现功能 3 4 1 监视功能 虚拟操作环境监视系统中的所有硬件资源,包括构成分区的资源,也包括不构 成任何分区的预备资源部分。系统主要监测如下的资源状态。 各个分区的当前的负荷状况 第l o 页 西北工业大学硕士论文 夺c p u 负荷 夺内存负荷 夺s w a p 状况 夺各存贮器的空闲容量和使用状况 夺各通信路的使用状况 故障信息 夺分区中每一个使用中的i o 设备的错误发生状况 夺( ) s 输出的错误信息 夺s p 检查出来的硬件故障 各分区的状态 夺o s 执行中o ss h u t d o w n 中o s 重启中o s 停止中 夺o s 的p a n i c 的发生 夺分区的m e m o r y 量c p u 数 夺分区中部件在机器中的物理位置 硬件构成 夺0 s 识别的分区构成。重启的设备设定等 夺没有构成分区的预备部件 夺故障发生后,用于替换的部件 夺各种部件工作状况反映( p c i 版,p o w e rb a y ,风扇等各种部件) 这些信息,大部分是虚拟操作环境通过机器上的硎和i s p 得到的,另部分是通 过运行在可分区服务器上的操作系统提供的。这些信息以分区为单位存储在虚拟操作 环境的数据库中。 另外,负荷信息按照用户的要求在虚拟操作环境管理控制台上以图形方式表示。 故障信息,在虚拟操作环境管理控制台上,按照时间顺序以 o g 记录表示。更进一步, 构成信息有两种观点,一种是以逻辑构成信息为基础的分区为单位,另一种是以物理 构成信息为基础的硬件部件为单位,按照用户要求在虚拟操作环境管理控制台上显示。 第1 1 页 西北工业大学硕士论文 3 4 2 分区控制功能 虚拟操作环境能够通过向管理控制台发送命令来控制目标系统内各个分区的动作。 以下指示了可以进行的动作。 分区上的操作系统s h u t d o w n r e b o o t 分区上的操作系统重启 分区的r e s e t 分区电源o w o f f 分区上部分部件的d i s a b l e e n a b l e 操作 分区间资源的动态分配( 以c e l l 为单位) 分区上部件间连接状况的配置和设定 另外,在分区上的操作系统要求对应的聊进行r e s e t 的时候,f w 必须通过控制f w 向虚拟操作环境传递控制信息。虚拟操作环境以操作系统的r e s e t 要求为契机,执行 分区的构成变更,然后进行真正的r e s e t 要求。 这些功能在以下场合使用。 按计划实行构成变更的时候 p a u i c 发生的时候 o s 停止的场合 h w 故障发生的场合 3 4 3 测试和诊断实行功能 虚拟操作环境可以指示对目标系统内的硬件部件实行测试和诊断。虚拟操作环境 管理控制台保存测试和诊断程序,i s p 中提供阿p 服务功能。虚拟操作环境控制f w 执 行测试和诊断的时候,i s p 通过f t p 服务从虚拟操作环境管理控制台下载测试和诊断 程序,对指定的部件进行测试和诊断。测试和诊断是以可替换的部件单元( 一般c e l l ) 为基本单位。 通过测试和诊断对通常不使用的预备部件进行检测,确认它是否可以使用。 第1 2 页 两北工业大学硕士论文 3 4 4 模拟故障发生功能 虚拟操作环境可以肘目标系统内的操作系统和硬件部件执行模拟故障发生功能。 对于操作系统,通过虚拟操作环境代理模拟s t a l1 ( 虚拟操作环境代理无应答指示) 和 p a ! n i c 指示( 通过虚拟操作环境代理或控制f w ) 。对于硬件部件和分区构成单位,构成 单位,模拟永久故障发生和临时故障发生。 这早的模拟故障,是为了提前确认用户使用虚拟操作环境设定的故障发生时的构 成变更指示,可以正常动作。同时也可以提前知道伴随构成变更的回复时间需要多少。 因此,通常使用中不使用这个功能,其他的功能因设定的安全管理的不同而不同。另 外,在虚拟操作环境管理控制台和控制w 之间要添加设备,以防止因失误而导致的通 常运用中事故。 3 4 5 构成变更指示功能 用户可以在特定的条件下,向系统发出构成变更指示和分区控制指示,系统应该对 指示进行接收,并且按照指示完成相应的构成变更和分区控制。 根据时间指定进行构成变更和分区控制 根据发生的特定故障进行构成变更和分区控制 根据负荷变化进行构成变更和分区控制 即时进行构成变更和分区控制 虽然用户严格指定h l v 部件等可以指示分区构成,但是不明确的分区构成指示基本 上也是可以的。虚拟操作环境管理控制台在数据库中存储的信息和知识将使这些! 模糊 指示具体化。 非实时的构成变更指示决定是否发行监视功能收集的监视信息,如果决定发行可 以立即发行。用户可以使用两种用户接口进行构成变更指示,一种是g l i , - - 种是描述 语言。 3 4 6 构成变更功能 。 分区的构成变更实际上是通过i s p 和f w 进行的。虚拟操作环境向i s p 和f w 发出 指示进行分区构成变更,i s p 和f w 控制分区进行构成变更同时将分区构成变更时的信 息和状况实时反映给虚拟操作环境。另外,虚拟操作环境管理控制台在构成变更之后, 第1 3 页 西北工业大学硕士论文 常常将和现在的构成的差异作为历史纪录存放在数据库中。这样,就可以知道h w 部件 的哪一个分区可以使用,x , j - n 故障历史纪录,就可以把握因果关系。 3 。4 7 筐体内集群通信功能 虚拟操作环境另一方面也支持分区间的高速通信。这是一种使用通信线路 ( 通常是c r o s s b a rs w i t c h ) 在目标系统的c p u 内存单元之间通信的功能。作为这个功 能的接口,准备了一个完全类似于普通的l a n 的模拟接口。这个l a n 接口作为新的l a n 使用高速通信线路,具有不用改变应用程序就可以使用的优点。 3 4 8 其他功能 3 4 8 1i n 部件交换的监视功能和日志功能 虚拟操作环境能监视h 1 i y 部件的插拔。h l v 部件交换的时候,新插入的h w 部件作为 旧部件的替代品( 不是完全 辩3 有另外功能的韶粥,要确认它是否合适,如果有问题, 要通过虚拟操作环境控制台通知给用户。 另外,部件可能通过限定的序列号来管理,详细记录交换历史后,h l v 出现问题就 比较容易把握。 3 4 8 2 集群连接功能 在目标系统中,使用筐体内集群能力构成集群的时候,结合集群管理软件,进行 构成集群的每一个分区的构成变更时,不用停止业务就可以执行动作。 例如,各个分区依次完全停止,变更构成后再重启的时候,结合集群管理软件, 可以将现在使用的分区和待机的分区作替换,然后顺序实施构成变更。这样的话,虚 拟操作环境管理控制台要同时保存分区构成的管理信息和筐体内集群的构成信息。另 外,虚拟操作环境代理要拥有与在那个分区上运行的集群管理软件连接的功能。 3 4 8 3 虚拟操作环境代理安装功能 因为在新的分区中( 新的o s 的媒介) ,虚拟操作环境代理没有安装,虚拟操作环境 不能进行必要的信息收集。为此,在操作系统安装的时候,要提供从虚拟操作环境管 理控制台安装虚拟操作环境代理的功能。 第1 4 页 西北工业大学硕士论文 3 5 虚拟操作环境系统的高可甩陛 3 5 1 可分区服务器的动态资源重组 支持虚拟操作环境的可分区服务器有着强大的动态资源重组的能力。正是在这 强大的动态资源重组的前提下,虚拟操作环境能够得以保证可分区服务器的高可用性 可分区服务器提供了基本的动态资源重组功能,主要有: 分区中追加c e l l 向一个分区中追加c e l l 这样分区的c p u 数和内存容量得到了提升。 分区中删除c e l l 从一个分区中删除c e l l ,这样减少了分区的c p u 数和内存容量,一个c e l l 也 没有时分区会停止运行。 分区组中追加分区 向一组分区中追加分区,提高了整个分区组的运算能力。 分区组中删除分区 从一组分区中删除分区,可刚氐整个分区组的运算能力。 分区启动 启动一个停止的分区,可进行新的任务的运行。 分区停止 停止一个启动的分区,可中止一个任务的运行。 3 5 2 虚拟操作环境中资源的划分 为了方便的管理和控制可分区服务器,在虚拟操作环境中对可分区服务器的资源 进行了划分。在虚拟操作环境中c e l l 是最小的资源分配的单位,分匿中可以动态的划 分c e l l 。当一个分区第一次注册到虚拟操作环境中时,分区本身的部件和资源也被注 册进虚拟操作环境系统,分区此时的配置被称作分区定义的配置。虚拟操作环境中可 以定义虚拟的分区组,分区组在可分区服务器上是不存在的,只在虚拟操作环境的逻 辑中存在。 第1 5 页 西北工业大学硕士论文 3 5 3 虚拟操作环境的动态资源重组 虚拟操作环境根据可分区服务器基本的操作,提供了多种方式的复杂的动态资源 重组来保证可分区服务器的高可用性。在虚拟操作环境系统里主要有以下复杂的动态 资源重组方式 1 分区重启 利用可分区服务器的分区停止和分区启动功能对分区进行重启。 2 分区上c e l l 追加: 利用可分区服务器的c e l l 追加的功能和虚拟操作环境的监视功能, 根据各个c e l l 的不同的状态虚拟操作环境计算出最适合i 宦加的c e l l ,追 加到分区上。 3 分区上c e l l 删除: 利用可分区服务器的c e l l 删除的功能和虚拟操作环境的监视功能, 根据各个c e l l 的不同的状态虚拟操作环境计算出最适合删除的c e l l ,从 分区上删除。 4 分区组上c e l l 的追加: 利用可分区服务器的c e l l 追加的功能和虚拟操作环境的监视功能, 根据各个c e l l 的不同的状态虚拟操作环境计算出最适合追加的c e l l ,逐 个追加到分区组上每个分区。 5 分区组上c e l l 的删除: 利用可分区服务器的c e l l 删除的功能和虚拟操作环境的监视功能, 根据各个c e l l 的不同的状态虚拟操作环境计算出最适合删除的c e l l ,逐 个从分区组上每个分区中删除。 6 分区组上分区的追加: 利用可分区服务器的分区启动的功能,在分区组中启动一个分区。 7 分区组上分区的删除: 利用可分区服务器的分区停止的功能,在分区组中停止一个分区的运 行。 第1 6 页 西北工业大学硕士论文 8 分区的定义返回: 根据分区注册时记录的信息将分区恢复到晟初定义时的状态。 3 5 4 周期性的资源重组 虚拟操作环境可根据周期性的时间为基础,动态的实现资源重组。 虚拟操作环境提供了类f 以于w i n d o w s 9 8 系统中的计划任务功能。用户可以以时间 为触发条件自定义一些动作。具体可以定制每天某段时间的动作,每周,每月,每年 的特定时间的动作,同时可以指定每周哪些天不需要执行动作,每年哪些天不需要执 行动作,方便用户节省资源。例如,超市的结算系统,主要是从早八点到晚上九点营 业,可以定制分区服务器每天早上八点开机,晚上九点关机节省了费用,如果周日超 市休息还可以将周日设定为除外日,服务器全天不启动。每天营业结束时都要统计一 天的营业数据入账管理,此时可以定时启动数据备份服务器 例如,对一般的用户来醴,系统在白天的任务主要是进行在线业务的处理,而数 据备份的任务少一些,这个时候,相应的在线业务服务器的资源应该分配的多一些, 数据备份服务器的资源要少一些。而在晚上,业务处理的任务少一些,系统主要来进 行白天业务的数据备份,那么,数据备份服务器占用的资源就要多一些,业务服务器 的资源要少一些。如下图所示: 第1 7 页 西北工业大学硕士论文 图3 5 一l 虚拟操作环境系统进行资源重组示意图 3 5 5 基于负荷的资源重组 只能通过时间调整分区资源是无法确保高可用性的,根据分区负荷来动态调整分 区的资源是实现高可用性必不可少的手段。 分区负荷增加时的处理: 虚拟操作环境发现分区负荷达到一定程度,作业运行无法及时完成时会通过以 下动作减轻负荷。 第1 8 页 西北工业大学硕士论文 1 分区中追加c e l l : 分【基上的负荷过大时动态向负荷过大分区追加合适的空闲c e l l ,没有合适的 空闲c e l l 时可以从等级低的分区中抢夺c e l l 进行使用,低等级的分区如果没有 了倒可c e l l 将会s h u t d o w n ,如果抢夺一个c e l l 后仍不能降氏到希望的负荷状况, 虚拟操作环境会继续寻找c e l l 给该分区使用。 2 分区组中追加分区: 虚拟操作环境中可以定义逻辑上的分区组,分区组内由一个或多个分区组成, 这在可分区服务器物理结构上是不存在的,分区组内的分区可以共同运行一个作 业,也可以独立运行不同的作业,虚拟操作环境发现分区组的负荷达到一定高度, 会启动备用的预备分区共同运行作业降低负荷,在分区组中没有预备分区时,分 区组会自动从分区外启动等级低的分区共同运行作业降低负荷; 分区负荷减少时的处理 1 分区中删除c e l l : 分区上的负荷很低时动态从负荷低的分区删除合适的c e l l ,作为整个可分区 服务器的预备c e l l 进行备用。 2 分区组中删除分区: 分区上的负荷很低时动态从负荷低的分区组中停止合适的分区的运行,作为整个 分区组的预备分区进行备用。 虚拟操作环境中可以定义逻辑上的分区组,分区组内由一个或多个分区组成,这 在可分区服务器物理结构上是不存在的,分区组内的分区可以共同运行一个作业,也 可以独立运行不同的作业,虚拟操作环境发现分区组的负荷达到一定高度,会启动备 用的预备分区共同运行作业阿氐负荷,在分区组中没有预备分区时,分区组会自动从 分区外启动等级低的分区共同运行作业刚氐负荷; 虚拟操作环境可以通过分区上的操作系统得到当前分区的各种负荷隋报,不同的 操作系统能够获得的负荷隋报也是个不相同的。用户可以指定负荷的百分比,负荷持 续的时间,监视负荷的频率。当系统监测到某一个分区的当前负荷已经达到或超过分 区的阈值上限的时候,这时,系统会自动的给该分区再进行资源的分配,般是添加 一个c e l l 。比如用户可以指定当前分区所用c p u 的利用率达到9 0 ,每一分钟查询一 次,持续时间超过1 0 分钟时,启动c e l l 追加动作,向分区追加c e l l ,从而刚氐了分 区负荷。同样的,如果在某一时间内,分区的负荷非常小,已经小于浚分区的阂值下 限,虚拟操作环境会减少分区上的c e l l ,将c e l l 作为预备c e l l 做为负荷高的分区的 第1 9 页 西北工业大学硕士论文 候补。 当系统的资源处于紧张状态时,比如,预备资源已经用完,处于高负荷状态的分 区又有很多,就整个系统而鲁资源是不充足的,不可能对所有的高负荷状念的分区 进行资源添加,这时在系统进行负荷平衡时,按照分区e 所运行的业务的优先级进行 资源的剥夺与重新分配。在虚拟操作环境中每个分区都可以进行优先级的设置。 在虚拟操作环境系统中,业务的处理要求一般比较高,一个分区很难完成业务的 要求,这样就要求多个分区来共同完成这个业务,我们把这些共同完成一项业务的分 区称为一个组,这些分区通过网络连接在一起,组内的分区的负荷平衡由该组的b a d b a a n c e r 来进行控制,以保证每个分区的负荷正常。对系统而言,只捌扑组的负荷 情况进行控制。当一个组中的负荷超过阈值上限时,系统采用预备资源中的资源新建 一个分区( 这个分区由称作基本分区,其中只包含一个c e l l ,不包含其他的设备) ,并 且将该分区添加到组中,实现组的负荷平衡。如果,预备资源已经用完,可以从负荷 较小的组中剥夺资源。 3 5 6 基于故障的资源重组 为了保证可分区服务器的高可用性,解决故障造成的宕机问题才是关键。虚拟操 作环境通过故障监视和基于故障的策略实现了高可用性中最重要的一环 当发现分区发生故障时可通过以下方式进行操作 1 分区重起: 某些情况下由于各种各样的原因重起分区后故障可能会消失,所以通过 分区停止和分区启动让分区重起。 2 故障部件置换: 虚拟操作环境通过i s p 得* l i t 故障部件的信息经过判断故障等级,发现 故障会影响到操作系统的正常运行时对故障部件进行替换( 一般是由c p u 和 m e m o r y 组成的c e l l ) 。以上操作通过分区中追加c e l l 和分区中删除c e l l 的 基本操作来完成。 3 故障分区置换: 当虚拟操作环境发现故障的分区根本无法使用时将寻找预备分区代替 故障分区进行工作,通过故障分区停止和预备分区启动来完成。 虚拟操作环境通过f w 和i s p 不断监视分区服务器上硬件的运行状态,返回到图形 第2 0 页 西北工业大学硕士论文 界面上相应信息。用户可以定制分区的故障级别,故障时的动作,比如发生任何故障 都重新肩动分区,发生c e l l 故障时,使用预备c e l l 对故障c e l l 进行替换,用户可以 指定多个预备c e j i ,当第一个c e 【l 被

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论