(计算机科学与技术专业论文)高可用性虚拟化管理操作环境的研究与开发.pdf_第1页
(计算机科学与技术专业论文)高可用性虚拟化管理操作环境的研究与开发.pdf_第2页
(计算机科学与技术专业论文)高可用性虚拟化管理操作环境的研究与开发.pdf_第3页
(计算机科学与技术专业论文)高可用性虚拟化管理操作环境的研究与开发.pdf_第4页
(计算机科学与技术专业论文)高可用性虚拟化管理操作环境的研究与开发.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(计算机科学与技术专业论文)高可用性虚拟化管理操作环境的研究与开发.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着计算机系统越来越庞大,越来越复杂,系统的可用性和管理受到了空 前的挑战。由于历史原因,大型企业或机构的计算环境往往是分散、孤立、异 构的,缺乏资源的统一管理和动态配置,每个应用环境都需按预计最大负载来 构建i ,彼此之间仅有较低的或根本没有资源共享。这是导致系统可用性不高 的重要原因。 面对这些传统i t 技术与架构所带来的问题,本文对商可用系统进行了研究, 通过虚拟化技术,将基础设施从物理变成虚拟的,i t 设施交成了一个虚拟资源 池。在此基础上,探讨并设计了一个资源自主计算模型。构建一个“整合”、。开 放”、“自主”和“虚拟”【1 9 】的计算资源管理系统,实现了计算机系统的高可用 性和自我管理性。根据以上目标,作者参与设计并实现了具有虚拟化管理的高 可用性的虚拟操作环境系统。作者研发的工作主要体现在以下几个方面: 1 资源管理框架的设计:为了对计算资源进行统一管理,虚拟操作环境利 用w b e m ( 瞻b b a s e de n t e r p r i s em a n a g e m e n t ) 标准,设计并实现了一 个开放性的管理框架,该框架具有良好的整合性和管理的灵活性 2 自主计算模型的设计:为了系统能够实现自我配置、自我修复、自我优 化和自我保护四个自主计算的特征,设计和实现了一个自主计算模型, 进而提高了系统的可用性也降低了系统的管理难度。 3 资源虚拟化的设计:把企业中所有的各种资源整合成一个虚拟资源池。 利用逻辑分区技术使可分区服务器和存储设备等资源能够根据业务需 要进行动态的配置。同时引入自主计算技术实现系统一定程度上的自我 管理。 关键词:自主计算,分区,高可用性,虚拟化,w b e m ,c 玎订 a b s t r a c t w i 也t l l ec o m p u t e rs y m 咖b e 蝴m gm o r e 锄dm o 比c o m e x ,i ti sa n m 啦嗽c d c n t e dc h a l l e n g ef 缸也ca v a i la _ b i l i 巧锄dm a 纰g e m e n to fc m l p u t e rs y s t e m t h ec o m p u t e f 锄啊r o m n to fe n 舱r p r i a r e u s u a l l yd i 鲥b u t e d i s o l a t i o n h e t e r o g e n e o u s 1 1 l e 陀s o u r c eh a sn o tb cm a i l a g e di l l l l i l i f i e dw a y ,髓dn o tb c d 印l o y e dd y 舢i c a l l y e a c ha p p l i c 撕h 鹊t l l cd i 丘舐n tp la _ 哟锄;e a c ha p p l i c a l i 蛳 曲“加叽m e n tm u s tb ec o n s 仇l c t e da c c o r d i n gt om eh e a v i e s tl o a dw l l i c hi se s t i i i l a t e d , e a c ho 山盯o n l y h 船l o w e ro rd o e s n o t h a v e t h er e s o u r c e s t os h a r e t l l i s i s t h e i n a i l l a nw h ym ec o 哐n p u t e r 夥s t 锄i sn o ta v a i l 8 b l e f a c 洒gd b ) v cq u e g t i o n s ,i n 也ep a p i e r ,w es t l l d i e dm eh i g h 删la _ b i l i t ys y s t e m , t h r o u g hv i 巾l i 盈矗o nt c c l l n o l o g y m ei n 疗a s 仉l c t i i 心t i l m sv i 巾阻i i z a 虹o nf 幻mp i l y s i c s , a n dt h er ri i 血a s 细l c t i l r ct l l m e di n t 0av i n i i a l 托s o u r c e sp o 以o nt h eb a s i so fi t ,w c d i s c u s s c d 柚dd e s i 四e d 瓤a u t o n o m i cc o m p u 恤gm o d e l ,锄d n s 咖c t e d 锄i t r e s d u r c em 粕a g e m c i l s y s t c m 删c h 划i z e dt h e 是a t 【i r so f c e 删o n i 0 辨n , 簟a 呦n o i n i c a n d 桕忻n i l a i i z a t i o i i ,a n d 托a l i z e dt h e c o m 讲l 钯rs y s t 锄w i m 1 1 i g h - a v a i l a b i l i t y a n dt h e l m a n a g e m e n t i 诅k ep a r ti n l h er e s e a r c ha n d d e v c l o p m c n to f m ev o e s 谢t hh i g l la v a i l a b i l 匆锄dv i 巾培i i z a t i o nm a i l a g e m e n t m y 艘a r c h a n d d e v e l o i ) n l e n t 删c h i t a l 【e p a n i i l t l l e v o e s g r o u pa r e l i s l c da s f o l l o 哪: 1 t h ed 船i g no fr 姻o u l c em a n a g e m e n tf 置m e w o r i :i i lo r d e rt om l i 移t h e m a n a g e m e n to fc o m p u 血1 9r e s o w s ,i nv o e ,、粥u l h cs 协n d a r do f w b e m ( w 音b - b a s e de m 明m m 她a g 啪e n t ) ,d e s i 辨a n dr e a l i z ear e s 0 1 】r m 雒塌g e i 】噼n t 帕r k 、i t ht h ef c 船so f “o p e n ,“i n t e g 船t i o n ,锄d n e 弼b j l i t yo f 地s o u r c em a n a g e m c n t 2 t h ed e s i g no fa t o n o m i cc o m p u t i n gm o d e i :i no r d c rt 0 糟a l i z e 也e f c a t u r e so f s e l c o n 丘础舀s e l b h e a l i n &s e 培0 p t i m i z i l l g 锄d s e l f p m t c c t i n go fa u t o n o m i cc o m p u 伽g ,w ed e s i g n 锄dr e a l i z e狃 a u t o n o f n i ce 彻1 p u t 抽gm o d c li n 吐l ev o e 3 t h ed 鹳i 鼬o fr 器o u r v i r t - l a l i z a t i o n :w 色i l t h el o 西c a lp a n i t i o n t e c h n o l o g i e s 觚da u t o n o 面cc o m p u t i n gt c c h n o l o g i 部t or e a l i z ed y 咖i c c o n f i g m 硝o na n ds e l f m 锄g e m e m0 f c o n l p u t i n gr e s o u r c 髂 k e y w o r d s :a u 协n o m i cc o m p l n i n 岛p a n i t i 呱h i g ha v a i l a b i i i 劬r t i l a l i 2 a t i 呱 ,b e m c i m l i 西北工业大学 学位论文知识产权声明书 本人完全了解学校有关保护知识产权的规定,即:研究生在校攻读 学位期间论文工作的知识产权单位属于西北工业大学。学校有权保留并 向国家有关部门或机构送交论文的复印件和电子版。本人允许论文被查 阅和借阅。学校可以将本学位论文的全部或部分内容编入有关数据库进 行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 同时本人保证,毕业后结合学位论文研究课题再撰写的文章一律注明作 者单位为西北工业大学。 保密论文待解密后适用本声明。 学位论文作者签名:鱼盗 阳7 年争月2 ,日 指导教师签名: 矽7 年妒月z 日 西北工业大学 学位论文原创性声明 秉承学校严谨的学风和优良的科学道德,本人郑重声明:所呈交的 学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所 知,除文中已经注明引用的内容和致谢的地方外,本论文不包含任何其 他个人或集体已经公开发表或撰写过的研究成果,不包含本人或他人已 申请学位或其它用途使用过的成果。对本文的研究做出重要贡献的个人 和集体,均已在文中以明确方式标明。 本人学位论文与资料若有不实,愿意承担一切相关的法律责任。 学位论文作者签名:! 堑蕴 训0 7 年牛月乙日 西北工业大学硕士学位论文第一章绪论 1 1 研究的目的及意义 第一章绪论 随着互联网及其应用的快速发展,客户对网站系统访问的响应时间、网站 内容以及所提供服务的可靠性、即时性等也越来要求越高,使得以单台服务器 来支撑整个网站的系统已无法满足客户需求。取而代之的是一组服务器群虽 然企业间的各个网络都连到了一起,但是不同的业务单元各自有着自己的资源 设备,彼此独立使用,资源的共享和动态分配较少,资源的使用率较低因此, 系统在理解、管理、安全、升级和操作方面存在困难也就不足为奇了口1 1 多年来,企业的i t 部门都希望对这些应用进行合并,减少服务器的数量, 同时还可以节省大量的管理成本、硬件、占地空间和电力消耗但问题是,通 常这些应用在编写时就已经确定不能与其他应用共存于同一台服务器上【”有 些应用需要不同版本的操作系统、数据库和中间件;有些应用则可能消耗系统 中的所有硬件或软件资源,因而阻止其他应用的运行对于业务的增加、变动 系统的资源根本不能适应快速、频繁的重新配置。 同样,由于企业系统的复杂化和异构化,导致企业计算机资源的管理也越 来越困难。i 删有报告指出,随着计算环境的复杂化,系统管理人员十分缺乏, 如果以目前的趋势发展,将会没有足够的熟练的系统管理人员来保证计算机系 统的运行【1 9 j 。面对复杂和异构的系统,出现问题是不可避免的事情,对于系统 的故障,管理员不得不亲临现场进行故障排查。因为发生的问题不一定是硬件 的故障,有可能是内部逻辑错误等,管理员不得不跟踪问题发生的轨迹,解决 这些故障常常需要几小时甚至几天时间,并且未必能够顺利解决问题。不仅如 此,管理这样的一个庞大的计算机系统所需的维护、培训等费用也越来越高 总之,随着计算机系统的复杂性的增加,企业i t 系统架构面临着新的危机, 这主要体现在以下几个方面: 1 系统自适应性太差。应用被捆绑在固定的平台上,每个应用环境都需 按预计的最大负载来构建,彼此之问仅有较低的或根本没有资源共 享。系统配置不灵活,随机应变能力差【2 j l 。 2 系统的可用性降低。由于系统的管理和维护滞后,对频繁出现的故障 西北工业大学硕士学位论文 第一章绪论 不能迅速恢复,大大降低了系统可用性,导致企业业务运行的频繁长 时间中断,这对企业来说是一个巨大灾难【2 l 】。 3 系统管理难度增大。面对复杂的系统,普通非专业人员只能束手无策, 即便是非常专业的系统管理技术人员面对系统资源间千丝万缕的联 系也无法迅速解决系统出现的闯题1 2 ”。 4 故障修复周期延长。管理人员很难在庞大的系统内迅速找到故障关键 所在及其影响并立即修复,而这些关键业务是企业的命脉,短暂的故 障可能造成极大的损失。 5 资源得不到优化。随着系统复杂性的增大,不仅系统内各种设备的数 量极其多,而且各个设备之间的相互联系也非常复杂,有些设备超负 荷工作而另一些空转,这样就造成了资源没有得到合理的应用。如何 让这些设备能均衡负载,是一个很难的问题f 2 l l 。 6 系统的成本提高。有研究表明,可管理性是系统总拥有成本t c o ( t o t a l c o s to f 嘶n e r s h i p ) 各种费用之中所占比例最大的一项。提高系统的 可管理性将大大减少t c o 【班】。 面对以上所出现的问题,对于复杂、异构的企业计算环境如何进行资源有 效地整合,如何使管理具有开放性,如何使系统资源具有虚拟性和自主性,如 何能使资源进行动态配置,这些成了当今国际上研究的热点和亟待解决的问题。 本论文就如何提高企业计算系统的可用性和可管理性,降低管理成本等方 面做了一些研究和探讨,并参与了一个实现智能管理的高可用性虚拟操作环境 的部分开发工作。 1 2 研究工作概述 本论文结合作者承担的研究和开发工作,针对当今企业计算环境复杂、异 构的特点,围绕如何提高企业计算的可用性和降低企业资源的管理难度,实现虚 拟化管理的高可用性虚拟操作环境这一目标,从系统设计的思想、资源管理框 架、资源自主计算模型到管理员对企业进行虚拟化管理的操作进行资源灵活的 配置等几个方面展开了研究,并在此基础上,设计和实现了虚拟操作环境。 1 2 1 论文的主要工作 1 ) 对高可用系统以及要解决的问题进行了概述,针对当前企业i t 系统资源 2 西北工业大学硕士学位论文第一章绪论 管理的现状以及存在的问题,探讨了虚拟操作环境设计的思想、预期的目 标和所需要的关键技术,同时介绍了虚拟操作环境的系统结构。 2 ) 对当前各种管理协议逐个进行分析和比较,并对这些协议面对当前企业复 杂、异构的i t 资源管理的局限性进行分析。进而探讨了w b e m 标准的优点, 并在虚拟操作环境中实现了基于w b e m 标准的资源管理框架,也对存储资 源的c i h 模型建立加以具体的实现。 3 ) 结合自主计算的特性,实现了自主计算模型,以及对动态决策循环优化模 型加以实现然后介绍自主计算特性在虚拟操作环境中的具体的体现。 4 ) 对虚拟操作环境虚拟化设计思想进行探讨,介绍了服务器虚拟化,进而利 用髓酬管理框架进行对资源进行整合统一管理,根据业务进行灵活配置 使系统资源具有自适应性,同时把自主计算模型引进资源管理框架中实现 系统进行自我管理。 1 2 2 论文的结构和章节安排 本文共分六章。 第一章绪论 简要介绍了本文的研究目的和研究意义,以及论文内容的安排。 第二章高可用性系统概述 对高可用性系统进行了的研究,探讨了高可用系统要解决的主要问 题。 第三章虚拟操作环境系统的关键技术 介绍了虚拟操作环境系统所使用的自主计算、分区技术、虚拟化等 企业管理等技术。 第四章虚拟操作环境资源管理框架的设计与实现 分析和比较了当前的主要管理协议,阐明了采用髓叫的管理框架 的优点,进而采用w b 蕊标准设计虚拟操作环境的管理框架,最后 具体给出了在虚拟操作环境中建立存储设备的c i m 模型的细节。 第五章虚拟操作环境自主计算模型的设计与实现 设计和实现一个具有自我配置、自我修复、自我优化和自我保护特 性的自主计算模型,同时也介绍了在虚拟操作环境中自主计算四个 特性的具体的实现。 第六章虚拟操作环境虚拟化管理的设计与实现 3 西北工业大学硕士学位论文第一章绪论 1 3 小结 提出了虚拟化设计的思想,并探讨了服务器的虚拟化。然后介绍虚 拟操作环境虚拟化的具体实现方案,以及管理员管理资源虚拟化的 具体体现。 本章主要介绍了高可用系统虚拟化管理的研究的目的及意义,笔者所做的 主要工作和本文的组织结构和章节安排。 4 第二章高可用性系统的概述 2 1 什么是高可用性系统 高可用性系统主要用在大型的计算项目和控制项目上,人们评价一个系统 是否是高可用性系统,主要的判断方面就看该系统的持续工作时间。持续工作 时问越长,就说明系统越接近于高可用性。基本的高可用系统主要的评价目标 是: 能够提供不间断的服务。这里的不间断的含义就指的是系统的连续运 行时间,对用户来说,这个时间越长越好,如果能够达到全年的3 6 5 天,每 天2 4 小时不间断服务是最好的 系统不会出现硬件故障而宕机当系统中的某一硬件出现故障时,系 统迅速的解决掉故障。保证系统能正常的运行下去 高可用性具体定义如下; 计算机系统的可用性( a v a i l a _ b i l 叻是通过系统的可靠性 i i a b i l 姆) 和可维护 性( m a i n t a i 舶b i l 对) 来度量的工程上通常用平均无故障时问( m 兀- f ) 来度量系统 的可靠性,用平均维修时间仰i ) 来度量系统的可维护性。于是可用性被定义 为:m r r f 0 m r r f + m 1 p + 1 0 0 业界根据可用性把计算机系统分为如下几类: 表2 1 计算机系统分类 擎静。轷可用比例。“。“年停机时阅”“”9 可用性分类一8 i 口e r c e n ta v a i l a b i u t ) ,) ( d o w n t m l 曲e a r ) 。 ( a v a i l a b i l i t y ) 。 9 9 53 7 天 常规系统( c o n v e n t i o n a l ) 9 9 98 8 小时 可用系统( a v a i l a b i c ) 高可用系统 9 9 9 9 5 2 6 分钟 ( h i g l l l ya v a i l a b l e ) 9 9 9 9 95 3 分钟 f a u l tr e s i l i e n t 9 9 9 9 9 93 2 秒 f a i l l tt b l e 枷t 对于关键业务,停机通常是灾难性的。因为停机带来的损失是巨大的。特 5 西北工业大学硕士学位论文第四章虚拟操作环境资源管理框架的设计与实现 别是进入2 1 世纪后,企业间使用电子商务系统,供应链管理系统,企业资源计 划系统越来越多,随着企业越来越依赖于信息技术,由于系统停机而带来的损 失也越来越大。 下面的统计数字列举了不同类型企业应用系统停机所带来的损失。 表2 2 停机给企业带来的损失 应用系统 每分钟损失( 美元) 呼叫中心( c a l lc e n t e r ) 一 一 2 7 0 0 0 一 企业资源计划( e r p ) 系统 一 1 3 0 0 0 供应链管理( s c m ) 系统 1 1 0 0 0 电子商务( e c o 砌e r c e ) 系统一 1 0 0 0 0 客户服务( c u s t o m e rs e r v i c ec e n t e r ) 系统 2 7 0 0 0 而现在,随着计算机技术的应用面越来越广,它的应用领域已经深入到了 各行各业,人们对系统的高可用性也提出了更高的要求。特别是自主计算概念 的提出将高可用性系统提升到更高的层次。2 0 0 1 年1 0 月,m m 正式提出了一 种称为自主计算( 跚t d n o n l i cc o m p u t i l l 酌的概念。自主计算的灵感来自人体复杂 的自主神经系统,而所要解决的则是日益复杂的运算环境所面临的管理与成本 问题。i b m 将自主计算定义为“能够保证电子商务基础结构服务水平的自我管理 ( s e l ! fm 龇a g i i l g ) 技术”。之后惠普、富士通、s 1 | n 等公司均发表了自主计算构想。 n e c 于2 0 0 3 年1 0 月2 2 日发表了旨在实现自主计算的新构想“也u m o ”。 n e c 将自主计算所需的功能定义为3 个方面,即“自主”、“虚拟化”和“分散”。 n e c 将按照、r a i 切0 构想,在2 0 0 4 年内在产品中嵌入必要的功能。自主是一 种当系统出现故障时能够自动恢复的功能。包括处理负荷过高时,自动分散负 荷的功能等。虚拟化是一种在连接多个服务器的环境中,逻辑上能够将多台服 务器作为1 台服务器运用的技术。可提高扩展性能及降低运用负荷。分散是一 种在网络环境中确保信息连动的功能。有助于在异地建立灾害对策站点等。 由此可见,未来对计算速度、系统可靠性和成本实效性必将成为企业追求 的目标。随着计算机网络的出现,一个新的具有更高性1 j 皂,价格比的体系逐渐成 为应用主流分布式集群计算体系。当用户需要完成任何任务时,分布式集群 计算提供了尽可能多的计算机处理能力和数据的透明访问能力,同时实现高性 能与高可靠性的目标。 6 西北工业大学硕士学位论文第四章虚拟操作环境资源管理框架的设计与实现 2 2 高可用性要解决的主要问题 2 2 1 系统恢复 提供不闯断的系统服务是高可用性系统所追求的目标,但是我们又不能保 证也无法预测系统中的软硬件资源不出现故障。这样一来,在系统的软硬件发 生故障时,如何迅速的进行系统恢复以保证系统的正常运行就是高可用性系统 要解决的首要问题唧。 一般的,我们采取部件的冗余设置来解决这个问题,也就是说,为硬件设 置备份,在出现故障时,备份的硬件可以进行替代容错系统就是采用这种方 法来解决这个问题的。对主服务器设置一台备用的服务器,当主服务器发生故 障的时候,从服务器接替主服务器的工作继续提供服务。设置的从服务器越多, 系统的可用性越高网。 2 2 2 负载均衡 在很多系统中,经常由于系统内的负荷分配不均衡而导致了某些节点的负 担过重,从而导致了系统的宕机例如,某系统向用户提供了很多项服务,其 中一项服务在某一时间内的业务量非常大,而其他的业务量很小,这时,如果 系统没有采取一些措施,会导致处理该业务的资源耗尽。而使用户的请求不能 得到响应的情况,甚至会引起系统的宕机田】 眈的规模每一百天就会增长一倍,客户希望获得7 天2 4 小时的不问断 可用性及较快的系统反应时间,而不愿屡次看到某个站点“s e r v 钌1 硇b 璐y ,及频 繁的系统故障。比较热门的站点会吸引前所未有的访问流量,例如根据眺o o 的新闻发布,y 曲0 0 已经每天发送6 2 5 亿页面。一些网络服务也收到巨额的流 量,如a m 翻c a n 删m 的w 曲c a c h e 系统每天处理5 0 2 亿个用户访问w 曲的 请求,每个请求的平均响应长度为5 5 l :b y t e s 。与此同时,很多网络服务因为访 问次数爆炸式地增长而不堪重负,不能及时处理用户的请求,导致用户进行长 时间的等待,大大降低了服务质量。如何建立可伸缩的网络服务来满足不断增 长的负载需求已成为迫在眉睫的问题。 系统中各个核心部分随着业务量的提高、访问量和数据流量的快速增长, 其处理能力和计算强度也相应增大,这使得单一设备根本无法承担i 捌。在此情 况下,如果扔掉现有设备去做大量的硬件升级,这样将造成现有资源的浪费, 7 西北工业大学硕士学位论文第四章虚拟操作环境资源管理框架的设计与实现 而且如果再面临下一次业务量的提升,这又将导致再一次硬件升级的高额成本 投入,甚至性能再卓越的设备也不能满足当前业务量的需求。于是,负载均衡 机制应运而生。, 负载均衡( l o a db a l a n c e ) 建立在现有网络结构之上,它提供了一种廉价有 效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理 能力、提高网络的灵活性和可用性吲。 负载均衡有两方面的含义:首先,大量的并发访问或数据流量分担到多台 节点设备上分别处理,减少用户等待响应的时间:其次,单个重负载的运算分 担到多台节点设备上做并行处理,每个节点设备处理结束后,将结果汇总,返 回给用户,系统处理能力得到大幅度提高【捌。 负载均衡是由多台服务器以对称的方式组成一个服务器集合,每台服务器 都具有等价的地位,都可以单独对外提供服务而无须其他服务器的辅助。通过 某种负载分担技术,在性能不同的服务器之间进行负载平衡,充分利用服务器 群中的每一台服务器,保护现有投资,既保证性能差的服务器不成为系统的瓶 颈也保证性能高的服务器资源得到充分利用。 为了使网络系统达到高可用性的要求,负载均衡时必不可少的解决问题之 2 2 3 动态的资源管理 高可用系统的一个重要特征是进行资源的灵活管理,以实现系统中的有限 资源的有效利用田l 由于系统在运行过程中,资源的使用情况是在不断变化的, 也是不可预测的,如果要提高资源的使用效率,系统必须实现资源的动态化管 理。系统要不断的对系统的资源分配状况和资源利用情况进行检测,并随时根 据检测的结果重新调整系统的资源分配,以保证系统的当前运行部分都拥有足 够的资源,也保证了大部分资源处于被使用状态,从而避免了空闲的部分占用 着资源,繁忙部分申请不到资源的状态的出现【2 3 】。 2 3 提高系统可用性的途径 经上述分析可知,可用性是由可靠性和可维护性共同决定的。由此可知, 提高系统的可用性有两种途径:1 提高可靠性,即增大系统的m 1 - 1 1 p ;2 提高可 维护性,即减低系统的m 1 v n t 。在高可用性系统的设计中,应同时采用这两个 8 西北工业大学硕士学位论文、第四章虚拟操作环境资源管理框架的设计与实现 方面的技术。 2 3 1 提高可靠性 高可用系统的设计采取一系列可靠性概念与技术,主要有: i ) 使用商品化部件。由于商品化部件的制造工艺成熟、且被大量长期使 用、b u g 较少高可用集群系统的设计尽量使用商品化部件,包括节 点板、节点操作系统、编译器、数学工程库、数据库等。 2 ) 避免单一故障点。任何系统的容错性,都是一个不容忽视的问题。考 虑容错性之前,在此先解释一下单一出错点s p t ( s i n 醇ep o i n to f f a i l u r e ) 的概念对于一个硬件或软件系统,如果某部分发生故障而导致整个 系统的崩溃,那么这部分就称为单一出错点一个存在单一出错点 s p f ( s i n 西ep o i n to f f a i l u r e ) 的系统将有可能严重影响系统的性能。给系 统增加一定的冗余,高可用性系统中的任一软、硬部件都不止一个, 这样任何部件故障都有一个备份,不会导致整个系统崩溃比如节点 有多个,通行网络有多条等。这里的冗余是指由隔离的冗余,即冗余 部件不会因为同样的原因而同时发生故障。 3 ) 实现系统的自我管理。使系统管理员可以少犯错误。 4 ) 其它可靠性技术包括合理地设计电源、机箱、电源线与信号线的规则 走线、散热系统等 2 3 2 提高可维护性 高可用系统的可维护性技术包括三个方面,即系统备份、系统监测和系统 恢复。其目的是及时地发现和定位部件的故障,然后迅速地从备份中将系统恢 复,整个过程不需要停机。 1 系统备份包括硬件、软件和数据的备份。数据通常备份在硬盘阵列上, 同时还有磁带机做后援备份。 2 系统监测 准确及时地发现系统中的故障是降低切换时间的重要环节。如果故障未能 及时监测出来,将严重地影响系统的可用性。同时如果经常发生虚警而使系统 9 西北工业大学硕士学位论文 第四章虚拟操作环境资源管理框架的设计与实现 产生不必要切换则降低系统的效率,甚至导致关键数据的丢失。 1 1 心跳技术: 目前高可用系统中普遍采用心跳技术来监测系统的工作状态。节点之间通 过侦察网络互相定时发送“心跳( h e a nb 龆t ) ”信号。每个主机上的监测进程 通过一定时间内是否收到足够的心跳信号来判断对方系统是否已经发生故障。 一般为了防止系统负载重时影响心跳信号而产生虚警采用专用侦测网络,也可 以采用专用侦测网络与应用网络相结合的方式。 2 ) a g 蚰t 技术: h e a r tb e a t 技术一般只用于检测整个系统的正常情况。a g e n t 则用于检测系 统中各个不同的功能部件的工作状态,包括c p u 、磁盘、网络、虚存、加设 备、文件系统、进程、平均负荷等等。不同的应用所依赖的系统功能也可能不 同。当系统某个功能部件故障时,可能有的应用已经无法继续进行,而有的应 用却根本不受影响。因此有时还需要针对特殊的应用来设计a g e n t 。 a g 朗t 实际上使很多相关技术的总称,为实现高效的a g e m 往往需要有操作 系统核心的支持,有时还需要特殊的硬件支持。如i n t c l 公司为基于i n t e lc p u 服务器系统制定的d m i & l 孤d e s k 标准,就包括c p u 过热、机箱风扇故障、文 件系统过载监测等很多功能,大大简化了a g e n t 的设计。 3 系统的恢复 当出现故障时应用切换到一个正常节点继续进行。同时,系统维护人员可以 对出现故障的节点进行修复。依其难度和对用户的有用性,切换可以分成几种 模式: 1 ) 重启:系统在新节点上重启应用程序,从头开始运行。如果磁盘或r a i d 也坏了,文件可以从磁带上恢复。这种模式实现简单,且对计算和数据 库应用而言,用户可能损失大量已做的工作。 2 1 回卷:系统或用户程序随时或定期设检查点或日志,将当前应用程序的 状态放到一个安全的地方( r a i d 或镜象磁盘等) 。在切换时,应用程 序可以从最近的一个检查点恢复。对某些程序而言,这种模式需要核心 的支持。 3 ) 进程迁移:不仅是应用程序和数据本身,还包括其它相关的系统信息, 在切换时一起被送到新的节点。这种方式最理想,但实现起来难度最大, 1 0 西北工业大学硕士学位论文第四章虚拟操作环境资源管理框架的设计与实现 需要核心的支持。 2 3 3 与传统方法的比较 传统上,人们往往重视了可靠性的,而没有对可维护给予足够的重视。但 事实上,正如前文所说的,可用性是由可靠性和可维护性共同决定的只有从 这两个方面共同着手才能从根本上解决可用性的问题。 提高系统的可靠性一般采用部件级冗余技术,即通过对系统中的薄弱环节 增加冗余,提高关键部件的m r r f ,来提高整个系统的脚。传统的容错机 多采用此类技术,但专用的设计往往增加整个系统的成本。高可用系统则主要 着重于降低h 彻l ,即低成本、高技术地降低修复时间。采用的主要方法是系 统级的冗余。即利用多个基本独立的主机相互进行冗余备份当一台主机的某 个关键部件发生故障后,则认为该主机系统已经失效,其它主机将故障主机的 应用接管过来,继续运行,同时进行故障主机的维修工作。 西北工业大学硕士学位论文第四章虚拟操作环境资源管理框架的设计与实现 第三章虚拟操作环境系统的关键技术 虚拟操作环境系统主要使用了分区技术,集群技术相结合的技术来达到其 高可用性系统的设计目标。下面对这两个技术及其在虚拟操作环境系统的结合 进行详细介绍。 3 1 服务器分区技术 3 1 1 什么是分区技术 系统分区技术的概念来自于大型机计算:系统资源( 包括处理器、内存、 和存储设备) 被虚拟化,这样同时运行的所有程序都可以完全获取系统资源。 但各个分区的活动实际上是互不干扰的,也是分别受到保护的,一旦一个虚拟 分区发生故障被限制,其他分区不会受到影响。系统分区可以帮用户完成服务 器硬件合并,把许多利用率不高、效率较低的不必要的服务器合并为少数几部 高效率的系统,未来不需要购置太多的的服务器就可以实现效率的大幅提高; 提高服务器的利用率,把一个处理器分为多个分区,而不是让一个低吞吐量的 应用程序占用全部的处理器资源;简化服务器的管理,集中管理少数几台服务 器,而不是在多个地点分别进行管理;实现低成本的集群:实现存储设备的虚 拟化,根据各分区的需求变化动态地进行资源分配;简化了应用程序的配置, 在多个分区中使用同样的软件镜像,使经过测试的合格的操作系统和应用程序 组合尽快地安装到各硬件平台中。 目前,在分区技术领域占据领先地位的包括s u n ,i b m ,惠普、康柏等多家厂 商。 3 1 2 分区技术分类 目前分区的种类越来越多,而且越来越细致,更倾向于客户的应用。最典 型的分区技术就数我们在p c 上使用的多操作系统了,这属于本地物理分区的 范畴。而在多机环境中,通过分区可以将不同“组”的计算机分割开来,被分 区的计算机还可以在不同的层面上复用,以提高计算机系统的利用率。服务器 分区技术可将服务器的c p u 、内存、加等资源合理地进行分区和调配,不同分 1 2 西北工业大学硕士学位论文第四章虚拟操作环境资源管理框架的设计与实现 区内可以执行不同的操作系统或同一操作系统的不同版本,最大限度地挖掘了 服务器的性能,一台服务器甚至可以当作几十台使用,提高了硬件利用率。给 服务器资源分区有好几种方法。有些厂商将服务器分区技术分成硬分区和软分 区两种,而其他有些厂商则提出了物理分区、逻辑分区和软件资源管理的分类 方案。 目前常见的两种服务器分区方法有物理分区和逻辑分区,大多数的应用是 将二者结合起来部署的。下面我们对这两种分区进行介绍 1 物理分区 物理分区,英文简称是p p a r 。所谓物理分区,通常意义上就是一类服务 器划分为更小处理单元的方法而这样的处理单元可以被当作小型服务器,同 时这些“小型服务器”的硬件体系结构完全一样。p 凇r 式的分区界定在用来 构造服务器的建筑模块的物理边界之内所以,一般说来p p a r 在尝试创建满 足应用程序需要的资源量分区时缺乏灵活性。 物理分区包括2 种不周的类型,即动态分区和静态分区。 1 ) 动态分区 动态分区允许分区的操作系统在运行的同时重新配置硬件( 添加或去除) 。某 些高端的企业级x 架构的服务器已经可以在操作系统的支持下实现动态分区的 能力,可以支持在线插入或去除某些资源,如4 路s m p 扩展模件和单个节点的 即插即用。 2 ) 静态分区 静态分区是在节点或系统范围界限内进行的,这就意味着各分区必须具有 独立的硬件功能( 如处理器、内存和瑚等) ,因而一个节点不能够再细分为多 个分区,但一个分区可以包括多个节点。静态分区下,只需要将节点调整到脱 离整个系统即可,其他连在系统上的节点不受影响而可以继续正常运作。 在下面我们列举便用了物理分区技术的产品: 惠普s u p e r d o m e 系统 惠普s u p e r d o m e 系统最多可以配置6 4 个c p u ,2 5 6 g b 内存和1 9 2 个p c i 插槽, 最多可支持1 6 个物理分区,这些分区被称为n 分区。每个n 分区包含一个或者 西北工业大学硕士学位论文第四章虚拟操作环境资源管理框架的设计与实现 多个单元,而且分别运行h p - u _ ) ( 操作系统。每个单元由一块系统板组成,系统 板上包含4 个c p u ,2 到1 6 g b 内存,可以连接到包含1 2 个p c i 插槽的单一加 托架。惠普服务器支持的n 分区技术拥有多种功能,这也正是n 分区“n ”的意 义所在。这些功能包括:多个节点的硬分区( 每个节点可配置不同的操作系统) ;一 个节点的硬分区( 可配置多个操作系统) ;一个硬分区内的虚拟分区:分区可支持 更为细化( 如。p u 水平) 的工作负载合并和软件隔离:一个操作系统内的资源分区: 支持系统管理员对分区资源进行智能化调配,目的在于保证关键任务运行。 s u n e n t e f p f i 辩1 0 0 0 0 s 姐公司的e n t e r 两s e l 0 0 0 0 系统上配备了物理分区功能。e n t e r p r i s e l o 0 0 0 是一款s m p 服务器,其配置是6 4 个c p i l 6 4 g b 内存和6 4 个加插槽。资源按 照系统板( sy s l 翩心o a r d s ) 的建筑模块安排。每个系统板包含4 个c p u ,最高可以 配置4 g b 内存和两条加总线。每条加总线支持两个s b l l s 插槽或者一个p c i 插槽。一台e n t e r p f i s e l o o o o 可以划分最多1 6 个分区( 称为域) 。每个域包含一个 或者多个系统板以及系统板上的全部资源。给现有域增加系统板的时候,不论 是否需要这些资源,系统板上所有可用的资源都会集成到域里。如果c p u 、内 存和1 ,o 等资源位于同一系统板上,那么这些资源不可能配置到不同的域内。 e n t e r p r i l o o o o 服务器能在不同的域上运行不同版本的s 0 1 a r i s 操作系统。运行 在各个域上的应用程序完全隔离,相互之间不会干扰。 2 逻辑分区 逻辑分区,英文简称l p | a r 。l p a r 不按照物理建筑模块分组,它在资源 分组以及形成分区的方式上不同于p 鼢r 。它增加了更多的灵活性和自由度, 可从可用系统资源所组成的全部资源池中选择组件。这样就可以实现更好的资 源间隔,一方面系统上的资源利用得到了最大化,另一方面则把不必要的资源 重新分配最小化了。逻辑分区技术把一个在处理器水平上( 使用相关联的内存、 1 o 及其他所需的资源) 进行分区的多节点综合系统进行重新配置,而不需要关 机或重新启动软硬件。这样,不用关机便可以自由地添加或去除硬件资源。当 工作量需求发生变化时,用户也可以从一个逻辑分区中重新分配资源到其他分 区,而不需要关机和重启系统。l p a r 在单一内存配置域内工作,所以它可以 用在简单的s m p 内而无须特殊的建筑模块结构。所有的操作系统映像都在同一 内存映射中运行。 下面列举一些采用了逻辑分区技术的产品: 1 4 西北工业大学硕士学位论文第四章虚拟操作环境资源管理框架的设计与实现 i b m p s 甜e s l p a r p s e r i e s 6 9 0 支持i 卫a r 功能,一台服务器上可以同时存在最多1 6 个分区一 个分区必须包括一些基本资源,比如至少一个处理器、1 g b 内存和充足的l l o 容量等。p s c r i e s 6 9 0 实现的分区方案同其他u n 系统厂商不同:物理资源可以 不受内部物理系统板的限制而分配给一个分区,处理器、内存和1 舶擂槽可以 分配给任何分区而无须涉及其物理位置。比方说,同一个p a w e r 4 硅芯片上的两 个处理器就可以分配给不同的分区使用。p c i 插槽单独分配给分区,而内存以 固定的增量为单元进行分配。每个分区都运行在自己的a 操作系统上并且同 其他分区的任何活动隔离。软件崩溃不会在系统上扩散,硬件工具和微代码可 以提供资源隔离措施由于分区是通过划分单一服务器得以创建的,所以某些 硬件组件将被所有的分区共享,这意味着某些组件在出现故障的情况下可能影 响系统上多个分区。不过,p s 蹦e s 6 9 0 的许多组件都具有恢复机制,多种类型 的错误,即便在共享资源上发生,也隔离在它们所发生的分区之内。 m m 于1 9 9 9 年在a s 4 0 0 ( 现在叫做i b m i s e r i e s ) 平台上实现t 对l p :a r 的支 持。2 0 0 0 年,工b m 宣布有能力在z s 商c s 服务器上的一个l p a r 内运行l i i l u x 操作系统。工b m 过去2 5 年里形成的物理和逻辑分区经验极大地影响了p s e r i e s 的【艄r 的设计和实现 惠酱r n 】a 1 p 硼m 唧n g 惠普的v i n l l a l p a n i t i o i l i 】唱( 虚拟分区) 由整个系统或者个n 分区范围之内的 一个或者多个。p 。组成,可借助软件命令建立。不同的虚拟分区上允许存在多 种版本的肿u x 操作系统。虚拟分区可以独立启动,每个分区都执行自己的 h p u x 操作系统,可以在完全隔离的情况下驻留自己的应用。在多个分区中, 资源可从一个分区删除并添加至另一分区,这个过程无需硬件的物理操作,只 需在系统管理界面上进行相应的配置即可。如系统管理员可以将c p u 从一个虚 拟分区动态删除并添加到另一个,而无需系统重新启动惠普的资源分区技术 指为工作量管理建立的独特分区资源分区一般运行于同一个操作系统内,由 称为资源管理器的管理软件予以控制,系统管理员根据当前待处理任务的优先 等级,为不同的任务动态地划分不同比例的资源。在每个虚拟分区内,可借助 p r o c e s s r e s o u r c c m a l l a g e r a p r m ) 或h p u 娜r l d o a d m 缸a g e ( w l 岣等解决方案建 立和使用多达6 4 个资源分区。惠普已能够在整个高、中、低档服务器产品线上 提供分区功能,客户能在中档( n 系列和r p 8 4 0 0 ) 和入门级( l 系列) u r l i 】【服务器上 实旌分区方案。 西北工业大学硕士学位论文第四章虚拟操作环境资源管理框架的设计与实现 3 。1 3 分区技术的优点 分区技术允许把一个大的服务器分成几个小的逻辑上或物理上的服务器, 每一个小的服务器运行一套独立的操作系统。分区技术可将服务器的c p u ,内 存、加等资源合理地进行分区和调配,不同分区内可以执行不同的操作系统或 同一操作系统的不同版本,最大限度地挖掘了服务器的性能,一台服务器甚至 可以当作几十台使用,提高了硬件利用率。并且,在任何某个分区发生故障时, 都不会影响其他分区的运行,不同分区的应用之间保持独立性。 v o m s 开发对象是大型可分区服务器,在可分区服务器中,每个分区被称 为n 分区,一个分区由一个或多个单元组成,它们在高带宽、低延迟交叉结构 上相互通信。每个分区运行自己独立操作系统。不同分区可以执行操作系统的 相同或不同版本,它们甚至还可以执行不同的操作系统,如h p d x 和谢n d o w s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论