




已阅读5页,还剩69页未读, 继续免费阅读
(计算机应用技术专业论文)计算网格环境下基于检查点的进程迁移机制研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算网格环境下基于检查点的进程迁移机制研究 曾科宏( 计算机应用技术) 指导教师:全兆岐( 教授) 梁鸿( 副教授) 摘要 随着i n t e m e t 技术的飞速发展和广泛应用,一种新的计算模式一网格 计算蓬勃发展起来。网格作为基于i n t e m e t 的协同资源共享和问题求解环 境,推动i n t e m e t 发展到了新的阶段。在网格这种广域分布、普遍异构的 计算环境中进行协同资源共享和问题求解需要解决许多挑战性的问题。其 中之一就是在资源故障发生较频繁的情况下,如何保证网格的高可用性和 高可靠性。 本文的研究聚焦于计算网格,在分析计算网格高可用性问题特殊性的 基础上,围绕如何在网格中间件g t 上为应用提供高可用性和容错性,研 究了计算网格高可用关键技术,包括进程迁移和检查点。本文主要创新工 作包括: ( 1 ) 提出了基于g t 的高可用服务层体系结构( h i g ha v a i l a b i l i t y s e r v i c el a y e ro f a r c h i t e c t u r eb a s e do ng l o b u st o o l k i t ,h a s l a ) ,主要包括 进程迁移、检查点数据管理和资源备份。该体系结构是在对计算网格工程 与科学计算需求分析的基础上提出的,在兼顾性能及服务质量的同时,力 求高可用性和容错性。 ( 2 ) 借鉴了检查点和进程迁移两种高可用技术,提出了基于检查点的 进程迁移模型( p r o c e s sm i g r a t i o nm o d e lb a s e do nc h e e k p o i n t ,p m m c ) ,并 且从检查点的设置、进程状态转储、进程状态迁移和进程恢复四个方面详 细地阐述了模型的过程。该模型为网格系统的运行提供了高可用性和容错 性,有效地平衡了节点负载,提高了节点的利用率和吞吐量。 ( 3 ) 通过分析经典的进程迁移算法,结合了检查点设置策略,改进了 一种类似f i l es e r v e r 的基于检查点的进程迁移算法,并在网格实验平台上 进行性能测试。实验结果表明,该算法有效地减少了迁移的冻结时间,消 除了残余依赖,为系统提供了实时性和容错性。 关键词:计算网格,进程迁移,检查点,容错,高可用性 r e s e a r c ho fp r o c e s sm i g r a t i o nm e c h a n i s mb a s e do n c h e c k p o i n t i nc o m p u t a t i o n a lg r i d z e n g k e - h o n g ( c o m p u t e ra p p l i c a t i o nt e c h n o l o g y ) d i r e c t e db yp r o f e s s o rt o n gz h a o - q ia s s o c i a t ep r o f e s s o rl i a n gh o n g a b s t r a c t w i t ht h er a p i dd e v e l o p m e n ta n dw i d ea p p l i c a t i o no f i n t e r a c tt e c l m o l o g i e s an e wc o m p u t i n gp a t t e r n - - g r i dc o m p m i n g ,w h i c hs u b s t a n t i a l l yc h a n g e st h e w a yw ep e r c e i v ea n du s ec o m p u t a t i o n a lr e s o u r c e sa n ds e r v i c e si sb o o m i n g g r i di sa ni m e m e t b a s e di n f r a s t r u c t u r ef o rc o o p e r a t i v er e s o u r c es h a r i n ga n d p r o b l e m s o l v i n g ,w h i c hb r i n g st h ei n t e m e ti n t oan e ws t a g e f o rc o o p e r a t i v e r e s o u r c es h a r i n ga n dp r o b l e m - s o l v i n g ,m a n yc h a l l e n g i n gp r o b l e m sa n t i c i p a t e s o l v i n g i ns u c haw i d e a r e ad i s t r i b u t e da n ds u b s t a n t i a l l yh e t e r o g e n e o u s c o m p u t i n ge n v i r o n m e n ta sg r i d ,m a n yc h a l l e n g i n gp r o b l e m sa n t i c i p a t et ob e s o l v e d o n eo fw h i c hi sh o wt og u a r a n t e et h el l i g ha v a i l a b i l i t ya n dr e l i a b i l i t y o f g r i di nc i r c u m s t a n c e sw i t hf r e q u e n tr e s o u r c ef a i l u r e t h er e s e a r c hi nt h i st h e s i sf o c u s e do nc o m p u t a t i o n a lg r i d w ea n a l y z e d t h ep a r t i c u l a r i t yo f t h ea v a i l a b i l i t yo f c o m p u t a t i o n a lg r i d ,t h e ns t u d i e dt h ek e y t e c h n o l o g yo fp r o c e s sm i g r a t i o na n dc h e c k p o i n ti ng r i df o rt h ep u r p o s eo f p r o v i d i n gh i 曲a v a i l a b i l i t ya n df a u l t - t o l e r a n c ew i t hg r i dm i d d l e w a r e g l o b u s t o o l k i tf o ra p p l i c a t i o n s m a i ni n n o v a t i o n so f t h i st h e s i si n c l u d e : ( 1 ) t h r o u g ha n a l y z i n gt h ee n g i n e e r i n go fc o m p u t a t i o n a l g r i da n d s c i e n t i f i cc o m p u t i n g ,ah i g ha v a i l a b i l i t ys e r v i c el a y e ro fa r c h i t e c t u r eb a s e d o ng l o b n st o o l k i t ( h a s l a ) w a sp r o p o s e dw h i c hi n c l u d e sp r o c e s sm i g r a t i o n , c h e c k p o i n t d a t a m a n a g e m e n t a n dr e s o u r c e b a c k u p i t t a k e st h e h i g h - a v a i l a b i l i t ya n df a u l t - t o l e r a n c ei n t oa c c o u n ta sw e l la sp e r f o r m a n c ea n d s e r v i c eq u a l i t y ( 2 ) u s i n gt h et e c h n o l o g i e so fp r o c e s sm i g r a t i o na n dc h e e k p o i mf o r r e f e r e n c e ,t h e t h e s i s p r o p o s e d ap r o c e s s m i g r a t i o nm o d e lb a s e do n c h e c k p o i n t ( p m m c ) ,a n de x p o u n d e dt h ec o u r s eo ft h em o d e lf r o mf o u r a s p e c t s :c h e c k p o i n ts e t t i n g , p r o c e s ss t a t ed u m p ,p r o c e s ss t a t em i g r a t i o na n d p r o c e s sr e c o v e r y t h i sm o d e lh a sp r o v i d e dt h e l l i g ha v a i l a b i l i t ya n d f a u l t - t o l e r a n c ef o rr u n n i n g ,e f f e c t i v e l yb a l a n c e dt h en o d el o a da n di n c r e a s e d n o d e s u s i n gr a t ea n dt h r o u g h p u t ( 3 ) b a s e do n 锄a l y 西n gc l a s s i c a la l g o r i t h m so fp r o c e s sm i g r a t i o na n d c o m b m c dw i t hc h e c k p o i n ti n t e r c a l a t i n gs t r a t e g y , t h i sp a p e ri m p r o v e dak i n d o f a l g o r i t h mo f p r o c e s sm i g r a t i o nb a s e do nc h e c k p o i n tw h i c hw a ss i m i l a rt o f i l es e r v e r a tl a s t , w et e s t e dt h ep e r f o r m a n c eo nt h ee x p e r i m e n t a lp l a t f o r m t h er e s u l t ss h o w e dt h a tt h i sa l g o r i t h mi se f f e c t i v ei nr e d u c i n gt h em i g r a t e d f r e e z i n gt i m ea n de l i m i n a t i n gr e m a i n sd e p e n d e n c e ,a n di tp r o v i d e dr e a lt i m e a n df a u l t t o l e r a n c ef o rt h eg r i ds y s t e m k e y w o r d s :c o m p u t a t i o n a lg r i d ,p r o c e s sm i g r a t i o na l g o r i t h m ,c h e c k p i o i n t , f a u l t - t o l e r a n c e ,h i 曲a v a i l a b i l i t y 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取 得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中国石油 大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志 对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。 签名:! 蓝! i 室 2 。7 年孕月1 日 关于论文使用授权的说明 本人完全了解中国石油大学有关保留、使用学位论文的规定,即: 学校有权保留送交论文的复印件及电子版,允许论文被查阅和借阅;学校 可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保 存论文。 ( 保密论文在解密后应遵守此规定) 。 学生签名:堂墨塞上删净严月1 日 导师签名: 名出幽差一 圳年仁月 e t 中国石油大学( 华东) 硕士论文第1 章前言 第1 章前言 1 1 课题来源及研究背景 随着计算机性能的不断提高和网络通讯技术的迅猛发展,应用需求日 益朝着高性能、大规模、多样性、多功能的方向发展,要求将地理上分布 的、异构的各种高性能计算资源、存储资源、数据资源和其它特殊资源通 过高速网络连接起来,实现高性能联合计算,共同完成重大应用问题,即 广域高性能的元计算技术,也称为网格计算技术【1 】。与传统的分布式计算 不同,网格计算着重于大规模的资源共享、创新应用,并在一定情况下定 位于高性能计算,已经成为一个重要领域。在网格这种广域分布、普遍异 构的计算环境中进行协同资源共享和问题求解需要解决许多挑战性的问 题。其中之一就是在资源故障发生频繁的情况下,如何保证网格的高可用 性和高可靠性。 随着三维地震勘探、高分辨率地震勘探和四维地震勘探等新技术在地 震勘探领域的应用和推广,地震资料采集的数据量比以往大大增加,加之 处理流程中不断增加的中间数据,使得需要处理的地震资料的数据量和计 算量更加庞大,传统的地震处理解释系统己无法完全满足地震勘探数据处 理的需求,因此开展大规模分布式数据处理,就成了地震资料处理发展的 必由之路【2 】。网格这种具有超强计算能力技术的出现,恰好满足了地震资 料数据处理对更强、更大、更灵活的计算力的需求。 本课题组研究的“基于网格技术的地震资料处理解释系统”,简称 g s p s ( g r i ds e i s m i cp r o c e s s i n gs y s t e m ) ,是在胜利油田和中国石油大学重 大科技攻关项目“微机集群并行交互地震处理解释系统”的基础上提出的, 目的在于将基于集群的地震处理解释系统移植到计算网格环境中。为了使 她震资料处理高效地利用网格的超强计算能力,课题组根据网格技术的特 点,研究设计适合地震勘探数据处理的网格基础设施,为地震资料处理需 要的高性能计算能力提供平台,并在此平台上开发地震资料处理解释系 统。本论文是g s p s 课题的子课题,研究旨在为网格系统提供高可用性和 容错性,为网格技术在地震勘探资料处理领域中的应用做好基础性工作。 中国石油大学( 华东) 硕士论文第1 章前言 1 2 关键技术及研究现状 1 2 1 检查点 设置检查点( c h e e k p o i n t i n g ) 是计算机系统进行故障恢复的重要手段。 计算机系统通过周期性的设置检查点,把程序在运行时的正确状态保存到 稳定存储器中。如果在随后的运行过程中发生故障,那么系统将进行回卷 恢复( r o l l b a c kr e c o v e r y ) ,从稳定存储器中读出一个检查点时的正确状态, 从该点继续执行。这样可以避免由于故障而导致的程序从头重新执行,因 而可有效地减少计算的损失。d u d a 证明在故障条件下,如果不使用检查 点,程序平均执行时间随其有效执行时间( 假设不发生故障时间的执行时 间) 呈指数增长,而使用固定间隔的检查点则呈线性增长 3 1 。实际上,当 故障率超过一定值,两次故障的平均间隔时间小于程序的有效执行时间的 时候,如果不使用检查点,程序几乎不能运行到结束。 检查点机制包括两个基本过程: ( 1 ) 状态检查( c h e c k p o i n t i n g ) :即记录进程运行的中间状态信息的过 程; ( 2 ) 状态恢复( r e s t a r t i n g ) :是指利用状态检查所记录的进程一致性状 态信息产生一个和原进程具有相同中间状态进程的过程。 状态检查主要有两种实现方式1 4 j : 一是进程本身调用状态检查函数保存进程状态,称之为内部状态 检查( i n t e r - c h e c k p o i n t i n g ) 。采用内部状态检查相对来说比较简单,因为 绝大数上下文信息对于进程本身来说都是可见的。这种方式一般通过信号 ( s i g n a l ) 处理机制来完成检查点的状态检查。但是它需要修改应用程序甚 至是系统内核的源代码,透明性不高是其最大的缺点; 二是外部进程对指定进程进行状态检查,称之为外部状态检查 ( e x t e r - c h e c k p o i n t i n g ) 。该方式通过操作系统提供的进程间地址访问接口, 可以在核心地址空间访问任意进程用户地址空间。外部状态检查最大的优 点是不必修改应用程序与系统内核,透明性高。 检查点机制通常是以软件包、函数库、功能模块等形式实现。其中较 为著名的包括e p c k p t ! 卯、c r a k l 6 、d y n a m i t e l 7 1 、c k p t 、l i b c k p t t 引、c o n d o r 【9 1 、 2 中国石油大学( 华东) 硕士论文第1 章前言 c o c h e c k 10 】等。表1 1 详细介绍了几种利用检查点机制的系统。 表i - i 利用检查点机制的几个系统 名称描述及特征操作系统实现形式 e p c k p t支持并行进程、共享内存、当前目录、 l i n u x 、系统内核实现 文件及管道等 s y s t e m v c r a k 基于e p c k p t 开发,实现了e p c k p t 相 l i n u x系统内核模块 同功能,并支持s o c k c t 状态检查 d y n a m i m无需重新编译或重新链接,支持并行l i n u x用户层实现 进程 s o l a r i s c k p t无需重新编译或重新链接应用程序l i n u x用户层实现 l i b c k p t 性能优化,对应用程序透明 u n i x 用户层函数库 c o n d o r仅支持单进程,主要用于任务的调度u n i x用户层函数库 c o c h c c k一致性状态检查,支持p v m 和m p iu n i x用户层函数库 检查点机制作为一种后向故障恢复技术,能将故障导致的计算损失降 低到最小,因此在系统容错和高可用性方面应用广泛。国内外对于检查点 机制的研究也是方兴未艾。 1 2 2 进程迁移 进程迁移( p r o c e s sm i g r a t i o n ) 是实现负载平衡、高可用性和容错性 的关键技术之一。进程迁移的基本思想是在进程运行的过程中,将进程转 移到其它的节点上运行,并且对资源的访问也能够延续,而且不必知道运 行进程或其它相互作用的进程的知识就可以启动进程迁移操作,这意味着 迁移是透明的( t r a n s p a r e n t ) 。简单地说,进程迁移的过程就是进程计算和 通信状态的保存及在其它节点恢复的过程。 进程迁移的概念最初源于分布式系统中,主要目的在于提高分布式系 统的性能( 如解决负载平衡问题) 及可靠性。但随着研究的深入,它的应 用已不再局限于此,进程迁移主要应用有: ( 1 ) 容错性和高可用性:与检查点机制结合,可以将故障节点机上的 进程迁移到正常运行的节点机上,增加系统的可靠性和可用性,改善系统 的容错能力。 ( 2 ) 动态负载平衡:将进程迁移到负载轻或空闲的节点上,充分利用 中国石油大学( 华东) 硕士论文第1 章前言 可用资源,通过减少节点间负载的差异来全面提高性能。 ( 3 ) 提高通信性能:利用进程迁移机制将位于不同节点机上而又彼此 频繁通信的一组进程迁移到同一节点执行,可在一定程序上降低进程的通 信开销。 ( 4 ) 提高特殊资源的利用率:分布式系统中某些资源不能被远程获 得,此时可利用进程迁移机制使它们得到较高的利用率,而这些资源从远 程访问和从本地访问的效率相差很大,进程迁移也可以有效地解决这个问 题。 ( 5 ) 并行文件i o :将进程迁移到文件服务器上进行l d o ,而不是通过 传统的从文件服务器通过网络将数据传输给进程。对于那些要向文件服务 器请求大量数据的进程,这将有效地减少通信量,极大的提高效率。 ( 6 ) 提高多任务应用的并行度:将单机上提交的并行任务通过迁移分 散到分布式系统的各个节点机上,实现真正意义上的并行。 ( 7 ) 内存引导( m e m o r yu s h e r i n g ) 机制:当一个节点耗尽它的主存 时,内存引导机制将允许进程迁移到其它拥有空闲内存的节点,而不是让 该节点频繁地进行分页或和外存进行交换。这种方式适合于负载较为均 衡,但内存使用存在差异或内存物理配置存在差异的系统。 进程迁移技术随着集群等分布式系统的发展而发展。很多进程迁移系 统实现在u n i x 上,并且通常不用修改内核,这些方法提供了广泛的可移 植性,但是也有不少困难,尤其是在处理迁移后的进程间通信i p c 上。 常见的进程迁移系统有: f r e e d m a n 1 1 1 f r e e d m a n 是一个非常简单的进程迁移系统,只提供了进程内存映像 的迁移,但不提供对操作系统状态的传输,如文件描述符、进程标识符和 套接字地址等。系统运行在未加修改的u n i x 上,应用代码需要进行修改 才能使用迁移服务,每隔一段时间就要检查是否需要被迁移,可以在迁移 前和迁移后分别添加“h o o k ”函数。标记为可迁移的应用受负载平衡算 法的制约,确保迁移进程不会运行在交互的机器上,c p u 负载被平均分 布在参与的机器间。 4 中国石油大学( 华东) 硕士论文第l 章前言 c o n d o r 1 2 j w i s c o n s i n m a d i s o n 大学开发的分布式资源管理系统c o n d o r ,用于工 作站网络环境下提高空闲节点的利用率。系统提供进程记录检查点和迁移 的机制,每个提交的程序通过记录检查点的方式( 用一个特殊的信号处理 程序来实现) ,生成一个新的可执行文件,该文件在其它节点上能够从该 检查点处开始执行。 a c c e n t 1 3 】 c a r n e g i em e l l o n 大学1 9 8 7 年研制了a c c e n t 系统。它基于一个新的与 u n i x 不兼容的核心,其进程间通信通过“端口( p o r t ) ”的抽象来完成异 步消息的传输。z a y a s 给系统增加了进程迁移,他认为传输块的地址空间 是阻止快速迁移的一个瓶颈。为了减少数据传输,系统在主机间进行的是 逻辑传送而不是物理传送。迁移采用c o p y o i l r e f e r e n c e 方法,只有当进程 需要时,页面才被传送到目的节点上去。该项目最终导致了m a c h 系统的 研制。 c h a r l o t t e 1 4 】 c h a r l o t t e 是w i s c o n s i n - m a d i s o n 大学开发的分布式操作系统,作为分 布式算法和负载分布策略的一个试验平台。它包含新的多线程内核,它通 过进程之间的累加连接l i n k s 来通讯,提供了一套丰富的i p c 原语。 c h a r l o t t e 的进程迁移系统做得非常好,容错性非常高,但是系统和u n i x 不兼容,文件系统难以使用并且可能导致差的性能。 l o c u s 1 5 1 l o c u s 是c a l i f o r n i al o sa n g l e s 大学1 9 7 9 年开始开发的一个分布式操 作系统。l o c u s 是作为分布的、容错( 高可用性) 、兼容u n i x ( s y g e m v 和b s d ) 的系统来开发的。它是在u n i x 内核上修改开发的,支持对异 构环境的操作,扩展了对文件c a c h i n g 和网络文件系统复制的支持。 m o s i x l 6 】 m o s i x 是h e b r e w 大学研制的一个多机操作系统,将松散耦合的计算 机集群集成为一个单一的类u n i x 环境,重写了一个新的操作系统核心, 并支持u n i x 系统v 版本2 的i p c 标准,即消息、共享内存、信号量、 管道和信号等。进程可以在主机之间自由迁移。m o s i x 实现了一个分布 中国石油大学( 华东) 硕士论文第1 章前言 式的负载平衡策略,成为该领域的典范。 s p r i t e 1 7 1 加州大学b e r k e l e y 分校在八十年代研制的实验性操作系统s p r i t e ,与 u n i xb s d 4 3 兼容,提供一种半自动的透明的进程迁移机制。其进程迁 移机制的主要设计目标是高度的透明性,虽然进程被迁移走了,但看起来 仍然像在源节点上运行一样,它可以停止、发信号和调试迁移进程。 m a c h 1 8 】 m a c h 上的任务迁移。m i l o j i c i e ,z i n t ,d a n g e l 等人为m a c h 微内核增加 了任务迁移和负载分布的支持。主要目标就是尽可能少的修改内核,在用 户空间提供透明的可移植的迁移。迁移的基本单元为任务( t a s k ) ,任务 是进程运行在其中的环境,包括分页的虚地址空间和对系统资源( 如处理 器和端口能力) 的访问权。 c h o r u s 1 9 1 c h o r u s 是一个非常现代的基于微内核的操作系统。程序分布的逻辑单 元是a c t o r 。一个a c t o r 关联着一个上下文,定义了一个虚地址空间,许 多轻量级的线程可以运行在其中。线程通过向端口( p o r t s ) 的消息队列 中发送消息来通信。跨网络的远程通信则是通过网络管理器这个用户模块 以一种位置无关的方式访问的。 迁移系统由定义了良好接口的3 个白包含的模块组成。内核模块 ( k e r n e lm o d u l e ) 负责进程封装、重建和维持负载信息;策略模块( p o l i c y ) 负责整个迁移策略;传输模块( t r a n s p o r tm o d u l e ) 负责负载状态的传送。 策略模块从内核模块中获得参与节点的负载信息,然后开始迁移过程。迁 移的单元是a c t o r ,等同于u n i x 上的进程。 r h o d o s 2 0 c o l l e g e 和n e w s o u t h w a l e s 大学九十年代开始研制的实验性分布操作 系统r h o d o s ( r e s e a r c ho r i e n t e dd i s t r i b u t e do p e n i n gs y s t e m ) ,旨在研究 分布式操作系统中的一些基本问题,特别是命名,负载平衡和进程迁移, 支持迁移的通信子系统,可移植的存储器管理,保护机制,通信安全以及 身份认证等方面的实现方式和算法,并研究这些算法对性能的影响。 r h o d o s 系统建立在一个模块化的基于进程的操作系统核心之上,具有 6 中国石油大学( 华东) 硕士论文第1 章前言 灵活的通信子系统和内置的进程迁移支持,提供消息传递和r p c 机制, 进程间通信通过端口的消息队列来完成。 从上述研究现状来看,进程迁移的研究还主要处于实验室研究阶段, 真正得到广泛应用的系统还不多。这主要是因为进程迁移实现的复杂性和 对操作系统的依赖阻碍了它的发展。现在较为成熟的进程迁移系统都是构 建在自行研发的分布式操作系统之上,其中大部分不与l i n u x 操作系统兼 容,而在实现的方式上,只有c o n d o r 采用的是基于检查点的机制。现有 的多数进程迁移系统,其目的是为系统提供负载均衡功能,用于提高系统 高可用性、可靠性和容错性的应用实现还不多。 1 3 论文的研究目标和内容 本文将在研究网格高可用和容错服务的理论基础上,设计实现一个高 效地适用于地震资料处理的高可用和容错的网格系统,为地震资料处理的 正常运行提供可靠的服务保证。论文不涉及地震勘探的具体内容。主要研 究的内容如下: ( 1 ) 网格系统研究:掌握g l o b u st o o l k i t 的使用方法,明确网格的定 义,了解网格的体系结构,分析计算网格的可用性; ( 2 ) 检查点技术研究:分析了检查点机制的基本原理,重点研究了检 查点的一致性、检查点时间间隔的选择和检查点数据的存储结构,总结了 检查点的优化技术; ( 3 ) 进程迁移机制研究:描述了进程迁移的状态,重点研究了进程选 择策略和目的节点选择策略,分析了进程迁移的代价; ( 4 ) 进程迁移算法研究:从s t a t a 、t i m e l 和t i m e 2 三个条件分析 了进程迁移算法,阐述了四种经典迁移算法,改进了一种类似f i l es e r v e r 的基于检查点的进程迁移算法; ( 5 ) 基于检查点的进程迁移模型设计与实现:借鉴检查点和进程迁移 两种高可用性技术,提出了基于g t 的高可用服务层的体系结构,提出了 基于检查点的进程迁移模型,从检查点的设置、进程状态转储、进程状态 迁移和进程恢复四个方面阐述了该模型,对模型进行实验测试和结果分 析。 中国石油大学( 华东) 硕士论文第1 章前言 1 4 论文组织与结构安排 本论文共分为6 个章节,其中: 第1 章为前言,主要介绍了论文的研究背景及意义、论文的主要研 究内容以及关键技术( 检查点和进程迁移) 的研究现状。 第2 章为网格基础理论研究,包括网格定义、网格特点、体系结构、 网格计算的研究现状及主要应用和网格的可用性分析等内容。 第3 章对检查点和进程迁移两种高可用关键技术作了详细研究,主要 包括检查点的关键问题( 检查点的一致性、时间间隔选取和检查点数据的 存储管理) 和进程迁移的基本问题( 负载信息的管理和进程迁移的代价分 析及对节点负载状况的影响) 。在此基础上,提出了h a s l a 体系结构。 第4 章对基于检查点的进程迁移进行了详细的设计与实现。具体介绍 了基于检查点的进程迁移模型的实现过程以及进程迁移算法。 第5 章是测试与结果分析。分别对改进的进程迁移算法与其它进程迁 移算法比较,以及在网格试验平台上对系统进行性能测试,并对结果进行 分析比较。 第6 章是总结和展望。总结全文并指出有待进一步研究的问题。 8 中国石油大学( 华东) 硕士论文第2 章网格理论研究 第2 章网格理论研究 概述了网格的定义、特点、网格体系结构以及网格的研究现状,重点 分析了网格的可用性。 2 1 网格计算概述 2 1 1 网格的定义 由于目前网格正处于研究、发展时期,仍然没有一个能够被大家一致 认同、接受的概念。不同的人从不同的角度提出了多个不同的网格定义, 其中以网格研究的权威科学家i a nf o s t e r 等人提出的定义为代表,但是他 们的网格定义也随着研究的深入及对于网格认识的变化而发生变化。 i a n f o s t e r 等人在1 9 9 8 年的g l o b u s 项目状况报告首次提出的网格 定义为:计算网格是大规模高性能分布式计算环境,该环境对高端计算资 源可靠、一致、普遍的访问【2 “。该定义所强调的网格的特点是大规模、 可靠、一致、普遍的访问。 f a nf o s t e r 等人在1 9 9 8 年出版的网格经典图书1 1 1 eg r i d :b l u e p r i n tf o r a n e w c o m p u t i n gi n f r a s t r u c t u r e ) ) 中给出的网格定义为:计算网格是一个 软硬件的基础设施,提供了对高端计算能力可靠、一致、普遍并且廉价的 访i h - 2 2 1 。在这个定义中将“大规模高性能分布式计算环境”改成了“基 础设施”,并强调网格是由软件和硬件共同构建的。 i a nf o s t e r 等人在2 0 0 1 年发表的文章1 1 1 ea n a t o m yo ft h eg r i d : e n a b l i n gs c a l a b l ev i r t u a lo r g a n i z a t i o n s ) ) 将网格描述为:在动态的多机构 的虚拟组织协同的资源共享和问题求解【2 3 1 。这个定义提出了虚拟组织、 资源共享和资源协同的思想,细化并发展了前面两个定义。 i a nf o s t e r 等人在2 0 0 2 年发表的文章 g r i ds e r v i c e sf o rd i s t r i b u t e d s y s t e mi n t e g r a t i o n ) ) 给出了至今最完整的一个网格定义:网格技术及其基 础设施支持在动态的、分布的虚拟组织对不同资源的共享与协同使用,从 具有不同政策的不同组织所操纵的地理上分布的部件来构建虚拟的计算 系统,该系统被充分的集成以便提供所需用的服务质量1 2 4 1 。该定义基本 涵盖、扩展了其以前所提出的网格概念,其中描述的网格特点更广泛,包 括地理上分布的、异构的、资源共享、资源协同、多管理域、可靠访问、 9 中国石油大学( 华东) 硕士论文第2 章网格理论研究 普遍访问、服务质量等。 i a nf o s t e r 等人对网格进行定义的上述过程正是网格不断发展变化的 体现,由于网格的各个领域尚处于研究阶段,还远远没有成熟,可以预见 网格的定义还会继续发展下去。 2 1 2 网格的特点 分析网格的特点能够更深刻、清晰的了解网格技术、丰富网格的内涵。 网格作为一个被寄予了极大希望的基础性设施,与其它系统相比,具 有兼容并包的特点,网格的主要特点如下 2 5 之刀: 1 大规模分布与可扩展:网格集成了众多的资源,可以从几个扩展 到上百万个,而且这些资源是分布在地理位置不同的多个地方。 2 异构性:网格集成了各种软件和硬件资源,这些资源之间存在很 大的不同,范围包括从数据、文件、软件组件以及程序到传感器、科学设 备、显示设备、计算机、超级计算机和网络等。 3 多管理域与自治性:网格资源是属于不同的组织并且是跨越多个 管理域分布的。资源所有者的自治权需要被尊重,同时资源的用户具有本 地资源管理和制定使用策略的权利。 4 多样性与动态性:与传统的分布式系统相比,网格环境中的资源 不仅仅包括计算机和网络,还包括其它多种资源,如软件、数据、贵重仪 器等。正是由于网格环境中资源多样,所以资源出错的可能性很大;又由 于网格中的资源具有自治性,因此资源可以随时加入或者退出。 5 共享与协同:网格中的资源属于许多不同的组织,能够被其它组 织或者个人访问。这样应用程序就可以使用非本地的资源,以提高效率, 降低费用。为了提供集成的计算能力,网格中的资源必须要协同。 2 2 网格体系结构 网格体系结构是关于如何建造网格的技术,包括对网格基本组成部分 和各部分功能的定义和描述,网格各部分相互关系与集成方法的规定和网 格有效运行机制的刻画。显然,网格体系结构是网格的骨架和灵魂,是网 格核心的技术,只有建立合理的网格体系结构,才能够设计和建造好网格, 才能够使网格有效地发挥作用。网格体系结构的研究对网格的研究与构建 有重要的意义。 1 0 中国石油大学( 华东) 硕士论文第2 章网格理论研究 到目前为止,比较重要的网格体系结构有两个,一个是i a nf o s t e r 等 在早些时候提出的五层沙漏结构【矧,另一个就是以i b m 为代表的工业界 在考虑到w e b 技术的发展与影响后,i a nf o s t e r 等结合w e bs e r v i c e 提出 的开放网格服务结构o g s a ( o p c ng r i ds e r v i c e sa r c h i t e c t u r e ) 1 2 虮。 2 2 1 网格的五层沙漏结构 五层沙漏结构是g l o b u s 项目在早期提出的具有一般性的网格体系结 构,它的主要特点就是简单,是一种影响十分广泛的结构,它是以协议为 中心的“协议结构”,强调协议的层次及在网格的资源共享和互操作中的 地位。它建立在互联网协议之上,以互联网协议中的通信,路由、名字解 析等功能为基础,自下而上分为五层:构造层、连接层、资源层、汇聚层 和应用层。每层都有自己的服务、a p i 和s d k ( s o f t w a r ed e v e l o p m e n t k i t s ) ,上层协议调用下层协议的服务。图2 1 描述了网格的五层沙漏结构 模型。 嚣夕 威用层 谚墓怒7 汇聚层 p 彳 资源与 连接层 丧瓢 构造层 图2 - 1 五层沙漏结构模型 2 2 2 开放式服务网格体系结构s a o g s a 被称为是下一代的网格体系结构,它是在原来“五层沙漏结构” 的基础上,结合最新的w e bs e r v i c e 技术提出来的。o g s a 包括两大关键 技术即网格技术和w e bs e r v i c e 技术。 中国石油大学( 华东) 硕士论文第2 章网格理论研究 o g s a 最突出的思想就是以“服务”为中心。在o g s a 框架中,将一 切都抽象为服务,包括计算机、程序、数据、仪器设备等。这种观念,有 利于通过统一的标准接口来管理和使用网格。w e bs e r v i c e 提供了一种基 于服务的框架结构,但是,w e bs e r v i c e 面对的一般都是永久服务,而在 网格应用环境中,大量的是临时性的短暂服务,比如一个计算任务的执行 等。考虑到网格环境的具体特点,o g s a 在原来w e bs e r v i c e 服务概念 的基础上,提出了“网格服务( g r i ds e r v i c e ) ”的概念,用于解决服务发现、 动态服务创建、服务生命周期管理等与临时服务有关的问题。 基于网格服务的概念,o g s a 将整个网格看作是“网格服务”的集 合,但是这个集合不是一成不变的,是可以扩展的,这反映了网格的动态 特性。网格服务通过定义接口来完成不同的功能,服务数据是关于网格服 务实例的信息,因此网格服务可以简单地表示为“网格服务= 接口珩为 + 服务数据”。图2 2 是对网格服务的简单描述。 服掣嚣问露黼显示撤销,p ( 必需的) 软状态生命周期 绑定特性 可靠激活 认证 黼卜薏口 一授权 一服务创建 一服务注册 一管理 一并发 + 面向特定应 用的接口 二二二二三茎薹= !i 图2 - 2 网格服务示意图 2 3 网格研究现状 网格计算源于美国和欧洲( 英国、德国等) 的研究计划,作为一种新 兴的计算机技术,网格正在快速发展。网格计算正在迅速的从美国和欧洲 向世界上的其他国家和地区迅速传播。各国政府、相应的国际组织及大的 企业财团已经在网格研究领域投入了大量的资金。全球网格论坛、地区和 1 2 中国石油大学( 华东) 硕士论文第2 章网格理论研究 国家的网格论坛正在迅速的发展,其学术交流活动也正在积极地展开。其 中全球网格论坛( g l o b a lg r i df o r u m ,g g f ) 已经成为网格标准制定与发 布的主要机构。g g f 坚信标准是网格技术发展的决定性因素。 在世界范围内已有多种国际性的网格项目,其中集成的网格系统有 l x l e t s o l v e 2 9 ,n i m d 3 0 ,u i l i c o r c 【3 1 1 ;网格中间件有g l o b u s ,g r i d b u s l 3 2 ,c g s p , g r i d s i m ,l e g i o n 等;用户级中间件有a p p l e s 3 3 1 ,c o n d o r - g 3 4 1 , n i m r o d - g 3 5 1 ,c a c t u s 3 6 j ,g r a d s 3 7 1 ,g r i d p o r t 3 8 】等;网格应用有e u r o p e a n d a t a g r i d 3 9 1 ,g r i p h y n t 4 0 1 ,n e e s g r i d 4 1 1 ,g e o d i s e 4 2 ,1 p g 4 3 】等。此外还 有很多规模不一的各种各样的网格项目和实验床。下面具体介绍一下网格 目前主要的研究现状及其应用。 2 3 1 美国的网格研究现状 美国是网格技术的倡导者,也是目前网格技术的引领者。美国的网格 发展是从大学和科研机构开始的,随后企业界的参与加快了网格技术的发 展。先后出现了l e g i o n ,g l o b u s l 4 4 1 ,c o n d o r - g ,t e r a g r i d ,p l a n e t l a b 4 5 1 等。 g l o b u s 是目前网格技术的旗舰产品,是g l o b u s 联盟的网格产品。 g l o b u s 联盟推动了网格技术的不断发展,是网格技术发展的主要力量之 一。g l o b u s 联盟是网格计算的领导团
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 4.2 角 第1课时 角 说课稿 2024-2025学年北师大版七年级数学上册
- 2025年四川省劳动合同样本
- 7-1 《青蒿素人类征服疾病的一小步》教学设计 2023-2024学年统编版高中语文必修下册
- 晋中事业单位笔试真题2025
- 3.15 秦汉时期的科技与文化 说课稿 2024-2025学年部编版七年级历史上学期
- 2025授权合同样本:授予出版权合同
- 电池厂消防安全培训管理规定
- 湖北公务员真题2025
- 2025四川建筑劳务合同示范文本
- (2024年秋季版)江苏省连云港市七年级道德与法治下册 第四单元 体悟生命价值 第10课 珍爱生命 第2框 生命只有一次说课稿2 苏教版
- 2025年驾驶员安全培训考试试题库卷(答案+解析)
- 无人机培训课件
- 2025辽宁沈阳副食集团所属企业招聘3人考试参考题库及答案解析
- 储罐区的安全题库及答案解析
- 交大入党测试题及答案
- 培训如何开早会的课件
- 劳务人员入厂安全培训课件
- 2025年河北沧州市中心医院、沧州博施康养集团公开招聘辅助岗工作人员113名考试参考试题及答案解析
- 药店冷链药品知识培训内容课件
- 消防员抗洪抢险知识培训课件
- 历年时事政治试题及答案
评论
0/150
提交评论