(计算机应用技术专业论文)药物设计的网格平台搭建.pdf_第1页
(计算机应用技术专业论文)药物设计的网格平台搭建.pdf_第2页
(计算机应用技术专业论文)药物设计的网格平台搭建.pdf_第3页
(计算机应用技术专业论文)药物设计的网格平台搭建.pdf_第4页
(计算机应用技术专业论文)药物设计的网格平台搭建.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

(计算机应用技术专业论文)药物设计的网格平台搭建.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

火连理 :大学硕士学位论文 摘要 随着x 射线衍射以及核磁共振等技术的发展,越来越多的生物大分子的三维结构被 测定出来,计算机辅助药物设计呈现出了突飞猛进之势,药物分子虚拟筛选是其中的重 要环节。计算机药物筛选可以显著地缩短新药的研发周期、降低研发费用。计算机药物 筛选一般是针对选定的靶标,使用高性能并行训算机,从庞大的小分子库中筛选出具有 药理活性的化合物。然而,进行虚拟筛选不仅要搜索化合物小分子库,而且要对库中的 小分子进行分子筛选,即便对柔性小分子,粗略估计在其设计空间中也至少含1 0 ”个解, 再加上庞大的数据库搜索,需要耗费巨大的计算机时间,普通计算环境难以在可以接受 的时间内得到满意的结果。 近年来,网格技术得到了飞速的发展。网格为使用者提供了与地理位置无关和具体 的计算设施无关的通用的计算能力和资源,它代表了一种先进的技术和基础设施,是继 互联网之后又一次重大科技进步。把网格技术引入到虚拟筛选中,借助于网格的资源和 计算能力,可以很好地解决虚拟筛选所面临的搜索空间问题。新药研发网格正是基于这 样的背景而发展起来的,借助于新药研发劂格,可以显著地缩短一次配体集与受体对接 的时间。 本文主要做了以下工作:( 1 ) 搭建了一个供研究和测试使用的进行药物研发的网格 平台;( 2 ) 在大连理工大学的深腾18 0 0 服务器上搭建了新药研发网格的分节点;( 3 ) 对 新药研发网格的虚拟筛选算法进行了改进,编制了相应的程序:( 4 ) 给出数值算例并与 原虚拟筛选算法在时f 刮上进行了对比分析。 本文的研究工作得到国家重点基础研究发展规划项目( n o 2 0 0 4 c b 5 1 8 9 0 1 ) 经 费的资助。 关键词:网格;药物分子设计:计算平台;并行计算 火连理工火学硕= b 学位论文 ag r i dp 1 a t f o r mc o n s t m c t i o nf o rd m g d e s i g n a b s tr a c t w i mt h er a p i dd e v e l o p m e n to fx r a yc r y s t a l l o g r a p h i ca n dn u c l e a rm a g n e t i c r e s o n a n c e ( n m r ) t e c h 工l i q u e s ,m o r ea n dm o r et h r e ed i m e n s i o n s ( 3 一d ) p r o t e i n s t r u c t u r e sa r ek n o mb yp e o p l e ,w h i c hm a k e sap r o m i s i n gf u t u l ef o rd m d ( d r u g m o l e c u l a rd i s c o v e r y ) h o w e v e r ,d m ds u f b r st h ep r o b l e m st h a t ,打r s u y ,t 1 1 es e a r c h i n g s p a c eo f d m gm o l e c u l a rd o c k i n gi sh u g e ,w h j c hi n c l u d e s1 0 。”s o l u n 。n sa tl e a s te v e ni f o i l l yn e x i b i l i c yo f1 i g a n di sc o n s i d e r e d f u r t h e r m o r e ,i fb m i o n so fc o m p o u n d sa r et o b es c r e e n e di nt h i sw a 乳t l l ec o m p u t a t i o n a lp o w e rt h a ti sr e q u i l _ e db e c o m e sal i m i t i n g f 音a t u r e t h et e c h n o i o g yo fg r i dh a sn l a d eag r e a td e a lo fp r o g r e s si nt h er e c e 】1 t y e a r s g r i dc a ng i v et h eu s e r sg e n e l a lc o m pu t a t i o n a la b m t ya 1 1 d r e s o u r c e s ,w h i c ha r e i 1 1 e l a t i v et oa n yg i v e n1 0 c a t i o no 】e q u i p m e l l t s g 1 i di sr e p r e s e m a t i o no fa d v a n c e d t e c h n o l o g ya f l di i l f i a s t m c t w e ,龇1 di ti s ag r e a tp r o g r e s sa f t e ri m e m e t c o m b i n i n g v i r t u a ls c r e e l l i n g 晰t h 鲥dc o n l p l l t i n gw 珊b ev a l u a b l ei n d r u gd e s i g n d r u g d i s c o v e r yg r i d ( d d a 0i sd e v e l o p e db a s e do nt h i sb a c k g r o u n dt h et i m ef b rd o c k i n g o fs o m el i g a n d sa n dam o l e c u l ec a nb er e d u c e dg r e a t l yb yu s i n gd d g t h em a i nc o n t r i b u t i o n so ft 1 1 i sp a p e ra r es m m a r i z e da sf o l l o w s ( 1 ) c o n s t r u c ta g r i dp l a t f o 衄o fr e s e a r c ha 1 1 dt e s t i n gf o rn e wd r u gd i s c o v e r y ;( 2 ) c o n s t m c tan o d eo f d d go nd e e p c o m p18 0 0i nd a l i a nu n i v e r s i 够o ft e c h n o l o g y ;( 3 ) i m p r o v et h e v i n u a ls c r e e n i n ga l g o r “h mo fd d g ,a n dd e v e l o pap r o 伊a n lf o r 鲥dc o m p u t i n g ;( 4 ) g i v em a k eat i m ec o n t r a s tb e t w e e nt h e a yo fd d ga n dt h i sp a r a l l e lp r o g r a m t h er e s e a r c hw o r ki ss u p p o r t e db yt 1 1 es p e c i a lf u n d sf o rm a j o rs t a t eb a s i c r e s e a r c hp r o i e c t ( n 0 2 0 0 4 c b 5 1 8 9 0 1 ) o f c 1 i n a k e yw o r d s :g r i d ;d r u gm o l e c u l a rd c s i g n ;c o h l p u t i n gp l a t f o r m ;p a r a l i e lc o m p u t e 独创性说明 作者郑重声明:本顿士学位论文是我个人在导师指导下进行的研究工 作及取得磷究成柒。尽我所知,除了文中特掰加懿标注和致谤 的地方外, 论文中不包含其他人已经发表或撰:写的研究成果,也不包含为获得大连理 工大学或喾其链荜位数学位或证书所佼瘸过麓材瓣。与我一霹王俸豹麓志 对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。 作者签名:莲幺强期:兰= 董:兰:丕、 大连理工大学硕士研究生学位论文 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用 规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子 版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论 文。 作者签名 导师签名 年月日 大连理工大学硕士学位论文 1 绪论 回顾过去短短十几年,人们使用计算资源的方式发生了巨大的变化。十年前,人们 镬震零缝诗篓浚源完戏诗冀任务,毽瑷在这襻敲,已经不缒逶应社会发展静鬟要。嚣稳 在于:一方面,计算机、网络的普及和硬件价格的降低,使人们可以普遍地拥有高性能 浆诗冀资源;贯一方霹,秘技熬飞速发震傻太稠腰覆对浆秘学诗算趣黎| 三l 趋复容、庞大, 而解决这些问题需要觅加快速、稳定和高性能的计算资源以提供巨大的计算能力。为此 人 f j 开始寻求一耪菝的瓣决闯题鲍方法诗箨鄹爨豢仪爨设餐资源瓣共享,靼:裂惩 网络和有效的管理方法统一调度分布猩广域网上不同地域的资源。研究表明,个人电脑、 大型计冀机和舄贵的仪嚣设备资源的利用率逮常都比较低,丙圈趋完蛰的现代互联鄹技 术,不断增加的网络带宽又为资源共事提供了有利的祭件和基础保证。因此,如何有效 统一的管理这数分散在不同地理位景的计算资源,实现计算要求成为当今网络研究的一 个重要方向。阏格( g r i d ) 计算技术的出现,为这一问题实现资源共享提供了一种有效的 解决方法。 翠在上整鳃9 0 年代初便癫虢了潮格计算这一概念,主要鹿用子辩学计算领域,研 究关于干兆网试验床和一些元计算方面的工作。通过定义统一的网络协议和应用编程接 霜( a p p i c 蕊。珏p r o g r a m m i n gh 滟r f 酝e ,a p i ) ,在不目的资源主剖建统一熬诗算环境,实现 计算资源的共事。从9 0 年代中期到晚期,出现了一些比较重鼹的和舆有开创性、奠熬 瞧静磷究凌嚣。这一鬻阕,关予丽臻诗簿熬磅究帮实验褥羁毽器各国致瘸露辩吾胥辊秘鹃 高度重视和大力支持。由美豳自然科学基金资助的p a c i ( p a n n e r s h i pf o ra d v a n c e d c o m 氍采i o 髓ll 羟蠹鑫s 敦鞋e t 毫r e ) 项嚣,霞戆鼹拿整要熬部分,分爨蹩n c s a 淤a 鲑。菇a l c o m p u t a t i o n a l s c i e n c e a l l i a n c e ) 和n p a e i ( n a t i o n a lp a r 虮e r s h i p f o ra d v a n c e d c o 班p u 圭a t i o ll n 蠹8 s t 雕e 掘r e ) ;这一项霆逶过蜷辫术赛、欢癀部门襄工业赛戆力爨缝合怒 采,建立一个网格计算艇础设施的伙伴联盟,来促进科学发现和工程研究的发展。美圈 的n a s a 心蠹i o n 畦a e n a u t i c sa 娃ls p a e oa 越l 城s t r a t i o n ) 橡造7 一个霹格诗算实验庶,称 为i p g ( 1 1 1 f o h n a t i o np o w e rg r i d ) ,它可以将n a s a 分布在各地的资源邋过网络( 包括既 线通信手段) 逡接起来,解决n a s a 曩翦无法解决的科学与工程计冀以及数攥管理等 闽题。幽美国源部和三个国家重点实验室s a n d i a 、l i v e 册o r e 与l o s a l 黜o s 菇同承抠 的a s c i ( a c e e l e r a t e ds t r a t e g i cc o m p u t 赫gi n i t i 碱v e ) 计划,是一个主要腰子军事的高性熬 计算发展计剜,其冒的烃在不避行物理核实验的情况下,通过计算模拟对开展核武器众 方位的研究。 药物殴计的网格平台搭建 国内的网格项目主要有由中科院为首的“国家高性能计算环境( n a t i o n a lh i 曲 p e r f b 肌a n c ec o m p u t i n ge n v i r o l m e n t ,n h p c e ) ”项目,其长期的目标是提高计算网格系统 的性能,包括可扩展性和可用性等:目前包括北京、长沙、成都、合肥、上海、西安等 几个试验节点。另一个重要项目是“教育科研网格计划”,其目的是建立一个主要为教 育系统各单位提供资源共享的集科研、教育、培训为一体的高性能计算基础设施,实现 跨学科、跨地域合作与人才培养。 医药产业作为一种高技术产业,具有高投入、高风险和高收益等特点。根掘美国制 药商协会统计,从新药临床前的试验到美国食品及药物管理局批准,平均每个品种要花 费1 2 年时间;开发新化学实体所用时间自7 0 年代的7 7 年增加到9 0 年代的1 2 8 年。 在费用上,过去成功开发一种新药只需数千万美元,而目前的研究开发成本费一般在4 9 亿美元之间。此外,研究中的化学药品能够进入市场的成功率非常低( 欧洲为4 3 1 7 :1 , 美国为6 1 5 5 :1 ) 。新药临床试验时间的延长,新药评审时间的增加,使得新药上市后的 有效专利期大大缩短:首次上市的新药,其平均有效专利期已从1 9 6 0 年的1 2 年下降到 不足6 年。由此可见,新药开发的风险在增加,上市新药的数量在减少。 传统的药物设计( 如图1 1 所示) 从总体上讲,具有很大的盲目性,缺乏成熟完善 的发现途径。随着计算机技术、计算化学、分子生物学和药物化学的发展,药物发现进 入了理性的阶段,理性药物设计( r a t i o n a ld r u gd e s 培n ,r d d ) 是在分子甚至电子的水平上 考虑分子结构,它需要有先进的技术支撑,计算机的辅助是理性药物设计的重要手段。 图1 1 传统药物设计 h g 1 1t r a d i t j o n a id r l l gd e s i g n 性 临床前研究 基于分子水平的计算机辅助药物设计( c o m p u t e ra i d e dd r u gd e s i g n ,c a d d ) 又称为 计算机辅助药物分子设计( c o m p m e r a i d e d m 0 1 e c u l a r d e s i g n ,c a m d ) 。它综合并籍助了多 大连理n 大学硕士学位论文 学科的先进技术、方法和成果,为理性药物设计提供了强有力的基本工具和手段a 自从 1 9 6 0 年定量构效关系方法提出以来,经过4 0 多年的探索和努力,c a d d 得到长足地发 展;尤其是到1 9 9 0 年以后,随着多种新方法的出现,c a d d 已经发展为一门完善的研 究领域。它的应用缩短了药物研究与开发( r e s e a r c ha n dd c v e i o p m e n t ,r & d ) 的进程,提 高了药物开发的效率,也为人们研制新药提供了一条新的思路。 计算机辅助药物设计的方法大体可以分为基于小分子的药物设计方法、基于受体结 构的药物设计方法和计算机组合化学方法。随着x 射线衍射以及核磁共振等技术的发 展,越来越多的生物大分子的三维结构被测定出来,所以基于受体结构的药物设计也就 更具现实意义,如图1 2 所示。 关然声惭配俸肺选一 牡 分予生物学与蛋白质化学一 图1 2 基于结构的药物设计 f i g 12s 廿u c t u r e b a s e dd r u gd e s i g n 通过分子筛选可以从已有配体小分子库中筛选出有希望的药物先导化合物,避免了 繁琐的合成过程。然而,进行药物分子筛选时所涉及的搜索空间非常巨大,需要耗费大 量的时间,并且对计算环境也有较高的要求。将网格技术应用于药物分子虚拟筛选是解 决上述问题的有效途径。 国际上已经开展了将网格技术应用于药物开发的研究,例如i b m 等动用网格计算 技术开发天花治疗药物 1 】:由i b m 、u n i t e dd e v i c e s 及a c c e l r y s 提出的旨在开发天花治 疗药物的网格计算项目:天花研究网格计算项目( s m a l l p o x r h e s e a r c hg r i d p r o j e c t ,s r g p ) 。 药物设计的网格平台搭建 该项目采用的方法是招募志愿者,登录全球数百万台计算机并利用各电脑空闲时间,运 用网格计算技术对3 5 0 0 0 万种候选治疗药物成分及数种蛋白质和天花病毒进行化学相互 作用的分析。目前从事该分析工作的有英国牛津大学( o x f o r d u n i v e r s 姆) 及埃塞克斯大学 ( e s s e xu n i v e r s 畸) 的研究人员,加拿大罗伯特研究协会( r o b e n sr e s e a r c hi s t i t u t e ) 、美国 s 1 0 a 1 1 。k e t t e r i n g 癌症中心( s l o a n - k e t t e r i n gc a n c e rc e n t e r ) 及加拿大西安大略大学( t h e u n i v e r s i t yo fw e s t e mo n t a r i o ) 所属的天花专家。希望参加天花研究网格计算计划的志愿 者首先需从相关网站下载屏幕保护程序。该程序在电脑空闲时间进行数据处理,这样可 分担一部分研究所进行的分析工作。志愿者:海处理完的结果发送到u n i t e dd e v i c e s 的数 据中心,然后可以自动下载新数据再进行分析。 另一个典型的相关项目是药物设计和优化实验室( d r u gd e s i 鲫a n do p t i m i z a t i o nl a b , d 2 0 l ) 网格计算项目【2 j :这是一个大规模的分布式计算项目,用计算机仿真测试用于对 抗重症急性呼吸系统综合症( s e v e r ea c u t er e s p i r a t o r ys y n d r o m e ,s a r s ) 的新药物。这个 项目充分利用计算机的空闲中央处理器( c e n 士r a lp r o c e s s i n g u n i t ,c p u ) 时间进行运算,快 速地仿真检测可能用于治愈s a r s 的新药物的有效性,可以达到巨型超级计算机的处理 能力。 上述研究主要针对如何利用大量异地p c 机的闲散资源,即通过计算节点数量上的 增加来加快药物的开发过程。 但是,目前网格研究还面临很多问题,如数据安全的接收和发送、资源的自动发现 和利用等。本文搭建了一个针对药物虚拟筛选这一特定应用的网格计算平台,用于测试 和研究虚拟筛选算法,数值算例表明本平台可以在局域网范围内顺利运行。 中国新药研发网格( d r u gd i s c o v e r yg r i d ,d d g ) 是一个应用于计算机药物筛选的、负 载均衡的多极并行对等计算系统。该系统是在互联网环境下以计算资源的端对端( p e e r t o p e e r ,p 2 p ) 计算为基础,结合网格思想,利用分布的异构高性能计算机资源,采用常用的 药物分子筛选软件d o c k ,实现有效的、高可用的并行计算系统,是一种计算数据密 集型的高通量新药筛选应用网格【3 。与中科院上海药物研究所等单位合作,本文在大连 理工大学的深腾1 8 0 0 服务器上搭建了新药研发网格的分节点,从而使深腾1 8 0 0 服务器 成功的加入到新药研发网格中。 利用新药研发网格进行虚拟筛选时,作为网格节点的深腾1 8 0 0 服务器,在接到由 网格管理节点发来的筛选分子集后,其主节点平均分配好小分子的个数并交给服务器内 的每个空闲的计算节点。因为每个小分子所需的对接时间难以估计,并且计算节点上的 负载情况也是随时间动态变化的,这种对各计算节点平均分配小分子的虚拟筛选算法可 能导致负载不均衡,从而造成计算资源的浪费和计算时间的延长。对于深腾18 0 0 服务 大连理工大学硕士学位论文 器这种具有并行计算能力的超级计算机,可以采用异步计算格式达到负载平衡,提高计 算效率。 为此,本文设计了一种基于消息传递接口( m e s s a g ep a s s i n gi n t e r f k e ,m p i ) 的虚拟筛 选程序,此程序优化了小分子的分配算法,有效地缩短了计算时间,并且此程序可以灵 活的使用多种对接软件进行对接运算。 药物设计的网格平台搭建 2 网格计算技术 计算机的实际使用情况表明,计算机的各种资源并没有有效的被利用,如c p u 的 利用率一般在1 0c y 扣2 0 之间;另一方面,随着信息和数据的不断膨胀和增长,及时处 理这些数据已经远远超过单个计算机的物理极限。为了解决这种矛盾,产生了并行计算 技术、集群技术和分布式计算技术等,但是这些技术都只能帮助人们使用一定范围内的 计算资源,这个范围通常就是一个管理域的范围。利用上述技术所能共享的资源很有限, 所产生的整体力量也不强。随着互联网的成熟和不断推广,人们产生了把互联网的资源 集成起来使用的想法,利用已有的互联网设施建立一种新的基础设施把世界上的各种计 算资源集成起来,为世界范围的用户提供使用这些资源的良好接口。这种新的基础设施 就是网格,所以有人说网格就是世界上最大、最强的计算机。 网格代表了一种先进的技术和基础设施,是继互联网之后又一次重大的科技进步。 网格是借鉴电力网的概念提出来的,其最终目的是希望用户在使用网格时,就像现在使 用电力网一样方便,用户并不需要知道他所使用的资源在那里。早期的互联网应用在一 定程度上方便了人们的信息交换,也为大家获取信息提供了迄今为止最为便捷的手段。 然而,人们所期望的还不止于此,人们希望更进一步地共享互联网上的一切资源,包括 处理能力、存储容量、数据库、应用软件和文件等,实现这一梦想的途径就是利用目前 正在兴起的网格计算技术。 1 9 9 8 年美国阿贡国家实验室( m g o n n en a t i o n a il a b o r a t o r y ) 和芝加哥大学教授f o s t e r i 和k e s s e l m o mc 所著网格崭新计算基础设施的蓝图一书中,以及1 9 9 9 年所撰 论文t h eg l o b u st 0 0 1 k i t 一文中率先提出有特定计算技术内容的术语计算网格。该文 提出,计算网格是一种计算机硬件和软件的公共设施。该设施向用户提供可靠、一致、 广泛和廉价的高端计算能力 4 j 。网格技术的目的是实现网络上资源的全面连通,包括计 算资源、存储资源、通信资源、软件资源以及科学仪器资源等 5 】。 2 1 网格的基本概念和分类 简单地说,网格就是一个集成的计算与资源环境,或者说是一个计算资源池 酣。网 格能够充分吸纳各种计算资源,并将它们转化成一种随处可得的、可靠的、标准的,同 时还是经济的计算能力。除了各种类型的计算机,这里的计算资源还包括网络通信能力、 数据资料、仪器设备甚至是人等各种相关的资源。网格并不仅仅就是通过网络把计算机、 人、仪器、数据等资源连接起来,网格内部是一个有机的整体。目前,中间件技术也被 引入到了网格技术里。 大连理工大攀颈士学佼论文 然而,猁目前为止,网格计算迸没有一个十分精确的寇义,下面是f o s t 芒ri 给出的 一个较为通用的定义:网格就是在缺少中央控制、没有全知者( o r r m i s c i e n c e ) 以及嗽的信 任关系的谤况下能够协潜傻带遣瑗分布静备荦辛资源。两格概念静棱心就是突破了酞往强 加在资源上的种种限制,使人们可以以一种全新的、更自由、更方便的方式使用计算资 澡,解决燹菇复杂的蠲蘧。 网格应实现这魃技术:当计算扩越多个机构时,支持管理证书和策略的安全解决方 寨;资漂管疆协议秘鼹务,支祷安全恁远程访润诗葵秘数豢燹深以及耱嚣分嚣各静资源; 信息查询协议和服势,显示提供关于资源、组织和服务的配置信息和状态信息;还有数 据繁理骚务,在存镳系统窝痤爱之阉定瞧鞍绩麓数攮集【4 。 通常网格系统可分为计算网格( c o m p u t a t i o n a lg r l d ,c q 、数据阐格( d a t ag r i d ,d g ) 嚣黢务网揍( s e 搿i c o 黼d ,s g ) 三类 f 1 ) 计算网格 诗算烈格是一个能够掇供可 表赖的、一致的、簧遍的和壤价的离溃计算能力的硬件 和软件底层,有蓿很高的计算能力,可以被进一步分为分布式超级计擀( 研sn _ i b u t e d s u p e r m p 戚n g ,d s ) 网格和离吞吐鬟计算嬲i 曲t l l r o u g 却u t ,h t ) 网格两类。分布式越级计 算阚格在多个机器上执行并行计算阻减少一个作业的执行辩间,这类网格救应嗣于有 巨大挑战的问题( k i l l e ra p p l i c a t i o n s ,k a ) ;高吞吐蕊计算网格增加实时到达的任务流的 完成率。 f 2 ) 数据网格 数据圈梧是蒂采提供放多个广域分布黟数撂灞合成新瓣信惠底层静系统,典鍪静应 用包括从多个信息源获得相关信息的数据挖掘以及处理分布数据的各种实验。 f 3 ) 窳务丽罄 服务网格提供单机所不能提供的各种服务,可以细分为需求网格( d e m a n dg r j d l d 回、合佟麴穰( e o l l a b 。r a t i v og r 逡,e g ) 帮多媒体网揍( m 蠢t i m 。蠢eg r 遗,瓢回。需求两格 动态地收集不同的资源提供新的服势,这些应用往往更重视性价比而不是单纯地追求绝 对瞧缝,资源爨衷楚动态懿;合终鼹撂将震户积应爝连接农会侈竣工终缝爨,逶j 蔓一个 虚拟空间提供用户和应用间的实时爱互;多媒体网格提供广域实时多媒体应用的底层, 因此嚣要支持跨越多个不慰钒器的服务质鬈( q u a | i 锣o f s e r v i o e ,q o s ) ; 2 2 网格的特征和基本要求 掴对予一般静分布式系统,两格有着许多更为复杂静特征,主要包括: 药物设计的网格平台搭建 ( 1 ) 网格由多个管理域组成,因此系统不能干涉现有的各组成单元的管理和自治, 不能危及现有用户和远程节点的安全,不能替换现有的操作系统和服务; ( 2 ) 系统具有动态性,允许远程节点自由加入和离开计算环境; ( 3 ) 在硬件和软件两个层次上提供对异种构件的支持; ( 4 ) 在广域环境下,各种差错无法避免,因此网格必须提供一个可靠的、容错的底 层,不存在单点失败: ( 5 ) 由于通信带宽等资源都是共享的,因此通信延迟更为不确定。 对于网格提供的计算能力有几个基本的要求,主要是: ( 1 ) 可靠性要求。网格提供的计算能力必须保证是持续、稳定和安全的,不应该因 为网格内部个别资源的变动而对网格的应用造成影响;网格内部局部资源的变动对于网 格用户来说应该是透明的。 ( 2 ) 标准化要求。网格内部的资源之间应该有一个统一的可以相互访问的接口或者 通讯协议,这样才能够实现网格资源之间的相互操作,从而实现充分的资源共享:同时, 网格对用户提供的计算能力应该满足一定的标准。 ( 3 ) 易访问性要求。网格用户应该可以在任何时间、任何地点,以统一的形式访问 网格和使用网格的资源;网格的服务可以通过网络系统送到各个地方;网格上的资源不 应该受到地域的限制,各处的资源只有在网格上和不在网格上的区别。 ( 4 ) 价格要相对低廉。网格最初被重视的主要原因之一也是因为网格可以最大限度 地利用各地的闲散资源,可以极大地提高各个资源、设备的利用率;网格用户不仅可以 利用这些闲散资源而且可以避免由于地理位罱限制带来的各种额外开销,所以网格对于 网格用户来说存在着很大的降低开销的潜力。 2 3 。网格的体系结构 2 3 1 传统网格体系结构 传统的网格协议结构( 如图2 1 ) 又被称为五层沙漏结构,这五层分别是构造层、 连接层、资源层、汇集层和应用层。每层都有自己的服务、应用编程接口和软件开发工 具包( s o 丘w a r ed e v e l o p m e n tk i t ,s d k ) ,上层协议调用下层协议的服务。在五层沙漏结构 中,一个最为重要的思想就是以协议为中心,同时强调服务的重要性。五层沙漏结构中 并不提供严格的规范,它不是对全部所需协议的完整罗列,而是对该结构中各部分组件 的通用要求进行定义,将这些组件形成硬顶的层次关系;每层的组件具有相同的特征, 上层组件可以在任何一个底层组件的基础之上建造。五层沙漏的分层原理有些类似于广 为使用的t c p i p 仂、议。 大连理工大学硕士学位论文 蜒 姆 基 盎 蟾 匿 应用层 1 l 汇聚层 资源层 连接层 图2 1 传统网格五层结构 f 培2 1t r a d i t i o n a l5 - 1 a y e l g r i da r c h i t e c 恤。e 五层结构中沙漏的含义是指各部分协议的数量是不一样的。对于最核心的部分,要 实现上层协议向核心协议的映射,同时实现核心办议向下层其它各种协议的映射。核心 协议应该在所有支持网格服务的地点都支持,因此核心协议的数量不应该很多,这样核 心协议就形成了协议层次结构中的一个瓶颈。在五层结构中,资源层和连接层共同组成 这一核心的瓶颈部分。如图2 2 所示 4 】。 : 用户应用 i ; : i 集合服务i j 资源和 连接性协议 基础结构i : 图2 2 五层沙漏结构 f i g 2 25 - l a y e rs a n d g i a s sg r i da r c h i t e c t u r e 药物设计的网格平台搭建 每层的描述和所实现的功能如下: f 1 ) 构造层 该层的功能是向上提供网格中可供共享的资源,这些资源可以是物理或逻辑实体。 常用的资源包括处理能力、存储系统、目录、网格资源、分布式文件系统、分布式计算 机池和计算机集群等。构造层提供的网格计算工具软件包t o o i k i t 中的相应组件负责侦 测可用的软硬件资源的特性、当前负荷、状态等信息,并将其打包供上层协议调用。 ( 2 ) 连接层 该层提供网格中网络事务处理通信与授权控制的核心协议。构造层提交的各种资源 间的数据交换都在这一层的控制下实现。各资源间的授权验证、安全控制也在本层实现。 在t o o l k i t 中,安全组件提供单一登录、委托、兼容不同的本地安全方案,以及基于用 户的信任关系等功能。资源间的数据交换通过传输、路由和解析实现。 ( 3 ) 资源层 这一层的作用是对单个资源实施控制,与可用资源进行安全握手、对资源做初始化、 监测资源运行状况、统计与付费有关的资源使用数据。在t o o l h t 中有一系列组件用来 实现资源注册、资源分配和资源监视。t 0 0 1 k “还在这一层定义了客户端的c 、j a v a 的 a p i 和s d k 。 f 4 ) 汇集层 这一层的作用是将资源层提交的受控资源汇集在起,供虚拟组织的应用程序共享 和调用。为了对来自应用的共享进行管理和控制,汇集层提供目录服务、资源分配、日 程安排、资源代理、资源监测诊断、网格启动、负荷控制、账户管理等多种功能。 ( 5 ) 应用层 这一层是网格上用户的应用程序。应用程序通过各层的a p i 调用相应的服务,再通 过服务调用网格上的资源来完成任务。应用程序的开发涉及大量库函数,为便于网格应 用程序的开发,需要构建支持网格计算的函数库。 2 3 2 开放网格服务体系结构 开放网格服务体系结构( o p e ng r i ds e 州c e sa r c h i t e c t u r e ,o g s a ) 是g l o b u s 的重要标 准建议,是继五层沙漏结构之后最重要、也是目前最新的一种网络体系结构,被称为是 下一代的网格结构 6 1 ao g s a 是建立在开放网格服务基础架构( 0 p e ng r i ds e r v i c e s i n 丘a s 廿u c t u r e ,0 g s i ) 的基础之上,所有的资源等在o g s a 中都被称为服务,0 g s a 要实 现这些服务的共享。o g s a 定义了网格功能环境中需要的服务、附加接口和行为。例如, 发现、数据管理、资源提供和服务虚拟化等都需要定义接口,安全、策略和记账还需要 大连理工大学硕士学位论文 其它服务。o g s a 是由网格领域的专家i a n f o s t e r ,c a r l k e s s e l m a n 等人提出的一种开放 的、分布式的系统架构,其主要目的在于实现网格技术在商业领域的应用。o g s a 的两 个主要技术来源是网格核心技术( 包括g l o b u s 工具包) 和w e bs e r v i c e 机制h j 。 在o g s a 内部所定义的服务称为网格服务( g r i ds e r v i c e ) 。网格服务是一种w e b s e r v i c e ,该服务提供一组接口,这些接口的定义明确并且遵守特定的管理,来解决如服 务发现、动态服务创建、生命周期管理和通知等问题。w e bs e r v i c e 解决了发现和激发 永久服务的问题。但是在网格环境中,大量的是临时服务,因此o g s a 对w e bs e r v i c e 进行了扩展,提出了网格服务的概念,使得它可以支持临时服务实例,并且能够动态地 创建和删除。在o g s a 中的所有组件都是虚拟化的。通过提供一个全局网格服务来实现 基础的一致接口,这使得其他层次和级别的服务能以统一的方式进行处理。虚拟化还可 以把多个逻辑资源对应到同一物理资源上。网格服务的这种虚拟化加强了通用服务语义 行为无缝地映射到实际某地平台设施的能力。 w e b 服务 i 驻留环境f协议 图2 3 开放网格服务体系结构的核心组件 f 培23t h ek e m e ic o m p o n e n to f o g s i 如图2 3 所示,o g s a 的三个主要组件是开放网格服务基础结构、0 g s a 服务和 o g s a 模式 4 】,o g s a 是构筑在w e bs e r v i c e 之上的。w e bs e r v i c e 是一个基于标准的、 广泛部属的分步计算模式,它提供了用于描述和调用网格服务的基本机制。o g s a 服务 药褥设计静隧格平台辫建 可猷驻罄在静种环境下,并艇可良通过协议进行通僚。w e b 服务掇供了一种重要手段, 但是现有的w e b 服务标准不能解决有关基本服务语义相关的闯题,这些服务语义和其 他重簧静鼹务行为斑该予臻椽准话,戳便使黻务虚瓠化和蠹务闯能够互搡作。通过0 g s i 的核心接口可以解决这些问题,符合o g s i 标准的w e b 服务就称为网格服务。 2 4 网格关键技术 ( 1 ) 网耪资源鲍管理 网格环境包含各种各样的资源,这些资源具有动态变化、地域分布和系统异构等特 性。在网格计算中,首先需要鸯清障搭里所肖可用资源,比如哪些主机可供访翔、逐空 置多少处理黼力、数据库里可供使用的数据建什么、共享的应用程序是否已准备好,以 及共享主机采用何种文件系统等。资源管理的目的就是解决资源的描述、组织和管理等 一系列关键阕题。 ( 2 ) 任务的调度与管理 1 帑户撵交静任务要壶系统来分酝资源著控翻英遮行,包捂要褥蕊分配搿嘟些主桃上 运行、调用哪些数据、启动何种应用程序、何时开始运行等。任务调度与管理的作用就 是校据当翦系统受载跃琵,对系统雨静任务邂行动态调度,箕调度算法及调度过程设计 的好坏对系缆效率的高低起潜至关黧要的作用。 ( 3 ) 霜撩安全鼓术 网格是通过开放的网络环境向用户提供服务的,因此它不可避免地要涉及到网络安 全楚题。与传统瓤终寝曩辐跪,羁穆熬疆糠楚实瑷熏大蕊围秘更深簇次雏资源共享,_ 舞 以它存在更严峻的安全问题,并提出了更高的安全黼求。由于网格系统一般舰模大、牵 涉磁广,并蕊掇有超强弱计算能力,毽此,与传统熬喇络入侵活动麴比,如果网撂系统 一旦遭到攻击破坏,威者被非法利用,其潜在的损必更大,潜在的筑窖更严重。与传统 嘲络环境辐比,网格诗算环境投其复杂,它矮有大规模、分东、异构、动态、可扩展等 特性,因此与传统的网络安众相比,嘲格安全所涉及的范围照广,解决方案也更加复杂。 ( 4 ) 网格监测工具 为了管濑和维护复杂的网格环境,需要提供监视系统资源和系统运行情况的工蒸, 即网格监测工具。网格监测工具可以监视系统的运行状态,并提供性能分析等功能。 ( 5 ) 编稔工其和图形用户界面 网格系统应该能提供丰富的用户接口和编程环境。通过直观友好的用户访问接口, 使翔户可良谯任侮佼鬟、任馋平套上方便毯使灞系统资源。另外,瓣格计箨瓣主要赣域 是科学计算,它往往伴随着海量的数据,面对庞大的数据和信息想通过人工分析得出正 大连理工大学硕士学位论文 确的判断十分困难。如果把计算结果转换成直观的图形信息,就能帮助研究人员摆脱理 解数据的困难。 ( 6 ) 高速网络系统 高速网络系统是在网格计算环境中,提供高性能通信的必要手段。通信能力的好坏 对网格计算提供的性能影响很大,要做到计算能力“即连即用”必须要高质量的宽带高 速网络系统支持。用户要获得延迟小、可靠的通信服务也离不开高速的网络。 2 5 网格计算工具包及框架的组织 2 51s e t l h o m e 项目 s e t i ( 萄h o m e 8 】是使用互联网连接的计算资源来执行超大规模数据分析的项目,主 要用于搜索外星智能。这个项目搜索包括宇宙背景辐射和有可能起源于地球或者其卫 星、也可能起源于外星世界的信号辐射到地球的电磁噪音。s e t i h o r n e 项目分析在波 多黎各的a r e c i b o 望远镜收到的数据。m e c i b o 望远镜已产生大约8 1 4 6 7 2 1 5 单元的数据, 每个单元大约为一兆字节。s e t i h o m e 把这些数据分发到运行s e t i h o m e 软件的互 联网用户,然后这些用户搜索可能的外星信号。迄今为止,用户已返回5 7 2 6 5 0 9 3 单元 结果。s e t i 国h o m e 项目尚未有发现宇宙信号,将继续另一个两年计划。s e t i h o m e 提供的软件作为一个屏幕保护程序运行,用户自愿地下载它并执行工作。该项目的成功 表明了使用志愿计算机是建设有效的网格环境的一个可行方法。s e t i h o m e 提供软件 也是开放源代码的,用户也可以根据自己的需要进行相应的修改。 2 5 2g l o b u s 项目 g i o b u s 项目是目前国际上最有影响的与网格计算相关的项目之一1 6 j 。其最初的目的 是希望把美国境内的各个高性能的计算中心通过高性能网络连接起来,方便美国的大学 和研究机构使用,提高高性能计算机的使用效率。现在,g l o b u s 项目已经不仅仅局限于 科学计算领域,还还能够对各种商业应用进行广泛的、基础性的网格环境支持,实现更 方便的信息共享和互操作。g 1 0 b u s 对新鲜权、资源管理、信息服务、数据管理以及应用 开发环境等网格计算的关键理论和技术进行了广泛的研究,开发出能在多种平台上运行 的网格计算工具包软件( g l o b u st 0 0 1 k i t ) ,能够用来帮助规划和组建大型的网格试验和应 用平台,开发适合大型网格系统运行的大型应用程序。 g i o b u s 项目旨在为计算网格创建基本的基础设施以及高级服务。尽可能地增加对重 要应用的平均和峰值计算性能,可以使这些服务在无需考虑资源和用户双方的空间分布 的情况下仍能体现出很高的创造性。该工具包主要包括以下三个核心高级服务: 药物设计的网格平台搭建 f 1 ) 资源分配管理 资源分配管理提供资源分配、过程创建、监控以及管理服务。资源分配管理最常见 的用途就是远程作业提交与控制工具,然而,它不提供作业调度或资源代理的能力,作 业调度工具通常是由本地系统提供的。资源分配管理使用一种高级的资源规范语言 ( r e s o u r c es p e c i f i c a t i o nl a n g u a g e ,r s l ) 来指定命令,并将它们映射到本地的调度程序及 计算机。 f 2 ) 网格安全基础设施 网格安全基础设施提供了单点登录的方式,这种登录方式可以在需要认证的地方运 行,它支持访问权限的本地控制,并且能够从全局映射到本地用户身份。在保持现有网 格安全基础设施机制的同时,现在还结合了w e b 服务安全标准。 ( 3 ) 网格信息服务 网格信息服务能够与网格资源相关的信息,目的是实现资源的发现、选取以及优化。 监控与发现服务是一种可扩展的网格信息服务,它将数据发现机制和轻量目录访问协议 结合在一起,为提供和访问系统配置和状态信息创建了一个统一的框架。 2 5 3l e g i o n 项目 l e g i o n 【9 是弗吉尼亚大学的一个中间件项目计划,是为了网格应用而设计的基于对 象的元系统软件。该项目的目标是通过为处理器、数据系统、文件系统等提供标准的对 象表示,从而推动分布式系统软件的原则性设计。 l e g i o n 通过类似公共对象请求代理结构( c o m m o no b j e c tr e q u e s tb r o k e ra r c h i t e c t u r e , c o

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论