(计算机应用技术专业论文)网格相关技术及其在药物网格中的应用研究.pdf_第1页
(计算机应用技术专业论文)网格相关技术及其在药物网格中的应用研究.pdf_第2页
(计算机应用技术专业论文)网格相关技术及其在药物网格中的应用研究.pdf_第3页
(计算机应用技术专业论文)网格相关技术及其在药物网格中的应用研究.pdf_第4页
(计算机应用技术专业论文)网格相关技术及其在药物网格中的应用研究.pdf_第5页
已阅读5页,还剩115页未读 继续免费阅读

(计算机应用技术专业论文)网格相关技术及其在药物网格中的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网格相关技术及其在药物网格中的应用研究 摘要 随着x 射线衍射以及核磁共振等技术的发展,越来越多的生物大分子的三维结构被 测定出来,计算机辅助药物设计呈现出了突飞猛进之势,药物分子虚拟筛选是其中的重 要环节。然而,进行虚拟筛选不仅要搜索化合物小分子库,而且要对库中的小分子进行 分子筛选,即便对柔性小分子,粗略估计其在设计空间中也至少含1 0 ”个解,再加上庞 大的数据库搜索,需要耗费的计算机时间十分巨大,并且对计算环境也有较高的要求。 建立网格平台,将网格技术应用于药物分子虚拟筛选是解决上述问题的有效途径。 本文论述了当前基于网格的药物分子设计发展状况,并从药物网格环境下的数据传 输、网格资源管理、任务调度、安全性以及虚拟筛选软件性能等方面具体论述了药物网 格所面临的主要问题,针对上述问题,本文主要做了以下工作: 1 提出了数据传输优化模型和算法,充分利用了药物分子配体库的易分割性和分 子筛选过程的独立性等特点,克服了传统数据传输方法中由于负载的动态性和传输环境 的不确定性引起的传输性能随时问波动大的问题,使数据传输能够自主地、动态地向每 一时刻或者相对较小的时间段内的较优者聚集。 2 提出一种基于市场机制的动态自适应的网格资源管理方法:运用市场价格体系 对动态变化环境的良好适应能力来处理网格资源分配中的异构性和动态性等难题;给出 了网格资源管理框架;提出了基于多目标规划的资源管理优化数学模型,并引入了资源 分配优化求解的近似算法;利用“交易后改变价格”的方法避免了因价格频繁波动而给 用户带来不便等市场机制的负效应;同时,提出了资源组的原子性分配,提高了相关资 源的协同分配,并避免了资源申请的死锁问题和资源的无效齿用。 3 提出了r d h t s ( r e l i a b l ed y n a m i ch e t e r o g e n e o u st a s ks c h e d u l i n g ) 任务调度算法。 该方法与传统方法的显著不同体现在如下两个方面:用“通讯开销”矩阵c o s t 来表示 各任务间的通讯开销情况,c o s t 矩阵本身相应于r t t s ( r o u n d t r i pt i m e ) 值的周期变 化而动态变化;通过分析网格中各结点自身中断事件发生次数的数学期望和方差,得出 各结点的即时可靠性评价参数,增强了任务调度的可靠性,从而较好地适应了网格结点 状态的n o n - d e d i c a t e d 特性。 4 建立了负责签发备主体认证证书的认证中心c a ,为各主体颁发认证证书,通过 公钥等技术对证书真伪加以鉴别,并通过在网格主体的全局名称与主体的本地局部名称 之间建立映射关系,来保证本地安全机制的有效性。 5 将上述研究的方法和技术用于构建药物发现应用网格的研究,通过对区域、结 点计算性能的量化,实现了对药物分子虚拟筛选任务的动态分配、数据传输的优化处理 和网格资源的优化分配;并建立了认证中心,保证了平台使用的安全性;通过分析网格 中各结点自身中断事件发生次数的数学期望和方差,使得在计算结点进行药物分子虚拟 筛选任务的可靠性得到了改善。测试表明了药物分子虚拟筛选服务与网格技术相结合的 合理性及有效性。 网格相关技术及其在药物网格中的应用研究 本文的工作得到国家重点基础研究发展规划( 9 7 3 ) 项目( g j l 9 9 9 0 3 2 8 0 5 , 2 0 0 4 c b 5 1 8 9 0 1 ) 和国家自然科学基金项目( 1 0 2 7 2 0 3 0 ) 的资助。 关键词:网格;药物分子设计;数据传输:任务调度;资源分配;计算平台 i i 网格相关技术及其在药物网格中的应用研究 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fx r a yc r y s t a l l o g r a p h i ca n dn u c l e a rm a g n e t i cr e s o n a n c e ( n m r ) t e c h n i q u e s m o r ea n dm o r et h r e ed i m e n s i o n s ( 3 d ) p r o t e i ns t r u c t u r e sa r ek n o w nb y p e o p l e ,w h i c hm a k e sap r o m i s i n gf u t u r ef o rd m d ( d r u gm o l e c u l a rd i s c o v e r y ) h o w e v e r , d m ds u f f e r st h ep r o b l e m st h a t ,f i r s t l y , t h es e a r c h i n gs p a c eo fd r u gm o l e c u l a rd o c k i n gi sh u g e , w h i c hi n c l u d e s1 0 “s o l u t i o n sa tl e a s te v e ni fo n l y f l e x i b i l i t yo fl i g a n di sc o n s i d e r e d f u r t h e r m o r e ,d a t a b a s es e a r c h i n ga n dr i g i dc o m p u t i n gc o n d i t i o n sa r en e e d e db yt h i s a p p l i c a t i o n p r o b l e m sm e n t i o n e da b o v ec a nb es o l v e dt h r o u g hu s i n gt h et e c h n i q u e so f 商d d e v e l o p m e n ts i t u a t i o na b o u td r u gm o l e c u l a rd e s i g ni sd i s c u s s e df i r s t ,t h e n ,t e c h n i q u e sa n d a p p l i c a t i o n so nd r u gg r i da tp r e s e n ta r ed i s c u s s e di nt h i sp a p e r ,s u c ha sd a t a - t r a n s f e r r i n g o p t i m i z a t i o n ,r e s o u r c e sm a n a g e m e n to p t i m i z a t i o n , t a s ks c h e d u l i n go p t i m i z a t i o n ,s e c u r i t ya n d p e r f o r m a n c eo fd o c k i n gs o f t w a r eo p t i m i z a t i o n t oo v e r c o m et h e s ep r o b l e m s ,s o m em e t h o d s r e l a t e da r ed e v e l o p e d w eb r i e f l ys t a t eo u rr e s e a r c h e sa sf o l l o w s : 1 b a s e do nt h ec h a r a c t e r so fl i g a n dd a t a b a s e se a s yd i v i s i o na n dd o c k i n g si n d e p e n d e n c y , a l lo p t i m i z e dd a t a - t r a n s f e r r i n gm e t h o da n dm o d e lr e l a t e da r ep r e s e n t e di nt h i sp a t ) e r , i tn o t o n l yc o n q u e r st h es h o r t c o m i n g so ft r a d i t i o n a lm e t h o d s b u ta l s om a k ed o e k i n gt a s k s d i s t r i b u t e da e c o r d i n gt od y n a m i cp e r f o r m a n c eo f e v e r ys e r v e r 2 ad y n a m i ca n ds e l f - a d a p t i v em e t h o di sp r o v i d e dt h r o u 吐u s i n gt h ev i r t u e so fm a r k e t m e c h a n i s m t h ef r 8 x i l eo fr e s o u r c e sm a n a g e m e n ti sp r o v i d ef i r s t l y ;t h e n am a t h e m a t i cm o d e l r e l a t e di sp r e s e n t e da n da l la l g o r i t h mu s i n gf o rr e s o u r c e sd i s t r i b u t i o ni sd e s i g n e d ;t h e s h o r t c o m i n g so fm a r k e tm e c h a n i s m ,s u c ha st o of r e q u e n tf l u c t u a t i o no fp r i c e ,a r ei m p r o v e d b ym e a n so fd l a i l g i n gp r i c e sa f t e rt r a d i n l g ;u s i n ga t o ma l l o c a t i o no fr e s o u r c eg r o u p ,t h e c o o p e r a t i n ga l l o c a t i o ni si m p r o v e d a n ds o m ep r o b l e m s ,s u c ha sd e a d l o c ko fr e s o u r c ea n d i n e f f i c i e n t l yo c c u p y i n gr e s o u r c e ,a r ea v o i d e d 3 am e t h o dr d h t so fg r i dt a s ks c h e d u l i n gi sp r e s e n t e di nt h i sp a r e rt om a t c ht h e r e q u i r e m e n to fd y n a m i s ma n dh e t e r o g e n e i t yo fg r i d t w oo b v i o u sd i f i e r e n c e sb e t w e e n r d h t sa n dt r a d i t i o n a lm e t h o d sa r e :f i r s t , t h em a t r i xc o s ti sd e s i g n e dt oe x p r e s s c o l n t l n n i c a t i o nf e e sb e t w e e nt a s k sa n di t sv a l u e sa r ec h a n g e dp e r i o d i c a l l ya c c o r d i n gt o c h a n g e so fr t r s ( r o u n dt r i pt i m e ) s e c o n d ,t h er e l i a b i l i t y o fg r i dt a s ks c h e d u l i n gi s i n c r e a s e dm u c ht h r o u g ht h et o e f f i c i e n to fv a r i a t i o no fr e l i a b i l i t y , w h i c hi so b t a i n e db y a n a l y z i n gt h em e a na n dv a r i a n c eo f t h en u m b e ro f m e n o d e so w ns e q u e n t i a l j o b s ,t h a t st os a y i ta d a p t st h en o n - d e d i c a r e dc h a r a c t e ro fg r i d , 4 a na u t h o r i t yc e r t i f i c a t ec ai sf o a n d e d ,w h i c hi sr e s p o n s i b l ef o rd i s t r i b u t i n gc e r t i f i c m e s t h e n ,d i s t i n g u i s ht h ea u t h e n t i c i t yo fc e r t i f i c a t e sa f t e rc ad i s t r i b u t e dt h e ma c t o r d i n 叠t o m e c h a n i s mo fp u b l i ck e y l a s tb u tn o ta tl e a s t ,s e t t i n gu pm a p p i n gb e t w e e ng r i dn a m ea n d 1 0 c a ln a m eo f a ne n t i t y , w h i c hi su s e dt oe n s u r et h ee f f i c i e n c yo f l o c a ls c c u r i t ym e c h a n i s m 5 m e t h o d sa n dt e c h m q u e sm e n t i o n e da b o v ea r ea p p l i e di nd r u g 鲥dr e s e a r c h ad y n a m i c d i s t r i b u t i o no fd o c k i n gt a s k si ss e tu pt h r o u g ht h eq u a n t i t yd e s c r i i p t i o n so fn o d ea n dd o m a i n p e r f o r m a n c e s t h eo p t i m i z e d 面dt e c h n i q u e s ,l i k e ,d a t a - t r a n s f e r r i n go p t i m i z i n gm e t h o d ,t a s k s c h e d u l i n go p t i m i z i n gm e t h o da n dr e s o u r c e sm a n a g e m e n to p t i m i z i n gm e t h o da r er e a l i z e di n t h i sp a p e r 1 1 1 es e c u r i t yo fp l a t f o r mi se n s u r e dt h r o u 【曲c aa n dm a p p i n gb e t w e e ng r i du s e r i t l 一塑竖塑差垫查堕苎壅堑型塑塑! 堕皇望竺塑一 a l l dl o c a lu s e r w h a t sm o r e ,t h er e l i a b i l 砖o fd o c k i n gi si m p r o v e db ya n a l y z i n gt h em e a na n d v a r i a n c eo ft h en u m b e ro ft h en o d e so w ns e q u e n t i a lj o b st h er e s u l t so fe x a m p l et e s th a y e s h o w nt h a tt h ec o m b i n a t i o no fd r u gm o l e c u l a rd o c k i n gd e s i g na n dg r i dt e c h n i q u e si se f f i c i e n t a n dr e a s o n a b l e t h i sd i s s e r t a t i o ni sf i n a n c i a l l ys u p p o r t e db yt h en a t i o n a ln a t u r a ls c i e n c ef o u n d a t i o n ( 10 27 2 0 3 0 ) a n ds u b s i d i z e db yt h es p e c i a lf u n d sf o rm a j o rs t a t eb a s i cr e s e a r c hp r o j e c to fc h i n a ( g 1 9 9 9 0 3 2 8 0 5 ,2 0 0 4 c b 5 1 8 9 0 1 ) k e yw o r d s :g r i d ;d r u gm o l e c u l a rd e s i g n :d a t at r a n s f e r r i n g :t a s ks c h e d u l i n g :r e s o u r c e s d i s t r i b u t i o n c o m p u t i n gp l a t f o r m v 网格相关技术及其在药物网格中的应用研究 1 绪论 1 1 问题的提出以及论文的研究背景 1 1 1 计算机辅助药物分子设计 医药产业作为一种高技术产业,具有高投入、高风险、高收益的特点。根据美国制 药商协会( p m a ) 统计,从新药临床前的试验到美国食品及药物管理局( f d a ) 批准,平 均每个品种要花1 2 年时间,开发新化学实体( n c e ) 所用时间自7 0 年代的7 7 年增加到9 0 年 代的1 2 8 年。从费用上看,过去成功开发一种新药只需数千万美元,而目前的研究开发 成本费一般在4 9 亿美元之间。此外,研究中的化学药品能够进入市场的成功率非常低( 欧 洲为4 3 1 7 :1 ,美国为6 1 5 5 :1 ) 。新药临床试验时间的延长,新药评审时间的增加,使 得新药上市后的有效专利期大大缩短,首次上市的新药,其平均有效专利期已从1 9 6 0 年 的1 2 年下降到不足6 年。由此可见,新药开发的风险在增加,上市新药数在减少。 药物设计就是在上述背景下逐渐发展起来的,传统的药物设计( 如图1 1 所示) 从 总体上讲,具有很大的盲目性,缺乏成熟完善的发现途径。随着计算机技术、计算化学、 分子生物学和药物化学的发展,药物发现进入了理性的阶段,出现了理性药物设计 ( r a t i o n a l d r u g d e s i g n ) ,如图1 - 2 所示。 性 临床前研究 图1 - 1 传统药物设计 f i g 1 - 1t r a d i t i o n a l d r u gd e s i g n 理性药物设计是在分子甚至电子的水平上考虑分子结构,它需要有先进的技术支 撑,计算机的辅助是理性药物设计的重要手段。基于分子水平的计算机辅助药物设计 ( c o m p u t e ra i d e dd r u gd e s i g n ,c a d d ) 称为计算机辅助药物筑予设计( c o h 巾u t e ra i d e d m o l e c u l a rd e s i g n ,c a m d ) 。c a d d 综合并藉助了多学科的先进技术、方法和成果,为理 性药物设计提供了强有力的基本工具和手段。自从1 9 6 0 年定量构效关系方法提出以来, 经过4 0 多年的探索和努力,尤其是到1 9 9 0 年以后,随着多种新方法的出现,c a d d 经 3 t n y g - - 门完善的研究领域。它的应用缩短了药物研究与开发( r & d ) 的进程,提高了 药物开发的效率,也为人们研制新药提供了崭新的思路和成功的希望。 计算机辅助药物设计的方法大体可以分为基于小分子的药物设计方法、基于受体结 网格相关技术及其在药物两格中的应用研究 构的药物设计方法和计算机组合化学方法。随着x 射线衍射以及核磁共振等技术的发展, 越来越多的生物大分子的三维结构被测定出来,所以基于受体结构的药物设计也就更具 现实意义。 图卜2 基于结构的药物设计一 f i g 1 - 2s t r u c t u r e b a s e dd r u gd e s i g n ( s b d d ) 1 1 2 药物设计与网格计算 通过分子筛选可以从已有配体小分予库中筛选出有希望的药物先导化合物,避免了 繁琐的合成过程。然而,进行药物分子筛选时所涉及的搜索空间非常巨大,即便对柔性 小分子,粗略估计其搜索空间也至少含1 0 3 0 个解,需要耗费夫量的时间,并且对计算环 境也有较高的要求。将网格技术应用于药物分子筛选服务中,能很好地解决上述问题。 已经有将网格技术应用于药物开发的先例了,例如m m 等动甩网格计算技术开发天 花治疗药物【1 1 = 由i b m 、u n i t e dd e v i c e s 及a e c e l r y s 提出的旨在开发天花治疗药物的网格 计算项目,“s m a l l p o xr e s e a t c hg r i dp r o j e c t ”( 天花研究网格计算项目) 。该项目采 的有效性,它可以达到巨型超级计算机的处理能力。 网格相关技术及其在药物瞬格中的应用研究 上述研究主要针对如何利用大量异地p c 机的闲散资源,即通过计算结点数量上的 增加来加快药物的开发过程。本文的不同之处主要在于:更具有针对性地将网格技术应 用于药物分子虚拟筛选过程中;在现有网格资源的基础上,使虚拟筛选任务能够自主地、 动态地向相对较小的时间段内的资源较优者聚集。 l ,2 药物网格面临的问题 1 2 1 数据传输问题 网格计算很重要的作用就是有效利用各地的资源,快速准确地进行大数据量计算。 我们所希望的是把有效的时间用于实际的计算上,这样就需要尽可能减少数据的传输时 间。数据往往是备份到不同的数据服务器上,传统的方法是,选择一个最佳数据服务器 用于传送所需数据,但由于以下两个原因有可能导致传输结果不理想: ( 1 ) 在庞杂的网格环境中,设计一个算法用来从多个数据传输服务器中选择一个性能 最优者并不是一件容易的事情,而且算法难于在不同的网格环境下达到选择最优的目 的: ( 2 ) 即使存在算法能够选择某一时刻的性能最优服务器,由于数据服务器本身任务负 载的动态性和传输环境的不确定性,传输性能有可能随时间波动较大,并最终导致数据 传输耗时长、传输性能不理想等。 上述问题增加了在网格中快速传输数据的难度,然而,由于用于药物虚拟筛选的数 据库有以下特征: ( 1 ) 已经存在权威的标准配体小分子库及其异地镜像数据库; ( 2 ) 由于数据库 中的单个配体小分孑_ 信息间具有完全独立性,使得数据库具有了易分 割性,从而为进行数据传输优化提供有利曹匀条件。 上述特征为药物网格土的数据传输优化提供了有利的条件。 l ,2 2 资源管理问题 作为下一代计算基础设施的先进代表计算网格,能够充分有效地对异地分布的 资源进行选择、集成和共享,来解决大范围、高复杂度的问题。网格本身的特性决定了 其资源通常是异构的、异地的、动态的和涉及范围广的,所以也就对网格资源的管理方 法提出了严峻的挑战,该方法必须能够适应网格环境的动态变化,同时还要能够方便、 高效的使用网格资源,这就需要研究种优化资源管理方法来较好地瘦对这一特殊环境 的需浆。 ? j 此外,在药物分子虚拟筛选过程申还要分别用到一些特殊的软、硬资源,例如专用 的分子表面处理软件( 软资源) 和s g i 图形工作站( 硬资源) 等i 所以针对药物分子筛 选的不同过程,如何对网格的相关资源进行时间、空间饷优化管理就绒为了摆在我们面 前需要解决的一项难题。 1 2 ,3 任务调度问题。 传统的任务调度策略考虑孓各予任务求解的差异性,但却很少考虑各计算结点本身 的差异性 或者只是孤立地考虑两令差异性,而忽略了镬整体调度方案中两个差具性之 间的内在联系。另一个问题是,已存在的绝大多数任务调度策略都是基于静态模式的, 例如,m o d i f i e dc r i t i c a lp a t h ( m c p ) 川,i n s e r t i o ns c h e d u l i n gh e u r i s t i c 州和d o m i n a n ts e q u e n c e c l u s t e r i n g ( d s c ) 【5 1 等,也就是需要假定从任务开始到所有任务结束这一期间内,各结点 网格相关技术及其在药物网格中的应用研究 计算环境、网络通讯条件等不发生任何变化。这在现实环境中,尤其是在网格环境下是 不可行的,因为动态性和异构性正是网格环境的两个主要特征。 在网格环境下进行任务调度还需要考虑一个特殊的问题,即,如何对计算结点的计 算能力及其波动性进行量化,以提高网格任务可以按计划执行的可靠性。 1 2 4 安全性问题 网格计算技术是由传统网络计算技术发展而来的,它继承了传统的网络技术,并在 传统的网络技术基础上提出了瓶的技术理论和方法,满足了大规模分布式协同计算、高 性能计算等先进的网络应用需求。与传统网络环境下的客户n 务器等应用相比,网格 环境下的先进应用具有下面一些新的引人注目的特点: ( 1 ) 需要同时使用大量的分布式资源。 ( 2 ) 需要同时使用多管理域异构环境中的资源。 ( 3 ) 其资源规模动态可变、资源请求动态发生。 ( 4 ) 需要使用复杂的通信结构。 ( 5 ) 具有严格的性能要求。 ( 6 ) 需要使用高速的广域网络技术。 因此,与传统的网络安全问题相比,网格环境下的安全问题更加复杂,所涉及的范 围更广,它对安全技术的要求也更高。 1 2 5 药物分子设计软件自身性能的优化问题 随着x 射线衍射以及核磁共振等技术的发展,越来越多的生物大分子的三维结构被 测定出来,使基于受体结构的计算机辅助药物设计更具现实意义。然而,药物分予对接 设计所涉及的搜索空间非常巨大,即便对柔性小分子,粗略估计其搜索空间至少含1 0 ” 个解,比较好的分子对接软件对接一个分子一般也要3 5 分钟。要适应化合物数据库搜 索的需要,对接时间应该不超过1 分钟。因此除了应用网格的相关技术进行优化以外, 还要对现在运行的对接软件本身进行必要的改进,以缩短对接软件本身的计算花销。 l1 3 本文的主要研究内容和工作 1 3 1 数据传输优化方法 对药物网格数据传输进行优化的目的是尽可能减少数据的传输时间,而把有效的时 间用于对药物分子的虚拟搜索上。我们应该充分利用药物分子虚拟搜索的特点,即,配 体分子库往往是标准的,异媳镜像数据库。例如剑桥小分予数据摩【6 j 等。 我们提出的数据传输优化方法基于以下几点考虑: n ) 不需要从多个数据服务器中选取个最优者;从而避免了针对不同网格环境设计 复杂的择优算法的需求,降低了算法的实现难度,且提高了算法的通用性; ( 2 ) 避免因选中的数据服务器自身性能或与其相关的传输环境的变化带来的最终传 输性能的不确定性,从而提高了数据传输的可靠性和稳定性; ( 3 ) 数据传输能够自主地、动态地向每一时刻或者相对较小的时间段内的较优者聚 集,也就是说,在每一时刻或者相对较小的时间段内的性能较优的数据服务器将承担份 额较大的数据传输任务。 简单来说,传统的改进方法可描述如下: 网格相关技术及其在药物网格中的应用研究 性篙罱:到性器? :j 7 s = s t ,s z ,s 。j :是数据传输服务器中m 个性能较优的数据传输服务器构成的集合 c = c l ,c 2 ,c 。) :是n 个用户结点构成的集合; 1 ( x ) :x 的入度,代表连入x 的线路个数,其中x _ c h 。2 ,c n ,s l ,s 2 ,s 。; x2 ( x ) :x 的出度,代表x 连出的线路个数,其中x = c 1 ,c 2 ,c 。s h s 2 ,s 。; 1 k ,n ;j = 1 , 2 ,m ;m 为数据服务器个数,n 为客户端个数。 而本文提出的数据传输优化方法的表达式转换模式进一步改进为: i z l ( s e r v e r s ) l 2 ( c l i e n tj ) i h ( s e r v e 5 ) 2h i 屯( c l i e n t ,) = m 令各服务器在某时刻可提供的传输能力为a l ,a 2 ,a m ,则对个用户提出的请求, 传统的方法只能在c = m a x a l ,a 2 ,a m 范围内得到解决,而利用本文中的方法却可以在 c = a l + a 2 + + a m 范围内得到解决。 1 3 2 资源优化管理 提出了一种改进的基于市场机制的动态自适应的计算网格资源管理方法:用市场机 制来解决计算网格资源分配的相关问题,能较好的利用价格杠杆等市场机制的灵活性、 有效性等优点来解决网格资源分配中的难点问题,如,资源管理者的自治性、资源及其 使用者的异构性、资源分配决策的分布性和并行性等。采用交易后改变价格的方法,既 能够较好地适应市场资源供需情况的变化,又能够避免在一次资源分配中频繁的进行价 格沟通。这样,任务的执行效率得到了提高,同时又减少了由于需要用户的较多参与而 给用户造成的负担。通过对同一作业所需各资源进行成组的原子分配,来避免资源申请 中产生死锁和资源的无效占用,从而提高整体执行效率。 网格中共有三方参与资源交易:用户及其相应应用领域的应用代理构成买方;信息 服务模块作为信息提供方;资源及其代理作为卖方。 基本思想是:以价格的上下浮动来体现资源的供求关系,并且实现以下四个目标: 资源实现充分利用;以公平的价格充分考虑到用户和资源的拥有者双方的利益;避免因 价格的频繁波动导致增加用户的工作量;避免资源申请中产生死锁和资源的无效占用, 从而提高整体执行效率。 资源分配的最佳方案具有如下特征: n ( 1 ) 资源的拥有者取得最大效益;即m a x ( ( ) x p j ) j i = l ( 2 ) 用户取得最佳满意度。可用如下两点表示,即, 月 以用户申请并获得资源r j 的最大数量,即m a x ( z 口) ,来刻画用户最佳满意度 i = 1 月 以最低的费用来刻画用户最佳满意度,即m i n ( 、( x f ) x p j ) 。 j = 1 其中,酗代表应用代理a i 使用资源r j 的数量。p j 是资源r j 的单位价格。在实际操作 网格相关技术及其在药物网格中的应用研究 中,使用功效系数法将上述多目标阀题化为如下单目标规划: m a x 肛a ( ( x p ) ( p j p o ) ) + 1 3 ( x ”) 一y ( ( 却) ( p j p o ) ) 扫i = 1卢j ( x ) ( q ( p j p o ) + o yx ( p p o ) ) = ( z u ) ( b 一( y q ) x ( p j p o ) ) 0 工口,x 。c , 0 s b ,s 白c , f _ i = 1 b ,一p ,兰0 。c + p + y = 1 其中,b 。是r j 的单位成本价格;e j 是1 j 的数量( 或能力) ;x 。i l 是应用代理a ,申请资 源r i 的最少数量( 下限值) :a 代表了资源拥有者所获利益在整体资源管理中重要程度 的比重;1 3 代表了用户所获资源的数量利益在整体资源管理中重要程度的比重;y 代表 了用户所获资源的价格利益在整体资源管理中重要程度的比重。 上式含义如下: ( 1 ) 当取y a 时,p i 值减小时,f 值增大。即,当在价格方面,用户利益比资源棚 有者利益更重要时,资源价格p j 应下降; ( 2 ) 当取y n 时,p j 值增大时,f 值增大。即,当在价格方面,资源拥有者利益比 用户利益更重要时,资源价格p 应上升; ( 3 ) 当y = n 时,p j 的变化对f 值不产生影响,所以p j 保持不变; “) 0 增大时,f 值随之增大,0 减小时,f 值随之减小。说明用户对资源数量的渴 求是整个资源管理系统获得最佳效益的动力。 1 _ 3 3 任务调度优化 针对网格环境的动态性和异构性特点,提出了d h t s ( d y n a m i ch e t e r o g e n e o u st a s k s c h e d u l i n g ) 和r d h t s ( r e l i a b l ed y n a m i ch e t e r o g e n e o u st a s ks c h e d u l i n g ) 两个任务调度算 法,且d h t s 是r d h t s 的一个特例。算法沿用了h t o p c u o g l u v 提出的任务调度设计思想: 用d a g ( d i r e c t e d a c y c l i co r a p h ) 来描述任务间的依赖关系,结点代表任务,边表示依赖关 系,箭头指向具有数据依赖性的子任务;通过对任务优先级函数的设定,使具有数据依 赖关系的“任务对”中的父任务的优先级高于子任务的优先级,从而保证了具有数据依 赖关系的任务调度策略的正确执行。 同时,r d h t s 算法在以下两点明显优于h t o p c u o g l u l 7 1 算法: 首先,在网格环境下,结点问的数据传输速率是动态变化的,尤其是解决大规模复 杂问题时,任务集的整体执行时间较长,数据交互频繁,这一动态变化就更应该列入任 务调度策略的考虑范围之内,而后者显然没有将这一重要因素考虑在内。在r d h t s 调 度策略中,用“通讯开销”矩阵c o s t 来表示各任务间的通讯开销情况,c o s t 矩阵本 身是相应于r t t s ( r o u n d t r i pt i m e ) 值的周期变化而动态变化的,使得该问题得到了很 网格相关技术及其在药物网格中的应用研究 好的解决。 其次,网格中的结点处于n o n d e d i c a t e d 8 j 状态,也就是说各结点具有自治性,其资 源应首先满足自身的需要,而h t o p c u o g l u ”只是假定各结点都处于d e d i c a t e d 状态。在 r d h t s 算法中,通过分析网格中各结点自身中断事件发生次数的数学期望和方差,得 出各结点的即时可靠性评价参数,增强了任务调度的可靠性,从而较好地适应了网格结 点状态的l i o n d e d i c a t e d 8 】特性。 r d h t s 还借鉴了b k r u a t r a e h u e1 4 的任务间空闲插入策略,将优先级较低的、与当 前任务没有数据依赖关系的、执行时间小于任务间空闲时间的任务进行插入执行。这样 可以增加任务执行密度,从整体上缩短任务集的执行时间。同时,结合g c s i hj 9 等提 出的动态性问题和任务分层问题的解决方案,增强了算法对动态环境的适应能力。 1 3 4 药物分子设计软件自身优化 遗传算法( g e n e t i ca l g o r i t h m ,简称g a ) 因其实现简单以及具有很强的全局寻优 能力而被广泛用于各个领域u 。文中建立了柔性配体与刚性受体对接的数学优化模型, 采用了一种带有空间收缩的多种群遗传算法 1 ”,用信息熵控制最优解搜索空间的收缩, 并用空间收缩的尺度作为算法停止的判据,进化过程中还采用了最优保留策略,充分保 证了算法的全局收敛性;在保证个体多样性的基础上适当减小种群规模以减少计算量。 实例证明该算法可以有效的用于药物分子对接设计。 1 3 5 药物网格平台搭建 实现了针对药物分子对接这一特定应用的网格计算平台:建立了认证中心,通过认 证证书的使用及在网格用户与本地用户间建立映射关系,保证了平台使用的安全性;将 数据传输优化优化方法在平台上进行了实际应用;通过对区域、结点计算性能的量化, 实现了动态地进行分子对接任务的分配;通过基于经济模式的i 阈格资源优化分配方法的 应用,网格资源的使用效率得到了提高;通过分析网袼中各结点自身中断事件发生次数 的数学期望和方差,使得计算结点进行分子对接任务的可靠性得到了改善。 1 4 本文的组织结构 论文主要工作正是通过优化网格相关技术来证明药物分子对接服务与网格技术相 结合的合理性及有效性丽展开的。以药物分子对接网格面临问题的提出、解决为主要线 索进行论文的论述。具体研究内容如下: 第一章首先阐述问题的提出及论文的研究背景,然后对药物网格面临的问题作以 全面论述,并在此基础上介绍本文的研究内容及主要工作。 第二章主要介绍网格计算技术,包括网格的基本概念和分类、网格的特征、网格 的体系结构、网格关键技术以及网格计算工具包及框架的组织等。 第三章主要介绍分子设计的基本原理,包括对接时所遵循的互补匹配原则、构象 搜索算法及典型分子对接软件等。 第四章主要介绍数据传输问题优化模型及算法,通过对数据传输传统改进模型和 本文提出的数据传输优化模型的比较得出优化思路的形成过程。然后,通过相关优化算 法及实例测试使数据传输问题优化模型得到了论证。 第五章主要介绍了基于经济模式的网格资源优化分配模型及算法,通过总体框架 结构的提出,描述出执行流程的概述。资源优化分配模型基本思想是:以价格的上下浮 动来体现资源的供求关系,并且实现以下四个目标:资源实现充分利用;以公平的价格 网格相关技术及其在药物阿格中的应用研究 充分考虑到用户和资源的拥有者双方的利益;避免因价格的频繁波动导致增加用户的工 作量;避免资源申请中产生死锁和资源的无效占用,从而提高整体执行效率。最后,通 过实例测试对该模型及算法进行了验证。 第六章提出了d h t s 和r d h t s 算法。在充分考虑任务间的依赖关系和通讯开销的动 态变化的基础上,通过对任务执行次序优化设定和任务间空隙有效利用等方法,提高了 协同任务的执行效率;然后,通过分析网格中各结点自身中断事件发生次数韵数学期望 和方差,得出各结点的即时可靠性评价参数,从而增强了任务调度的可靠性。 第七章主要介绍了一种基于信息熵的分子对接设计多种群演化模型,该模型除包 括传统对接模型的优化目标外,还含有由信息熵组成的目标函数。在此基础上,发展了 一种改进型遗传算法用于分子对接设计:将信息熵概念引入进化过程,熵的介入使随机 搜索类进化算法的寻优目的性大为增强;按搜索空间的收缩率作为算法的停止准则,对 算法的传统收敛判据做了改进。 第八章介绍了药物网格的安全策略。首先对安全的相关技术及标准、网格的安全 策略进行了论述,然后给出了网格安全策略的具体实现。 第九章介绍了平台的实现及实例测试。在给出平台总体设计之后,对平台的后台 实现进行了详尽的论述:介绍了区域、结点计算性能量化的实现;给出主要程序及其主 体构架。最后,给出平台计算的具体实例和测试结果。 第十章总结和展望。 8 嗣格丰h 关技术及其n 一药物网格中的应用研究 2 网格计算技术 网格代表了一种先进的技术和基础设施,是继j n t e m e t 之后又一次重大的科技进步。 早期的互联网应用在一定程度上方便了人们的信息交换,也为大家获取信息提供了迄今 为止最为便捷的手段,然而,人们所期望的还不止于此。人们希望更进步地共享互联 网上的一切资源,包括处理能力、存储容量、数据库、应用软件、文件等,实现这一梦 想的途径就是目前正在兴起的网格计算技术。 2 1 网格的基本概念和分类 简单地说,网格就是一个集成的计算与资源环境,或者说是一个计算资源池 1 2 。网 格能够充分吸纳各种计算资源,并将它们转化成一种随处可得的、可靠的、标准的同时 还是经济的计算能力。除了各种类型的计算机,这里的计算资源还包括网络通信能力、 数据资料、仪器设备甚至是人等各种相关的资源。 然而到目前为止,网格计算还没有个十分精确的定义,下面是i a nf o s t e r 给出的 一个较为通用的定义: 定义2 1 网格就是在缺少中央控制、没有全知者( o m n i s c i e n c e ) 以及强的信任关系 的情况下能够协同使用地理分布的各种资源。 通常网格系统可分为计算网格( c o m p u t a t i o n a lg r i d ) 、数据网格( d a t ag r i d ) 和服 务网格( s e r v i c eg r i d ) 三类副: ( 1 ) 计算网格 计算网格是一个能够提供可依赖的、一致的、普遍的和廉价的高端计算能力的硬件 和软件底层,有着很高的计算能力,可以被进一步分为分布式超级计算( d i s t r i b u t e d s u p e r c o m p u t i n g ) 恭l 高吞吐量计算( 1 l i 曲t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论