已阅读5页,还剩50页未读, 继续免费阅读
(原子与分子物理专业论文)应用abeemσπ模型计算蛋白质电荷分布及并行程序实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
应用a b e e mc r l r 模璎计算蛋白质电荷分布及并行程序实现 摘要 内容摘要: 依据密度泛函理论,分子体系的电子密度决定了分子体系的一切性质,因此 准确计算分子体系的电荷分布对解释和预测它的结构和性质具有重要的作用。在 密度泛函理论和电负性均衡方法的基础上,建立的原子一键电负性均衡方法中的 彻模型明确地考虑了双键中的万键部分,在计算和解释大分子体系的结构和性 质关系方面取得了令人满意的结果。本文对比了l b 0 3 、l e o q 、l i 5 h 、1 i 6 c 、l n i z 、 1 0 6 w a 0 1 、1 0 6 w a 0 2 、l t k 7 这八种蛋白质分子的a b e e me r z 的电荷分布与从头算 h f s t o - 3 g 的电荷分布,从它们的相关方程可以看出,a b e e m d z 电荷可以很好地 重复相应从头计算结果。我们根据a b e e m a z 模型计算分子体系电荷分布的串行 程序,提出和发展了三种不同的并行算法,能快速地计算大分子体系的a b e e md :z 电荷分布。测试时间数据表明,使用编译和调试的a b e e m o z 并行程序能准确、 更快速地计算出大分子体系的电荷分布,尤其是针对规模比较大的分子体系效果 更加显著。 关键词:原子一键电负性均衡方法彻模型蛋白质电荷分布并行计算 应用a b e e m a 筇模型计算蛋白质电荷分布及并行程序实现 a b s t r a c t c o n t e n t :a c c o r d i n gt od e n s i t yf u n c t i o n a lt h e o r y ,t h ee l e c t r o nd e n s i t yo fas y s t e m d e t e r m i n e sa l lp r o p e r t i e so ft h es y s t e m s oa c c u r a t ec a l c u l a t i o no fc h a r g ed i s t r i b u t i o n s i nam o l e c u l a rs y s t e mp l a y sa ni m p o r t a n tr o l ei n e x p l a i n i n ga n dp r e d i c t i n gi t s s t r u c t u r ea n dp r o p e r t i e s a t o m - b o n de l e c t r o n e g a t i v i t y e q u a l i z a t i o nm e t h o d d 万 ( a b e e m 仂r ) m o d e l ,w h i c hi sb a s e do nd e n s i t yf u n c t i o n a lt h e o r ya n d e l e c t r o n e g t i v i t ye q u a l i z a t i o nm e t h o d ,h a sg a i n e ds a t i s f y i n gr e s u l t si nc o m p u t i n ga n d e x p l a i n i n gt h er e l a t i o n s h i pb e t w e e ns t r u c t u r e sa n dp r o p e r t i e so fb i o m a c r o m o l e c u l e s y s t e m w ep e r f o r m e dt h ec h a r g ed i s t r i b u t i o no fe i g h tp r o t e i n sw h i c ha r elb 0 3 ,le o q , l i 5 h ,l i 6 e ,l n i z ,1 0 6 w a 0 1 ,1 0 6 w a 0 2a n d1 t k 7b yu s i n ga b e e m c r n m o d e la n da b i n i t i oh f s t o - 3 gm e t h o d a b e e mo n c h a r g ed i s t r i b u t i o n so fe i g h tp r o t e i n sa r ei n b e t t e ra c c o r d 、 ,i t ha bi n i t i oh f s t o 一3 gc h a r g ed i s t r i b u t i o n s w eh a v ep r o p o s e da n d d e v e l o p e dt h r e ed i f f e r e n tp a r a l l e lp r o g r a m s ,w h i c hb a s e do na b e e m o n m o d e l s s e r i a lp r o g r a mf o rm o r ef a s t l yc a l c u l a t i n ga n do b t a i n i n gt h ec h a r g ed i s t r i b u t i o no f l a r g es y s t e m i tc a nb ed e m o n s t r a t e df r o mt h et e s tt i m et h a tt h ep a r a l l e la b e e m o n p a c k a g e sc a na c c u r a t e l ya n dm o r ef a s t l yc a l c u l a t et h ec h a r g ed i s t r i b u t i o no ft h e m a c r o m o l e c u l e s ,e s p e c i a l l yf o rt h el a r g e rm a c r o m o l e c u l e s k e yw o r d s :a b e e mo n m o d e l ;p r o t e i n ;c h a r g ed i s t r i b u t i o n ;p a r a l l e lc o m p u t a t i o n 学位论文独创性声明 本人承诺:所呈交的学位论文是本人在导师指导下所取得的研究成果。论文 中除特别加以标注和致谢的地方外,不包含他人和其他机构已经撰写或发表过的 研究成果,其他同志的研究成果对本人的启示和所提供的帮助,均已在论文中做 了明确的声明并表示谢意。 学位做作者签名。言、 学位论文版权的使用授权书 本学位论文作者完全了解辽宁师范大学有关保留、使用学位论文的规定,及 学校有权保留并向国家有关部门或机构送交复印件或磁盘,允许论文被查阅和借 阅。本文授权辽宁师范大学,可以将学位论文的全部或部分内容编入有关数据库 并进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。保密 的学位论文在解密后使用本授权书。 学位论文作者签名: 彦 虢和誊 日 期:删仝 应用a b e e m 何模型计算蛋白质电荷分布及并行程序实现 应用a b e e mo w 模型计算蛋白质 电荷分布及并行程序实现 1 引言 发展准确、快速的计算方法用于探讨大分子体系的结构和性质是现代理论 化学的一个主要目标。高精度的从头计算方法虽然令人信服,但是固有的计算 量阻碍了其应用到非常大的分子体系当中。因而对于大分子体系而言,发展一 种计算量较小且有较高精度的近似方法就显得尤为重要。原子一键电负性均衡方 法中的研模型( a b e e m o - 死- ) 是以密度泛函理论和电负性均衡原理n 3 为基础发展 起来的处理有机大分子体系的一种计算方法。它同时考虑了分子中原子电荷、 键电荷以及孤对电子的电荷,并确定了参数的意义和数值,对于应用到大分子 体系电荷分布的计算有很大的优越性和精密度,并为大家所接受。使用原子一键 电负性均衡模型,在已知分子几何构型和参数的条件下,只需解一组线性方程 组,就可以得到分子体系中的电荷分布,即各个原子上的电荷和各个化学键上 的电荷。本文对比了应用a b e e m c r 万模型计算得到的蛋白质的电荷分布与应用从 头算h f s t o - 3 g 计算得到的电荷分布,并分析了它们的相关性,得到了很好的 结论。 并行计算刮就是在并行计算机上所做的计算,随着计算机和计算方法的飞 速发展,几乎所有的学科都走向定量化和精确化,从而产生了一系列的诸如计 算物理、计算化学、计算生物学、计算地质学、计算气象学和计算材料科学等 计算科学瞪1 ,在世界上逐渐形成了- 1 计算性的科学分支,即计算科学与工程。 计算极大地增强了人们从事科学研究的能力,大大地加速了把科技转化为生产 力的过程,深刻地改变着人类认识世界和改造世界的方法和途径。 为了使a b e e m 锨模型能应用到更大的分子体系当中,并且能更快速地计算 出分子体系中的电荷分布,我们对应用a b e e m 彻模型计算分子体系电荷分布的 源程序中解线性方程组的部分提出了三种不同的并行算法,分别是楚列斯基 ( c h o l e s k y ) 分解算法、g a u s s 消去法和l u 分解法。我们分别对这三种并行算 法进行了分析,结果表明,利用改编后的并行程序能准确、快速地计算分子体 应用a b e e m o ,r 模型计算蛋白质电荷分布及并行程序实现 系的电荷分布,分子体系越大效果越理想。 2 理论背景 2 1 密度泛函理论 传统的从头计算或半经验的量子化学计算方法是由h a m ii t o n 算符描述的电 子体系,能量是波函数的泛函,用变分原理和自洽场方法可求得体系的波函数 和能量;而密度泛函理论( d f t ) 是用简单的单电子密度p p ) 代替了复杂的n 一电子 波函数、壬,f ,工。,x 2 ,0 v ,) ,将能量当作电子密度的泛函,用变分法和自洽场方法求 解电子密度p ) 和体系的能量e 防】。密度泛函理论的基础是h o h e n b e r g - k o h n 两 个著名定理。 h o h e n b e r g k o h n 第一定理指出,体系的单电子密度p ) 决定了体系的外势 矿9 ) ,又因为p g ) 决定了电子数n ,所以p 伊) 决定了体系的基态波函数进而确 定体系所有其它性质。其证明可用基态能量最低原理:考虑电子体系非简并 基态的电子密度p ) ,它通过简单的积分式( 2 1 1 ) : f p p 矽p ) = ( 2 1 1 ) 决定了n ,也决定了y p ) ,从而决定了所有性质。因为如果存在两个外势v i i iy 7 , 相差一个常数,每个外势对基态给出相同的密度p ( 0 ,这样就会有两个不同的 h a m i i t o n 算子h 和h ,并给出不同的归一化基态波函数甲和甲( 但给出的基态 密度p p ) 相同) 。取、王,作为h 的尝试波函数,则由式e 陋】= ( 叫h i ) ( i ) 得, e o ( 甲i n l v 7 ) 2 ( 甲i n7 j l 壬,) + ( 甲7 l h h 1 甲) 2 日+ ,p g ) 杪) 一矿7 p 凇p ) ( 2 1 2 ) 式中和耳分别是h 和h 7 的基态能量。类似用甲作为h 的尝试波函数,有: 耳 ( 、王,i h7 l 、壬,) 2 ( 、王,i h i 、王,) + ( 、王,i h 一h i 、王,) 。岛+ ,p p ) 眇7 p ) 一y g ) p p ) ( 2 1 3 ) 2 应用a b e e m 何模型计算蛋白质电荷分布及并行程序实现 将( 2 1 2 ) 和( 2 1 3 ) 两式相加,得到e o + 蜀 目+ ,这是一个矛盾的结果, 是不可能的。所以两个不同的外势矿不可能给出相同的基态密度户p ) 。 在d f t 中基态电子总能量可以写成电子密度p g ) 的泛函( 写成e ,以明确表 示其依赖于d : e ,【p 】= 丌p 】+ k 【p 】+ 吃【p 】= ,p 伊) 】+ f p p y p 舻) ( 2 1 4 ) h o h e n b e r g - k o h n 第二定理实际上是密度泛函理论的变分原理。它的内容是: 对于一个试探密度声p ) ,只要及尹) o rf 及尹) 痧= n ,那么 e o e ,防】 ( 2 1 5 ) 这里e v 纠是( 2 1 4 ) 式的能量泛函。要证明这个定理,只要注意到第一定理 保证了烈尹) 决定了自己的外势旷、h a m i l t o n 算子h 和波函数币,而每可作为尝 试波函数: ( 币j h l 币) = 万o 少( ,p ) + f 防】- e ,防】e ,必】 ( 2 1 6 ) 假设e ,【j d 】可微,变分原理( 2 1 5 ) 要求: 万扛,必卜【f p p ) 方一且= o ( 2 1 7 ) 从而得到e u l e r l a g r a n g e 方程: = 铹卸) + 丽8 f b ( 尹) l = 常数 ( 2 1 8 ) 密度泛函理论中称为化学势。 h o h e n b e r g k o h n 定理指出了由及尹) 计算基态分子性质的基本原理。但没有 指出在不知道波函数的情况下如何由烈尹) 计算e o 。这一问题由k o h n 和s h a m 解 决。k o h n 和s h a m 的最大贡献即在于将轨道的概念引入到密度泛函理论之中。他 们将体系的能量表示为: e 必】- t 必】+ ,b 】+ - p 加p 沙+ e x c l o 】 ( 2 1 9 ) 其中瓦咕】是具有密度户驴) 的基态的无相互作用的电子气的动能: 应用a b e e m o ,r 模型计算蛋白质电荷分布及并行程序实现 t 纠= ;p 冷) ( 一丢v 2 p g 炒 ( 2 1 1 0 ) 其中,和分别为自然自旋轨道( n a t u r a ls p i no r b i t a l ) 及其占据数。 州= 三孵 ,l d 】是经典的c o u l o m b 排斥能。 ( 2 1 1 1 ) e x c p - - 丁陆卜毛必卜圪。l o 一,p 】 ( 2 1 1 2 ) e 嬲纠为体系的交换一相关能( e x c h a n g e c o r r e l a t i o ne n e r g y ) ,它包含了体系 动能,与乃的差值,以及的非经典部分。 电子密度可表示为: p g ) = 胛,缈? g 切,g ) i ( 2 1 1 3 ) 其中仍( 尹) ( i = l ,2 ,n ) 为k o h n s h a m 轨道。运用变分方法即可获得正则 的k o h n s h a m ( k s ) 轨道方程: 一1 二v 2 + o e 驴 缈,= 毛伊, 其中,d 够是k s 有效定域势场,u ) 是所有原子核提供的势场。 将能量泛函e l d 】对体系电子密度p p ) 求偏微商,可以得到: = 渊= 铡+ 渊嘶,+ 锗嘞铹 其中: 啪m 渊+ 锗嘶) + 噼删 这里 一锗 4 ( 2 1 1 4 ) ( 2 1 1 5 ) ( 2 1 1 6 ) ( 2 1 1 7 ) 应用a b e e m 凹模型计算蛋白质电荷分布及并行程序实现 2 2 电负性均衡原理 2 2 1 电负性 电负性概念最初在1 9 3 2 年由p a u l i n g n0 1 1 1 定义为“分子中的原子将电子拉 向自身的能力 ,并且从热化学数据给出元素的电负性标度。电负性这个概念广 为化学界接受和使用,人们逐渐认识到原子和分子的许多物理化学性质与电负 性之间存在着明显的关联,又从不同角度出发,提出了许多的电负性标度n 2 q 射。 在这个研究方向上,i c z k o w s k i 和m a r g r a v e n 司迈出了最重要的一步,他们 提出原子的电负性z 是原子能量对电子数的导数的负值:z :一等。1 9 6 2 年, h i n z e ,w h i t e h e a d ,和j a f f e 等人基于m u l l i k e n 的定义,又提出了轨道电负性 这一重要概念,把i c z k o w s k i 和m a r g r a v e 使用的势的思想扩展到包括原子轨道。 而h u h e e y 在1 9 6 5 年提出了一个很简单的途径来计算基团电负性。 : 1 9 7 8 年,当p a r r n 6 1 等人将i c z k o w s k i 和m a r g r a v e 的电负性定义推广到密 度泛函理论中后,电负性这一概念再次引起了人们的极大关注。p a r r 等人将电 负性z 定义为体系电子化学势的负值,从而给出了电负性精确的定义和物理 解释。这里是能量泛函e p g ) 】对电子密度p g ) 取极小时引入的l a g r a n g e 乘因 子:= 一z = ( 筹 这个导数可在固定外势( 由原子核提供) 的情况下求得。 p a r r 等人的工作为电负性均衡和电负性等于能量随原子电荷的变化率这两个概 念提供了理论上的支持。随着电负性均衡原理在密度泛函理论基础上获得了精 确的数学表达式,m o r t i e r 和n a l e w a j s k i 等人认识到了这一原理的优越性, 建立并实现了直接计算分子中原子电荷分布的新方法,即基于分子中原子的电 负性均衡方法( e e m ) 。 2 2 2 s a n d e r s o n 的电负性均衡原理n 7 。例 在两个或多个不同原子( 或其他组合基团) 结合在一起形成分子过程时, 体系中各部分的电负性差导致电子从电负性低区流向电负性高区( 即电子从化 应用a b e e m o ,r 模型计算蛋白质电荷分布及并行程序实现 学势高区流向化学势低区) ,从而使各组成原子或基团调整其电负性而趋于平 衡,直至都等于最终分子的电负性。根据这个原理,从不同的观点和路线出发, 建立了多种多样的电负性均衡方法,可以直接快速地计算分子中的电荷分布、 总能量及其它一些重要的物理量,有相当广泛的应用。 2 2 3m o r tio r 的电负性均衡原理n 9 。2 7 1 m o r t i e r 和n a l e w a j s k i 建立在基于密度泛函理论基础上的电负性均衡方法 ( e l e c t r o n e g a t i v i t ye q u a l i z a t i o nm e t h o d ( e e m ) ) 非常引人注目。e e m 已被用来成 功的预测了分子中的电荷分布、体系能量、电子布居正则模式等,并深入讨论 了分子的硬度、软度等反应指标,包括分子筛的催化问题,且在研究沸石催化 的应用中取得了令人满意的结果。 我们知道分子总能量包括动能t ,电子与电子作用势能圪,核与电子作用 势能吃,核与核作用势能: e = t + 吃+ 吃+ ( 2 2 1 ) m o r t i e r 在其提出的电负性均衡方法( e e m ) 中作了两个近似:第一个是原子 分辨近似( t h er e s t r i c t i o nt oa t o m i cr e s o l u t i o n ) ,即将方程( 2 2 1 ) 中的四个能量项都 写成原子贡献之和: 丁= 瓦 吃= 莓( 嘭加+ 荟j 11 n , f 2 n p ( 2 2 2 ) ( 2 2 3 ) k ;( 圪柚+ n 。z p , 亿2 = 莓荟三1 z , 2 了z p ( 2 2 5 ) 方程( 2 2 3 ) 和( 2 2 4 ) 中电子与电子相互作用势能吃和核与电子相互作用势能 圪。被分解成原子内贡献和原子间贡献。虬是原子0 【上的电子数,且有: 6 应用a b e e m 何模型计算蛋白质电荷分布及并行程序实现 口= b p 涉 ( 2 2 6 ) 吃 所以体系总能量为: e = 出吧岫峨岫+ 球等一百n , , z p + i 1 丐z , , z p 一 亿2 7 , e e m 的第二个近似是方程( 2 2 7 ) 的前三项写成二级t a y l o r 展开: 疋+ 磁岫+ 吃,妇= 或+ :( 。一e ) + 叩:帆一:) 2 ( 2 2 8 ) 定义原子0 c 的有效电荷为: g 口= 乙一虬= 啦一虬 ( 2 2 9 ) 并使用成= - z ;,则e e m 分子总能量表达式写为: 肚水屹”嘲:+ 三磊引 一些原子的e e m 参数z :,叩:已经通过拟合 s t o 3 0 - f l 拘m u l l i k e n 布居分析啪1 得到。e e m 电负性定义为方程( 2 2 1 0 ) ,即能量对原子0 【有效电荷或原子a 上电 子数负值的偏导数: :_ ( 爿= ( 爿= 加嘲口+ 荟卺 亿2 t 0 ) 方程( 2 2 i 0 ) 表明原子的电负性依赖于原子电荷和周围其它原子产生的势场。 电负性等于化学势的负值。对平衡态的分子,电负性均衡原理要求所有原子的 化学势相等,所以: 屁= = = 以= 孑 ( 2 2 i 1 ) 对含有n 个原子的分子,则有r 1 个形如( 2 2 i 0 ) 的方程,连同分子总电荷的限 制条件: z q 口= g 叫 a = l ( 2 2 1 2 ) 共有n + 1 个线性方程,很容易解得n + 1 个未知数:n 个原子的原子电荷g 。和e e m 分子电负性孑。 7 应用a b e e m 卿模型计算蛋白质电荷分布及并行程序实现 自从电负性均衡原理以密度泛函理论的形式被证明之后,有许多基于此原 理的计算方法被发展起来。除m o r t i e r 和n a l e w a j s k i 等人的电负性均衡方法外, y o r k 和y a n gw 提出了一种能够应用到分子模拟中的经典化学势( 电负性) 均衡 方案乜娴1 1 ,简称c p e ( c h e m i c a lp o t e n t i a le q u a l i z a t i o n ) 。c i o s l o w s k i 3 2 嗡1 提出 了电荷限制的电负性均衡方法;g h o s h m 一7 1 的半经验的电负性均衡方法;还有我 们早期建立的修正的电负性的均衡方法( m e e m ) c - 4 0 3 及后期发展的考虑了原子 和化学键的原子一键电负性均衡方法( a b e e m ) h 卜“1 ,以及进一步发展的原子一键 电负性均衡方法的何模型( a b e e m d z ) ,对于处理有机和生物大分子体系给出 了更加合理的结果。 2 3 并行计算 并行计算( p a r a l l e lc o m p u t i n g ) ,就是在并行计算机上所做的计算,它和常 说的高性能计算、超级计算是同义词,因为任何高性能计算和超级计算总离不 开并行技术。随着计算机和计算方法的飞速发展,几乎所有的学科都走向定量 化和精确化,从而产生了一系列的诸如计算物理、计算化学、计算生物学、计 算地质学、计算气象学和计算材料科学等计算科学,在世界上逐渐形成了一门 计算性的科学分支,即计算科学与工程,简称为c e s ( c o m p u t a t i o n a ls c i e n c e & e n g i n e e r i n g ) 。当今,计算科学已经和传统的两种科学,即理论科学和实验科学, 并列成为第三门科学,它们彼此相辅相成地推动科学发展与社会进步。在许多 情况下,或者是理论模型复杂甚至理论尚未建立,或者试验费用昂贵甚至试验 无法进行,此时计算就成为求解问题的唯一或主要的手段。计算极大的增强了 人们从事科学研究的能力,大大地加速了把科技转化为生产力的过程,深刻地 改变着人类认识世界和改造世界的方法和途径。计算科学的理论和方法,作为 新的研究手段和新的设计与制造技术的理论基础,正推动着当代科学与技术向 纵深发展。 计算科学涉及到大型科学工程计算,是一个多学科的交叉领域,往往需要 数学家、工程师和计算机科学家进行跨学科和跨行业的协同研究。一方面,它 需要运用许多基础数学理论( 如非线性分析、现代偏微分方程理论、微分几何 和近代数学等) ;另一方面又需要熟悉某一特定应用领域的背景知识;最后还需 应用a b e e m 卿模型计算蛋白质电荷分布及并行程序实现 要充分掌握和运用先进的计算设备。所以今后的科学与工程计算工作者应尽可 能兼备数学、物理、化学、工程科学和计算机科学等多方面的知识,并善于应 用超级计算机进行大规模数值试验与分析。 2 3 1 并行计算需求 人类对计算机性能的需求是无止境的,在诸如预测模型的构造和模拟、工 程设计和自动化、能源勘测、医学、军事以及基础理论研究h 5 1 等领域中都对计 算提出了极高的具有挑战性的要求。例如,在做数值气象预报时,要提高全球 气象预报的准确性,据估计在精度、纬度和大气层方向至少要取2 0 0 x1 0 0 x 2 0 = 4 0 万个网格点。目前中期天气预报有的模式需要6 3 5 万个点,内存需要几十千兆 字节( 1 g b = 1 0 9 b ) ,总运用量达2 5 万亿次( t = 1 0 1 2 ) ,并要求不到两个小时内完成 4 8 小时的天气预报。当计算能力不足时,只好降低结果的分辨率,简化计算方 案,从而就影响了计算的准确性。又如,在进行油田整体“油藏模拟 时,假 定一个油田有上万口井,每口井模拟时至少要取8 x 8 5 0 个点,则总的变量数 可高达千万量级,使得至今的计算难以实现。其他的应用领域包括核武器数值 模拟,航空航天高速飞行器的设计,原子物理过程微观世界的模拟,材料科学 中的计算,环境资源以及化学生物计算等。这些重大的计算问题,涉及到非规 则的复杂结构、非均匀的复合材料、非线性的动力学系统以及奇性区域、活动 边界、带约束条件等各种复杂的数学物理问题。要对这些复杂的非线性数学物 理方程进行大规模和高精度的计算,在一般的计算机上用传统的计算方法往往 是无能为力的。 对高速的并行计算的需求是广泛的,但归纳起来主要有三种类型的应用需 求:1 计算密集型应用,如大型科学工程计算与数值模拟;2 数据密集型应用, 如数字图书馆、数据仓库、数据挖掘和计算可视化等;3 网络密集型应用,如 协同工作、遥控和远程医疗诊断等。 并行计算不仅仅是获得高性能的一种手段,它同时也具有将计算能力从单 个处理器无缝的扩展到无数个处理器的潜力。这种潜力在几十年前就已被人们 所熟知,但是,直到2 0 世纪8 0 年代末,它才真正地显示出来。然而,可扩展 并行性的实现是一条曲折的道路,并行计算还没有取得完全的成功。 9 应用a b e e m 鳜模型计算蛋白质电荷分布及并行程序实现 1 9 6 5 年,戈登摩尔提出如下的观察结果:“半导体上的晶体管数量大约每 年增长一倍。 在短时间内这个增长速度可望保持下去。虽然没有理由相信在至 少1 0 年时间内增长速度不能继续稳定,但对较长时间而言,也难以确定其增长 速度。也就是说,到1 9 7 5 年,每块集成电路上的晶体管数将达到6 5 0 0 0 个。 他的推理是根据观察基于元件复杂度和时间的对数一线性经验关系中的三个数 据点得到的。他由此证明,到1 9 7 5 年,在只有四分之一平方英寸的单一芯片上 含有6 5 0 0 0 个晶体管是可能的。1 9 7 5 年当拥有6 5 0 0 0 个晶体管的1 6 kc c d 存储 器制造出来后,他的预测被证明是准确的,他在1 9 7 5 年接下来的文章里,把对 数一线性关系改成了芯片尺寸、晶体管最小尺寸以及“电路与元件合理排列之 间的指数关系。接下来他写道:“空间太少挤不进任何东西,除非布局更合理化, 我们只能依靠两个尺寸方面的因素一更大的芯片及更小的晶体管。他把元件每 增长一倍的时间修改为1 8 个月并预测从1 9 7 5 年起按这个降低后的速度增长。 这就是著名的“摩尔定律 h 副。摩尔定律指出,处理器性能每1 8 个月翻一番, 事实上,超级计算机的峰值速度可以超越摩尔定律的速率增长。但是应用程序 的性能不能成比例增长,因此并行计算机上的编程任务相当繁重。这已成为一 个突出的问题,因此无缝的可扩展性要求应用程序的性能随着处理器的个数的 增长而自动的增长,这就要求编程时尽可能的开发并行性。 2 3 2 并行计算硬件 过去的5 0 年间,计算机厂商、计算机体系结构、计算技术以及计算机应用 发生了巨大的变化,推动了科学计算领域的发展。尽管存在各种变化,但计算 机性能的发展仍然遵循著名的摩尔定律。 2 0 世纪7 0 年代末,向量机的出现标志着现代超级计算机的开始。相对于当 时传统的计算机,向量机的性能至少可以提高一个数量级。初始阶段,硬件性 能是超级计算机的主要卖点,但是n t2 0 世纪8 0 年代初,人们越来越重视将 向量技术集成到常规的计算环境中去。只有那些能够提供标准编程环境、操作 系统、应用软件的厂商才能成功地赢得用户,这些用户对于企业在市场上的生 存是至关重要的。这段时期主要通过改进芯片技术和提高共享存储多处理器系 统来提高性能。 l o 应用a b e e m o x 模型计算蛋白质电荷分布及并行程序实现 2 0 世纪8 0 年代后期,在政府的支持下,基于分布存储的可扩展并行计算成 为研究热点。新系统的研制主要是为了克服共享存储系统的不可扩展的缺陷。 r i s c ( r e d u c e di n s t r u c t i o ns e tc o m o p u t e r ,精简指令集计算机) 革命之后, 微处理机的性能迅速增长,同时大规模生产的成本降低,产生了一股巨大的冲 击波,从而在建构大规模的并行系统时,导致了芯片技术从e c l 到c m o s 的转变, 以及使用通用微处理器代替专用微处理器的局面。 2 0 世纪9 0 年代初期,正当多处理器向量系统达到全盛时期时,新一代并行 机,即超大规模并行机,与向量系统相同或更优越的系统进入了人们的视野。 为了提供对高性能计算机的一个基本的、可信赖的统计结果,t o p 5 0 0 报告应运 而生。这份报告列出了世界上前5 0 0 台强大计算机系统的安装地点,使用l i n p a c k 基准测试的最好性能作为安排这些计算机的依据。自1 9 9 3 年以来,t o p 5 0 0 报告 每年更新两次。在1 9 9 3 年6 月的t o p 5 0 0 报告中,就有1 5 6 台m p p 并行机和单 指令多数据系统,占t o p 5 0 0 报告中的3 1 。 但是到了1 9 9 4 年,在s g i ,d i g i t a j 和s u n 等公司的工作站产品系列中, 出现了一个新成员一对称多处理机( s m p ) 。从一开始,由于s m p 系统具有成熟 的体系结构架构和高的性价比,受到工业用户的欢迎。同时,许多工业界用户 开始购买和使用i b ms p 2 系统。s p 2 系统最初是为计算数值密集型应用而设计的, 但是1 9 9 5 年下半年,它在另一个更大的商业市场( 用于数据库操作的系统) 的 销售中取得了成功,专用数据库系统占据了i b m 很大一部分的销售额。 1 9 9 5 年t o p 5 0 0 报告显示了根据消费者类型分类的高端计算机分布( 包括学 术地点、研究性的实验室、工业或商业用户、厂商安装地点、秘密机构的重大 变化) 。到1 9 9 5 年6 月为止,t o p 5 0 0 的数据表明了工业或商业用户在减少,而 政府资助的研究机构用户在增加。这一趋势反映了在政府高性能计算项目的推 动下,研究机构才有可能购买并行机,特别是具有分布存储的并行机。由于分 布存储系统通常是不成熟和不稳定的,因此工业界极不情愿购买它。这是可以 理解的,他们仍然固守在老的向量系统这一阵营中,然而这些向量系统由于低 性能而逐渐被排除在t o p 5 0 0 之外。 2 3 3 程序并行分解 应用a b e e m 研模型计算蛋白质电荷分布及并行程序实现 在并行机上要实现一个并行程序,必须处理4 个主要问题。首先,需要将 那些能并行的计算部分标示出来;其次,要将程序分解成多个并行部分;然后, 选择编程模型和实现界面来编写并行程序;最后,选择一种实现方式,能有效 实现并行程序并体现编程模型。 并行实现的第一个步骤是识别程序的哪些部分可以并行。正确的并行实现, 应该每一步的并行都将产生与串行实现相同的效果。因此,并行程序必须派生 多个并行进程分管不同的计算,执行这些计算,并在最终同步。如果多个计算 不共享数据,那么这些计算可以并行执行。如果两个计算同时读取共享存储单 元的数据,那么这些计算也可以并行执行。但是,如果某个计算写数据而另一 个计算同时读取或写同一数据,这将产生问题,此时这些操作的顺序至关重要。 如果串行程序中第一个计算写数据在前,第二个计算读取数据或写数据在后, 那么在并行程序中就要确保相同的操作顺序。这种情况称为“数据竞争。 并行实现的第二个步骤是选择分解策略。通常有两种方法。第一种方法称 为“任务并行 ,即把程序分解成多个任务,标识出它们之间的依赖关系,并进 行任务调度,使得并行执行的任务互不干扰。也就是说,不同的处理机执行不 同的功能。另一种方法称为“数据并行”,它将问题的数据空间分解成多个区域, 并分配给不同的处理机,每个处理机负责计算各个区域的结果。因此,当在1 0 0 个处理机和1 0 0 0 x1 0 0 0 的网格上做二维模拟时,可以给每个处理机分配l o o x1 0 0 的子网格,这样就能有效地利用这些处理机。由于数据并行策略可以使更多的 处理机保持忙碌状态,且具有天然的可扩展性,而任务并行的策略不高,所以 求解科学问题时通常采用数据并行。如果用1 0 0 0 0 个处理机求解同样的问题, 每个处理机仍然分配l o o x1 0 0 的子网格,则总共可以求解1 0 0 0 0 x1 0 0 0 0 的网格 上的问题。由于每个处理机上的计算量没有变,所以大规模问题仅比小规模问 题的求解时间稍长一些。任务并行和数据并行可以联合使用,流水线技术就是 一个典型的例子。每个处理机分别处理流水线上的不同部件,在每个部件上进 行串行计算。如果多个独立的数据集输入到流水线中,多个部件可以同时处理 不同的数据集。 并行程序实现中还要考虑使用何种编程模型。编程模型的选择将影响现实 中所使用的编程语言和库的选择。通常有两种选择: 1 2 应用a b e e m m r 模型计算蛋白质电荷分布及并行程序实现 一共享存储编程模型:数据存储于一个共享存储器中,所有处理机均可访 问该共享存储器。这就意味着每个处理机可以独立地对存储器中的任一单元进 行读或写操作。这种模型的特点就是用同步保证共享数据结构的完整性。 二消息传递编程模型:数据分别存储在多个处理机的本地存储器中,因此 需要通信以访问远存中的数据。通常,要通信的两个处理器之间必须显示地进 行发送接收操作。在这种模型中,发送和接收取代了同步。 通常可以根据相应的并行机体系结构来选择这两种编程模型,但对它们的 使用并不局限于此。可以在分布存储并行机上采用共享存储模型,例如通过硬 件实现( 称为分布共享存储) 或软件模拟d s m 。同样,在共享存储并行机上可以 采用消息传递模型。这两种使用方式可能会降低性能。 现在让我们转向与并行程序实现相关的问题。在科学程序常用的数据并行 策略中,有两种实现并行的载体:迭代型循环和递归遍历数据结构。通常实现 数据并行循环有两种方式:一种方式是在共享存储系统上采用显示的循环并行 方式,其中个次迭代之间不需要同步;另一种迭代方式是在分布存储系统上采 用单程序多数据模式。 在科学计算的程序中,最重要的是开发循环中的并行性。典型的做法是将 不同的迭代和迭代块分配到不同的处理机上。在共享存储系统上,这种分解常 使用p a r a ll e ld o 之类的指令来实现。在循环的各迭代之间不存在数据竞争的 情况下,可以使用上述方法而不需要同步。因此,必须仔细检查是否存在数据 共享现象。在编译器理论构造中,这种竞争成为依赖关系。 在分布存储消息传递系统上,要实现上述归约操作,需要使用显式消息传 递语言来重写程序。为方便起见,通常采用s p m d 编程。在s p m d 程序中,所有 的处理机均执行相同的程序,但是使用不同的数据。通常,标量变量被复制到 各个处理机上,并且做重复计算。 递归任务编程为处理树型结构中的递归并行,必须创建多个进程或线程来 并行遍历树的不同路径。例如,在一棵未排序的树中搜索某个特定值时,必须 首先访问树根。如果值未找到,则派生一个进程来搜索左侧的子树。而调用者 继续搜索右侧的子树。 应用a b e e m 何模型计算蛋白质电荷分布及并行程序实现 3 原子一键电负性均衡方法中的a t 模型的建立( a b e e m 何) 在电负性均衡方法中,m o r t i e r m l 的电负性均衡方法引人注目,但未考虑分 子中化学键的存在。g h o s h 的半经验电负性均衡方法考虑了化学键电荷,但键电 荷取值假设太简单,只能处理双原子分子。而y a n gh 卜删等人在密度泛函理论和 电负性均衡原理的基础上建立的原子一键电负性均衡方法( a b e e m ) 同时考虑了 分子中原子和化学键的存在,并在此基础上进一步考虑了化学键中的双键结构, 从而把该模型发展为原子一键电负性均衡方法中的彻模型( a b e e m 彻) :将双键 划分为一个盯键区域和四个万键区域( 每个双键原子各有2 个万键区域) ,其中, 仃电荷中心位于两成键原子之间共价半径之比处;万电荷中心垂直于双键所在平 面,置于双键原子上下两侧。 3 1 理论方法 在一定的几何构型下,分子体系的能量厶,包括动能( 7 ) ,核与电子之间的 吸引能( 蹦,电子与电子之间的排斥能( 哟,以及核与核之间的排斥能( , e m d ,= 丁+ 吃+ 吃+ ( 3 1 1 ) 上式中,等号右边的每一项均可以表示为如下形式, 丁= ( 1 5 f ,肼甜| _ v ,2 i y 删) = s - ? 2 ( ,r l 西 ( 3 1 2 ) 吃却一一军莩网g o = ;碓铲 ( 3 ) 州“军荟南= 圭衅静止 , = 三莓荟丝r o b ( 3 ) 上式中y 。,y , n o ,( ,lp ( ,) 以及p :“,2 ) 分别代表分子轨道波函数,一阶密度 矩阵,单电子密度和双电子密度。z 和尼分别表示原子a 的核电荷和坐标,尼, 是原子a 与原子b 之间的距离。下脚标1 ,1 和2 分别表示第j 个,第1 个以及 1 4 应用a b e e m o r r 模型计算蛋白质电荷分布及并行程序实现 第2 个电子。 在我们的a b e e m o l r 模型中,分子的电子密度按下式分割, p ( ,) = p 。( ,) + p 。( ,) + p 。一。( ,) + p 。:。( ,) + p 册;。( ,) + 脚( ,) 口 埘口一6硎= 刀刃对= n 驴 ( 3 1 6 ) 其中,p 口( ,) 和成( ,) 分别表示坐落于单键原子a 区域和双键原子历区域的单电 子密度,p m ( ,) 代表分布于单键区域a - b 的单电子密度,p 。:。( ,) 为坐落于双键 m = 的盯键区域的单电子密度,而p 删:。( ,) 代表坐落于双键= 7 的万键区域的单 电子密度,绵( ,) 则表示位于孤对电子区域l p 的单电子密度。这里应该强调指 出,在我们的a b e e m 彻模型中,见( ,) 或p 。( ,) 坐落于核a 或核历上,p ( ,) 或 p 硎:。( ,) 分别坐落于单键a - 6 区域中心或双键脚中的仃键区域中心,户册:。( ,) 或 吼( ,) 分别位于双键1 1 1 = 1 7 的万键中心或孤对电子中心,这些中心都是经过适当优 选确定的。 为了便于实际应用和程序化,依据( 3 1 6 ) 式划分分子体系的电子密度,其 动能表达式( 3 1 2 ) 及势能表达式( 3 1 3 ) 和( 3 1 4 ) 可以写成各相应局域电子: 密度贡献之和。这样,分子体系的总能量就可以表示成如下形式( 3 1 7 ) ,其 中的每一项都有其明确的意义,总体上说,是其内部能量和相互作用能之和。 e 删= l e ”+ e ”+ e 墨,+ e 三三+ x i n tr n ,+ e ”i 3 l7 ) l口 m 口- bo m = n翮= 月 驴l + ye 硫” j _ 这样,分子体系总能量,就可以被分割成典型的单键原子项,双键原子项, 单键项,双键中的仃键项,双键中的万键项,孤对电子项,以及它们之间的相互 作用项。那么进一步就可以导出分子体系的总能量表示成( 3 1 8 ) 式。 应用a b e e m o 万模型计算蛋白质电荷分布及并行程序实现 e ,。,= k 一:g 。+ 刁:g 纠+ k 一:g 肘+ 叩_ :| g :】 + 防:一。一:曲q 。一。+ 叩:一。g 三。j + 陋二。- u 2 :。q 硎。+ 叩二:。g 二;。】 + 陋二;。- u 2 。g 。+ 叩二。q k 。j + 陵- l z :p q 咖+ 刁二g 二j + a - b 警+ 警 + 荟警+ ;荟警 + 甜警r+ 警r + 三。警r:刊 ,。,删:。i 用,急。 ,。 + 七ez q a q g - h z 伸z q a q t q + 氍eq m q 琦l q + 荟荟,石q m q k =
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年护理应急处置静脉输液操作考核试卷及答案
- 2026年省级行业企业职业技能竞赛(人力资源从业人员)模拟试题及答案
- 2026年教育服务数字化转型协议
- 2026年工程承运人事外包合同
- 中央空调安装外包协议
- 陕西省西安市长安第一中学2026届高三调研测试化学试题试卷含解析
- 2025年村委会工作人员聘用合同二篇
- 市政道路毕业论文
- 2026届江西省抚州市临川第一中学高三TOP20九月联考(全国II卷)化学试题试卷含解析
- 2026届甘肃省嘉峪关市高考一模考试化学试题(A)含解析
- 中国物流集团有限公司2026届春季校园招聘笔试备考题库及答案解析
- 统编版初中道德与法治八下11.1国家监察机关的产生和性质 课件(共26张)
- 国家事业单位招聘2025农业经济与发展研究所招聘笔试历年参考题库典型考点附带答案详解
- 核电站反应堆压力容器安装施工方案
- 2026年国家电网招聘《公共与行业知识》考试题库附完整答案详解(历年真题)
- 广东省惠州市2026届下学期高三一模(韶关市二模)生物试题(含答案)
- 2025年四川攀枝花市中考化学考试真题带答案
- 《电力机车运用与规章》课程标准
- 2026中级社工《综合能力》模拟试卷2
- 2026年海南事业单位招聘考试题目及答案
- 卫生院动火管理制度
评论
0/150
提交评论