




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Se p t e mb e r 物 理化 学 学 E W u l i Hu a x u e X u e b a o Act a C h i m 2 0 1 1 2 7 9 2 0 1 9 2 0 2 6 2 0 1 9 Re v ie w GP U引发的计算化学革命 鲍 建樟 北京师范大学管理学院系统科学系 丰鑫 田 于建 国 l w n V wh x b p k u e d u cn 北京 1 0 0 8 7 5 北京师范大学化学学院 北京 1 0 0 8 7 5 摘要 综述了图形处 GP U 在计算化学中的应用和进展 首先简单介绍了GP U在科学计算中应用的发 展 然后分别详细讲述了迄今几个使用GP U和 CU D A co mp u t e u n i f i e d d e v i ce a r ch i t e ct u r e 显卡厂商N v i d i a 推出的计算平台 开发工具设计的量子化学计算和分子动力学 MD 模拟的算法和程序 尤其对目前唯一完全使 用GP U技术开发的量子化学计算软件T e r a Ch e m做了完备的介绍 包括算法 实现的细节和程序 目前的功能 此外 本文还对GP U在计算化学上将会发挥的作用做出了极为乐观的展望 关键词 GP U CU D A 计算化学 分子动力学 T e r a Ch e m 中图分类号 O6 4 1 GPU T r i gg e r e d Re v ol u t ion in Co m pu t a t ion a l Ch e mis t r y B AO J i a n Zh a n g F ENG Xi n Ti a n YU J i a n Gu o f De p a r t m e n t o fS y s t e ms S cie n ce S ch o o l o f Ma n a g e me n t B e i j i n g N o r m a l U n iv e r s i t y B e i j i n g 1 0 0 8 7 5 R C h i n a C o l l e g e o f C h e m i s t r y B e lti n gN o r m a l U n iv e r s ity B e i j i n g1 0 0 8 7 5 PR C h in a Ab s t r a ct Ov e r t h e la s t 3 y e a r s t h e u s e o f g r a p h i cs p r o ce s s i n g u n i t s GP U i n g e n e r a l p u r p o s e co mp u t i n g h a s b e e n i n c r e a s i n g b e ca u s e o f t h e d e v e l o p men t o f GPU h a r d wa r e a n d p r og r ammi n g t o o l s s u ch a s CU D A f co mp u t e u n i fie d d e v i ce a r ch i t e ct u r e H e r e we s u mma r i z e t h e p r o g r e s s i n a l g o r i t h ms a n d t h e cor r es p o n d i n g s o f t wa r e wi t h r e g a r d t o comp u t a t i o n a l c h e mi s t ry u s i n g GPU i n c l u di n g qu an t u m ch emi s t r y a n d mo l e c u lar d y n ami cs s i mu l a t i on s i n d e t a i l W e i n t r o du c e a n d e x p l o r e t h e n e wl y d e v e lop e d T e r a Ch e m p rogr am wh i c h i s u n i qu e q u a n t u m c h emi cal s o f t wa r e a n d we d i s c u s s t h e alg or i t h ms i mp l e men t a t i o n s a n d f u n c t i on al i t y o f t h e p r o gr a m Fi n al ly we g i v e a n o p t i mi s t i c o u t lo ok f o r t h e u s e o f GPU i n co mp u t a t i o n a l c h emi s t r y Ke y W o r d s GPU CUD A Co mp u t a t i o n al ch e mi s t r y Mo l e c u l a r d y n a mi c s T e r a Ch e m 1 引 言 计算 化学是基于计算科学 的原理来解 决化 学 问题的一个化学分支学科 计算科学和技术的任何 进步 都会 迅速 应用于计算化学 为计算化学 带来 长足 的进步 而敏锐的计 算化学家们 也 时刻关注 着计算科学 的每一个新进展 切盼这些进展能对使 用计算机从微观上 了解化学和生命现象带来突破 和契机 无疑 自2 0 0 7 年起 G P U在计算化学上 的应 用和导致 的一些具有 革命意义的进展 且该浪潮 的 势头还 正方 兴未艾 对任何与计算化学有关的学科 的科 学工作者 都 是应该密切 关注和深入 了解 的 概要介绍 G P U用于科学计算 的基本技术和原理 穷 极搜罗至今有关 的成果 条分缕析地归类分析 为 计算化学家和关注并需要计算化学成果 的非计算 化学家提供一个 引导性的材料 使他们能把握前进 的脉搏 而争取迅速迎头赶上 并在其中争得一席 Re ce iv e d Apr il 1 5 2 01 l Re v is e d J u n e 9 2 0 1 l Pu b l is h e do nWe b J u ne 2 4 2 01 1 C o r r e s p o n d i n g a u t h o r E ma i l j i a n g u o y u b n u e d u cn T e l 8 6 1 0 5 8 8 0 2 0 5 1 T h e p r o j e ct wa s s u p p o r t e d b y t h e Nm io n a l Na t u r a l S cie n ce F o u n d a t i o n o f Ch i n a 2 0 7 3 3 0 0 2 2 0 8 7 3 0 0 8 2 1 0 7 3 0 1 4 国家 自 然科学基金 2 O 7 3 3 0 0 2 2 0 8 7 3 0 0 8 2 1 0 7 3 O l 4 资助项目 E d it o r i a l o ffi ce o f Act a P h y s i co C h i mica S i n i ca 2 0 2 0 A ct a P h y s 一 C h i m S i n 2 0 1 1 lo 1 2 7 之地 是写这篇综述的初衷 在这篇综述中 第二节将简单介绍 G P U以及它 在数值计算 中应用发展 的几个阶段及加速在 GP U 上的计算软件开发的工具 第三节将逐一介绍迄今 使用 GP U改进量子化学计算算法和程序 的努 力和 一 个极有前景的完全基于 G P U的量子化 学计算软 件 T e r a C h e m 第四节介绍使用 G P U对 MD算法的改 进和迄今能在 G P U上运行 的MD程序 最后简单总 结并展望基于 GP U的计算化学算法和程序的辉煌 前 景 2 GP U在数值计算中的应用和软件开发工具 价格 合理 的 G P U g r a p h ics p r o ce s s in g u n i t s 图 形处理器1 最先是为能在计算机游戏中生动真切显 示三维 图形而设计 的计算机硬件 为了更好地显示 二维 3 D 图形 GP U需要对每个要显示的画面进行 大量的浮点运算 GP U最先的设计者们完全没有意 识到 他们在每一个 G P U中安排 的数百个计算单元 具有能够进行数量可观的并行运算的特征 使得 G P U在今天成 了科学计算 的宠儿 相 比而言 一直 在 计算机 中担 负计 算使 命 的每 一个 C P U ce n t r a l p r o ce s s i n g u n it 中央处理器 到今天也最多只能有数 个运算单元 多核 G P U的设计特性使得 巨大数 目 的并行事件 同时进入 GP U的 R AM r a n d o m a cce s s me mo r y 随机存取存储器 即相同操作能在GP U的 内存 不 同部 分 执 行 这 属 于 S I MD s in g l e in s t r u c t io n mu l t ip l e d a t a 单指令 多数据 类型 典型的 G P U 包含许多分列成组的计算单元 每组共享能快速进 旦 0 入的内存和一个指令单位 这些高度密集的计算单 元需要更大的 ca ch e 和控制单元 G P U在数值计算 中表现出的优异性能与 已经趋于平缓发展 的C P U 相比展现 出了令人耳 目一新的表现 见图 1 数据 收 集到 2 0 0 8 年 6月 而之后不到三年 的时间 到 2 0 1 1 年 3月 Nv id i a的Ge F o r ce G T X 5 9 0的G P U的浮 点 运算峰值和 内存带宽就又冲到 了2 4 8 8 3 GF l o p S 和 2 x1 6 3 8 7 GB S G P U结构 的本身具备进入科学计算 的基 本需 求 最早将 G P U用在数值计算中的企图可以追溯到 2 0 年前 尽管之后各种努力和尝试不绝如缕 但很 长时间 以来一直没有突破性 的进展 原因是缺少科 学计算编程的有效工具 当时一般是用特定的汇编 语 言或 图形 取 向的应用编程接 口 AP I a p p l ica t io n p r o g r a mmin g in t e r f a ce 如 O p e n GL或 D ir e ct X等 编 程 T作量之 巨大让人望而 生畏 值得一提 的工作 有最早 的Y a n g 等 使用 O p e n G L作为载体编制出程 序 在 G P U上进 行了分子动力学 的模拟计算 之后 有An d e r s o n 等 在 GP U上进行量子蒙特 卡罗 QMC 计算的尝试 由于 G P U硬件快速发展的促动和科学计算 高 速化 的迫切需求 在 GP U上用于科学计算简易快捷 的编程工具应运而生 它们是 A T I S t r e a m T e ch n o l o 2 v 和Nv id ia 的C UD A co mp u t e u n ifie d d e v ice a r ch i t e ct u r e S t r e a m计算机 编程范式 p a r a d ig m 最先 是 A T I 公 司为在 多个 计算 单 元或 多种 计算 硬件 如 C P U和GP U问容易进行平行计算设计的 不需特别 规定不同计算单元 问的交流和传递 之后A T I 公司 图 1 GP U与 C P U的浮点运算峰值和 内存带宽的 比较 Fig 1 Compa r is ons o f pe a k GFl op and m e mor y ba ndwidt h of GPU a nd CPU T he da t a cO m e f r o m NVI DI A we b s it e GT2 0 0 Ge Fo r ce GTX 2 8 0 G9 2 Ge F o r ce 98 0 0 GTX G8 0 Ge F o r ce 8 8 0 0 GT X G71 Ge F or ce 7 9 0 0 GTX G7 0 Ge Fo r ce 7 8 0 0 GTX NV4 0 Ge Fo r ce 68 0 0 Ul t r a NV3 5 Ge F o r ce F X 5 9 5 0 Ul t r a NV3 0 Ge Fo r ce FX 5 8 0 0 NO 9 鲍建樟等 G P U引发的计算化学革命 2 0 2l 在2 0 0 6 年被 A MD公司收并 直到 2 0 1 0 年后期 A T I 品牌彻底被 AMD取代 C UD A是一 个类似于 C语 言 的高级 直观 的编程 语 言 并 能被 C语 句调 用 NV I D I A公司最近还推 出了P a r a l l e l Ns i g h t 使 C U DA能在微软公司最为普及 的软件开发平台 V is u a l S t u d io 上使用 这惠及 了数百万 的软件开发工作者 可 以毫不夸张地说 C UD A给 G P U在科学计算上应 用 的飞速发展插上 了翅膀 一时间诸多的与数值计 算有关的科学家趋之若鹜 这 已经在改变着科学计 算的面貌了 现有数值计算的程序编码 已是浩如烟海 无论 如何方便 的在 G P U上的编程工具 如 C U DA 仍无 法重 复所有 已有 的编码和算法 若有简便的工具将 现有 的数 值计算 的程序 转换到 GP U上 将善莫 大 焉 在这个方 向上的尝试和进展包括能在 GP U上计 算的量子化学和固体物理中常用 的一些算法 中的 子程序库 如进行傅里叶变换的 C UF F T 和线性代 数库 C U B L AS 和 MAG MA 一 开始影响G P U在科学计算上普及使用的另 一 障碍是早期G P U较低的数值精度 随着N V I D I A 公司的支持 3 2 位浮点运算精度 的G8 0 系列 G P U卡 的 推 出 和 6 4 位 的 Ge F o r ce 8 8 0 0 G T X G P U卡 的 推 出 用于科学计算 的精度 问题得 到 了彻底 的解 决 尽管 在 6 4 位 浮点运算精度 下 运算速度会 有所损 失 3 使用 G P U的量子化学计算方法和程序 量子化学计算的基本方法 从头算 a b in it io 密度泛 函理论 D F T 的最主要计算工作 是求得双 电子排斥积分 也包括 D F T中的交换一 相关积分的数 值求取 和生成F o ck 矩阵以及矩阵的对角化 Y a s u d a 第一个认识到可使用GP U来提高计算 电子 排 斥积分 E R I 的速 度 他 使用 Ge F o r ce 8 8 0 0 GT X G P U卡 发展出了使用 G P U计算 D F T的KS矩 阵的 C o u l o mb 积 分的算法 但 仅适用于 S 和P基 函 数 这个 算 法 在 T a x o l 和 V a l in o my cin的 小基 组 和 L S D A D F T计算里 使用G P U计算C o u l o m b 势 仅 需C P U常规计算 时间的 1 3 尽管使用的 G P U仅支 持 单精度浮 点数运 算 但仍然有 可 以接受 的精度 Y a s u d a 的算法是在 G a u s s ia n 0 3 程序 上完成的 G P U对积分 的计算只能包括 S 和P基函数 是远 远不够 的 将 G P U上的积分计算扩展到d 及更 高角 量子数的基 函数的困难在于 目前最大 的单个 G P U 也无法容纳这些 高角量子数 的计算壳层 如对于一 个 价双 电子积 分的壳层 在 中间计算 时共 需要 5 3 7 6 个浮点数 它们要做多次的乘法运算 最终需 约 l 0 个 浮 点数 对 于 双 精 度 这 相 应 于 1 2 3 0 0 8 b y t e s 远远超 出了 目前最大单片 GP U的容量 有人 在等待着很快有更大的GP U上市 但As a d ch e v 等 另辟 蹊径 近来提 出 了一个使用 C UD A能计算到g 型基 函数的算法 他们将计算的中间结果存放在装 置的内存 而不是 GP U中 并将这些壳层块的积 分 重新 排序 满足这些积分 的频繁调用 这样做带 来 的问题是为了适应 所有积 分类 型的有 效排 列的方 式 原来在 C P U下使用的大量程序 需要重写 他们 采用了由一个个模块 自动生成的方式来解决这个 问题 使 用 GT X2 7 5和 T e s l a T1 0 GP U卡 他 们 与 G AME S S 比较 了双 电子 排 斥 积 分 的运 算 速 度 C P U能达 到 1 G F l o p S t 每秒钟进行 1 g ig a浮点运 算 而 G P U在单精度和双精度运算 时能分别达到 5 0和 2 5 GF l o p S 对D F T G G A中的X C 交换一 相关 势的数值计 算 仍是Y a s u d a 首先提出了在G P U上计算的算法 他 采用 的策 略 是 在 仅 将 XC较 费 时 的 步骤 交 由 GP U 其余仍 由C P U处理 使用NVI DI A的G e F o r ce 8 8 0 0 GT X卡 与 2 8 GH z的I n t e l P e n t iu m 4 相 比 该 步计算的加速能达到4 0 倍 As p u r u G u z ik等 将开发基于 G P U的量子化 学算法 的注意力放在 了包括相关能校正的R I MP 2 f R I r e s o l u t io n o t h e i d e n t i t y 方法上 除了对于含过 渡金属的体系 MP 2 计算的平衡几何构型优于广为 使用 的DF T MP 2 计算 中最为耗 时的是原子轨道基 的积分 向分子轨道基 的变换 这一般是体系基函数 数 目J 的5次方 O 引入 R I 积分近似可减少计 算时间而又没有明显的精度损失 A s p u r u G u z i k 等 分析 R I MP 2 计 算各个步骤 对计算机 时间 的需求 认识到RI MP 2 计算 中主要的时间消耗是在从半变 换 的三指标积分变换为分子轨道积分 时的矩 阵相 乘 他们使用 C UB L AS 的函数在 G P U上执行矩 阵 相乘的运算f 将 C UB L AS的函数引入量子化学计算 这还是首次 据他们自己的测试 在单精度下 计算 速度能达到原来使用 C P U的4 3倍 使用 NVI DI A T e s l a C1 0 6 0 G P U和4 G B的内存 他们测试了有 1 6 8 个原子的分子V a l i n o my cin 在单精度 混合精度和 双精度下分别能比C P U提速 l 3 8 1 0 0 和 7 8 倍 在 双精度 下 误 差接近于零 他们 的计算是植根于 另 20 2 2 Act a P s 一 Ch i m S i n 2 0 1 1 Vl01 2 7 一 广为使用的商品化量子化学计算程序 Q C h e m 在此还 应提 及一个 不被化 学家 熟悉 的 使用 Da u b e ch ie s 波 而不是 G a u s s ia n型的基 函数 的程序 包 B ig DF T Bi g D F T使用 C UD A在 G P U上编程 达 到了极高的并行效率 使用 G P U的版本能 比C P U的 提速达6 倍 量子化学计算程序 F ir e fl y 的前身是著名的量 子化 学程序 GA ME S S 的变 种 P C G AME S S 近来 F ir e fl y 在它的MP 4 S D T Q 计算中使用了GP U 对于 C 1 一 HF 分 子使用 6 3 l 1 G 2 d 2 p 基组进行单 点计 算 在使 用 四个 G P U 2 G T X 2 9 5 2 C1 0 6 0 时 计 算 速度提高 了近 1 0 倍 通 用 的 量 子 化 学程 序 包 Q C h e m 的一 个 突 出 特 点是具有运算速度非常快 的D F T计算功能 近来 O C h e m的开发者们 Ga n等 也将 G P U用于进一步 提高D F T 计算速度 结合已有的可用于D F T 一些步 骤 的GP U算法和 Q C h e m在DF T计算上的改进 提 出 一 个方案 t a s k b a s e d p r o g r a mmin g o b j e ct o r ie n t e d de s ig n OPENM P f o r mu l t it h r e a d ing M P I f o r cr os s n o d e co mmu n i ca t io n s 即基于作业编程 目标取 向设 计 用OP E NMP作多线程和用MP I 处理节点问的交 通 作者 自己的测试计算对 T a x o 1 分子 C H NO 使用一片C 1 0 6 0 G P U 计算速度提高了2 4 倍 若使 用4片G P U 速度提高达到 了1 0 2 倍 对将 G P U使用到量子化学计算极为关注和付 出努 力的还有 美 国I o wa 州立大 学 的Go r d o n教授 Go r d o n教授 的研 究小组 是 G AME S S 程序 的维护 者 并不断开发和发展 最先对 G P U计算精度的不 足曾影响了Go r d o n 教授对之的投入 随着双精度的 GP U卡 的出现 G o r d o n 教授 和 G AME S S研发 小组 变成了积极的参与者 Go r d o n 教授和他 的研发小组 正在重 写 G AME S S中的程序 使之 能在 GP U 七高 效使用 相信很快就有这样 的G AME S S 版本推 出 以上提到 的近几年提 出的使用 G P U提高量 子 化学计算速度的算法中 除了B i g D F T 其余都是利 用现有软件包 改善其中部分算法 在某一特定计 算步骤 使计算速度得到提高 而刚于 2 0 1 0 年推 出 的T e r a C h e m程 序则 完全 使用 C UDA概 念 重写 了 G P U上 的量化计算的基本程 序 T e r a C h e m是由美 国 S t a n f o r d大 学 的 Ufimt s e v和 Ma r t in e z 编 写完 成 的 由美国P e t a C h e m公司于2 0 1 0 年推出商业化版 本 由于他们在 GP U的量子化学程序 的先驱性 的 丁作和突出贡献 Ma r t i n e z 教授被 G o r d o n 称 为美 国 量子 化学 家 的 G P U的领 头人 Ufimt s e v和 Ma r t i n e z 提 出的计算双 电子排斥 积分基于 McMu r ch ie Da v i d s o n 框架 检验 了三种分 配 G P U C P U丁作和处理 任 务分块 的模式 1 B C I 1 T 1 C I 和 1 T 1 P I 先 进 行 由 H原子 组 成 的体 系 的 Is s 型积分的运算 然后推广到包括 由P函数组成 的基的排斥积分 他们发现若从 Ga u s s i a n 基 的双 电 子排斥积分直接进入 F o ck 矩阵 而不是如传统的将 G a u s s ia n轨 道 基 的排 斥 积 分 收 缩 到 S l a t e r 轨 道 S T O 在 G P U下能有 极高 的效率 对于 由 6 4个 H 组成 的体系 使 用 6 3 1 1 G和三种模 式计算 排斥积 分 分别耗 费 7 0 8 6 0 6 7 5 和 0 4 2 8 S 加上用 C P U的 预计算 的0 0 0 9 S 和 G P U C P U转换的 0 8 8 3 S 最快 的 1 T 1 P I 模 式 共 需 1 3 2 0 S 而 使用 G AME S S在 单 C P U下则需 1 7 0 8 S Ufimt s e v 和 Ma r t in e z 随后报道 了完全使用 G P U进行 H a r t r e e F o ck计算的方法 基 于 以前提出的 1 T1 P I 处理双 电子排斥积分的方法 他们提 出了Ha r t r e e F o ck的 矩阵和 K矩 阵在 GP U 下依据大小分块处理的算法 还研究了多 G P U的并 行化处理 每个 GP U处理 自己的l 矩阵子块 计算 矩阵时每个GP U处理 矩阵的不同的行 使用三个 G P U卡 GT X2 8 0 1 做 检 验 能 达 到 一 个 G P U卡 的 2 0 2 8 的效率 他们测试 了从2 4 个原子到4 5 3 个原 子组成 的分子的 Ha r t r e e F o ck 单 点能量计 算 使用 3 2 l G和 6 3 1 G基组 以及 一个 G P U Ge F o r ce 2 8 0 G T X 在双精度下 与 G AME S S 相 比 速度能提高 4 0 到 6 0 0 多倍 而总能量 的差别可忽略 计 Ufimt s e v 和 Ma r t in e z系列文章的第三篇 是关 于能量解析梯度计算 的G P U处理 包括C o u l o mb 和 交换部分计算的处理 加上多 G P U卡的并行计算 的 处理 该方法可用于 Ha r t r e e F o ck能量和 DF T能量 的解析梯度 的计算 使用 GP U程序 和单个 GP U卡 G e F o r ce 2 9 5 GT X 与 在 4 核 2 6 6 GH z C P U上 运行 的G AME S S程序 相比 从小到大 的分子 GP U仍然 可有数倍到超过百倍 的速度提高 这样 他们提 出的在 G P U上运行的量子化学计 算的算法 涵盖了基本的从头算 DF T的全部三个耗 时步骤 双 电子积分 Ha r t r e e F o ck Ko h n S h a n 矩 阵 处理和能量 的解析梯度 基 于此 Ma r t in e z 推 出了 他们 的 T e r a C h e m程 序 2 0 1 0年 春推 出 的为 1 0 5 版 能进行 闭壳层 的Ha r t r e e F o ck和 D F T的单点能 量计算 基于解析梯度的几何构型极小化和过渡态 优化的计算 以及基于以上计算 能量和解析梯度 NO 9 鲍建樟等 G P U引发的计算化学革命 2 0 2 3 的动 力学模 拟 MD 和简 单 的QM MM 计 算 使 用 T e r a C h e m 很容易检验和实现上述他们 的三篇论文 的结果 最近 2 0 1 1 年4月 推出的v 1 4 5 版 已能进行 包括 d 轨道和含过渡金属原子体系 的H F和 D F T计 算 并能达到与 轨道差不多的速度提 高 具体算 法 的改进和实现还未见有详细报道 T e r a C h e m更为不凡 需引起密切关注的原因是 这是第一个完全基于GP U 从零开始编制 的量子化 学计算程序 本文 引述 的在 Ufimt s e v 和 Ma r t i n e z的 工作之前或之后 的关于 GP U的量子化学计算 的算 法 的文章 虽都基 于某一特 定量子 化学程序 包实 现 但 至今还都没有 能进 入公开发行 的程序包 中 有些或许只能永远停留在纸面上 而 T e r a C h e m 进 入人们 的视 野 就 以完 备的商 品软件 的姿态 出现 据 P e t a C h e m网站披露 T e r a C h e m在 2 0 1 0 年春 天一 推 出 短短半年就有超 过4 0 0 0 份 的试用版本发 出 展现 出蓬勃的生命力 量子蒙特 卡罗 QMC 是求解与时问无关的薛定 谔方程 的精 确方法 之一 并且 Q MC很容 易并行 化 A n d e r s o n等 在 2 0 0 7 年就提 出了在 G P U上 加速 QMC计算的方案 使用 C U DA核优化缓存使用 在 GP U上进 行需求很大 的并行计算 对 于 8 3 2 个 原 子 的体 系 比C P U上的执行 速 度能有 5 倍的提高 Me r e d i t h 等 在单精度的G P U上用量子簇近似 使 用规整晶格上的二维H u b b a r d 近似研究超导在临界 温度下 的混乱效应 在G P U上使用C UB L AS 库执行 矩阵乘法 得到与C P U上的双精度可比的结果 4 分子动力学算法和程序中的GP U MD计算对生物分子的模拟 自McC a m m o n 等 对酶的计算为肇基 当时的计算水平是5 0 0 个原 子 模拟 的时间 1 0 p s 之后飞速发展 到 了今天 模 拟 的生物体系包括数百万个原子 模拟 时间能持续 到微秒都已成常规 而科学家对生命现象 的深入 了 解仍在向计算化学家不断提 出更高的要求 如对蛋 白质折叠的MD模拟研 究 折叠行为约需毫秒来完 成 如以纳秒 为步长做模拟 且每步计算花费一天 计 这样 的模拟就需执行一百万天 即差不多 3 0 0 0 年 这确实是对计算化学家提 出了严 峻的挑 战 虽 然有人花费巨资搭建豪华计算机系统 如 日本 的总 耗资超过一千 五百万美元 的MDG R AP E 3 系统 这是 使用 专门设计的硬件加速搜 寻表 以加速直接 空问非键 的计算 但这样的耗 费巨资并为某一特定 问题专门设计的硬件完全无法做广泛 的推广 且不 说耗资惊人了 而GP U适时的出现为MD对生物 的 模拟计算带来了曙光 由于在 G P U下编程 的 困难 早期试 图在 GP U 上提高 MD计算速度 的努 力有许 多是走入迷途 的 报导的结果也是使人信疑参半 至今被普遍接受 的 GP U上 MD算法 的成功 改进仍属本文 开始提 及的 Y a n g等 的工作 尤 其值 得赞 许 的是该 工 作是 在 C UD A推 出之 前 直接使 用 O p e n G L编 程 在 G P U 上 实现需惊人的工作量 并达到了 1 0 倍 以上速度的 提 高 虽然他们 的算法相 当简捷 在模拟过程 中仅 包含 L e n n a r d J o n e s 相互作用和建立一个邻接 目录 而缺乏对生物体系模拟 的许多计算步骤 但这个先 驱性 的工作仍有力地证实 了GP U能在 MD模拟上 发挥重要作用 早期使用 GP U改进 MD运算速度 的尝试大都 局限于使用简化的模型 或者只针对于特定的问题 做处理 而不是着眼于对真正MD的全面改进 L i u 等 是第一个使用C UD A来对 MD的计算进行 改进 的 他们仅在 G P U上计算简化 的范德华势 而避免 了对凝聚态体系 MD模拟的复杂的乘积运算 S t o n e 等 在他们的文章里仔细讨论 了一系列用于分子模 拟的算法 提 出了第一个直接空间范德华势和静 电 势在 GP U上合并处理 的方法 但该方法并不包括任 何实际的MD计算 而仅仅是在被模拟体系临近库 仑势的时间平均的计算 中使用 G P U 并引入到 MD 程序包NAMD 中 诞生了NAMD的GP U加速 的新 版 之后还有一些使用 GP U对 MD算法 的局部改 进 竭 直到A n d e r s o n 等 将共价项的贡献与使用 G P U计算的范德瓦尔和简谐键势项加入到他们的 HOO MD程序包 中 用 于研究非离子液体 可 以认 为 GP U版的HOO MD朝 向真正完整的GP U的MD 程序前进了一大步 真 正能称之为使用 G P U的MD程序产 品是到 2 0 0 9 2 0 1 0 年才出现的 至今只有三个MD程序包可 认为基本满足 它们分别是H a r v e y 等 的A C E MD F r ie d r ich s 等 的Op e n MM和 P h il ip s 等 的N AMD AC E MD可谓 是第一个 支持全 部 G P U加速功 能的处理凝聚相 的MD程序包 可处理周期性边界 和短程 长程的静 电作用 使用 G P U加速后 有很 明 显的速度提高 O p e n MM是一个程序库 起先仅是 对于小的和中等大小的体系使用非键项的间接求 2 0 24 Act a P h y s 一 Ch im S in 2 0 1 1 V0 1 2 7 和方法来计算溶剂的广义Bo rn模 型 之后 E a s t ma n 和 P a n d e 对 之 改进 显性 计算 进行 溶剂 的 MD模 拟 最 新推 出 2 0 1 1 年 3月 1 1日 的 O p e n MM 版 是 v 3 0 著名 MD程序包 G RO MACS 新近 的GP U版 将 O p e n MM纳入其 中 可在GP U上大大提高MD计 算的速度 NA MD的v 2 7 b 2 版也添加了GP U加速 的 明确进行溶剂化计算 的功能 在对一个 由2 5 0 9 5 个 原子组成的生物体系的模拟计算 速度提 高到了8 6 倍 NA MD最 新的版本是 v 2 8 b l 仍是 以C P U计算 为主 在多节 点间进 行 MD计算 而将 之置于 GP U 的环境 使用单片或多片G P U来提高C P U的单个节 点内的计算效率以达到提高 MD计算速度的 F j 的 AMB E R程序可谓是 MD计算机程序家族 中最 为 著名 的一员 由一些使用 A MB E R力场 进行 与 MD有关 计算 的程序包组 成 最近 AMB E R程序 家 族 的 P ME MD程 序在 显 性溶 剂 P ME p a r t icl e me s h E wa l d H 广义 B o r n 模型 GB g e n e r a l iz e d B o rn 的处 理 中使用 N v id ia的GP U 并 因之 推 出了A MB E R1 1 版 但使用 G P U后 的速度提高和计算精度还都有 待于检验 最 近 推 出 的 另 一 MD 程 序 H 00 MD B L UE 0 9 2 也声称支持GP U的运算 算法的作者声称他 们 的整个 MD计算都在 G P U上进行 单片 G P U运算 的速度 相 当于 3 0 个微 处理 器 尽 管有诸多 的对 MD在 G P U 上应用 的算法 的 创立和改进 和相应的能在 G P U上运行的 MD程序 的推出 其 中某些还声称是完全使用了在 G P U上基 于C U D A开发的新算法 但相对于G P u的量子化学 计算 程序能对速度 有 5 0 1 0 0 倍 的提 高 G P U上 的 MD程序 的速度提高还不尽如人意 最高速度提高 的倍数大约为 1 0 但据我们验证 除特殊情况 基本 无 法达到这 个速率1 这 是 由MD计 算 的本质 决 定 的 尽 管今天 的C P U 甚至 GP U的计算速度 已足够 快 但硬件问数据传递 的速度仍是瓶颈 而 MD计算 却是非常依赖和需要这些传输 GP U运算速度 的提 高无助于这些传输 甚至加重 了节点间数据传输 的 压力 这就是为什么至今 G P U上的MD程序仅限于 单个 GP U O p e n MM和 AMB E R 或单个节点内的多 个 GP U AC E MD 仅 NA MD试 图在 多节 点上应用 G P U改进 MD的计 算速 度 试图模 拟非 常大 的体 系 而 是优化单节 点 内的运行 这需要数量众 多 的 G P U卡 而仅有 差强人意 的速度提 高 且 性价 比 还相当低 5 结语 近年 由C UD A带动的 G P U在科学计算上 的蓬 勃 应 用和 发 展 不可 能不 进 入计 算化 学 领域 白 2 0 1 0 年 以来 接连有 G P U在计算化学 包括量子化 学计算和MD模拟1 的综述文章发表 如G6 t z 等 题 为 Q u a n t u m C h e mis t r y o n G P U 的综述 和 X u等 对 GP U在生物分子 MD模拟的进展的综述f 本文的 一 些材料问接引自这两篇综述 最近美国C h e m i ca l E n g in e e r in g Ne ws 上 的一 篇题 为 G P U革命 T h e G P U Re v o l u t io n 的短文也对 G P U将对计算化 学 的贡献和前景给出了极为乐观的评价和期许 纵观 由三年来 多方努 力和 如雨后春 笋般的在 GP U上的量子化学计算和 MD模拟算法和程 序的 呈现 仅有 Ufimt s e v和 Ma r t in e z辛勤 创 立 的 T e r a C h e m软件是完全从零的基础上 完全为 G P U计算 设计和实现 却也达到 了计算速度 的可喜提 高 而 其它量子化学程序和差不多所有的MD程序都还有 各种各样的缺憾和不足 T e r a C h e m或许会成为量子 化学计算的一个新里程碑 如 同四十年前 G a u s s ia n 7 0 和九十年代初量子化学软件的商品化大潮 呈现 以二十年为周期的飞跃 同时 N v id ia 会不断推出容量吏大 速度更快 的 GP U 而价格也会 愈来愈低 C U DA也会不 断扩 充 新功能 并愈来愈完善 使得在 GP U上编制科学计 算程序成为常规 而AMD的A T I S t r e a m T e ch n o l o g y 和 相应 的硬件或许在很近 的将 来会成为 Nv id ia 的 GP U卡和 C UD A的有 力竞争者 而且 GP U在 科学 计算上的应用也将出现百花齐放的繁盛局面 这些 都使我们相信 我们处在 一个计算化学新时代来临 的前 夜 R e f e r e nce s 1 NV DI A C UDA C o mp u t e U n i fi e d D e v i ce Ar ch i t e ct u r e P r o g r a mmin g G u i d e V e r s io n 3 0 h t t p w ww n v id i a co m o b j e ct cu d a d e v e l o p h t ml a cce s s e d Ma r ch 6 2 0 1 O 2 C o mp a r is o n o f N v i d i a Gr a p h ics P r o ce s s i n g U n i t s h t t p e n wik ip e dia o r g wik i Co mp a r is o n o f Nv id ia g r a p b ic s p r o c e s s in g u n it s a cce s s e d Ma r ch 6 2 0 1 O 3 L e n g y e l J Re ich e r t M Do n a l d B R Gr e e n b e r g D E Co mpu t Gr a ph 1 9 9 0 2 4 3 2 7 f 4 B o h n C A J o i n t C o n f e r e n ce o nI n t e l l i g e n t S y s t e ms1 9 9 9 J C 1 S 9 8 1 9 9 8 2 6 4 f 5 Ho f f K E I I Cu l v e r Ke y s e c J Mi n g L Ma n o ch a D Fa s t Co mp u t a t io n o f Ge n e r a l iz e d Vo r o n o i Dia g r a ms Us in g G r a p h ics h a r d wa r e I n P r o ce e d in g o fS I GG R A P H 9 9 Da n v e r s NO 9 鲍建樟等 G P U引发 的计算化学革命 2 0 2 5 6 7 8 9 f l 0 f I 2 1 3 1 4 f l 5 1 6 1 7 f 1 8 1 1 9 2 0 2 1 2 2 2 3 f 2 4 Au g us t 8 1 3 1 9 9 9 As s is o n W s s l e y P u b l is hin g Co mp a n y 1 9 9 9 2 7 7 2 8 6 Y a n g J Wa n g Y C h e n Y C o m p u t 肋 2 0 0 7 2 2 1 7 9 9 An d e r s o n A G Go d d a r d W A I I I S ch r o d e r P Co mpu t Ph y s Commu n 2 0 0 7 i 7 7 2 6 5 ATI S t r e a m T e chn o l o g y h t t p www a m d co rn US PRODUCTS TECHN OLOGI ES S TREAM TECHNOLOGY Pa g e s s t r e a m t e ch n o l o g y a s p x A cce s s e d Ap r i l 1 3 2 o 1 1 C UD A S a n t a Cl a r a C A h t tp w ww n v id i a co m o b j e ct cu d a h o me n e w h t ml a cce s s e d Ap r i l 1 3 2 0 1 1 NVI DI A S a n t a Cl a r a CA CUF FT Lib r a r y h t t p d e v e l o pe r d o wn l o a d n vid ia co m co mp u t e cu d a 2 3 t o o l k it d o cs C UF F T L i b r a ry 2 3 p d f a cce s s e d Ma r ch 6 2 0 1 0 NVI DI A S a n t a Cl a r a CA CUBLAS Lib r a r y 2 0 h t t t d e v e l o p e r d o wnl o a d n v id ia co m co mp u t e cu d a 2 0 d o cs CUBLAS L i b r a ry 2 0 p d f a cce s s e d Ma r ch 6 2 o l o I n n o v a t iv e Co mp u t in g La b o r a t o r y Un iv e r s it y o f Te n n e s s e e Ma t r
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民爆行业安全培训课件
- 民法婚姻法课件
- 北京滴滴专车考试题目及答案
- 新质生产力具体成果
- 民族风动漫课件
- 民族观与宗教观
- 民族舞网课课件
- 某公司企业文化建设方案
- 民族理论第三章课件
- 新质生产力发展方向的企业布局
- 2025民法典婚姻家庭编司法解释二解读
- 《吞咽障碍膳食营养管理规范》(T-CNSS 013-2021)
- 2024全国中考语文试题分类汇编:议论文阅读
- 《城市轨道交通车辆标志规范》
- 人事工作目标及规划
- 象棋入门课件教学
- 2024年3dmax模型制作与精修培训课件
- 咨询类合同合同范例
- Vue3系统入门与项目实战
- 旅游产品开发与设计作业指导书
- 中职语文职业模块1.2《宁夏闽宁镇:昔日干沙滩-今日金沙滩》教案
评论
0/150
提交评论