




已阅读5页,还剩56页未读, 继续免费阅读
(工程力学专业论文)药物分子对接的优化模型与算法.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
突篷理工大学壤 擎整论文 臻要 药物的设计和研发工作长久以来以其商投入 高风险的特质成为制约药物领域发展 懿鬟要嚣素 疆着主嫠绝舌哮 撬技术熬逐鬃发矮 将诗算程菝寒 优纯努法与药携浚谤 三者融合而成的计算机辅助药物分子设计融经成为创新药物研究的重要领域 而药物分 予对接方法研究则是计算机辅助药物分予设计豹重要环节和步骥 最优化方法作为一门 寂爝型的学科 遥过将实际的应用问题转化为合理的数学模鍪 并采用高教的优健算法 得到问题的最优答案 将最优化方法应用到药物分予对接领域 可以大大提高计算机辅 助药物分子投诗豹准确蠖与效搴 弱嚣援犬懿痒羝药物设计翦麓豹成本 本文的童要工作 就是从优化方法的模型建立与改进的优化算法应用两个主要方面 入学 通过建立全新的药物分子对接中的优化模型并应用改进的搜索算法 从而得副更 鸯瑟金瑟 实糟静分子j c 雩接优纯方法 首先介绷了计算机辅助药物分子设计领域的发展及药物分予对接方法的理论 然 屠 综述了霹翦饯诧方法的研究现状劳羞鬟鼹本文皮弱的遗传算法理论及方法进纾了阉 述 在此基础上 构懋了基于经验和基予知识的两种药物分予对接的优化模垄e s c a r e 和k s c o r e 并将改进的基于信息熵的多种辩自适应遗传算法引入到分子j c 寸接的优化过程 串 形成了蜜薅有效鹣芬耱分予瓣接程黟 盎s d o 蔽及 沁矗毒羚溅 为验证两种优化方法的有效性 本文分别采用复台物自由结合能预测及晶体结构复 原 分子对接实例等方法对两种髯法的准确性及可行性进行了测试 测试结果显示瓶种 分予对族方法均吴有较鲟的实用往爱计算精度 待嗣是基予躲谖酶优髭 模墅在礴 a 及 r n a 复合物的自由结合能预测及分子对接方面有着照为广阔的发展前景 关键词 药物分子设计 分子对接 遗传算法 信意熵 药物分予甜接的优化模型及冀法 i m p r o v e do p t i m i z a t i o nm o d e l a n d a l g o r i t h mi nm o l e c u l a rd o c k i n g a b s t r a c t m 出c o s ta n dl o we f f i c i e n c ya r ear e m a r k a b l ec h 咖o f t h ed r u gd e s i g n w h i c hh a v e b e c o m eas e r i o u sp r o b l e mi nm e d i c m ed e v e l o p m e n t c o m p u t e r a i d e dd r u gd e s i g np l a y sa i m p o r t a n tr o l ei nt h em e d i c m ed e v e l o p m e n t w h i c hc o m b i n e dw i t ht h ec o m p u t e rt e c h n i c a l o p t i m i z a t i o na n dd r u gm o l e c u l a rd e s i g n t y p i c a lo p t i m u md e s i g n sn e e dt oe s t a b l i s h 题 o p t i m i z a t i o nm o d e lw i t ht h ef u n c t i o n sa n ds o m ed e s i g nc o n s t r a i n t sa n dd e s i g nt h ee f f e c t i v e a l g o r i t h m s f o rs o l v i n gt h em o d e l b ym e a l 强o fo p t i m i z a t i o nd e s i g n t h ee f f i c i e n c ya n d a c c u r a c yo fd r u gm o l e c u l a rd e s i g n b ei m p r o v e da n dt h e 州c co fp r e c e d i n gs t a g eo ft h e d r u gd e s i g nr e d u c e dg r e a t l y 珏er e s e a r c hw o r ko ft h ed i s s e r t a t i o ni st oc o n s t r u 畦a 荆o p t i m i z a t i o nm o d e lf o rt h e d r u gm o l e c u l a rd o c k i n ga n dd e s i g n 舔i m p r o v e da l g n r i t h m m a k i n gd r u gm o l e c u l a rd o c k i n g a c c u r a t ea n dq u i c k f i r s t as u n l m a r yo f t h em o l e c u l a rd o c k i n si nd r u gd e s i g na n dt h es t a t u so fo p t i m i z a t i o n i n c l u d i n gt h ei m p r o v e dg e n e t i ca l g o r i t h m w h i c hi si m p o 舳ti n t h ed i s s e r 恤f i o n i s i n t r o d u c e d t h e nt w ok i n d so fn e wo p t i m i z a t i o nm o d e li sm 粼l c w h i c hi sc a l l e de s c o r ea n d i 汹i es e p a r a t e l y b a s i n g0 1 1t h en e wm o d e la n di m p 珀v e dg e n e t i ca l g o r i t h m t w om o l e c u l 簦 d o c k i n gp r o g r a n u n e r se g a s d o c k a n dk g a s d o c kh a v eb e e nd e v e l o p e d at e s to fr e v e r t i n gt h es l r u c t 瑚eo fc o m p o u n d i n ga n dp r e d i c t i n gt h eb i n d i n ge n e r g yi s u s e dt oe x a mt h er a t i o n a l i t ya n dp r a c t i c a b i l i t yo fe g a s d o c ka n dk g a s d 0 c k 硼托r e s u l t s s h o wt h a tt w ok i n d so fm e t h o dh a v ee x c e u e n tc a p a b i l i t yi ne s t a b l i s h i n gt h eo p t i m i z a t i o n o b j e c t i v e e s p e c i a l l y t h ef u n c t i o nb a s e do nk n o w l e d g ek s c o r ew i l lb ev e r yu s e f u li nt h e d e v e l o p m e n tf o rd n a r n a i e s e a r c h k e yw o r d s d r u gd e s i g n m o l e c u l a rd o c k i n g c s e n 出ca l g o r i t l x m i n f o r m a t i o ne n t r o p y l l 独创性说明 作者郑重声明 本硕士学位论文是我个人在导师指导下进行的研究工 作及取得研究成果 尽我所知 除了文中特别加以标注和致谢的地方外 论文中不包含其他人已经发表或撰写的研究成果 也不包含为获得大连理 工大学或者其他单位的学位或证书所使用过的材料 与我一同工作的同志 对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意 作者签名 垒 型鳌日期 出生 大连理工大学硕士骈究生学位论文 大遗毽王夫学学位论文版权使用授权攀 本学位论文作者及指导教师完金了解 大连理工大学硕士 博士学位 论文版权使用规定 同意大连理工大学保留并向国家有关部门或机构送 交学位论文的复印件和电子版 允许论文被查阗和惜阕 本人授权大连理 王大学可以将本学位论文的全部或部分凑客壤入有关数据津送行检索 也 可采用影印 缩印威扫描等复制手段保存和汇编学位论文 作者签名 耋堕圣 导师签名 砂髯次 馥年 l 胃l 磊 1绪论 1 1 本文研究背景及意义 医药产业作为 种高技术产业 具有高投入 高风险 高收益的特点 新药的研发 是一个高投入 低效率的工作 根据美国制药商协会 p m a 统计 一个新药从筛选到 成功上市 大约平均要花1 2 1 4 年的时间 从费用上看 中间过程的花费则高达2 0 3 5 亿美元 并且这种时间和投入仍在呈逐年上升的趋势 1 我国制药工业的规模居于世界前列 然而创制新药的能力却十分有限 医药产业的 形式非常严峻 就全新的化学药品而言基本上是空白 长期以来 我国医药产业以仿制 国外药品为主 其中西药中9 7 的上市药品为仿制药 造成这种情况的一个关键原因 就在于缺少具有自主知识产权的创新药物 这就要求我国的医药界努力提高自主研发新 药的实力 尽快研制成功一批具有专利保护的 有国际影响的创新药品 新药研究之所以进展缓慢 主要原因在于在新药研制初期 缺乏有效的药物分子设 计和筛选手段 以往在药物设计初期 往往耗费了大量的人力 物力及财力 而最终得 到的结果有时却不尽如人意 在这种情况下 药物分子设计的理论及思想应运而生 药 物分子设计将传统的药物设计理论和数学上的最优化方法引入药物分子的虚拟筛选中 建立有效的数学模型 利用计算机快速高效的特点 使得药物分子设计更加快捷 有效 这种计算机辅助药物分子设计大大减少了发现先导化合物的时间 同时也降低了药物开 发的成本叫 2 0 0 1 年9 月 我国国家科技部将小分子药物设计和分子设计列入十五期间8 6 3 计 划 确定其研究目标为 发现具有新机理 新结构类型的原创性先导化合物 力争获得 一批国家专利 针对药物设计及分子设计的关键环节 研发具有自主版权的软件 获得 应用前景明确的蛋白质及其它生物功能分子 1 2 计算机辅助药物设计 新药的研制是一件耗费巨大而且效率低下的工作 迫切需要应用新的理论方法和新 的技术加以改进 药物设计就是在这种社会需求的强大推动下逐渐发展起来的 它是药 物研究过程中的一个重要阶段 图1 1 药物设计作为独立和明确的研究领域 始于 上世纪6 0 年代 迄今只有4 0 余年 传统的药物设计 图1 2 从总体上讲 具有很大 的盲目性 缺乏成熟完善的发现途径 随着计算机技术 计算化学 分子生物学和药物 化学的发展 药物发现进入了理性的阶段 出现了理性药物设计 r a t i o n a ld r u g d e s i g n 如图1 3 所示 药物分子黠接豹优纯攘墨汲雾法 药物发现 拯臻裁研究 诋寨研党 样翕获褥 药学研究簸采应鹧 偶然发现 k 药效学磁究人l 期l 羟痰觋究 药物筛选 v一般药理研究 i i 期临床研究 理谂职究 药物代谢研究临床应用 药物设计 毒理学研究不良反应鉴溅 豳1 1 药物设计发展阶段 魄1 1t l m d e v e l o p m e n t o f m r u g d e s i m 用1 2 传统药物设计 f i 善1 2t i m t r a d i t i o n a l d r u g d e s i g n 囊牲药物设诗燕在分子蕊至电子豹承平 乏考虑药耪结构 它需妥有先递游技术支 撑 羚筹戡豹麓助是理性蘩物设计豹燕要孚段 基于分子承平瓣 冀规辏助菸勃设诗 c o m p u t e ra i d e dd r u gd e s i g n c a d d c a d d 综会莠藏助了多学科的先进技零 方法 和成果 为理性药物设计提供了强有力的基本工具和手段 自从1 9 6 0 年定量构效关系 方法提出以来 经过4 0 多年的探索和努力 尤其是1 9 9 0 年以后 随着多种新方法的出 现 c a d d 己经发展成为 i 3 的学科领域 它的应用缩短了药物研究与开发的进程 提高 了药物开发静效率 也为入们研蒂4 新药提供了崭新的思路和成功的希蓬 大连理盖大学顼士冬 控谂文 图1 3 基于结构的理性药物设计 残罄1 3 t h er a f i o n a ld r u gd e s i 肛b a s e d 锄s 钿l 曲蚰l 图1 4 基于分子对接的理性药物设计 f i 鲁1 4t h e d r u g d i g n b a s e d o n m o l u l a r d 1 c i n g 计算机辅助药物设计的方法大致可以分为基于小分子的药物设计方法 基于受体结 构韵药物设计方法和计算机组合化学方法 随着x 射线衍射以及核磁共振等技术的发展 越来越多的垒物大分子鹃三维结构被测定出来 所以纂于受体结构酌药豹设计也就踅具 理实意义 菊物分子x 接戆霞愆横茎 及雾法 分子对接是薹予受俸结构药物设计串静一震重要努法秘是企薪静药物设计豹主要筝 段 也是进行大规模虚拟筛选的重要途径 对按时将小分子配体放置予受体的活性位点 楚 势寻我其会瑾豹欷窝窝构篆 舞豳l 4 掰示 遴过分子瓣揍胃班获已有纯舍耪分 子库中筛选出有希望的苗头化合物 节省了许多合成操作 分予对接的过程就是寻找配 俸与受镩结合熬活性惑点处 氛能穆象熬过程 搜索算法襄译分瓣数是分子对接过程孛嚣 个不可分割的麓要部分 好的搜索算法应该能够遍历所有构象空间 合理的评分函数能 够有效遮模羧聚俸 受镕之弱籀互作蠲戆亲嚣匆 1 3 最优化方法 最优化方法弼是 f 3 应用健很强的学科 宦研究篥些数学上定义的问题的最优解 即对予给出的实际问题 从众多的方案中选出最优方案 一般设计问题都存在着许多可能的设计方案 入们在设计时 总怒力求从释种可能 方案中选择较好的方案 传统的工程设计过程一般是 首先进行综合设计 然质对方絮 进行分祈评价 如不满意 刚进行再设计 提斑改进的优纯方案 在这种 评价一再设 计 的过程中 往往产生若干种优化方案 直到从中选取一种 满意 的设计方案为止 这个满意的方案 就是最优仡方案 螽于设计方法的弱限性 这种 优亿 设计的质蠢 不高 速度很慢 直到有了高速的计算机 人们才能够对各类较大规模的优化问题利用 计算梳送行求解 使激优纯努法成为解决阉嚣豹一种实耀豹王共 优化方法实质上就是运用计算机高质量高速度地完成设计方案的 评价一再设计 煞过程 是诗舞税辘麓设计静棱心技术之一 滋行最毫l 己纯主要骞两方瑟鹃工露 第一方 面 将实际要解决的问题数字化 模型化 使之成为标准的最优化数学模型 第二方面 将最谯纯模蝥豹求簿穷法震谤舞撬实瑗 扶焉翊计算梳来解决该翊嚣豹最霞纯 撬蘩簧 求解的实际问题的最优化答案 爨然最砉 己纯霹鞋逡壤裂专分砉老熬援篷鹅遂 然甏 宅或凳 f j 狻立赘学瓣是在2 g 世纪4 0 年代米 d a n t z i g 提出求解一般线性规划问题的单纯形法之后 随着线性规划 l 线饺援划 戬及隧穰 烧划 l 必溪栽划 多嚣振鬟魁 足餐缎刘等务秘最钱纯舞蘧鹣 理论的研究发展迅速 新方法不断出现 实际应用日益广泛 2 0 邀纪8 0 年代磅期 禁忌搜索 模数运火 遮传算法窝人工毒枣经网终等一系列餐 类 方法的兴起 伴随计冀机的广泛应用 使得最优化方法在解决复杂实际问题时发挥了觅 妇有效匏作用 一4 一 大涟理王大学疆 学整 龟文 1 4 基于优化方法的药物分子设计 随着基因技术 蛋白质化学 蛋皂质纯化等技术的快速发展 近魑年 已知三终结 构的蛋白质的数量得到了飞速增长 利用这毖已知结构特征的蛋白 采用有效的优化方 法在计算机辅助下进行药物分子设计中的分子对接方法已经成为可靠 相对廉价的用于 先导健舍甥发瑷垂冬一静鬟要事段 分子对接方法通过将已知结构的小分子化合物放入靶撂分予艇结合位点 优促小分 子化合物的取向及构象 寻找小分子与靶标大分予作用的最佳结合构象 计算其与生物 大分子的相互作用能 分子对接包括3 个相瓦关联的部分 结合位点的识别 优化模型 懿建立帮有效豹梅象优纯方法 大多羧分子对接耩亭在事先定义豹结合位患赴遴行构象 优化 结会位点可以通过比较不嗣浆体驰蛋巍质菇馋缕梅 或是遥过与具窍相似功黢雏 蛋白质进行比较 如果对蛋白质结合位点没有任何信息可以利用的话 可以通过一些口 袋议剐软件来假定结合位点 而建立有效的数学优化模型 寻求有效的优化方法则是近 年来分子对接优纯麓嚣的研究重煮 1 s 本文主要研究内容与工作 本文在药物分予对按的萋穑上 对药物分子设计中的数学模疆的建立及有效的优化 方法进纡了聚究与探索 发震了戥遗簧算法必基破熬药凌分子设计圣 己纯算法 势逶逡蘧 算法对3 种不同的靶标体系进行晶体结构复原 褥到了与真实结构相近的复原缕果 验 证了方法的正确性 同时 对8 3 个复合物测试集的分子进行了对接测试 通过与典型 簿凌软件结栗麓诧较 从而验证了本文药物分子优化设计方法的有效性及高效性 第一褰瓣述了芬甥分子设诗的琴 究背豢帮鬈义 余绥了最优纯方法静概念 努秘 分子设计所要勰决的问题以及药物分子设计中的优化方法的应用 势在此基础上余缨本 文的主要研究内容和工作 第二章穰述了药物分子设计的对接原璩 包括分子对接原理的艇补题配原则 对 接藩理静分类 分子对攘串懿模攒方法 梅象搜索算滚 典登静分子对接软僻等 第三章综述了优化理论及本文应用的遗传算法的起源 发展及其基本理论 势对 本文中用于药物设计的基于信息熵的多种群自适威遗传算法理论进行了重点的阐述 第四章建立了基于e s c o r e 及k s c o r e 的分子对接优化模型 并对新模型中目标函 数串各矮豹 筝褥迸符了详尽豹分析 第五掌将叛型匏优化摸型及改进戆遗传算法琴l 入到药椽分子设计孛 设谤篷基于 经验优化模型的分子对接方法e g a s d o c k 及基于知识优化模型的分子对接方法 药物分子对接的优化模婺吸算法 k g a s d o c k 透过复合物结会自由巯预测 晶体结构复原及分予 孽接溯试集等方戏 验迁 了方法的惩确憾 高效性及有效性 第六章总结和展望 一巷 大连理工火学硕士学位论文 2 药物分子设计中的分子对接原理 2 翁物分子设计概述 生命科学基础研究结 聚表明阱 内源性活性妨质或者外源性小分子药物 广泛称为醚 体 1 i g a n d 作用予机体内的靶橼 t a r g e t 从而引起生物活性 而机体的酶 爱体 寓子逶遂 拨黢等为滢在熬药鐾掺用靶橼或靶患 广义建嚣必受钵 r e c e p t o r 配体与受体结合时 彼此存在静电相互作用 氢键相互作用 范德华相互作用和疏 承穗互律焉 聚俸与受俸缭舍必缳满是鬣餐嚣鬣覆弱 冕蚕2 1 帮鬣体与受俸尼筒 形状互补匹配 静电相互作用互补匹配 正电荷对应负电荷 氢镶相互作用 氢键供体 对应氢键受体 疏水稻互作角互补匹鬣 疏永嚣 l 嘲 期蛾 h 置弗 圈2 1 配体受体短补匹配图 f i 参2 1 西岵啊c e p 瞬删旺c 燃n go nc o m p l e m e n t a r y 合理药物设计就是根据靶标生物大分子三维结构 考查配体小分子 内源性配体 天然药物 或合成小分子 的化学结构特征 寻找和设计合攥的药物分子 以发现选择 性作用于靶椽 又具骞生物溪性的蕊物毙导纯食物 绒摄据靶标三维结橡蹇接设谤具鸯 生物活性的配体 用由此发现和设计的药物先寻化合物 可以进一步设计 研制跚药物 途耱芬狻疰毯活缝强 捧弱专一 戮痒廷低 称为舍莲芬凌设诗 r a t i o n a l 鼢u gd e s i g n 药物的治疗作用主要通过药物与受体的相赢作用 在生物体中受体大多是生物大分 子 蔼叛蛋鑫质屠多 鲡栗入镪了解了受镩蛋翻质的缡构 就可骑根据其结构采研究药 物是怎棒改变它的构象 进而产生治疗作用 设想受体蛋白磊种可能的药物结构来模拟 这种相互作用就有助于找到较好的药物 这是当前药物筛选中的一个合理的和有效的途 径 量裁基予生甥犬分子懿药物设诗受体模型生要有以下足类 1 基于酶结构的药物设计 骜物分子i 夔女的倪纯穰黧及算法 2 基于抗体结构的药物设计 3 蒸予致癌 抑癌基因袭达产物斡药物设诗 4 基子转录嚣手续稳懿瑟瑟设谤 2 2 药物分子设计中的分子对接原理 2 2 1 分子对接原理概述 隧麓x 射线衍射以及核磁共振等技术的发殿 越来越多的生物大分子的三维结构被 溅定窭 羧鞋基予受俸续耩豹蓊兹霰谤选藏黉荚现实意义 瑟分学瓣装是薹予受俸三 维络构豹药物设计方法中十分重要的一种 也最大规模虚拟筛选的鬟器途径 分予对接方法将小分予西已体放置于受体的活性位点处 并寻找藏合理的取向和构 象 使得配体与受体的形状和相互作用的匹配最俄 在药物设计中 分子对接方法主要 用来从小分子数据库中搜索岛受体生物大分子有较好亲和力的小分予 进行药理测试 获孛发瑗赣熬宠导健会携 分予霹接方法豹主要後煮是 垂分子配律豢零上来宣现有纯合物数据痒或制药公黉 自己韵法人数据库 而且其巾很大一部分可以向供应商定购 如啪l a c d 嘲中的所有化 合物均可购买到 因此 分予对接方法可以大火加快先导化合物的发现进程 分子对接 是从整体上考虑配体与受体的结合效果 能比较好她避免其他方法啦容易出现的局部作 用好嚣熬俸缝金欠佳豹情况 2 2 2 对攘审静分子表达 受体生物大分子和配体的表达是评估分子对接方法的一个重要因素 分子的表达形 式某种糕度上决定了分子对接程序采用何种优化方法 对接中的优化袭达大致可以分为 三种 原予 表面 和网格m 覆学表达逶零曩在按照粪实势垂数透露分子怼揍露 它是分予袭逮孛囊准确懿一 种 毽融鼍 其计算秘复杂挂 教常雳在分子对羧过程最螽豹舞痔过糕 基予表面的分子对接悬嗣仁常典型的 如图2 2 常用在蛋白质一蛋白质对接中 与原予激达相比 分子表面的计算极大地降低了计算的复杂性 提高了算法的速度 一8 大连理工大学硕士学位论文 图2 2 对接中的分子寝面表达 f 毽2 2t h e m o l e c u l a r s c f f a c e i n d o c l c 吨 分子对接的网格表然 见图2 3 可以看作是分子对接的预处理过程 它用计算机技 术将靶橼分子的结合位点区域划分成正方体网格 受体的物理化学性质被预先存储在网 辏点上 髑格文传只嚣谤冀一次 农计算褥分时霹重复读入诗冀 因此太大绷抉了计算 速度 图2 3 对接中的分子网格表达 f i g 2 2 t h em o l e c u l a rs u e f a c ea n d g r i di nd o c k i n g 2 2 3 分子对接的方法分类 根据分子对接在药物设计中的用途可将分子对接分为两类 细致对接耧粳略对接 缁蒙j c 雩接瘸子改造绒设诗琵镩分子 霹耩发辩求较高 黧考虑较多熬分予柔毪 溶 剂作用时 有时还需要对亲和性做出估计 细致对接对速度的舞求不很严格 通常一次 对接计算谯几个小时内完成 凝錾瓣接雳手对豫含凌数据瘴戆薅选 簌孛找瀣霉戆与受傣缝含熬睨合凌 透鬻爨 要对至少1 0 5 个小分子的数据库进行对接过虑筛选 为了在合理时限内完成这样规模的 计算 必须以很快的速度完成对单个小分子的对接 当然 这要以牺牲一些精度为代价 假定对接整个数据库的可接受合理时限为1 0 6s 约两周 则对单个小分子的对接时间 平均只有l o s 根据对接时计算量的简化程度 可以将分子对接分为刚性对接 半柔性对接 和柔 性对接 刚性对接刚性对接指在对接过程中 研究体系的构象不发生变化 刚性对接适合 考虑比较大的体系 比如蛋白质一蛋白质以及蛋白质一核酸之间的对接 它的计算较为 粗略 原理也相对简单 半柔性对接半柔性对接指在对接过程中 研究体系尤其是配体的构象允许在一定 的范围内变化 其中比较有代表性的对接方法有k u n t z 等发展的d o c k m 软件以及o l s o n 等开发的a u t o d o c k 软件 1 半柔性对接方法适合于处理小分子和大分子之间的对接 在 对接过程中 小分子的构象一般是可以变化的 但大分子比如靶酶则被认为是刚性的 由于小分子相对较小 因此在一定程度考察柔性的基础上 还可以保持较高的计算效率 在药物设计中 尤其在基于分子对接的数据库搜索中 一般采用半柔性的分子对接方法 柔性对接柔性对接指在对接过程中 研究体系的构象基本是可以自由变化的 其 中比较有代表性的方法有a c c e l r y s 公司发展的基于分子力学和分子动力学的分子对接 方法 及分子对接程序f l e x i d o c k 柔性对接方法一般用于精确考察分子之间的识别 情况 由于在计算过程中体系的构象是可以变化的 因此柔性对接耗时较长 目前流行的分子对接方法多采用半柔性或柔性对接方法 2 3 分子对接过程中的主要研究问题 2 3 1 分子对接中的优化算法 分子对接就是耍寻找具有与受体分子最佳匹配的 或最低能量的 配体构象 这是 一个复杂的优化过程 在目前现有的对接程序中 构象搜索方法基本可以分为 系统 搜索 片断生长法 构象搜索法 构象库法 随机搜索 蒙特卡罗法 遗传算法 禁忌 搜索 确定性搜索 分子动力学模拟 系统搜索 方法为了尽可能的遍历分子的所有自由度 大都采用片段生长或分层生 长的方法 即将配体逐步添入蛋白质的活性部位 再将各种分子片段分别对接到蛋白质 的活性位点区域 最后将这些对接片段联合起来构成分子对接的最终结果 这种方法在 概念上遍历了搜索空间 不易陷入局部最优的区域 但由于片段之间的联结表达及搜索 夫粒大学磷 学蠹沦文 空麓豹复杂饿 既种控索努法需要耗费一定酌计算辩闻 确定性搜索方法主要应用为分予动力学方法 分子动力学通过数值积分方法由各个 裢予鹃瓣嚣受力情魏来求出它稍熬遴动经共辘迹 爨蕊虿用途释方法模羧垒物大分予的 构象和计算体系的热力学性质 尽管是 种常规的横拟方法 但由予计算时间过长 容 曩貉入蜀整簸霞等特赢 鏊耨分子动力学方法在分予对接当巾应磊较多 随机搜索方法叉称智能必算法 其特点为配体分子构象绒是代表配体分子的种群是 夔棱交纯赘 薮生戏熬配俸糖象由鬏先定义豹藏率嚣数译信褥蘩 蒙特卡洛方法 蹙使 用经验势函数的随机模拟方法 通过按照一定的采样方法不断抽取体系构象 使其蝣渐 趋予魏力学擎餐系综 模羧遥火技零 萄霹激骞效遮等我分子豹往势糖象 其j 霆程秀 先 使体系升温 在高源下进行分子动力学模拟 使分予体系有足够的能量 克服柔性分子 孛存在的各耱旋转筑垒和蹶反冥孛冬熊垒 援罨全部 l 奄象空阖 在构象空闳中选出一臻毙 量相对极小的构象 然后逐渐降温 再进行分子动力学模拟 此时较高的能穗已无法越 过 在极小纯后去除能量较褒的构象 最后霹l 乏褥到相应的能量最小瓣优势梅象 逡搀 算法 的主鬻特点怒直接对结构对象进行操作 不襻在求导和函数涟续性的限定 具有 较好的全局罨优能力 采用概率化的寻优方法 能自动获取秘指导优化的搜索空圊 自 适应她调整攘索方向 不需簧确定的规则 作为一种全局优化搜索算法 遗传算法以其 简单通用 邋于并行处理及赢效 实用等显蔫特点 在各个领域褥到了广泛应用 取霉 了蠢好的效聚 并逐渐成为熏要的智能算法之一 上述随机搜索方法的共同特点在于没有明确的收敛准则 大多数程序通过控制参数 或操作次数终丘程孝 本文聚用了谦题组研制的基予信患熵的多种群自适应遗传算法作 为分子对接的优化方法 以空间收缩尺度作为搜索停止的判据 有效她控制了算法的收 敛 阍对逶澄多释群及自遥癍策略保证了稀群静多样往 避兔陷入辩都最优解现象髂发 生 2 3 2 分予对接牵结合位赢的选撵 配体与受体的住用部位 s i t e 郎结合位点是指受体或酶分子中一个特定的小区域 一般位于受体或酶分子表面的凹穴中 口袋 这个特定部位由少数氨基酸残基的侧链基 团所组成 它们在一级结构上可能棚距很远 甚至有匏在不阁主链上 但由于盘曲拱叠 的绪果丽在空间结构上十分相近 这样就与附近的箕它残基有序地稍 布成特定的空间结 构 这个空间结构与配体形状互补 相契合 并且具有适宜的非极性环境 以利于基因 闻发薹e 静电甄补 疏水互补镣作用 使底物紧紧嵌含在这个特定部彼上 结合位点的选择是一个十分复杂的过程 直接关系到分子对接的结果优劣 由予数 药物分子x 霪接的甓诧摸婺吸算法 据的数量十分庞大 因此在选择结合位点时 大都采用糨略划分结合口袋的方法 即将 结合位点及其附近一定范围内的区域化为结合口袋区域 通过计算配体小分子与结合阴 袋速域中静蛋氢覆部分的相互作用褥虱分子对接的优纯舀标值 同时 在颈处理阶段 霹以摄握嬲格撼述 将结会口袋划分照格 结会区域内蛋白凄懿我震德存在弼格熹上方 便计算 2 3 3 分子对接中优化模型的建立 在基予结构的分子对接及虚拟筛选过程中 优化模型的建立是其中关键的因素之 一个好的分子对接优化模型可以准确的评估分子间的作用力 从而确保了分子对接 豹正确往 在分子对接中 优纯模登又称抒分函数 用来正确的评估配体各种构象与鬣 囊霞分子之翅亲嚣力 弱孵终必构象甓化过鬈豹适馕丞数 势将羲测懿瑟俸分子瓣j 奄象 进行打分排序 对于优化的结果起麓决定性的作用 在蛋囱质与配体分子的结含过稔中 蕴含着大蹙的相互作用 其中包括描述分子间 碾弓i 及j 舞的范德华相互作用 与舔子电荷有关的静电作用 与周围水分子有关的溶剂 位效应 裁键撵罱 以及结舍 逑程串的瘸变等毽素 这臻嚣豢联合作爱 爱得蛋蠢覆一 配体缝合过程中产生能量的变化 在众多形态各异的描述分子对搂过稷的优化模型中 自由能微扰法 是最为准确的 种 它严格的计算既体与蛋囱质乏间的结合亲和力 但由予这一过程将耗费大量的计 冀酵阕 辫子制药遘程嚣期大麓模酌舞选来说并不逶尾 在过去的十年里 鸯了搽罨抉速 猿确懿计算结会爨由毙携饯亿模型 诲多手段耱 方法应运而生 且前的分予对接优化模型可以根据评价的方法分为基予力场 基予经验 和基予知识的优化模型三类 基于力场豹优纯横墅巍嘲 多数采用矗疆酞和c h a p 蕊力场的 键相互作用 将蛋自 发一瓤体终会叁由戆近似海范德毕冬势电楣蔓作震豹趣秘 燕公式2 1 肚搿专一专 3 3 2 0 哿 汜 其中 白为配体分子中原予f 与受饽分子中原予 之阉的距裹 差泸彩为夔德华参 数 高6 为范德华力排斥及吸引指数 采用l e n n a r d j o n e s6 1 2 势函数 0 啦表示 琢j 与原予 的点电荷 口为介电常数 3 3 2 是将静电势能转化成标准单位 k c a l m 0 1 豹茵子 蕊德华摆蔓作用由l e r m a r d j o n e s 势霹数诗舅霉裂 癸龟提蔓终是照壶与距蔫耀美 大连理王大学嫒 尊啦 q 文 的介电系数的库仑公式计算得到 基予力场的打分函数 由于优化模型棚对俺单 因此 计算速度较高 同时可以将蛋白质的能量预处理在网格点上 因此提高了计算速度 在 器前的分子对接软件串商着广泛的应弄j 僵是由于羞予力场的打分函数只考虑了范德华 及势电嘏互佟用 瓣结会过程孛熬其它作罴考虑熬不是是影翡它对羧精度熬主簧暴霆 在处理一些疏水性原子或含簿大量氢键的分子对接时 力场打分函数的结果劳不理想 基予经验的优化模型 更加细致的将分子对接中的结合自由能通过不同作用项的 加和来获得 其中每项前面的权系数由蛋白质一既体的训练集训练得到 这些作用项通 豢溺盖了结会过程孛毖较重要懿鬣键 离子援互作用 蘸承 筝弱及结合过程孛豹缡变等 互补相关项 每一项作用都人为绘出了显式的经验公式 毛汹 a g z 识 弓 q 2 i 其中 每个 是醚体坐标蜀辐蛋臼覆受体受标 的黼数 矗g 为第f 顶的权系数 衡如 早期抟经典经验模整s c o r e 8 辩采用 耋5 令蛋鑫覆一配傣复合貔作必调练集 奄捂了氢键 盐携 琉水效应和溶解熵等项 具体模型表迭式失 a 镪 豳搭 a g o a c 静 厶焉妇 矗g k 必a 跫 6 7 2 3 嬲知l i a g r s n r o t 经验优纯横螫瞻确豹箍述了绪合过程串豹各作焉颂 考虑的更加全面具体 但是由 于各终用项验复杂性 嚣蔻对于掾爆瑷豹接述蒡没毒统一戆标准 嚣就缀难慰经验努分 函数的准确性做出标准的评判 而且由于经验优化模型对予权系数的训练集选取有较强 的依赖性 因此模挺中的单独某一项很难重新组含成新的优化模型 同时训练榘的人为 经验经选取也使得优纯模垂对于不同类鹜的复合物计算精度差别很大 基予细识麴往纯模型嘶 圭要是采用概率统计踩理 将邑寨静蛋塞覆一鼯俸绫构 用反 b o l t z m a n 规则将原予间距离的概率分布转化为与距离鸯关的爨白质一配体鹱子 对间的作用能 因此 基于知识的优化模型其实是通过蛋白质一配体原子对作用的加和 模瓠重复实验的结构而并非鳐合能 具体禳蓬表达式为 她柑 艺鸣p 蠢 一黜掣 2 4 g 妒 矗 麓i 类型骧子与j 类嫠原予之简的平均力的势能 将所有蛋囱质一配体的原予对 耘l 箨掰有静类燮i j 之溺静律焉力船秘褥蜀 置燕波尔兹曼 b o l t z m a n n 常数 砌 是 距离为 处原予对 的归一化的概率 量 砖是归一化的参考概率 通过计算各种不问原予类型原子对的概率分布 这姥原子类型作用力根据分子环境 被定义 并将结合过耩孛译多吴裔复杂籀关缝两又无法被褥确建模豹结合效应期棱隐含 在橛率分布中 与其它两类优化模型棚比 知识优化模型理论上涵羲了缝合过疆中戆赝 有力 模型构成相对简单 应用范围较广 唯一不足在于由予所有作用都被综合考虑 因诧当 葬精度不离辩 缀难嚣分吴钵静葙蠢俸爱类掰 除了上述三类优化模型之外 近年还出现了一弛抒分策略 一数性挂分 c o n s e n s u s s c o r e 一致性打分并非一种新型优化模型 而是将多种优化模戮相结合 在对接时 采麓多释德亿横鍪分溺计算得分 取多数优亿模登缩栗优秀静 j 分子为盛叛筛选的酋标 化台物小分子 这种优化篡赂 可以从莱静稷度上减轻不适用的优化模型对该类型小分 子的影响 在降低假阳性方面效果显著 但同时 也会使一些阳性化合物丢失 同时由 于将各释优 二稹鍪豹烫蕺帮计算能力蓍作是均等静 绪莱有辩氇并不暴翔入意豫 2 4 常耀分子对接软体 乏4 1 g k d o c k e 3 是第一令分子辩接程澎 凌魉剥援恧鼗建立大学溅金出分棱扮k u n t z 缝子 1 9 8 2 年开发 最新版本为d o c k 6 1 目前是相对较为完整和被普遍认可的通用分子对接 程序 d o c k 4 0 汗始考虑配体的豢性 采用a 惦e r 力场进行基于力场的分子对接优化模 型黪建立 攫索算法袋曩萃缝形方法 更高的叛本孛 撬莛了分子豹结擒莠霹虢实现并 行化处理 d o c k 能自幼地模拟配体分予在受体活憾点地作用情况 并把理论预测最佳的 方式记录下来 而且改方法可以对配体的三维结构数据库进彳予自动搜索 因此被广泛应 用予基于受俸络梅懿数据露搜索熬药秘设谤串 势取缮了成功 2 4 2a u t o d o c k a u t o d o c k 嗍是由s c r i p p s 研究所o l s o n 小组开发的 最额版本为a u t o d o c k 4 0 1 采用模拟退火和遗传算法等搜索算法来寻找受体和配体的最佳的结合位簧 优化模型采 用拳经验静势笺专 冀方法 蕊谣豹半经验势缝诗算方法楚综合经验势能醺数秽力场抒分 函数的多目标优化计算方法 而在搜索冀法的选撵上 早期a u t o d o c k 选择得是模拟退 火算法 后改为拉马克遗传算法 通过比较 拉马克遗传算法具有更高的计算效率 同 鞋 离叛本戆a u t o d o c k 还考瘩7 丈分子铡铙鹣柔经 大连理工大学硕士学位论文 3 分子对接中的优化方法研究 3 1 优化方法的基本理论 3 1 1 鼹优化方法的定义 最优化方法嘲是 i j 应用相当广泛的学科 在自然科学 社会科学 生产实际 工 程设计和现代纯管璞中有着重簧的实用价德 最优纯方法的实质 就是用数学的模型和 计算规的数僮计算鲍方法去寻找一令最佳戆选择 恧苓必列举和诗算黪毒哥辘豹选择 所谓的最佳往往表现为一个目标函数在满足一定约束条件下的极大和极小 由予入稍在生灞或者工作中 许多事情总希颦得到一个最佳静方案媛者状态 黼此 卡世鳃六十年代以来 最优化理论秘方i 麦迅速发震越来 愁经成为了 i j 薮兴豹学毒 并得到了广泛的应用 尤其是计算机技术的迅速发展 为最优化方法提供了更加广阔的 发最空简 剥用最优化的爨论秘方法勰决实际生产积叁然科学孛黪具体翘题 一般分失嚣令步 骤 1 建立数学模登 邵辩所要解决的具体 蠢题滋行分析研究 翻以简纯 形成最 优化闯题的数学描述 2 对问题进行数学加工和求解 遮个过程包括 将所得的最优化问题进行整理 和变换 使之蒇为荔于求解的形式 选择或提出解决该问题的适强的计算方法 编箭计 算程序劳上枧计算 分析计算续果 番其怒否霉擎会实鼯 3 1 2 最优化问题的一般形式 优化问题存在予各种不同的领域 它们各自有不同的机理 然而它们却在数学模型 上有一个显著相同静表达形式 舔阍题都可以表示成下述形式 r a i n 嗡 满足 g 2o 魂 痨 锈 lx 尸 而2 霹d k 醢 k l 乙 j 3 1 i 1 2 n 其中 力为优化的目标稻数 而魂 力 g j x 毛分别为等式约束 不等式约 束及鑫交置懿交诧蒗蚕 蕊秘分子对揍静霞豫攘鍪及冀法 3 3 最优 l 方法鹣分类 按照最优化问题的特点洲可将最优化问题分为 1 丽绥最优纯 或解析最优化 方法 就是把所研究酾掏越 例如 物理 力 学 化学和工程问题 用数学公式描述出来 然后用解析方法求其最优解 2 壹臻聂饶纯 或实验最饶能 方法 在菜些情况下 所研究豹对象本身酶梳 理尚不清楚 光法用数学方法描述 这时可设法在数学原理的指导下 赢接通过少量试 验 鬏据试验缔莱戆磁较瑟求箕最霞瓣 这释方法被称为直接簸优纯方法 它珂戳秀采 求解没有解析袭达式或解析式子很复杂的最优化问题 优选法就是解决这一类问题的重 要戆数学方法乏一 按照最优化模型的型式 可以分为 1 线性甄爨 l i n e a rp r o g r a m i n g 嘲 若 o 钆 上 g 都是x 的线性函数 则上述优化问题 3 1 称为线性规 翻翘鬏 篱写为 簿耀 臻麓瑟豹搽准形式 上 m i n 国 幺墨 3 2 i 毛麓 嬲 f 1 2 刀 线性规划在最优化方法中占有很鬟要的地位 这不仅是因为它本身可以解决好多 实际阉题 而爨也因为它是鹪决一些复杂最优化问题的基础 2 二次规翔 q u a d r a t i cp r o g r a m m i n g 嘲 在式 3 1 中 麓玩 x g o 均为x 驰线性函数 而 为x 螅二次黼数 则 上述阔题可称为二次黼划问题 简写为q p 问题 其标准形式为 r a i n 秘 妄石 h x 9 7 z 3 3 f8 罗 x b 1x 0 f l 幺 删 f 1 2 撑 3 非线性规划 n o n l i n e a rp r o g r a m m i n g 嘲 芬 00 l 铅辑 州 f l 在式 3 1 中 若函数厂 功 丸 x g c x 中至少有一个是x 的非线性函数 则 上述问题 3 1 成为非线性规划问题 常写作n l p 问题 显然二次规划问题是最简单 的一种非线性规划 一般的非线性规划问题 根据约束条件的情况可分为 i 无约束非线性规划问题 既没有任何约束条件限制的非线性规划问题 有时也 称之为无约束优化问题或简称为无约束问题 常写作 m i n 厂o z r 3 4 i i 约束非线性规划问题 即在 3 1 中 至少有一个约束条件限制的非线性 规划问题 有时也称之为约束优化问题或简称为有约束问题 4 整数规划 i n t e g e rp r o g r a m m i n g 嘲 在式 3 1 中 如果还要求某些设计变量或全局设计变量取非负的整数值 则上 述问题称为整数规划问题 常写作i p 如果所有的设计变量都要求取整数值 这类问题 称为纯整数规划问题或全整数规划问题 如果只要求部分设计变量取整数值 而其余的 设计变量为连续的非负变量 这类问题称为混合型整数规划问题 如果在整数规划问题 中 要求其中的部分设计变量或所有的设计变量取值为0 或i 这类问题称为0 i 规划 问题 5 几何规划嘲 几何规划由c z e n e r 在1 9 6 1 年首先提出 是作为解决工程中的优化设计问题而提 出的 在式 3 1 中 若目标函数和约束函数都是设计变量x 的广义多项式 即形如 式3 5 的函数 h月 删 q 兀矽 删 j t 其中 c 白可取任意实数值 而而 0 则称非线性规划问题 3 5 i 1 2 m 3 6 为几何规划问题 这里 g 工 均为x 的广义多项式 6 多目标规划嘲 多目标最优化的研究对象是 多于一个的目标函数在给定区域上的最优化 极小化或极 大化 问题 由于多个目 嗣g 个向量目标表示 因此 多目标最优化问题有时也叫 m 鬟 g n 目工 坩 向量极值问题 一般地 多目标最优化问题可归结为如下的多目标极小值模型 定义2 1 v m i n f x f i i f 2 i f i 7 也可写成如下形式 x c 五 3 7 m i n f i i k i m i n 毛 i i x 2 c 9 i 口 3 8 口 m i n 瓯 1 2 i t g j x l x 2 i 0j l p g k i 1 2 i 0k l q 模型中的v r a i n 表示向量极小化 即向量目标函数 i z c x 五 i 厶 x 7 中 的各个子目标函数都尽可能地最小化 多目标问题的解分为绝对最优解和p a r e t o 解 绝对最优解和p a r e t o 解之间有着本 质的差别 对于单目标优化问题而言 人们设法选取使这一问题在某种意义下达到 最 优 的方案 这个最优的方案通常是问题的全局最大值点或最小值点 但对于多目标优 化问题而言 绝对最优解就是关于所有的目标函数都是全局的最大 最小 值点 一般 不存在这样的解 在通常情况下 各个子目标有可能是相互冲突的 一个子目标性能的 改善可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护士编制专业面试题及答案
- 2024-2025学年高中政治 第2单元 第4课 第2框 文化在继承中发展说课稿 新人教版必修3
- 岷县气候地理题库及答案
- 文职专业技能试题题库及答案
- 团的专业考试题及答案
- 2.百分数(二)税率(教学设计)-2023-2024学年六年级下册数学人教版
- 洞口作业应急预案(3篇)
- 《11.动物的四肢》教学设计-2023-2024学年青岛版五四制科学二年级下册
- DB65T 4461-2021 羊螨病防治技术规程
- 2025年文化遗产数字化展示与传播的互动体验设计报告
- 智慧医院综合智能化规划设计方案
- 炎症性肠病的饮食护理措施讲课件
- 物业公司廉洁培训课件
- 铝合金门窗讲课件
- 人教版-2025秋七级道法上册-2.7.2 共建美好集体教学设计
- 社会责任CSR培训教材
- 脊柱外科入院宣教
- 2025至2030年中国成都市酒店行业市场发展调研及投资方向分析报告
- 医院“十五五”发展规划(2026-2030)
- 黑龙江学位英语考试试题及答案
- AI大模型驱动的智慧供应链ISC+IT蓝图规划设计方案
评论
0/150
提交评论