(教育技术学专业论文)进化算法在分子对接中的研究与应用.pdf_第1页
(教育技术学专业论文)进化算法在分子对接中的研究与应用.pdf_第2页
(教育技术学专业论文)进化算法在分子对接中的研究与应用.pdf_第3页
(教育技术学专业论文)进化算法在分子对接中的研究与应用.pdf_第4页
(教育技术学专业论文)进化算法在分子对接中的研究与应用.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(教育技术学专业论文)进化算法在分子对接中的研究与应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

天津师范大学硕十学位论文 摘要 计算机辅助药物设计加快了新药设计速度,节省了创制新药工作的人力和物 力。分子对接作为计算机辅助药物分子设计的重要环节和步骤,主要用来从化合 物数据库中搜寻与受体生物大分子有较好亲和力的小分子,发现全新的先导化合 物,提高药物分子设计的准确性与效率,降低药物设计前期的成本。搜索算法和 评分函数是当前分子对接研究的难点与热点,针对搜索算法,本文主要工作如下: 1 对分子对接中构象搜索策略的优化进行了研究与探索;利用最优化方法建 立了分子对接数学模型a u t o d o c k m o d e l ; 2 基于a u t o d o c k m o d e l 用克隆选择算法对a u t o d o c k 3 进行了改进,并用均 匀设计原理对克隆选择算法中的参数进行了设计,实现了a u t o d o c k c l a 分子对 接方法。 3 基于a u t o d o c k m o d e l 用免疫遗传算法改进了a u t o d o c k 3 ,实现了 a u t o d o c k l g a 分子对接方法。 4 为验证a u t o d o c k c l a 和a u t o d o c k l g a 的寻优能力,文章用p d b 蛋白质 数据库中七种蛋白质配体复合物对其进行了测试,并与a u t o d o c k 3 中对接方法 进行了对比。 a u t o d o c k c l a 和a u t o d o c k l g a 的7 组实验结果表明:相比a u t o d o c k 3 , a u t o d o c k c l a 寻优效果最好;a u t o d o c k l g a 的对接准确性和a u t o d o c k 3 中基于 拉马克遗传算法的分子对接方法相似,在对接时间上前者的要短于后者;而 a u t o d o c k 3 中基于模拟退火算法的对接效果最差;文中提出的a u t o d o c k c l a 和 a u t o d o c k l g a 在求解分子对接复杂优化问题时相比传统方法有较明显优势,算 法有一定通用性,对于教育资源优化,实参数优化,工程设计优化等复杂优化问 题求解亦有较高参考和借鉴价值。 关键词:分子对接,免疫遗传算法,克隆选择算法,均匀设计 天津师范大学硕士学位论文 a b s t r a c t c o m p u t e r - a i d e dd r u gd e s i g n ( c a d d ) i n c r e a s e st h ep a c eo fd e s i g n i n gn e v 矿d r u g , s a v e sh u m a na n dm a t e r i a lr e s o u r c e si n v o l v i n gi nt h en e wd r u g sc r e a t i o np r o c e s s m o l e c u l a rd o c k i n gi sr e g a r d e da so n eo ft h em o s ti m p o r t a n ts t e p so fc a d d , m a i n l yb e i n gu s e dt os e a r c ht h es m a l lm o l e c u l et h a to fg o o da f f i n i t yw i t hb i o l o g i c a l m a c r o m o l e c u l e sf r o m c o m p o u n dd a t a b a s e ,d i s c o v e r i n gn e wp a t e n t s o nl e a d c o m p o u n d ,a n dt h u si m p r o v i n gt h ea c c u r a c ya n de f f i c i e n c yo fd r u gd e s i g n ,a n d r e d u c i n gt h ep r e d r u gd e s i g nc o s t i nt h em o l e c u l a rd o c k i n gs t u d y , s e a r c ha l g o r i t h m a n ds c o r ef u n c t i o nh a v eb e e nt h em a j o rd i f f i c u l t i e sa n dh o tp o i n t s w eh a v e c o n d u c t e ds e a r c ha l g o r i t h mr e s e a r c hi no u rd i s s e r t a t i o n ,m a i nw o r k sa r ea sf o l l o w s : 1 e x p l o f j n gt h eo p t i m i z a t i o nt om o l e c u l a rd o c k i n g sc o n f o r m a t i o n a ls e a r c h s t r a t e g y ;c o n s t r u c t i n gan e wo p t i m i z a t i o nm o d e l a u t o d o c k m o d e l f o rt h e m o l e c u l a rd o c k i n gw i t ho p t i m i z a t i o nm e t h o d s ; 2 i m p r o v i n ga u t o d o c k 3w i t hc l o n a l s e l e c t i o n a l g o r i t h m b a s e do nt h e a u t o d o c k m o d e l ;d e s i g n i n gp a r a m e t e r sf o rc l o n a ls e l e c t i o na l g o r i t h m w i t hu n i f o r m d e s i g np r i n c i p l e ,a n di m p l e m e n t i n gt h ea u t o d o c k c l a ; 3 。i m p r o v i n ga u t o d o c k 3w i t hi m m u n eg e n e t i ca l g o r i t h mw i t ha u t o d o c k m o d e l a n da c h i e v i n gt h ea u t o d o c k l g a ; 4 i no r d e rt ov e r i f yt h eo p t i m i z i n ga b i l i t yo fa u t o d o c k l g aa n da u t o d o c k c l & w ec o n d u c tt e s t so ns e v e np r o t e i n - l i g a n d sc o m p l e xf r o mt h ep d bp r o t e i nd a t a b a s e a n d c o m p a r e t h er e s u l t sw i t ho n e sw eh a v eo b t a i n e df r o ma u t o d o c k 3 t e s t ss h o wt h a ta u t o d o c k c l ah a st h eb e s t o p t i m i z i n ga b i l i t y , a n d a u t o d o c k l g a sh a ss i m i l a rd o c k i n ga c c u r a c yw i t ha u t o d o c k 3u s i n gl a m a r c k i a n g e n e t i ca l g o r i t h m ,t h o u g ht h ef o r m e ro n ep e r f o r m sb e t t e rt h a nt h el a t t e r si nt e r mo f t i m e c o n s u m i n g a n o t h e ra u t o d o c k 3w i t hs i m u l a t e da n n e a l i n ga l g o r i t h mh a st h e w o r s tp e r f o r m a n c e 。a sf o rd o c ki s s u e ,b o t ha u t o d o c k l g aa n da u t o d o c k c l aa r e b e t t e rt h a nt r a d i t i o n a lg a m e t h o d s ,t h et w oa l g o r i t h m sa r eu n i v e r s a la n ds i g n i f i c a n tt o o t h e rc o m p l e xo p t i m i z a t i o np r o b l e m ,e g ,o p t i m i z a t i o no fe d u c a t i o nr e s o u r c e ,r e a l p a r a m e t e le n g i n e e r i n gd e s i g n ,e t c k e yw o r d s :m o l e c u l a rd o c k i n g , i m m u n eg e n e t i ca l g o r i t h m ,c l o n a ls e l e c t i o n a l g o r i t h m ,u n i f o r md e s i g np r i n c i p l e 独创性声明 本人声明所呈交於论文是我个入在导师指导下进行的研究 :作及取得的研究成粟。尽我 所知,除了文中特别加以标注和致澍的地方外,论文中不包含其他人已经发袭或撰写过的研 究成果,也不包含为获得:叁逮! 垂基盘茎或其它教育梳构於学位或证二强丽使崩过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 签名: 盏j 查豇日 学位论文版权使用授权书 本人完全了解天津师范大学有关保整、使用学位论文的规定,即:学校有权将学位论文 的全部或部分肉容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇 编以供蠢阅和借阅。同意学校向国家有关部门喊机构送交论文的复印f t - _ ;f l l 磁辙。 ( 保密的论文在解密后应遵守此规定) 签名:主灶导师签名: 日期: 天津师范大学硕十学位论文 1 1 研究背景及意义 第一章绪论 研究创新药物具有重大的社会经济效益,然而新药研发是一个高投入、低效 率的工作。据统计一种新药从筛选到成功上市,大约平均要花费1 4 年的时间, 中间过程的花费则高达2 0 3 5 亿美元,且这一费用将继续逐年增长【1 1 。另外, 据美国制药商协会( p m a ) 统计,研究中的化学药品能够进入市场的成功率非常低 ( 欧洲为4 3 1 7 :1 ,美国为6 1 5 5 :1 ) 。新药临床试验时问的延长,新药评审时间的增 加,使得新药上市后的有效专利期大大缩短,首次上市的新药,其平均有效专利 期已从1 9 6 0 年的1 2 年下降到不足6 年。由此可见,新药开发的风险在增加,上 市的数量在减少。 我国制药工业的规模居于世界前列,但新药创制能力却十分有限,医药产业 的形式非常严峻,就全新的化学药品而言基本上是空白。据有关数据显示,目前 我国医药工业生产的药品大约9 7 是仿制外国的品种,自己创新的新药仅占 2 3 ,中药出口额仅占国际中草药市场的3 左右,医药产业总体经济效益低 下,难以承受国际竞争的强烈冲击。造成这种状况的一个关键原因是缺少具有自 主知识产权的“重磅炸弹式的创新药物( 一般以年销售额大于5 亿美元为标 准y 2 1 。这就要求我国的医药界努力提高自主研发新药的实力,尽快成功研制一 批具有专利保护和国际影响的创新药品。而且,随着国际上知识产权保护的各项 法规在我国逐步实行,新药的研制己同益显现出其重要性和紧迫性。 面对新药研制这一耗费巨大而且效率低下的工作,迫切需要应用新理论方法 和新技术加以改进。在这种社会需求的强大推动下,药物设计逐渐发展起来,它 是药物研究过程中的一个重要阶段( 图1 1 ) 。药物设计作为独立和明确的研究领 域,始于上世纪6 0 年代,迄今只有4 0 余年。传统的药物设计( 图1 2 ) 从总体上 讲,具有很大的盲目性,缺乏成熟完善的发现途径。 在新药研制初期,由于缺乏有效的药物分子设计和筛选手段,导致了新药研 究进展缓慢。随着计算机技术、计算化学、分子生物学和药物化学的发展,药物 分子设计将传统的药物设计理论和数学上的最优化方法引入药物分子的虚拟筛 选中,建立有效的数学模型,利用计算机快速高效的特点,使得药物分子设计更 天津师范大学硕士学位论文 快捷、有效。进而使药物发现进入了理性的阶段,出现计算机辅助药物设计,如 图1 3 所示。这种计算机辅助药物分子设计大大减少了发现先导化合物的时间, 降低了药物丌发的成本【2 1 。 药物发现 样品获得 偶然发现 药物筛选 理论研究 药物设计 临床前研究 药学研究 约效学研究 一般药理研究 药物代谢研究 毒理学研究 图1 1 约物设计发展阶段 临床研究 临床应用 i 期临床研究 i i 期临床研究 临床应用 不良反应监测 图1 2 传统约物设计 2 天津师范大学硕士学位论文 1 2 计算机辅助药物设计 作为一种理性药物设计方法,计算机辅助药物设计( c o m p u t e ra i d e dd r u g d e s i g n ,c a d d ) 是在分子甚至电子的水平上考虑药物结构。c a d d 始于1 9 8 0 年 早期,是应用量子力学、分子动力学、构效关系等基础理论数据研究药物对酶、 受体等的作用的药效模型,从而达到药物设计目的。c a d d 综合并藉助了多学科 的先进技术、方法和成果,为理性药物设计提供了强有力的基本工具和手段。 c a d d 作为药物化学发展的重要分支【4 1 ,通过理论计算来研究受体生物大分 子上活性点部位的结构与性质、药物与受体结合的模式及相互作用、药物分子的 活性基团( 药效基团) 等掣2 1 。当今,随着人类基因组计划的完成、蛋白组学的迅 猛发展,以及大量与人类疾病相关基因的发现,药物作用的靶标分子急剧增加、 己知三维结构的蛋白质的数量得到了飞速增长【3 1 。同时,随着计算机技术的迅猛 发展,计算化学、计算生物学及计算机辅助药物分子设计将发生革命性变化1 6 j 。 c a d d 的一般原理是,首先通过x 一单晶衍射等技术获得受体大分子结合部 位的结构,并且采用分子模拟软件分析结合部位的结构性质,如静电场、疏水场、 氢键作用位点分布等信息。然后再运用数据库搜寻或者全新药物分子设计技术, 识别得到分子形状和理化性质与受体作用位点相匹配的分子,合成并测试这些分 子的生物活性,经过几轮循环,就可以发现新的先导化合物。 药物设计方法主要分为两种:一种是从小分子结构出发,通过改造、修饰等 方法得到活性更好、毒性更低的新化合物,称为间接药物设计;另一种是从生物 靶标大分子结构出发,寻找、设计能够与它发生相互作用并调节其功能的小分子, 称为直接药物设计。间接药物设计包括定量构效关系( q s a r ) 和三维药效基团 模型方法,直接药物设计分为分子对接和全新药物设计两种方法。 在药物设计中,分子对接是基于受体结构药物设计的一类重要方法【4 j ,如图 1 4 。对接时将小分子配体放置于受体的活性位点处,并寻找最佳结合姿态,包 括其取向及构象,通过打分函数( s c o r i n gf u n c t i o n s ) 计算药物分子与受体结合部位 相互作用并评价结合的优劣,预测药物分子一受体的结合亲和力。通过分子对接 可以从已有的药物分子库筛选出有希望的先导化合物,避免了繁琐的化学合成试 验,从而大大的缩短了新药研发的时间。 3 天津师范大学硕士学位论文 图1 4 基丁分子对接的理性药物 1 3 本文主要研究内容与工作 本文在药物分子对接的基础上,研究探索了药物分子对接中的构象搜索策 略,提出了基于克隆选择算法和免疫遗传算法的分子对接构象搜索方法,运用均 匀设计原理对克隆选择算法中的参数进行了设计,并用来自p d b 蛋白质数据库 中七种复杂程度和化学性质不同的蛋白质一配体分子进行了实验。通过比较不同 参数的克隆选择算法的分子对接情况,文章选出了对接情况最好的一组参数做为 克隆选择算法的参数;并比较以克隆选择算法、免疫遗传算法、模拟退火算法和 拉马克遗传算法作为构象搜索策略的分子对接方法的寻优能力。通过与典型对接 软件结果的比较,从而验证了基于克隆选择算法、免疫遗传算法的构象搜索策略 的有效性及高效性。 全文共分为六章: 第一章阐述了药物分子设计的研究背景和意义,介绍了计算机辅助药物设 计,并在此基础上介绍本文的主要研究内容和工作。 第二章概述了分子对接相关理论知识及其国内外的研究现状,包括分子对接 原理的互补匹配原则、对接原理分类、分子对接中的构象搜索算法、典型的分子 对接软件等。 第三章从最优化方法方面对分子对接问题进行了深入分析,并对分子对接问 题进行数学建模,提出基于最优化方法的分子对接数学模型a u t o d o c k 。m o d e l 。 第四章介绍克隆选择算法和均匀设计原理,将克隆选择算法引入药物分子对 接中并对a u t o d o c k 3 进行改进,设计并实现了基于克隆选择算法的分子对接方 法a u t o d o c k c l a 。另外,用均匀设计原理对克隆选择算法的参数进行设计,通 过实验结果对基于不同参数的克隆选择构象搜索算法进行了比较与分析。 4 天津师范人学硕士学位论文 第五章用免疫遗传算法改进了a u t o d o c k 3 ,实现了基于免疫遗传算法的分子 对接方法a u t o d o c k l g a ;用p d b 蛋白质数据库中七种蛋白质一配体复合物对 a u t o d o c k 3 中两种对接方法、a u t o d o c k i g a 和a u t o d o c k c l a 进行了测试比较, 并对实验结果进行了分析。 第六章,总结和展望。 5 天律师范大学硕l j 学位论文 第二章分子对接概述 2 1 理论基础 生命科学基础研究结果表明:内源性活性物质或者外源性小分子药物( 厂泛 称为配体( 1 i g a n d ) ) 作用于机体内的靶杯( t a r g e t ) ,从而引起生物活性,而机体的酶、 受体、离子通道、核酸等为潜在的药物作用靶标或靶点,广义地称为受体 ( r e c e p t o r ) 。 分子对接通过将已知i 维结构的配体小分子化台物放入靶标分子受体的结 台位点,优化配体的位臀方向以及柔性键方向,汁算其b g i 物大分子的相互作 用能( 图21 ) 。它包括3 个帽互关联的部分:结合位点的识别,优化模型的建立 和有放的构象优化方法。大多数分子对接方法在事先定义的结合位点处进行构象 优化,结合位点可以通过比较不同配体的蛋白质晶体结构,或是通过与具有相似 功能的蛋白质进行比较。如果对蛋白质结合位点没有任何信息可以利用的话,可 以通过一些口袋识别软件来假定结合位点。而建立有效的数学优化模型( 确定分 子对接的打分函数) 和寻求有效的优化方法( 分子对接过程的构象搜索算法) 是 近年来分子对接研究的重点和难点。对接过_ 程中要集中考虑以下问题:配体与受 体如何匹配,如何确定最佳匹配,如何实现最佳匹配。 酗21 抑制荆d m p 2 3 2 4h i v 蚩一酶结合示意幽pf p d b c o d e = i b v e ) 分子对接方法的主要优点是:小分子配体基本上来自现有化台物数据库或制 药公司自己的法人数据库,而且其中很大一部分可以向供应商定购,如 m d i d a c d 2 l 中的所有化台物均可购买到。因此,分r 对接方法州以人人加快先 导化合物的发现进程。分子对接是从整体上考虑配体与受体的结合效果,能比较 好地避免其他方法中容易出现的局部作用好而整体结合欠佳的情况。 天津师范人学硕士学位论文 2 2 对接原理 分子对接是药物设计的主要方法,也是进行大规模先导物筛选的理想途径, 对接过程就是将小分子配体放置于受体的活性位点处,并寻求其合理的取向和构 象的过程。 从热力学的观点来看,药物一受体相互作用是一个综合平衡的过程,并且药 物还必须取得一定构象,以“适应”受体结合部位的“空腔 形状和构象变化。 同时,为配合与药物的结合,受体的构象也会发生相应的变化,这就是所谓的“诱 导契合”,一般须遵循以下互补匹配原则( 见图2 2 ) :几何形状互补匹配,静电作 用互补匹配,氢键作用互补匹配,疏水作用互补匹配,此即所谓的“锁钥原理”。 受体分子与配体结合的部位是蛋白质的某几个氨基酸残基,结合的方式包括静电 作用、氢键作用、范德华作用和疏水作用,其中静电作用、氢键作用和范德华力 控制药物一受体结合,疏水作用是药物一受体结合的驱动力,如果疏水作用强,药 物和受体才能排除水分子,相互结合在一起。 d :药物 r :受体 的静电椎互律用 n o 氢键相互作用 叫 酸水相互作用 图2 2 药物一受体互补匹配示意图 2 2 1 对接的优化方法 分子对接的过程就是寻找配体与受体结合在受体活性位点处的低能构象的 过程。配体与受体结合的构象有成千上万种,要从中找出低能构象不仅依赖于一 定的搜索策略,更要借助于各种优化算法的支持。搜索算法的性能直接影响分子 对接的效率与准确性。对接算法的c p u 时间消耗主要用于反复计算相互作用的 能量函数上,其计算复杂度可用函数的调用次数来计量。而且,分子对接技术是 近年来发展起来的虚拟筛选的核心技术。要成功筛选含有数以力计个分子的化合 7 天津师范大学硕士学位论文 物库,搜索速度更是至关重要的。在目前现有的对接程序中,构象搜索方法基本 可分为3 类【1 2 】:系统搜索( 片段生长法、构象搜索法、构象库法) 、随机搜索( 蒙特 卡罗法、遗传算法、禁忌搜索) 和确定性搜索( 分子动力学模拟) 。 1 系统搜索方法 系统搜索方法【1 3 j 尽可能遍历分子的所有自由度,分子组合的复杂度决定了 成千上万的自由度,要做到完全遍历是不可能的。大部分的系统搜索方法采用片 段生长法将配体逐步添入蛋白质的活性部位,例如将各种分子片段对接到大分子 的活性区域再将各片段联接起来,主要应用在全新药物设计中,另外一种情况是, 将小分子分成核心片段( 刚性部分) 及侧链( 柔性部分) 首先将核心片段对接到蛋 白质的活性位点,侧链部分通过分层增长的方法依次加上并进行构象优化。系统 搜索法在概念上遍历了搜索空间,不易陷入局部最优的区域,但是由于片段之间 的联结表达及搜索空间的复杂性,此种搜索方法需要耗费一定的计算时问 2 确定性搜索 确定性搜索从同一始态出发,到达同一终态,其缺点是经常陷入局部最小值 而不容易跳出势垒。分子动力学方法【1 5 1 是一种常规的模拟方法,尽管非常适合 生物分子的模拟( a m b e r ,c h a r m m ) ,却很少应用在蛋白质配体的对接中,究 其主要原因就是计算时间过长,不适合化合物库,特别是大规模化合物库的虚拟 筛选。随着计算机技术的快速发展,相信在将来会在分子对接中扮演重要角色。 3 随机搜索方法 随机搜索方法又称智能类算法,其特点为配体分子构象或代表配体分子的种 群是随机变化的,新生成的配体构象由预先定义的概率函数评估得到。随机搜索 算法具有适应范围广、实现简单、不需要计算导数等优点,是当前对接算法使用 最多的构象搜索算法。典型方法有模拟退火算法( s i m u l a t e da n n e a l i n g ,s a ) n 6 1 ,遗 传算法( g e n e t i c 舢g o r i t h m ,g a ) 【1 7 。1 8 1 ,禁忌搜索算法( t a b o o g o r i t h m ,t a ) 1 1 9 2 0 1 , 蒙特卡罗方法( m o n i ec a r l ,m c ) 【2 1 。2 2 】以及这些算法的各种修正变种【2 8 铷】。最近也 出现了一些其他随机算法,如随机聚点搜索算法【3 1 1 ,随机近似平滑( t o c h a s t i c a p p r o x i m a t i o nw i t ha m o o t h i n g ,s a s ) 算法1 3 2 l 、粒子群算法( p a r t i c l e s w a r m o p t i m i z a t i o n ,p o s ) 1 3 3 l 和量子群算法f 1 4 】等。 2 2 2 评分函数 要找出配体一受体结合在受体活性位点处的最佳构象,必须依赖于某种评价 8 天津师范大学硕士学位论文 标准,这种标准就是分子之间的结合亲和力。而且许多药物和其它生物分子的活 性都是通过与受体大分子之间的相互作用表现出来的,所以对受体和配体之间结 合自由能( b i n d i n gf r e ee n e r g y ) 的评价是基于结构的计算机辅助药物分子设计的 核心问题之一。精确的自由能预测方法能够大大提高药物设计的效率。在过去的 2 0 年中,随着受体一配体相互作用的理论研究以及计算机辅助药物分子设计方法 的快速发展,自由能预测方法的研究受到了越来越多的关注。 在蛋白质与配体分子的结合过程中,蕴含着大量的相互作用,其中包括描述 分子问吸引及排斥的范德华相互作用、与原子电荷有关的静电作用、与周围水分 子有关的溶剂化效应、氢键作用、以及结合过程中的嫡变等因素。这些因素联合 作用,使得蛋白质一配体结合过程中产生能量的变化。 在基于结构的分子对接及虚拟筛选过程中,配体分子与受体大分子之间结合 自由能通过打评分函数来确定。打分函数用来币确评估配体的各种构象与蛋白质 分子之间的亲和力,同时作为构象优化过程的适值函数,对预测的配体分子的构 象进行打分排序,对优化的结果起着决定性的作用。所以一个好的打分函数可以 准确的估计分子之间的作用力,从而确保分子对接的正确性。 在众多分子打分函数中,自由能微扰方法【2 3 】是最严格的结合亲和力的计算 方法,但是会花费大量的计算时间,一个配体一受体复合物可能要花费几分钟到 几个小时。对于针对大规模数据库进行虚拟筛选的药物设计来说,显然难以胜任, 因此在分子对接方法中很少采用自由能微扰的方法进行结合亲和力的计算。只有 那些能够快速、准确地计算配体与受体问结合亲和力的方法,才适合分子对接的 需要,尽管相对于计算结合自由能要显得粗糙。 目前常用到的用于确定受体一配体近似结合自由能的打分函数主要有以下三 种:基于物理的能量函数、经验函数、基于知识的函数。 基于物理的能量函数【刈是利用“热力学主方程,进行自由能预测,将蛋白质一 配体结合自由能近似为范德华与静电相互作用的和( 见公式2 1 ) 。 e = 耋r e c ( a u _ 一鲁- 3 3 2 0 哿】 p 1 , 其中,r i i 为配体分子中原子i 与受体分子中原子j 之间的距离;a i i ,b i j 为范德 华参数;a ,b 为范德华力排斥及吸引指数;q i ,q i 表示原子i 与原子j 的点电荷;d 为 9 天津师范大学硕士学位论文 介电常数;3 3 2 0 是将静电势能转化成标准单位( k c a l m 0 1 ) 的因子。范德华相互作 用由l e n n a r d j o n e s 势函数计算得到,静电相互作用则由与距离相关的介电系数 的库仑公式计算得到。 基于物理的打分函数,优化模型相对简单,计算速度较高,同时可以将蛋白 质的能量预处理在网格点上,进一步提高计算速度。但是由于基于力场的打分函 数只考虑了范德华及静电相互作用,对结合过程中的其它作用考虑的不足是影响 它对接精度的主要原因,在处理一些含有疏水性原子或大量氢键的配体一受体复 合物对接时,力场打分函数的结果并不理想。 经验打分函数【3 7 ,3 8 l 把结合自由能分解为不同的相互作用能量项,并为各项赋 予不同的权重,这些权重通过一组训练集并利用统计方法来得到。经验打分通常 包括氢键、离子相互作用、疏水相互作用及结合过程中的嫡变这些互补相关项, 每一项作用都人为给出了显式的经验公式( 见公式2 2 ) 。 g a 加咖_ a g r 厂f “,厂p ) ( 2 2 ) 其中,每个五是配体坐标,f 和蛋白质受体啦标知的函数,a g 为第f 项的权 系数。a u t o d o c k 3 0 提供了经验自由能计算方法【勰】来评价配体和受体分子之间的 能量匹配。这个半经验的自由能计算采用下面的函数形式( 公式2 3 ) ,结合自 由能来自于五部分的贡献: g 一g + a g h 嘀n d b 口1 了j d 口1 一矿j “g 妇雾器+ q 。3 a g , o ,n , o , 枷叫6 ,_ 峨k 瞄) 公式2 - 3 中的五项分别表示:范德华力,氢键的作用,静电的相互作用,柔 性键对结合自由能的贡献以及疏水作用。其中每项的a g 都是半经验参数,通过 拟合得到。指配体分子在对接后被约束的可旋转键的数目。经验结合自由能 的半经验参数通过3 0 个来自p d b 数据库中的蛋白质配体复合物训练集的训练 1 0 一 玎万 玎| n c 一勺 生矿愣 , o e 咖 天津师范大学硕十学位论文 得到i 删。公式( 2 3 ) 中的静电相互作用、范德华相互作用的计算方法与公式( 2 2 ) 相同,只是每个计算出来的能量值需要乘上相应的权重系数a g 。 经验打分函数取样简单,计算量小,在药物设计中应用较多。但这类方法得 到的经验公式依赖于训练集的选择,对不同的体系具有不同的预测能力。 基于知识的优化模型【撑2 6 1 ,主要是采用概率统计原理,将已知的蛋白质一配 体结构用反b o l t z m a n 规则将原子间距离的概率分布转化为与距离有关的蛋白质 一配体原子对间的作用能。因此,基于知识的优化模型其实是通过蛋白质一配体原 子对作用的和,模拟重复实验的结构而并非结合能。具体模型表达式如下( 2 4 ) 。 鲋e 俐2 善4 峨坩n 错 q 4 a “是j 类型原子与类型原子之间的平均力的势能,将所有蛋白质一配体原 子对和所有的类型巧之间的作用力加和得到。是波尔兹曼( b o l t z m a n n ) 常数, g jr ) 是距离为,处原子对u 的归一化的概率,g ( ,) 是归一化的参考概率。知识 优化模型理论一t - _ 涵盖了结合过程中的所有力,模型构成相对简单,应用范围较广。 唯一不足在于由于所有作用都被综合考虑,因此当计算精度不高时,很难区分具 体的相互作用类别。 除了上述三类优化模型之外,近年还出现了一些其它打分策略,如一致性打 分( c o n s e n s u ss c o r e ) 1 2 7 1 和针对较难预测的o t h e r 类型的蛋白质复合物设计出的 特异打分函数【3 5 1 。一致性打分将多种打分函数相结合,在对接时采用多种打分 函数分别计算得分,取多数打分函数结果优秀的小分子为虚拟筛选的目标化合物 小分子。这种优化策略,可以从某种程度上减轻不适用的优化模型对该类型小分 子的影响,在降低假阳性方面效果显著。但同时,也会使一些阳性化合物丢失, 同时由于将各种优化模型的贡献和计算能力看作是均等的,结果有时也并不尽如 人意。 2 2 3 对接中结合位点的选择 配体与受体的作用部位( s i t e ) 且 j 结合位点是指受体或酶分子中一个特定的小 区域,一般位于受体或酶分子表面的凹穴中( 口袋) 。这个特定部位由少数氨基酸 残基的侧链基团所组成,它们在一级结构上可能相距很远,甚至可能在不同主链 犬律师范人乎硕+ 学位论文 上,但由于盘曲折叠的结果而在空间结构上十分相近,这样就与附近的其它残基 有序地排布成特定的空间结构。这个空间结构与配体形状互补( 相契合) ,并且具 有适宜的非极性环境,以利于基吲f b 】发牛静电互补,疏水互补等作用,使底物紧 紧嵌台柞这个特定部位上。结合位点的选择是个f 分复杂的过程,直接关系到 分子对接的结果优劣。山丁数据的数量十分庞大,凼此在选择结合位点时,大都 采片i 粗略划分结合口袋的方法。即将结合位点及其附近一定范到内的区域化为结 台口袋区域,通过计算配体小分子与结合口袋区域中的蛋白质部分的相互作用得 到分子对接的优化日标值。同时,在预处理阶段,町以根据网格【冽描述,将结 合口袋划分网格,结台区域内蛋n 质的性质储存在网格点l 方便训算。 2 3 对接方法分类 分子对接的过程就是寻找配体与受体结合在受体活性位点处的低能构象的 过程r 如图2 3 所示1 。按寻找配体与受体结合构象的方法,可将分子对接方法分 为三种情况:刚性对接,半柔性对接、柔性对接。 乡一囊汐 q ,q 裟黼q , 乡q 乡 图2 3 分子对接中的构象搜索过程 刚性对接指在对接过程中,研究体系的构象不发生变化。刚性对接适合考虑 比较大的体系,比如蛋白质一蛋白质以及蛋白质一核酸之间的对接,它的计算较为 粗略,原理也相对简单。 半柔性对接指在对接过程中,研究体系尤其是配体的构象允许在一定的范田 内变化。半柔性对接方法适合于处理小分子和大分子之间的对接。在对接过程中 小分r 的构象一般是可以变化的但大分亍二比如莘| ! i 酶则被认为是刚性的,由于小 分子相对较小,凼此在一定程度考察柔性的基础上,还町以保持较高的计算效率。 在药物设计中尤其在基于分予对接的数据库搜索中,一般采用半柔性的分子对 接方法。 天津师范大学硕十学位论文 柔性对接指在对接过程中,研究体系的构象基本是可以自由变化的,柔性对 接方法一般用于精确考察分子之间的识别情况,由于在计算过程中体系的构象是 可以变化的,用此柔性埘接耗时较长。 根据分子对接在药物设计中的朋途可将分予埘接分为两类:细致对接和粮略 对接。 细致对接用于改造或设计配体分子,对精度要求较高,如考虑较多的分子柔 性、溶剂作用时,有时还需要对亲和性做出估计。细致对接对速度的要求不很严 格通常一次对接计算在几个小时内完成。 粗略对接用于对化台物数掘库的筛选,从中找出可能与受体结合的化合物, 通常需对至少1 0 5 个小分子的数抛库进行对接过虑筛选。为了在合理时限内完成 这样规模的计算,必须以很快的速度完成对单个小分子的对接。当然,这要以牺 牲一些精度为代价。假定对接整个数据库的可接受合理时限为1 0 6 ( 约两周) ,则 对单个小分子的对接时间平均只有1 0 s 。 酗2 4 对接中的分子厢格表达” 2 4 分子表达 受体生物人分子和配体的表达是评估分子对接方法的一个重要因素,分子的 表达形式某种程度上决定了分子对接方法采用何种优化方法。对接中的优化表达 大致可以分为三种:原子、表面、和网格。 原子表达通常用在按照真实势函数进行分子对接时,它是分子表达中最准确 的一种,但由于其计算的复杂性故常用在分子对接过程最后的排序过程。基于 表面的分子对接是非常典型的,常用在蛋白质蛋白质对接中。与原子表达相比, 分子表面的计算极大地降低了计算的复杂性,提高了算法的速度。分子对接的两 格表达( 见图2 4 【“】) ,可以看作是分子对接的预处理过程,它用计算机技术将靶 天津师范大学硕士学位论文 标分子的结合位点区域划分成正方体网格,受体的物理化学性质被预先存储在网 格点上,网格文件只需计算一次,在计算得分时可重复读入计算,因此大大加快 了对接速度。 2 5 常用分子对接软件 2 5 1d o c k d o c k 是第一个分子对接方法,由加利福尼亚州立大学旧金山分校的k u n t z 组于1 9 8 2 年开发,最新版本为d o c k 6 1 ,目前是相对较为完整和被普遍认可的 通用分子对接方法;d o c k 4 0 丌始考虑配体的柔性,采用a m b e r 力场进行基 于力场的分子对接优化模型的建立,搜索算法采用单纯形方法;更高的版本中, 规范了分子的结构并可以实现并行化处理。d o c k 能自动地模拟配体分子在受体 活性点的作用情况,并把理论预测最佳的方式记录下来。而且该方法可以对配体 的三维结构数据库进行自动搜索,因此被广泛应用于基于受体结构的数据库搜索 的药物设计中并取得了成功。 2 5 2a u t o d o c k o l s o n 等人充分考虑了配体的柔性,设计了将柔性配体对接到受体分子上 的a u t o d o c k 程序。该程序可用于预n d , 分子配体与生物大分子的相互作用。最 新的版本为a u t o d o c k 4 0 1 。在1 0 和2 0 【1 6 】版本中,能量匹配打分采用简单的 基于a m b e r 力场和非键相互作用能。非键相互作用来自于三部分的贡献:范德 华相互作用,氢键相互作用,以及静电相互作用;构象搜索策略采用了模拟退火 算法。在h u t o d o c k 3 0 【2 8 1 用半经验的自由能计算方法( 公式( 2 3 ) ) 来评价受体 和配体分子之间的匹配情况,构象搜索策略分别采用了普通的遗传算法和拉马克 混合遗传算法。在a u t o d o c k 4 0 1 【3 3 1 打分函数考虑了更多的柔性键,构象搜索 策略使用的是粒子群算法。 1 4 天津师范大学硕十学位论文 第三章基于最优化方法的分子对接数学模型建立 3 1 最优化方法的基本理论 最优化方法1 7 1 是一门应用性很强的学科,在自然科学、社会科学、工程设计 和现代化管理中有着重要的实用价值。最优化方法的实质,就是用数学模型和计 算机数值计算方法去寻找一个最佳的选择,而不必列举和计算所有可能的选择, 所谓最佳往往表现为一个目标函数在满足一定约束条件下的极大和极小。 最优化方法研究某些数学上定义问题的最优解,即对于给出的实际问题,从 众多的方案中选出最优方案。优化方法实质上就是运用计算机高质量高速度地完 成设计方案的“评价一再设计”的过程,是计算机辅助设计的核心技术之一,进 行最优化主要有两方面的工作:第一方面,将实际要解决的问题数字化、模型化, 使之成为标准的最优化数学模型;第二方面,将最优化模型的求解方法用计算机 实现,通过计算机来找到要求解的实际问题的最优化答案。 优化问题存在于各种不同的领域,虽然它们各自有不同的机理,然而它们却 在数学模型上有一个显著相同的表达形式,即问题都可以表示成下述形式( 3 1 ) : m i n f l 、n h t o ) 一0 , g ,o ) 0 , 工f ( ”) 苫x j 石f ( 工) , 其中,f ( x ) 为优化的目标函数,而玩 ) 、g , ) ,墨分别为等式约束、不等 式约束以及自变量的变化范围。 按照最优化问题的特点【删可以将最优化问题分为间接最优化方法和直接最 优化方法。间接最优化方法是将所要研究的问题用数学公式描述出来,然后再用 解析方法求其最优解。直接最优化方法又称试验最优化,在某些情况下,所研究 的问题不能直接用数学公式进行描述,这时可以设法在数学原理的指导下通过少 量的试验,根据实验的结果比较从而求出问题的最优解。直接最优化方法可以解 析没有解析表达式或解析式很复杂的最优化问题,优化法就是解决这类方法的重 要的数学方法之一。 按照数学模型,最优化方法可分为线性规划法【4 7 ( l i n e a rp r o g r a m m i n g ) ,非 1 5 k, , “ , 2 2 乙 , , ,j 1 1 “ 戋啦 限u k 、 天津师范大学硕十学位论文 线性规划( n o n l i n e a rp r o g r a m m i n g ) i 4 9 1 等 除了上述优化问题的分类方法之外,按照优化问题的求解算法,还可以将最 优化问题分为: ( 1 ) 直接法:在无法得到或者很难得到目标函数对设计变量的灵敏度信息时, 传统的解决方法是基于直接搜索的。也就是直接计算目标函数值,比较目标函数 值,并以此作为迭代、收敛的依据。直接法种类很多,如穷尽法,即遍历所有可 能解,通过比较得出最优解,该算法虽然能保证得到全局最优,但效率相当低, 让人无法忍受。 ( 2 ) 梯度类方法:利用目标函数和约束条件的函数梯度信息,达到迭代、收 敛的目的。这类算法速度快,效率高,例如线性规划或者序列二次舰划等,但需 要借助于灵敏度分析。 ( 3 ) 智能式搜索算法:该算法都是以一定的直观基础而构造的算法。算法种 类很多,例如模拟退火算法、神经网络算法、遗传算法等等。这些智能类算法, 多通过模拟自然界中的法则,将其运用到最优化问题的求解中,针对目标函数较 复杂的情况进行求解并具有较好的可移植性,因此在各领域得到了较广泛的应 用。由于智能类算法对目标函数优化模型的限制较少,可以对常规方法无法求解 的复杂问题进行计算,因此,在基于药物设计的分子对接中,主要应用的优化方 法多为智能类算法,文章利用智能类算法中的免疫遗传算法和克隆选择算法作为 分子对接的优化方法。 3 2 问题分析 分子对接是寻找配体分子与受体分子在受体活性位点处的低能构象的过程。 在对接的过程中有两个要素:评分函数和构象搜索算法。评分函数用于评价受体 分子与配体分子的结合自由能,构象搜索算法用于搜索配体分子在受体大分子的 合理的取向和构象,即配体小分子在受体大分子上的位置、方向以及柔性键的方 向。由于现实中的受体大分子与配体小分子都是柔性的,即都是可以旋转的、而 且有大量的柔性键。所以分子对接所涉及的搜索范围是非常巨

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论