(分析化学专业论文)蛋白质多肽对接方法研究及应用.pdf_第1页
(分析化学专业论文)蛋白质多肽对接方法研究及应用.pdf_第2页
(分析化学专业论文)蛋白质多肽对接方法研究及应用.pdf_第3页
(分析化学专业论文)蛋白质多肽对接方法研究及应用.pdf_第4页
(分析化学专业论文)蛋白质多肽对接方法研究及应用.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

(分析化学专业论文)蛋白质多肽对接方法研究及应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 分子对接方法目前已经成为研究分子间相互关系的重要方法,所谓分子对 接就是已知两个分子的三维结构,考察它们之间是否可以结合,并预测复合物 的结合模式。通常热力学上认为生物分子的稳定构象是自由能最低的构象,因 此,分子对接的目的就是找到能量最低的构象。科学家对生物大分子与小分子 化合物的对接方法进行了很多研究,并取得了很多研究成果,目前分子对接的 范围已经发展到了蛋白质与蛋白质之间的对接方法,但介于两者之间的蛋白质 与多肽的对接方法仍然不多。很多重要的生物功能都是蛋白质与多肽之间的相 互作用所造成的,例如蝎毒对人体离子通道的影响、h i v 一1 入侵人体正常细胞的 过程等等。而且目前新药开发已经从化合物发展到了多肽类药物,多肽类药物 的研发已经成为新药开发的重要领域,多肽与蛋白质之间的相互作用的研究为 其提供了理论基础。 本文对蛋白质与多肽的对接方法进行了研究,并将其应用在蛋白质一多肽相 互作用的领域中。 在方法研究上,本文将应用于生物大分子与化合物小分子对接的a u t o d o c k 方法改进用到蛋白质与多肽的对接中,一定程度上解决了蛋白质一蛋白质对接现 有方法的模型比较简单的问题,提高了对接计算的精确度。a u t o d o c k 相比目前 的蛋白质一蛋白质对接方法,具有更精确的半经验评价函数,而且还能够处理部 分柔性。在搜索算法上,本文比较了g a 和t p s o 两种优化搜索算法在蛋白质与 多肽对接问题上的优化能力,并选择了其中较强的t p s o 作为蛋白质一多肽对接 方法的搜索算法。 在应用领域上,本文将研究的蛋白质与多肽的对接方法应用到蝎毒一离子通 道相互作用和h i v - 1 病毒进入细胞机制两个方面,并且通过对这两个领域的研 究进一步针对h i v - 1 入侵机制,以蝎毒多肽为模版的h i v - 1 多肽类抑制剂的研 究做了部分工作。 关键词:蛋白质一多肽对接方法,蛋白质一多肽相互作用,蝎毒多肽,钾离子通 道,h i v 一1 入侵过程,h i v - 1 多肽类抑制剂 a b s t r a c t a b s t r a c t a tt h ep r e s e n tt i m e ,m o l e c u l ed o c k i n gh a sb e c o m ea l li m p o r t a n tm e t h o dt os t u d y t h er e l a t i o nb e t w e e nm o l e c u l e s m o l e c u l ed o c k i n gi st oe v a l u a t et h eb i n d i n ga b i l i t y a n dp r e d i c tt h ec o m p l e xs t r u c t u r ew i t ht h ek n o w n3 ds t r u c t u r e so ft w om o l e c u l e s i n g e n e r a l ,i ti sc o n s i d e r e dt h a tt h es t a b i l ec o n f o r m a t i o no fb i o - m o l e c u l ei st h el o w e s t f r e ee n e r g ys t a t ei nt h e r m o d y n a m i cp r i n c i p l e s s ot h ep u r p o s eo fm o l e c u l ed o c k i n gi s t og e tt h ec o n f o r m a t i o ni nt h el o w e s tf r e ee n e r g ys t a t e s c i e n t i s t sh a v ed o n eal o t r e s e a r c ha b o u tt h ed o c k i n gm e t h o do fp r o t e i n - l i g a n da n dh a v eg o tal o to f a c h i e v e m e n t p r e s e n t l y , t h er a n g eo fm o l e c u l ed o c k i n gh a se x t e n d e dt op r o t e i na n d p r o t e i n b u tt h e r ea r ef e wd o c k i n gm e t h o d sf o c u so np r o t e i n - p e p t i d e t h ei n t e r a c t i o n o fp e p t i d e p r o t e i ni st h er u l e so fm a n yi m p o r t a n tb i o l o g yf u n c t i o n s ,s u c ha st h e i n t e r a c t i o nb e t w e e l li o n - c h a n n e la n ds c o r p i o np e p t i d ea n dt h ee n t r yo fh i v - 1v i r u s m a n yp e p t i d e t y p ed r u g sh a v eb e e nd e v e l o p e da n dt h er & do fp e p t i d e - t y p en e w d r u gh a sb e c o m et h eh o td o m a i n i nd d d c t h e s t u d yo ft h ei n t e r a c t i o no f p e p t i d e - p r o t e i np r o v i d e st h et h e o r yf o u n d a t i o nf o rt h ea b o v e i nt h i sp a p e r , w ed i ds o m er e s e a r c hw o r kt od e v e l o pt h ed o c k i n gm e t h o do f p e p t i d e - p r o t e i na n da p p l i e dt h em e t h o di nt h ef i e l do fp e p t i d e - p r o t e i ni n t e r a c t i o n a u t o d o c kp r o g r a mh a sb e e na p p l i e di nt h ep e p t i d e - p r o t e i nd o c k i n g t h e p r o b l e mt h a tp r o t e i n - p r o t e i nm o d e li st o os i m p l ei ss o l v e do ns o m ee x t e n ta n d i m p r o v et h e a c c u r a t i o no fd o c k i n gc o m p u t a t i o n c o m p a r e dw i t ht h ec u r r e n t p r o t e i n p r o t e i nd o c k i n gm e t h o d ,a u t o d o c kp r o g r a mt h a tm o d i f i e db yu sh a sm o r e c o m p u t a t i o np r e c i s e s c o r i n gf u n c t i o na n dc a nc o n s i d e rt h ef l e x i b l et e r m t w o o p t i m i z es e a r c h i n gm e t h o d ( g aa n dt p s o ) a r ec o m p a r e d i n s o l v i n g t h e p e p t i d e p r o t e i nd o c k i n gp r o b l e ma n dt p s oi sc h o s et ob et h eo p t i m i z ea l g o r i t h mo f p e p t i d e - p r o t e i nd o c k i n gm e t h o d p e 砸d e p r o t e i nd o c k i n gm e t h o d i s a p p l i e di ns t u d i n gt h ei n t e r a c t i o no f s c o r p i o n ga n di o n c h a n n e la n dt h ee n t r ym e c h a n i s mo fh i v - 1v i r u s f u r t h e r m o r e ,w e h a sd o n es o m ew o r k so ns t u d y i n go fh i v - 1e n t r yi n h i b i t o rf r o ms c o r p i o np e p t i d e a b s t r a c t k e yw o r d s :d o c k i n g ,p e p t i d e - p r o t e i nd o c k i n gm e t h o d ,p e p t i d e - - p r o t e i ni n t e r a c t i o n , s c o r p i o np e p t i d e ,i o n - c h a n n e l ,e n t r yo fh i v - 1 ,h i v - 1p e p t i d e - t y p e i n h i b i t o r i i i 同济大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行 研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文 的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的 作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集 体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任 由本人承担。 签名:棚构 沙y 年弓 月己1 日 学位论文版权使用授权书 本人完全了解同济大学关于收集、保存、使用学位论文的规定, 同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版 本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、 扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供 本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有 关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前 提下,学校可以适当复制论文的部分或全部内容用于学术活动。 学位论文作者签名: 年月日 经指导教师同意,本学位论文属于保密,在弓年解密后适用 本授权书。 指导教师签名:钆 学位论文作者签名:矛7 桕指导教师签名:噫钆学位论文作者签名:矛7 桕 嘶年弓月叫日沙- 年弓月1 日 前言 前言 蛋白质与多肽间的相互作用 生物体的功能是通过生物分子之间的相互作用来实现的,因此研究生物分子 问的相互作用对于阐明各种生物功能非常关键。蛋白质与多肽之间的相互作用又 是其中的一个重要组成部分。随着功能基因组研究的推进,通过x 射线衍射、核 磁共振、中子衍射等技术,越来越多的蛋白质结构被测定,相应的蛋白质结构数 据库( p d b ) 中的复合物结构数据也在增加,这是充分研究各种蛋白与多肽相互 作用的一个基本前提。 在细胞中,蛋白质与多肽之间的相互作用是许多生理过程所起作用所依赖的 机制,也是病理过程发展的原因m 1 。蛋白质与多肽之间的作用受不同的环境条 件和细胞机制控制,例如温度、p h 、离子强度、酶等璐。9 1 。 根据蛋白质复合物构型的稳定性,所有的复合物可以分成暂时性复合物和永 久稳定复合物n 训。它们通过复合物构型中的蛋白质界面不同的结构和性质来区 分。永久性复合物的构型可能由连续的蛋白质折叠构成,因此它们表面的性质和 蛋白质核心或者界面区域相似n 。暂时性复合物界面的性质针对每一对互相作用 的蛋白质是不一样的,可以被看作是酶活性位置的相似物n 2 | 。 现在,蛋白质与多肽相互接触的区域被看作成为新药的靶点,许多生理学和 病理学细胞过程都依赖蛋白质和多肽之间的相互作用,这一作用可以受到外界化 合物影响。设计新的生理活性的化合物的现代方法由下面三个主要步骤组成:确 定有前景的靶点,研究该靶点的性质和相关小分子配合物的设计。因此我们要研 究蛋白质与多肽接触表面的结构和性质、蛋白质与多肽之间相互作用反应的热力 学动力学参数、接触蛋白质对的计算机预测方法和功能蛋白组确认方法以及能够 改变蛋白质相互作用的化合物设计的最新方法。 分子对接 分子间的相互作用,特别是蛋白质之间的相互作用已经成为后基因组生物学 的一个重要的研究焦点。在遗传学、生物化学或者生物信息学研究所形成的无数 假定的复合物中,它们能够或者可能与成千上万的基因产品相互作用。因此预测 大分子间的相互作用模式对于遗传学和生物化学实验具有重要的指导意义,但是 这些预测方法必须首先进行广泛的测试以确保其有效性,这些方法我们通常称作 对接算法。 前言 从1 9 6 4 年h a n s c h 和f u j i t a 经典定量构效关系方法起n 副,计算机辅助药物设 计( c 伽p u t e r a i d e dd r u gd e s i g n ,c a d d ) 已经有三十多年的历史了。近年来,随 着分子生物学和结构生物学的发展,许多具有药理作用的生物大分子的三维结构 已经被测定,在此同时,计算机科学也得到了长足的进步,不但发展了用于大规 模并行计算的超级计算机,而且图形工作站和个人计算机也有巨大的发展。在此 基础上,科研工作者也发展了用于化学和生物学研究的各种功能先进的计算方 法。因此,计算机辅助药物设计方法呈现了突飞猛进之势,已从原来的理论研究 发展成为一门实用型的学科,许多经过计算机设计的或计算机参与设计的药物已 经上市或进入了临床研究。计算机辅助药物设计已经和传统的药物设计一样,成 为了药物设计中最重要的手段之一。因此,近年来应用各种理论计算方法和分子 模拟技术,进行计算机辅助药物设计,已成为国际上十分活跃的研究领域n 铂。 蝎毒多肽与i l i v - 1 蝎广泛分布于除寒带以外的世界各地区。在我国已有记载的仅有1 5 种蝎, 其中最常见的是东亚钳蝎b u t h u sm a r t e n s i ik a r s c h ( b m k ) ,它毒性较弱,对人 没有生命危险;相反,是一种重要的药用动物,中药材“全蝎 有镇痉、熄风和 攻毒的作用n 射。 蝎毒素的主要活性成分是多肽,包括神经毒素和酶,神经毒素又是蝎毒引起 死亡和麻痹的重要物质。迄今为止已有上百种神经毒素相继被纯化。按其分子的 大小,它们可被分为长链和短链两大类。长链毒素一般由约6 0 ,- - - 7 0 个氨基酸组 成,含4 对二硫键,主要作用于可兴奋细胞的n a + 通道;短链神经毒素一般由2 8 - 4 0 个氨基酸组成,分子中含有3 或4 对二硫键,有的可以特异性作用于可兴奋 细胞膜上的不同亚型的k + 离子通道,有的可以特异性结合于胶质细胞瘤的c 1 一通道 或从胞质方向阻断重建的鼠小肠上皮的c 1 一通道,还有一些可以特异性地作用于 r y a n o d i n e 受体c a 2 + 通道n 创。 人免疫缺损病毒i 型( h i v - 1 ,即艾滋病毒) 感染已经成为日愈严重的世界 性难题。h i v l 入侵宿主细胞的过程分为两个步骤:受体识别和膜融合。h i v - 1 首先识别宿主细胞表面的特异受体蛋白并与之相结合。这种结合引发了病毒和宿 主细胞表面的复杂构象变化,导致h i v 一1 包膜与宿主细胞质膜相融合,使得h i v - 1 核心颗粒进入宿主细胞的原生质中。 在整个入侵过程中起核心作用的是t t i v 一1 包膜上的糖蛋白n 利。近年来对 h i v 一1 包膜糖蛋白进行了大量的研究,取得一系列突破性的进展,为理解包膜病 毒的入侵机理,探索a i d s 防治方法和设计抗病毒药物分子提供了宝贵的资料。 2 前言 主要研究内容 目前对小分子对接和蛋白质之间的对接已经有了很多研究成果,但是小分子 对接的范围具有局限性,蛋白质之间的对接方法具有模型过于简单等缺陷,本文 提出了介于两者之间的蛋白质与多肽的对接方法,针对性的解决蛋白质与多肽相 互作用的问题。研究了蛋白质与多肽对接方法中如何应用部分柔性处理方法和不 同优化方法在解决该类问题的能力,并且将该方法应用在多个蛋白质一多肽相互 作用的领域:钾离子通道一蝎毒多肽和g p l 2 0 一c d 4 。并且根据它们之间的联系, 利用蛋白质一多肽对接方法对蝎毒多肽在针对h i v 一1 进入机制的抑制剂设计中的 应用进行了研究。 本文对蛋白质与多肽的对接方法进行了研究,并将其应用在蛋白质一多肽相 互作用的领域中。 在方法研究上,本文将应用于生物大分子与化合物小分子对接的a u t o d o c k 方法改进用于蛋白质与多肽的对接中,一定程度上解决了蛋白质一蛋白质对接现 有方法的模型比较简单的问题,提高了对接计算的精确度。a u t o d o c k 相比目前 的蛋白质一蛋白质对接方法,具有更精确的半经验评价函数,而且还能够处理部 分柔性。在搜索算法上,本文比较了g a 和t p s o 两种优化搜索算法在蛋白质与多 肽对接问题上的优化能力,并选择了其中较强的t p s o 作为蛋白质一多肽对接方法 的搜索算法。 在应用领域上,本文将研究的蛋白质与多肽的对接方法应用到蝎毒一离子通 道相互作用和h i v 一1 病毒进入细胞机制两个方面,并且通过对这两个领域的研究 进一步针对h i v - 1 入侵机制,以蝎毒多肽为模版的h i v - 1 多肽类抑制剂的研究做 了部分工作。各章具体内容如下:第一章介绍了分子对接的原理、发展现状和现 有分子对接程序;第二章介绍了蛋白质与多肽对接方法;第三章介绍了分子对接 方法在钾离子通道与蝎毒多肽对接计算中的应用;第四章分子对接方法在g p l 2 0 与c d 4 多肽对接计算中的应用;第五章介绍了使用分子对接的方法针对h i v 一1 侵入机制相应的药物设计。 我们从四个方面对蛋白质与多肽对接的方法进行了探索,即改进了 a u t o d o c k 程序,使之能够用于计算蛋白质与多肽的对接计算;将小分子与大分 子的评价函数引入到蛋白质与多肽的对接,比起蛋白质与蛋白质对接的评价函数 相比更精确,也更适应于蛋白质一多肽的体系:考虑到多肽与蛋白质复合物形成 过程中分子构象的变化,我们比较了刚性对接与部分柔性对接的结果;多肽与蛋 白质的部分柔性对接是一个多变量的优化问题,我们比较了g a ( 遗传算法) 和 t r i b e - p s o ( 部落粒子群算法) 两种优化算法在解决这个问题上的能力。 第1 章分子对接 第1 章分子对接 分子对接的最初思想起源于1 0 0 年前e f i s h e r 的“锁和钥匙模型 ,即“一 把钥匙开一把锁 。e f is h e r 认为,“锁和钥匙互补识别的首要条件是它们在 空间形状上要互相匹配。当然分子对接比“锁和钥匙模型要复杂的多。配体和 受体的构想是变化的,而不是刚性的。受体和配体在对接过程中互相适应对方, 从而达到更完美的匹配。分子对接和“锁和钥匙”模型的另一个不同之处是分子 对接不仅要满足空间形状的匹配,还要满足能量的匹配。受体和陪体能否结合以 及结合的强度最终是由形成此复合物过程的结合自由能的变化决定的。 1 1 分子对接过程的相互作用力 分子对接过程中的作用力可以分为两种:强相互作用( 共价键) 和弱相互作 用( 非共价键) 。共价键是指维持分子的基本结构,是分子中或分子间的原子之 间结合的主要相互作用,决定着生物大分子的一级结构。非共价键是指分子间或 基团间弱相互作用的总称,在维持生物大分子的二级、三级、四级结构中以及维 持其功能活性中起着相当重要的作用,也是药物与受体对接的重要方式。在通常 情况下,非键相互作用包括: ( 1 ) 盐桥或称为离子键,它是正电荷与负电荷之间的一种静电相互作用。 吸引力f 与电荷电量的乘积( q 。q 。) 成正比,与电荷质点间的距离平方( r 2 ) 成反 比,在溶液中此吸引力随周围介质的介电常数增大而降低。在生理p h 下,蛋白 质中的酸性氨基酸( a s p 和g l u ) 的侧链可解离成负离子,碱性氨基酸( l y s 、a r g 和h i s ) 的侧链可离解成正离子。在多数情况下这些基团都分布在球状蛋白质分 子表面,而与介质水分子发生电荷一偶极之间的相互作用,形成排列有序的水化 层,这对稳定蛋白质的构象有着一定的作用。 ( 2 ) 氢键由电负性原子与氢形成的基团如n 叫和0 _ - h 具有很大的偶极 距,成键电子云分布偏向负电性大的重原子核,因此氢原子核周围的电子分布就 少,正电荷的氢核( 质子) 就在外侧裸露。这一正电荷氢核遇到另一个电负性强 的原子核时,就产生静电吸引,即所谓氢键。 x 竹 这里x 、y 是电负性强的原予( n 、0 、s 等) ,x h 是共价键,h y 是氢键。 x 是氢( 质子) 供体,y 是氢( 质子) 受体。判断形成氢键的准则:a 原子h 与y 之间的距离小于2 5 a ;b x 与y 之间的角度大于1 3 5 0 。 氢键在维持蛋白质的结构中起着极其重要的作用。可以在多肽主链上的羰基 4 第1 章分子对接 氧和酰基氢之间形成氢键,也可以在侧链与侧链、侧链与介质水、主链肽基与侧 链或主链肽基与水之间形成。大多数蛋白质所采用的折叠策略是使主链肽基之间 形成最大数目的分子内氢键( 如a 螺旋,1 3 折叠) ,与此同时保持大部分能成 氢键的侧链处于蛋白质分子的表面将与水相互作用。 ( 3 ) 范德华力范德华力包括三种较弱的作用力,即定向效应、诱导效应 和分散效应。定向效应发生在极性分子或极性基团之问。它是永久偶极间的静电 相互作用,氢键可被认为属于这种范德华力。诱导效应发生在极性物质与非极性 物质之间,这是永久偶极与由它诱导而来的诱导偶极之间的相互作用。分散效应 是在多数情况下起主要作用的范德华力;它是非极性分子或基团间一种范德华 力,也称为l o n d o n 分散力。这是瞬时偶极间的相互作用,偶极方向是瞬时变化的。 瞬时偶极是由于所在分子或基团中电子电荷密度的波动即电子运动的不对称性 造成的。瞬时偶极可以诱导周围的分子或基团产生诱导偶极,诱导偶极反过来又 稳定了原来的偶极,因此在它们之间产生了相互作用。范德华力是很弱的作用力, 而且随非共价键合原子或分子间距离( r ) 的六次方的倒数即1 r 6 而变化。当非 共价键合原子或分子相互距离太近时,由于电子云重叠,将产生范德华力。实际 上范德华力包括吸引力和排斥力两种相互作用。因此范德华力( 吸引力) 只有当 两个非键合原子处于一定距离时才能达到最大,这个距离称为接触距离或范德华 距离,它等于两个原子的范德华半径之和。虽然就其个别来说范德华力是很弱的, 但是范德华相互作用的数量大并且具有加和性,因此就成为一种不可忽视的作用 力。 ( 4 ) 疏水相互作用水介质中球状蛋白质的折叠总是倾向于把疏水残基埋 藏在分子的内部。这一现象被称为疏水相互作用或疏水效应。它在维持蛋白质的 三级结构方面占有突出的地位。疏水相互作用其实并不是疏水基团之间有什么吸 引力的缘故,而是疏水基团或疏水侧链出自于避开水的需要而被迫接近。当然, 当疏水基团接近到等于范德华距离时,相互间将有弱的范德华引力,但这不是主 要的。 蛋白质溶液系统的熵增是疏水相互作用的主要动力。疏水相互作用是熵驱动 的自发过程。就药物和受体而言,它们的非极性部分在体液中均为水合状态,即 被水分子所包围,当药物与受体接近到一定程度时,非极性部分周围的水分子便 被挤出去发生去水合现象,使置换出来的水分子成无序状态,因而体系的熵增加, 焓变值减少,使两个非极性区域间的接触稳定化,这种缔合就是疏水相互作用的 结果。 综上所述,配体一受体相互作用时须遵循以下互补匹配规则: 1 ) 几何形状互补匹配,原子紧密结合,使其具有较大的接触面积; 第1 章分子对接 2 ) 静电相互作用相互匹配,正负电荷相对应; 3 ) 复合物界面包含尽可能多的氢键,盐桥; 4 ) 疏水相互作用互补匹配; 5 ) 尽量避免在界面上出现没有成对的极性基团。 1 2 分子对接的步骤 一般情况下,分子对接方法可以分为三个阶段。首先将受体和配体分子处理 为刚体( 有些算法可能对分子表面进行了软化处理) ,搜索平动和转动六维空间, 同时利用简单的分子表面几何互补性打分,初步排除一些不合理结构;然后,用 精细的能量打分对结构作进一步的评价并排序;最后,对排序较靠前的结构进行 能量优化,允许氨基酸侧链和骨架的运动。另外,如果在分子对接前能够获得任 何关于结合位点的信息,那么可以在尽可能早的阶段利用它来缩小构象搜索的范 围,提高结构的成功预测率。 1 3 分子对接方法中的两个重要问题 分子对接的目的是如何找到底物分子和受体分子之间的最佳结合位置。因 此,分子对接会遇到两个重要的问题:搜索算法和评价函数,即如何找到最佳的 结合位置以及如何评价对接分子之间的结合强度。目前分子对接中的困难主要有 两个: 物理模型过于简单大多数对接算法中的打分函数都采用经验势函数,即把 体系的中相互作用看作是组成该体系两两相互作用的总和。原子与原子之间的相 互作用又简化为各种简单相互作用,如键伸缩能、键角扭曲能、二面角扭曲能、 范德华相互作用、静电能等的累加。这种把一个多离子体系量子力学水平上的相 互作用,以原子对之间相互作用的和来表示的方法显然是过于粗略了。同时,描 述分子表面的各种模型,如残基一球模型、立方格子模型和表面点模型等还不足 以表达蛋白质分子内部和外部的真实情况,对分子柔性的考虑都不够充分。 1 8 如何找到结合自由能曲面上的全局极小点通常认为生物分子的稳定构象是 自由能最低的构象。因此对接模拟的目的就是要找到与最低自由能相对应的构 象,在自由度较多的体系中寻找全局最优的问题,目前还是比较困难的问题。 1 4 分子对接方法的分类 根据不同的简化程度,分子对接方法大致可以分为三类: 刚性对接刚性对接指在对接过程中,研究体系的构象不发生变化,其中比 6 第1 章分子对接 较有代表性的是w o d a k 和j a n i n 发展的分子对接算法。刚性对接适合考察比较大 的体系,比如蛋白质一蛋白质以及蛋白质一核酸之间的对接,它的计算较为粗略, 原理也相对简单。 半柔性对接半柔性对接指在对接过程中,研究体系尤其是配体的构象允许 在一定范围内变化,其中比较有代表性的对接方法有k u n t z 等发展的d o c k 软件 以及o ls o n 等开发的a u t o d o c k 软件。半柔性对接方法适合于处理小分子和大分 子之间的对接。在对接过程中,小分子的构象一般是可以变化的,但大分子比如 靶酶则是刚性的。由于小分子相对较小,因此在一定程度考察柔性的基础上,还 可以保持较高的计算效率。在药物设计中,尤其在基于分子对接的数据库搜索中, 一般采用半柔性的分子对接方法。 柔性对接柔性对接指在对接过程中,研究体系的构象基本是可以自由变化 的,其中比较有代表性的方法有a c c e l r y s 公司发展的基于分子力学和分子动力 学的分子对接方法。柔性对接方法一般用于精确考察分子间的识别情况。由于在 计算过程中体系的构象是可以变化的,因此柔性对接耗时较长。 当然这只是一种简单的分类方法,在很多分子对接程序方法中,实际上采用 了多种处理方法。比如在a c c e l r y s 发展的a f f i n i t y 程序中,作者实际上把半柔 性和柔性的分子对接方法进行了结合。 1 5 现有分子对接程序 d o c k 是第一个分子对接程序,是由加利福尼亚州立大学旧金山分校的k u n t z 小组于1 9 8 2 年开发,最新版本为4 0 。d o c k1 o 考虑的是配体和受体之间的刚 性形状对接;2 0 引入了“分而治之 算法,提高了计算速度;3 0 采用了分子 力场势能函数作为评价函数;3 5 引入了打分函数优化以及化学性质匹配等。其 他的对接方法有m c m a r t i n 和b o h a c e k 的f l 0 9 8 ,s c r i p p s 研究所o l s e n 小组的 h u t o d o c k ,w e l c h 等人的h a m m e r h e a d ,r a r e y 和k r a m e r 等人的f l e x x 等等n 蚴1 。 近两年来,分子对接有着很大的进展,主要集中在分子的柔性方面,j i a n g z h u 等人的f d y c o b l o c k 主要是增加了蛋白质的柔性,d o c k4 0 和5 0 版本开始 考虑分子的柔性,并且利用逐步增长的结构构建来处理分子的单轴旋转。 n i c o d 6 m ep a u la n dd i d i e rr o g n a n 的c o n s d o c k 作了1 0 0 个蛋白质的测试集,6 0 的时候在第一次搜索得到了最好的解( r a n k0 ) 。而t r e e d o c k 主要在半经验能量计 算作了一些研究;w e n s h e n gc a i 等人用球谐函数表面校正来进行分子对接等等 2 3 一船】 7 第1 章分子对接 1 6 分子对接的应用 分子对接不仅在理论上有了很大进展,它也在许多方面得到了应用。首先主 要集中在新药发展上,利用分子对接设计新药,已经成为新药设计的一个主要途 径,许多利用分子对接而进行库搜索研制的新药已经上市。目前,已在艾滋病、 老年痴呆症、心血管等疾病的药物研制中得到了很大的应用。此外,分子对接在 酶的研究,蛋白质网络研究中也具有重要的补充作用。 8 第2 章蛋白质与多肽的对接方法研究 第2 章蛋白质与多肽的对接方法研究 分子对接是计算机辅助药物设计中的一个方法,这样分子对接研究的目的就 是药物开发,大部分分子对接软件着重于药物小分子和受体大分子之间的对接研 究,现在的研究结果表明生命活动中蛋白质或者多肽与蛋白质之间的相互作用有 着极其重要的作用,因此今天的一些重要而有效的药物大多为多肽。所以我们对 分子对接应用方面研究的重点是蛋白质与多肽之间的相互作用泅1 。 2 1 研究蛋白质与多肽相互关系的背景和意义 随着人类基因组计划的进行,大量基因被发现和定位,基因的功能问题将成 为今后研究的热点。大多数基因的最终产物是相应的蛋白质,因此要认识基因的 功能,必然要研究基因所表达的蛋白质。蛋白质的功能往往体现在与其他蛋白质 或核酸的相互作用之中。细胞各种重要的生理过程,如信号传导、细胞对外界环 境及内部环境变化的反应等,都是以蛋白质问的相互作用为纽带而进行的。近年 来蛋白质问相互作用的研究得到普遍的重视。 人体内真正发挥作用的是蛋白质,蛋白质扮演着构筑生命大厦的“砖块 角 色,其中可能隐藏着开发疾病诊断方法和新药的“钥匙川驯。目前,蛋白质与多 肽接触的区域已经成为寻找新的药物靶点的热点区域,很多多肽类新药进入研发 阶段。蛋白质与多肽的相互作用存在于机体的每个细胞的生命活动过程中,生物 学中的许多现象,如基因的复制、转录、翻译和遗传密码的分析与破译以及细胞 周期调节、信号传导、免疫反应和中间代谢等,均受到蛋白质问相互作用的调控。 因此只有使蛋白质与多肽间的相互作用顺利进行,细胞正常的生命活动才有保 障。 2 2 蛋白质与多肽对接方法研究中有待解决的问题 目前,大部分分子对接方法的研究着重于化合物小分子与生物大分子的相互 作用,与之相比,蛋白质与多肽的对接是一个非常复杂的过程。多肽也是蛋白质, 而蛋白质一蛋白质对接方法中还主要存在三大问题。首先分子模型过于简单。常 用的分子模型对分子柔性的考虑还不够充分。其次,评价函数过于简单。用半经 验力场虽然可以处理包含几千到一万个原子的体系,但结果仍然有一定的近似 性。另外,对于多自由度体系的复合物体系,如何找到结合自由能曲面上的全局 最优,比起小分子化合物更加困难。而多肽与蛋白质对接与目前研究的蛋白质问 9 第2 章蛋白质与多肽的对接方法研究 对接相比较又有很大的不同,直观上更类似于小分子和大分子之间的作用,多肽 可以像小分子化合物一样深入蛋白质大分子受体的内部与之相互作用,因此在对 接方法上不能像蛋白质问对接方法一样粗略口卜蚓。 2 3 蛋白质与多肽对接方法 针对上面提出来的蛋白质与多肽对接中遇到的问题,我们将a u t o d o c k 相关 参数进行改进以解决蛋白质与多肽对接问题,并且在其基础上发展了t p s o d o c k 的方法用于蛋白质与多肽的对接。我们从四个方面对蛋白质与多肽对接的方法进 行了探索,即将小分子与大分子的评价函数引入到蛋白质与多肽的对接,比起蛋 白质与蛋白质对接的评价函数相比更精确,也更适应于蛋白质一多肽的体系;对 a u t o d o c k 进行改进以适用于多肽一蛋白质体系,调整了格点计算参数中的惩罚能 量,这一能量用于惩罚配体化合物结合时候氢键的损失,是一个常数;考虑到多 肽与蛋白质复合物形成过程中分子构象的变化,我们比较了刚性对接与部分柔性 对接的结果;多肽与蛋白质的部分柔性对接是一个多变量的优化问题,我们比较 了g a ( 遗传算法) 和t r i b e p s o ( 部落粒子群算法) 两种优化算法在解决这个问 题上的能力。 2 3 1 评价函数 使用a u t o d o c k 3 0 5 的半经验自由能计算方法来评价受体蛋白与配体多肽之 间的匹配情况,计算采用下面的函数形式,结合自由能来自于以下几部分的贡献: a g = g 咖+ g 删+ g 咖+ g 嘲+ g 0 + a g , o l 在上式中,前四项为范德华力( 色散排斥力) 、氢键作用力、静电作用力和 背离实际键长和键角的偏差,g 。,为内部转动、全局转动和平动的限制,g 。为 疏水作用能。 应用w e s s o n 和e i s e n b e r g 的热力学循环方法,上面公式可以近似为以下包 含五项的公式: g = 否( 軎一纠+ g 否耶,( 争一争 g e l e c z “嘶q i q ,j i + + a g s o t 否 巧+ s j l 妙2 一 在这里右式的五项g 为与实验拟合得出的各项系数,可以通过已知配体一 蛋白质复合物的结合常数计算得到。右边第一项是配体与受体之间的v a nd e r w a a l s 作用对结合自由能的贡献;第二项是氢键作用对结合自由能的贡献;第三 项是静电作用对结合自由能的贡献;第四项是配体的内部旋转自由能被冻结引起 1 0 第2 章蛋白质与多肽的对接方法研究 的结合自由能变化;第五项是配体与受体结合时的去溶剂化效应对结合自由能的 贡献。 为了实现配体的内部旋转和去溶剂化效应对自由能的贡献,在程序计算时, 大分子在p d b q 格式的基础上,还要加上参数变为p d b q s 格式的文件。 a u t o d o c k 的快速能量计算是是通过由预先计算配体分子中每种类型原子与 生物大分子相互作用能的网格( g r i dm a p s ) 。在a u t o g r i d 过程中,大分子周围一 定体积空间被划分为三维网格,在每个三维网格点上放一个探针原子( p r o b e a t o m ) ,生物大分子和单个探针原子的相互作用能值赋给这个网格点。对配体中 的每种类型探针原子( 典型的有c 、0 、n 、h 等) 及带一个正电荷的探针电荷分别 计算吸引势能。原子与蛋白质的作用能就可以通过它所在网格周围8 个网格点的 原子吸引势能,由三线性插值得到;电荷和蛋白质的作用能,则先由周围8 个网 格点的电荷势能通过三线性插值再简单地乘上电荷数。这样就可以计算出配体与 生物大分子之间的作用能。 2 3 2a u t o d o c k 改进 a u t o d o c k 3 0 5 除了用上面的能量公式计算能量以外,还用了网格点能量常 数来修正能量公式,这一常数用来惩罚配体化合物结合时候的氢键损失。因此在 计算的过程中网格中每一个网格点都被加上了这一惩罚能量常数,氧原子探针网 格图的网格点能量常数为+ 0 2 3 6 k c a l m o l ,氢原子探针网格图的网格点能量常数 为+ 0 1 1 8k c a l m o l ,其它的均为0 。这些常数是a u t o d o c k 的作者假设小分子上 所有可以形成氢键的位置在水相中都形成氢键,然后从未结合状态改变成结合状 态时候氢键的丢失中自由能的变化来优化的。而多肽是一个大分子,与化合物小 分子有着很大的不同,在未结合状态下仅有表面部分会产生这种情况,内部结构 如果按照这样的罚分方式是很不合理的。因此需要对这一参数进行调整,本方法 中去除了这一不合理的罚分,并且将原有的具有罚分常数对接的结果与修改后的 结果进行了比较。 图2 - l3 p t b 配体对接计算结果各原子静电能分布 第2 章蛋白质与多肽的对接方法研究 图2 - 23 p t b 配体对接计算结果各原子范德华能分布 3 p t b 的配体是一个只有1 3 个原子的化合物小分子,图2 1 比较了方法改进 前后对其电荷能计算的影响,可以看出静电能变化不大。图2 2 比较了方法改进 前后计算得到的范德华能,可以看出变化也不是很大,但有一定的影响。静电能 和范德华能是对接自由能中的主要组成部分,因此说明在做化合物小分子配体对 接的时候加入罚分能量是合理的,而且有其理论根据。 图2 31 a g t - 1 b l 8 复合物对接计算结果配体上各原子电荷能分布 i a g t 是一个有3 5 2 个原子的“大配体多肽,从图2 3 可以看出方法改进前后 计算得到的电荷能分布基本一样,主要分布在与受体靠近的原子上面,而其他部 分波动较小,因为距离较远的原子间不会发生强烈的作用。 1 2 第2 章蛋白质与多肽的对接方法研究 图2 - 41 a g t - 1 b l 8 复合物对接计算结果配体上各原子范德华能分布 而从图2 - 4 可以看出改进前后方法计算出来的配体上各原予的范德华能量分 布有着很大的不同,未改进的方法计算得到的结果不仅接触区域原子波动较大, 而且其他所有的地方均有呈规律性的正能量分布。我们认为这是由于多肽对接时 候加入了罚分能量所造成的,而且其能量值与罚分能量常数相同,为+ o 1 1 8 和 + 0 2 3 6 。按照原子间相互作用的理论,两者距离较远的情况下相互基本没有作用, 因此大部分区域的能量应该为零。改进后的方法计算则达到了我们的目的,在接 触区域原子的能量分布于a u t o d o c k 方法基本相同,在非接触区域上为零。因此 可以看出我们对方法的改进去除了罚分能量对多肽对接的不合理影响。 表2 1 多肽蛋白质对接结果比较 从上表的比较可以看出未修改程序的结果为正值,而对接能量为正值的结果 说明受体和配体不能够结合,而修改后的程序得到的结果就是比较合理的负能 量。 2 3 3 搜索算法 我们实验室在优化搜索算法的研究上具有一定的特色,先后进行了遗传算法 和离子群算法的研究,并进行了改进。 遗传算法遗传算法是以自然选择和遗传理论为基础,将生物进化过程中适 第2 章蛋白质与多肽的对接方法研究 者生存规则与群体内部染色体的随机信息交换机制相结合的搜索算法。遗传算法 是一种群体型操作,它的操作对象是一群二进制串( 称为染色体、个体) ,即种 群( p o p u l a t i o n ) 。这里每个染色体都对应于问题的一个解。选择( s e l e c t i o n ) 、 杂交( c r o s s o v e r ) 和变异( m u t a t i o n ) 是遗传算法的三个主要操作算子。遗传算法 包含如下6 个基本要素: 1 ) 参数编码:传统的遗传算法通过编码将它们表示成遗传空间的基因型串 结构数据。 2 ) 生成初始群体:由于遗传算法的群体型操作需要,所以必须为遗传操作 准备一个由若干初始解组成的初始群体。初始群体的每个个体都是通过随机方法 产生的。 3 ) 适应度评估检测:遗传算法在搜索进化过程中一般不需要其他外部信息, 仅用适应度( f i t n e s s ) 值来评估个体或解的优劣,并作为以后遗传操作的依据。 4 ) 选择( s e l e c t i o n ) :选择或复制操作是为了从当前群体中选出优良的个体, 使它们有机会作为父代为下一代繁殖子孙。个体适应度越高,其被选择的机会就 越多。一般采用与适应度成比例的概率方法进行选择。具体地说,就是首先计算 群体中所有个体适应度的总和( f ) ,再计算每个个体的适应度所占的比例( f i f ) ,并以此作为相应的选择概率p s 。 5 ) 杂交操作:杂交操作是遗传算法中最主要的遗传操作。简单的杂交( 即 一点杂交) 可分两步进行:首先对种群中个体进行随机配对;其次,在配对个体 中随机设定杂交处,配对个体彼此交换部分信息。 6 ) 变异:变异操作是按位( b i t ) 进行的,即把某一位的内容进行变异。变异 操作同样也是随机进行的。一般而言,变异概率p m 都取得较小。变异操作是十 分微妙的遗传操作,它需要和杂交操作配合使用,目的是挖掘群体中个体的多样 性,克服有可能限于局部解的弊病。 基本的遗传算法是采用二进制数作为编码,在算法中需要采用映射和逆映射 操作。而实际应用中大部分问题是基于实数的,遗传算法在解决问题时需要时间 较长和应用有一些限制。为此,李通化等提出了数值遗传算法盼副,直接采用实数 作为染色体,并把遗传算法加以改动,取得了很好的效果。数值遗

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论