已阅读5页,还剩17页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 蛋白质空间结构的研究是蛋白质功能研究的必经之路,因为结构决定 功能。面对大量新发现的蛋白质,传统的用来测定蛋白质三维结构的实验 方法- x 光晶体衍射和n m r ( 核磁共振) 技术己经无法跟上脚步,必须 发展计算的方法去预测蛋白质的空间结构。 本文以世界上广泛使用的生物分子三维结构数据库p d b 为基础,利用 沈世镒教授提出的蛋白质主链的三角形拼接带模型,详细分析了蛋白质四 连子的空间结构。通过旋转变换等相关知识给出了四连子旋转角合成的 计算方法,并对理论计算的西c 角和实际空间结构中的西r 角进行了误差分 析。误差分析的目的是为了让我们能够更加清楚、更加深刻的认识蛋白质 的空问结构,为以后的蛋白质结构预测打下基础。 关键词:蛋白质结构分析,蛋白质主链的三角形拼接带,四连子, 旋转合成,误差分析 a b s t r a c t t h er e s e a r c ho f p r o t e j n s p a t i a ls h ”d c t u r cj st h eb a s eo f t h e r e s e a r c ho f p r o t e i n f u n c t i o n f o rt h es t r u c t u r ed e t e r m i n e st h ef u n c t i o n a sm o l ea n dm o r en e w p r o t e i n s h a v eb e e nf o u n d ,t h et r a d i t i o n a le x p e r i m e n t a lm e t h o d s o f m e a s u r i n g p r o t e i n s p a t i a l s t r u c t u r e s u c ha sx r a yc r y s t a l l o i dd i f f r a c t i o na n dn m r ( n u c l e a rm a g n e t i cr e s o - n a n c e ) ,c a nn o tk e e pu pw i t ht h ep r o d u c i n gs t e p s w em u s td e v e l o pc o m p u t a t i o n a l m e t h o d st op r e d i c tp r o t e i ns t r u c t u r e ,c o m b i n i n gw i t ht h ee x p e r i m e n t a ld a t a i nt h i sp a p e r , t h ea u t h o r a p p l y t h et r i a n g l eb e l tm o d e lo f p r o t e i n sb a c k b o n e , p r o p o s e db yp r o f s h i y is h e n ,t oa n a l y z es p a t i a ls t r u c t u r eo fp r o t e i nf o u ra m i n o a c i dr e s i d u e s ,b a s e do n 山ew i d eu s e d3 d _ s i x u c t o l ed a t a b a s ep d b t h ea u t h o r g i v e o u tt h ec a l c u l a t i n gm e t h o do f s y n t h e s i z i n gt h er o t a t e da n g l eb ya p p l y i n gt h er o t a - t i o nt r a n s f o r m a t i o n a f t e r t h a t ,t h ea u t h o rm a k e a ne l r o r a n a l y s i so n t h et h e o r e t i c a l v a l u e 圣口a n dt h er e a lv a l u e 圣ra n df i n do u tf o u rk e y r e a s o n st h a tl e a dt h e s ee r r o r s t h ea i mt oa n a l y z et h ee r r o r si st om a k eu st ok n o w p r o t e i ns p a t i a ls t r u c t u r eb e t t e r a n dl a yaf o u n d a t i o nf o rp r o t e i ns t r u c t u r ep r e d i c t i o n k e y w o r d s :p r o t e i n s t r u c l t u ta n a l y s i s t r i a n g l eb e l tm o d e o f p r o t e i n sb a c k - b o n e ,f o i 1 1 a m i n oa c i dr e s i d u e s ,r o t a t i o ns y n t h e s i s 。e r r o ra n a l y s i s 2 1 前言 蛋白质空问结构分析是生物信息学的核心课题之一。 研究蛋白质的功能需要深入了解它们的结构,特别是空间( 三维) 结 构,因为结构决定功能。生命的功能和它的结构,二者是统一的。有什么 样的结构就有什么样的功能,反之亦然。p e r u t z 对血红蛋白构象的深入了 解使他弄清了机体中氧和二氧化碳的运载过程。近十几年对肌肉蛋白的 三维结构的深入研究,使我们了解了肌肉收缩的机理。 蛋白质的三维结构完全由其氨基酸序列( 即一级结构) 决定。蛋白质 的结构预测的目标就是从蛋白质的一级结构出发,直接确定蛋白质的三维 结构。这是分子生物学的一个中心定理:序列决定构象。 随着人类基因组计划和其它基因组计划的顺利进行,成千上万的新的 基因和蛋白质产生了。弄清它们的功能就成为我们新的目标。众所周知, 蛋白质的空间结构十分复杂。蛋白质的三维结构为确定它的功能提供了关 键性的信息。至今为止,人们还无法有效的知道大多数蛋白质的具体空间 形态。传统的用来测定蛋白质三维结构的实验方法,例如x 光晶体衍射 和n m r ( 核磁共振) ,已经无法跟上序列产生的脚步,我们需要结合计算 的方法去预测蛋白质的空间结构。 为了能够更有效的分析和预测蛋白质的空间结构,沈世镒教授提出了 一种把蛋白质主链分解成三角形拼接带结构的方法,把蛋白质空间结构的 形态归为不同三角形平面之间相互转动的旋转角。由这些旋转角的大小基 本上可以决定蛋白质的空问形态变化。因为蛋白质的主链已经足以将蛋白 质的空间结构表现出来。所以我们可以暂时不考虑侧链的信息,这样可以 简化模型的复杂度。 本文的主要目的就是比较由这些旋转角旋转如来的蛋白质空间结构与 蛋白质本身自己真实的空间结构之间的关系,并对产生误差的原因进行详 细的分析。计算方法主要利用的是旋转群和旋转合成的有关知识。 本文第二节介绍了关于生物学中蛋白质分子结构的基本知识,第三节 介绍了沈世镒教授提出的蛋白质主链的三角形拼接带模型,第四节给出了 我们进行旋转角合成的计算方法,第五节列出了我们建立的四连子数据库 的部分数据结果,并进行了数据统计分析,第六节对产生误差的四个重要 原因进行了详细的分析,第七节是进一步的讨论。 本文的主要结果有:蛋白质四连子三角形拼接带模型中旋转角合成的 计算方法;蛋白质四连子空间结构数据库:蛋白质四连子结构计算结果的 误差分析。 4 5 2 预备知识 蛋白质是天然高分子化合物,是生命物质的基础。我们知道,生命活 动的基本特征就是蛋白质的不断自我更新。蛋白质是一切活细胞的组织物 质,也是酶、抗体和许多激素中的主要物质。所有的蛋白质都是由氨基酸 构成的。氨基酸目前已知的已经超过1 0 0 种以上但在生物体内作为合成 蛋白质的原料( 即天然氨基酸) 的只有2 0 种。它们都是a 一氨基酸,即 在。一碳原子上有一。个氨基,可用图2 1 里的化学式来表示: h l r c c o o h l n h 2 图2 - 1 氨基酸的化学结构式 其中,r 是氨基酸的侧面基团,它们是氨基酸中不参与肽键形成而 赋予氨基酸独特性的部分( 比如亲水和疏水,带电和不带电,有无极性 等) 。由2 0 种不同的侧面基团,形成2 0 种不同的氨基酸。 在2 0 种氨基酸中,有3 种氨基酸比较特殊,它们是甘氨酸g ( g l y ) , 脯氨酸p ( p r o ) 和半膀氨酸c ( c y s ) 。甘氨酸g 是唯一一个没有侧面基团 的氨基酸,为此它既不能和其他残基的侧链相互作用,也不能残生任何位 阻现象;脯氨酸p 是一个距氨基酸,它的n 原子在一个苯环当中,这直接 导致它有一些特殊的性质,比如p 很少出现在口一螺旋中:半胱氨酸c 中有 一个s 原子,它可以和另外一个半膀氨酸c 形成s s ( 二硫键) ,对蛋白 质的空间结构,特别是远程折叠,有着很大的影响。 一个氨基酸分子韵羧基与另一个氨基酸分子的氨基发生脱水反应而形 成的酰胺叫做肽,其形成的酰胺键称为肽键。形成过程如图2 - 2 所示: c hco h n h 2 - c o o hn h = 一l h 氯j l j c o o h 一 一 + 亡h 一- - - - - - - +一亡h e n h ;亡h 一 肤键 图2 - 2 肽键的形成过程 由多个a 一氨基酸缩合而成的肽称为多肽,通常把含有1 0 0 个以上氨基 酸具有一定功能的多肽( 有时是含5 0 个以上) 称为蛋白质。较大的蛋白质 可能会含有多条肽链。 5 蛋白质构象研究的开创人鲍林( p a u l i n g ) 和科里( c o r e y ) 在3 0 年 代后期的研究中提出了一个重要的结论,即蛋白质肽单位的刚性和共面 性。如图2 - 3 所示,肽单位中肽键键长为o 1 3 3 n m ,介于单键g 一的键 长0 1 4 9 a m 和双键c = 的键长0 1 2 7 n m 之间,具有部分双键的性质, 是刚性的。参与肽键的6 个原子构成了包含整个肽键的平面,被称为肽平 面。 图2 - 3 肽平面示意图 肽单位中除了肽键之外,还有两个重要的化学键:c :一e 和一c r q 。 这两个都是纯粹的单键,具有充分的旋转自由,使肽链折叠成各种各样的 空间形态。我们将它们对应的转角分别记为妒和咖,妒代表键c o c 的转 角,代表键一c 二的转角。如果每一个氨基酸残基中的妒和妒都已知, 则多肽主链的构象就完全确定了。 3 模型介绍 蛋白质结构是一个复杂的空间形态结构,用单纯的折线分析并不能完 全反映它的特征。为了能够更好的研究蛋白质的空间结构,沈世镒教授提 出了蛋白质主链的三角形拼接带模型。因为蛋白质的主链已经足以将蛋白 质的空间结构表现出来,所以我们可以暂时不用考虑侧链的信息,这样做 可以极大的简化模型的复杂度。 6 首先,什么是蛋白质的主链? 在每个氨基酸中,有三个重要的特殊原 子:n ( 氮原子) 、c ( 连接僦面基团的q 一碳原子) 和c ( 羧基中的碳原 子) 。当氨基酸结合成蛋白质时,这三个原子就依次连接,形成蛋白质的 主链。 我们记蛋白质主链的原子序列为: l = ( l ,a 1 ,a ,2 ,a 2 ,岛,a 。 其中m 为蛋白质一级结构的长度,a 为。一碳原子瓯的简写。将蛋白 质主链上的原子按次序依次用直线连接起来,形成一条链( 一段空间 折线) 。然后再将肌一g ( 1 m ) 、a j 一+ l ( 1 jsm 一1 ) 和瓯一a k + 1 ( 1 k m 一1 ) 分别连起来,这样就形成了图2 _ 4 中的蛋白 质主链三角形拼接图。 a n 3 n 2 a 2 图3 - 1蛋白质主链结构的三角形拼接图 蛋白质主链结构是由三种不同类型的三角形交替拼接而成,这些三角 形是: 挑a g ,a g l + l ,g m + l 件l “= 1 ,2 ,m 一1 ) 整个图形形成一个复杂的空间中的三角形拼接带,但是其中还是可以找到 。些规律。 在蛋白质主链的三角形拼接图中,有两类参数族:一类是弧长参数 族,另一类是转角参数族,有了这两类参数族,就可以完全确定蛋白质的 主链。 弧长参数族描述的是相邻原子间的距离,也就是拼接三角形的边长。 共有6 种不同类型的弧长,我们分别用随机变量1 ,r 2 ,”3 ,r 4 ,r 5 ,”6 来分别 7 代表6 种边眦a ,a q ,a 她+ 1 ,m g ,a + l ,c i a i + l 的长度,其中c i n + i 表示第i 个氨基酸中的碳原子和第 + 1 一个相邻氨基酸中的氮原子连接形 成的边a l 眦+ 1 和g a ,+ 1 也是如此。通过对p d b 数据库中的蛋白质进行 统计可以发现,这些边的边长都非常稳定,表3 - 2 是在2 0 0 3 年1 月版p d b 数据库中的统计数据: r l r 2 r 3 r 4r 5r 6 样本量 8 8 3 3 3 5 58 8 3 3 3 5 58 7 5 5 3 1 78 8 3 3 3 5 58 7 5 5 3 t 78 7 5 5 3 1 7 期望1 4 5 8 0 9 21 5 2 3 4 6 21 3 2 8 7 0 42 4 5 7 1 2 2 2 ,4 2 8 3 2 02 ,4 3 2 3 9 5 方差 0 0 0 0 2 1 20 0 0 0 2 9 8o 0 0 1 6 4 7o 0 0 3 0 8 2 o 0 0 2 2 6 2o ,0 0 2 1 1 7 标准差0 0 1 4 5 6 60 0 1 7 2 4 9o 0 4 0 5 7 70 0 5 5 5 1 4 0 0 4 7 5 5 70 0 4 6 0 1 5 表3 - 2 蛋白质主链弧长参数统计表 由此我们可以提出模型中的第一条假设:蛋白质主链的三角形拼接带 模型中所有边长均为常数。 转角参数族包含三种不同类型的转角: 1 a a i a l + 1 以向量a g 为旋转轴,绕平面肌a a 的旋转角妒; 2 妣+ 1 a + l g + l 以向量魁+ 1 a 件l 为旋转轴,绕平面g n i + i a i + l 的 旋转角西; 3 c ; 腿+ 1 a i + l 以向量旺n i + 1 为旋转轴,绕平面a g 瓤+ 1 的旋转 角。 由第二节的预备知识可知妒和币可自由转动,但是u 则几乎是一个平 面角。通过对p d b 数据库中所有转角u 进行统计,我们有 e ( u ) = 一0 0 0 5 2 3 6 ,v a r ( w ) = 0 0 2 7 3 5 3 其中e 表示期望,v a t 表示方差。因此我们可以作出模型中的第二条假 设:蛋白质主链的三角形拼接带模型中所有u = 0 ,即a g 她+ l a i + 1 四点 共面。 根据上面两条假设,如果一条蛋白质主链中的所有妒角和角都确定 了,那么这条蛋白质主链的构象就完全确定了。 我们把蛋白质主链结构看成是由- 系列三角形拼接而成的带子,如果 把每个三角形进行适当的旋转,将这个带子解开,使这些三角形最后都处 在同一个平面上,并且使相邻的三角形不重叠,这个平面图形就是蛋白质 主链结构的三角形拼接带的平面展开图,这个过程叫蛋白质主链的三角形 8 拼接带的平面展开。如果初始三角形的位嚣固定,那么整个主链平面展开 的位置是唯一确定的。这在参考文献【l 】中已有详细证明。展开后的主链结 构如图3 - 3 所示: c i 把 图3 - 3 蛋白质主链结构的三角形拼接带的平面展开图 反过来,由于旋转是剐性运动,我们也可以将一条平面展开的三角形 拼接带带还原成原来的空间结构。操作过程如下: 先在平面上画一条三角形拼接带,在各顶点上依次标上 1 ,a l ,c i ,2 ,a 2 ,岛,飓,a 3 ,q ,i v 4 ,a 4 ,q , 使得各边长满足 也a a 8 g 胍+ l n i c t a i 胍+ 1 g a i + 1 = e ( r 1 ) = e ( r 2 ) = e ( r a ) = e ( r 4 ) = e ( r 5 ) = 1 4 5 8 0 9 2 = 1 5 2 3 4 6 2 = 1 3 2 8 7 0 4 = 2 4 5 7 1 2 2 = 2 4 2 8 3 2 0 e ( r 6 1 = 2 4 3 2 3 9 5 由于三个边长固定之后,三角形的形状和大小就完全固定下来了,所 以此三角形拼接带是可以建立并形状确定的。然后,我们按照图3 4 所示给 中间自a 条链( 即各个旋转轴) 标上方向。 1 2 图3 _ 4 蛋白质主链结构的有向旋转轴 我们要将此拼接带还原成空间结构,根据前面两条假设,只需要 获得两种转角的信息;一个是a g + l 以向量a g 为旋转轴,绕平 面 ;g 的旋转角妒,另一个是腿+ l a i + l a + l 以向量挑+ l a 件1 为旋转 轴,绕平面g i + 1 a i + 1 的旋转角咖。只要我们能够得到或者估计出这两种 转角的值,我们就可以通过旋转将蛋白质的平面拼接带还原成它的空间结 构。 9 下面,我们将此模型应用到蛋白质的一种特殊小序列蛋白质四连 子中。蛋白质四连子指的是在蛋白质序列中任何连续的四个氪基酸组成的 小片断,其三角形拼接带平面展开如图3 - 5 所示: 中lv l巾2v2 图3 - 5 蛋白质四连子三角形拼接带的平面展开图 在蛋白质四连子的空阅结构中,包含了一个重要的参数角垂。我 们取n 一碳原子为氨基酸中的代表原子( 简写为a ) ,分别用a l ,a 2 ,a 3 ,a 4 表示四个氨基酸中的。一碳原子,则角西为 , a 2 a 3 a 4 绕平面 1 2 a 3 ( 即 向量轴a z a 3 ) 的转角,取值范围为( 一f ,) ,当按右手螺旋法则旋转时,西 取正值,反之,垂取负值。我们研究四连子的目的就是为了研究蛋白质主 链的旋转情况,雨角圣则包含了旋转的主要信息,因而我们可以通过预测 角垂来预测蛋白质的空间结构。为了获得好的预测效果,我们需要先对 角西进行深入的研究。 角圣的获得可以通过4 个a 原子的坐标简单计算得到,但一般情况 下我们并不知道它们的坐标。这时我们可以利用模型来获得( 或预测) 角圣,也就是将平面模型通过适当的旋转,使其还原成四连子的空间结构 图,进而进行计算。 由假设,在模型中只有四个未知参数咖h 妒l ,咖,也与角垂有关,即 角垂是l ,妒l ,也,忱- 这4 个小角的函数。我们利用旋转变换来将4 个小角 合成成1 个大角,下面我们就来看如何从机,妒l ,如,也推导出壬。 4 计算方法 现在对p d b 数据库中的任意一个四连子日易f 3 毋,我们给出2 种方 法来计算它的角圣。一种是通过4 个a 原子的坐标直接来计算角圣,我们 将其记为垂t ,表示它是真实空间结构中的角圣;另一种是通过模型来利 用4 个参数咖1 ,妒l ,也,也合成角壬,我们将其记为西c ,表示它是通过合成 计算得到的角圣。 1 0 5 4 1 圣t 的计算 首先我们来计算圣? 。对于p d b 数据库中的任意一个四连子,我 们知道了其主链上的四个氨基酸中的1 2 个原子的坐标。实际上我们只 要a l ,a 2 ,a 3 ,山这四个原子坐标来计算m t 。现用我们用点来代表从原点 到这点的向量,即用a 1 来表示向量d 以1 , 首先得假设a l ,a 2 ,a 3 三点不共线,a 2 ,a 3 ,山三点也不共线,否 则西t 不存在。这时定义平面a 1 a 2 a 3 的法向量为o l ,且 a = ( a 2 一a i ) ( a 3 一a 2 ) 定义平面a 2 a 3 a 4 的法向量为口,且 卢= ( a a a 2 ) ( a 4 一a 3 ) 由于我们是定义当a 2 a a a 4 和a 1 a 2 a 3 在同一平面内不重合垂角为0 , 故向量a 和芦的夹焦的补角就是平面a 2 a s a 4 绕平面a l a 2 a 3 的转角的大 小。不过,现在我们还没有确定转角的方向,即西t 的正负。这只需判断 一f 向量a a a 4 与法向量。的夹角0 和2 的大小关系:如果日 2 , 则壬t 为正;如果0 = 7 r 2 ,则西r 为0 ;如果0 o 3 的四连子个数:4 3 2 7 0 误差的分类统计: 1 由a c n a 平面( 肽平面) 翻转( 川 1 1 7 r 1 2 ) 引起误差的四连子 个数:5 5 3 9 4 2 由a c n a 平面( 1 l t 平面) 波动( r 1 2 且l t a ) i 0 0 5 ) 引起的误差的四连子个 数:2 3 0 3 4 4 由相邻三个a 原子几乎成一条直线( i o l j 1 1 z r 1 2 或i 口2 l 1 d r 1 2 ) 引起误差的四连子个数:5 1 4 5 由综合原因引起误差的四连子个数:9 9 6 5 在第5 种情况里,误差都不是很大,多数在0 3 0 5 之间,是多种原 因综合导致。因此我们只用针对前4 种产生误差的原因作详细分析。 6 1a c n a 平面( 肽平面) 翻转引起的误差 虽然在大多数已知结构的蛋白质中,肽平面的旋转角w 均在0o 附近, 但是大概有1 1 0 0 0 的肽平面其旋转角u 在1 8 0o 附近,即整个肽平面都翻 转了过来,在化学中这两种结构称为顺反异构体。出现这样的情况必然会 引起很大的误差,因为后面肽链的方向已经整个都发生了改变。 下面的直方图5 - 3 就是我们在p d b 数据库统计的关于转角u 的分布情 况。我们将( 一”,) 等分成2 0 0 分,统计了一下t d 落在各个区间的频次, 取t 0 9 1 0 后分布如图6 1 所示: 1 9 图6 - 1 l 0 9 1 0 u 的频次分布图 从图中可以明显看出,确实有大概1 1 0 0 0 的u 在1 8 0 。附近,这是 引起误差的最主要的一个原因。但是,这个原因引起的误差是可以通 过对模型的修改消除的。为此,对每个四连子,我们引进三个新的参 数o l ,a 2 ,a 3 ,分别代表o l ,0 2 ,w 3 的示性数,即如果u = 1 8 0 。,则o = 0 ; 如果u = 1 8 0 。,则n = 1 。在计算西e 的时候将o l ,0 2 ,0 3 考虑进去,就可 以消除由肽平面翻转引起的误差。在上面的统计中我们可以看到,修正模 型以后,误差大于0 3 的四连子被去掉了将近6 0 。 通过进一步的研究,我们还发现在大约2 0 0 0 0 个发生翻转的肽平面 中,有接近9 0 的翻转发生在后一个氨基酸是p ( 脯氨酸) 的时候。这可 能跟脯氨酸的特殊结构有很大关系。脯氨酸严格说来是一个亚氨基酸,它 的n 原子被包含在。个苯环中,这个特殊结构使得脯氨酸在形成肽键的时 候容易发生肽平面翻转,进而影响肽链的空间结构。 6 2a c n a 平面( 肽平面) 波动引起的误差 除了肽平面的翻转引起误差以外,肽平面的波动也会引起一定的误 差。虽然大多数的肽平面是不可扭转的平面,但也有一些肽平面是可以扭 转的,也就是说,肽键一般虽然带有双键的性质,不宜旋转,但也不是绝 对刚性的,它可以在一定范围内旋转,可扭曲程度u 大约在( - - 1 5o ,1 5o ) 这个范围内。 由上面的p d b 数据库中肽平面旋转角u 的频次分布图也可以看出,大 多数的u 都集中在0 。和1 8 0 。附近,但仍有少数分布在其它的位置,这些 不规则的数据肯定会引起误差。在四连子的3 个肽平面旋转角“l ,u 2 ,w 3 之 中,u 2 对最后圣c 的计算影响最大,而u 1 和。3 则影响相对较小,这是因 为此在四连子的中部,影响的参数最多。在计算出的数据中,一般西角误 差较大的四连予多数都是属于这种情况。 5 6 3 四连子边长波动引起的误差 在四连子平面展开模型中,一共有2 l 条边,但是参与oc 角计算的一 共只有1 7 条边,它们是: a 1 a ,4 l 2 ,c l 2 ,口a 2 ,n i a 2 ,n 2 岛,a 2 6 2 ,a 2 3 ,岛3 岛a 3 ,3 a s ,n a t 3 ,a 3 岛,a s n 4 ,岛4 ,岛a 4 ,4 a 4 在第三节中我们给出过蛋白质主链结构中6 种边长的统计数据,它们 都非常稳定。但是仍然会有一小部分边长波动较大,甚至出现极端的不规 则情况,铡如某些原子之间的距离特别近,或者特别远。 下面是在2 0 0 3 年1 月版p d b 数据库中的统计的6 种边长的最大最小值 和均值的比较: r lr 2r 3 r 4r 5 r 6 期望 1 4 5 8 0 9 2 1 5 2 3 4 6 21 3 2 8 7 0 42 4 5 7 1 2 22 4 2 8 3 2 02 4 3 2 3 9 5 最大值8 2 0 5 0 9ll ,6 7 2 4 25 9 7 7 5 0 31 1 2 6 2 5 56 0 3 0 9 2 25 9 。5 2 5 8 8 最小值0 1 7 6 7 0 6o ,】6 2 4 5 90 1 7 7 3 3 00 。3 9 6 5 3 10 3 0 2 6 0 50 2 3 7 8 9 5 在图6 - 2 中,左图是p d b 数据库中蛋白质p d b 2 p d e 的氨基酸序号 为1 一9 的一段肽链的三维结构图,右圈是蛋白质p d b l h d p 的氨基酸序号 为5 7 6 3 的一段肽链的三维结构图。 图6 - 2 原子距离不正常的例图 2 l 第一副图是空间原子太远的一段肽链的球棒示意图,第二副图是空间 原子太近的一段肽链的球棒示意图,两个图形均用三维绘图软件r a s m o l 绘制。这两个图可能是由数据库本身的错误引起,也可能是这两个蛋白质 本身结构就如此怪异。 6 4 相邻三个a 原子几乎成一条直线引起的误差 在第四节的计算方法中,我们假设a 1 ,4 2 ,a 3 不共线,且a 2 ,a 3 ,a 4 也不共线。这样才可以计算出平面a 2a 3a 4 绕平面a la 2a 3 的转角垂。 但在蛋白质实际的空间结构中,相邻的三个a 原子却有可能几乎在一 条直线上,这时即使通过模型旋转后的四连子形态与真实的形态很相似, 也有可能会引起很大的误差,例如图6 - 3 之中,假设两副图的a l ,a 2 ,a 3 位置相同,则它们的 4 的距离相差非常小,因为计算机都是近似计算,所 以最后计算出的结果可能相同,但实际图形中的角却可能相差了1 8 0o ,所 以这种情况可能会造成很大的误差。但是这种情况发生的并不多,在整个 四连子数据库中只有5 0 0 多个。 a a d 图6 - 3 三个a 原子几乎成一条直线 7 进一步的讨论 蛋白质四连子结构数据库可以作为蛋白质空问结构预测的基础,我们 可以用它来估计只知道一级序列的蛋白质肽链中的转角壬,进而预测出蛋 白质的二级结构乃至空间结构。下面是一些初步的想法: i 我们发现在相同的四连子中。角对( 虫妒) 有明显的聚类性。由于每 个角对受
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新车营销活动方案策划(3篇)
- 普惠金融营销方案(3篇)
- 水上打混凝土施工方案(3篇)
- 油罐区改造-施工方案(3篇)
- 混凝土底部拆除施工方案(3篇)
- 爱乐酒吧营销套餐方案(3篇)
- 电控柜施工方案(3篇)
- 网架焊接球施工方案(3篇)
- 街舞集市活动策划方案(3篇)
- 超高清电视营销方案(3篇)
- 审计回避制度模板
- 2026年淮北矿业集团招聘100名考试参考试题及答案解析
- 中考数学总复习《三角函数》专项检测卷(含答案)
- 卫生院动火管理制度
- 航拍机使用管理制度规范
- 2025年广东省房屋安全检测鉴定技术培训考核考前冲刺备考300题(含答案)
- 保镖基础知识培训课件
- 原合同作废的补充协议
- (正式版)DB32∕T 5184-2025 《海域使用权立体分层设权技术规范》
- 【新疆、西藏】2025年高考全国卷理综化学高考真题(原卷版)
- 二年级上册两位数加减法竖式计算300道(进退位)及答案
评论
0/150
提交评论