(概率论与数理统计专业论文)氨基酸侧链的异—构分析.pdf_第1页
(概率论与数理统计专业论文)氨基酸侧链的异—构分析.pdf_第2页
(概率论与数理统计专业论文)氨基酸侧链的异—构分析.pdf_第3页
(概率论与数理统计专业论文)氨基酸侧链的异—构分析.pdf_第4页
(概率论与数理统计专业论文)氨基酸侧链的异—构分析.pdf_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自然界中所有的蛋白质都是由一系列氨基酸按定生物规贝i 腓列成。而最常见的 氨基酸种类有2 0 种,除甘氨酸外,每种氨基酸都至! 蜘有一个不对称的碳原 子,即在羧基和氮基之间的那个碳原子,所以每种氨基酸都可以以两种旋光异构体 存在。般来说,我l f 谤捷洒种旋光异构体以。型氮基酸和d 型氨基酸身嘲魂只。但 是在氨基酸肽链里由化学分析和x 射劈狻哺i 我们知道多肽链几乎全部由l 型氮基酸组 成。通过分柝表明,在氮基酸肽链中以万分之一的既率存在些d 型氨基酸,本文 通过找到这些存在着的d 型彝基酸,并加以分析,得到关于这些特殊氨基酸结构上 一些参数的有用结果。 作者通过对p d b 数据库( 地型盟坚竖遍幽堑查) 中每个氨基酸中特定的原子坐标 数据的计算,利用一系歹嵝女学工具找出其中所有的d 型氮基酸。并对这些特殊氨基 酸的些参数,例女畸2 莹长,键角,出现频率等加以统计分析,然后和l 尸型氨基酸的这 些参数加以比较,以此来讨论这些特殊氨基酸位点的结构特征。最后,以上面的分析 作为基础,从结构和功能e 对于这些特殊的氨基酸的存在原因进行些初步的分析, 例如对d 型氨基酸中出现频率比较高的脯氨酸( p ) 等出现原因的分析并讨论其意 义。 关键词:氨基酸侧链,l 一型氨基酸,d 一型氨基酸 a b s t f a c t n m 嗡l o 培岱a l 、驴 h v e 诋a 啪单e c i a l 锄盘d d 鬻叩e 民a 瑾呜m e 2 0 锄血d 矧s 恼嘲m o n i y o d 煎h 吐e r 曲苴弓o 嘟蠡x g b o m 簟1 9 i 面凼罐妇随咄曲。嘴1 i 母瑚m 瞰i c a l 固口b o n 锄m 卜甜e o f l e l 趣k 加旧瞰疆画面留疆n 四两。脚s o 旬r 孤o i l e s e1 9 锄h 的a 随担c h 疵剃h a s i 训s o f 础豳嘲s w 鼬骶删签d 咖e 疆l d l 孵附娃衄 h o 、坩v 臣嚣3 d d m c n 毯m 锄锄。d b y n m r 0 r x 稍m p e o 眯虹。e m 瞳吐1 e 锄陆的a c i 出i n 吐1 e r r 豳c h a i no f 】1 咖诋r n c 蚵时髓i 由p 巴删r i d 锄蛹s 妇、订v 孤踟沁a c i d 幽。吣p o r 叭弹e 飒魄鹏h a s b 唧p r o o e s 剐s o 妇虹豳函锄晌s 岫m y p c 鲰础麟i s 岫硎眦 b y o u r c a k 妇觚玳矧衄伽l l y 0 0 1 呷斑a n l 啪獭s d e d 叭y p e 咖【舢e 锄d 悄卿曲 o t a 1 1 证莨s e d 电p e 曲u 嘶耶臣 b y 妇0 0 0 l d i r 锄苍o f 删啪3 缸l m 懋答吼b y p 【) b d 如b a 9 岛m 砌到砸胡她 i ) 七律舶咖瞄a n d m a d e 【n e 盎睡妇l 跚b b 豳爱rm e s e m 懂舡互骂蚰曩l 璇譬1 l e 盘j q l h 珂o f 疵a c i d s 缸哇e m y p e 咖l d l 琨妊h 啦0 f b 。i d 讲幢疆幽b 弧锄b o f 血b y 出馨a c o l 珥谢s o n b 嘶嘲l 妇芦疆嘲骶0 f 啦供姐边托列& 律姐咖e 锵戤d b i c 幻锄 谢矗d l 阳阿r 螂蕾趟b 晦吐露s d 妇l o f 冯弘0 r 蛳l 嬲虹v 恳雪岱a 两班q 尉p k 嘲两o t w n y s o 盯枷a 画d s s e i o d d 螗曲u 血驼 k 科w o 溅珥啪缸矗b d 商1 1 ,b y p e 蚶媳d 每p e 啦慢柚i 鹤 l 前言 我们知道在氨基酸中,有个碳原子和4 个基团结合,这4 个基团分别是一个氨 基,个羧基,个氢原子和喇隧o q 。当这个侧链r 不是氢原子的时候,这4 个与碳原子相连的基团全都不同。我f f 确矗游的碳原予就叫不对称的碳原子。所以在 构成蛋白质的2 0 种氨基酸中除了甘氮酸没有手性,另外1 9 种都为左型,即l 型氨基 酸关于l 型- 氮基酸和d 型氨基酸的慨念,我们在第二章中有详细的描述。而常 见的核糖和脱氧核糖分子则是d 型的。有 讲为,地球上生命世界中手性不对称性与 生命进化过程有关,也与生6 体高度有序有关。由于只存在l 型氨基酸,这样有利 于构成高度有序的生命分子。但是通过一系列研究表明,自然界中仍然存在着少量的 n 型氨基酸。同时,随着越来越多的蛋白质结构变得己知,由这些数据组成的庞大 的蛋白质数据库不断涌现,而且随着更新更决的测定方法的出现,数据库也变的愈发 的庞大。例如:刚遗弹吨欺煅等大型数据库,这些数据库都保持着大量数据的频繁更 新。这些数据库是生物信息学研究的基础,这些庞大的数据量为研究人员的介 提供 了充分的数据准备和足够的信息。在这些数据库的基础之b 使得我f | 、t 可以对n 型 氨基酸在自然界中的存在数量及其性质进行研究。 本文主要是以p d b 数据库为基础,利用数据库中各个氨基酸分子的原子坐标,通 过一系列数学方法,来找出p d b 数据库中所有的n 型氨基酸。经过分析计算表明, d 型氮基酸以万分之的慨率存在。随后讨论了所有d 型氨基酸其自身所包含的 键长,键角等等一系列物理性质,这一系列的物理性质的计算,都是基于沈世镒老师 所提出的氮基酸肽链的三角形拼接带漠型的基础之匕的。同样,本文也分析了d 型 氨基酸断吼l 耍率以及d 型氮基酸和相邻氨基酸所组成的双氨酸出3 唰瞬静擎性质。最 后,讨论了出现d 型氨基酸i 塞种反常睛形的些可能存芷的原因及其意义。 根据分析表明在蛋白质结构中,共价键维系了蛋白质的级结构,多种弱力( 氢 键、范德华力、静电相互作用、疏水相互作用、堆积力等) 和可逆的二硫键使多肽链 折叠j 拐特定的构象,主链e 的氢键维系了蛋白质的二级结构;而氨基酸侧链的相互作 用和二硫键维系着蛋白质的三级结构。亚基( 鲥m 血) 内部的侧链相互作用是构象稳定 的基础,蛋白质链之间的侧链的相互作用是亚基组装( 四级结构) 的基础,而蛋白质 中侧链与配体基团间的相互作用是蛋白质行使功能的基础。 首先我们来看蛋白质分子的主链,即h l 。西鼢心j a 扑_ 。( :型( 其具体模 型,见图2 ) 的主链,他们之间的主要由共价键维系了蛋白质的级结构,而同时氨基 酸的各种侧链及不同侧链之间的相互作用力在蛋白质结构中也起着重要的作用侧链 酸字母表: z q2 人r n id c q e g h l l k 帆e e s ,工w y v 在p j 和刚b 呷峨数据库中,还常常有z ,x 字符出现,其中z 是a 上或 g l n ,x 代表不确定的氨基酸,本文对于这些情况不做考虑。 我1 f 搬据上面台勺j 聪擞字母表可以炯酋与糈劁傍荆洌:= ( b t k b n ) ;b z q ,称之为向量。而对于向量= ( b l k b n ) ,映射到氨基蠢嫡嗲u 中, 则为一n 长的肽链,在第3 节的讨论的中,我f f 球 讨论到包含d 型氨基酸位点的n 长的肽链其出现的频率,以及些其他的性质。下面,我们将就如何找出n 型氨基 酸进行讨论。 在上部分蝴寸论中,我们给出了【,型氨基酸和d 型氨基酸的定义与其数学模 型,在这部分,我f f 眯哙给出在p d b 数据库中,对d 型氨基酸的查找方法,并对 其自身些性质的分析。 莸们的工作就是鲫数据库中提取所有蛋白质中的氮基酸残基,然后根据它的 位点数鼎杓翱螂苗许强搁题,然后提取出所有的n 型的氨基酸残基,对于d 型 氨基酸的存在与否,在p d b 数据库中搜寻,其数据量将会非常庞大,因此,我们需要 按照p d b 数据库中的标识形式,给予氨基酸的各个基团以一定的代号。 为了简化结构和便于下文的计算,这里将氨基酸分子中的羧基用c 来标识, 而荽【基贝i 拥n 来代替,对于麟和氨基之间所夹的c 原予贝l 佣c a 来标识c a 上 所生出的口h 恂钡i 隧个用四来标识,严格来讲,甘氨酸( 哑的不存在侧链,所以 实际上我们对于发生异构觋象的氨基酸位点的分析按照可能出现的侧链的种类实际上 只包括1 9 种氨基酸。 接下来就是数据读入的工作。对于每个所选的蛋白质记录,打开相应的p c ) b 数据库r 蛳丛塑塑墅鲢目自地) 的文件,在文件中只提取每个残基懒原子的空 间坐标代mz ) 。这样,个含n 个氮基酸残基的蛋白质结构就能够撇为n 个所指 定原子点在三维空间上的分布。在这里我们所选取的指定原予即为n c 凡c ,c b ,我们 分别取出这4 个原子的空间坐标作为对象加以计算: n = ( n x ,n ,) ,c a _ ( c a ,c a v ,魄) ( k ( c 、,g ,c ) c b = ( c & ,c & ,c 岛) ( 3 1 ) 上表表示了由p d b 中j 行计算出的发生多黼况黉葛鞫彩曳基韵阕氇匿鳞幞的分布情 况,和每种氮基酸的些物理性质。同样的,我f f 丁畦l 箭计分析了包含口型氨基酸的 氨基酸2 联子萄诸多联子的出坝频率,由于文科皴量过大,出璎舸能性太多,在 这罩我们也不加以详尽的列举。 同样的我f f 河以统i 十蔓酬帅b 数据库中所有1 9 种氨基酸出现的频率,然后加以 比较,如下表所示: 氟磷酸频率氯基酸频率 m 非授性100 8 2 2 n 极性,不带电)0 0 4 4 7 c f # 撮性) 0 0 1 5 8 p i 非撮性)00 4 6 6 1 3 ( 舒负电) 00 5 7 5 q ( 极性不带电)00 3 7 9 既旖负电) 00 6 2 6 r i 葡正电) 0 0 4 s 3 f 1 ( 非极性) 00 4 0 l s ( 掘性不带电)00 6 0 4 l “椅正电1 0 0 2 3 l t ( 极性不带电l0 m s 8 6 c 非极性) 00 5 5 5 v 非极性) 00 7 0 7 k ( 荷正电) o 0 5 9 5 w ( 非极性) 00 1 4 9 l ( 非极性) o 0 8 8 v ( 极性,不带电)0 0 3 5 h , 非极性)o 0 2 1 5 从t 表中,我l f 何以看到,在d 型氮基酸n 溉f ,出现频率燃的p ,a , c ,d ,在整个p d b 中,除了a 出现的比饺多以外,其他的氨基酸出现的频率都比较 正常,相反c 出现豹频率甚至很少。而在d 型氨基酸的情况下,出现频率比铰少的 f ,在望竹中d b 中,出坝麒瓣却相对较高。 j = 面n 蕴过关于n 型氮基酸和整1 、p d b 数据库中所包含的复基酸的参数的这些比 较,我们发现了,某些参数对于n 型氨基酸的成因具有定的影响,至于更深一j 层 的原因,我 f 粥在下一节盼讨论中提到。 正如上文所说,由1 伊m 鞘黯蜘郦可尔法聚谷氨酸,如果谷氨酸都是l 型的,那 么这l o 个氮基酸最终就只能生成种阿尔法聚谷氨酸。如果开始谷氨酸就是1 型和 d 型混合的,那么这由1 悯基酸组成的聚合分子的异构体将高达2 的l o 次方数量 级,这样的分子将可能不利于构成高度有序的结构。这样也就注定了在自然界中仅仅 能出现极其少量的d 型氮基酸。而另一方面,因为相邻氮基酸的侧链f 中出在主链的 异侧,相间的侧 莲f 申出在主琏的同侧。由两种异构体的混合物组成的链理论e 来讲不 可能 急定,因为当卜型氨基酸和d _ 型氨基酸相邻的时候,在同惯| 蹴会有两个相邻的 侧链突出出来,这洋就会使侧链蹦齐 并使踺变形。所以包含n 型氮基酸的蛋白质 理论上说应该是极其少量而耳并不稳定的,而对于匕面找到的7 8 5 个n 型氮基酸存 在原因的分析是非黼义的,下面我f f 弼讲玢析一下d 型氨基酸存在性的些可 能原因。 首先,对2 0 种构成天然蛋白质的氮基酸的分类就是多种多样的,如按其恻链的 理佬性质,可以将其分为四类: ( 1 ) 非极性侧链氨基酸( 疏水性便嗡转基酸) :侧链均为非极性基团,不能电 离,不能与水形成氢键,因此这些懊临鳍b 是疏水的:如:( ;,v ,l ,a ,l 。,i ? ( 2 ) 非电离极性侧链篓【基酸( 亲水性懊蛔氮基酸) :侧鼢;能电离,但侧链含有 一) h 、c o n h 2 等极性基团,可与水形成氢键;如w ,s ,y ,c ,m ,n ,q , 1 l 。 ( 3 ) 酸陛侧链氨基酸( 亲水性侧链氨基酸) :侧链带有c 0 0 h ,可电离为 伽而释放 ;如:d ,e 。 ( 4 ) 碱性蝌濑l 【基酸( 紊蜊酆啪绞睡黢) :侧黼n h 2 、邙娃 粼基 团,可结合一碱姗 3 + 、制。如:k ,r ,h 。 这些理化性质蘸借郫肽链蝴接,构象及其稳定性中起着至关重要的作用,对于 其次,存在着一些特殊的氨基酸,比如脯氨酸( ) )它属叫 i 肇酸,但i 比亚氢基酸仍能与另一| 羧基形成肽键,不过n 在环中,移动的自由度受到 限制,当它处于多肽链中时,往往使肽链的走向形成折角。从图7 中找们可以看到在 所:氰卜型氨基酸的出现情形当中,脯氪酸( f ) ) 的出现频率是比较高的。 理论上看由两种异构体的混合物组成的链不是很稳定,因为当l 广型氨基酸和d 型氮基酸相邻的时候,在同懊慵睡潮个相邻的便雌,这样就会使侧链拥挤,并使 键变形。所以我们分析在自然界中仍旧存在着些n 型的氨基酸,是因为有些特 殊的原因使得这些包含两种异构体的蛋白质变得相对稳定,比如上面提到的脯氨酸 。 再e 匕如两个位于j 赫坏同部绷半j 溶嗷( c y s ) 近,则有可能被氧化形成= 硫桥。即: 二硫桥可稳定蛋白质的三维结构。在些蛋白质中,这些二硫桥可把不同的肽链 连接在一嚏况溺激定的三维结构。对于许多蛋白质和酶人f f 阿以通过定向突变技术 引入二硫键的方法,使这些蛋白质和酶更稳定,通过面的统计分析,我f f 弛可以清 晰的看至憷浒的情形,即在半胱氨酸( c y s ) 或其周围产生d 型氮基酸的情况。 另外,蛋白质为了行使一定的功能,或者经过酶的修饰,也有可能形成d 型氨 酸。综合上面三点因素,我”潴测上面的这些原因,使得包含d 型氨基酸的肽链 及蛋白质的结构相对稳定,从而能够在自然界中存在。 5 参考文献 1 】沈世镒( 1 9 9 3 ) 。信息的度量及其应用。长沙:湖南教育出版社。 回【法】皮埃尔巴尔迪、【丹麦】索恩布鲁纳克著。张东晖等译。生物信息 学一机器学习方法。北京:中信出版社。 【3 】艾伯茨、布雷、约翰逊、刘易斯、拉夫、罗伯茨、沃尔特著。赵寿元、金承 志、丁小燕等译( 2 0 0 2 ) 。基础细胞生物学一细胞分子生物学入门。上海:上海科学 技术出版社 4 沈 f j = 镒、陈鲁生( 2 0 0 2 ) 信息论与编码理论。北京:科学出版社 5 n m 签m 嘶j o ya n 啪a s ( 1 9 9 1 ) :口咖o f h 向啊脚帆t h c o 叫 【6 】h m b e r m a n ,j 、,e s t b r o o kzf e n & gg 川i l a n d ,t nb h a t ,e t a l ( 2 0 0 0 ) :t h e pr 【) l e i nd a t ab a n k n u c i e i ca c i d sr e s e a r c h 2 8p p2 3 5 2 4 2 【7 】c h e wlp h u n e n l o c h e rd ,k e d e mk ,k l e i n b e 唱j ( 1 9 9 9 ) f a s td e t e c t i o no f c o m m o n g e o m e t r i cs u b s t r u c t u r ei np r o t e i n s jc o m p u tb i 0 1 f a i l w i n t e r ;“3 4 ) :313 2 5 8 】v e e r a p a r i d a nb ( 1 9 9 2 ) :s t r u c t u r ea n df u n c t i o no f i n t e r l e u k i n i b a s e do n c r ) s a l i o g m p h i ca n dm o d e l i n gs t u d i e s b i o p h y sja n r ;6 2 ( i ) :l i2 5 n oa b s t r a c ta v a i l a b l e 9 】t i r a b o s c h ig j u l i i a nn ,t h e r yv a n t o n c z a l l ( s ,f o u m i e + z a i u s k im ( :,e t a i ( 1 9 9 9 ) :a h r e e d i m e n s i o n a lc o n s t r u c t i o no f l h ea c t i v es i t e ( r e g i o n5 0 7 7 4 9 ) o fh u m a nn e u t r a l c 1 1 d o p e p t i d a s e ( e c 3 4 2 4 1 1 ) p r o t e i ne n g f e b ;1 2 ( 2 ) :1 4 l - 9 【10 】am l 七s k ,“at 0 0 i k i tf o rc o m p 毗a t i o n a lm o l e c u i a rb i o l o 甜i i 0 1 1t h eo p t i m a l l u p e r p o s no f t w os e t so f c o o r d i n a t e s ”a c t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论