蛋白质超二级结构模体的统计分析_第1页
蛋白质超二级结构模体的统计分析_第2页
蛋白质超二级结构模体的统计分析_第3页
蛋白质超二级结构模体的统计分析_第4页
蛋白质超二级结构模体的统计分析_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-精选财经经济类资料- -最新财经经济资料-感谢阅读- 1 蛋白质超二级结构模体的统计分析 【摘 要】蛋白质的空间结构决 定其生物学功能,蛋白质空间结构的预 测成为重要课题。从蛋白质的一级结构 预测高级结构却很困难。由超二级结构 得到的信息可用于三级结构的预测。本 文从氨基酸序列出发,对四类超二级结 构进行统计分析,得一系列可用于蛋白 质结构预测的有益信息。 中国论文网 /5/view-4007211.htm 【关键词】蛋白质;超二级结构; 统计分析 超二级结构是介于二级结构和高 级结构之间的模体,由超二级结构得到 的结构信息可用于三级结构的预测1。 一般在超二级结构中无规卷曲也称为 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 2 Loop,Loop 在蛋白质结构中是一个重 要部分。最简单的具备特殊功能的超二 级结构模体包括两边的二级结构片断和 它们的连接 Loop2,二级结构中螺旋 记为“H”,折叠记为“E” 。由此,超二级 结构模体可分分四类,Loop 两端连接 螺旋,则定义为 HH;HE 是 Loop 左端 连接螺旋,右端连接折叠; EH 定义 类似;EE 是 Loop 两端连接两个折叠。 本文对四类超二级结构统计分析,得到 蛋白质超二级结构中一些有用信息,可 用于蛋白质结构及功能的预测。 1.数据集 选取 SCOP(1.69release)中 7290 个蛋白质序列片断,再从 PDB 库 中都找到该序列对应的二级结构。再从 这些序列中整理出 HH、HE、EH、EE 四类超二级结构。模体中 Loop 的氨基 酸长度从 1 到 20 个,经过统计发现 loop 长大多在 2 到 8 之间,所以选取 loop 氨基酸长为 2 到 8 的序列进行统计 分析,四类超二级结构中 Loop 长为 2-8 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 3 的超二级结构序列片段个数见图 1。 2.方法 我们参照文献3的作法,对 Loop 长为 2-8 的五类超二级结构序列统 计了各位点 20 种氨基酸出现概率。选 取了 8 个位点:按照 Loop 起始位点对 齐时,我们选取 4 个位点,-3、-2、- 1、N;五类模体 Loop 序列的起始位点 记为 N,与 Loop 相连接的左边 3 个残 基从左到右记为-3、-2 、-1 ;Loop 终止 位点对齐时,选取 4 个位点, C、1、 2、3;五类模体 Loop 序列的终 止位点记为 C,与 Loop 相连接的右边 3 个残基从左到右记为 1、2、3。 3.结果 Loop 起始位点对齐时,对选取 4 个位点:-3、-2 、-1、N ,统计 20 种 氨基酸出现概率结果见图 2-图 5;Loop 终止位点对齐时,对选取 4 个位点: C、1、 2、3,统计 20 种氨基酸出现概 率结果见图 6-图 9。 可以看到,图 2-图 3 的图形走向 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 4 很相似,说明 loop 长 2-8 的超二级结构 序列在-3 、-2 二位点 20 种氨基酸出现 概率的规律是相似的;图 3-图 6 的图形 走向不一致,说明 loop 长 2-8 的五类超 二级结构序列在-1、N、C、1 四位点 20 种氨基酸出现概率的规律有较大差别; 可以看到,图 8-图 9 的图形走向也很相 似,说明 loop 长 2-8 的超二级结构序列 在 2、3 二位点 20 种氨基酸出现概率的 规律是相似。说明超二级结构序列中 Loop 序列的起始位点和终止位点以及 与 Loop 起始位点和终止位点相连接的 规则二级结构的第一个氨基酸残基,在 20 种氨基酸的含量上明显的不同于序列 中其它位点。统计发现脯氨酸 P 变化最 大,说明 P 不利于形成螺旋但经常出现 在螺旋的第一圈中1。半胱氨酸 C、甲 硫氨酸 M、组氨酸 H、色氨酸 W 四种 氨基酸含量普遍底,符合文献1中指出 这四种氨基在蛋白质序列中出现的概率 最低。甘氨酸 G 是最倾向于形成无规卷 曲,图 2-图 9 中也看到四类模体在 N -精选财经经济类资料- -最新财经经济资料-感谢阅读- 5 位置 G 含量都最高,C 位置 G 的含量 也较高,其余位置却相对较低。由图 1- 图 8,我们还发天冬氨酸 D、天冬酰胺 N、甘氨酸 G、丝氨酸 S、谷酰胺 Q 在 四类模体的-3、-2 、-1、1、2、3 六个位 置上含量都较低;精氨酸 R、丙氨酸 A、赖氨酸 K、苏氨酸 T、酪氨酸 Y 四 类模体中含量变化较小;谷氨酸 E、异 亮氨酸 I、缬氨酸 V、亮氨酸 L、含量 在四类模体中含量变化较大,可知 E、I、V、L 的信息可用来区分四类模 体。 4.总结 本文对五类超二级结构模体按位 点对齐统计了 8 个位点 20 种氨基酸的 含量,得一些规律可用于区分四类模体, 但工作尚有很多不足,例如对序列统计 分析时没有考虑氨基酸的亲疏水性,而 氨基酸亲疏水性对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论