




已阅读5页,还剩68页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.1,生物信息学,谢文海讲iewenhai,2 .第2,5章蛋白质序列分析和结构预测,第1,蛋白质结构2,蛋白质数据库介绍3,蛋白质序列分析4,蛋白质结构预测5,蛋白质功能预测,3,对从多种免疫球蛋白序列中提取的8个片段进行多重比较,审查。4,Humanbetaglobin(人类beta globin)horsebetaglobin(马beta globin)humanalphaglobin(人类alphaglobin)horsealphaglobin(马alphaglobin),5,结构是蛋白质行使功能的前提。6,1,蛋白质的结构,蛋白质的结构主要分为四个阶段,第一结构,第二结构,第三结构,第四阶段结构。一级结构:蛋白质多肽链中氨基酸残基的排列顺序,mtyklngktkgetteavdataekfvqyandngvdgewtyte,7,蛋白质二次结构,二次结构:主要由氢键维持的结构(-螺旋,-折叠)表示多肽链中主链原子的局部空间排列的结构,不包括侧链部分的结构。-螺旋、-折叠、-角、随机卷曲、-螺旋组合() -折叠组合()和-螺旋-折叠组合()。8,-螺旋的结构特征如下:(1)主链骨架围绕中心轴形成右手螺旋。(2)螺旋上升的每个圆是3.6个氨基酸残基,节距为0.54nm是;是。(3)相邻螺旋环之间形成许多氢键。(4)侧链群位于螺旋的外侧。Ala、Glu、Leu、Met促进了Pro、Gly、Tyr、Ser的形成,并提供了人类细胞glovin(2d C3 . pdb)的第121至140个残基的a螺旋侧视图和顶部(n-to)视图,以及,9,(1)促进多肽链或肽段平行或半平行排列。(2)所有肽键的C=O和n-h形成链间氢键。(3)侧链组分别交替出现在床单的上方和下方。折叠的结构特征如下。半平行和平行多折叠链形成完整折叠结构的氢键图;在人类pi型谷胱甘肽-S转移酶的单个子基中,在连续主链的部分折叠结构(2DGQ.pdb)侧视图中可见的角(turn);人pi型谷胱甘肽-S转移酶连续主链的部分折叠结构的俯视图,可见角;人信号转导蛋白SMAD4(1DD1.pdb)的亚基部分-折叠结构的俯视图可见大环。10,多肽链180回折叠部分通常由4个氨基酸残基组成,维持1.4残基之间形成的氢键。Asp、Asn、Ser、Thr、Gln、Pro经常出现在角,角在人类细胞球蛋白(2DC3.pdb)中有两个alpha螺旋连接到角,用较厚的树脂在两个螺旋末端标记脯氨酸。11,随机卷边的结构特征如下:随机卷曲不规则地缠绕在主链骨架上,其结构状态仍遵循物理化学原理,但波动大,对温度变化敏感;通过实验测量三次结构,即使没有坐标,也常常无法识别无定形卷边(缺少其坐标)。随机剔除和环的区别主要是其长度及其形状的可变性。12,超二次结构的主要类型和特征,超二次结构(supersecondarystructure)是位于同一主链上的多个二次结构组件形成的特定组件,可以直接用作第三次结构或域的组成单元,在蛋白质二次结构中形成第三次结构的过渡结构形式,也称为三维结构形成。,13,(1)连接连续4个alpha螺旋形成的4 螺旋束,如角或环;(2)中央固定位置包括亮氨酸和其他疏水侧链氨基酸残基,螺旋两端包含强亲水侧链氨基酸的螺旋组成的亮氨酸拉链;(3)主链上相邻7个双亲螺旋通过过度结构形成的7个透射膜螺旋组;(4)连续主链中2个螺旋连接的3段折叠链形成的Rossmann折叠;(5)由角连接a螺旋组成的a-螺旋-角-螺旋;(6) 环连接由螺旋组成的-环-螺旋等。(7)-折叠是超二次结构。超二次结构的主要类型:14,蛋白质第三级结构,第二级结构进一步折叠形成的域,15,3阶结构:蛋白质的多肽链,进一步弯曲或折叠基于多种二阶结构的固定三维空间结构,形成称为蛋白质三阶结构的固定规则三维空间结构。蛋白质第三级结构的稳定性主要取决于氢键、疏水键、盐键、范德华力等第二级键。16,4级结构:具有由具有两个或更多独立三级结构的多肽链组成的蛋白质,通过其多肽链之间的二级结合形成的空间结构称为蛋白质的四级结构(quarternarystructure)。其中,具有每个三阶结构的多肽链单位称为子单位。17,蛋白质的一级结构是蛋白质的二级,三级,四级结构。18,1。蛋白质序列数据库:例如,PIR,SWISS-PROT,NCBI,这些数据库中的数据主要是根据蛋白质的序列确定的,并相应地被注释;2.蛋白质模型和域数据库:PROSITE、Pfam等这些数据库主要收集蛋白质的保留域和功能域的特性顺序。3.蛋白质结构数据库:像PDB等,这些数据库主要基于蛋白质的结构测量数据。4.蛋白质分类数据库:SCOP、CATH、FSSP等基于序列比较的序列分类数据库和结构比较基础结构分类数据库。蛋白质数据库是根据蛋白质结构水平:ii,蛋白质数据库,19,蛋白质数据库特征:不同,但内部相互连接。每个数据库都有指向其他数据库的指针,数据库之间的顺序及其结构是共享的,相同的蛋白质依次出现在其他数据库中。这种数据通信有助于更深入地挖掘蛋白质的内部生物信息,包括顺序信息的请求、处理、存储和输出。20,1。蛋白质序列数据库,(1)PIR(proteneinformationresource,PIR)和PSD(proteneinsequencecodatabase,PSD)http:/PIR . geePIR-PSD的序列源自GenBank/embel/ddbj三大数据库的编码序列、发布的文档序列和用户直接提交的序列。(2)SWISS-PROT/TrEMBL数据库/swissprot,数据库由蛋白质序列项目组成,每个项目包含蛋白质序列、引文文献信息、分类学信息、注释等,注释包括蛋白质的功能、转录后变形部位,21,2。模型和域数据库、模型数据库(1)PROSITE蛋白质系列和域数据库(www . expaty . org/PROSITE/)PROSITE数据库收集具有相当生物学重要性的蛋白质部位序列、蛋白质特征序列谱库和序列模型,并根据这些特征属性确定未知功能蛋白序列属于哪个蛋白质系列PROSITE处理的序列模式包括酶的催化部位、配体结合部位、金属离子结合部位、二硫键、小分子或蛋白质结合区域等,还包括通过多序列排序制作的剖面图(profile),使序列中的信息更加敏感。22,Prosite并发数据库用于序列分析工具:ScanProsite检索提交的序列数据是否包含PROSITE数据库中的序列模式或SWISS-PROT数据库中提交的序列模式。 motifs可用于查找未知序列中所有可能的已知结构组件,例如PROSITE序列表谱、PROSITE模式、Pfam收集的隐藏Markov模式(HMM)等。23,(2)printsfingerprintdatabasewww . bioinf . man . AC . uk/dbrowser/prints/此数据库包含1500个蛋白质指纹,这些蛋白质指纹是9136个单主题编码的。(3)blocks(www . blocks . fhsc . org/)blocks是通过一些非常保守的蛋白质区域进行比较的没有空位的片段。模板数据库,24,蛋白质域数据库(1)蛋白质家族序列排序和隐藏的Markov模式数据库proteneinfamiliesdatasofalignmentshmms(pfam)pfam位于: www . Sanger . uk/software/(2)蛋白质域数据库prodom http:/pro des . Toulouse . inra . fr/prodom/doc/prodom . html(3)smarts mart确定并注释可传输的遗传因子,分析域结构以传递信号,以及http:/smart . embel-heidelberg . de/,25,3。蛋白质结构数据库,pdb (protenein data bank,pdb) http:/www。RCSB.org/pdb/pdb包含生物大分子结构数据,例如蛋白质、核酸、蛋白质-核酸复合物和病毒,几乎所有从事生物大分子结构研究的研究机构都有蛋白质结构数据,并被rcsb (str)维护和注释。,26,4。蛋白质结构分类数据库,(1)CATH数据库www . biochem . UCL . AC . uk/bsm/CATH new/index . html(2)SCOP蛋白质结构分类数据库(structuralclassificationoffprotein),27,3,蛋白质的序列分析,28,29,蛋白质的理化性质是蛋白质研究的基本蛋白质的基本性质:相对分子质量氨基酸组成等电点(PI)灭系数半衰期不稳定性系数总平均亲水性.实验方法:相对分子质量测量、等电点实验、沉淀实验缺点:基于实验经验的耗时、成本高的计算机分析方法,1 .蛋白质基本理化性质分析。30,根据初级序列进行成分分析,参考氨基酸亲水性和其他分析高级结构预测,提供蛋白质基本理化性质分析:Protparam工具http:/www . expaty . org/tools/protoparam . html,相对分子氨基酸成分等电点(PI).31,蛋白质理化性质分析工具,32、aacompident、peptide mass、33,Protparam工具http:/www . expaty . org/tools/protoparam . html计算以下物理化学特性:相对分子质量理论pI值氨基酸组成吸光系数半衰期不稳定性系数脂肪系数总平均亲水性。34,主要选项/参数,顺序在线提交表单:如果SWISS-PORT和TrEMBL数据库中的序列直接填充Swiss-Prot/TrEMBLAC编号(accessionnumber),则分析新序列:搜索框中的氨基酸,35,Swiss-Prot/TrEMBLAC编号输入各种功能域肽段,输出结果,36,点击不同的功能区域或直接粘贴氨基酸序列的话,匹配/负电荷残差标准,37,37,原子构成,分体,原子总数,38,不稳定系数,脂肪系数,总平均亲水性,40unstable,39,(a)-typeimembraneprinein(b)-typeimembrannebranerotein(c)-multipasstransmembranebranerotein,40,3,蛋白质亲水性分析,氨基酸侧链的疏水性用各氨基酸减去甘氨酸疏水性来表示,蛋白质的疏水性对维持蛋白质第三级结构的形成和稳定性有重要作用。疏水性是蛋白质折叠的主要动力分析,蛋白质氨基酸熟悉性是理解蛋白质折叠的一步氨基酸疏水性分析,为蛋白质二次结构预测提供了证据。蛋白质相互作用部位-抗原部位预测(预测准确度达56%)。41,海参溶菌酶亲水性/疏水性分析,Score0,疏水性;Score0,表示亲水,42,螺旋转氨酶区主要由20-30个疏水氨基酸(Leu,Ile,Val,Met,Gly,Ala等)组成,亲水残留经常出现在疏水残留之间。功能的重要作用是在亲/疏和蛋白质膜区域中各氨基酸的统计分布偏好tmp red http:/www . ch . embnet . org/software/tmp red _ form . htmlsosuii-http:/BP . nuap . nago ya-u,43,常用蛋白质transmembrane区域分析工具,44、TMHMM、45,ProtScale工具http:/ca . expansa . org/tools/prot scale . html氨基酸刻度表示特定
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 可爱的青猎马说课稿-2025-2026学年小学音乐人音版五线谱北京三年级下册-人音版(五线谱)(北京)
- 2024八年级英语下册 Unit 1 Spring Is Coming(Review)说课稿(新版)冀教版
- 2.5有理数的减法说课稿2023-2024学年 北师大版七年级数学上册
- 慢性支气管炎和慢性组赛性肺疾病病人的护理说课稿-2025-2026学年中职专业课-内科护理-医学类-医药卫生大类
- 4.2 基因表达与性状的关系教学设计-2023-2024学年高一下学期生物人教版必修2
- 2025玛纳斯县司法局招聘编制外专职人民调解员人笔试备考题库及答案解析
- 高端酒店集团管理职位劳动合同汇编
- 啤酒广场与体育赛事合作租赁及赞助合同
- 地下室租赁合同范本(含提前终止条款)
- 金融机构与个人间的医疗费用贷款合同
- HY/T 080-2005滨海湿地生态监测技术规程
- GB/T 27689-2011无动力类游乐设施儿童滑梯
- GB/T 20969.1-2021特殊环境条件高原机械第1部分:高原对内燃动力机械的要求
- GB/T 10125-2021人造气氛腐蚀试验盐雾试验
- GB 7231-2003工业管道的基本识别色、识别符号和安全标识
- 医疗机构财政电子票据管理平台建设方案
- 吸附及吸附过程课件
- 食品安全主题班会课件
- 二年级奥数《走迷宫》
- 管道施工安全检查表
- 云南省雨露计划改革试点资金补助申请表
评论
0/150
提交评论