已阅读5页,还剩60页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章 蛋白质功能分析与结构预测,农业与生物学院 张利达 ,蛋白质功能分析,蛋白质功能预测,新基因的可能功能 已经了解到神经纤维素nf1基因的突变 与遗传性的多发性神经纤维瘤型疾病有关(neurofibromatosis 1); 但关于该疾病的分子机制知之甚少。 序列相似性分析发现 NF1 与酵母的IRA蛋白同源,该蛋白是一个GTP酶活性调控蛋白(GTPase activating protein) ,也已经知道在酵母细胞中其调控GTP酶Ras的活性。 推断: NF1在人细胞中可能调控Ras蛋白; 然后进一步可以用生物实验加以验证。,IRA,NF1,蛋白质功能预测方法,基于同源序列的蛋白质功能预测 基于结构域(模体)的蛋白质功能预测 基于空间结构的蛋白质功能预测 基于相互作用的蛋白质功能预测,基于同源序列的蛋白质功能预测,蛋白质A具有转录功能,蛋白质B与A在氨基酸序列上同源(直系同源),因而蛋白质B也具有转录功能。,A,B,转录活性,转录活性,蛋白质A,蛋白质B,序列相似性比较作为一个非常有效的工具用于同源基因的发现,基于序列同源的蛋白质功能预测,基于序列同源的蛋白质功能预测,基于结构域(模体)的蛋白质功能预测,一类基因具有转录功能, 且它们所编码的蛋白质都具有Y结构域(模体),蛋白质B也具有Y结构域(模体),因而蛋白质B的功能也应该与基因转录相关。,蛋白质B,转录活性,蛋白质模体或结构域在氨基酸序列水平比其他区域保守,通过对序列比对可以发现这些在进化上较为保守的区域; 蛋白质模体或结构域通常与该蛋白质的功能直接相关; 根据模体或结构域信息可以对同源水平较低的蛋白质的进行功能预测。,基于结构域(模体)的蛋白质功能预测,基于模体的蛋白质功能预测,举例:SWISS-PROT Q03112,基于空间结构的蛋白质功能预测,蛋白质A具有某一空间结构 ,而蛋白质B也具有与A类似的空间结构特征 ,因而蛋白质B具有与A 相似的功能。,鼠的Abl 酪氨酸激酶,人的p38丝氨酸激酶,序列-结构比较 结构-结构比较,基于空间结构的蛋白质功能预测,蛋白质结构决定蛋白质性质和功能,相似结构具有类似功能; 结构比序列更保守,空间结构比较可以发现序列相似性很低但结构相似的远源同源蛋白,根据这些远源同源蛋白的结构和相关信息推测蛋白可能的功能。,基于空间结构的蛋白质功能预测,鼠abl酪氨酸激酶与人p38丝氨酸激酶序列比较,基于空间结构的蛋白质功能预测,蛋白质结构比序列更保守,28的序列一致性,鼠abl酪氨酸激酶,人p38丝氨酸激酶,基于相互作用的蛋白质功能预测,蛋白质之间相互作用以及通过相互作用而形成的蛋白复合物是细胞各种基本功能的主要完成者。 蛋白质A具有转录功能,蛋白质B可以与蛋白质A相互作用,因而蛋白质B可能与基因转录相关。,蛋白质A,蛋白质B,转录活性,基于相互作用的蛋白质功能预测,A具有转录功能,蛋白B、C、D和E的功能可能与基因转录有关,A,B,C,D,E,DIP蛋白质相互作用数据库(Database of Interacting Proteins),基于相互作用的蛋白质功能预测,/,蛋白质结构预测,结构决定功能,一级结构决定高级结构 相似的氨基酸序列具有相似的结构 相似结构具有类似功能,蛋白质一级结构,蛋白质一级结构就是氨基酸的排列顺序,MTYKLILNGKTKGETTTEAVDAATAEKVFQYANDNGVDGEWTYTE,蛋白质二级结构,二级结构:主要由氢键维系的结构(-螺旋、-折叠),Protein 3D Structure,-螺旋,-折叠,环(loop)或转角,无规则卷曲(coil),Back,蛋白质三级结构,二级结构进一步折叠形成的结构域,蛋白质空间结构确定方法,实验方法 X-射线晶体衍射 最为精确的方法(1A) 体外,需要蛋白结晶 核磁共振(NMR) 精确度次之(1-2.5A) 体内,不需要结晶 适用于小分子蛋白,计算机方法 结构预测 蛋白质的氨基酸序列决定其结构,根据氨基酸序列来预测蛋白质结构。,蛋白质空间结构确定方法,由于资金和技术等方面的限制,许多蛋白质的空间结构尚未测定。对于这些蛋白质,利用计算机方法进行结构预测是获得其空间结构的很好办法。,PDB数据库 55,000个空间结构,蛋白质结构预测,Swiss-prot 405,506个记录,TrEMBL 6,964,485个记录,蛋白质结构预测方法,同源建模法(Homology) 同源蛋白质具有相似的结构和功能 根据序列同源性推断目标蛋白的结构 折叠识别/穿线法(Threading) 根据现有的蛋白质折叠类型来推断目标蛋白的折叠方式 从头算预测法(ab initio) 从序列到结构 根据物理模型进行分子动力学模拟,主要思路: 对于一未知结构的蛋白质,找到已知结构的同源蛋白质,以同源蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。 依据: 蛋白质一级结构决定高级结构,相似序列具有相似结构。一般如果蛋白质序列一致性超过30%,则它们具有类似的空间结构,即两个蛋白质的基本骨架相同,只是在非主要结构的一些细节部分有所不同。,蛋白质同源建模,预测结果准确率: 一致性60%的氨基酸序列,同源建模非常准确。若超过60%,且无大片段的插入或缺失,则预测结果接近于实验测定的结果。 一般情况,如序列一致性大于30%,则可以期望得到比较理想的预测结果。,蛋白质同源建模,蛋白质同源建模应用,Marti-Renom et al. Annu. Rev. Biophys. Biomol. Struct. (2000): 291-325.,可用于分辨蛋白空间结构的变化,如确定结合位点的位置及估计配体大小 根据结构进行蛋白定点突变,模型准确率=低分辨率的x-ray或中等分辨率的NMR 小分子配体或蛋白与蛋白对接,可用于蛋白质功能的预测,蛋白质同源建模基本过程,搜索与目标序列同源的模板序列(已知结构的蛋白质序列) 目标序列与模板序列对齐 (关键步骤) 骨架结构构建 非保守区的环(loop)结构建模 侧链安装 优化和评估所建模型,一、选择合适的结构模板,通过序列相似性 用FASTA, BLAST, PSI-BLAST 高度序列相似性的效果最好,但可尝试远源同源性,之后评估效果 进化关系越相近,效果越好 考虑系统进化树 通常采用多个模板来建立模型的效果比较好,一、选择合适的结构模板,在PDB数据库中搜索与目标序列同源的模板序列,找到所有在序列水平上与目标序列相似的已知结构的蛋白质。,一、选择合适的结构模板,根据一定序列相似性标准初步筛选模板,如SWISS-MODEL选择与目标序列一致性大于25%,且长度大于20个氨基酸残基的已知结构的蛋白序列为模板。,二、目标序列和模板的比对,目标序列和模板正确的比对非常重要 比对过程尽量使用结构信息 大部分的插入/ 缺失发生在主要二级结构的连接处,而不是发生在二级结构中间。 用所有可能的模板进行基于结构的序列比对,二、目标序列和模板的比对,ClustalW 的对齐结果,考虑结构的序列对齐结果,二、目标序列和模板的比对,ClustalW 的对齐结果,考虑结构的序列对齐结果,如果只有一个模板,直接复制空间骨架结构; 如果有多个模板,对所有相关模板进行空间结构叠合,去除不一致的模板。,三、建立模型I骨架的构建,三、建立模型I骨架的构建,平均化-碳原子的位置,确定目标氨基酸序列的空间骨架结构。,loop结构建模的方法,基于物理性质的方法: 分子动力学进行结构模拟 基于已知结构的方法: 与已知结构的loop进行匹配,将相匹配的loop结构的坐标转换为目标结构的坐标,Loop是含有5个以上的氨基酸残基的转角,连接蛋白质的二级结构 通常目标分子和模板在loop区域不同(片段的插入/缺失),四、建立模型IIloop结构建模,Back,侧链安装,对具有相似序列的位置,复制模板结构 对于不同序列的位置,通过匹配旋转异构体数据库中的结构来确定侧链结构,五、建立模型III侧链安装,六、优化所建模型,由步骤I-III建立的蛋白质结构模型可能具有较差的立体化学性质; 通过分子动力学能量最小化可以改进严重的局部错误,如SWISS-MODEL通过对所构结构模型进行能量最小化优化。,有很多地方容易出错,不合适的模板根本没有与目标序列相同的结构; 错误的对齐结果产生错误的结构 错误的loop结构构建 错误的侧链位置,折叠识别方法,很多蛋白质在氨基酸序列水平上有很大的不同(30%),对于这类蛋白质,很难直接通过序列比对找出它们之间的关系。 蛋白质结构具有很大的可变性,但由于分子作用力往往倾向于形成某些折叠结构(基本骨架)。 有限的蛋白质折叠类型(可能只有几千种)。,有限的蛋白质折叠类型,独特的折叠结构数量较少 (可能只有几千种),有限的蛋白质折叠类型,向PDB提交的新结构中 ,90% 与数据库中的已知折叠结构相似,有限的蛋白质折叠类型,258 种类型,165 种类型,141 种类型,334 种类型,50 种类型,目标序列 MTYKLILNGKTKGETTTEAVDAATAEKVFQYANDNGVDGEWTYTE 折叠结构,折叠识别方法,目标序列与已知折叠结构进行比较, 找到目标序列最佳的折叠结构,以此预测目标蛋白结构(因为只有千余种折叠结构, 总能找到目标序列正确的折叠形式)。,折叠结构模板数据库,蛋白质折叠识别是一种不依赖于序列相似性的蛋白质结构预测方法,该方法通过序列与结构的比对,从有限的蛋白折叠结构中找到目标序列最有可能的折叠方式。,折叠识别方法,折叠识别的关键:判别目标序列与模板的关系,也就是序列与结构能准确比对。,MTYKLILNGKTKGETTTEAVDAATAEKVFQYANDNGVDGEWTYTE,残基的环境偏好: Es,残基间相互作用倾向: Ep,插入/缺失区域: Eg,total energy: Em + Es + Ep + Eg + Ess,残基突变成模板对应位置残基的倾向: Em,残基与所在二级结构的兼容性: Ess,序列-结构最佳对齐方式,能量最小化,折叠识别通过在比对过程中计算结构能量,实现序列与结构性质的关联,这也是与同源建模最大的不同之处。,折叠识别方法,MTYKLILNGKTKGETTTEAVDAATAEKVFQYANDNGVDGEWTYTE,Score = 600,Score = 1600,Score = 920,Score = 1120,哪一个为目标序列的正确折叠结构?,折叠识别方法,折叠识别方法只能预测蛋白质的骨架结构,蓝色: 实际结构 绿色: 预测结构,预测结构,实际结构,折叠识别方法,折叠识别方法预测较成功的例子,actual,predicted,actual,actual,actual,predicted,predicted,predicted,折叠识别方法,折叠识别方法预测不太成功的例子,折叠识别方法,从头预测方法既无已知结构的同源蛋白质、也没有已知结构的远源同源蛋白质的情况下,仅仅根据氨基酸序列本身,通过理论计算(如分子动力学计算)进行结构预测。该类方法假设折叠后的蛋白质取能量最低的构象。,从头预测方法,从头预测方法,从头预测方法的不足之处: 一是自然的蛋白质结构和未折叠的蛋白质结构,两者之间的能量差非常小。 二是蛋白质可能的构象空间庞大,针对蛋白质折叠的计算量非常惊人。,当前预测方法概况,MAGSKWETEETNQFAIENQKLEEEWRKKRRLEKKRKRKILEEEEKAEERNIDACRLYLMGNTPELKSCNSIDDYEILEKIEEGSYGIVYRGLDKSTNTLVALKKIKFDPNGIGFPITSLREIESLSSIRHDNIVELEKVVVGKDLKDVYLVMEFMEHDLKTLLDNMPEDFLQSEVKTLMLQLLAATAFMHHHWYLHRDLKPSNLLMNNTGEIKLADFGLARPVSEPKSSLTRLVVTLWYRAPELLLGAPSYGKEIDMWSIGCIFAEMITRTPLFSGKSELDQLYKIFNLLGYPTREEWPQYFLLPYANKIKHPTVPTHSKIRTSIPNLTGNAYDLLNRLLSLNPAKRISAKEALEHPYFYESPRPKDPKFFPTFPSKAKGESKEKNVFQSFRSASPKK,从酵母中克隆到一个新的丝/苏氨酸蛋白激酶基因,其所编码的氨基酸序列如下:,蛋白质同源建模:SWISS-MODEL,/,蛋白质同源建模:SWISS-MODEL,蛋白质同源建模:SW
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《电子测量与仪器》课程标准
- 2026 学龄前自闭症精细动作引导课件
- 《中药学(第2版)》课件27- 攻毒杀虫去腐敛疮药
- 工程信号与系统(第2版)课件 第六章 拉普拉斯变换与复频域分析
- 2025年东方书院元宇宙场景的书桌设计
- 城南旧事演讲稿8篇
- 2025工程(波浪能设备租赁)合同
- 大连2026年省考公务员《申论》考试试题及答案
- 糖基化基因消防安全管理规定
- 2026年校园宿舍安全管理注意事项
- 2023年08月上海申康医疗卫生建设工程公共服务中心招考聘用笔试历年难易错点考题荟萃附带答案详解
- 2023年牛津上海版中考英语复习如何应对中考口语考试真题解析课件
- 中华传统文化与当代青年
- 2023年上半年教师资格证考试《高中物理专业面试》真题及答案解析
- 第四章+攀钢转炉提钒工艺
- 重庆市(2022年-2023年)初中结业考试地理试题及答案
- 蒸汽管道安装方案
- 2023年生物实验报告单模板(15篇)
- GB/T 9332-2008船舶电气装置控制和仪器回路用150/250 V(300 V)电缆
- GB/T 38854-2020智能工厂生产过程控制数据传输协议
- 《基础生态学》全套优质课件
评论
0/150
提交评论