热点残基预测的总结_第1页
热点残基预测的总结_第2页
热点残基预测的总结_第3页
热点残基预测的总结_第4页
热点残基预测的总结_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、热点残基预测的总结,13 级 艾美乐,相关背景,近年来,研究人员对蛋白质相互作用网络的研究中发现,在蛋白质相互作用界面上存在一种很特殊的残基,当使用丙氨酸突变扫描技术将这类残基诱发突变成丙氨酸后,会使结合自由能产生很大的变化,研究人员将这些残基称为热点残基。通过进一步的研究发现,热点残基主要是集中在蛋白质相互作用界面的中心部位,它们对保持蛋白质的功能和相互作用结合的稳定性起着非常重要的作用。因此对蛋白质相互作用界面中热点残基的研究不仅助于我们理解未知蛋白质的功能以及特定生物功能的生物特性,还能为研究人员探明致病微生物的致病机理,有助于新型药物的研发,从而提高人类的生活质量。,1.研究意义,2.

2、研究技术,目前研究蛋白质相互作用界面中热点残基的技术方法主要是丙氨酸突变扫描实验,该方法就是把蛋白质结合界面的氨基酸残基突变成丙氨酸,然后检查这个过程中结合自由能的变化,如果超过某个值就被认定为热点残基。该方法的优点是识别精度非常高,但缺点是成本高,周期长,需要消耗大量的人力和物力。因为蛋白质结合界面中的氨基酸残基数量非常大,但热点残基的数量往往很小,所以生物实验中要找到热点残基是相当困难的,因此通过数据挖掘和机器学习的方法来预测蛋白质相互作用界面的热点残基的方法应运而生,通过预测模型可以找出大部分的热点残基,然后结合生物实验进行验证,不仅能大大降低发现热点残基的成本,而且能缩短周期,提高效率

3、。,3.研究现状,正因为热点残基在蛋白质相互作用中有着非常重要地位,研究人员对它的生物属性进行了大量的研究。,bogan和thorn的研究表明,热点残基和非热点残基在氨基酸组成上存在着明显区别,色氨酸、酪氨酸和精氨酸在热点残基中出现的频率较高,苏氨酸、亮氨酸、缬氨酸和丝氨酸这些氨基酸在蛋白质结构中有着重要地位,但是它们在热点残基中出现却很少,而天冬酰胺和天冬氨酸相比谷酰胺和谷氨酸,在热点残基中出现更加频繁,原因可能是侧链构象熵的不同。 li和liu在研究中发现,热点残基通常是被一些在结合自由能上贡献不大的残基环绕着,这些残基在热点残基周围形成了一个环形结构,这个结构被称为“o”环,它的作用是使

4、热点残基与周围的水分子隔离开来而不能与之发生相互作用。 另外一些研究表明,热点残基比非热点残基在进化过程中更加的保守。,热点残基的相关介绍,一般热点残基通常被定义为丙氨酸突变后引起结合自由能的变化值大于等于2.0kcal/mol的那些结合面上的残基。 其它: g=2.0kcal/mol为热点残基,g=2.0kcal/mol为热点残基,g=1.0kcal/mol为热点残基,g1kcal/mol为非热点残基。,界面残基的定义:asa12的残基。或者,界面残基是和其它链有原子连接的残基。这里的原子连接可以用csu program计算。,热点残基数据库,asedb:丙氨酸扫描热力学数据库,就是实验获得

5、的热点残基的数据库。 bid:结合界面数据库,通过从文献中挖掘经过实验验证的热点残基数据库。,通常从asedb数据库中获得的数据作为训练集,从bid数据库中获得的数据作为测试集,热点残基的预测方法,从策略和技术上面来说: 策略: 1.基于能量的 2.基于特征的 3.基于综合信息的,1.经验公式 a.能量函数 b.经验函数 2.机器学习 a.遗传算法 b.人工神经网络 c.决策树 d.支持向量机 e.贝叶斯网络,技术:,基于能量的策略需要计算g,例如,计算丙氨酸扫描技术,就是利用结合自由能函数来计算丙氨酸突变效应引起的g的变化,根据计算出的g来标识热点残基。,let a and b denote

6、 the unbound monomers and ab the complex we assume that the alanine mutation occurs on protein a. we further denote with (wt) the wild-type molecules and with (mut) the mutated molecules,基于特征的策略,利用各种特征把特点残基于界面上的其余残基区分开来,主要包括:从序列提取的特征,从结构提取的特征,从分子相互作用信息提取特征。现在大多数都是基于特征的。,特征: 序列:pssm,sequence entropy等

7、 结构:asa,ca等 分子相互作用:氢键,库仑力等,基于序列特征。从aaindex中提取154个特征,经过提取去(去冗余)最终得到132个特征。提出了一个新的编码方案;pssm*aa1点乘。对这132个特征分别建立分类器,最终选出10个最好的特征。然后集成。,基于序列和结构的特征,asa,bc,phy,ese,se,pssm。本论文,首先分成两组asa,bc,phy和phy,ese,se,pssm。sequence-based svm,structure-based svm和all features svm,分别进行预测。,本论文也是多种特征,包含序列和结构信息,包含62个特征,然后利用特征

8、选择f-score。然后获得9个特征,构建9个基于asa或pi的单特征svm模型,然后通过投票来预测热点残基。,基于能量的特征,van der waals potentials,solvation energy,hydrogen bonds ,coulomb electrostatics。3种类别,共12个特征。svmx特征根据correlation of energy terms with observed g values.,本论文利用108个序列,结构,能量特征。然后又分别计算两结构相邻的特征,euclidean distance 和 voronoi diagram 一共324个特征。进行两步特征选择,随机森林和序列向后消除。获得38个优秀特征,之后利用svm进行分类,最后进行集成。,the nearest contact residue in the other face and the nearest contact residue in the same face,本论文也是利用序列,结构和能量的特征。而且面对数据不平衡问题上提出了利用半监督学习。,在线服务器,kfc server:http:/kf

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论