蛋白质二级结构预测的模型与方法研究_第1页
蛋白质二级结构预测的模型与方法研究_第2页
蛋白质二级结构预测的模型与方法研究_第3页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

蛋白质二级结构预测的模型与方法研究蛋白质组研究是后基因组时代生命科学中最重大的研究课题之一,蛋白质结构预测是蛋白质组研究中一个发展已久但仍富有挑战性的问题,它的研究不仅对于理解蛋白质空间折叠机制与蛋白质功能具有理论价值,更对生物制药、农业生物科技等应用领域具有直接的指导作用。针对这种需求,本文应用生物信息学的方法对蛋白质结构预测的相关问题进行了深入研究,取得的主要成果与创新工作概括如下:(1)由于传统的神经网络方法具有“黑箱”的特点,其预测或分类能力蕴含在它的各种连接参数之中,在用于结构预测时很难从模型中获取领域相关的知识与信息;而模糊推理系统则使用与人的思维方式接近的逻辑推理机制,具有易于理解的优点,但系统难以训练与学习限制了其适用范围。我们将模糊推理系统与神经网络相结合建立了自适应模糊神经网络混合模型,并首次应用于蛋白质结构预测。结果表明,模型导出的规则具有较好的可理解性,便于从中挖掘出可重用的领域相关知识。(2)在自适应模糊神经网络模型中,输入变量维数过高和模糊规则数目太多是关系到建模可行与否的两个关键性难题。我们针对蛋白质结构预测问题的特点,使用模糊聚类和主成分分析方法,对输入变量进行了有效的降维处理;使用启发式方法与遗传算法,成功解决了模糊推理规则的精简问题。这些方法的运用,有效地降低了模型的复杂性,使模型得以应用于蛋白质结构预测,并大大提高了最终生成的规则的可理解性。(3)相邻两侧残基的局部影响作用是决定蛋白质二级结构类型的主要因素,应用标准隐Markov模型进行蛋白质二级结构预测时,模型固有的时序特性不能充分利用双侧局部作用信息,从而限制了结构预测算法的性能。针对这种缺陷,我们提出了适用于蛋白质二级结构预测的一种双向隐Markov新模型,同时结合反馈型神经网络,有效减少了自由参数数量。实验数据表明,应用双向HMM与神经网络系统进行蛋白质结构预测,可以将预测准确率提高至78.1%,较目前的结构预测算法提高2~3个百分点。(4)蛋白质结构预测建模时经常需要对具有分类属性的数据对象进行聚类分析,对海量数据聚类的内存需求和时间开销均对传统串行聚类方法提出新的挑战。研究相应的并行聚类算法是解决问题的办法之一,但关于分类属性数据对象的并行聚类问题目前尚无很好的解决方案。我们在分析串行聚类方法的数据依赖关系与通信特点的基础上,提出并实现了分布式存储环境下分类属性数据的并行聚类方法,理论分析与数值实验表明,该并行方法具有较好的加速特性和可扩展性。(5)目前的蛋白质二级结构预测面临着准确率难以提高的难题,我们在对蛋白质结构数据库的冗余数据进行分析研究后发现,在大约25%左右的序列位点上,蛋白质会形成几国防科学技术大学研究生院学位论文种不同的二级结构,这表明传统的二级结构预测算法所隐含的基本假设“一级结构决定二级结构”并不完全成立。对传统二级结构预测方法分析比较的结果,证实了蛋白质二级结构的这种可变性是制约结构预测准确率提高的重要原因。(6)蛋白质结构预测算法的评价标准直接影响到模型的选择与构建,针对目前结构预测中算法评价标准不一的现状,深入剖析了各种常见性能评估指标的适用范围及相互联系,比较了它们的优缺点;同时结合神经网络建模的实例,讨论了性能评估指标对结构预测建模的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论