DNA序列数据挖掘分析的文献总结.doc_第1页
DNA序列数据挖掘分析的文献总结.doc_第2页
DNA序列数据挖掘分析的文献总结.doc_第3页
DNA序列数据挖掘分析的文献总结.doc_第4页
DNA序列数据挖掘分析的文献总结.doc_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.基于DNA序列数据挖掘算法研究岳晓宁 井元伟 (2009)摘要:引入数据挖掘技术,研究DNA序列数据内在规律性,并给出DNA序列分类问题的算法。综合考虑碱基组的出现概率以及相邻氨基酸之间的关系,从DNA序列片段的个案中密码子分布密度角度出发,提取出已知类别的DNA序列片段的特征;应用分类的逐步判别分析的方法,提出判别能力不显著的变量,给出DNA序列分类的判别函数。仿真结果表明,该算法具有分类计算公式简单且分类结果精度的优点。关键字:DNA序列 密码子 判别函数 数据挖掘 频率主要通过分析64个密码子来判断DNA序列的分类2.数据挖掘技术在生物医学领域的应用余辉 吕扬生 (2003)摘要:阐述了数据挖掘技术基本流程及其在生物医学领域的应用前景,介绍了近年来国内外研究学者运用数据挖掘技术在DNA分析、医学影像数据自动分析以及多种生理参数监护数据分析领域的研究趋势和发展方向。关键字:数据挖掘 DNA分析 医学数字影像标准 医院信息系统 医学图像的存档与通讯系统3.聚类和关联规则挖掘在基因表达数据分析中的应用研究马猛 钮俊清 宁岩 郑浩然 王熙法 (2008)摘要 随着DNA微阵列技术的广泛应用,产生了海量基因表达数据。如何利用这些数据研究基因间的调控关系成为当前生物信息学的一个研究热点。关联规则挖掘是数据挖掘领域的一个重要技术,然而直接对基因表达数据进行关联规则挖掘存在两个问题:一是时间和空间复杂度过高;二是获得的规则仅定性表示基因间的调控关系,无法提供关于调控关系强度的信息。本文利用聚类实现数据降维,然后将基因表达水平离散化为七个状态,最后关联分析每个聚类中的基因表达数据。实验结果表明本文的分析方法是有效地。关键字 生物信息学;基因表达数据;数据挖掘;聚类;关联规则。4.基于DNA计算的聚类算法研究张鸿雁 (博士学位论文2011年山东师范大学)本课题把聚类中的数据对象转化成为图中的节点,那么簇的生成就转化为节点的组合问题,进而把善于解决组合问题的DNA计算应用到聚类中去,在DNA计算应用中是新的尝试,也为聚类分析提供了新的思路和方法。本文的研究内容:1、 利用面向对象方法学分析并描述DNA计算的相关概念和技术。2、 利用DNA计算进行聚类3、 在已提出的基于DNA计算的聚类理论思想的基础上,进一步通过实验来证明其可行性和效果。4、 算法复杂度的讨论分为两个方面:一个是在计算机模拟的基础上对基于DNA计算的聚类算法进行了复杂度的讨论,在计算机编程基础上,讨论按照计算机编程的思想分析DNA计算的时间复杂度;另一个是计算算法的复杂度讨论,讨论了生化实验的消耗和反应时间。关键词:DNA计算 聚类算法 层次聚类 网格聚类 粘贴模型5.聚类分析方法在DNA序列分类中的应用王显金 阳军 (2011)摘要:从序列片段中密码子分布密度角度出发,提取序列片段的特征,基于五大类氨基酸出现的频率,应用聚类分析方法对序列片段进行分类,结果表明,该算法具有分类简单且分类结果精度较高的优点。关键字:密码子频率聚类分析主要内容:四种碱基,三个构成一个密码子,所以密码子共有64个,64种密码子出现的频率构成64维特征向量,最终分成5大类。然后计算距离在进行分类。本文对DNA序列信息的提取,主要以生物学意义为基础:根据氨基酸分子中侧链基的急性性质,把氨基酸分成五大类(含终止信息三联体),出于兼顾碱基含量和融入对碱基排列顺序的考虑,采用指针平移法对各类氨基酸在每一个DNA序列出现频率进行统计,得到一个五维特征向量与之对应,降维后得到四维向量,所得向量维数较低,便于计算和操作;使用SPSS统计工具,采用层次聚类法对40个样本进行分类,分类结果精度较高,其中学习样本回代正确率为95%。6.DNA数据库中的关联规则挖掘王鑫(东北师范大学硕士学位论文2007)摘要:随着人类基因组计划的顺利完成和各种后基因组计划的开始实施,涌现出海量的生物分子数据。充分利用这些数据,揭示这些数据的内涵,得到对人类有用的生物学信息,是科学家们所面临的一个严峻的挑战。虽然生物信息学中已经提出了大量有积极意义的方法,但目前大部分的方法还不能获得最优的模式,最准确的预测。本文根据数据挖掘中的关联规则挖掘算法。提出了一种支持度匹配框架下、挖掘基因DNA序列数据库中非公共的闭合频繁序列之间的关联规则的新型算法。本文使用了来自美国NCBI中RAKalpha和HBsAg基因数据,以实例的形式说明和分析了算法。分析表明,这种算法不仅可以准确、快速的找到所有的序列模式,还可以更好的发现这些模式之间隐含在序列结构中的生物学信息。并且利用这种算法在基因序列数据得到的规则,可以准确的预测新的基因数据的种类和功能。关键词:数据挖掘;关联规则;序列数据库;priori算法。第一章 引言1.1生物信息学简介 1.2数据挖掘的研究现状 1.3论文的内容第二章 关联规则和Apriori的简单介绍第三章 序列数据库中的关联规则挖掘第四章 在基因数据库中挖

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论