【毕业学位论文】(Word原稿)利用序列相似性及支持向量机于蛋白质二级结构预测-義守大學资讯管理研究所_第1页
【毕业学位论文】(Word原稿)利用序列相似性及支持向量机于蛋白质二级结构预测-義守大學资讯管理研究所_第2页
【毕业学位论文】(Word原稿)利用序列相似性及支持向量机于蛋白质二级结构预测-義守大學资讯管理研究所_第3页
【毕业学位论文】(Word原稿)利用序列相似性及支持向量机于蛋白质二级结构预测-義守大學资讯管理研究所_第4页
【毕业学位论文】(Word原稿)利用序列相似性及支持向量机于蛋白质二级结构预测-義守大學资讯管理研究所_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

义 守 大 学 资 讯 管 理 研 究 所 硕士 论文 利用序列相似性及支持向量机于 蛋白质二级结构预测 生:蔡佶龙 指导教授 :林建宏 博士 中华民国 九十三 年 六 月 利用序列相似性及支持向量机于 蛋白质二级结构预测 究 生 : 蔡 佶 龙 导教授 : 林建宏 博士 守 大 学 资 讯 管 理 研 究 所 硕士论文 A of 2004 华民国九十三年六月 I 摘要 随着人类基因定序及许多基因定序计画陆续完成 ,序列的资料量将大幅成长 。 因此,如何有效地分析这些序列更显得重要 。 了解蛋白质的功能及结构是制药跟基因相关产品制造的基础 。 要了解完整蛋白质的功能必先从三级结构着手 ,但直接从蛋白质序列去预测它的三级结构是非常困难且精确度极低 。 转而代之的就是预测其二级结构 。 在过去的研究中,学者们通常将蛋白质二级结构分成三种类别,分别是螺旋体 (折迭 (、其他部份归类为 或 因此我们可以将蛋白质二级结构预测视为一个普遍的分类问题 。 与过去机器学习的预测方式比较, 过去常常将蛋白质本身的序列或结构特性忽略, 这会使预测的精确度降低 。 由于 一些蛋白质序列虽然同源 (但它们在演化树上却相距甚远, 因此会有预测上的盲点 。 在此, 我们提出利用蛋白质序列的相似性来补足以上缺失,再加上支持向量 机 (利于处理循序资料等特性来预测蛋白质二级结构 。 首先, 我们将 白质序列编码 (并向量化 。 接下来, 建构支持向量机的分类器, 并将每个残基 (分成 H( E( C(类 。 支持向量机源于统计学习理论, 它透过一些 计算, 将输入空间提升到高维度的特征空间 ( 找出一个理想的超平面 ( 支持向量机曾经应用于许多 识问题 , 在处理大量的蛋白质序列上也很合适 。 我们将展示多种蛋白质二级结构预测的方法比较与挑战 。 关键字 : 支持向量机 , 蛋白质序列相似性 , 蛋白质二级结构预测 he of of an to is its to is In on of Its a of It of a of In we to to we to we VM of H, E, ). in a of in a a a Its to of 谢 这篇论文能顺利完成,要感谢很多人。首先要感谢我的指导教授, 林建宏 老师,由于老师两年来辛勤的指导,能让完全不了解人工智慧的我,增长不少 因为老师给予自由发挥的空间,才有机会接触到生物资讯方面的课题,还有老师帮我突破论文的瓶颈及生活上的方便。 其次,感谢 AI 文扬 老师、 洪宗贝 老师,能在论文上给予建议及课业上的指导,还有 钱炳全 老师、 张弘毅 老师在报告上的指导;管理方面也感谢 吴昭燕 老师、 王天津 老师等指导,使我有机会可以接触 再者,必须感谢我的 同学兼好朋友, 智德 跟 兴国 ,感谢他们常带给我欢乐及生活上的协助,还有 翠峰 、 桂凤 、 姿蓉 、 俊豪 等同学在学业上的帮助;还要感谢学弟 荣文 、 丁瑜能帮忙处理一些行政上的锁事等等。 最后,感谢我的父母亲,能在背后给予稳定的经济来源及精神上的鼓励,使我能在衣食无缺的情况下,专心地做论文。还有家里的小 都能陪我娱乐,可惜论文完成前,她先走了 !有这么多的老师、同学、朋友及家人们的帮助与关怀,这篇论文才能顺利付梓,在此,致上我深深的谢意。 蔡佶龙 民国九十三年六月 V . I . . . V . . 1 . 1 3 of . 4 of . 7 . s . . 17 . 20 . 21 . 22 . 24 28 . 32 to a . 34 . 36 38 . 42 . 47 . 53 . 55 . 56 . 56 . 58 . 64 . 64 . 66 . 2 . of . s . s . . . . . .0. .1. A .2. .3. in . 28 4. . 32 5. . 41 6. A 42 . 44 . A of of . 0 . 11 . An of . . . 31 . . 35 . . 37 . . 37 . 3 OV 48 1 . A is an of to As of to in in of of 2 is of of 99. of by of of as or as or of be or by or to by of it 16. it be of a is 14. 3 of on of or t 100% 4 or to 16. of a of 1,000,000) of 25,000) is . an to is In we to it to 153017 1062416 DB 25960 . A of of 1. , , we of we in . we of , . 6 . of 7 of he of 1. We a A VM is to of 2. We of 3. We VM a of 4. In to VM it is to by VM at of VM is at a of on of of 8 . s we go we of to s it as a to is NA is In of is on to of is by of of at on of 9 of s to of 92. s in . s : it NA to , C, G, T A, C, G, U 20 10 . s : 1) NA a is t as its 2) NA it a to in a (A), G), C) T). a it is is NA is T ) of 91: ( .) A C C T C T T G G A G A . , of 12 of we (to . It is to NA - 3 - 5. NA as a of as a a by NA is NA is . is is no T) U) is In is , G, C . a NA 100. NA , . NA of 13 to s NA of of 92. he is a NA , of 4 0 of s to an 14 . is in NA o ,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论