对生物信息学所学内容的简单总结_第1页
对生物信息学所学内容的简单总结_第2页
对生物信息学所学内容的简单总结_第3页
对生物信息学所学内容的简单总结_第4页
对生物信息学所学内容的简单总结_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、对生物信息学所学内容的简单总结邹国兴 caas06f2_01WebLab是北京大学生物信息中心开发出来的一个有关生物信息工具包集成的网站,利用这些工具可有效地开展生物信息相关的研究。本学期主要是学习文献检索、相关工具(主要是WebLab和emboss中工具)、有关软件的使用、生物信息学的基础知识、常用数据库和网站介绍。结合自身的工作实际,选择性地使用或练习了这些工具和软件,现对所学的内容做一个简单的总结。一、序列比对1、全局比对,用于两个序列全长对比分析、检查数据的质量、确定长的插入或缺失片段以及逐个分析序列中的突变点等。主要学习了needle,是我们学习的重点。 2、局部比对,用于分析两个序

2、列同源性、进行逐个氨基酸残基的精细比对,这样可以获得高精度的序列对比结果。主要学习了water,自己再练习了matcher和wordmatch,以water 为例。3、序列点阵图分析,序列间的重复以图形的形式来表示。重点学习了dotmatcher、dotpath、dottup、polydot四个工具,以dotmatcher为例。4、多序列比对,来分析不同序列之间的差异,是学习的重点。主要学习了emma工具、软件WebLogo、MEGA和clustalx,以例来说明。以10个植物的SBP蛋白质的结合域用emma来分析,用不同的颜色来显示序列的差异。用上框粉红色中的序列以WebLogo来分析序列的

3、保守性,字母越大,保守性越高。MEGA和clustalx软件的多序列比对与emma类似,就不再说明。二、序列同源性搜索与系统发育树的构建1、主要学习的是在NCBI中开展BLAST工作,分五种检索程序,blastP( 蛋白质蛋白质 ),blastN(核酸核酸 ),blastX( 核酸蛋白质 ),tblastN( 蛋白质核酸 )和tblastX(核酸核酸 )。以水稻的OsHT在swissprot数据库中进行blast,结果发现与它同源高的序列很少,比较近的源分值也才在60-80之间,没有找到高度同源的序列。如果在nr数据库中进行blast,则结果将不一样,可以找到很多同源序列,可见在合适的数据库中

4、进行blast是很重要的,以下是在swissprot中blast的结果。下图为通过blastl来构建的系统发育树,可知OsHT与另外5个序列的关系。2、系统发育树的构建,主要学习在WebLab中利用protocol工具包来构建。程序为emma-fseqboot-fprotdist-fneighor-fconsense。构建的树是采用邻近法,注意的是,每下一步程序用的序列是上一步程序分析的结果。同时也学习了利用MEGA和clustalx来构建系统发育树的方法,这两种软件使用方法基本上类似,构建起来方便快速,尤其是利用MEGA软件,可以对所做的图进行修改,得出符合研究者满意的树来,深得使用者的偏爱

5、,以MEGA的使用来构建树为例。三、蛋白质性质分析 1、借助蛋白质分析工具,我们可以预测蛋白质的结构、理化性质等。课堂上主要学习了pepcoil、pepnet、tmap、pepwheel等,课后自己再练习了其它一些prettyplot、 remap 、showalign、 showseq 、sixpack、disgest、pscan 、charge 、octanol、 pepstats、 pepwindow 、topo、plotorf 、prettyseq等工具,现以pepnet和tmap为例。Pepnet可以将蛋白质的一部分或全部展示成螺旋结构,以水稻OsHT的1-70个氨基酸来分析,结果为

6、:tmap分析OsHT有11个跨膜区, 具体位于序列的位置可查看到。2、学习了两个分析蛋白质基序的软件,MEME和SMART,MEME是用来搜索蛋白质中存在基序的一种工具软件,SMART是一种结构分析软件,可以用来进行序列、结构分析或结构域检测,利用它们分别可以得出如下的结果。以水稻的CPP为例,利用MEME可分析出3个基序的特征。以拟南芥的转录因子SPL8为例,利用SMART分析得出一个结构域,两个低两个低复杂度的区段分别从289到299和从313到332具有与SPL8类似结构域器官和组分的蛋白质各有69个四、蛋白质的三维结构分析主要学习的是Cn3D4.1软件和SPDBV软件,这两个软件的功

7、能非常大。课上主要学习如何来分析蛋白质的-螺旋和-折叠等,课后自己也摸索了其它部分,要想精通,需要花精力去多实践才行。以SPDBV软件分析几个蛋白质为例,通过control panel可以获得很多信息。1A4F,全部为-螺旋,没有-折叠,其中B链上有9个-螺旋,最长的为19个氨基酸,最短的为2个氨基酸,还可以测轻键之间的距离,以及不同氨基酸之间的距离。另外还可以看出氨基酸残基指向分子内部还是分子表面等。 蛋白质1PHZ和 2PAH进行比对的结果五、网上资源共享 学习了利用WebLab中的my data与同学或朋友来共享数据。其步骤:点击共享的文件share输入自己的帐号shareimport输入对方的帐号确定-对方打开帐号,点击要查看的文件,非常方便。当然如果不想再让对方共享,也可以取消。六、文献查找 主要学习了在NCBI中PubMed如何有效地开展文献查找,主要的方法有利用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论