生物信息学20169序列比对_第1页
生物信息学20169序列比对_第2页
生物信息学20169序列比对_第3页
生物信息学20169序列比对_第4页
生物信息学20169序列比对_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Liaoning University Bioinformatics 生物信息学生物信息学Life Science SchoolHongsheng Liu Prof.Liaoning University Bioinformatics 第第三三章:章:序列比对序列比对Liaoning University Bioinformatics 序列比对的基本概念序列比对的基本概念 打分矩阵打分矩阵 序列比对算法序列比对算法 序列序列比对软件使用方法介绍比对软件使用方法介绍Liaoning University Bioinformatics 序列比对软件使用方法介绍序列比对软件使用方法介绍Liaonin

2、g University Bioinformatics 一致性:一致性指两个序列相同的程度。保守性:某一氨基酸残基或序列的改变(突变)保持了原始氨基酸残基的物理化学特征,那么这个突变就是保守的。相似性:相似性表示序列之间相关联的程度。与一致性比较相似性进一步考虑了发生保守突变的氨基酸的数目,即考虑了相似氨基酸的数目。同源性:如果两个序列是来源于一个共同的祖先,那么他们是同源的。内容回顾内容回顾Liaoning University Bioinformatics l匹配:匹配:竖线(竖线(| |)l相似:相似:双点(双点(: :)l较弱的相似:较弱的相似:单点(单点(. .)l空位:空位:短横线

3、(短横线(- -)l不相似的替换:不相似的替换:空白空白序列比对结果的表示方法Liaoning University Bioinformatics 两序列进行比对,通常使一个得分矩阵(两序列进行比对,通常使一个得分矩阵(scoring scoring matixmatix)来计算比对的分值,以得到一个评价优劣的)来计算比对的分值,以得到一个评价优劣的标准。标准。 核酸的得分矩阵:核酸的得分矩阵:等价矩阵、等价矩阵、BLASTBLAST矩阵矩阵 蛋白质的得分矩阵:蛋白质的得分矩阵:等价矩阵、等价矩阵、PAMPAM矩阵、矩阵、BLUSOMBLUSOM矩矩阵阵 存在空位(存在空位(GapGap)是要

4、进行空位罚分()是要进行空位罚分(Gap penaltyGap penalty)Liaoning University Bioinformatics 序列比对常用软件使用方法序列比对常用软件使用方法l点阵法:点阵法:http:/myhits.isb-sib.ch/cgi-bin/dotlethttp:/myhits.isb-sib.ch/cgi-bin/dotletl动态规划算法动态规划算法: : 全局序列比对:全局序列比对:Needleman-WunschNeedleman-Wunsch算法算法http:/www.ebi.ac.uk/Tools/psa/emboss_needle/http:

5、/www.ebi.ac.uk/Tools/psa/emboss_needle/局部局部序列比对序列比对:Smith-Waterman算法算法http:/www.ebi.ac.uk/Tools/psa/emboss_water/http:/www.ebi.ac.uk/Tools/psa/emboss_water/双序列比对常用软件双序列比对常用软件Liaoning University Bioinformatics l全局比对:全局比对:对序列从头到尾进行比较。试图使尽可能对序列从头到尾进行比较。试图使尽可能多的字符在同一序列中匹配。全局比对适用于相似度多的字符在同一序列中匹配。全局比对适用于相

6、似度较高而长度相近的序列。较高而长度相近的序列。例子例子1 1:使用:使用Needleman-WunschNeedleman-Wunsch算法对人算法对人RBP4RBP4蛋白和小鼠蛋白和小鼠RBP4RBP4蛋白进行全局比对蛋白进行全局比对 首先在UNIPROT数据库( /)中下载人RBP4蛋白(P02753)和小鼠RBP4蛋白(Q00724)的氨基酸序列 然后打开Needleman-Wunsch算法程序(Needle)的在线服务器网址 把人RBP4序列和小鼠RBP4序列分别粘贴到两个文本框中 如果需要可以调整比对的参数,如:得分矩阵,空位罚分等 然后提

7、交具体步骤:具体步骤:Liaoning University Bioinformatics 粘贴序列粘贴序列粘贴序列粘贴序列修改参数修改参数提交提交Liaoning University Bioinformatics 人人RBP4RBP4蛋白和小鼠蛋白和小鼠RBP4RBP4全局序列比对全局序列比对结果结果一致性一致性相似性相似性空位空位得分得分序列比对结果序列比对结果Liaoning University Bioinformatics l局部比对:局部比对:寻找序列中相似度最高的区域,也就是匹寻找序列中相似度最高的区域,也就是匹配密度最高的部分。局部比对适用于某些部位相似度配密度最高的部分。局

8、部比对适用于某些部位相似度较高,而其他部位差异较大的序列。较高,而其他部位差异较大的序列。例子例子2 2:使用:使用Smith-WatermanSmith-Waterman算法对人算法对人RBP4RBP4蛋白和人蛋白和人lipocalin1lipocalin1蛋白进行局部比对蛋白进行局部比对 首先在UNIPROT数据库中下载人RBP4蛋白(P02753)和人lipocalin1蛋白(P31025)的氨基酸序列 然后打开Smith-Waterman算法程序(Water)的在线服务器网址 把人RBP4序列和人lipocalin1蛋白序列分别粘贴到两个文本框中 如果需要可以调整比对的参数,如:得分矩

9、阵,空位罚分等 然后提交具体步骤:具体步骤:Liaoning University Bioinformatics 人人RBP4RBP4蛋白和人蛋白和人lipocalin1lipocalin1蛋白局蛋白局部比对结果部比对结果比对不是从第一个氨基酸比对不是从第一个氨基酸开始的,也不是到最后一开始的,也不是到最后一个氨基酸结束,而是找出个氨基酸结束,而是找出了相似性最高的一部分了相似性最高的一部分(局部比对)(局部比对)全局比对结果全局比对结果Liaoning University Bioinformatics 多序列比对,实际上是一组蛋白质之间的一系列的双序列比对。与双序列比对相比,多序列比对更能

10、发现进化保守关系信息。在双序列比对中出现的相同的氨基酸残基,虽然在两条序列上是保守的,但这种保守可能只是偶然的。而如果某一位点在多序列比对的都出现了相同的氨基酸残基,则说明该残基是进化保守的可能性更大。多序列比对多序列比对Liaoning University Bioinformatics 序列分别为鸡、小鼠、序列分别为鸡、小鼠、人、猪和牛的人、猪和牛的RBP4蛋白蛋白使用了使用了Clustal Omega软件软件通过多序列比对可以发通过多序列比对可以发现现RBP4蛋白中的大部分蛋白中的大部分氨基酸残基在多个哺乳氨基酸残基在多个哺乳动物中都保守。动物中都保守。Liaoning Universi

11、ty Bioinformatics 序列分别为人的载脂蛋序列分别为人的载脂蛋白白D,人视黄醇结合蛋白,人视黄醇结合蛋白4,孕激素相关子宫内膜,孕激素相关子宫内膜蛋白,补体蛋白,补体8(肽),肽),lipocalin1,人气味结合,人气味结合蛋白蛋白2A, -1微球蛋白,微球蛋白,嗜中性明胶酶相关蛋白,嗜中性明胶酶相关蛋白,前列腺素前列腺素D2合成酶合成酶通过多序列比对可以发通过多序列比对可以发现人这些旁系同源物序现人这些旁系同源物序列高度趋异,互相之间列高度趋异,互相之间的相似度并不高。的相似度并不高。但都存在一个保守的模但都存在一个保守的模体:体:GXW,即甘氨酸,即甘氨酸-任任意氨基酸意氨

12、基酸-色氨酸。色氨酸。GXW保守保守模体模体Liaoning University Bioinformatics Clustal OmegaClustal Omegahttp:/www.ebi.ac.uk/Tools/msa/clustalo/http:/www.ebi.ac.uk/Tools/msa/clustalo/MUSCLEMUSCLEhttp:/www.ebi.ac.uk/Tools/msa/muscle/http:/www.ebi.ac.uk/Tools/msa/muscle/CLUSTAL XCLUSTAL X/clustal2/http

13、://clustal2/(下载网站)(下载网站)MEGAMEGA(分子发育分析综合软件,集成了(分子发育分析综合软件,集成了ClustalWClustalW和和MUSCLEMUSCLE)http:/ (下载网站)(下载网站)多序列比对常用软件多序列比对常用软件Liaoning University Bioinformatics 例子例子3 3:使用:使用Clustal OmegaClustal Omega比对人比对人RBP4RBP4蛋白,小鼠蛋白,小鼠RBP4RBP4蛋蛋白,鸡白,鸡RBP4RBP4蛋白,猪蛋白,猪RBP4RBP4蛋白,牛蛋白,牛RBP4RBP4蛋

14、白的氨基酸序列蛋白的氨基酸序列 首先在UNIPROT数据库中下载人RBP4蛋白(P02753),小鼠RBP4蛋白(Q00724),鸡RBP4蛋白(P41263),猪RBP4蛋白(P27485),牛RBP4蛋白(P18902)的氨基酸序列 然后打开Clustal Omega的在线服务器网址 把所有蛋白序列粘贴到文本框中,也可以直接上传FASTA文件 然后提交具体步骤:具体步骤:Liaoning University Bioinformatics 多序列比对结果多序列比对结果ALNALN格式,参照格式,参照第三节课第三节课PPTPPT中中介绍介绍Liaoning University Bioinf

15、ormatics 例子例子4 4:使用:使用ClstalXClstalX比对人比对人RBP4RBP4蛋白,小鼠蛋白,小鼠RBP4RBP4蛋白,鸡蛋白,鸡RBP4RBP4蛋白,猪蛋白,猪RBP4RBP4蛋白,牛蛋白,牛RBP4RBP4蛋白的氨基酸序列蛋白的氨基酸序列 打开ClustalX后,点击File Load Sequences,加载包含上述蛋白序列的FASTA文件 然后点击Alignment Do complete alignment,选择好比对结果文件的文件夹,进行序列比对具体步骤:具体步骤:lClustalX是需要安装的软件,需要先下载,安装之后才能使用。Liaoning Univer

16、sity Bioinformatics Liaoning University Bioinformatics 例子例子5 5:使用:使用MEGAMEGA中的中的ClustalWClustalW比对人比对人RBP4RBP4蛋白,小鼠蛋白,小鼠RBP4RBP4蛋白,鸡蛋白,鸡RBP4RBP4蛋白,猪蛋白,猪RBP4RBP4蛋白,牛蛋白,牛RBP4RBP4蛋白的氨基酸序蛋白的氨基酸序列列 打开MEGA后,点击Align Edit/Built Alignment Create New Alignment Protein,出现序列编辑的界面 可以将蛋白质序列粘贴进去,也可以通过菜单栏Data Open

17、Retrieve Sequences from File,加载包含上述蛋白序列的FASTA文件 然后点击W按钮或通过菜单栏Alignment Alignment by Clustal 出现参数页面,可以调整参数,一般都使用默认参数,点击OK进行序列比对具体步骤:具体步骤:lMEGA也需要安装之后才能使用。Liaoning University Bioinformatics Liaoning University Bioinformatics Liaoning University Bioinformatics Clustal WLiaoning University Bioinformatics ClustalW的参数设置页面,一般的参数设置页面,一般情况下使用默认参数情况下使用默认参数Liaoning University Bioinformatics Liaoning University Bioinformatics 课堂练习题课堂练习题练习课件中的例子1-5使用Clast

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论