构建系统进化树的详细步骤_第1页
构建系统进化树的详细步骤_第2页
构建系统进化树的详细步骤_第3页
构建系统进化树的详细步骤_第4页
构建系统进化树的详细步骤_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

#/12构建系统进化树的详细步骤1.建树前的准备工作1.1相似序列的获得——BLASTBLAST是目前常用的数据库搜索程序,它是BasicLocalAlignmentSearchTool的缩写,意矚慫润厲钐瘗睞枥庑赖賃軔朧。为“基本局部相似性比对搜索工具"(Altschuletal.,1990[62];1997[63])。国际著名生物信息中心聞創沟燴鐺險爱氇谴净祸測樅。都提供基于Web的BLAST服务器。BLAST算法的基本思路是首先找出检测序列和目标序列之间相似性程度最高的片段,并作为内核向两端延伸,以找出尽可能长的相似序列片段。首先登录到提供BLAST服务的常用网站,比如国内的CBI、美国的NCBI、欧洲的EBI和日本的DDBJ。这些网站提供的BLAST服务在界面上差不多,但所用的程序有所差异。它们都有一个大的文本框,用于粘贴需要搜索的序列。把序列以FASTA格式(即第一行为说明行,以“>”符号开始,后面是序列的名称、说明等,其中“>”是必需的,名称及说明等可以是任意形式,换行之后是序列)粘贴到那个大的文本框,选择合适的BLAST程序和数据库,就可以开始搜索了。如果是DNA序列,一般选择BLASTN搜索DNA数据库。这里以NCBI为例。登录NCBI主页-点击BLAST-点击Nucleotide-nucleotideBLAST(blastn)-在Search文本框中粘贴检测序列-点击BLAST!-点击Format-得至UresultofBLASTo残骛楼諍锩瀨濟溆塹籟婭骤東。BLASTN结果如何分析(参数意义):>gi|28171832|gb|AY155203.1|Nocardiasp.ATCC4987216SribosomalRNAgene,complete酽锕极額閉镇桧猪訣锥顧荭钯,sequenceScore=2020bits(1019),Expect=0.0Identities=1382/1497(92%),Gaps=8/1497(0%)Strand=Plus/Plus彈贸Query:1gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt60謀荞||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct:1gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggtaaggcccttc--ggggt58厦礴Query:61actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc120茕|||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct:59acacgagcggcgaacgggtgagtaacacgtgggtgatctgcctcgtactctgggataagc118鹅Score:指的是提交的序列和搜索出的序列之间的分值,越高说明越相似;Expect:比对的期望值。比对越好,expect越小,一般在核酸层次的比对,expect小于1e-10,籟丛妈羥为贍偾蛏练淨槠挞曉。就比对很好了,多数情况下为0;Identities:提交的序列和参比序列的相似性,如上所指为1497个核苷酸中二者有1382个相同;Gaps:—般翻译成空位,指的是对不上的碱基数目;Strand:链的方向,Plus/Minus意味着提交的序列和参比序列是反向互补的,如果是Plus/預頌圣鉉儐歲龈讶骅籴買闥龅。Plus则二者皆为正向。1.2序列格式:FASTA格式由于EMBL和GenBank数据格式较为复杂,所以为了分析方便也出现了十分简单的FASTA数据格式。FASTA格式又称为Pearson格式,该种序列格式要求序列的标题行以大于号“>”开头,下—行起为具体的序列。—般建议每行的字符数不超过60或80个,以方便程序处理。多条核酸和蛋白质序列格式即将该格式连续列出即可,如下所示:>E.coli1aaattgaagagtttgatcatggctcagattgaacgctggcggcaggcctaacacatgcaa渗61gtcgaacggtaacaggaagaagcttgcttctttgctgacgagtggcggac……铙誅卧泻噦>AY631071JiangellagansuensisYIM0021gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt擁締凤袜备訊顎轮烂蔷報赢无。61actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc其中的„>为ClustalX默认的序列输入格式,必不可少。其后可以是种属名称,也可以是序列在Genbank中的登录号(AccessionNo.),自编号也可以,不过需要注意名字不能太长,一般由英文字母和数字组成,开首几个字母最好不要相同,因为有时ClustalX程序只默认前几位为该序列名称。回车换行后是序列。将检测序列和搜索到的同源序列以FASTA格式编辑成为一个文本文件(例:C:\temp\jc.txt),即可导入ClustalX等程序进行比对建树。2.构建系统树的相关软件和操作步骤坛摶乡囂忏蒌鍥铃氈淚跻馱釣。构建进化树的主要步骤是比对,建立取代模型,建立进化树以及进化树评估。鉴于以上对于构建系统树的评价,结合本实验室实际情况,以下主要介绍N-JTree构建的相关软件和操作步骤。蜡變黲癟報伥铉锚鈰赘籜葦繯。2.1用ClustalX构建N-J系统树的过程⑴打开ClustalX程序,载入源文件.File-Loadsequences-C:\temp\jc.txt.(2)序列比对Alignment-Outputformatoptions-?Clustalformat;CLUSTALWsequencenumbers:ON買鲷鴯譖昙膚遙闫撷凄届嬌擻。Alignment-Docompletealignment(OutputGuideTreefile,C:\temp\jc.dnd;OutputAlignmentfile,C:\temp\jc.aln;)Align?waiting等待时间与序列长度、数量以及计算机配置有关。掐头去尾File-SaveSequenceas...Format:?CLUSTALGDEoutputcase:LowerCLUSTALWsequencenumbers:ONSavefromresidue:39to1504(以前后最短序列为准)Savesequenceas:C:\temp\jc-a.alnOK将开始和末尾处长短不同的序列剪切整齐。这里,因为测序引物不尽相同,所以比对后序列参差不齐。一般来说,要“掐头去尾”,以避免因序列前后参差不齐而增加序列间的差异。剪切后的文件存为ALN格式。File-Loadsequences-Replaceexistingsequences?-Yes-C:\temp\jc-a.aln重新载入剪切后的序列。Trees-OutputFormatOptionsOutputFiles:?CLUSTALformattree?Phylipformattree?PhylipdistancematrixBootstraplabelson:NODE锹籁CLOSETrees-ExcludepositionswithgapsTrees-BootstrapN-JTree:構氽頑黉碩饨荠龈话骛Randomnumbergeneratorseed(1-1000):111Numberofbootstraptrails(1-1000):1000SAVECLUSTALTREEAS:C:\temp\jc-a.njbSAVEPHYLIPTREEAS:C:\temp\jc-a.njbphbOK?waiting輒峰陽檉簖疖網儂號泶蛴镧釃等待时间与序列长度、数量以及计算机配置有关。在此过程中,生成进化树文件*.njbphb,可以用TreeView打开查看。尧侧閆繭絳闕绚勵蜆贅瀝纰縭。Trees-DrawN-JTreesSAVECLUSTALTREEAS:C:\temp\jc-a.njSAVEPHYLIPTREEAS:C:\temp\jc-a.njphSAVEDISTANCEMATRIXAS:C:\temp\jc-a.njphdstOK识饒鎂錕缢灩筧嚌此过程中生成的报告文件*.nj比较有用,里面列出了比对序列两两之间的相似度,以及转换和颠换分别各占多少。凍鈹鋨劳臘锴痫婦胫籴铍賄鹗。TreeViewFile-Open-C:\temp\jc-a.njbphbTree-phylogram(unrooted,slantedcladogram,Rectangularcladogram多种树型)Tree-Showinternaledgelabels(Bootstrapvalue)(显示数值)恥諤銪灭Tree-Defineoutgroup...?ingroup>>outgroup?OK(定义外群)鯊腎鑰诎褳鉀沩Tree-Rootwithoutgroup通常需要对进化树进行编辑,这时首先要Edit-Copy至PowerPoint上,然后Copy至Word上,再进行图片编辑。如果直接Copy至Word则显示乱码,而进化树不能正确显示。2.2Mega建树硕癘鄴颃诌攆檸攜驤蔹鸶胶据。虽然ClustalX可以构建系统树,但是结果比较粗放,现在一般很少用它构树,Mega因为操作简单,结果美观,很多研究者选择用它来建树。阌擻輳嬪諫迁择楨秘騖輛⑴首先用ClustalX进行序列比对,剪切后生成C:\temp\jc-a.aln文件;(同上)⑵打开BioEdit程序,将目标文件格式转化为FASTA格式,氬嚕躑竄贸恳彈濾颔漿纷釓鄧.File-Open-C:\temp\jc-a.aln,File-SaveAs-C:\temp\jc-b.fas;⑶打开Mega程序,转化为mega格式并激活目标文件,File-ConvertToMEGAFormat-C:\temp\jc-b.fas?C:\temp\jc-b.meg,釷鹆关闭TextEditor窗口-(Doyouwanttosaveyourchangesbeforeclosing?-Yes);Clickmetoactivateadatafile-C:\temp\jc-b.meg-OK-怂阐譜鯪迳導嘯畫長凉(Protein-codingnucleotidesequencedata?-No);Phylogeny-Neighbor-Joining(NJ)DistanceOptions-Models-Nucleotide:Kimura2-parameter;谚辞調担鈧谄动禪泻類?d:Transitions+Transversions;IncludeSites-?PairwiseDeletionTestofPhylogeny-?Bootstrap;Replications1000;RandomSeed64238嘰觐OK;开始计算,得到结果;(4)Image-CopytoClipboard-粘贴至Word文档进行编辑。此外,Subtree中提供了多个命令可以对生成的进化树进行编辑,Mega窗口左侧提供了很多快捷键方便使用;View中则给出了多个树型的模式。下面只介绍几种最常用的:Subtree-Swap:任意相邻两个分支互换位置;熒绐譏钲鏌觶鷹緇機库圆鍰缄。-Flip:所选分支翻转180度-Compress/Expand:合并/展开多个分支;-Root:定义外群;View-Topology:只显示树的拓扌卜结构;-Tree/BranchStyle:多种树型转换;-Options:关于树的诸多方面的改动。2.3TREECON打开ClustalX,File-Loadsequences-jc-a.aln,File-SaveSequenceas...(Format-PHYLIP;Savefromresidue-1to末尾尾;Savesequenceas:C:\temp\jc.phy);鶼渍螻偉阅劍鲰腎邏蘞阕簣择。打开TREECON程序,Distanceestimation点击Distanceestimation-Startdistanceestimation,打开上面保存的jc.phy文件,SequenceType-NuleicAcidSequence,Sequenceformat-PHYLIPinterleaved,SelectALL,OK;DistanceEstimation-Jukes&Cantor(orKimura),Alignmentpositions-All,Bootstrapanalysis-Yes,Insertions&Deletions-Nottakenintoaccount,OK;纣忧蔣氳頑莶驅藥悯骛覲僨鴛。Bootstrapsamples-1000,OK;运算,等待Finished-OK。Infertreetopology点击Infertreetopology-Startinferringtreetopology,Method-Neighbor-joining,Bootstrap颖刍莖蛺饽亿顿裊赔泷涨负這。analysis-Yes,OK.;运算,等待Finished-OK。Rootunrootedtrees点击Rootunrootedtrees-Startrootingunrootedtrees,Outgroupopition-singl

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论