分子进化树构建方法课件_第1页
分子进化树构建方法课件_第2页
分子进化树构建方法课件_第3页
分子进化树构建方法课件_第4页
分子进化树构建方法课件_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章系谱分析生物信息学

2.系统发生分析(Phylogeneticanalysis)分析基因或蛋白质的进化关系系统发生(进化)树(phylogenetictree)Atreeshowingtheevolutionaryrelationshipsamongvariousbiologicalspeciesorotherentitiesthatarebelievedtohaveacommonancestor.经典进化生物学:比较:形态、生理结构、化石分子进化生物学:比较DNA和蛋白质序列研究系统发生的方法Residuesthatarelinedupindifferentsequencesareconsideredtoshareacommonancestry(i.e.,theyarederivedfromacommonancestralresidue).AnAlignmentisanhypothesisofpositionalhomologybetweenbases/AminoAcidsEasyonlywithsubstitutionsDifficultalsowith

indels=((A,(B,C)),(D,E))Newickformat节点Node分支BranchABCDE末端节点

可以是物种,群体,或者蛋白质、DNA、RNA分子等OTU祖先节点/树根Root系统发生树术语内部节点/分歧点该分支可能的祖先HTUAclade(进化支)

isagroupoforganismsthatincludesanancestorandalldescendentsofthatancestor.geneticchangenomeaningPhylogram

CladogramtimeTaxonATaxonBTaxonCTaxonD111635TaxonATaxonBTaxonCTaxonDTaxonATaxonBTaxonCTaxonDUltrametrictree

超度量树进化树分支树系统发生树术语Rootedtreevs.Unrootedtreetwomajorwaystoroottrees:ABCD102352d(A,D)=10+3+5=18Midpoint=18/2=9Bymidpointordistance有根树ACBD无根树系统发生树术语outgroup外群、外围支plantplantplantfungusanimalanimalanimalUnrootedtreerootRootedtreebacteriumanimalanimalanimalfungusplantplantplantMonophyleticgroupMonophyleticgroupRootedtreevs.Unrootedtree选择外群

(Outgroup)选择一个或多个已知与分析序列关系较远的序列作为外类群外类群可以辅助定位树根外类群序列必须与进化树上其它序列同源,但外类群序列与这些序列间的差异必须比这些序列之间的差异更显著。eukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaarchaeabacteriaoutgroup外群Howtorootatree?系统发育树构建步骤多序列比对(自动比对、手工校正)选择建树方法(替代模型)建立进化树进化树评估最大简约法(maximumparsimony,MP)距离法(distance)最大似然法(maximumlikelihood,ML)贝叶斯法(Bayesianinference)统计分析BootstrapLikelihoodRatioTest……UPGMA邻近法(Neighbor-joining,NJ)最小进化法(minimumevolution)距离法 距离法又称距离矩阵法,首先通过各个序列之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。进化树的构建则是基于这个矩阵中的进化距离关系。CatDogRatDog3Rat45Cow676CatDogRat11224Cow计算序列的距离,建立距离矩阵通过距离矩阵建进化树Step1.计算序列的距离,建立距离矩阵Uncorrected“p”distance(=observedpercentsequencedifference)Kimura2-parameterdistance(estimateofthetruenumberofsubstitutionsbetweentaxa)对位排列,去除空格(选择替代模型)由进化距离构建进化树的方法有很多,常见有:1.UnweightedPairGroupMethodwithArithmeticmean

(UPGMA)

2.Neighbor-JoiningMethod(NJ法/邻位连接法)

3.MinimumEvolution(MP法/最小进化法)Step2.通过矩阵建树 最大简约法(MP)最早源于形态性状研究,现在已经推广到分子序列的进化分析中。最大简约法的理论基础是奥卡姆(Ockham)哲学原则,对所有可能的拓扑结构进行计算,找出所需替代数最小的那个拓扑结构,作为最优树。

最大简约法(MaximumParsimony)FindthetreethatexplainstheobservedsequenceswithaminimalnumberofsubstitutionsSequence1TGCSequence2TACSequence3AGGSequence4AAG1

2

3PositionMP法建树流程If1and2aregroupedatotaloffourchangesareneeded.

If1and3aregroupedatotaloffivechangesareneeded.

If1and4aregroupedatotalofsixchangesareneeded.Position1

(1,2):1change;

(1,3)or(1,4):2changesPosition2

(1,3):1change;

(1,2)or(1,4):2changesPosition3

(1,2):1change;

(1,3)or(1,4):2changes456BESTMP法建树步骤最大似然法(MaximumLikelihood)最大似然法(ML)最早应用于对基因频率数据的分析上。其原理为选取一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构作为最优树。ML法建树流程CAGATGCCATGCPickanEvolutionaryModelForeachposition,GenerateallpossibletreestructuresBasedontheEvolutionaryModel,calculateLikelihoodoftheseTreesandSumthemtogettheColumnLikelihoodforeachOTUcluster.CalculateTreeLikelihoodbymultiplyingthelikelihoodforeachpositionChooseTreewithGreatestLikelihoodInferringthemaximumlikelihoodtreeHolder&Lewis(2003)NatureReviewsGenetics4,275-284Bayesianinference:Whatistheprobabilitythatthemodel/theoryiscorrectgiventheobserveddata?Pr(T|D)MaximumLikelihood:

Whatistheprobabilityofseeingtheobserveddata(D)givenamodel/theory(T)?Pr(D|T)SpeedNoneedforbootstrapping构建进化树的新方法——贝叶斯推断

(Bayesianinference)与ML相比,BI的优势:ComparisonofMethodsDistanceMaximumparsimonyMaximumlikelihoodUsesonlypairwisedistancesUsesonlysharedderivedcharactersUsesalldataMinimizesdistancebetweennearestneighborsMinimizestotaldistanceMaximizestreelikelihoodgivenspecificparametervaluesVeryfastSlowVeryslowEasilytrappedinlocaloptimaAssumptionsfailwhenevolutionisrapidHighlydependentonassumedevolutionmodelGoodforgeneratingtentativetree,orchoosingamongmultipletreesBestoptionwhentractable(<30taxa,homoplasyrare)GoodforverysmalldatasetsandfortestingtreesbuiltusingothermethodsBioinformatics:SequenceandGenomeAnalysis,2ndedition,byDavidW.Mount.p254ChoosingaMethodforPhylogeneticPrediction/cgi/content/full/2008/5/pdb.ip49MolecularBiologyandEvolution200522(3):792-802AssessingtreereliabilityPhylogeneticreconstructionisaproblemofstatisticalinference.Onemustassessthereliabilityoftheinferredphylogenyanditscomponentparts.Questions:(1)howreliableisthetree?(2)whichpartsofthetreearereliable?(3)isthistreesignificantlybetterthananotherone?Astatisticaltechniquethatusesintensiverandomresamplingofdatatoestimateastatisticwhoseunderlyingdistributionisunknown.评估进化树的可靠性——自展法(bootstrappingmethod)从排列的多序列中随机有放回的抽取某一列,构成相同长度的新的排列序列重复上面的过程,得到多组新的序列对这些新的序列进行建树,再观察这些树与原始树是否有差异,以此评价建树的可靠性TheBootstrap

Computationalmethodtoestimatetheconfidencelevelofacertainphylogenetictree.rat GAGGCTTATChuman GTGGCTTATCturtle GTGCCCTATGfruitfly CTCGCCTTTGoak ATCGCTCTTGduckweed ATCCCTCCGG

0123456789SamplerathumanturtlefruitflyoakduckweedInferredtreeMorereplicates(between100-1000)rat GGAAGGGGCThuman GGTTGGGGCTturtle GGTTGGGCCCfruitfly CCTTCCCGCCoak AATTCCCGCTduckweed AATTCCCCCT

0011222345Pseudosample1rat CCTTTTAAAThuman CCTTTTAAATturtle CCCCCTAAAT fruitfly CCCCCTTTTToak CCTTTCTTTTduckweed CCTTTCCCCG

4455567778Pseudosample2自展法检验流程Bootstrappingdoesn’treallyassesstheaccuracyofatree,onlyindicatestheconsistencyofthedata对ML法而言,自展法太耗时,可用aLRT法检验进化树的可靠性Anisimova&Gascuel(2006)Syst.Biol.55(4):539-552MSA程序可对任何序列进行比对,选择什么样的序列进行比对非常重要!!用于构建进化树的序列必须是同源序列MSA是构建分子进化树的关键步骤分子进化树构建(ClustalW)页面下方显示CladogramTree点击“ShowasPhylogramTree”展示PhylogramTree不推荐:仅提供距离法建树,且没有进行评估输入比对后的序列(或上载Alignments文件)EBI的ClustalW2-phylogeny分析网页http://www.ebi.ac.uk/Tools/phylogeny/clustalw2_phylogeny/看图工具下载“Phyliptreefile”(ph文件)TreeView

进化树编辑打印软件(在http://taxonomy.zoology.gla.ac.uk/rod/treeview.html)输入比对后的序列(或上载Alignments文件)用TreeView软件打开上述文件可以不同格式展示进化树(1、2、3)EBI的ClustalW2-phylogeny分析网页PHYLIPhttp:///phylip.html

免费的集成进化分析工具PAUPhttp:///商业软件,集成的进化分析工具MEGAhttp:///免费的图形化集成进化分析工具PHYMLhttp://atgc.lirmm.fr/phyml/最快的ML建树工具PAMLhttp://abacus.gene.ucl.ac.uk/software/paml.htmlML建树工具Tree-puzzle

http://www.tree-puzzle.de/

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论