版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章系谱分析生物信息学
2.系统发生分析(Phylogeneticanalysis)分析基因或蛋白质的进化关系系统发生(进化)树(phylogenetictree)Atreeshowingtheevolutionaryrelationshipsamongvariousbiologicalspeciesorotherentitiesthatarebelievedtohaveacommonancestor.经典进化生物学:比较:形态、生理结构、化石分子进化生物学:比较DNA和蛋白质序列研究系统发生的方法Residuesthatarelinedupindifferentsequencesareconsideredtoshareacommonancestry(i.e.,theyarederivedfromacommonancestralresidue).AnAlignmentisanhypothesisofpositionalhomologybetweenbases/AminoAcidsEasyonlywithsubstitutionsDifficultalsowith
indels=((A,(B,C)),(D,E))Newickformat节点Node分支BranchABCDE末端节点
可以是物种,群体,或者蛋白质、DNA、RNA分子等OTU祖先节点/树根Root系统发生树术语内部节点/分歧点该分支可能的祖先HTUAclade(进化支)
isagroupoforganismsthatincludesanancestorandalldescendentsofthatancestor.geneticchangenomeaningPhylogram
CladogramtimeTaxonATaxonBTaxonCTaxonD111635TaxonATaxonBTaxonCTaxonDTaxonATaxonBTaxonCTaxonDUltrametrictree
超度量树进化树分支树系统发生树术语Rootedtreevs.Unrootedtreetwomajorwaystoroottrees:ABCD102352d(A,D)=10+3+5=18Midpoint=18/2=9Bymidpointordistance有根树ACBD无根树系统发生树术语outgroup外群、外围支plantplantplantfungusanimalanimalanimalUnrootedtreerootRootedtreebacteriumanimalanimalanimalfungusplantplantplantMonophyleticgroupMonophyleticgroupRootedtreevs.Unrootedtree选择外群
(Outgroup)选择一个或多个已知与分析序列关系较远的序列作为外类群外类群可以辅助定位树根外类群序列必须与进化树上其它序列同源,但外类群序列与这些序列间的差异必须比这些序列之间的差异更显著。eukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaarchaeabacteriaoutgroup外群Howtorootatree?系统发育树构建步骤多序列比对(自动比对、手工校正)选择建树方法(替代模型)建立进化树进化树评估最大简约法(maximumparsimony,MP)距离法(distance)最大似然法(maximumlikelihood,ML)贝叶斯法(Bayesianinference)统计分析BootstrapLikelihoodRatioTest……UPGMA邻近法(Neighbor-joining,NJ)最小进化法(minimumevolution)距离法 距离法又称距离矩阵法,首先通过各个序列之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。进化树的构建则是基于这个矩阵中的进化距离关系。CatDogRatDog3Rat45Cow676CatDogRat11224Cow计算序列的距离,建立距离矩阵通过距离矩阵建进化树Step1.计算序列的距离,建立距离矩阵Uncorrected“p”distance(=observedpercentsequencedifference)Kimura2-parameterdistance(estimateofthetruenumberofsubstitutionsbetweentaxa)对位排列,去除空格(选择替代模型)由进化距离构建进化树的方法有很多,常见有:1.UnweightedPairGroupMethodwithArithmeticmean
(UPGMA)
2.Neighbor-JoiningMethod(NJ法/邻位连接法)
3.MinimumEvolution(MP法/最小进化法)Step2.通过矩阵建树 最大简约法(MP)最早源于形态性状研究,现在已经推广到分子序列的进化分析中。最大简约法的理论基础是奥卡姆(Ockham)哲学原则,对所有可能的拓扑结构进行计算,找出所需替代数最小的那个拓扑结构,作为最优树。
最大简约法(MaximumParsimony)FindthetreethatexplainstheobservedsequenceswithaminimalnumberofsubstitutionsSequence1TGCSequence2TACSequence3AGGSequence4AAG1
2
3PositionMP法建树流程If1and2aregroupedatotaloffourchangesareneeded.
If1and3aregroupedatotaloffivechangesareneeded.
If1and4aregroupedatotalofsixchangesareneeded.Position1
(1,2):1change;
(1,3)or(1,4):2changesPosition2
(1,3):1change;
(1,2)or(1,4):2changesPosition3
(1,2):1change;
(1,3)or(1,4):2changes456BESTMP法建树步骤最大似然法(MaximumLikelihood)最大似然法(ML)最早应用于对基因频率数据的分析上。其原理为选取一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构作为最优树。ML法建树流程CAGATGCCATGCPickanEvolutionaryModelForeachposition,GenerateallpossibletreestructuresBasedontheEvolutionaryModel,calculateLikelihoodoftheseTreesandSumthemtogettheColumnLikelihoodforeachOTUcluster.CalculateTreeLikelihoodbymultiplyingthelikelihoodforeachpositionChooseTreewithGreatestLikelihoodInferringthemaximumlikelihoodtreeHolder&Lewis(2003)NatureReviewsGenetics4,275-284Bayesianinference:Whatistheprobabilitythatthemodel/theoryiscorrectgiventheobserveddata?Pr(T|D)MaximumLikelihood:
Whatistheprobabilityofseeingtheobserveddata(D)givenamodel/theory(T)?Pr(D|T)SpeedNoneedforbootstrapping构建进化树的新方法——贝叶斯推断
(Bayesianinference)与ML相比,BI的优势:ComparisonofMethodsDistanceMaximumparsimonyMaximumlikelihoodUsesonlypairwisedistancesUsesonlysharedderivedcharactersUsesalldataMinimizesdistancebetweennearestneighborsMinimizestotaldistanceMaximizestreelikelihoodgivenspecificparametervaluesVeryfastSlowVeryslowEasilytrappedinlocaloptimaAssumptionsfailwhenevolutionisrapidHighlydependentonassumedevolutionmodelGoodforgeneratingtentativetree,orchoosingamongmultipletreesBestoptionwhentractable(<30taxa,homoplasyrare)GoodforverysmalldatasetsandfortestingtreesbuiltusingothermethodsBioinformatics:SequenceandGenomeAnalysis,2ndedition,byDavidW.Mount.p254ChoosingaMethodforPhylogeneticPrediction/cgi/content/full/2008/5/pdb.ip49MolecularBiologyandEvolution200522(3):792-802AssessingtreereliabilityPhylogeneticreconstructionisaproblemofstatisticalinference.Onemustassessthereliabilityoftheinferredphylogenyanditscomponentparts.Questions:(1)howreliableisthetree?(2)whichpartsofthetreearereliable?(3)isthistreesignificantlybetterthananotherone?Astatisticaltechniquethatusesintensiverandomresamplingofdatatoestimateastatisticwhoseunderlyingdistributionisunknown.评估进化树的可靠性——自展法(bootstrappingmethod)从排列的多序列中随机有放回的抽取某一列,构成相同长度的新的排列序列重复上面的过程,得到多组新的序列对这些新的序列进行建树,再观察这些树与原始树是否有差异,以此评价建树的可靠性TheBootstrap
Computationalmethodtoestimatetheconfidencelevelofacertainphylogenetictree.rat GAGGCTTATChuman GTGGCTTATCturtle GTGCCCTATGfruitfly CTCGCCTTTGoak ATCGCTCTTGduckweed ATCCCTCCGG
0123456789SamplerathumanturtlefruitflyoakduckweedInferredtreeMorereplicates(between100-1000)rat GGAAGGGGCThuman GGTTGGGGCTturtle GGTTGGGCCCfruitfly CCTTCCCGCCoak AATTCCCGCTduckweed AATTCCCCCT
0011222345Pseudosample1rat CCTTTTAAAThuman CCTTTTAAATturtle CCCCCTAAAT fruitfly CCCCCTTTTToak CCTTTCTTTTduckweed CCTTTCCCCG
4455567778Pseudosample2自展法检验流程Bootstrappingdoesn’treallyassesstheaccuracyofatree,onlyindicatestheconsistencyofthedata对ML法而言,自展法太耗时,可用aLRT法检验进化树的可靠性Anisimova&Gascuel(2006)Syst.Biol.55(4):539-552MSA程序可对任何序列进行比对,选择什么样的序列进行比对非常重要!!用于构建进化树的序列必须是同源序列MSA是构建分子进化树的关键步骤分子进化树构建(ClustalW)页面下方显示CladogramTree点击“ShowasPhylogramTree”展示PhylogramTree不推荐:仅提供距离法建树,且没有进行评估输入比对后的序列(或上载Alignments文件)EBI的ClustalW2-phylogeny分析网页http://www.ebi.ac.uk/Tools/phylogeny/clustalw2_phylogeny/看图工具下载“Phyliptreefile”(ph文件)TreeView
进化树编辑打印软件(在http://taxonomy.zoology.gla.ac.uk/rod/treeview.html)输入比对后的序列(或上载Alignments文件)用TreeView软件打开上述文件可以不同格式展示进化树(1、2、3)EBI的ClustalW2-phylogeny分析网页PHYLIPhttp:///phylip.html
免费的集成进化分析工具PAUPhttp:///商业软件,集成的进化分析工具MEGAhttp:///免费的图形化集成进化分析工具PHYMLhttp://atgc.lirmm.fr/phyml/最快的ML建树工具PAMLhttp://abacus.gene.ucl.ac.uk/software/paml.htmlML建树工具Tree-puzzle
http://www.tree-puzzle.de/
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国四柱下压式油压机项目投资可行性研究报告
- 下颌骨继发恶性肿瘤的护理个案
- 2025年下半年中国石油宝鸡石油钢管限责任公司招聘10人易考易错模拟试题(共500题)试卷后附参考答案
- 2025授权选矿加工合作协议模板
- 2025年下半年中国海洋石油集团限公司秋季校园招聘易考易错模拟试题(共500题)试卷后附参考答案
- 2025年下半年中国国家电网广西分公司校园招聘740人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年下半年中国人民财产保险雅安分公司招聘工作人员易考易错模拟试题(共500题)试卷后附参考答案
- 2025年下半年中储粮(海南)限公司招聘易考易错模拟试题(共500题)试卷后附参考答案
- 2025年下半年下半年海南琼海市事业单位招聘工作人员78人笔试易考易错模拟试题(共500题)试卷后附参考答案
- 2025授权公司房屋租赁合同范本
- 啤酒厂筹建项目可行性研究报告
- 展会活动中如何提高观众的参与度与满意度研究报告
- 智能化与低碳化的关系
- 晚秋和值谜字谜
- K12教培咨询师培训
- 2016大型年会晚会筹备工作分工推进计划表(专业详细完整版)
- 《乌有先生历险记》课件
- 人教版小学一年级上册数学期中试卷(可直接打印)
- 英语-山西省太原市2024-2025学年高一上学期11月期中考试试题和答案
- 《书戴嵩画牛》知识清单
- 《基于拓展引力模型的制度距离对我国在东盟OFDI的影响实证研究》13000字(论文)
评论
0/150
提交评论