分子进化分析与相关分析软件的应用_第1页
分子进化分析与相关分析软件的应用_第2页
分子进化分析与相关分析软件的应用_第3页
分子进化分析与相关分析软件的应用_第4页
分子进化分析与相关分析软件的应用_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分子进化分析与相 关分析软件的应用 生命科学学院 2005.4 内容提要 v 分子进化分析介绍 v 系统发育树重建方法 vPhylip软件包在分子进化分析中的应用 vPAUP*在分子进化分析中的应用 内容提要 v 分子进化分析介绍 v 系统发育树重建方法 vPhylip软件包在分子进化分析中的应用 vPAUP*在分子进化分析中的应用 从物种的一些分子特性出发,从而了 解物种之间的 生物系统发生 的关系。 蛋白和核酸序列 通过序列 同源性的比较 进而了解 基因的进 化 以及 生物系统发生 的内在规律。 分子进化研究的目的 系统发育树是什么? 对一组实际对象的 世系关系 的描述(如基 因,物种等)。 一个系统发育树 末端 物种 顶端 中间节点 中间枝条 根 末端分支 叶子 节点 A B C D E F G 树只代表分支的拓扑结构 F GCD E A B 分子进化研究的基础(假设) v 核苷酸和氨基酸序列中含有生物进化历史的 全部信息。 v 在各种不同的发育谱系及足够大的进化时间 尺度中,许多序列的进化速率几乎是恒定不 变的。(分子钟理论, 1965 ) 分子进化研究的基础(理论) v 虽然很多时候仍然存在争议,但是分子进化 确实能阐述一些生物系统发生的内在规律。 分子进化研究的基础(实际) 从一个分歧数据可以推测其他 序 列 分 歧 度 分歧时间 x y 分子钟理论 v 直系同源 (orthologs): 同源的基因是由于 共同的祖先基因进化而产生的 . v 旁系同源 (paralogs): 同源的基因是由于 基因复制产生的 . (以上定义源自 Fitch, W.M. (1970) Distinguishing homologous from analogous proteins. Syst. Zool. 19, 99113) 直系同源与旁系同源 paralogs orthologs paralogs orthologs Erik L.L. Sonnhammer Orthology,paralogy and proposed classification for paralog subtypes TRENDS in Genetics Vol.18 No.12 December 2002 http:/tig.trends.co m 0168-9525/02/$ see front matter 2002 Elsevier Science Ltd. All rights reserved. 以上两个概念代表了两个不同的进化事件 用于分子进化分析中的序列 必须是直系同源 的,才能真实反映进化过程。 趋同 进化的基因 (genes have converged function by separate evolutionary paths) 异源 基因或水平转移基因 (xenologous or horizontally transferred genes) Bacterium 1 Bacterium 3 Bacterium 2 Eukaryote 1 Eukaryote 4 Eukaryote 3 Eukaryote 2 Bacterium 1 Bacterium 3 Bacterium 2 Eukaryote 1 Eukaryote 4 Eukaryote 3 Eukaryote 2 Phylograms show branch order and branch lengths 进化树,有分支和支长 信息 2.进化分支图,进化树 Cladograms show branching order - branch lengths are meaningless 进化分支图,只用分支 信息,无支长信息。 Rooted by outgroup archaea archaea archaea eukaryote eukaryote eukaryote eukaryote bacteria outgroup root eukaryote eukaryote eukaryote eukaryote 无根树 archaea archaea archaea Monophyletic group(单源群 ) Monophyletic group 3.有根树,无根树,外围群 有根树 外围群 4.基因树,物种树 We often assume that gene trees give us species trees a b c A B D Gene tree Species tree 内容提要 v 分子进化分析介绍 v 系统发育树重建方法 vPhylip软件包在分子进化分析中的应用 vPAUP*在分子进化分析中的应用 系统发育树重建分析步骤 多序列比对(自动比对,手工比对) 建立取代模型(建树方法) 建立进化树 进化树评估 Bioinformatics Sequence and Genome Analysis David W.Mount Chapter 6 Phylogenetic Prediction The Source Below Come From: 系统发育树重建的基本方法 v 最大简约法 (maximum parsimony,MP) v 距离法 (distance) v 最大似然法 (maximum likelihood,ML) 最大简约 法( MP) 最大简约法 (maximum parsimony,MP)最 早源于形态性状研究,现在已经推广到分子 序列的进化分析中。最大简约法的理论基础 是奥卡姆( Ockham) 哲学原则,这个原则 认为:解释一个过程的最好理论是所需假设 数目最少的那一个。 对所有可能的拓扑结构 进行计算,并计算出所需替代数最小的那个 拓扑结构,作为最优树。 序列个数与树的个数的关系 信息位点 (Sites are informative) 所谓信息位点,它必须在至少 2个分类群中具有 相同的序列性状。 信息位点是指那些至少存在 2个不同碱基且每个 不同碱基至少出现两次的位点。 优点: 最大简约法 不需要在处理核苷酸或者氨基 酸替代的时候引入假设(替代模型)。 此外,最大简约法对于分析某些特殊的分 子数据如插入、缺失等序列有用。 最大简约法( MP) 缺点: 在分析的序列位点上 没有回复突变或平 行突变 ,且被检验的序列位点数很大的时候 ,最大简约法能够推导获得一个很好的进化 树。 然而在分析序列上 存在较多的回复突变 或平行突变 ,而被检验的序列位点数又比较 少的时候,最大简约法可能会给出一个不合 理的或者错误的进化树推导结果。 最大简约法 ( MP) 距离法 距离法又称距离矩阵法,首先通过各个物 种之间的比较, 根据一定的假设(进化距离 模型)推导得出分类群之间的进化距离,构 建一个进化距离矩阵。 进化树的构建则是基 于这个矩阵中的进化距离关系 。 计算序列的距离,建立距离矩阵 通过距离矩阵建进化树 一种简单的距离矩阵 由进化距离构建进化树的方法有很多,常见有 : 1.Fitch-Margoliash Method( FM法) 2. Neighbor-Joining Method (NJ法 /邻接法 ) 3. Neighbors Relaton Method(邻居关系法 ) 4.Unweighted Pair Group Method (UPGMA法 ) 通过矩阵建树的方法 Fitch-Margoliash方法( FM法) DE距离 =d+e (1) D到 ABC间的平均距离 =d+m (2) E到 ABC间的 平均距离 =e+m (3) (2)-(3)+(1) d=4,e=6 c+g+(e+d)/2=19 (1) c+f+(a+b)/2=40 (2) (e+d)/2+(a+b)/2+f+g=41 (2) (1)+(2)-(3) 得: c=9 c+g+(e+d)/2=19 (e+d)/2=5,c=9,则 g=5 由: (a+b)/2+f+g+(d+e)/2=41 得: f=20 由: a+f+c=39 得: a=10, 则 b=12 1.找出关系最近的序列对,如 A和 B 2.将剩余的序列作为一个简单复合序列,分别计 算 A、 B到所有其他序列的距离的平均值 3.用这些值来计算 A和 B间的 距离 4.将 A、 B作为一个单一的复合序列 AB, 计算与 每一个其他序列的距离,生成新的距离矩阵 5.确定下一对关系最近的序列,重复前面的步聚 计算枝长 7.从每个序列对开始,重复整个过程 8.对每个树计算每对序列间的预测距离,发现与 原始数据最符合的树 Fitch-Margoliash方法( FM法)小结 NJ/邻接法 任意两个节点选为相邻序列的总支长计算公式 把 A、 B看成一个新的复合序 列,构建一个新的距离表,重复 以上过程。 邻居关系法 AB组合出现 3次, DE组合出现 3次, CD、 AC、 BC组合各一 次,则 AB和 DE各为两对关系最近的邻居。(关系最近的邻 居作为邻居的次数最多),将邻居看成一个新的复合序列, 重复这个过程。 UPGMA法 d=e=10/2=5 c=19/2=9.5 g=c-d=9.5-5=4.5 a=b=22/2=11 A B (CDE) A - 22 39.5 B - - 41.5 (CDE) - - - (AB) (CDE) (AB) - 40.5 (CDE) - - f1+a=f2+c=40.5/2=20.25 f1=9.25 , f2=11.75 距离矩阵的改进:将序列相似性转化为距离记分 蛋白质的正规化相似性记分 Sreal:实际的相似性记分值 Srand:背景平均记分值(随机情况下可能的记分值 ) Sident:该 长度下相似性记分的预测值 P=0.007时 Srand的值为: 其中, 、 K由打分矩阵给出 对于长度为 m和 n的 序列的排列的预测值 Sident为 : Sii为匹配记分, Pi为每种氨基酸的比例, n为较短序列的长度 修正后的相似值 S表示为: 一旦得到 S值,就可以用 1-S计算序列的距离,实 际中的距离计算则用下面的式子: 最大似然法( ML) 最大似然法 (maximum likelihood,ML)最早 应用于系统发育分析是在对基因频率数据的 分析上,后来基于分子序列的分析中也已经 引入了最大似然法的分析方法。 最大似然法分析中, 选取一个特定的替代 模型来分析给定的一组序列数据,使得获得 的每一个拓扑结构的似然率都为最大值,然 后再挑出其中似然率最大的拓扑结构作为最 优树 。在最大似然法的分析中,所考虑的参 数并不是拓扑结构而是每个拓扑结构的枝长 ,并对似然率球最大值来估计枝长 。 最大似然法( ML) 最大似然法的建树过程是个很 费时 的过程,因 为在分析过程中有很大的计算量,每个步骤都要考 虑内部节点的所有可能性。 最大似然法是一个比较成熟的参数估计的统计 学方法,具有很好的统计学理论基础,在当样本量 很大的时候,似然法可以获得参数统计的最小方差 。只要使用了 一个合理的、正确的替代模型 ,最大 似然法可以推导出一个很好的进化树结果。 最大似然法( ML) 碱基 变化的通用模型 L( Tree1) =L1L2 L6 L( Tree2) =L1 L2 L6 位置 1 位置 2 位置 3 SUM 拓扑 树 A L( A1 ) L( A2) L( A3 ) Asum 拓扑 树 B L( B1 ) L( B2) L( B3 ) Bsum 拓扑 树 C L( C2 ) L( C3) L( C3 ) Csum 似然值 最大,即 SUM最大的拓扑树则为最优树 。 由于最大似然法的分析过程需要耗费较多 的时间,针对这种情况,发展出了许多优化 的可以加快最大似然法寻找最优树的搜索方 法,如 启发式搜索 , 分枝交换搜索 等。最大 似然法具有坚实的统计学理论基础,充分的 使用了分析序列中的信息资源,只要采用了 合理的替代模型,可以得出很好的进化树分 析结果。 最大似然法( ML) 选择外类群 ( Outgroup) 选择一个或多个已知与分析序列关系较 远的序列作为外类群 外类群可以辅助定位树根 外类群序列必须与剩余序列关系较近, 但外类群序列与其他序列间的差异必须比 其他序列之间的差异更显著。 bacteria outgroup eukaryote eukaryote eukaryote eukaryote archaea archaea archaea 外围群 进化树的可靠性分析 自展 法( Bootstrap Method ) 从排列的多序列中随机有放回的抽取某一列, 构成相同长度的新的排列序列 重复上面的过程,得到多组新的序列 对这些新的序列进行建树,再观察这些树与原 始树是否有差异,以此评价建树的可靠性 原始排列 Alpha AACAAC Beta AACCCC Gamma ACCAAC Delta CCACCA Epsilon CCAAAC Bootstrap1 Alpha ACAAAC Beta ACCCCC Gamma ACAAAC Delta CACCCA Epsilon CAAAAC Bootstrap2 Alpha AAAACC Beta AACCCC Gamma CCAACC Delta CCCCAA Epsilon CCAACC Bootstrap3 Alpha ACAAAC Beta ACCCCC Gamma CCAAAC Delta CACCCA Epsilon CAAAAC 内容提要 v 分子进化分析介绍 v 系统发育树重建方法 vPhylip软件包在分子进化分析中的应用 vPAUP*在分子进化分析中的应用 常见的分子进化分析程序 1.Phylip 由华盛顿大学遗传学系开发,是一个免费的系统发 育分析软件包,可以通过以下地址下载。 /phylip.html 2. PAUP* 最早是在苹果机上开发的具有菜单界面的进 化分析软件,早先版本只有 MP法,后续版 本已经包括距离法和 ML法,现今有 mac, win, linux等多种版本,该软件不是免费软 件,使用者需要向开发者购买。 Phylip软件包介绍 Phylip是一个免费的系统发生 (phylogenetics) 分析软件包。以下链接可以下载: http:/evolution.genetics,/phylip.htm l 由华盛顿大学遗传学系开发, 1980年首次公布, 目前的版本是 3.6( 2000年 6月)。 Phylip软件包介绍 Phylip包含了 35个独立的程序,这些独立的 程序都实现特定的功能,这些程序基本上包 括了系统发生分析的所有方面。 Phylip有多种不同平台的版本(包括 windows, Macintosh, DOS, Linux, Unix 和 OpenVMX)。 Phylip是目前最广泛使用的系统发生分析程 序,主要包括一下几个程序组: 分子序列组 , 距离矩阵组 ,基因频率组,离散字符组, 进化树绘制组 。 Phylip软件包介绍 分子序列组: 1.蛋白质序列: protpars, proml, promlk, protdist 2.核酸序列: dnapenny, dnapars, dnamove, dnaml, dnamlk, dnainvar, dnadist, dnacomp Phylip软件包分组介绍 距离矩阵组: Fitch, kitsch, neighbor 基因频率组: Gendist, contml 离散字符组 Pars, mix, move, penny, dollop, dolmove , dolpenny, clique, factor Phylip软件包分组介绍 进化树绘制组: drawtree, drawgram 其他: restdist, restml, seqboot, contrast treedist, consense, retree Phylip软件包分组介绍 Phylip软件包的文档是非常详细的,对于每 个独立的程序,都有一个独立的文档,详细 的介绍了该程序的使用及其说明。 此外, Phylip软件包还包括程序的源代码( c 语言)。 Phylip软件包的文档 Phylip软件包的应用 1,根据你的分析数据,选择适当的程序 如,你分析的是 DNA数据,就在核酸序列分 析类中选择程序( dnapenny, dnapars, dnamove, dnaml, dnamlk, dnainvar, dnadist, dnacomp ) 如果分析的 是离散数据,如突变位点数据,就在离散字 符组里面选择程序。 2.选择适当的分析方法 如你分析的是 DNA数据,可以选择简约法( DNAPARS), 似然法( DNAML, DNAMLK), 距离法等( DNADIST)。 。 Phylip软件包的应用 3.进行分析 选择好程序后,执行,读入分析数据,选择 适当的参数,进行分析,结果自动保存为 outfile, outtree。 Phylip软件包的应用 Outfile是一个记录文件,记录了分析的过 程和结果,可以直接用文本编辑器(如写字 板)打开。 outtree是分析结果的树文件,可以用 phylip提供的绘树程序打开查看,也可以用 其他的程序来打开,如 treeview Phylip软件包的应用 v 出发数据已经排列好的蛋白序列。 v 重构算法距离法 (protdist.exe) v 最大简约法 (protpars.exe) v 最大似然法 (proml.exe) v 统计分析拨靴 法 (bootstrap) 实际应用(从蛋白序列推导进化树) 实际操作 v Phylip软件包中的每个分析程序都是一个 独立的应用程序。我们选择好了分析算法 后,按一定的顺序组合使用选择的程序, 就可以获得按选择的算法分析的结果(进 化树)。 v 例子:从我们刚刚通过 clustal比对获得的 蛋白序 列推测进化树。 v 选择方法:距离法 (protdist.exe) v 第一步:双击执行 protdist.exe,根据提示输入分析 的 v 文件名 (程序默认是 infile)。 v 第二步:设定各个参数,执行程序,获得距 离矩阵数据输出文件 outfile。 v 第三步:选择通过距离矩阵推测进化树的算法 (fitch.exe, kotsch.exe, neighbor.exe)。 v 第四步:将刚获得的输出文件改名为 infile, 执行 选择的推测算法 (neighbor.exe)。 设置好参数后执 行程序,获得 outfile和 outtree两个结果输出。 获得的结果文件中, outtree文件是一个树文件, 可以用 treeview等软件打开。 outfile是一个分析结 果的输出报告,包括了树和其他一些分析报告, 可以用记事本直接打开。 outfile outtree 加入统计分析 (bootstrap) v 我们刚刚获得的进化树是纯粹的根据先前 获得的排列数据所推导出来的。有很多可 能使得这个树并不一定可靠。 v1.测序的出错。 v2.多序列比对算法本身的问题。 v3.其他的问题。 v 我们可以引进一些统计分析来寻找更优的 进化树 v 最常见的就是 bootstrap分析。 Bootstrap分析 vPhylip软件包中有两个用于执行 bootstrap分 析的程序。 (seqboot.exe,consence.exe)。 v 分析过程: v1.Seqboot产生大量的数据组 v2.应用选择的算法对产生的数据组进行分析 。 v3.由 consence获得最优树。 内容提要 v 分子进化分析介绍 v 系统发育树重建方法 vPhylip软件包在分子进化分析中的应用 vPAUP*在分子进化分析中的应用 PAUP*的使用 vPAUP*的数据格式 (Nexus) #NEXUS begin taxa; dimensions ntax=12; taxlabels Lemur_catta Tarsius_syrichta; end; begin characters; dimensions nchar=898; format missing=? gap=- matchchar=. interleave datatype=dna; options gapmode=missing; matrix Lemur_catta AAGCTTCATAGGAGCAACCATTCTAATAATCGCACATGGCCTTACATCATCCATATTATT Homo_sapiens AAGCTTCACCGGCGCAGTCATTCTCATAATCGCCCACGGGCTTACATCCTCATTACTATT Pan AAGCTTCACCGGCGCAATTATCCTCATAATCGCCCACGGACTTACATCCTCATTATTATT Gorilla AAGCTTCACCGGCGCAGTTGTTCTTATAATTGCCCACGGACTTACATCATCATTATTATT Pongo AAGCTTCACCGGCGCAACCACCCTCATGATTGCCCATGGACTCACATCCTCCCTACTGTT Hylobates AAGCTTTACAGGTGCAACCGTCCTCATAATCGCCCACGGACTAACCTCTTCCCTGCTATT v begin assumptions; v charset coding = 2-457 660-896; v charset noncoding = 1 458-659 897-898; v charset 1stpos = 2-4573 660-8963; v charset 2ndpos = 3-4573 661-8963; v charset 3rdpos = 4-4573 662-.3; v v exset coding = noncoding; v exset noncoding = coding; v v usertype 2_1 = 4 weights transversions 2 times transitions v a c g t v a . 2 1 2 v c 2 . 2 1 v g 1 2 . 2 v t 2 1 2 . v ; v usertype 3_1 = 4 weights transversions 3 times transitions v a c g t v a . 3 1 3 v c 3 . 3 1 v g 1 3 . 3 v t 3 1 3 . v ; v v taxset hominoids = Homo_sapiens Pan Gorilla Pongo Hylobates; v end; v begin paup; v constraints ch = (Homo_sapiens,Pan); v constraints chg = (Homo_sapiens,Pan,Gorilla); v end; vPAUP*的数据格式 (Nexus) 主要包括 taxa, characters, assumptions, sets, trees, codons, distances, paup八 个 数据块。 对于一个常规的分析, taxa, characters块 是必须的。而分析的命令可以通过菜单操作 ( mac), 或者键盘命令 (win,linux), 也可以 在 nexus文件中加入 paup命令块 1.TAXA块 主要是定义所分析的数据(如分子序列) 个数 ,以及这些数据的名称(如 物种名称 )。 2. CHARACTERS 块 主要是定义数据矩阵(如多序列比对结果 )和其他一些相关的信息(如序列特征值 ,序列有效区域等) PAUP*的 Nexus的文件块 3. ASSUMPTIONS块 定义了对数据的一些设定,如那些特征值 是不需考虑的,怎么处理 gap这个特征值 等,用户自定义的一些数据也放在这块, 如自定义的打分矩阵。 4. SETS块 定义了一系列的数据组,如特征值组,物 种组等,这些设置都是为了方便后续的分 析。 5. TREES 块 定义了用户自己设定的树。用于后续的分 析,如作为限制树等。 6. CODONS 块 定义了遗传密码子的一些信息。如编码的 位置(哪些是编码的,密码子的位点等) 。 7. DISTANCES 块 定义了一些距离矩阵。 8. PAUP 块 是软件的核心块,所有的分析命令和一些 参数设置( 90多个命令)都放在这一块。 这一块并不是分析输入数据所必须的,这 些命令可以写在这一块(文件中),这时 载入文件时就开始根据该块的命令进行分 析(有点类似 dos的批处理过程)。当然也 可以通过键盘命令逐一敲入 , 交互 进行分 析。 批处理 的方式在分析过程比较长,耗时比 较久的时候是比较有用的。当然在进行处 理之前一定要先保证该批处理过程没有问 题。 一个 PAUP*的基本分析实例 1.通过 clustalw/clustalx获取一个多序列比对结 果(可能要经过人工调整,推荐用 bioedit做 辅助编辑器)。保存 成 nexus格式的文件, 或者用其他格式转换软件转换成 nexus格式 。 paup*中也有一个 tonexus命令可以将其他 格式(包括 phylip, GCG等格式)的文件转 换为 nexus格式的文件。 2.在 PAUP*程序中读入数据( Nexus格式) 输入命令的 地方 打开文件 的窗口 程序自带的 测试数据 执行该文件还是编辑该文件? 执行文件时将文件数据读入程序,编辑文件则调用 一个文本编辑器。如果不是 nexus格式,执行时候 会出错,然后调用文本编辑器打开。 3.数据输入完成,开始分析 两个很有用的命令 ? :显示所有的命令 命令 ? :显示命令的所有参数 分析 (开始一) 1.开始之前 打开记录文件?(跟踪整个分析过程) 命令: log start file =your_log_file_name; 停止: log stop; 2.设置数据 哪些用于分析 ? 如: include coding/only; exclude coding/only; 哪些物种要分析(删除不要的) ? 如: delete 1; 或者 delete taxa_name undelete 1; 分析 (开始二) 3.确定建树方法 最大简约法?最大似然法? 距离法? 命令: Set criterion=parsimony|likelihood|distance; 分析 (建树一) 4.确定其他参数 Set ? 查看其他参数的设置,改为自己所需要 的设置。 如: set maxtree=10000 increase=no autoclose=yes; 分析 (建树二) 5.确定搜索方法(对于距离法不适用) 穷尽法: alltrees 分支跳跃查找: bandb 启发式搜索: hsearch 其他: puzzle( 只在 likelihood时有效) 分析 (建树三) 6.开始搜索树之前(设置各个建树方法的参数 ) 距离法: dset 如: dset distance=tamnei negbrlen=allow 最大简约法: pset 如 pset collapse=no gapmode=newstate 最大似然法: lset 如: lset nst=6 clock=yes 分析 (建树四) 7.再次确认参数 是否要设置外围群( outgroup) ? 如 outgroup 1,2 ;或者 outgroup taxa_set; 其他参数? 分析 (建树五) 7.开始搜索树 距离法: NJ, UPGMA 最大简约法,最大似然法 Hsearch ? 参数是否要更改? 如: hsearch andseq=random swap=spr 分析 (建树六) 8.进化树的评估 选择评估方法? Bootstrap( 自展法) 用的最多, 是对进化树重新取样的评估方法,可 以对距离法,简约法,似然法以及衍生出的任何 其他方法构建的进化树进行评估。其分析结果是 一组数字,这个数字描述了进化树进化分支的支 持比例,也就是进化树分支的稳健性。 分析 (树评估一) 分析 (树评估二) 未经过 bootstrap的树 Bootstrap后的树 v BOOTSTRAP options/heuristic-search-options|branch-and-bound-search- options; v 使用分支限制或者是启发式搜索的方法进行 bootstrap分析。 v 参数: v BSEED = integer-value 随机数种子。 v NREPS = integer-value bootstrap重复的次数,默认值为 100。 v SEARCH = HEURISTIC|BANDB|FASTSTEP|NJ|UPGMA 搜索方式 v CONLEVEL = integer-value bootstrap重复次数的最低比率,默认为 50。 v KEEPALL = YES|NO v WTS = IGNORE|SIMPLE|REPEATCNT|PROPORTIONAL v NCHAR = CURRENT|number-of-characters 每次重复采样的数目。 v GRPFREQ = YES|NO 显示 bootstrap分割频率 v TREEFILE = bootstrap-tree-file-name 树的文件 v FORMAT= NEXUS|ALTNEXUS|FREQPARS|PHYLIP|HENNIG v BRLENS = YES|NO 分支的长度 v *REPLACE = YES|NO v CUTOFFPCT = integer-value 定义显示的最低 bootstrap分割频率。 v Example v bootstrap nreps=200 treefile=boot.tre search=heuristic/addseq=random; 分析 (树评估三) PAUP*中的 bootstrap命令 对折分析 ( jackknife) 跟 bootstrap类似,只是在对原始数据取样的 时候不会取重复的数据位点。因为它重复取 样的时候是在原始数据中除去一个或者多个 比对位点。 对折分析得出的结果和 bootstrap是一样的。 命令和参数都类似,用的比 bootstrap少很多 。 分析 (树评估四) v JACKKNIFE options/heuristic-search-options|branchand-bound-search-options; 对折分析 v PCTDELETE = real-value 每个对折分析循环中删除的 data set百分数 v JSEED = integer-value 随机数种子 v NREPS = integer-value 对折循环次数 v SEARCH = HEURISTIC|BANDB|FASTSTEP|NJ|UPGMA 树的搜索方法( NJ和 UPGMA仅在最优规 v 则为 distance时才可用) v RESAMPLE = NORMAL|JAC v CONLEVEL = integer-value boostrap中出现的最小比例(最为保留 group), 默 认为 50,即 50 v KEEPALL = YES|NO 低于 conlevel的树,若与一致树兼容,也保留 v WTS = IGNORE|SIMPLE|REPEATCNT|PROPORTIONAL v GRPFREQ = YES|NO 显示对折分区频率 v TREEFILE = tree-file-name v FORMAT = NEXUS|ALTNEXUS|FREQPARS|PHYLIP|HENNIG v *REPLACE = YES|NO v CUTOFFPCT = integer-value

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论