使用贝叶斯方法构建系统发育树mrbayes_第1页
使用贝叶斯方法构建系统发育树mrbayes_第2页
使用贝叶斯方法构建系统发育树mrbayes_第3页
使用贝叶斯方法构建系统发育树mrbayes_第4页
使用贝叶斯方法构建系统发育树mrbayes_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

用贝叶斯方法构建系统进化树MrBAyesmrBayes要求的比较文件的格式是nex。如果比较是选择并输出这种文件格式,那么可以在命令提示符下运行mtBayes,并在CMD中输入mrBayes。出现以下界面在界面中输入exe文件(或执行文件,其中file是序列文件名)以获得以下界面如果没有错误,数据文件格式是正确的。设置替换模型参数您可以使用帮助lset查看由lset设置的参数Nucmodel:是指核酸的类型。4by4指的是序列上没有区别的位点。密码子指密码子模型的使用。此时,序列中每个位点的置换率将从密码子模型中推断出来。双重序列通常用于具有共同进化效应的序列。一般来说,可以使用4by4。如果是编码序列,最好使用密码子:核酸替代模型。1是JC69模型,即单参数模型。2是F81型号。6是GTR模型。在mrBayes中,可以尝试分别运行三个模型来选择最佳结果。代码:指密码子编码规则。通用是指通用密码子的使用规则。如果线粒体中的基因被推测,Metmt是必需的,叶绿体需要支原体倍性:比率:指定序列中每个站点的替换比率。相等意味着替换率是一致的。伽马表示伽马用于确定序列的替换率。Ngammacat:使用上述参数,如果更换率设置为、和Adgamma,则需要设置该选项。同上。使用类似命令设置参数,如lset Nst=6 Rate=。设置模型的先验信息使用帮助文件查看相关参数及其描述一般来说,需要注意的参数是:过渡:指定过渡和横向的比例。固定可以用来指定,或者贝塔分布可以用来模拟生成。Revmatpr:在GTR模型中指定替换率的先验分布。Aamodelpr:指定氨基酸替代模型中参数的先验分布。状态频率:指定GTR模型中核苷酸平衡频率的先验概率。Shapepr:设置速率分布的比例参数。设置采样信息使用帮助mcmc查看相关参数Ngen:指总采样次数。Nruns:规定了独立分析的数量。如果为2,则表示程序从两个独立的树开始采样,并在分析完成后综合两个分析结果。Nchain:设置每次分析运行的链数。Samplefreq:从样本总数中指定采样频率。这通常与Ngen一起使用,以确保分析的最终样本量足够。例如,Samplefreq设置为100,000,nruns设置为1000。因此,从100,000个随机样本中的每一个中抽取一个样本,并且可以获得总共1000个样本。Burninfrac:该参数控制待分析样品的数量。MCMC采样开始时的数据通常不可靠,需要删除。Burninfrac控制移除的百分比。如果为0.25,则移除样本的前25%数据。因此,用于分析的样本总数为1000*(1-0.25)=750。使用类似的命令设置相关参数,如mcmcmcpgen=10000和Samplefreq=10。设置完成后,输入MCMC并输入,程序开始运行。最后一列中的时间表示程序完成所需的时间。当程序完成时,它将提示分析是否需要继续。这意味着如果采样不稳定,我可以继续增加样本数量。判断它是否稳定的依据是这一行提示的差异足够小。通常小于0.01可以被认为达到了平衡。上图显示方差变化为0.01,分析可视为稳定。因此,不需要更多的取样分析,输入“否”并进入车辆。在屏幕输出中查找链交换信息。如果由链交换信息显示的四个链之间的交换频率在0.1和0.8之间,则结果可以被认为是合理的,并且可以进行下一个分析。否则,必须重置参数:包括足够长的Ngen,并适当降低温度等。如果结果合理,输入sumburnin=250 (250是根据burnin=0.25计算的,samplefreq=10,Ngen=10000)主要与屏幕的输出结果有关。如果数字1和2在屏幕上没有明显的上升趋势,数据分析是合理的。如果输出是这样的这表明数据还没有达到稳定的水平。应该重新分析一下。需要添加Ngen。如果采样是稳定的,我们可以使用多芯片组件分析的结果。屏幕输出有以下结果这是所用替换模型中每个参数的估计值。使用sumt burnin=250查看树。节点上的数据代表了树的可靠性。越高越好。相关的树文件和参数保存在带有后缀的文件中。con,可以通过treeview等软件查看。mrBayes的高级功能。1)在序列文件中设置相关参数如果我们不想在屏幕上输入参数,但在输入序列文件后让程序自动运行,我们可以在序列文件中设置相关参数。格式如下:因为集水坑和集水坑具有诊断功能,所以不建议将这两个命令写入文件。2)使用划分函数如果分析的序列不一致,例如编码区和子编码区,或者如果要将编码分成密码子的第一、第二和第三个碱基,则需要使用划分函数。将以下内容添加到序列文件中字符集用于设置变量和赋值。1。3是指从第一个位置开始,从三个位置中的每一个位置取出一个值,并用变量pos1表示这些值。这代表第一个密码子。其他类比。“分区”和“设置”行用于提示程序,顺序分为三个部分。Prset线用于指定独立估计三个部分的参数。如果序列被分为编码区和非编码区

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论