版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、图文详解MEGA5构建系统发育树(2013-10-11 20:52:49)如遇不妥,请指正。软件下载:MEGA 5;DNAMAN 71 准备序列文件准备fasta格式序列文件(fasta格式:大于号后紧跟序列名,换行后是序列。举例如下)。每条序列可以单独为一个文件,也可以把所有序列放在同一文件内。核酸序列:sequence1_nameCCTGGCTCAGGATGAACGCT氨基酸序列:sequence2_nameMQSPINSFKKALAEGRTQIGF2 多序列比对打开MEGA 5,点击Align,选择Edit/Build Alignment,选择Create a new alignment
2、,点击OK。这时需要选择序列类型,核酸(DNA)或氨基酸(Protein)。选择之后,在弹出的窗口中直接Ctrl + V粘贴序列(如果所有序列在同一个文件中,即可全选序列,复制)。也可以:点击Edit,选择Insert Sequence From File,选择序列文件(可多选)。 序列文件加载之后,呈蓝色背景(为选中状态)。点击按钮 ,选择Align DNA(如果是氨基酸序列,则会出现Align Protein)。弹出的窗口中设置比对参数,一般都是采用默认参数即可。点击OK,开始多序列比对。比对完成后,呈现以下状态。这时需要截齐两端含有-的序列:选中含有-的序列,按键Delete删除(注意:
3、两端都需要截齐)。截齐之后,保存文件为:filename.mas3 构建系统进化树多序列比对窗口,点击Data,选择Phylogenetic Analysis,弹出窗口询问:所用序列是否编码蛋白质,根据实际情况选择Yes或No。此时,多序列比对文件就激活了,可以返回MEGA 5主界面建树了。MEGA 5主界面。点击Phylogeny,选择Construct/Test Neighbor-Joining Tree弹出的对话框询问:是否使用当前激活的数据,选择Yes。这时弹出建树参数设置对话框,更改No. of Bootstrap Replications为1000,其他参数默认即可,点击Compu
4、te。这里解释一下,Construct/Test Maximum Likelihood Tree(ML)或Construct/Test Neighbor-Joining Tree(NJ)或Construct/Test Minimum-Evolution Tree(ME)为三种不同的建树方法,NJ方法最常用。 建树完成,效果如下所示。注意,要点击Bootstrap consensus tree查看树形。保存文件为filename.mts(可以用MEGA 5打开)。4 后期修改为了美观,也是为了满足发表文章的要求,需要对进化树进行树形、字体、字号的修改。点击View,选择Options。弹出窗口中
5、,在Tree标签中可以修改枝与枝之间的距离(Taxon Separation)、枝长(Branch Length)和树宽(Tree Width),调整至美观即可。Branch标签中,可以选择勾选“Hide values lower than %”,一般隐藏50%以下的数值。其他的参数可以自行研究,一般默认即可。文字字体、字号的修改。方法1:点击Image,选择Save as PDF file,保存至filename.pdf。打开软件Adobe Illustrator CS6,文件-打开-选择刚刚保存的PDF文件。修改好之后,文件-导出-可以导出很多种类型的文件。一般选择保存成TIFF(.tif
6、)文件,颜色模式选择RGB,勾选LZW压缩,其他默认。方法2:点击Image,选择Copy to Clipboard。粘贴到Word中,右击进化树图片,编辑图片。即可更改字体字号。修改好可以了。或者进一步导出图片格式:先将该word文件打印生成PDF文件,再用Adobe Illustrator CS6或Adobe Photoshop CS6导出图片格式。Mega建树虽然Clustal X可以构建系统树,但是结果比较粗放,现在一般很少用它构树,Mega因为操作简单,结果美观,很多研究者选择用它来建树。(1) 首先用Clustal X进行序列比对,剪切后生成C: empjc-a.aln文件;(同上
7、)(2) 打开BioEdit程序,将目标文件格式转化为FASTA格式,File-Open- C: empjc-a.aln,File-Save As- C: emp jc-b.fas;(3) 打开Mega程序,转化为mega格式并激活目标文件,File-Convert To MEGA Format- C: emp jc-b.fas C: emp jc-b.meg,关闭Text Editor窗口-(Do you want to save your changes before closing?-Yes);Click me to activate a data file- C: empjc-b.me
8、g-OK-(Protein-coding nucleotide sequence data?-No);Phylogeny-Neighbor-Joining(NJ)Distance Options-Models-Nucleotide: Kimura 2-parameter;d: Transitions+Transversions;Include Sites-Pairwise DeletionTest of Phylogeny-Bootstrap; Replications 1000; Random Seed 64238OK;开始计算得到结果;(4) Image-Copy to Clipboard
9、-粘贴至Word文档进行编辑。此外,Subtree中提供了多个命令可以对生成的进化树进行编辑,Mega窗口左侧提供了很多快捷键方便使用;View中则给出了多个树型的模式。下面只介绍几种最常用的:Subtree-Swap:任意相邻两个分支互换位置;-Flip:所选分支翻转180度;-Compress/Expand:合并/展开多个分支;-Root:定义外群;View-Topology:只显示树的拓扑结构;-Tree/Branch Style:多种树型转换;-Options:关于树的诸多方面的改动。3 、TREECON打 开Clustal X,File-Load sequences-jc-a.aln
10、,File-Save Sequence as(Format-PHYLIP;Save from residue-1 to 末尾;Save sequence as : C: empjc.phy);打开TREECON程序,(1) Distance estimation点 击Distance estimation-Start distance estimation,打开上面保存的jc.phy文件,Sequence Type-Nuleic Acid Sequence,Sequence format-PHYLIP interleaved,Select ALL,OK;Distance Estimation-
11、Jukes&Cantor(or Kimura),Alignment positions-All,Bootstrap analysis-Yes,Insertions&Deletions-Not taken into account,OK;Bootstrap samples-1000,OK;运算,等待Finished-OK。(2) Infer tree topology点击Infer tree topology-Start inferring tree topology,Method-Neighbor-joining, Bootstrap analysis-Yes,OK.;运算,等待Finishe
12、d-OK。(3) Root unrooted trees点击Root unrooted trees-Start rooting unrooted trees,Outgroup opition-single sequence(forced),Bootstrap analysis-Yes,OK;Select Root-X89947,OK;运算,等待Finished-OK。(4) Draw phylogenetic tree点击Draw phylogenetic tree,File-Open-(new) tree,Show-Bootstrap values/ Distance scale。File-
13、Copy,粘贴至Word文档,编辑。TREECON 的操作过程看起来似乎较MEGA烦琐,且运算速度明显不及MEGA,如果参数 选择一样,用它构建出来的系统树几乎和MEGA构建的完全一样,只在细节上,比如Bootstrap值二者在某些分支稍有不同。在参数选择方 面,TREECON和MEGA也有些不同,但总体上相差不大。4、 PHYLIPPHYLIP 是多个软件的压缩包,下载后双击则自动解压。当你解压后就会发现PHYLIP的 功能极其强大,主要包括五个方面的功能软件:i,DNA和蛋白质序列数据的分析软件。ii,序列数据转变成距离数据后,对距离数据分析的软件。 iii,对基因频率和连续的元素分析的软
14、件。iv,把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。v,按 照DOLLO简约性算法对序列进行分析的软件。vi,绘制和修改进化树的软件。在此,主要对DNA序列分析和构建系统树的功能软件进行说明。(1) 生成PHY格式文件首 先用Clustal X等软件打开剪切后的序列文件C: empjc-a.aln另存为C: empjc.phy(使用File-Save Sequences As命令,Format项选“PHY”)。用BioEdit或记事本打开(2) 打开Phylip软件包里的SEQBOOTseqboot.exe: cant find input fi
15、le infilePlease enter a new file name C: empjc.phy按路径输入刚才生成的 *.PHY文件,显示如下:Bootstrapping algorithm, version 3.6a3Settings for this run:D Sequence, Morph, Rest., Gene Freqs? Molecular sequencesJ Bootstrap, Jackknife, Permute, Rewrite? BootstrapB Block size for block-bootstrapping? 1 R How many replica
16、tes? 100W Read weights of characters? NoC Read categories of sites? NoF Write out data sets or just weights? Data setsI Input sequences interleaved? Yes0 Terminal type none1 Print out the data at start of run No2 Print indications of progress of run YesY to accept these of type the letter for one to
17、 changeRNumber of replicates?10000Settings for this run:D Sequence, Morph, Rest., Gene Freqs? Molecular sequencesJ Bootstrap, Jackknife, Permute, Rewrite? BootstrapB Block size for block-bootstrapping? 1 R How many replicates? 1000W Read weights of characters? NoC Read categories of sites? NoF Write
18、 out data sets or just weights? Data setsI Input sequences interleaved? Yes0 Terminal type IBM PC1 Print out the data at start of run No2 Print indications of progress of run YesY to accept these of type the letter for one to changeYRandom number seed (must be odd)?5(any odd number)completed replica
19、te number 100completed replicate number 200completed replicate number 300completed replicate number 400completed replicate number 500completed replicate number 600completed replicate number 700completed replicate number 800completed replicate number 900completed replicate number 1000上 面的D、J、R、I、O、1、
20、2代表可选择的选项,键入这些字母后敲回车键,程序的条件就 会发生改变。D选项无须改变。J选项有三种条件可以选择,分别是Bootstrap、Jackknife和Permute。R选项让使用者输入 republicate的数目。所谓republicate就是用Bootstrap法生成的一个多序列组。根据多序列中所含的序列的数目的不同可以选取 不同的republicate。当我们设置好条件后,键入Y按回车。得到一个文件outfile:C:Program FilesPhylipexe outfile.重命名outfileinfile。(3) 打开dnadist.exeNucleic acid sequ
21、ence Distance Matrix program, version 3.6a3Settings for this run:D Distance ? F84G Gamma distributed rates across sites? NoT Transition/transversion ratio? 2.0C One category of substitution rates? YesW Use weights for sites? NoF Use emperical base frequencies? YesL Form of distance matrix? SquareM A
22、nalyze multiple data sets? NoI Input sequences interleaved? Yes0 Terminal type ? 1 Print out the data at start of run No2 Print indications of progress of run YesY to accept these of type the letter for one to changedD Distance ? Kimura 2-parametermMultiple data sets or multiple weighs? (type D or W
23、)dHow many data sets?10000Settings for this run:D Distance ? Kimura 2-parameterG Gamma distributed rates across sites? NoT Transition/transversion ratio? 2.0C One category of substitution rates? YesW Use weights for sites? NoF Use emperical base frequencies? YesL Form of distance matrix? SquareM Ana
24、lyze multiple data sets? Yes, 1000 data setsI Input sequences interleaved? Yes0 Terminal type ? IBM PC1 Print out the data at start of run No2 Print indications of progress of run YesY to accept these of type the letter for one to changeY选 项D有四种距离模式可以选择,分别是Kimura 2-parameter、Jin/Nei、Maximum-likeliho
25、od和Jukes-Cantor。选项T一般键入一个1.5-3.0之间的数 字。选项M键入1000。运行后生成文件C:Program FilesPhylipexe outfile。重命名outfileinfile。(4) 打开 neighbor.exeNeighbor-Joining/UPGMA method version 3.6a3Settings for this run:N Neighbor-Joining or UPGMA tree? Neighbor-JoiningO Outgroup root? No, Use as outgroup species 1L Lower-triang
26、ular data metrix? NoR Upper-triangular data metrix? NoS Subreplication? NoJ Randomize input order of species? No, Use input orderM Analyze multiple data sets? No0 Terminal type ? 1 Print out the data at start of run No2 Print indications of progress of run Yes3 Print out tree Yes4 Write out trees on
27、to tree file? YesY to accept these of type the letter for one to changemHow many data sets?1000Random number seed (must be odd)?5Settings for this run:N Neighbor-Joining or UPGMA tree? Neighbor-JoiningO Outgroup root? No, Use as outgroup species 1L Lower-triangular data metrix? NoR Upper-triangular data metrix? NoS Subreplication? NoJ Randomize input order of species? Yes M Analyze multiple data sets? Yes, 1000 sets0 Terminal type ? IBM PC1 Print out the data at start of run No2 Print indications of progress of run Yes3 Print out tree Yes4 Write o
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 皮肤微生态失衡与痤疮的药物治疗策略
- 癫痫持续状态伦理决策的困境与解决
- 癫痫发作预测:脑电-临床数据实时分析
- 癌症家属焦虑缓解沟通方案
- 病理诊断标准化提升医疗精准度的策略
- 病毒载量动态监测指导下的个体化随访策略
- 3.2世界是永恒发展的 课件 2025-2026学年统编版高中政治必修四哲学与文化
- 电力规程员工培训
- 场景护理礼仪培训课件
- 生物材料增强干细胞心肌整合策略
- 部队装备换季保养课件
- DB 5303∕T 23-2024 《露地甜樱桃种植技术规程》
- 《微压富氧康养整体空间设备》
- 卫星互联网基础知识培训课件
- 2025年敖汉旗就业服务中心招聘第一批公益性岗位人员的112人模拟试卷含答案详解
- 婚姻家庭继承实务讲座
- 新内瘘穿刺护理
- 钳工个人实习总结
- 大健康养肝护肝针专题课件
- 道路高程测量成果记录表-自动计算
- 关于医院“十五五”发展规划(2026-2030)
评论
0/150
提交评论