




全文预览已结束
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
MegaMegaMegaMega 关于关于关于关于MegaMegaMegaMega 产生背景产生背景产生背景产生背景 功能及特点功能及特点功能及特点功能及特点 MegaMegaMegaMega的使用的使用的使用的使用 同类软件同类软件同类软件同类软件 参考文献参考文献参考文献参考文献 关于Mega MEGA 的全称是Molecular Evolutionary Genetics Analysis 分子进化遗传分析。MEGA is an integrated tool for automatic and manual sequence alignment, inferring phylogenetic trees, mining web-based databases,estimating rates of molecular evolution, and testing evolutionary hypotheses. MEGA 可用于序列比对、进化树的推断、估 计分子进化速度、验证进化假说等。 MEGA 还可以通过 网络(NCBI)进行序列的比对和数据的搜索。 产生背景 随着不同物种基因组测序的快速发展,产 生了大量的DNA 序列信息,这时就需要一种简 便而快速的统计分析工具来对这些数据进行有 效的分析,以提取其中包含的大量信息。 MEGA 就是基于这种需求开发的。 MEGA 软件 的目的就是提供一个以进化的角度从 DNA 和蛋 白序列中提取有用的信息的工具,并且,此软 件可以免费下载()使用。 功能及特点 MEGA主要集中于进化分析获得的综合的序列信息。使用它我 们可以编辑序列数据、序列比对、构建系统发育树、推测物种间 的进化距离等。此软件的输出结果资源管理器允许用户浏览、编 辑、打印输入所得到的结果而且所得到的结果具有不同形式的可 视化效果。此外,该软件还能够得出不同序列间的距离矩阵,这 是他不同与其他分析软件的地方。在计算矩阵方面有一些自己的 特点: 1. 推测序列或者物种间的进化距离 2. 根据MCL(Maximum Composite Likeliood method)的方法构建系 统发育树 3. 考虑到了不同碱基替换的不同的比率,考虑到了碱基转换和 颠换的差别。 4. 随时可以使用标注:所以的结果输入都可以使用标注,而且 标注的内容可以被保存,复制。 MegaMegaMegaMega的使用的使用 1. 1. 运行环境:在运行环境:在Windows 95/98, NT, ME, Windows 95/98, NT, ME, 2000, XP, vista 2000, XP, vista 等操作系统下均可使用。等操作系统下均可使用。 2. 2. 下载安装:可以直接登下载安装:可以直接登 进行下载安装,另外还进行下载安装,另外还 可以可以从从 中的链接进去。中的链接进去。 3. 3. 双击桌面快捷方式图标双击桌面快捷方式图标 进入主界面;进入主界面; 或者从开始菜单,单击图标启动。或者从开始菜单,单击图标启动。 一、启动 打开后会出现下面的页面,通过这个界面我们可以看 到有四个条目,一个是 MEGA 的使用指南;二是打开数据 文件;三是发表文章时要注明引用 MEGA;四个到达MEGA 的网站。我们可以通过使用指南熟悉 MEGA 的使用,MEGA 的使用指南详细地介绍了 MEGA的使用。 二、数据的准备 一个是可以利用已有的数据,二是可以利用 MEGA直接通过NCBI直接查找所感兴趣的序列, 或到NCBI、EMBL、DDBJ、GenBank等数据库网 站查找,并以Fasta等格式保存。 用以下13条序列进行多序列比对构建系统发育树用以下13条序列进行多序列比对构建系统发育树 SpeciesSpeciesSpeciesSpeciesCodeCodeCodeCodeCyt b accessionCyt b accessionCyt b accessionCyt b accession 白鹳 C.ciconia CcAB026818 蒙古沙鸦 C.mongolusCmAF417927 环颈鸦 C.alexandrinus CalAF417931 大杓鹬 N.madagascariensis NmAF417925 白腰杓鹬 N.arquata NaAF417929 中杓鹬 N.phaeopus NpAF417930 红脚鹬 T.totanus TtAF417932 林鹬 T.glareolaTgAF417923 翘嘴鹬 X.cinereus XcAF417922 翻石鹬 A.interpres AiAF417928 反嘴鹬 R.avosetts RaAF417926 砺鹬 H.ostralegusHoAF440782 大滨鹬 C.tenuirostris CtAF417924 多序列比对 1) 打开Mega,然后单击Alignment Alignment explorer/clustal ,单击后,会出 现如右图界面 这里有三个选项,分别对应三种不同 的情况:以下分别予以介绍: Create a new alignment :是在你没有任何 比对的时候使用,比如你只有一个fasta 格式的序列就可以选择这个选项 。 Open a saved alignment session:使用它可 以打开一个我们已经比对好的序列文件。 Retieve a sequence from a file :这种情况 同第一种情况相似,只是不用选择是 DNA 还是蛋白质序列比对,选择的也是 fasta 格式的文件,打开后的界面都是一 样的。 2)将我们的数据转化为 FASTA格式,导入Alignment explorer 、 在Alignment explorer 下还可以对序列进行编辑、序列的插入、 BLAST 搜索等。 下图为转化的氨基酸序列 下面介绍菜单的使用:下面介绍菜单的使用: DataData: Creat a new Creat a new Creat a new Creat a new : :创建一个新的数据比对文件,也就是说当我们比对完一组后,想接着 比对另一组,那么使用它就可以不用退出直接把数据文件导入; OpenOpenOpenOpen: :打开先前已经比对并保存好的文件,它包含两个子菜单:retive sequence from file 和saved aligment session ; CloseCloseCloseClose: : 关闭当前的比对数据文件; 关闭当前的比对数据文件; Save sessionSave sessionSave sessionSave session: :保存当前比对结果,可以给比对的结果一个文件名; Export alignmentExport alignmentExport alignmentExport alignment: :将当前的序列比对结果输出到指定文件,有两种输入格式可供选 择:MGTA 和FASTA. DNA sequenceDNA sequenceDNA sequenceDNA sequence: :使用它来选择输入的数据 DNA 序列,这里需要说明的是如果你输入的 数据是氨基酸序列的话,比对窗口只显示一个标签,若是DNA 序列的话则显示两个标 签,一个是 DNA 序列的,另一个是氨基酸序列的。 Protein sequencesProtein sequencesProtein sequencesProtein sequences :选择输入的氨基酸序列,选择后,所以的位点就被当作氨基酸残 基位点来对待。 Translate/untranslateTranslate/untranslateTranslate/untranslateTranslate/untranslate: :只有比对的序列是编码蛋白的 DNA序列的时候才可用。它可以 根据指定的遗传密码表将 DNA 序列翻译成特定的氨基酸序列。 Select genetic code tableSelect genetic code tableSelect genetic code tableSelect genetic code table :使用它将编码蛋白的 DNA 翻译成特定的蛋白序列。 Reverse complementReverse complementReverse complementReverse complement :将选择的一整行的 DNA 序列变为与之互补配对碱基序列。 Exit alignment explorerExit alignment explorerExit alignment explorerExit alignment explorer :退出序列比对的资源管理窗口。 Edit Edit Edit Edit 菜单:菜单: 使用这个菜单可以对我们的比对序列进行想要的一些编辑工作具体为 UndoUndoUndoUndo: :撤销上一步操作; CopyCopyCopyCopy:复制;C C C Cutututut:剪切;PastePastePastePaste:粘贴;这三个操作都可以只针对一个碱基或 氨基酸残基也可以是一段甚至是整个序列; DeleteDeleteDeleteDelete: :从比对表格中删除一段序列; Delete gapsDelete gapsDelete gapsDelete gaps: :去掉序列中的空缺; Insert blank sequenceInsert blank sequenceInsert blank sequenceInsert blank sequence: :重新插入一空行;标签和序列都是空的; Insert sequence from fileInsert sequence from fileInsert sequence from fileInsert sequence from file:从已保存的文件中插入新的序列;Select sites:选择 一列序列,与点击比对表上方的灰白空格作用类似; Select sequenceSelect sequenceSelect sequenceSelect sequence: :选择一行序列,与点击比对表格左侧的标签名作用类似; Select allSelect allSelect allSelect all: :全选; Allow base editingAllow base editingAllow base editingAllow base editing:只读保护,只有选择后才能对序列进行编辑操作,否则 所以的序列为只读格式,不能进行任何编辑操作。 Search 菜单: 用来快捷查找序列中的标记未定或者目的碱基或残基。 Find motif:输入你想要查看的一小段序列。找到后会以黄色标出; Find next:在序列的下游查找目的序列片段; Find preious:在序列的上有查找目的序列片段; Find marked sites:查找标记位点; Highlight motif :突出标记已经选择的位点。 Web 菜单: 这个菜单提供一个链接 Genbank 的入口,可以在网上直接做Blast 搜索。当 手上没有准备好要比对的序列时,可以直接去网上搜索。 Query gene banks:开启NCBI 的主页; Do blast search: 开启NCBI BLAST 主页; Show browser:开启网页浏览器。 Sequencer 菜单: 此菜单下只有一个子菜单: edit sequencer file ,用来打开一个打开文件对话 框,此对话框可以打开一个 sequencer data file,一旦打开,这个文件就在 trace data file viewer/editor 的对话框中展示出来。这个编辑窗口允许你查看和编辑 automatd DNA sequencer 产生的trace data。它可以阅读和编辑ABI 和Staden 格式 文件并且序列可以直接被导入到序列比对窗口或被上传到网页浏览器做 blast 搜 索。 Display 菜单: 这个菜单相对简单,主要用来调整工具栏。 Toolbars:工具栏菜单,它包含一些子菜单,选择后就会出现在比对的窗口 中; Use colors:将不同的位点以不同的颜色显示; Background color:选择后位点的显示与位点一样的背景颜色; Font:字体对话框,通过选择来调整窗口中的序列字符的大小。 A A A Alignment lignment lignment lignment 菜单 菜单 Mark/unmark site:Mark/unmark site:Mark/unmark site:Mark/unmark site:在比对的表格中标记或者不标记一个单一位点,一次每 在比对的表格中标记或者不标记一个单一位点,一次每 条序列只能被标记一个位点,不同序列间的位点你可以选择同一列的,也条序列只能被标记一个位点,不同序列间的位点你可以选择同一列的,也 可以是错开的,要根据自己的目的进行选择。选择标记后的序列可以使用可以是错开的,要根据自己的目的进行选择。选择标记后的序列可以使用 alignmarked sitesalignmarked sitesalignmarked sitesalignmarked sites进行比对分析。 进行比对分析。 Align marked sites:Align marked sites:Align marked sites:Align marked sites:比对标记的序列,在这里如果在两个或多个序列间标 比对标记的序列,在这里如果在两个或多个序列间标 记了不在一列的位点重新比对后会出现空格记了不在一列的位点重新比对后会出现空格。 Unmarked all sitesUnmarked all sitesUnmarked all sitesUnmarked all sites:把所以标记的位点去标记; :把所以标记的位点去标记; Delete gap-only siteDelete gap-only siteDelete gap-only siteDelete gap-only site:去掉序同是空格的一列;这在多序列比对前很有用。 :去掉序同是空格的一列;这在多序列比对前很有用。 Auto-fill gapsAuto-fill gapsAuto-fill gapsAuto-fill gaps:使用空格补齐不同长度的序列。 :使用空格补齐不同长度的序列。 Align by clustalwAlign by clustalwAlign by clustalwAlign by clustalw:此软件整合了 :此软件整合了clustalw clustalw clustalw clustalw 程序,这也是它的方便之处,选择要 程序,这也是它的方便之处,选择要 比对的序列后点击会出现下面的对话框:比对的序列后点击会出现下面的对话框: 一般参数: DNA/protein weight matrix :选择不同的加权矩阵; Residue-specific penalties:特殊氨基酸罚分。在序列比对的过程 中特异氨基酸可能增加或减少罚分值,比如:富含甘氨酸 的区段比富含缬氨酸的区段更可能有空格出现,因而他们 的罚分不同。 Hydrophilic penalties:如果有连续的 5 个或者更多的亲水性氨基 酸的话,他们倾向于出现空格,这些区段很可能出现环状 或卷曲,因此罚分不一样。 Gap separation distance:参数设置来尽可能降低空格之间离的太 近的机会,小于指定数值的空格罚分要多余其他的,这不 能避免出现相邻空格,只能降低他们出现的频率。 Use negative matrix:使用负性矩阵, Delay divergent cutoff:若一条序列相似性低于设定的百分值将 推迟比对。 需要注意的是:这个软件不会考虑到核酸序列中的编码位点, 所以在比对的过程中可能会在编码区中插入空格,所以如 果分析cDNA 或者编码序列建议将他们翻译成蛋白序列后在 比对。一对序列比对和多序列比对下的设置都是一样的如 下:Gap opening penalty:空格罚分设置,增加一个空格就 罚相应的分值,增加这一分值会降低空格出现的频率。 Gap extension penalty:空格扩展罚分,就是根据空格的长度来 罚分,增加这一分值会使空格变短,末端空格不计入罚分。 单击AlignmentClustalw,弹出如右 图对话框,然后对其中参数设置。参数 设置好后,点击 OK 就可以进行比对 了,中间会出现一个过程对话框。比对 结束后,可以将结果保存(data/save session/),以供构建系统发育树使用。 另外,如果不保存直接关闭,在弹出对 话框中点Yes也可保存比对结果。保存 完后自动打开序列数据管理的管理界 面,此外还可以通过主界面上data/open data 路径打开,效果是一样的,注意打 开的只能是刚才保存的后缀是.MEG 的 文件。 3)3)多序列比对多序列比对 4)构建系统发育树 1、当导入数据后,主窗口界面会发生变化(如图), 会多出几个功能。 简要介绍主页面上的几个菜单的使用简要介绍主页面上的几个菜单的使用 Distances Distances Distances Distances 菜单: 菜单: 相关原理:相关原理: 两条序列间的进化距离是通过计算两条序列间碱基或氨基酸替换 得来的,推测进化距离是研究分子进化、构建系统发育树和推测物种分化时间的 基础,这个软件中包括了绝大部分广泛使用的推测进化距离的方法。值得提出的 是,该软件还使用解析公式和bootstrap 的方法来评价出现的错误。 该软件所包括的方法大致可被分为三类:核酸;同义该软件所包括的方法大致可被分为三类:核酸;同义非同义替换;氨基酸。非同义替换;氨基酸。 1) 1) 1) 1) 核酸: 核酸:序列是核酸和核酸之间的比较,计算编码蛋白和非编码蛋白的核酸序列间 的进化距离,主要有两种方法: No. of differences 和p-distance 还包括许多的模型: Jukes-Cantor Model 、Tajima-Nei Model、Kimura 2-Parameter Model、Tamura 3- Parameter Model、Tamura-Nei Model、Maximum Composite Likelihood Model 等,可 以根据需要进行不同的选择。 2) 2) 2) 2) 同义 同义非同义替换:非同义替换: 序列是编码子和编码子之间的比较,所以只能用来计算编码 蛋白的序列。常用的模型有: Nei-Gojobori Method 、 Modified Nei-Gojobori Method 、Li-Wu-Luo Method 、 Pamilo-Bianchi-Li Method、Kumar Method 等。 3) 3) 3) 3) 氨基酸类: 氨基酸类:序列间是氨基酸残基之间的比较。能够用来计算氨基酸序列间以及编 码蛋白的核酸间的距离,编码蛋白的核酸在比对的时候自动被翻译成氨基酸序列进 行比较。常用的模型有:Poisson Model、Equal Input Model、 Dayhoff and JTT Models。 Choose modelChoose modelChoose modelChoose model:选择模型,选择跳出一个距离模型的选项窗口 ,在这 个窗口里,model 选项是选择推测进化距离的随机模型的,可以通过单击 绿色小方框进行选择。 Pattern among lineages:只有当距离模型选定后才可 用。rates among sites:允许位点间存在不同的替换率。选好后单击 OK 即可。 Compute pairwiseCompute pairwiseCompute pairwiseCompute pairwise:单击出现 与Choose model类似的对话框 。Compute: 选择是只计算进化距离还是选择计算同时进行评价。选择后者会出现 standard error computation by 选项,通过这一选项选择解析公式或bootstrap method 来评价结果的好坏。 Gaps and missing data :在计算开始前选择去除 所有包含比对空格和失意的位点;另外,最初你也可以保留这些位点,在 必要的时候在去掉。Labled sites:只有当一些或者全部位点有相关标签时 才可用。点击绿色方框,就可以看到包括选择标签的位点,如果你选择这 些位点的话,这些位点就最先从数据中提出来。选好后compute 出现一个比 对后的距离矩阵窗口,这个窗口包括很多不同的功能菜单,来调节显示的 内容。File 菜单中有一个子菜单是Show Analysis Description:显示计算所用 的不同的选项,这些信息可以被保存或者打印出来。 Average Menu:这里 面有个子菜单Overall 单击会显示比对的总体平均距离。Distance 菜单中其 他的子菜单操作同上类似只是内容略有不同,具体可自行摸索。 PhylogenyPhylogenyPhylogenyPhylogeny菜单: 菜单:菜单:菜单: Phylogeny Phylogeny Phylogeny Phylogeny 选项中有以下子菜单: 选项中有以下子菜单: 其中 Construct Phylogeny 和B
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025福建厦门国贸集团股份有限公司校园招聘27人笔试参考题库附带答案详解
- 2025河南驻马店市正阳县县管国有企业招聘21人笔试参考题库附带答案详解
- 2025江西南昌民航空管实业有限责任公司面向社会招收劳务派遣制员工汽车驾驶员笔试参考题库附带答案详解
- 2025年陕西医药控股集团有限责任公司招聘28人笔试参考题库附带答案详解
- 2025年福建省储备粮管理有限公司直属库工作人员招聘33人笔试参考题库附带答案详解
- 2025年浙江平阳县城市发展集团有限公司下属房开公司公开招聘7人笔试参考题库附带答案详解
- 2025年度山西地质集团校园招聘307人笔试参考题库附带答案详解
- 2025年中铁集装箱运输有限责任公司招聘(19人)笔试参考题库附带答案详解
- 2025年中国建筑地勘中心陕西总队招聘13人笔试参考题库附带答案详解
- 2025山东东营众邦人力资源有限责任公司招聘20人笔试参考题库附带答案详解
- 人工智能在国际贸易中的应用
- 视频监控调取记录表
- 第2章 Windows 10操作系统
- 教研活动:幼儿园班级主题墙创设课件
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、异丙醇和正丁醇检验
- 酒店住宿水单模板-可修改
- SF-三福的历史与文化 v2.0
- 幼儿园故事《小红帽》PPT模板
- GB/T 6723-2017通用冷弯开口型钢
- GB/T 4456-2008包装用聚乙烯吹塑薄膜
- 葫芦丝(初学教学)-课件
评论
0/150
提交评论