




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、? ?生物信息学生物信息学? ?分子进化分子进化系统分析系统分析分子进化系统的应用系统发育分析的开展分子系统树的构建系统发育分析的目的1. 物种来源?如人类源自哪里?2. 现有的多样性丰富生物他们之间的亲缘关系是怎样的?进化论 达尔文:物种起源 华莱士:论变种无限地离开其原始模式的倾向生物是进化的产物,由共同祖先由远及近依次进化而来。研究的局限:在时间的横断面怎样确定物种之间的进化关系?进化关系的反映是不同分类单元与共同祖先的相对近度进化分类学派传统的分类支序分类学派 数值分类学派分子系统学老虎蜥蜴鳄鱼鸳鸯哺乳纲鸟纲爬行纲进化分类学派 传统的分类系统与系统发育关系: 系统发育关系图与传统发育关
2、系不对应。传统的分类系统不一定能准确反映系统发育关系;支序分类学派 主张以生物的血亲关系来重建系统发育关系和分类系统。 由于血亲关系无法直接观察和实验,因而只能利用生物的共有衍征来重建和推导同源特征(homology):后代所具有的起源于共同祖先同一特征的特征。 相似的特征不一定同源异源同形共有祖征(symplesiomorphy):两个或两个以上分类单位具有某特征起源于比最近的共同祖先更早的祖先共有衍征(synapomorphy):某一特征起源于最近的共同祖先。自有新征(autapomorphy):某一支系独有的特征。姐妹群(sister group): 当两个分类单元共有一个不为第三者所有
3、的祖先时,互为姐妹群,关系最近。鳄鱼鸭嘴兽袋鼠老虎有脊柱被毛、有乳腺胎生长孕期共有祖征(老虎袋鼠)共有衍征(老虎,袋鼠,鸭嘴兽)祖征与衍征的判断:化石标准外群比较:所研究的某一特定类型的群称为内群;不包括在内群中,与内群又有一定关系的群称为外群。将内群某一特征与外群相应特征比较,往往可得到演化极向。个体发育信息:个体发育史早期特征往往是祖征态.系统发育关系的推导:必须利用共有衍征假设有5个分类单元和4个特征,来推导分类单元间的系统发育关系。0表示祖征,1表示衍征EDCBA非同源假设少实际上,上表的四个物种分别:A:智人,B:红袋鼠;C: 鸭嘴兽;D:鸡蛋白链为肌球蛋白链。通过其他特征,如A,B
4、,C的共有衍征毛发、乳腺,听小骨和A,B的共有衍征胎生、牙齿、乳头验证,确实是图11比较好。增加特征数可以提高准确性。数值分类学派 数值分类派认为上述两种方法存在主观因素影响,希望建立客观的,可重复的分类系统。 认为两个物种关系越近,其共有性状及其相似性就越多,性状反映了共同基因的多少,他们的相似程度和相互关系反映了遗传关系。 建立的方法:1.用来分类的特征越多,包含的信息越大;2.各性状之间是等权的;3.两个分类单元之间的全面相似性由统一公式算;4.分类系统由相似度和差异建立 缺点 1.根据无进化意义的性质进行归类不恰当 2. 形态特征与基因型不是对应关系 3. 生物某些特征不是等权的,把所
5、有特征都等权本身就是主观 4. 生物个体在幼体和成体变化较大,雌雄个体差异也大,还有环境因素,因此实际才用的特征并不多,总体相似的估计比较困难 分子进化系统 分子系统学:利用分子标记主要是DNA,RNA和蛋白质分子或片段来探讨生物系统发育和进化过程的学科。内容提要 分子进化分析介绍 系统发育树重建方法从物种的一些分子特性出发,从而了从物种的一些分子特性出发,从而了解物种之间的生物系统发生的关系。解物种之间的生物系统发生的关系。 蛋白和核酸序列蛋白和核酸序列通过序列同源性的比较进而了解基因通过序列同源性的比较进而了解基因的进化以及生物系统发生的内在规律。的进化以及生物系统发生的内在规律。分子进化
6、研究的目的系统发育树是什么?对一组实际对象的世系关系的描述如基因,物种等。一个系统发育树末端物种顶端中间节点中间枝条根末端分支叶子节点AB CDEFG树只代表分支的拓扑结构FGCDEAB分子进化研究的根底假设 核苷酸和氨基酸序列中含有生物进化历史的全部信息。 在各种不同的发育谱系及足够大的进化时间尺度中,许多序列的进化速率几乎是恒定不变的。分子钟理论, 1965 分子进化研究的根底理论 虽然很多时候仍然存在争议,但是分子进化确实能阐述一些生物系统发生的内在规律。分子进化研究的根底实际从一个分歧数据可以推测其他序 列 分 歧 度分歧时间xy分子钟理论 直系同源(orthologs): 同源的基因
7、是由于共同的祖先基因进化而产生的. 旁系同源(paralogs): 同源的基因是由于基因复制产生的. (以上定义源自Fitch, W.M. (1970) Distinguishing homologous from analogous proteins. Syst. Zool. 19, 99113) 直系同源与旁系同源paralogsorthologsparalogsorthologsErik L.L. Sonnhammer Orthology,paralogy and proposed classification for paralog subtypes TRENDS in Genetic
8、s Vol.18 No.12 December 2002 :/tig.trends 0168-9525/02/$ see front matter 2002 Elsevier Science Ltd. All rights reserved. 以上两个概念代表了两个不同的进化事件 用于分子进化分析中的序列必须是直系同源必须是直系同源的,才能真实反映进化过程。Bacterium 1Bacterium 3Bacterium 2Eukaryote 1Eukaryote 4Eukaryote 3Eukaryote 2Bacterium 1Bacterium 3Bacterium 2Eukaryote
9、1Eukaryote 4Eukaryote 3Eukaryote 2Phylograms show branch order and branch lengths进化树,有分支和支长信息2.进化分支图,进化树进化分支图,进化树Cladograms show branching order - branch lengths are meaningless进化分支图,只用分支信息,无支长信息。Rooted by outgrouparchaeaarchaeaarchaeaeukaryoteeukaryoteeukaryoteeukaryotebacteria outgrouprooteukaryot
10、eeukaryoteeukaryoteeukaryote无根树无根树archaeaarchaeaarchaeaMonophyletic group(单源群单源群)Monophyleticgroup3.有根树,无根树,外围群有根树,无根树,外围群有根树有根树外围群外围群 系统发生树性质: 1如果是一棵有根树,那么树根代表在进化历史上是最早的、并且与其它所有分类单元都有联系的分类单元; 2如果找不到可以作为树根的单元,那么系统发生树是无根树; 3从根节点出发到任何一个节点的路径指明进化时间或者进化距离。 4.基因树,物种树基因树,物种树We often assume that gene trees
11、 give us species treesabcABDGene treeSpecies tree系统发育树重建分析步骤多序列比对自动比对,手工比对建立取代模型建树方法建立进化树进化树评估 序列比照: 软件: clustal w 序列比对后,核苷酸或氨基酸序列的差异可以通过模型转化成距离 Judes 和 Cautor 假设每一碱基具有同等机率突变为另外 3 种碱基中的任何一种,其频率常数为/3,为碱基替换频率。提出了序列距离 K系统发育树重建的根本方法1. 距离法(distance) 2. 特征法 最大简约法(maximum parsimony,MP) 最大似然法(maximum likeli
12、hood,ML)距离法距离法又称距离矩阵法,首先通过各个物种之间的比较,根据一定的假设进化距离模型推导得出分类群之间的进化距离,构建一个进化距离矩阵。进化树的构建那么是基于这个矩阵中的进化距离关系 。计算序列的距离,建立距离矩阵通过距离矩阵建进化树由进化距离构建进化树的方法有很多,常见有:1.Fitch-Margoliash MethodFM法2. Neighbor-Joining Method (NJ法/邻接法)3.Unweighted Pair Group Method (UPGMA法)通过矩阵建树的方法非加权配对法UPGMA算法示意图应用算术平均数的非加权成组配对法, unweighte
13、d pair-group method using an arithmetic average距离最近人类hu,黑猩猩(ch),猩猩(or,长臂猿gi,大猩猩go人类hu,黑猩猩(ch),猩猩(or,长臂猿gi,大猩猩go距离最近邻接法 NJ法 UPGMA假定各分支的进化速度和程度是一致的。 邻接法的关键步骤: 一是计算发散系数ri,二是生成一个速率校正矩阵。 该方法通过确定距离最近(或相邻)的成对分类单位来使系统树的总距离到达最小。Mijdijor与gi 的 Mij 最小,它们用新的节点代替or与gi Mij 最小,它们用节点1代替,那么新节点(节点 1)到这二个节点的距离为节点 1 到其它
14、各节点的距离见表在该矩阵中,人(hu)和黑猩猩(ch)的Mij值最小,那么它们又形成一个新节点(节点 2),依次类推,便可最终完成矩阵的计算和邻接法无根系统树距离dij(上对角线局部)和Mij(下对角线局部) hu ch go or gi0.01562-0.000990.005710.057170.102630.019430.024150.04050特征法构建进化树最大简约法MP最大简约法(maximum parsimony,MP)最早源于形态性状研究,现在已经推广到分子序列的进化分析中。 最大简约法的理论根底是奥卡姆Ockham哲学原那么,这个原那么认为:解释一个过程的最好理论是所需假设数目
15、最少的那一个。对所有可能的拓扑结构进行计算,并计算出所需替代数最小的那个拓扑结构,作为最优树。 优点:最大简约法不需要在处理核苷酸或者氨基酸替代的时候引入假设替代模型。此外,最大简约法对于分析某些特殊的分子数据如插入、缺失等序列有用。最大简约法MP缺点:在分析的序列位点上没有回复突变或平行突变,且被检验的序列位点数很大的时候,最大简约法能够推导获得一个很好的进化树。然而在分析序列上存在较多的回复突变或平行突变,而被检验的序列位点数又比较少的时候,最大简约法可能会给出一个不合理的或者错误的进化树推导结果。最大简约法MP最大似然法ML最大似然法(maximum likelihood,ML)最早应用
16、于系统发育分析是在对基因频率数据的分析上,后来基于分子序列的分析中也已经引入了最大似然法的分析方法。最大似然法分析中,选取一个特定的替选取一个特定的替代模型来分析给定的一组序列数据,使得代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结值,然后再挑出其中似然率最大的拓扑结构作为最优树构作为最优树。在最大似然法的分析中,所考虑的参数并不是拓扑结构而是每个拓扑结构的枝长,并对似然率求最大值来估计枝长 。最大似然法ML最大似然法的建树过程是个很费时的过程,因为在分析过程中有很大的计算量,每个步骤都要考虑内部
17、节点的所有可能性。最大似然法是一个比较成熟的参数估计的统计学方法,具有很好的统计学理论根底,在当样本量很大的时候,似然法可以获得参数统计的最小方差。只要使用了一个合理的、正确的替代模型,最大似然法可以推导出一个很好的进化树结果。 最大似然法ML由于最大似然法的分析过程需要消耗较多的时间,针对这种情况,开展出了许多优化的可以加快最大似然法寻找最优树的搜索方法,如启发式搜索,分枝交换搜索等。最大似然法具有坚实的统计学理论根底,充分的使用了分析序列中的信息资源,只要采用了合理的替代模型,可以得出很好的进化树分析结果。最大似然法MLBayes法 与ML法利用先验概论进行计算不同, Bayes 法采用后
18、概率运算和构树。 后验概率就是根据所要研究序列的实际进化状况对先验概率进行调整后得到的进化模型和概率。 与ML 法一样,bayes 也要选择一个进化模型,抽样统计分析所要研究的序列各位点的实际状态,将统计分析结果代人公式后计算出后验概率,再根据后验概论进行模式修正,然后根据修正后的模式和特征变化建立一支树。接下来再从第一步做起,如此循环,得到所有可能的树,对所有树的后验概率进行统计,将具最大相似后概率的树进行叠合。一般在概率大于时,此方法会给出唯一的树。选择外类群Outgroup选择一个或多个与分析序列关系较远的序列作为外类群外类群可以辅助定位树根外类群序列必须与剩余序列关系较近,但外类群序列与其他序列间的差异必须比其他序列之间的差异更显著。bacteria outgroupeukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaarchaea外围群外围群进化树
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- T/CCBD 24-2023首次公开募股(IPO)企业品牌培育指南
- T/CCAS 022-2022水泥工业大气污染物超低排放标准
- T/CC 2-2019弓用瞄准器
- T/CBMCA 057.1-2024适老化全场景技术规范第1部分:居住建筑适老化基本要求
- T/CBJ 2210-2024白酒工业智能制造能力成熟度评价实施指南
- T/CASTEM 1014-2023科技成果转化风险评估指南
- 字节java算法面试题及答案
- 成都美术面试题及答案
- 高考画画考试题及答案
- 法学的面试题及答案
- 展览馆展示中心项目可行性研究报告
- 学做卤菜签合同协议
- GB/T 15340-2025天然、合成生胶取样及其制样方法
- 公路法知识培训课件
- 《乡土中国》课件统编版高一语文必修上册
- 钢管柱混凝土施工方案
- 马拉松方案策划
- 2025年全国青少年禁毒知识竞赛题库及答案(中学生组)
- 毕业设计(论文)-基于PLC的自动上料系统设计
- 武装部面试题及答案
- T-NXS 0116T-2024 宁夏滩羊肉质量追溯标准体系构建应用技术规范
评论
0/150
提交评论