苯丙氨酸解氨酶的分子进化分析1.doc_第1页
苯丙氨酸解氨酶的分子进化分析1.doc_第2页
苯丙氨酸解氨酶的分子进化分析1.doc_第3页
苯丙氨酸解氨酶的分子进化分析1.doc_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三节 分子系统发生学与系统发生树一系统发生学(phylogenetics)与系统发生树的概念分子系统发生学(molecular phylogenetics)主要是对生物进化规律及物种间亲缘关系进行研究。广义地说,分子系统发生学是通过不同生物大分子的信息来确定它们在进化过程中的亲缘关系和地位分歧的时间,在此基础上,建立分子系统树,推断生物大分子的进化历史的一门学科。经典系统发生学研究的主要是生物表型(phenotype)特征,所谓的表型特征主要是指形态学结构方面的特征,比如说生物体的颜色、大小、触角个数,当然也包括某些生理的、生化的,还有就是行为习性方面的特征。为了知道生物体的基因型,我们可以通过比较表型来推断,进而对物种之间的进化关系开展相关的研究1。然而,只是单纯地根据表型特征来推断物种的进化关系是不全面的,它有很多局限性。我们在进行研究的时候,偶尔也会发现,有时候关系很远的物种也能进化出相似的表型,从生物角度来说,这是由称为趋同进化(convergent evolution)的过程造成的。人们对生物的认识渐渐地开始从宏观的角度转向微观,由此,对物种分类的依据科学家们也从最初观察生物形态的宏观层次上发展到了微观上的分子,并且,在科学家们的努力下有了突破性的进展,系统发生分析进入分子层次。当今世界上存在的蛋白质和核酸都是从最初共同的祖先经过不断的进化而形成的,生物进化的信息存在于核酸和蛋白质中,因为核酸是作为遗传物质,而蛋白质是作为生命的机器。由此,核酸和蛋白质可以用于系统发生关系的研究 2。相比较于传统的只是停留于对生物进行表型方面的研究,我们从分子水平上进行研究分析具有更多表型分析所没有的优势,所得到的结果也更加科学、可靠。分子系统发生分析是直接利用从生物的核酸序列或其蛋白质分子提取的信息,作为物种的一个特征,通过比较生物分子序列,比如说两两比对或者是多序列比对,分析序列之间的关系,构造系统发生树,发现一些规律,进而更好地阐明各个物种之间的进化关系。在分析这些序列时,我们会发现,在序列或者是结构上,分子都保留着进化的痕迹。当今,在分子进化的研究中,我们根据已知的生物基因或物种多样性来发现并重建生物的进化史是一个非常重要的研究方向。我们想了解生物进化的机制和生物进化的历史 ,需要一个可靠的系统发生的推断,因为这可以揭示出有关生物进化过程的顺序。系统发生树4:一般而言,系统发生树是一种二叉树。所谓树,实质就是一个无向非循环图。一系列的节点(nodes)和分支(branches )组成了系统发生树,其中,每个节点都代表了一个分类单元(可以是序列或者物种),而节点之间的连线则代表了各个物种之间的进化关系。树的节点又可以分为内部节点(internal node)和外部节点(terminal node)。一般而言, 内部节点代表了进化事件发生的位置,或者是代表分类单元进化历程中的祖先,内部节点又称为分支点。外部节点则代表了我们实际观察到的分类单元。分类单元是一种由研究者选定的基本单位,在进行同一项研究时,一般情况,分类单元应当一致。在下面的分析讨论中,我们基本上全部是以序列(蛋白质序列或者是DNA序列)作为分类单元。树节点间的连线又称为分支,其中一端与叶节点相连的称为外支,而不与叶节点相连则称为内支。二系统发生树的形式系统发生树的形式多种多样,可能是有根树(rooted tree),也有能是无根树(unrooted tree);可能是一般的树,也有可能是二叉树;可能是有权值的树(或者称为标度树,scaled ,tree,树中标明了各个分支的长度),也可能是无权值树(或非标度树,unscaled tree)3。图1 有根树 图2 无根树Fig 1 root tree Fig 2 no root tree 图1所示的是一棵有根树,而图2显示的是一棵无根树,图中的A、B、C、D为所研究的分类单元。在一棵有根树中,根节点是唯一的一个,因为它代表了其它所有节点的共同祖先,从这样的树能看出生物进化的层次,从根节点出发,到进化到任何其它节点只有唯一的路径。系统发生分析中有一个重要的差别,那就是有的能由系统发生树推断出共同祖先和进化的方向,而有的却不能。无根树则没有层次结构,它只说明了节点之间的一些关系,关于进而化发生方向的信息则没有。但是我们可以通过使用外部参考物种(最早从被研究物种中分化出来的已经被明确的物种),可以在无根树中把它指派为根节点,以此作为一个参考。三系统发生树的性质如果是一棵有根树,那么树根代表的是在进化历史上是最早的、并且与树上其它所有分类单元都有关系的一个分类单元; 如果我们在树上找不到可以作为树根的单元,那么系统发生树就是无根树; 从根节点出发,到任何一个节点的路径都指明了进化距离或者是进化时间。四基于距离的系统发生树构建方法基本思路是:从距离的角度出发,定一种序列之间距离的测度,在该距离测度下构建一棵系统发生树,从而使得该树能够很好地反映已知序列之间的距离。主要方法有:非加权组平均法 、 邻位归并法1.非加权组平均法在平均连锁聚类过程中,一个新类到其它类之间的距离就是简单的原距离平均值7。如果类中分类单元的个数不一样的话,那么原距离矩阵中各个距离值对新距离计算的贡献就不一样,或者可以说是经过“加权”的,称这样的聚类为加权分组平均7。我们在计算新分类到其它分类之间平均距离的时候,非加权分组平均法是按照各分类中分类单元的数目进行加权处理的。连锁聚类和UPGMA算法是假定所有家系的进化速率是相同的,这是它们的一个缺点,因为实际情况并不总是这样。进化速率的稍微有变化的话就很容易导致连锁聚类和UPGMA算法产生错误拓扑结构的树。假设有A、B、C和D 4个分类单元,其系统发生关系以及各个分类单元之间的距离如图3所示,距离矩阵见表1。如果我们是利用UPGMA来进行分析的话,那么首先是合并A和C,(AC)到B的距离等于9/2+11/2=10,(AC)到D 的距离等于12/2+10/2=11;然后就是合并(AC)和B ,(AC)B)到D 的距离等于211/3 + 115/3 = 37/3;最终得到系统发生树如图4,但是我们可以看出,该树显然与真实树有一些差别的。图3 4个分类单元A、B、C和D之间的系统发生关系Fig 3 the phylogenesis relationship among four assorts A,B,C and D图4 UPGMA根据表1构造的系统发生树Fig 4 the structure of phylogenesis tree through UPGMA according to table 1表1 四个分类单元的距离矩阵 Tab 1 the distance matrix of four assorts A B C B 9 C 8 11 D 12 15 10 不同的家系有不同的进化速率,一些基于距离矩阵的方法考虑了这个方面的因素,其中距离变换法(Transformed Distance Method)是最早也是最简单的算法。距离变换法很好地利用了外群或外部参考物种(outgroup),即优先于其它所有被考虑的物种(称为内群或内部物种,ingroup)从它们的共同祖先中分化出来的那些物种。假设有A、B、C和D 4个物种,假设D是物种A、B和C的外部参考物种,并且这四个物种的距离矩阵是已知的,我们可以把D作为变换其它物种之间的距离的外部参考,变换式如下所示:其中,dij是物种i和物种j之间的变换后距离, 是全体内部物种与外部参考物种之间的平均距离,此例中 = (dAD + dBD + dCD)/3。从进化的角度看,负值是不可能的,所以引入 只是为了保证所有变换后的距离为正值,利用 值和原来的距离矩阵,物种A、B和C就会产生一个新的距离变换矩阵。在上面的例子, = (dAD + dBD + dCD)/3 = 37/3,dAB=(9-12-15)/2+37/3=10/3, dAC=(8-12-10)/2+37/3=16/3, dBC=(11-15-10)/2+37/3=16/3。用基本的UPGMA方法产生新的距离构造系统发生树,因为dAB是其中的最小值,A和B先

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论