距离法构建进化树_第1页
距离法构建进化树_第2页
距离法构建进化树_第3页
距离法构建进化树_第4页
距离法构建进化树_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、OUT:operational taxonomic units 分类学单位,变形距离法,如果假定速率恒定在各谱系间不成立则UPGMA法可能会给出错误的拓扑图,不过该拓扑图错误也许能用被称为变形距离法(transformed distance method) 的校正方法来订正。 简单地说此法是用一个组外单位out group 作参照物来对被研究谱系间进化速率不等的情况作一些校正,然后对新得到的距离矩阵应用UPGMA法从而推测出该树的拓扑图,组外单位是一个我们对其有外在认识的(OTU)。 这些外在认识,如分类学的或古生物学的知识能清楚地表明该(OTU)已先于所有其他被研究的(OTU)而从其共同祖先

2、分岐出来。 在现在的例子中,我们假定分类单位对所有别的分类单位来说是一个组外单位,那么即可当作参照物,并用下式来变换距离,这里dij是变形距离 i=A,B 或C, d =(dAD+dBD+dCD)/3 d项的引入是为了保证所有dij的值都是正的 在我们的例子里d =37/3 而新距离矩阵中关于分类单位A、B和C的值为 所以A 和B 最先被聚类在一起,然后,C 再加入到该树中,Least-squares method,最小二乘法(LS)包括一般LS法和加权LS法 容许各个分支核苷酸替代速率有所不同 算法: 实践中,可能的拓扑结构非常多,逐个计算不可能。一般采用计算一个拓扑结构,然后利用分支交换法

3、搜索,在标准的LS法中,所有可能的拓朴结构的 相比后,最小的拓朴结构即为最终的树,分支长度的估计,有时某一被估出的枝长可能会是负的由于实际枝长绝不可能是负的所以最好用来代替这样的估值,最小进化(EM)法,原理 在本方法中,所有分支长度估计的和为: 所有可能的拓扑结构都要计算S值,具有最小S值的拓扑结构被挑选作为最优树 我们已提及分支长度的LS估计是由距离估计dij 的函数给出的,即,Neighbor joining method,在一个无根两分叉树中,如果两个OTU通过一个内部节点联结,则它们就被说成是近邻(neighbors) 比如4个OTU,i、j、m、n。、 假定第一个和的值最小,那么我

4、们把i和j对以及m和n对都记1分,其余对记0分。 在对所有可能的四单位组都评过分以后,得总分最高的对子即被选为第一个近邻对,算法,用NJ方法构建一棵星状树,这就是假设不存在聚合群 如果估计一棵星状树的分支长度并计算出所有分支的总和(S0),那么这个数目应该比真实树或最终的树的Sf要大,Neighbor joining method,邻接法的一般步骤如下 1采用了Jukes-Cautor单参数模型,计算出第i条和第j条序列距离 dij 计算公式: 其中 q 为两个序列中相应位置上相同碱基的概率,Neighbor joining method,2计算第i个叶子结点(即第i个序列)的净分歧度 ri 其中N是叶子结点的个数,dik为叶子结点i和叶子结点k之间的距离,Neighbor joining method,3计算任意两两结点 i 和 j 之间的速率校正距离(rate-corrected distance)Mij: 4挑选出最小的速率校正距离Mij 5定义一个新的结点t,t的左、右孩子分别是第i个和第j个结点。结点t到i,j的距离为,Neighbor joining method,结点t与进化树其他结点k的距离为 dtk 6从叶子结点集合 L 中删除结点i和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论