遗传距离.ppt_第1页
遗传距离.ppt_第2页
遗传距离.ppt_第3页
遗传距离.ppt_第4页
遗传距离.ppt_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四讲遗传距离与距离树 概念 遗传距离 以任何对象 序列 基因次序 基因有无 蛋白质结构域等 采用各种方法估计的两个OTU 个体 群体 物种 种上分类单元或基因家族序列 之间的差异值 与距离相对的是相似性 距离矩阵 假设有n个OUT 则需要计算的成对距离有n n 1 2个 通常以上三角或下三角表示 将序列数据转化为距离分析的优点 1 序列本身很少有直观意义 距离能直观而具体的表达序列之间差异 2 将序列转换成距离 能够对各自对应的不同进化时间的距离作相应校正 3 距离矩阵方法运算速度快 可用于大规模数据集的系统分析 缺点 1 转化过程中部分系统发生信息丢失 2 转化成距离数据后无法与其他类型性状数据联合分析 3 只有通过性状分析才能识别特定的有用性状 即序列位点 距离数据无法做到 遗传距离计算方法 未校正的遗传距离1 总替换分歧度2 转换 颠换替换分歧度3 同义 非同义替换分歧度4 indel距离校正的遗传距离1 独立估计方法 解析公式法 JC69 K80 最大似然法 2 同步估计方法LogDet距离 考虑进化过程中碱基组成的不稳定性 基因组距离蛋白质遗传距离 类型类似核苷酸 未校正遗传距离 未校正遗传距离 将两个序列的所有同源位点逐一比较 对差异绝对值求和 可以直接获得两序列间发生的总替换数 也可以对indel 转换和颠换分别计数 求出两条序列之间发生的indel数 转换数和颠换数 这些数据除以序列长度就是各自的差异百分比 即未校正的遗传距离 p distance 总替换分歧度 总替换分歧度 根据序列之间的所有类型的差异计算的未校正的遗传距离 仅适用于相似性较高的序列 p nd n nd为两条序列之间不匹配的位点数目 n为比对后序列长度注意事项 1 序列末端长度变异的处理2 空位处理 作为性状 两两删除 完全删除3 相同残基位点数目的确定 严格定义 宽松定义 嘧啶 嘌呤 4 模糊残基处理 转换 颠换替换分歧度 转换距离 序列对之间发生的转换位点数 序列长度 颠换距离 序列对之间发生的颠换位点数 序列长度 同义 非同义替换分歧度 同义替换 蛋白质编码基因序列没有引起氨基酸取代的核苷酸突变 同义替换距离 dS 非同义替换距离 dN 计算方法 1 突变比例法 计算每条序列的同义替换位点数S和非同义替换位点数N 两序列间的同义替换差异数Sd和非同义替换差异数Nd 多重替换校正算出dS dN P80 MY80 NG86 I95 ZRN98 YN002 简并位点法 计算两条序列间无简并位点 二重简并位点 四重简并位点差异数目 算出dS dN LWL85 PB93 L93 C95 MP973 密码子模型法 最大似然法计算61个有义密码子间的同义和非同义替换速率 Ks Ka 计算dS dN MG94 GY94 M96 YN98 校正的遗传距离 随着分歧时间延长 DNA序列上突变的固定数目增加 某些快速进化位点上发生多重替换的概率增大 多重替换位点中后来发生的变化将消除早期变化的任何痕迹 这可通过进化过程的假设估计多重替换的数目来校正 注意事项 1 JC69距离 0 1 JC69 K802 0 11 0 放弃序列 删除快速进化序列 转换成氨基酸5 分析氨基酸序列 近缘物种 且同义替换遗传距离 1 0 用同义替换遗传距离 远缘物种 非同义替换遗传距离 基因组距离 基因组距离 从一个基因组进化到另一个基因组所发生的遗传改变事件的最小数目 包含基因含量距离 基因重复距离 基因重排距离 字符串向量距离 蛋白结构距离 计算遗传距离的软件 PAUP MEGA6 TREECON DAMBE DnaSP TREE PUZZLE 系统树构建 距离矩阵法简约法 简约法利用系统发生学上的离散资料作为特征所构成的矩阵估计一个或多个最佳的系统发生树 而这些资料来源可能是有遗传关系的多个物种或多个族群 之后最大简约法在可能的亲缘树中挑选需最少步骤可形成者作为所估计的亲缘关系树 最大似然法 最大似然法明确地使用概率模型 其目标是寻找能够以较高概率产生观察数据的系统发生树 最大似然法是一类完全基于统计的系统发生树重建方法的代表 该方法在每组序列比对中考虑了每个核苷酸替换的概率 贝叶斯系统发生推论法 贝叶斯推断的显著特征是 为了得到一个统计结论能够利用先验信息和样本信息 系统树构建 1980 2010年系统发生分析文献数量 分析方法及软件使用情况的统计结果 基于距离矩阵的系统树 聚类分析方法 非加权配对算数平均法UPGMA邻接法 NJ 无根树中一个节点所连接的两个分类群互为邻居 使用最广泛的距离树 适用于大数据集最小进化法叠加树法距离树可靠性检验 自举检验 自举内部分支检验 距离树优点 1 简单2 稳定缺点 1 信息丢失2 无比较次优树能力3 统计学分析困

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论