人类遗传统计基础—术语、概念、基础统计培训(ppt 96页).ppt_第1页
人类遗传统计基础—术语、概念、基础统计培训(ppt 96页).ppt_第2页
人类遗传统计基础—术语、概念、基础统计培训(ppt 96页).ppt_第3页
人类遗传统计基础—术语、概念、基础统计培训(ppt 96页).ppt_第4页
人类遗传统计基础—术语、概念、基础统计培训(ppt 96页).ppt_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人类遗传统计基础 术语 概念 基础统计 2004年10月 北京 常用术语与概念 染色体 chromosome 46条 23对同源染色体 homologouschromosome 有丝分裂 mitosis DNA复制形成姐妹染色单体 chromatid 姐妹染色单体分开进入新细胞 减数分裂 miosis DNA复制形成姐妹染色单体 同源染色体配对 四倍体 交换 同源染色体 分开进入新细胞 姐妹染色单体 分开形成配子进入新细胞 单倍型 haplotype 一条染色体上不同基因座上来自同一个亲体的基因排列 遗传密码 DNA链上不同的碱基排列 为了编码20种氨基酸 需要最少3个碱基组成1个序列片段 称三联体密码 tripletcode 每个三联体 如AAA 在mRNA上的副本 UUU 称为一个密码子 codon 地球上所有生物都具有统一的遗传密码 同一氨基酸可有好几个密码 密码子的专一性主要由前两个碱基决定 64个密码中61个都对应了相应的氨基酸 其中一个 AUG 对应甲硫氨酸的唯一密码 兼具起始密码功能 另有3个终止密码 UAA UAG和UGA 基因 gene 完成特定功能的一段核苷酸序列 基因座 locus 基因在染色体上的位置等位基因 alleles 同一位点上可能出现的基因 例如ABO血型基因基因型 genotype 同一位点上两个等位基因的组合纯合体 homozygote 如A A杂合体 heterozygote 如A O表现型 phenotype 基因型控制的性状 表现型与基因型并非一一对应关系 单基因性状 由单个基因控制的性状 这些性状之间的差别明显 一般没有中间过渡类型 呈不连续变异 质量差异 称为质量性状 qualitativecharacter 如单眼皮 双眼皮 卷舌 用手习惯 卷发 直发 血友病 色盲等 单基因性状属于孟德尔式遗传 多基因性状 由多个基因共同控制的性状 这些性状的变异有一系列过渡类型彼此间只有数量的差别 没有明显质的界限 呈连续变异 因此 多基因性状又称为数量性状 quantitativecharacter 人类性状多是数量性状 如智力 身高 肤色 冠心病 消化性溃疡等 多基因遗传 一种遗传性状的表达受两对或两对以上基因的控制 各对基因彼此间没有显性隐性关系 每对基因对表型的效应都很小 各对基因的作用有积累效应 多基因遗传的特征 1 纯合亲本 F1的表型一般是双亲的中间类型 2 F2个体的表型平均值大体上与F1相近 但变异幅度显著增加 3 含有环境效应 环境因子数目越大 变异越接近正态分布 4 当双亲不是极端类型时 其子女可分离出高于高亲值或低于低亲值的类型 称超亲遗传 基因频率 allelefrequency 人群中一个等位基因占该位点全部基因的比例基因型频率 allelefrequency 人群中特定基因型占该位点全部基因型的比例基因多态性 polymorphism 一个位点上等位基因频率中最大值不超过95 孟德尔第一定律 独立分离 得到父母2等位基因之一的概率为1 2孟德尔第二定律 自由组合 不同染色体上的等位基因传递独立 P AB AaBb P A Aa P B Bb 哈代 温伯格平衡 无迁移 选择 突变 群体中的基因频率和基因型频率保持不变 P A p P B q P O r全部 p q r 2 近交系数F一般 0 005 遗传漂变 有限群体中 除迁移 选择和突变外 基因库中仅部分个体贡献下一代配子 这种因抽样产生的随机性导致下一代基因频率变化 有效群体 群体中生育年龄个体数 有效群体大小 N 4MF M F 例 达到生育年龄男性50 女性200N 4 50 200 50 200 160 ABO血型基因型与表现型 白人4种ABO基因的基因型与表现型频率 基因频率a1 0 21 a2 0 07 b 0 06 o 0 66 隐性 recessive 显性 dominant 共显性 codominant 交叉 crossover 互换 减数分裂中同源染色体配对 条染色单体之间 一次减数分裂至少一次交叉重组 recombination 奇数次互换导致一个重组 重组率 recombinationfraction 无连锁 连锁 连锁分析需家系资料 亲体须双杂合体才可能有信息 男女亲体 不同 回交 backcross 测交 testcross Aa AA aa 杂交 intercross 仅对2alleles适用 重组体 recombinant 非重组体 nonrecombinant 有连锁信息的条件 至少一个亲体为双杂合个体 doubleheterozygote 遗传度 heritability 遗传因素在性状表现中所起作用的大小 如果性状变异完全由环境因素造成 遗传度等于零 如果性状变异完全取决于遗传因素 则其遗传度为100 参与遗传机制的基因可以是1个 2个 几个和多个 遗传性状可以是定量 定性的 对定性形状 假定存在一个定量的 易感性 当其超过阈值时 发病 多基因阈值性状 一些估算遗传度的公式 双生子资料 h2 2 MZ DZ 父母子女资料 h2 2 父子 亲属 无父母 资料 ANOVA L h2 L MSb MSw MSb n 1 MSw h2 2 L 流行资料 prevalencedata 根据人群患病率Bp和患者直系亲属患病率Bo计算 h2 2Bp t X Bo f t t X Bp X y 1 1 y f t t 分离分析 检验家庭数据的遗传模式 估计分离率 比较与期望分离率的吻合度常染色体显性遗传 单基因 等位基因A a A致病 p A p 0 各婚配孟德尔 最可能出现的婚配型是Aa aa 一个子女患病一个不患病信息量最大 通常假定为Aa aa型 患病子女数X服从二项分布b n 欲检验 1 2 计算 2 4 ri n 2 2 n 1n k个家庭子女总数 ri 家庭i患病子女数 n k个家庭子女总数 ri 家庭i患病子女数例 乳光齿质症 亲本之一患病 共调查112子女 其中52人患病 2 4 52 112 2 2 112 0 57140 3 p 0 5该病可能属常染色体显性遗传 单基因 常染色体隐性遗传 单基因 孟德尔分离率 1 4 按最大似然方法估计 再与1 4比较 一般计算复杂 借助计算机程序实现 图距x 位点间的遗传距离 可转换成 遗传图谱 已知图距的基因排列x x cM Morgan 1cM 1000kb kb 1000核苷酸对 图距函数 x与 的关系Haldane x 0 5ln 1 2 0 0 5x 其他Kosambi x 0 5tanh 1 2 位点 x 2 x23 13 x13 连锁群 多态性程度 1 杂合率 hiterozygosity pi2pi 第i个allele频率 u n n 1 ABO基因频率0 28 0 06 0 66 0 282 0 062 0 662 0 48 考虑近交 1 F H一般F 0 005 a个等概 pi2 1 1 aa 1 1 H 例 H 0 9 a 10 2 多态信息量PICPIC pi2 2 pipj 2ABO基因频率0 28 0 06 0 66PIC 1 0 282 0 062 0 662 2 0 28 0 06 2 2 0 06 0 66 2 0 41 对max 95 的多态性定义 有 H 0 10 PIC 0 10 突变率 H 1 H 似然函数 似然函数L 观察到手头样本F的概率 对二项分布 p A p p a 1 p 观察到 k n 记为F 的概率为 P p F P p n k Cnkpk 1 p n k 例如n 4 k 1 p 0 3 P p F C41 0 3 0 73 0 4116如果p 0 4P p F C41 0 4 0 63 0 3456 L随F和分布 参数 而变 似然函数与最大似然估计 分布常参数化为 似然函数写成L F 二项分布 p F表示为 n k L F P p n k Cnkpk 1 p n k 已知 L F 是 的函数 给定 下的概率 的最大似然估计 使L F 最大化的 对上述例子 n 4 k 1 二项分布 p 最大似然估计 MLE的计算 对 L F 求解一般 令 ln L F 对上述二项分布例子 n 4 k 1 p L F L p F Cnkpk 1 p n k 4p 1 p 3Ln L p F ln 4 ln p 3ln 1 p 令 ln L p F p 1 p 3 1 p 0 1 4p 的MLE为0 25 MLE的单调变换仍是MLE 例如 2 2 MLE一般是有偏的 MLE一致 渐近无偏 渐近正态 假设检验 实例 3例死亡1例 一般病死率57 疗效好 1 3 0 57 以0 57为真病死率 100个n 3的样本 总病死率 171 300 57 但1 3样本有32个 0 3样本8个 共40个 占40 样本可能是这40 中之一 结论有问题 想证实疗效好 H 收集数据 作结论 结论没有考虑数据对H的支持程度 科研工作一般步骤 研究者的科学假设H 进行试验得到样本数据S 根据S对H的支持程度做出推断 假设检验 概率意义的 反证法 先设立H的对立假设H0 H记为H1 把H0下的样本空间 划分为拒绝域R与接受域A A R A R 观察样本S 落在A 或R 中 根据S位置进行推断 接受H0 当S A 拒绝H0 当S R 划分A和R的依据 A R A R p R H0 很小 R H0为小概率事件 如果H0真 一次试验中 R H0 一般不会出现实际实行 S 统计量T T的分布已知 划分 划分 当T为t t检验 A t t R t t 似然比检验 T supL F supL 0 F 如果H1真 则T 倾向于大 当T Tc时否定H0 Tc满足 p T Tc H0 按切贝雪夫不等式p T Tc H0 1 Tc 1 Tc p T Tc H1 似然比检验 例 5个重组事件 1个重组型 0 20 H0 无重组 0 5 H1 0 2T 0 2 0 84 0 55 2 62144若取 0 05 Tc 20 T Tc 不能否定H0 P值 经验显著水准 p T T H0 上例 T 2 62144 P值 1 2 62144 0 38147 支持函数 对数 似然函数 似然方法 不光是MAX L F 似然比检验时只考虑H0下似然比的分布 而是直接根据L F 推断 区间估计 连锁分析一般不做 支持区间 比似然函数曲线最大值小m个单位处画一条横线 其与似然函数曲线的两个交点对应了两个 值 它们构成 m单位支持区间 一般取m 2 Bayes定理 A B1 Bn 已知p A Bi 和p Bi 欲计算p Bi A p Bi A p BiA p A p A Bi p Bi p A Bi p Bi 例 稀有显性病 致病等位基因频率为p E1 患病父 母为纯合子 E2 杂合子 n个子女患病 F 条件下 患病父 母为纯 杂 合子的后验概率 E1的 非条件 概率为p2 E2为2p 1 p E1的相对概率 前概率 p2 p2 2p 1 p p 2 p 欲求后概率p E1 F p E2 F 连锁分析基础 基因连锁 linkage 同一染色体上两个位点的等位基因一起传递的现象 例如基因型AB ab 形成AB和ab两种配子 若交换则形成Ab和aB称重组体 连锁分析 根据家系资料估计 后者可用以分析基因座之间的图距 0 01 1图距或1分摩 cM 一般图距 25cM时这种近似线性关系成立 连锁平衡 linkageequilibrium 两个基因座上的等位基因独立 否则称连锁不平衡 disequilibrium 连锁不平衡参数 p AB p A p B 若初始 0 0 n代随机婚配后 变为 n 1 n 0当 1 2 很快达到平衡 连锁分析方法 直接法 重组事件k n 直接用k n估 可按二项分布计算可信区间 问题 须确知父母基因型 但即使是已知型双杂合体父母 也有时不能明确判断重组 Y统计量 重组事件k n 给定双杂合体父母相后 y k n k 只随 而变 1 2时最大 0时为0 Y统计量的效力低于最大似然估计 同胞对法 Penrose 依同胞两性状异同检验连锁 例 W T为基因型WW Ww及TT Tt的表现型 父母婚配为WT wt 两个子女可能的基因型组合有10种 可归4类 做成四格表如下 若不连锁 则4个格子里的频数应差不多一样 可按四格表 2检验法进行检验 未考虑父母基因型 低效 受累同胞对 ASP 法 见后 最大似然法 maxT 似然比 改变 0 1 2 找到极大化T 者为MLE 可信区间 困难 一般计算支持区间 见后 u统计量法 两代家系 仅对松散连锁有效 似然分数法 LOD Z 是似然比T 的常用对数 Z log10 T log10 L F L 0 F 不一定最大化Z 而是计算一系列Z 例 腺瘤样息肉 显性遗传 Ff 标记等位基因1或2 祖父是纯合体f2 f2 祖母患病已死 子女患病 未患病 祖母疾病基因型Ff 子女标记基因有12 22 祖母标记基因型12 但祖母可能有2相 F1 f2 F2 f1 相 4个非重组型 相 4个重组型 两相按等概处理 L 1 4 2 4 2 1 4 4 2似然比统计量T L L 1 2 8 1 4 4 Z log10 8 log10 1 4 4 若 0 1 Z 0 72 例 疾病位点等位基因记为1 2和3 标记位点是HLA 等位基因a b c d 或ABO血型 等位基因A B O 个体表现型可能的基因型 父1 3 a bI 1a 3bII 1b 3a母3 3 c d3c 3d子3 3 a c3a 3c女3 3 b c3b 3c 父I型下子重组 II型下女重组 似然函数为L 1 2 1 2 1 L 1 2 1 4 Z log 4 1 个体表现型可能的基因型 父 I 1a 3bII 1b 3a母3 3 c d3c 3d子1 3 a c1a 3c女1 3 b c1b 3c女3 3 a d3a 3d 父表现型未知 通过其他成员得其可能的基因型 I型下2重组 II型下1重组 似然函数 L 2 1 2 1 2 2 1 2L 1 2 1 8 Z log 4 1 此3子女信息量与上面2子女同 个体表现型可能的基因型 父1 3 O1o 3o母1 3 AI 1a 3oII 1o 3a子1 3 O1o 3o子1 3 O1o 1o子3 3 A3a 3o 因子有O型血 故母亲杂合 I下若1st子的1o来自母亲则为重组 来自父亲为非重组 II型下反之 给定任意 型 其概率为 2 1 2 2 1 4 是常数 在LOD里消掉 无信息贡献 次子与三子在I型下重组 L 2 2 1 2 2 2 1 2 2Z log2 log 2 1 2 个体表现型可能的基因型 父 p2 3a 3o2p 1 p 3a xo或3o xa母1 1 O1o 1o女1 3 O3o 1o子1 3 A3a 1o子1 3 O3o 1o 父的ABO基因必是a o 疾病位点只考虑3 把其他并为 x 记3的基因频率为p 有3种可能的基因型 1 3 3 此时3个子女基因型出现概率为1 2 条件似然Lc为1 8 无连锁信息 此情形出现的概率为p2 2 3 x 若3a xo 则长子非重组 其余2子女重组 Lc 2 1 8 3o xa下反之 Lc 1 2 8 加总得Lc 1 16 其概率2p 1 p 把条件似然按概率加权求和得到 L p2 8 p 1 p 1 8 Z p log 4 1 1 p p 1 3p Zmax在 1 2处达到 Zmax 0 其他lod皆为负值 Z p 除了随 改变而外 还依赖于参数p 多个齐性家系的资料 Z 值可以累加 固定 一般以表格形式报告连锁分析结果 列是不同 的值 行是不同的家系 由于不完全外显 信息缺失 男女重组率不同等原因 Z 一般需通过计算机程序计算 资料如果有偏 似然函数L 会受影响 但似然比统计量T 因而Z 不受影响 因为分子分母同时受影响而抵消 一般 从0以步长0 05变到1 2 计算一系列的Z 值 Morton双位点连锁分析当 2 21 4 6 3 13 8 渐近p 0 0002因单尾 渐近p 0 0001当考虑男女 不同 应取3 4为上界 否则p实际上 0 00025 Morton后验 类错误概率P H0 s P s H0 p H0 P s H0 p H0 P s H1 p H1 一般认为p H1 0 05 在44条染色体中 2基因位于同1条上的概率为0 044 若 0 5 0 001 3 66 的后验 为什么连锁分析里设定的 那么小 为了使Morton后验 类错误概率不过大 简单假设下的切贝雪夫不等式p T Tc H0 1 Tc对广义似然比检验 此时 不事先设定 而是估出 仍成立 p Zmax Zc H0 10 Zc例如Zc 3对应的p值上界是0 001 任何观察到的Zmax 对应了一个不超过10 Zmax的经验P值 例如Zmax 4对应的经验p值 0 0001 Zmax 1 5的经验p值 0 031623 的1 单位支持区间 高度为Zmax 1的横线与Z 曲线产生两个交点 若Z 在 0时最大 则下界取0 4 6Z 21 1个Z 单位乘以4 6就转换为 2单位 一个对 0的 2检验在 2达到4 6时对应了一个0 032的渐近水准 因此 上述支持区间有时被看作渐近置信区间 置信度96 8 按切贝雪夫不等式p Zmax Zc H0 10 Zc 置信度下界为90 为了使支持区间一致于检验 仅当Zmax 3时才构造3 单位支持区间 等量观察数当k n已知 则k n e为 的MLE 对 e 0 Zmax nlog2 n k log 1 e klog e nlog2 n 1 e log 1 e n elog e n log2 1 e log 1 e elog e Zmax nlog2当 e 0 解出n n Zmax log2 1 e log 1 e elog e 当 e 0n Zmax log2当 e 0k n e 例 6家系连锁分析 n 24 k 0 在 e 0处得到Zmax 3 26 等量观察数n Zmax log2 3 26 log2 10 83 k 0实际观察数24比等量观察数11大 说明未知相与基因型而人为指定时夸大了资料的信息量 简单家系资料的精确检验 n家系 m子女 已知相双回交家系 可明确判断重组数k 可计算Zmax 以及结果显著的概率ps 样本空间里那些 的样点概率之和 对不同 值 计算的ps列于表中 当n3 当n 10 15 仅Zmax 0 n 可 3 故ps 1 n 当n 16 19 仅Zmax 0 n 和Zmax 1 n 可 3 故ps 1 n n 1 n 1 n双回交家系 m子女 不同 下得到显著性结果的概率 原为nm 10 原为nm 16 可见 1 如果以Zmax 3 或2 为依据 则 不再固定 故有人建议除了报道Zmax 还要报道p值 2 仅当连锁紧密时 0 01 功效好 多重检验问题 单个检验假阳性概率 1 g次独立检验后假阳性概率 1 1 1 g 1 1 1 1 g 1 g 称Bonferroni校正 另一方面 排除掉一部分标记位点增大了剩余标记位点连锁的先验概率 二者抵消 以基因组为单位的假阳性概率不用校正 但对复杂性状 无事先假定的疾病位点 须通过检验来发现 不存在增大剩余标记位点连锁先验概率效应 随着标记位点增加 位点间图距缩小 或只是重复检验次数增加 以基因组为单位的假阳性概率也增加 按Bonferroni校正原理 有人提出一个简单公式 Kidd Ott1984 记单个检验水准为 1 g次检验后水准约为 g 1 g 1 10 Z 这个Z控制了总水准 1 10 Z log g 为了控制总水准 取单次检验界值为Z0 Z log g 例如 当Z 3 做5次检验 可取Z0 3 log 5 3 69897一般可通过模拟 例如SIMULATE程序 来近似总水准 对受累同胞对分析情形 有人对标记位点的不同图距计算了 1和Z0 受累同胞对分析 给定相邻标记位点图距和全基因组扫描总水准 0 05时的lod分数界值据Bonferroni校正结果 相邻标记位点图距在8cM以上时大致可视为稀疏 独立 家系资料的似然函数 L p x1 x2 xm 此处xi表示第i个家系成员的表现型 L条件独立 L p x gp x g gp x g p g Elston Stewart算法 逐步计算条件概率L p xm 1 gm 1 p gm 1 p xm gm p gm 从家系最底层开始 LINKAGE Lander Breen算法 计算量随家系成员数指数增加 随标记位点数线性增加 Kruglyak算法 定义遗传向量 p1 m1 分量为0 1变量 以及记分函数S F F是观察到的表现型 GENEHUNTER 家系资料的信息量 最大似然分数Zmax Fisher信息量I d2lnL d 2 必须是 的最大似然估计解析解I 是 估计值的近似方差 期望似然分数 在 处把每个LOD按发生概率加权求和 得到一条期望LOD曲线 ELOD一般指期望LOD曲线的最大值 ELOD的计算例 3子女 k重组 r 0 10 表内是Z值 期望LOD对不同家系有可加性 例如 为使似然分数 需要多少这样的3子女家系 3 0 48 6 23 大约7个 MELOD 期望LOD曲线的最大值 EMLOD 期望最大似然分数E Zmax 不可加 ELOD MELOD EMLOD 检验功效 p Zmax Zc 本例p Zmax 3 0 p Zmax 0 5 0 729 p Zmax 0 05 0 972 对表现型不详的家系资料 ELOD通过模拟来近似 如条件ELOD 目的是在测定标记基因型之前预测 如果测定了标记基因型 大致会得到什么样的Zmax 期望信息量与方差Fisher信息量I d2lnL d 2假设有1个重组 3个非重组事件Ln L ln 3ln 1 最大值在 1 4处 对Ln L 求二阶导数得 I Ln L 1 2 3 1 2 I Ln L 1 2 3 1 2I 0 25 1 0 252 3 0 752 21 3此I 是在MLE处计算的 期望信息量是真重组率r的函数I r 当结果分c类 每个观察值的期望信息量是 i r cq2 r p r p r 是类别发生概率 q r 是p r 例如重组与非重组 c 2 p r r q r 1 非重组率p r 1 r q r 1 i r 1 r 1 1 r 1 r 1 r n个子女提供的总期望信息量是I r n i r 1 I r 为MLE的渐近方差 多参数情形下 I r 取矩阵形式 称信息矩阵 按婚配类型计算期望信息量的步骤 1 列出可能的单倍体 可能的基因型合并难以区分的基因型2 按表现型归组基因型 各型概率 按i r cq2 r p r 计算期望信息量 例 A1 B2 A1 B2型婚配 共显性 A配子概率为1 2 A2为r 2 A1为 1 r 2双亲配子及子女基因型概率归纳如下 一方父母另一方父母 A1B2A2B1 1 r 2 1 r 2r 2r 2 A1 1 r 2A1 A1A1 B2A1 A2A1 B1B2 1 r 2B2 A1B2 B2B2 A2B2 B1A2r 2A2 A1A2 B2A2 A2A2 B1B1r 2B1 A1B1 B2B1 A2B1 B1 实际上只有10种不同的子女基因型 子女基因型及其概率这些基因型确定了9种表现型 A1 B2 A1 B2型婚配子女表现型及其概率 表现型的概率如果相同 它们的LOD分数也相同 对期望信息量的贡献也相同 因此把它们合并归为一类 A1 B2 A1 B2婚配归类表现型及其概率 总lod nZ 加总是对所有表现型类别 n是各类的子女数 一个子女的费歇信息量为 i r 1 r 1 r 4r 1 r r2 1 r 2 2 期望LOD P r Z 以r替代 得到 ELOD 1 r2 log 2 1 r r 2 r log 2r r2 1 r 2 log 2r2 2 1 r 2 给定真重组率r 上式提供了已知相双杂交子女的平均连锁信息量 在r 处ELOD 0 而在r 0处达最大值0 45 因此 为了得到3或更大的期望lod 需要3 0 45 6 67 即大约7个子女 多个等位基因情形下的双杂交假定2位点各有4个等位基因 ABCD和1234 考虑婚配A1 B2 C3 D4 按上述步骤 每个子女都是双杂合体 有16种可能的不同基因型 它们的概率有3种 1 r 2 r 1 r 和 r2 合并为3类后 类概率为 1 r 2 2r 1 r 和r2 婚配A1 B2 C3 D4每个子女能判断出2个重组事件 其Fisher期望信息量为 i r 2 r 1 r ELOD为 ELOD 2rlog 2r 2 1 r log 2 1 r 二者都大于A1 B2 A1 B2型 2等位基因 婚配子女 因为等位基因数增多了 当r 0 ELOD 0 601 2 allele型为0 451 二者比值为1 33 对紧密连锁 100例4 allele子女相当于133例2 allele子女 随着r增大 比值逐渐趋近于2 i r 比值在r 0时为1 随着r增大 比值逐渐趋近于2 因此 4 allele子女的信息量大致为2 allele子女的2倍 已知相双回交A1 B2 A1 A1此时k n已知 i r 1 r 1 r 期望lod rlog 2r 1 4 log 2 1 r 在r 0处 期望lod 0 30 这种婚配每个子女相当于一个重组事件 故常用作与其他婚配比较的基准 这种父母基因型已知的婚配 n个1子女家庭提供的信息等同于n 2个2子女家庭 也等同于1个n子女家庭提供的信息 两子女的未知相双杂交双杂合体为I相 A1 B2或II相 A2 B1 纯合体为A1 A1 假定一个子女为基因型为x A1 A1 x在I相下是非重组型 II相下是重组型 p x p x I p I p x II p II 1 r r 与r无关 对似然函数及LOD没有贡献 其他基因型也如此 故未知相双杂交的一个子女对连锁分析无信息贡献 2子女情形 设x1 x2 A1 A1 对给定相 2子女条件独立p x1 x2 p x1 x2 I p I p x1 x2 II p II 1 r 2 r2 1 r 2 r2 8 f1对子女基因型组合x1 A1 A1 x2 A2 A1p x1 x2 p x1 x2 I p I p x1 x2 II p II 1 r r 1 r r 1 r r 4 f2 其他所有可能的子女基因型组合概率都是f1 1 r 2 r2 8 或f2 1 r r 4 把相同概率的基因型组合归组 得到 类1指在I相下非重组 类2指在I相下重组 可见在亲体相不清楚时子女基因型不独立 这个表的相关系数 1 2r 2 1 2r称为连锁参数 当r 0 1 否则 0 此表可进一步合并 得到2个类别 2子女要么都重组要么都不重组 类别1 以及一个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论