亲属间相似性_第1页
亲属间相似性_第2页
亲属间相似性_第3页
亲属间相似性_第4页
亲属间相似性_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、亲属间相似性在数量遗传学中心的概念中,一个特征的遗传力是一个群体中个体间加性遗传 值的变异(即个人的变化,育种)在总变异的比例:Variance of breeding valuesh 2 = - =Phenotypic Variance由于个体的表现型可以直接取得,表型变异值VP可以从直接测量的人群数据中估 计而来。相反,一个人的育种值(加性效应)不能被直接观察,而必须从它的后代 平均值中推断而来(或更一般使用其他已知的表型值亲属)。因此,Va的估计要 求一些已知的亲属集。最常见的情况(我们在这里关注的)是父母与子女间或子代 之间的比较。我们可以将亲属按 祖传或旁系亲属来进行分类,而我们在这

2、里每次 只关注一种类型的亲属的设计。更一般的家系中,亲属间的信息是已有的。而不是父母。直系的亲属:例如,父母和子女(*测量父母一方或双方的表型且k为后代)/7/f0-a;巴0;口;X旁系亲属:全同胞对有共同的双亲0-a;巴0;口;X*衡量每个家庭k的后代, 半同胞仅共有父母之一*测量每个家庭的k个后代的表现型,而不是父母的表型。注意如果K1,这种设计 既包括全(在任何列)和半同胞(同一氏族的两列之间),被称为嵌套的半同胞对 全同胞对设计。重点观察:亲属间的表型相似性的大小反应了该性状的遗传变异量的大小。如果 性状变异有显着的遗传基础,血缘关系越接近,表型更类似。亲属之间表型相似性我们现在用协方

3、差来表述亲属间的表型相似性。作为一个概念,数量遗传学可 以追溯到大师费舍尔的1918的文章,他阐明了如何用亲属之间的表型协方差来估 计遗传方差,正如我们下面详细阐述的亲属间的表型协方差等于基因的遗传方差。 1.亲子回归有三种类型的亲子回归:两个单亲-子代回归(刻画后代特征均值与在父亲中 Pf或者在母亲中Pm的值的关系)双亲中值-后代回归(后代的均值对他们的父母的表型的均值的回归,父代表型平均值是指MP = (P + P )/2。 一个父代-子代的亲子回归模型中斜率的估计,W,、OP -nO -P)Cov (O, P)1用男性(Pm)和女性(Pf)值来计算各自的回归 贡献,所以单亲回归通常仅限于

4、父亲。双亲中值-后代回归斜率估计为,Cov (O, MP)1、mp = Var (MP)血佗 CoV(O,MP) =在 1bOP=FP where Cov( n-1 父代i的子代的平均特征值Oi,在所有的家庭中表示子代平均值(也叫做所有子 代的grand mean)。所有家长的平均值为一,我们研究n对亲子家庭。人们可以使 因为后者可能包含母体效应的n-乙OP -nO -MPi在这里是父母对的后代平均特征值,这些父母对有一个平均特征值MPi 我们研究口对亲子对。请注意这三个回归均涉及父母与子女协方差。2关系:方差分析在旁系亲属中,对上述样本协方差的公式是不恰当的,有两个理由。首先,通 常每个家庭

5、有超过两个旁系关系.第二,即使家庭仅有两个亲属,这两个的顺序是 任意的。例如,“X”和“Y”之间没有存在于父母和子女的情况中的那种自然的区 别。另一个说明第二点的方式是旁系亲属属于同一类或类别.与此相反,父母和子女 属于不同的类别。父母和子女之间的协方差是一种 组间(类间)协方差,而旁系 亲属间的协方差是一个 组内(类内)协方差。首先在费希尔的1918年的文件中 提出方差分析(ANOVA)方法,用来估计组内方差。在最简单的方差分析框架中,我们可以考虑一个特征的总方差是由两个部分组 成:组间部分(例如,不同家庭的平均值的不同)和组内部分(在每个家庭特征值 的变化)。总方差是组间和组内差异的总和:

6、Var (T) = Var (B) + Var (W)方差分析的一个重要特点是:组间方差等于组内协方差。因而,家庭成员间的协 方差越大,总的变异就越大,因而导致了每组平均值的差异。为了验证该结果,我 们令七=u+气+七,yij表示第i类里面的第j个个体的表型值,其中bi是组间效 应,eij为残差并且 (e *,e.= 0。. The covariance between two members of group i becomes%(yij; yik) = %(x+bi +eij; x+bi +eik)=为(bi; bi) = %2(b)the between-group variance (

7、the variance in the group effects).看到这一点,考虑全同胞间表现类型的极端模式:副g阮K酬淄口门J1241 N 己 耳 与FamilyFamily情形1假设在这里,群间方差Var (B) =2.5,并且群内方差Var (W) =0.2。这样给出了一个总的表型方差=Var (T) = Var (B) + Var (W) =2.7。在这里: 同一家族之中成员间的彼此的相似远大于不同家族之中成员间的相似.家族之间的 平均显型有很大的不同.产生的组内相关系数t是错误!未找到引用源。=0.93我们已经运用了组间方差等于组内协方差(这的协方差是全同胞间的)的方差分析 恒等

8、式。因为同类的元素是全同胞,这时常被七s指示区别它和其他的类别间的相 互关系。情形2假定总的(表型)方差和情形1中相同,即Var (T)=VP = 2.7.然而,假定没有群间方 差(Var (B) =0),必然包含Var (W) =2.7而且类别内的相互关系是t = 0。在这里:同一家族之中成员间的彼此的相似不再大于不同家族之中成员间的相似.家族 之间的平均显型没有显著性差异.表型的相似低,因此遗传变异低。注意:在亲属之中的表型相似能等价地认为是在一群亲属之中的相似性为数量性状 的显型(家属协方差),或在不同的家族之间的显型中的不同(群间方差)的一种 度量,当Cov (Within a gro

9、up) = Var (Between group means)。在亲属之中的表型协方差的因素亲属彼此之间的相似性在数量性状上超过非亲属的两个潜在的原因:1)亲属共用基因。关系愈靠近,被共用的基因的比例也愈高.2)亲属可能共有相似的环境.在亲属之间的基因的协方差:基因的协方差Cov(Gx,Gy)二基因型值(Gx,Gy)的个体评价X和y的协方 差。我们将会首先说明为什么父母和子孙,全同胞和半同胞之间的遗传基因的协方 差取决于遗传方差以和V。然后我们将会讨论在实际中如何估计协方差。基因的协方差出现是因为二个相关的个体相比二个无关的个体是更有可能分享 等位基因。分享等位基因意味着有同一血统(IBD)的

10、等位基因:即一个等位基因的两个副 本能被追溯到一位最近的共同祖先的单一副本。等位基因也可以是形态上的相同而没有血统上的相同。例如,考虑两个父母子女和标签在父母的四个副本的等位基因是否有基因都是相同 的是独立的。双亲:A1A2 XA3A4后代:o1=A1A3 o2=A1A4o3=A2A3o4=A2A4在这里o 1及o都有一个等位基因,。和。分享两个等位基因IBD,。和。没有等 位基因IBD。1.后代和父母一方什么是母本及其后代表型值的协方差?假定在一个父本某个给定的位点上的两个等位基因 为A1和A2,因为父代及其后代精确的分享一个等位基因,即子代的等位基因A 1)是从父代得 来的,而子代另一个基

11、因(设为A3)来自另一方父代。考虑父母对其后代的遗传贡献,我们把 父代的表型值写为Gp = A + D。我们可以通过考虑每一位父代等位基因对整体育种值的贡献而 将其进一步分解,即A= a 1+ a 2 ,因而父代的表现型值我们可以写为Gp = a 1 + a 2 + & 12,这里5 12为对Cov(Go+Gp)=Cov(a1+a2+612,a1+a3+613)我们可以使用协方差规则扩大到9个协方差计算,即Cov (a , a ) =0Cov(G ,G ) = Cov(a1,a1) + Cov(al,a3) + Cov(al,5 ) + Cov(a2,al) + Cov(a2,a3) + Co

12、v(a2,5 ) + Cov(5 ,a1) + Cov(5 ,a3) + Cov(5 ,5 ) 通过这种方法(故意)构建了 a和5膏他们是不相关的。更进一步:121212 13ifx 丰 y ,i,e, noutIBDx yVar(A)/2 ifx=y,i,e,IBD又因为:Var(A) = Var(a1 + a2) = 2Var(a1)所以有:Var (a1) = Cov(a1,a1) = Var (A) / 2所以当个体间共享一个等位基因IBD,他们分享一半的加性遗传方差。类似Cov (5 ,5)= 0ifxy丰wz,i,e,both,alleles,are,notIBDxy Var (D

13、) ifxy= ,i ,e ,both, allels, areIBD当两个个体有共同的两个等位基因时它们仅共享显性方差。根据上面的结论,9个中8个式子为0,因此Cov(G ,G ) = Cov(a1,a1) = Var(A)/22 .半同胞在这里,父母一方是共享的,另一个是在随机抽样得出的个体;Lectune 3T p昏 5半同胞之间的遗传协方差就是01与02遗传值的协方差。为了计算这个值,我们考虑单某一位点。首先注意到,。1与。2要么共有一个 等位基因IBD (从父亲那里获得的),要么就没有等位基因IBD (既然我们假设他们 的母亲是不相关的,这种同胞之间就不可能共享两个等位基因IBD,这

14、是因为他们 没有共同的母系等位基因IBD)。1与。2从父亲那里获得相同的等位基因的概率是 1/2(因为不论父亲遗传给o1是哪一个等位基因,他遗传给o2相同的等位基因的概 率都是1/2)。在这种情况下,两个子代含有一个等位基因IBD,他们对遗传协方差 的贡献是Cov(错误!未找到引用源。)=Var(A)/2.当。1与。2没有共享等位基因IBD 时,他们没有遗传协方差。总结如下:条件概率对遗传协方差的贡献o1与o2没有等位基因IBD1/20o1与o2含有一个等位基因IBD1/2Var(A)/2半同胞对的遗传协方差是Cov (Goi,Go2)=Var(A)/43.全同胞两个个体的父母是相同的, x0

15、1 O:这两个全同胞的基因型值的协方差是多少?正如之前所例证的那样,当考虑全同胞对的时候,有以下三种可能性:他们可 能共享0,1,或2个等位基因IBD。应用之前分析半同胞的方法,就能计算出: 1)每种情况的概率;2)每种情况对遗传协方差的贡献。全同胞中的每个个体都分别从父方和母方获得一个等位基因。每个同胞从父方获得 相同等位基因的概率是1/2,同样每个同胞从母方获得相同等位基因的概率也是1/2. 因此,Pr(两个等位基因IBD)=Pr(父方等位基因旧D)Pr(母方等位基因IBD)=(1/2)*(1/2)=14Pr(0个等位基因IBD)=Pr(父方等位基因不是IBD)Pr(母方等位基因不是旧 D

16、)=(1/2)*(1/2)=14Pr(一个等位基因IBD)=1-Pr(两个等位基因IBD)-Pr(0个等位基因IBD)=1/2从以上我们可知,当两个亲属共享一个等位基因IBD时,对遗传协方差的贡献 是Var(A)/2当两个亲属共享两个等位基因旧D时,考虑到每个个体在位点上相同基 因型,对遗传协方差的贡献为Cov(al + a2 + 5 ,a1 + a2 + 5 ) = Var(al + a2 + 5 ) = Var(A) + Var(D)12将以上结果整合得到,1212CaseProbabilityContribution1 and o-2 have 0 alleles IBD1/401 an

17、d o-2 have 1 allele IBD1/2Var(A)/21 and o-2 have 2 allele IBD全同胞之间的遗传协方差为1/4Var(A) + Var(D)Cov(G , G ) = 13 + 1(Var(A) + Var(D)=尝 + 冬 01 o2 22422全同胞之间的遗传协方差为Var (A)Var (A) Var (D)Cov (Goi, Go 2)=乡+ : (Var (A) + Var (D) = - + 4亲属间环境因素的关系共享的环境因素(比如说共同的母方环境)同样会对亲属间协方差起一定作用, 因此我们必须考虑区分从遗传协方差中这些环境所造成的协方差

18、。假如家庭中成员都在相同环境下共同成长,那么他们共享共同的环境值设为 Ec。如果每个家庭的共有环境氛围是不同的,由于共同环境因素的差异设为Vec,造 成了一个家庭内成员间更大的相似性,而不同家庭间更大的差异性,这比预期中他 们共享的基因比例还要大。因此,与预期中的基因型协方差相比,Vec增大了同胞间 表型协方差。当我们把总体基因型值分解成几部分,一些是共享的,另一些是在亲属间不相 互遗传的,我们在分析环境因素时也可以采取相同的方法。特别的,我们能把总体 环境因素E写成亲属间共享的共同环境因素EC,普遍的环境因素Eg和特异的环境因 素Es,因此,我们可以写成E=EC+Eg+Es,进而把环境变异分

19、割成如下形式:VE=VEc+VEg+VEs(4.7)我们可以更进一步地分析共同环境因素Ec的不同可能来源:EcS或EcL:由于在共同空间或位置(如不同的农场、房室)所导致的共享因素EcT:时间的因素(随时间变化,高潮或营养环境下的改变)EcM:母方的因素(先天和后天环营养) 因此,我们把环境变异分割为如下形式:= % + V,+ Vs= Vc + V,+ Vs + Vcs + VECT + VEcM(4.8)相同的环境因素主要导致同胞间的相似性,但是母方的环境因素也同样会影响 这母亲与后代的相似性。通过正确的实验设计,能够忽略或者估计VEcS和VEcT的值,但是要从全同胞 的协方差中忽略或者估

20、计VecM却十分困难(除了交叉养育以外)。另外,交叉养育 仅仅排除了后天母方的因素,但没有排除共享的先天母方因素。家系中的复杂关系:共祖系数在动物育种中多数的分析都会涉及到家系数据,在这些数据中关系日益地复杂 (如近亲繁殖的亲属)。我们决定引入一种方法来确定这些关系的数量。近交系数与共祖系数假定从个体X和y中随机的抽取单个等位基因,这两个等位基因在血缘上同一 的可能性叫做共祖系数,用帮表示。看待这个问题的另一个方式就是考虑x与y的 一个假设后代z。通过以上的定义可以知道畛是个体z在同一位置上两个基因拥 有血缘同一性的可能性。即为Wright的近交系于是,一个个体的近交系数等 同于其父母的共祖系

21、数:、匚二$气我们现在通过例子进一步证明细是怎样估计得到的。要解决的第一个问题就是 一个个体和它自己的共祖系数:”船。这也许看起来没什么意义,但是,我们很快 就会看到夕忍是一个重要的元素。首先指出个体x携带的两个基因是A1和A2,然后 从群体中随机的抽取一个基因代替其中一个基因,然后再抽取另一个。霸是被抽 取的两个基因有血缘同一性的可能性。有四种抽取基因的方式,每种的概率都是 /:两次都是A1,第一次是A1第二次是A2,第一次是A2第二次是A1,两次都是 A2。如果两次抽取的都是A1,则它们必有血缘同一性因为它们从同一基因复制而来。 这个道理同样应用于两次抽取的都是A2。于是,对基因A1,A2

22、。它们并不是血缘同 一。于是就是(皿)(1) + (1/4)(1)二I/%当然我们也应该认识到x是近亲繁殖的可能性,在这种情况下基因A1与A2血缘同一性的可能性是瓦于是一个个体与其 自身的共祖系数的表达式为:七广 4(i+fx+fx+1)=2(i+dA母辈基因OSOI I于代基因o oI父查基因(图4.1父辈与子代血缘基因一致性。圆圈与方形各自代表从母亲、父亲那里得到 的基因。左图:母亲非近亲交配而来且她的伴侣也非其亲属(所以子代非近亲交配 而来)。中图:母亲是近亲交配而来但与其伴侣无亲缘关系。右图不仅母亲是近亲 交配而来且与其伴侣有亲缘关系,所以他们的子代是近亲交配而来。)在计算一个父代与子

23、代之间的共祖系数时一个稍微复杂的情况出现了。为了简 化这个讨论,我们请感兴趣的家长母亲来参加,但是结果同样适用于提供的轨迹是 常染色体显性遗传的父亲。我们首先考虑母亲与孩子都不是亲近结婚的情况,即: 母亲的父母无血缘关系且其与伴侣也无血缘关系。在这种情况下,以上四种从母代 取得单个基因到子代的方式中,只有一组是有血缘一致性的(图4.1左图)。于是, 。假设母亲是近亲结婚而来(图4.1中图)所以她的两个等位基因同源的可能性是 气这与被子代继承的母代基因和那些不被子代继承的母代基因是血缘同一的 可能性是相同的。获取这样的基因组合的可能性是V4。于是,父母间近亲结婚的T- 达到帅八,在完全近亲结婚的

24、情况下 广”,父母双方的等位基因完全是同源的, 使得夕-为I?。最后,我们允许子代的双亲是有关系的,那么子代的自交系数为fo.(图4.1,右)。现在有必要考虑一个父源的子代基因,其概率为1/2。因为fo等价于父亲与母亲基因有相同IBD的概率,另外,由自交导致的亲子相同性为fo/2。总 之,最能表现父代和子代近交和共祖系数的式子为(4.10)0 po= 4(1+匕 + fo )通常在文献中,被简单的当做1/4.现在我们可以很清楚地了解这种假设是建立在父 代没有近交的情况下的。现在我们来考虑父母都相同(全同胞)的共祖系数。我们假设一个种族有不同的 性别,那么父亲和母亲就是不同的个体了。我们再次从最

25、简单的情况开始考虑,逐 步假设父代是自交或者是有关系的(Figure 4.2)。为了对全同胞和关系更为复杂的结构进行分析,在图4.2中的元素不再代表配子(像4.1中)而是代表个体。Figure 4.2由路径图分析得从全同胞是IBD得来的随机基因的概率是相同的。沿单 头箭头路径系数总是等于1/2。左:父母,m和f既不联系,也不自交系。中心: 父母无关,但近交系。右:除了近交外父母还有共祖系数土 。让m代表母亲f是父亲,x和y是他们的子代。当父母既不自交也没有关系时, 相同基因被传递到x和y有两种方式-一 和-一。两种方式都有相 同的序列,我们简单的看一下他们中的一个。首先,我们标记x和y接受相同

26、基因 的概率是1/2。母亲和自身的共祖系数为工,被表示为图中的双箭头。第二,我们 注意到x从母亲那随机得到基因的概率是1/2, y也是一样。那么,得到两个母源基 因是IBD 一个来自x,一个来自y的概率是-。加之,父亲路径有相同贡献.一,一,得到共祖系数 = 。路径分析提供了一种简单的方法 来获取这个结果。首先,设置在图4.2上的单箭头为首的所有路径系数等于1/2.然 后,请注意路径对两个变量之间的相关系数贡献等于的路径系数和与共同因素相关的相关系数的共同结果。(这种情况下= - -)o基因的概率是12。母亲和自身的共祖系数为:,被表示为图中的双箭头。第二, 我们注意到x从母亲那随机得到基因的

27、概率是1/2, y也是一样。那么,得到两个母 源基因是IBD 一个来自x,一个来自y的概率是- 。加之,父亲路径 有相同贡献- 一,得到共祖系数- =。路径分析提供了一种简单的方法来获取这个结果。首先,设置在图4.2上的单箭头为首的所有路径系数等于1/2. 然后,请注意路径对两个变量之间的相关系数贡献等于的路径系数和与共同因素相 关的相关系数的共同结果。(这种情况下= - -)o现在我们考虑父母是近交的概率,自交系数是和,这种情况使得个体与其 自己的共祖系数增大。这是唯一的要改变在图4.2 (中心)的路径图。目前仍然只 有两个途径,导致x和y有相同的基因,而且他们的和是0 = - G +0 )

28、= -!-m + 左土 -G + f + f )4.11a冲 4 mm ff 4 22 J 8 f m最后,当双亲有亲缘关系,二者的共祖系数为-,则对于子代x与y会有另外 两种路径产生IBD,如图4.2 (右):”一 一 一 ,“一 ,一 令图中单向箭头的系数为1/2,其中每一条新的路径会使x与y的共祖系数增 加-“ /4,则同胞对的共祖系数可总结为0斗= G + ff + 七+0可)4.11b当亲代为随机婚配时,会变为将上述x与y的共祖系数的推导推广到更一般的亲缘关系以及更复杂的亲缘模 式,则IBD是由两种类型的路径得到的。第一种路径:是双亲有一个相同的祖先; 第二种:是x与y的祖先有亲缘关

29、系。且两种路径中,相同的祖先最多只会通过一 次。其共祖系数计算公式总结为r-丫-1+蒙n -2jk4.12i其中,-表示经过共同祖先i的个体数(包括x,y),表示通过有亲缘关系的祖先j,k的个体数(包括x,y)Wright在1992年第一次将他的近交理论应于分析Roan Gauntlet (一只英国公 牛)的家谱,如图所示。长方形和椭圆分别代表公牛和母牛Lett ure 4?pg. 10这里,要计算的是Royal Duke of Gloster和Princess Royal的共祖系数,也就 是Roan Gauntlet的近交系数。Royal Duke of Gloster和Princess R

30、oyal获得IBD的路径有4条,在家谱中用有箭头的线标出,其中两条分别经过4个个体,另外两条分别经过7个个体。假设,Lord Raglan 和 Champion of England 不是近交后代,即-=-L则 Royal Duke of Gloster和 Princess Royal 的共祖系数为卜匚1 - L =求得的值与半同胞的共祖系数0.125相近。子代Roan Gauntlet的近交系数大约为14%兄弟系数(暂定译法)目前为止只讨论了单基因的IBD,接下来介绍另一个两个体基因位点的基因型的 旧D有用的量度:兄弟系数,记为一x与y获得基因型IBD的路径共有两种类型:(1) 一与的共祖基因和.与的共祖基因;(1)与的共祖基因和,与 的共祖基因 兄弟系数定义为:(4.13)Wf+w河x y x yx y x y下面举两个例子说明上述方程。第一种,假定X与y是同胞,即mx=my=m,fx=f y=f则4.13式简化为A叫=0邮爪0订+ 0如(4.14) 如果父母是没有亲缘关系的,则气f=0,如果父母不是近交

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论