




已阅读5页,还剩46页未读, 继续免费阅读
(概率论与数理统计专业论文)相依人群的基因型的联合分布及其应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
y a 6 8 3 譬, - 摘要 w e i 。( 1 9 9 4 ) 研究过关于在一个子人群中两个随机选择的无关个体的基因型的联合概 率问题。他通过1 5 种具体的同源遗传关系和对应的1 5 种具体的同源遗传关系的6 ( 如, 屯6 ,6 a b c d ) 概率和4 种。( p ,7 ,6 和) 概率来描述两个随机选择的无关个体的基因型 的联合概率。本文第二章第二节首先考虑任意n 个随机选择的无关个体的所有可能的同 源遗传关系,定义了相应的d 概率,并利用它得到这n 个个体的基因型的联合概率分布 公式,w r i g h t ,s ( 1 9 5 1 ) 在研究相关问题时假设了进化平衡条件,我们这里不需要这个条 件,因而适应面更广。第二章第三节具体研究了三个个体的所有同源遗传关系、给出了 所有的6 概率、j 概率与。概率的关系,以及用j 概率和a 概率表示的联合分布公式, 并在进化平衡状态下给出了所有的d 概率与口概率之间的关系。 “和s a c k s ( 1 9 5 4 ) 利用三个基本的随机矩阵得到了两个具有血缘关系的非近亲生育 的个体的基因型的联合概率。j a c q u a r d ( 1 9 7 4 ) 利用他们的结果去求解同一家族中两个个 体的基因型的联合概率,但是这些结果只是解决了两个个体的情形。g i l l o i s ( 1 9 6 4 ) ,h a r r i s ( 1 9 6 4 ) ,j a c q u a r d ( 1 9 6 5 ) ,l a n g e ( 1 9 9 2 ) 等提出了血亲系数的概念并讨论了血亲系数之间的 关系,这些关系在理论上可以用来解决相关个体的基因型的联合概率分布问题,本文第三 章给出了一系列任意多个具有血缘关系的非近亲生育个体的基因型的联合概率的公式, 第三章第二节得到了有共同父亲的两个个体和任意n 个个体的基因型的联合分布公式, 这些结果的应用非常方便,并具体列出了三个亲兄弟、两个亲兄弟和他们的一个同父异 母兄弟、三个同父异母兄弟的所有基因型的联合概率。第三章第三节对中国人口模型中 的个体做了一些研究,对理想模型和同一对祖先模型,得到了第k 代任意n 个个体的基因 型的联合分布。第三章第四节对同一家族的同一代的非近亲生育的个体情形做了研究, 引进了偏基因型的概念,得到了相邻两代之间联合概率的递推关系,这个结果也可推广 到不同家族的情形。第三章第五节利用前面这些结果做了两个案例分析。 关健词:等位基因,同源遗传关系,6 概率,a 概率,非近亲生育,基因型,基因型 的联合分布,似然比。 a b s t r a e t t h ec a s eo ft w oi n d i v i d u a l sh a sb e e ns t u d i e db yw e i r ( 1 9 9 4 ) ,b yi n e a n so ff i f t e e nd e t a i l e d i d e n t i t ys t a t e s m e a s u r e s6 0 ,以6 ,t 一,j a b c da n d f o u ra v e r a g em e a s u r e s0 ,7 ,d ,a n d i nt h es e c t i o n 2o fc h a p t e r2 ,w ef i r s tc o n s i d e ra l ld e t a i l e di d e n t i t ys t a t e so fa r b i t r a r ybu n r e l a t e di n d i v i d u a l s t h a th a v eb e e ns e l e c t e da tr a n d o mf r o ma s u b p o p u l a t i o n w ed e f i n et h eo p e r a t i o na m o n g t h e s e 6m e a s u r e s ,w eh a v e j o i n tg e n o t y p i cp r o b a b i l i t yd i s t r i b u t i o no ft h e u n r e l a t e di n d i v i d u a l sb y t h ed e f i n i t i o no f6m e a s u r e si tm a yb eb e t t e rt h a nw r i g h t sr e s u l tb e c a u s ei ti sn o tt h ec o n d i t i o n o fe v o l u t i v eb a l a n c e i nt h es e c t i o n3o fc h a p t e r2 。w ed e s c r i b et h r e ei n d i v i d u a l s a t ld e t a i l 械 i d e n t i t ys t a t e s ,a l lj o i n tg e n o t y p i cp r o b a b i l i t yd i s t r i b u t i o n sb y6m e a s u r e so rnm e a s u r e s ,t h e r e l a t i o n s h i pb e t w e e n 6m e a s u r e sa n ddm e a s u r e s a n dw ea l s oh a v ee x p r e s s i o no fa l ldm e a s u r e s b y a0 m e a s u r e s l ia n ds a c k s ( 1 9 5 4 ) d e r i v e dj o i n ta n dc o n d i t i o n a lg e n o t y p i cp r o b a b i l i t yd i s t r i b u t i o nf o r t w or e l a t i v e sn e i t h e ro fw h o mi s i n b r e d ,b ym e a n so fb a s i cs t o c h a s t i cm a t r i c e s t h e s er e s u l t s h a v eb e e ng e n e r a l i z e db yj a c q u a r dt oh a n d l ec o n s a n g u i n i t yi nt h ep e d i g r e e h o w e v e r ,t h e c a s eo ft w oi n d i v i d u a l sw i l lf a i li fn 梳 2 ) i n d i v i d u a l sm u s tb et a k e ni n t oa c c o u n t g i l l o i s ( 1 9 6 4 ) ,h a r r i s ( 1 9 6 4 ) ,j a c q u a r d ( 1 9 6 5 ) ,l a a g e ( 1 9 9 2 ) i n t r o d u c e dg e n e t i ci d e n t i t yc o e f f i c i e n t s t h e s e c o e f f i c i e n t s , n a ys e t t l ej o i n tg e n o t y p i cp r o b a b i l i t y d i s t r i b u t i o n sa b o u tn o n i n b r e dr e l a t i v e s t h e o r e t i c a l l y h o w e v e r ,w en e e ds o m ec o n v e n i e n tr e s u l t si nm a n yp r a c t i c a ls i t u a t i o n s 。i nc h a p t e r 3 ,w ed e r i v es o m ec o n v e n i e n tf o r m u l af o re v a l u a t i o nj o i n tg e n o t y p i cp r o b a b i l i t ya b o u ta r b i t r a r y nn o n - i n b r e dr e l a t i v e s :i nt h es e c t i o n2 ,w ed e r i v es o m e j o i n tg e n o t y p i ep r o b a b i l i t yd i s t r i b u t i o n s a b o u ta r b i t r a r ynn o n - i n b r e di n d i v i d u a l sw h oh a v eac o n l m o nf a r t h e r w ea l s ol i s to u ta l lj o i n t g e n o t y p i cp r o b a b i l i t ya b o u tt h r e ef u l ls i b s ,t w of u l ls i b sa n dt h e i ro n eh a l fs i b ,t h r e eh a l fs i b s i nt h es e c t i o n3 ,w eh a v es o m er e s u l t sa b o u tt h ep o p u l a t i o nm o d e lo fc h i n a i nt h es e c t i o n4 , w eh a v eam e t h o dt h a tc a nb ee v a l u a t i o nj o i n tg e n o t y p i cp r o b a b i l i t ya b o u ta r b i t r a r ynn o n i n b r e dr e l a t i v e si nt h es a i l eg e n e r a t i o n i nt h es e c t i o n5 ,w eu t i l i z et h e s er e s u l t st oa n a l y z et w o a 毋l i a t i o nc a s e s k e y w o r d s :a l l e l e ,i b d ,5m e a s u r e s ,8m e a s u r e s ,n o n i n b r e d ,g e n o t y p e ,j o i n tg e n o t y p i c p r o b a b i l i t y ,l r ( 1 i k e l i h o o dr a t i o ) i i 学位论文狻翅缝声麓 零a 声明所墨交的学位论文是我个人谯导师指导下进行的研究工作及驭褥 的研究成聚。尽我所知,除了文巾特涮加以标注和致谢的地方外。论文中不包含 葵稳夫已经发表残撰驾过翁辑究骏慕,连不憩含为获缛襄涛大掌蠖篡它教鬻极构 的学位或证书而使用过的材料。与我同工作的同志对本研究所做的任何贡献均 惑鑫论文孛 乍了臻确疑溪骥并表示了谗意。 整名:逮蠹曼:! ,| ;薯期:旦竺量 关于学位论文使厢授权的说嘴 寒南大攀、申鼓科学技术倍感掰究群、疆家辫书谵蠢投豫蜜本人掰邀交学位 论文的复印件和电子文档,可以袋嘲影| 、缩印域其他复制手段保秽论文。本人 电予文榻的内容和纸质论文的内容棺一致。除在保密潮内的保密沦文外,允许论 文被套鬻耪偌舞,霹潋公蠢( 包糕剥鼗) 谂文鹣全郄皴部分浓客。论文豹公稚( 包 括刊登) 授权东南大学研究生院办理。 签 名:蔓虹导筛熬名:未辩稚隧 麓:鱼釜。翌 第一章绪论 数学遗传学( m a t h e m a t i c a lg e n e t i c s ) 是数学与遗传学有机结合的- - i 边缘学科,既是 遗传学的一个分支,又是生物数学的一个重要分支。 早在1 8 6 5 年,遗传学的奠基人m e n d e l 通过豌豆实验发现了遗传定律后,遗传学专 家研究生物的遗传问题进入了数学的量化阶段。在上个世纪初,人类的遗传问题的数量 化研究取得了突破性进展,其标志就是h a r d y w e i n b e r g ( 1 9 0 8 ) 定律。从而使许多数学家开 始介入研究人类的遗传问题。他们使用了许多的数学工具,其中最主要的工具是概率论 和树理统计。例如,在上个世纪,许多数学家得到了许多模型下的个体的基因型的联合 概率分布。这些成果有很多的用途,其中一个很重要的用途就是上个世纪中叶发展起来 的案例分析和亲子鉴定。下面着重说一下与本文有关的结果。 自从w e i r ( 1 9 9 4 ) 在一个随机配对的子人群中找到了无关的,随机选择的两个个体( i n - d i v i d u a l ) 的基因型( g e n o t y p e ) 的联合概率分布。在一个给定的子人群中,这个理论已经用 来去获得基因型的联合概率分布。 然而,在很多情况下,必须考虑多于两个体的情况。因此必须去获得多个无关个体 的基因型的联合概率分布。在寻找多个无关个体的基因型的联合概率分布时,我们仍然 使用5 概率和n 概率等的概念来表示等位基因的同源遗传关系( i d e n t i c a lb yd e s c e n t ) 的 概率。例如,在常染色体的某一个基因座( 1 0 c u s ) 上,就对三个个体而言,这三个个体之 间的等位基因( a l l e l e ) 的关系完全被2 0 3 种具体的6 概率和l o 种n 概率来描述清楚。同 时,三个无关个体的基因型的联合概率分布也完全可以由它们表示出来。同样的关系也 完全适应多个无关个体的情况。本文第二章的目的就是使用这种方法去处理任意多个无 关个体的情形。 自从“和s a c k s ( 1 9 5 4 ) 提出他们的i t o 方法以来,这种理论以经被广泛的应用到去 求解同一家族中个体的基因型的联合概率分布或者条件分布以及一些显性的基因型的联 合概率分布或者条件分布。但是,这种方法仅仅适用于两个个体的情况。 k a r i g l ( 1 9 8 2 ) 提出他求解决多个个体的基因型的联合概率分布或者条件分布的方法。 在他的文章里,他得到了任意多个个体的一般情况下的基因型的联合概率分布的公式, 这个公式当然也适用于求同一家族中个体的基因型的分布。然而,他的结果只是一个理 论形式的表达式,无法利用数据直接得到需要的联合概率分布的结果,因此如果利用他 的公式,就必须求解出许多的d 概率。在很多情况下,我们没必要做这么巨大的工作, 而可以利用些个体的包含信息来解决同一家族中个体的基因型的分布。 本文第三章的目的是处理求解同一家族中任意多个个体的基因型的联合概率分布。 一个基本的问题是这些个体之间存在着许多的信息,由于同一家族中个体的关系能够事 先知道,因此可以得到这些个体的等位基因所包含的信息关系。如果我们要想得到一个 方便的公式,那么就必须利用这些信息。在必须面对多于两个个体的情况下,无法利用 l i 和s a c k s 的结果,如果利用k a r i g l 的结果,一方面必须做大量的工作,另一方面也不 一定能够做的出来。因此必须去找其他的方法。然而,多于两个个体的情况太复杂了, 我们并没有完全解决,只是解决了一些比较单纯的近亲关系,如规定这些个体都是非近 亲生育的( n o n i n b r e d ) ,也既他( 或她) 的父母是无关的。即使如此,我们也只是得到了关 于这些个体基因型的部分公式。 2 第二章在同一个子人群中多个无关个体的基因型的联合概率分 布 2 1预备知识 首先在一个子人群中随机选择n 个无关的二倍体( d i p l o i d ) 个体x l ,x 2 ,考虑 常染色体的某一个基因座上的等位基因a l ,a 2 ,a 女和与它们对应的概率p 1 ,p 2 ,- ,p 我们知道,每一个个体从他的父亲和母亲那里分别得到一个等位基因,等到他( 或她) 长 大以后,他( 或她) 再把他的着两个等位基因中的一个遗传给他( 或她) 的每一个孩子, 因此在这种情况下,在同一个子人群中的个体的一些等位基因就可能遗传自祖先的同一 个等位基因,这时候把这些等位基因的关系就叫做同源遗传关系。显然的,如果等位基 因不同,则这些等位基因不可能是同源遗传关系。我们用“;”表示同源遗传关系。例 如,如果等位基因a 和a 是同源遗传关系,则用“a 淳a ,”来表示 本节的目的就是归纳出任意n ( n 是任意一个自然数) 个个体的等位基因的同源遗传 关系和对应的d 概率的概念。这些概念对我们以后的讨论非常必要。 已经提到过,我们研究的摸型是:这个子人群中的个体之间是满足随机配对条件的, 寻找的联合概率分布是关于n 个无关的随机选择的个体的。我们用6 概率来表示等位基 因的同源遗传关系的概率,用d 的下标来说明等位基因的同源遗传关系,例如,概率如汕 的下标表示等位基因a ,a 是同源遗传关系,也即等位基因a ,a 来自同一个等位基因, 其他的等位基因彼此之间即不是同源遗传关系也不和a ,a 是同源遗传关系而概率6 a 池 表示在上述条件下的概率。在我们的假定条件下,也即这个子人群中的个体之间是随机 配对的,因此等位基因彼此之间可以认为是自由游动的,所以等位基因无论是在同一个 个体之间还是不同个体之间是没有区分的,因此可以得到: 6 池的值是一样的,无论 等位基因a ,a 是在同一个个体之间还是在不同个体之间这时候就称d 概率是平均概 率。例如,当考虑两个个体的时候,如果x 1 ,恐是从一个子人群中随机选取的,在这种 条件下,w e i r 使用十五个6 概率,它们满足下面的关系: 6 0 ; 6 0 6 = d n c = 6 a d = 6 6 c = 6 b d = 6 c d ; d n 6 c = d “= 如c d ; 如6c d = 如c = d d d k ; 6 n 6 c d 3 注:w e i r 当时用小写的英文字母表示等位基因。 如果考虑等位基因的同源遗传关系,那么个体的基因型的概率算法与没有考虑同源 遗传关系时的算法不同。例如计算“x ,= a 。a 。”的概率: ( 1 ) 若考虑等位基因的同源遗传关系,则:p r ( x l = a 。a 。) = 5 a 。a 。p i + ( 1 6 a 。a ,) p ; ( 2 ) 若不考虑等位基因的同源遗传关系,则:p r ( x l = a :a 。) = 井 如果考虑任意n 个体,由于等位基因太多,因此不方便用下标把等位基因彼此之间 的同源遗传关系表示出来。然而,由于无论等位基因是在同一个个体之间还是不同个体 之间,在我们的模型中6 概率的值是一样的,因此可以用自然数的下标代替等位基因的 下标,用i 2 c , 。表示这2 n 个等位基因有k 种同源遗传关系并且第j 种同源遗传关系有 i j 个等位基因。为了研究的方便,规定i 1 i 2 茎i t 例如,用6 2 表示如6 ,用d 2 :表 示5 a b 。d 等等 为了使任意n 个体的一般公式更加方便,我们定义6 的一种运算: ( 1 ) d o 是单位元 ( 2 ) 也q 屯j 2 ,m = 露 2 ,“+ 。 如果不考虑元素的顺序,那么: r 1 ,7 2 ,r k + 一= - 1 ,i 2 ,i k ,j l ,j 2 ,太 _ 例如: d o 如= 6 2 ;如如,3 = j 2 ,2 ,3 为了从另外一个角度来研究这个模型,我们定义了另外一种0 测度概率。首先给出 在一个随机配对的子人群中无关的,随机选择的三个个体的十种0 概率的定义: o c 2 :0 2 是从一个子人群中随机选出两个等位基因a 和b 是同源遗传关系的概率,也 既:o t 2 = p r ( a ;b ) 。 0 3 :0 3 是从一个子人群中随机选出三个等位基因a ,b 和c 是同源遗传关系的概率, 也既:0 3 = p r ( a b ic ) 0 4 :n 4 是从一个子人群中随机选出四个等位基因a ,b ,c 和d 是同源遗传关系的概率, 也既:0 4 = p r ( a ;b ! c id ) 0 5 :0 5 是从一个子人群中随机选出五个等位基因n ,b ,c ,d 和e 是同源遗传关系的概 率,也既:d 5 = p r ( a ;b ;c ! d ;e ) 0 6 :0 6 是从一个子人群中随机选出六个等位基因a ,b ,c ,d ,e 和,是同源遗传关系的 概率,也既:a 6 = p r ( a ;b c id ;e ;,) 0 2 ,2 :0 2 ,2 是从一个子人群中随机选出两组等位基因n ,b 和c ,d 分别是同源遗传关系 的概率,也既:22 = p r ( a ;b 且c id ) 4 o 。魄。是从一个子人群中随机选出两组等位基因o ,6 和c ,d ,e 分别是同源遗传关 系的概率,也既:o 粥= p r ( a ib 且c i d i e ) 。2 屹4 是从一个子人群中随机选出两组等位基因a ,b 和c ,d ,e ,f 分别是同源遗传 关系的概率,也既;o l 2 ,4 = p r ( a ;d 且c id = - - e i ,) a 。,s :n 。,。是从一个子人群中随机选出两组等位基因。,b ,c 和d ,e ,f 分别是同源遗传 关系的概率,也既:a 3 ,3 = p r ( a ;b ;c 且d ie i ,) o z 2 ,2 ,2 :。2 ,2 ,2 是从一个子人群中随机选出三组等位基因o ,抚c ,d ;e ,分别是同源遗传 关系的概率,也既:n 2 2 2 = p r ( a ;b 且c ;d 且e i ,) 从定义来看,a 概率只是考虑随机选出的等位基因是不是同源遗传关系,至于其它 的是不是同源遗传关系则不管。同样的理由,对于在同一基因座上的等位基因,n 概率 也是平均概率。 最后,我们回顾一下一种矩阵的乘法运算: a l n o n n b l lb 1 2 -_ 6 n 1b n 2 6 l n b n n a l l b l la 1 2 b 1 2 口n l b l n口n 2 b n 2 a l n o l n n bn 必须指出的是,当矩阵的元素也是矩阵的时候,这些元素的对应乘积为这两个元素 的通常乘积。例如: 2 2n 个个体的联合概率分布 本节考虑这样的问题:从一个子人群中随机选出n 个无关的个体x ,x 。,假 定这个子人群中的个体满足随机配对的条件。这意味着同一种6 概率的值是一样的,也 既6 概率的值不依赖等位基因的位置。根据这个假设条件,可以得到下面的一些结果: 定理1 :如果任意n 个个体在常染色体的某一个基因座上的2 n 个等位基因的d 概率 的个数为k ,那么k 可以表示为: = - + 耋:氧弛点幔。碌两器爵瓣( 驻1 i “讲一一“一。) 其中i o = 0 ,r p + l = 。,s 0 毗 | 蛳 证明:n 个个体在常染色体的某一个基因座上的2 n 个等位基因的j 最多的情形应 该是当所有的等位基因都是同一个的时候。比如我们设所有的等位基因都是a 因为当所有的等位基因都是同一个 :的时候,那么这2 n 个等位基因中的任意多个 都可能是同源遗传关系。因此n 个个体在常染色体的某一个基因座上的2 竹个等位基因 的6 最多的个数应该是这2 n 个等位基因的所有可能的同源遗传关系的个数因此可以得 到下面的结果: 耳= 曝+ c l + c # o + 嚷+ - - 4 - 啄+ ;赣一:+ q 2 。l 3 - 24 - c , 一4 。+ + c 一2 n - ;, + j l c 3c 一3 。+ - 十;簖厶 4 4 - 4 - 五i f , 2 f + 2 叫- - q 2 。2 = - + 耋:“锄点钲。:碌丽拦寡丽( u & ”- 一”一一+ - ) 其中i o = 0 ,7 叶1 = o o ,s 0 定理2 :若n 个个体在常染色体的某一个基因座上的2 n 等位基因的n 概率的个数为 工,那么三可以表示为: l = ( 2 n 1 ) + 1 p 。2 2 i l l + 4 1 2 2 + - + i p 9 s 2 2 “m 一2 证明:我们只需要用1 代替定理1 中的i r 匹j 两者鲁! :;:刀( 早击i “c “t 一乩”c ”一- ) , 因为一般不考虑n o ,因此还必须减去1 也既下面的结果 2 r =n l = 1 + i + 1 1 = 2 p = 2 2 蔓。i 1 i + i 2 2 + - - - s + 如p _ 2 2 m “一2 例如,当n = 3 的时候,可以算出 k = a 0 十u 6 2 + c 言+ 碟+ c 言+ 罐+ 互i 。f , 6 2 。f , 4 2 + 2 u 4 3 + 2 u 4 4 + q 3 u 3 3 + 丽1 。t v 6 2 。, 4 2 l ,( 1 2 2 = 2 0 3 l = 1 0 定理3 :若从一个子人群中随机选出n 个无关的个体x l ,托,一,x 。这个子人群中 的个体满足随机配对的条件用h 表示这n 个无关的个体的异合体的个数,这2 n 个等 6 一 “h 一 2 ,a ,a 刍,a 必定存在同源遗传关系不失 一般性,我们可以假定a 暑,a 刍,a 参来自a i ,a 铲1 ,a 铲2 ,雒来自山因此同源遗 传关系只能是( a 茹;a 刍;a 譬,a 铲1 = a 矿2 ;且) 因为他们的共同的父亲的 等位基因a t ( t = i ,j ) 遗传到a 皇0 = 1 ,2 ,n ) 的概率是;,所以: ( 1 ) 若k 1 ,n 一女 l ,则:如 k = 2 击= 杀t ( 2 ) 若k 1 ,n k = 1 ,贝0 :“= 2 嘉= 蠢b ( 3 ) 若k = 1 ,n k 1 ,则:矗一k = 2 击= 南 因此: p r ( a ) ,a 刍,- ,a ) = 鬲苦p 毋 引理2 :若刍,a 刍,a 马 _ a ) ,那么a = 【a ,a 刍,a 马 有且只有2 ”1 种同源 遗传关系,并且这些同源遗传关系的j 概率是某。而且 p r ( a 1 ,a 刍,一,a ) = 鬲圭t 【( 2 “一1 1 ) p ;+ 肌】 证明:由于a ,a 刍,a 都来自他们的共同的父亲,因此对n 2 ,a ,a 刍,a 暑 必定存在同源遗传关系。这些等位基因的同源遗传关系的种类数为: ( 1 ) 若n = 2 k ,那么有四+ 叼一1 + + 四+ 诺:2 “种 ( 2 ) 若n :2 k + l ,那么有四+ 四一i + + 谨+ 西宁:2 n 一1 种 由于这些同源遗传关系的6 概率是相等的,因此这些同源遗传关系的6 慨率是i 击 所以: ( 1 ) 若n = 2 k ,那么可以得到: p r ( 4 ) ,4 刍,a ) = 石熹了 ( 暖+ g :+ + ;靠) p ;+ q n p 。 ( 2 ) 若n = 2 k + 1 ,那么可以得到: p r ( a ) ,a 刍,a ;) = i 三了 ( 暖+ 四十+ g 0 笋) p ? + 四p i 所以: p r ( a ;,a 刍,一,a ) = 百未了【( 2 ”一1 1 ) p ;+ p ; 引理2 证毕。 引理3 :若x 1 ,x 2 ,凰,x 。有共同的父亲,那么 p r ( a ,a 刍,一,a ) = 吾熹了 p t 巧 a , 刍,a ;1 _ f ,山) + 【( 2 n - l _ 1 ) p ;+ 肌l i e ,a 刍,a ;】叶 ,) ) 证明:由引理1 和引理2 立即可得。引理3 证毕 如果x l ,捣,弱,墨。是非近亲生育的,他们的共同的父亲是f ,他们的母亲是 m ,m 2 ,地,一,和那么可以用下面的方法来求这n 个个体的基因型的联合概率: 因为a 来自f ,所以:a = 【a ) ,a 刍,a _ a ,山) 或者 a ) 当7 2 3 ,a 中 必定存在同源遗传关系,通过引理我们可以得到每一种同源遗传关系的概率为某。 现在把m 分成两个不同的类和,不妨假设尬恰好满足下面的顺序: = m 1 ,帆;尬只有一个小孩墨,i = l ,2 ,u ) ; k = 帆+ 1 ,眠+ 2 ,舰;尬至少有两个小孩,i = u + 1 ,u + 2 , 把b = f a i , ,a ,a j f 分成几个不同的下面的类: b 1 = i a k ,a 弘,一,a 孙l ; b 。+ l = f x j 的来自母亲。+ 1 的等位基因i ; b 。+ 2 = i x j 的来自母亲尬。+ 2 的等位基因i ; 玩 = 【 x j 的来自母亲的等位基因 因此可以得到: 定理2 :如果x 1 ,x 2 ,x 3 ,是非近亲生育的有共同父亲的个体,他们的共同的父 亲是f ,他们的母亲是尬,尬,慨一,那么当n 2 的时候,可以得到: 2 4 p r ( x 1 ,x 2 ,x 。) =击p ;p j l a _ ) + a 1 ,n p l ,a 2 m , p 2 ,a 玉a 刍,a 孙a ;。 ( 2 “一1 1 ) p ;+ p i i a + ( a ) p r ( a 珏) p r ( b i :) i l = 11 2 = “+ l 其中若u + 1si 2s ”,b ;。中有m 个等位基因,则p r ( b i 。) 可以通过引理3 得到。 证明:由于为我们假定x ,尥,凰,是非近亲生育的,并且他们的父母是无关 的,所以可以得出a 和b 是统计独立的通过引理3 ,可以得出: p r ( a b ) = p r ( a ) p r ( b ) = p r ( a ) p r ( b 1 ) i i p r ( b i :) 1 2 = u + 1 = 而与 p i p j l a _ + ,山 + ( 2 “一1 1 ) p ;+ p 1 厶- a i 】) i ip r ( a 珏) i i p r ( b 砬) 1 1 = l0 2 = u + l 因此: p r ( x 1 ,蜀,矗) = 赤妇j j 州a i , a ) 】 a 村l ,几p 1 ,a a ;,a k a ;,a 备a + 【( 2 “一1 一1 ) p ;+ p * i a + ( a ,) i ip r ( a ) i i p r ( b i 。) i l = 1i 2 = u + 1 容易的,通过引理3 ,可以得到p r ( b i 。) ( u + 1 i 2 ”) 的概率 定理3 :若x 1 ,恐,凰,j k 都是非近亲生育的个体,并且他们的父母是相互独立 的。那么可以得到: 8t p r ( x 1 ,x 2 ,矗) = 1 i p r ( u d p r ( w j ) m 1 , p 1 ,a b 刍,a 备a i = l ,= 1 其中巩= 【a 参+ 1 ,且# ,a 譬+ 1 :它们来自父亲f i ,t = 1 ,2 ,一 w j = 阻铲1 ,a 铲2 ,a :;十1 :它们来自母亲u j ,j = 1 ,2 ,t 并且p r ( u i ) 和e r ( w j ) 的概率可以通过引理3 得到。 证明:因为x l ,x 2 ,凰,誓:是非近亲生育的,并且他们的父母是相互独立的,所 以我们可以得出a 和b 是统计独立的,以和也是统计独立的 因此: p r ( x l ,托,x 。) = 1 - p r ( u i ) i ip r ( w j ) 并且p r ( u i ) 和p r ( w 0 ) 的概率可p a 过弓i n3 得到 推论2 :若x ,拖,是非近亲生育的亲兄弟,那么 p r ( x ,x z ,) _ 嘉 p i p j i 州) + 憎一1 ) p h 厶州:) ) a m i n p l ,a 玉 刍,a a 刍,n a 售“ 两1 p 。肌“。+ 秽一1 ) 磕+ p m i a + ) ) 推论3 :若x l ,x 2 ,矗是非近亲生育的同父异母兄弟,那么: p r ( x l ,x 2 ,一,) = 击 p p j l 叫一,) a k 鼻,a 村2 ,儿p 2 ,a d 刍, 孙 + ( ( 2 ”一1 一1 ) 癣+ p i i a + a ) i ip r ( w j ) j = 1 其中w j = 阻m k j + l ,a m k j ”,一,a :;+ 1 :它们来自母亲u j ,j :1 ,2 ,t 并且p r ( ) 的概率可以通过引理3 得到。 推论4 :若x i ,x 2 ,是非近亲生育的同父异母兄弟,而且每一个个体的母亲都 不相同,那么: p r ( x l ,施,) = 嘉 p t p j i a + a i , a j ) 3 2 3三个亲兄弟 + ( 2 “一1 一1 ) p ;+ 鼽 i a + 。) ) - i ip r ( a ) k = 1 我们用图3 1 来表示他们的关系。在图中我们用圆表示女性个体,用正方形表示男性 个体 图31x l ,x 2 和弱的家谱关系 2 6 推论5 :若x l ,x 2 和x 3 是非近亲生育的亲兄弟,那么他们的基因型的联合概率分 布为: p 。( x 1 ,x 2 ,x 3 ) =: n 功i a ,a ;,a 劲_ a ,山) + ( 3 p ;斗m ) 1 a a ;, 】一 ;) j a ,1 。a p l ,a * 4 ;,a a ; ; p 。p d 如b ,a , 卜+ ( 。,a 。) + ( 3 p i + p c ) 1 a k ,a ,a * 】。( a 。) ) 通过推论5 ,我们可以得到他们的所有的基因型的联合概率分布。在这里我们把具 体表达式代入a k ,a # 中来算一个基因型的联合概率分布,其余的结果放在附录1 里 p r ( a ,a 。,a ,a 。,a 。a j ) :p r ( a 。a , ,a i a i ,a j a i ) + p r ( a j a i ,a t a t :a j a j ) = ; 3 p ,2 + n 1 1 , ,a ,卜,( n ,) ) ; p 。p ,【a i , a i , a j 卜+ ”。, 】 + ;如,“山h “ j 】) ; 【3 p ;怕 i i a i , a i , a i h 蚰) = 而6 n 3 巧+ 而2 矾2 功 3 2 4两个亲兄弟和他们的一个同父异母兄弟 我们用图3 2 来表示他们的关系 图3 2 :x 。,恐和x 3 的家谱关系 推论6 :若x 。,x :是非近亲生育的亲兄弟,他们和x a 是非近亲生育的同父异母的兄 弟,那么他们的基因型的联合概率分布为: p 。( x 。,x 。,弱) : ;协p f l 【a ,a , ;h 屯”+ ( 珊+ p t ) i a - 靠 h 鲫) * a ,a m a p ,a * a ;1 ;p 州,喇卅卅矿( p 。2 协) 小纠叫。) ) p r ( 确) 通过推论6 ,我们司以得到他们的所有的基因型的联合概率分布。我们把具体表达 式代入a k ,a ;) 中来算一个基因型的联合概率分布,其余的结果放在附录2 里。 p r ( a i a i ,a , a i ,a t a j ) = p r ( a i a i ,a i a i ,a j a j ) + p r ( a i a i ,a a i ,a i a j ) = : 3 p ;+ 仇 i a i , a i ;a i 卜* ( 。) ) j 1 1 。2 + 鼽 ,【a 。,a ,】_ + ,) ) 功+ ; p ;功“钏_ + a ) ) 孔1 恍2 + p 。 驰川。似) ) p : = 耠4 p + 轴+ i l p 3 2 5 三个同父异母兄弟 我们用图33 来表示他们的关系 图33 :x - ,x 2 和x 3 的家谱关系 推论7 :若x 1 ,x 2 和凰是非近亲生育的i 司父异母的兄弟,自口么他们的基因型的联 合概率分布为: p r ( x l ,x 2 ,x 3 ) = 三。i p t p j l ,a ;,a 刍 _ a i , a i ) + 【3 p 2 + n ) l i t a ,a ;, 劲_ a 。) ) a 村1 , p 1 ,a k a 刍, 嚣 刍。 i ip r ( a ) 通过推论7 ,我们可以得到他们的所有的基因型的联合概率分布。我们把具体表达 式代入a k ,a 中来算一个基因型的联合概率分布,其余的结果放在附录3 里。 p r ( a i a i ,a i a i ,a i a j ) = p r ( a i a i ,a i a i ,a j a i ) + p r ( a i a i ,a i a i ,a i a j ) = ; ( 3 联2 + 仇 i ( a i , a i , a i 。 a i p i p 砒 + j if l 一。i a ,a :, j 】_ ( 。,a 。) ) p 。p 。p 。 = 馥p j + ;最p i 2 8 3 3中国人口的基因型的联合分布 中国自上个世纪七十年代实行计划生育以来,中国人口的结构发生了巨大的变化。 目前,特别是在中国的城市里,一对夫妻只生一个小孩,基本上结束了多子家庭。在将 来,中国将继续实行计划生育政策,因此,中国人口的这种结构将继续保持。基于中国 人口的结构的巨大的变化和将来的继续保持,因此有必要研究现在的中国人口的基因型 的联合分布。本节的目的是以中国传统的以血缘关系为纽带的家族的个体来做为研究对 象的。同时,中国的婚姻法明确规定不准近亲结婚,因此可以假定这些个体都是非近亲 生育的 3 3 1 理想模型 首先我们先看一个理想模型。若x - ,托,弱,是非近亲生育的同一个家族的个 体。在这个理想模型里,假定每一个母亲只有一个小孩,假定这个父系家族的这n 个个 体为第代个体,这个父系家族的最初的那个男性祖先为第0 代个体。这个父系家族的 个体的关系用图3 4 来表示。 图34 x ,j 屯,- - x 。的家谱关系 可以得到下面的结果: 定理4 :设x 。,x 2 ,x 3 ,是非近亲生育的同一个家族的个体,这些个体的关系 如图3 4 所示。那么可以得到: ( 1 ) 若k = 1 ,则p r ( a a 刍a ) 可以通过引理3 来得到。 ( 2 ) 若k 1 ,则: 1 n 11 nnn p r ( a p ln r 2 。邱) = ( 1 - 嘉) ”h p a ;+ n ( 卜嘉) ”1 ( ;) 1i i p 雒+ p a ; t = i l = 1l = ll = z 蚴。藏坳丽1 卜六r 4 瓦1 再i 一。 a 鲁, 磐, 台】+ 暑,a ;】+ ( 2 2 一l 一1 ) p j 分+ p a 台 a 鲁,a 分,a 台卜。 a 台) ) 证明:通过假设可以知道,等位基因a k 与其它的等位基因是独立的。因此可以通 过全概率公式得到定理( + ) 式的结果。下面我们来证明结果( 2 ) 。 通过条件可以知道,只有当a ,4 刍,a 这些等位基因中至少有两个来自最初的 那个男性祖先的时候,4 鼻,a 刍,a 才有可能出现同源遗传关系,因此,对等位基因 a ) ,a 刍,4 分成下面的类: h = a 1 ,雒,a 这些等位基因中没有一个来自最初的那个男性祖先) ; 硷= a 1 ,a 刍,a 这些等位基因中只有一个来自最初的那个男性祖先) ; b = a 1 ,a 刍,a 这些等位
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业面源污染治理2025年技术路径与政策实施效果评估报告
- 安全规范试题及答案
- 瑜伽课件培训方案范文
- 工业互联网平台射频识别(RFID)技术在智能工厂生产设备性能提升策略报告
- 法院执行普法培训课件
- 中国南水北调工程
- 《X射线诊断设备(第二类)注册技术审查》
- 中国剪纸英语教学课件
- 广西北海市银海区2025届八年级英语第二学期期中达标检测试题含答案
- 感恩教育班会
- 10kV供配电系统电气设备改造 投标方案
- 妇女儿童之家管理制度
- JG 121-2000施工升降机齿轮锥鼓形渐进式防坠安全器
- 2025山西大地环境投资控股有限公司校园招聘13人笔试参考题库附带答案详解
- 江苏省扬州市江都区城区2025届八年级物理第二学期期末联考试题含解析
- 《防爆安全管理》课件
- 【课件】2024年全国I、II卷新高考读后续写+课件-2025届高三英语一轮复习
- 医保村医政策培训
- 邮政社招笔试考试历年真题及答案
- 《结缔组织病本》课件
- 2025届四川省绵阳高三下学期英语模拟检测试卷(一模)含答案
评论
0/150
提交评论