第四章连锁交换值的计算ppt课件_第1页
第四章连锁交换值的计算ppt课件_第2页
第四章连锁交换值的计算ppt课件_第3页
第四章连锁交换值的计算ppt课件_第4页
第四章连锁交换值的计算ppt课件_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,第四章连锁交换值的计算,第一节连锁现象的统计测定,.,亲本及其配子遗传构成,相引相AB/ab配子:亲本型:AB,ab交换型:Ab,aB相斥相Ab/aB配子:亲本型:Ab,aB交换型:AB,ab各基因型个体数双显性:a=AB;单显性:b=Ab;c=aB;隐性:d=ab,.,如何判断连锁关系,步骤:先分析每个基因是否符合正常分离然后多对基因再联合分析,.,测Aa与11之间的偏差;,测Bb与11之间的偏差,测新组合;老组合与11之间的偏差,即测两对基因的独立性。,一、对测交后代进行x2测验,a=AB;b=Ab;c=aB;d=ab理论上测交后代,A:a=1:1即a+b=c+d;B:b=1:1即a+c=b+d如不连锁重组类型与亲本类型1:1即:ad=b+c,.,例:对AaBb进行测交,产生612个后代,其中AB=220,Ab=84,aB=102,ab=206,A、B基因之间是否存在连锁?把各项数字代入公式:,根据自由度(d.f.),可以查出获得上述2值的概率:,.,二、对F2进行2测验,.,表4-1测验两类性状分离的不同理论比率2值公式,.,例一、让AaBb自交得到AB=142,Ab=49,aB=43,ab=15,n=249,试问AB之间是否连锁?,把各项数值代入公式,则:d.f.=1P=0.700.50d.f.=1P=0.900.80d.f.=1P=0.98总2=0.3869+0.0656+0.0004=0.4529d.f.=3P=0.990.95可见Aa和Bb各自的分离都符合31分离比率,Aa与Bb重组类别也符合9331之比,说明这两对基因间不存在连锁关系。,.,例二,让AaRr自交,后代出现AR=152,Ar=99,aR=43,ar=9,求AR之间是否存在连锁关系?,依9331假设,算得各个2值和总2值如下:A2=9.99d.f.=1P0.01R2=18.31d.f.=1P0.01L2=13.66d.f.=1P0.01总2=41.96d.f.=3P0.01从总2来看,这个结果不符合9331的分离比率,但从各2的分解值来看,出现这种偏差主要在于基因对的遗传行为不正常,因而扰乱了整个分离群体的比例。,.,例三、PpSs自交,后代表现型为PS=235,Ps=91,pS=109,ps=9,求PS间是否存在连锁关系。,算得各2值及P值为:P2=0.590d.f.=1P=0.500.30S2=1.453d.f.=1P=0.300.20L2=20.184d.f.=1P0.75,说明符合独立遗传,Aa和Bb并不连锁。,.,五、卡方测验的正确应用,1、卡方值与样本容量实际观察值与期望值保持不变时,样本容量大,则卡方变小。所以,百分数不能用于卡方测验2、连续矫正,.,表4-2卡平方值,偏差和样本容量,此表说明,百分数不能用于卡方测验,.,这里所讲的一些原理也可以用来指导样本容量的设计:例如,某大麦遗传学家在200株大麦幼苗中发现有94株是浅绿苗。而从理论上推算,幼苗应按一半绿苗一半浅绿苗分离。实际观察值与理论值的偏差为6(或相当于期望值的6%),这一偏差的2值仅为0.72,说明上述分离完全适合11的比例。然而,该遗传学家怀疑淡绿基因可能与低生活力有关,故决定作另一种实验。他提的问题是:如果要在更大的样本中仍然保持6%的偏差,需要检查多少株才能使2值增加达10倍?答案可以从表中找到,即实际观察值与期望值之间的偏差如果保持在6%的水平上,将样本容量扩大到原来的10倍,就会使卡平方值达到要求的7.2。在这样大的样本中若能否定11的分离比例,则就足以证明浅绿苗的活力较差。在另一方面,如果大样本的卡平方值证明对11的分离偏差并不大,则可消除对淡绿苗活力较差的怀疑。,.,第二节连锁强度(交换值)的计算,一、测交法,相引相:,P值的标准差S.E.p=,相斥相:,.,利用测交法计算交换值的优点是:1需要的群体较小;2能分别求出不同性别的交换值;3用相引和相斥相的平均资料可以平衡成活率差异造成的影响;4在三点或多点测验中求出的基因序列比较可靠。小麦、水稻等自花受粉作物由于人工授粉比较麻烦,测交法难于应用。有时,双隐性个体或不能成活,或生活力很弱,在开花授粉前死亡。在这种情况下,就不得不利用F2资料求算连锁强度。,.,当雌雄配子交换值相等且无选择受精时,在相引相,各类配子自由结合的结果,F24类合子理论次数(频次)为:,b(Ab)=aB(c)=,a(AB)=3(1-P)2/4+4P(1-P)/4+2P2/4,=,=,d(ab)=,二、理论配子和合子频率的计算,.,相斥相的理论合子次数为:,.,表4-2不同连锁方式F1的理论配子次数和F2的理论合子次数,.,三、利用F2资料计算交换值,(一)根据F2双隐性个体出现的频率双隐性个体的出现是由于ab与ab配子相结合的结果,在相斥相出现次数为,即aabb=,故。在相引相,双隐性个体出现次数,由于此法计算交换值只根据F24种类型中出现概率最少的一种类型,因而常常有较大的取样误差。,.,(二)利用F24种类型的全部资料1相加法。把a+d与b+c进行比较而计算交换值P值。例如,在相引相:,.,在相斥相:,.,现举一实例进行演算:玉米中有一个株,自交结果如下(d为矮生株,pr为红色糊粉层):,a+b=0.504b+c=0.497交换值,即8.4交换单位。,.,极大似然率(maximumlikelihood)是连锁估计中最常用的方法。这一方法对重组率估计需要从资料(数据)中获得尽可能多的信息。最大化(maximization)则通过求算p的导数令其为零来进行,即求算的为p值的最大可能值,试误差达到最小。为方便起见,往往把似然的表达转化为对数形式,使函数为最大时,对数值也达最大。如果令m1,m2,m3mt分别表示分离类型1,2t的期望比值,并令a1,a2,at为各相应类型的实际个体数。期望比值m可以用p表示。例如在测交时,由相引组连锁的双杂合子产生的4种后代类型的比值可表示为:m1=m4=1/2(1-P),m2=m3=1/2P。获得实测家系的似然值可由(m1+m2+mt)n展开式中的一项求出。其中n为家系的总个体数,相应各项为:,似然率的对数形式为:L=C+a1logm1+a2logm2+atlogmt,2、极大似然法,.,通过求导数并令其为零即可得到估计方程:为了解出P,可直接将a1,a2at的实际观察值和各类型的期望值m1,m2mt代入该式。一般说来,连锁强度的估计可利用测交或F2代资料来进行。1利用测交资料计算重组率若把相引组连锁的双杂合子AB/ab与双隐性个体ab/ab杂交,那么,把这些m表达式代入估计方程得:,.,这样估计的p值就是该测交中的重组率。与此相似,在相斥组连锁情况下,双杂合子中两基因的重组率p可用下式估计:,.,2、对相引组F2代资料而言,仍以a,b,c,d代表4类个体数则有:,.,如令K=(1-P)2,则:L=alog(1/2+1/4K)+blog(1/4-1/4K)+clog(1/4-1/4K)+dlog(1/4K)求导:通分得:a(1-K)Kb(2+K)Kc(2+K)K+d(2+K)(1-K)0即nK2-(a-2b-2c-d)K-2d=0,n为F2个体数令Z=a2b2cd,则根据一元二次方程求根公式得:交换值:交换值:相斥相连锁得情况下K=P2,.,导数实际上是在X0点切线的斜率,.,=作代换即得这就是对数函数的导数公式,特殊地,当时,由上式得自然对数函数的导数公式:,.,如前面例子:相斥相数字计算P值:n=860,Z=4232212221510=441,.,测交例:在番茄上,基因Br代表正常节间,它们相对于短节间基因br为显性。基因S为可育基因,对半不育基因s表现为显性。用双隐性个体(brs/brs)对双杂合体(Brs/brS)作测交。测交后代的频数为:BrS-131-n/2PBrs-360-n/2(1-P)brS-390-n/2(1-P)brs-119-n/2P总数-1000-n,这样,其对数形式的似然函数表达为:L=131log(p)+360log(1-p)+390log(1-p)+119log(p)p=250/1000=0.2500或25%p值的精确度常用其标准误Sp来衡量。测交中,估计Sp的一般公式为在上例中于是该测交所测得的重组率及其误差可表达为:p=0.25000.01369,.,四、以F2数据及测交数据估计重组率的相对效率比较,当一定数量的植株(n)被测定以后,就可以通过比较两种交配组合的方差来估计用测交和F2资料估计重组率p的相对效率。比如,在某一测交中算得的重组率p=0.20,测定植株数为400,方差应为0.0004。在一个与之相似组合中,以F2资料算得在相斥组连锁情况下,重组率p=0.20,n=400,方差约为0.0023(在相斥组连锁情况下:,.,以一定数量的植株数所提供的信息量来衡量的两种组合的相对效率,是与它们方差值的比数成反比的。在上例中,p值为0.2,n=400,F2资料相对于测交资料的效率为:0.0004/0.0023,或等于1/6。也就是要获得同样的方差值,采用F2资料所需的观测植株数应为采用测交后代的6倍之多。或者说,为了测出20%的重组率,测交中所需的样本量可以减为F2资料的1/6就可以保持相同的精度,用方差比值来度量相对效率对于不同p值可能有所不同,但总的来说测交要比F2更有效(除非p的值很小而且F1处于相引组的连锁)因此在条件可能时应尽量采用测交法。,.,补充、似然函数估计,在连锁分析中,亲本基因型或基因的连锁相有时并不清楚,因而无法简单地通过计算重组体出现的频率来进行连锁分析。那么如何判断其连锁关系?在此情况下可以采用似然比方法来检验连锁是否存在,即比较假设两个座位间可能存在连锁(r0.5)的概率与可能不连锁(r=0.5)的概率。其概率之比可以用似然比统计量来表示,即L(r)/L(0.5),其中L()为似然函数。为了计算方便,常将L(r)/L(0.5)取以10为底的对数,称为LOD值。为了确定两对基因之间存在连锁,一般要求LOD3,即似然比大于10001,即连锁的可能性要超过不连锁的可能性1000倍,与此值相对应的2测验的显著水平为0.0002;而要否定连锁的存在,则要求似然比小于1001,即LOD2。如假定G与J之间存在如下可能关系:,.,0.9log9/5=+0.230.5log9/5=+0.130.1log1/5=0.070.5log1/5=0.35LOD值:+0.160.22上述结果的意义是,如要证明两基因连锁,则LOD值达到3时的个体数为:3/0.16=18.75即19株;反之,如要否定二者不连锁则需要的个体数为:3/0.2213.63即14株。,.,2利用F2资料估计重组率在F2家系中,以p表示的不同类型配子的期望值与测交情况是相同的,但因为雄配子与雌配子的重组率可能相同,也可能不相同,所以以p1和p2分别表示雄配子和雌配子中的重组率则可能更为合理。为此,相引组连锁时的配子期望值应分别为:,相斥组连锁时各种配子类型的期望值与相引组的写法相似。根据期望的配子比例就可能预期4种表型上不同的合子的比例。因为双隐性合子只能由双隐性的雄配子和双隐性的雌配子结合产生。该类型的比例应为自交时,由于a类个体的总发生率为1/4,所以单隐性类型aB的出现率将为1/41-(1-p1)(1p2)。同样,由于b类个体的总发生率为1/4,故Ab类型个体的出现率为1/41-(1-p1)(1p2)。双显性类型的出现率必然为1/42+(1-p1)(1p2)。,.,例1:相引相在大麦上,已知二棱(V)对六棱(v)为显性,绿苗(Lg)对浅绿苗(lg)为显性。在基因型VVVLgLg与vvlglg的杂种F2中,4种表型的数量及期望数分别为:,其中p=(1-p1)(1-p2)。以对数表达的似然率函数为:L=281log(1/2+1/4p)+59log(1/4-1/4p)+60log(1/4-1/4p)+58log(1/4p)因此458p2+15p-116=0p=0.4871如果能证明p1=p2,那么p=p2=p1=1-=0.3021或30.21%在相引组连锁中p的标准误由下式计算:其中q=1-p。在上例中,Sp=0.0265或2.65%,所以其重组率及标准误可表达为:p=(30.212.65)%,.,例2:相斥相如果F2资料来自相斥组的F1自交,其重组率也可用相似的方法估计。例如,番茄的基因O(圆果)对基因o(长果)为显性。基因S(单花序)对s(复合花序)为显性。由Os/oSF1值株自交产生的F2植株中4种类型的实际株数为:,其中:p=p1p2,.,取对数表达的似然率函数式为:L=126log(1/2+1/4p)+66log(1/4-1/4p)+63log(1/4-1/4p)+4log(1/4p)故259p2+136p-8=0从中解得p=0.05339如果假设p1=p2,则或23.11%。相斥组连锁计算p的标准误的公式为:,在上例中,Sp=0.0582或5.82%,于是重组率及其标准误可表示为:p

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论