(作物遗传育种专业论文)基于NCⅢ和TTC设计的胚乳性状QTL作图方法.pdf_第1页
(作物遗传育种专业论文)基于NCⅢ和TTC设计的胚乳性状QTL作图方法.pdf_第2页
(作物遗传育种专业论文)基于NCⅢ和TTC设计的胚乳性状QTL作图方法.pdf_第3页
(作物遗传育种专业论文)基于NCⅢ和TTC设计的胚乳性状QTL作图方法.pdf_第4页
(作物遗传育种专业论文)基于NCⅢ和TTC设计的胚乳性状QTL作图方法.pdf_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

王学枫:基于n c i i i 和订c 设计的胚乳性状q t l 作圈方法 - 1 王学枫,基于n c m 和1 1 设计的胚乳性袄q t l 作圈方法 基于n c i i i 和t t c 设计的胚乳性状q t l 作图方法 研究生:王学枫 导师:徐辰武教授 中文摘要 谷类作物的胚乳是由母本的两个极核和父本的一个精核受精发育而成的三倍 体组织由胚乳中的化学组分的物理性质或化学性质决定的一类性状称为胚乳性 状由于胚乳性状与谷物的籽粒品质息息相关,因此,胚乳性状的遗传研究是谷 物品质改良的重要基础。目前,虽然已经报道了一些适合于三倍体胚乳性状的q t l 作图方法,包括基于单粒胚乳观察值以及胚乳性状平均值两种数据模式的q t l 分 析方法然而,在已有基于胚乳性状平均值的q t l 作图方法中,或无法区分胚乳 q t l 的两种显性效应,或涉及到的杂交工作量太大。为此,本文根据三倍体胚乳 性状的遗传模型,提出基于n c i i i 以及 i t c 两种遗传设计的胚乳性状q t l 作图新 方法。方法的可行性和有效性通过计算机模拟数据进行分析验证。模拟研究供试 因素包括:q t l 遗传力,f 2 群体植株数以及每家系混合样品测定的胚乳数。考察 指标包括:q t l 的统计功效以及q t l 位置和效应估计的准确度和精确度。模拟分 析结果表明;( 1 ) 两种设计均有较高的q t l 统计功效,在供试的大多数处理下, 即使q t l 的遗传力只有5 ,其被发现能力也可达至1 0 0 0 6 。但相对来说。t i c 设 计的q t l 统计功效高于n c i i i 设计。( 2 ) 两种设计均可有效区分胚乳q t l 的各种 遗传效应。但相对来说,基于t r c 设计的胚乳o w l 作图方法,无论是在q t l 的 位置估计,还是效应估计匕均优于n c i i i 设计,虽然这一优势随着q t l 遗传力 的提高以及样本容量的增大而有降低的趋势 关键词i 胚乳性状;q t l 作图;n c i i i 设计;t t c 设计;极大似然估计;e m 算法 王学枫t 基于n c 和t r c 设计的胚乳性状a 几作圈方法 3 m a p p i n gm e t h o do fq u a n t i t a t i v e t r a i tl o c iu n d e r l y i n g e n d o s p e r mt r a i t sw i t hn c i i ia n d t t c d e s i g n s p o s t g r a d u a t e :x u e f e n gw a n g s u p e r v i s o r :p r o f c h e n w ux u t h ee n d o s p e r mo f c e r e a la o p si sat r i p l o i dt i s s u ep r o d u c e db yam a l eg a m e t ef r o m t h ep o l l e n 鼬缸i n gw i t ht w of e m a l en u c l e i e n d o s p e r mu a i t sr e f e rt ot h o s e c h 棚墨c 雠t h a td e t e r m i n e db yt h ep h y s i c a la n dc h e m i c a lp r o p e r t i e so fg r a me n d o s p e r m s i n c em a n yq i l a l i t yu a i t sa r ec l o s e l yr e l a t e dt ot h em l d o s p e r m s , t h eg e n e t i cs t u d yo f e n d o s p e r mt r a i t sp l a y saf i m d a m e n t a la n dv i t a lr o l ei ni m p r o v i n gg r a mq u a l i t y t h e r e h a v eb e e ns e v e r a lp 曲l i c a t i o n gd e t a i l i n gt h eu n i q u ep r o p e r t i e so f e n d o s p e r mt r a i t s a n d as e r i e so fq t lm a p p i n gm o d e l sa n da p p r o a c h e ss p e c i f i cf o rt r i p l o i dt r a i t sh a v eb e e n p r o p o s e d , u s i n gs i n g l eg r i no b s e r v a t i o no rm o r ep r a c t i c a lo n et h a to b t a i n e df r o m b u l k e ds a m p l e s h o w e v e r , c u r r e n tm e t h o d st h a tb a s e do nb u l k e ds a m p l e sc a no f t e nf a i l s t oe s t h n a t et w od o m i n a u c ee f f e c t so fe n d o s p e r mq t ls e p a r a t e l y , o ri n v o l v eah e a v y w o r ko f c r o s s i n g b a s e do nt h eq u a n t i t a t i v eg e n e t i cm o d e l sf o rt r i p l o i de n d o s p e r mw a i t s , 8d e wm a p p i n ga p p r o a c ht h a tb a s e do nn o r t hc 卸o l i n ad e s i g nm t n c m ) a n dt r i p l e t e s tc r o s s ( t t c ) w a sp r o p o s e di nt h i ss t u d y f e a s i b i l i t ya n de f f i c a c yo ft h em e t h o d w 懿i n v e s t i g a t e dt h r o u g hs i m u l a t e d 出t 8 le x p e r t m e n l a lf a c t o r sc 心n s i d e r e d i nt h e s i m u l a t i o n si n c l u d eq t lh e r i t a b i l i t y , s a m p l es i z eo ft h es e g r e g a t i o np o p u l a t i o na n d n u m b e ro f e n d o s p e r m sc o l l e c t e dp e rp l a n t t h er e s u l t ss m g g e s t e dt h a t :( 1 ) t h em e t h o d s h o s e do nt h eb o t hd e s i g n sh a ds a t i s f a c t o r i l yh i g hd e t e c t i o np o w e r s ,w h i c hr e a c h e d1 0 0 e v e nw h e nt h eg i lh e r i l a b i l i l yw a s5 b u tt h et r c - b a s e da p p r o a c ht e n d e dt oh a v e s l i g h t l yh i g h e rp o w e r t h a nt h en c l l i - b a s e do n e ;( 2 ) b o t ha p p r o a c h e sc 觚d i s t i n g i l i s ht w o d o m i n a n c ee f f e c t ss u c c e s s f u l l y b u t 讲f m l ,t h et t c - b a s e da p p r o a c hc 蛆o f f e rb e t t e r e s t i m a t i o no fe i t h e rq 几p o s i t i o n so re f f e c t s , t h o u g ht h i ss u p e r i o r i t yw a n e d 勰t h e h e r i t a b i l i t ya n ds a m p l es i z ei n :a s e 王学枫:基于n c l l i 和t i c 设计的胚乳性状a r l 作圈方法 - 4 k e y w o r d s :e n d o s p e r mm i l t s ;q t lm a p p i n g ;n o r t hc a r o l i n ai l ld e s i g n ;w t r i p l et c 毹 c r o s s ;h i 旺i m 岫l i k e l i h o o de s g m a t i o n ;e ma l g o r i t h m 王学枫一基于n c i i i 和t t c 设计的胚乳性状a i l 作图方法 1 前言 谷物的胚乳是人类食粮和许多生活必需品的主要来源,因此,胚乳性状的遗 传研究一直受到遗传学家和植物育种学家的重视【l 】。研究表明,多数胚乳性状均呈 连续的变异,个体之间界限不明显,很难明确分组,表现出典型的数量性状遗传 特征。 对数量性状的科学阐述始于j o h a n n s e n 的纯系学说和n i l s s o n - e h l e 的多因子假 说嘲。1 9 0 3 年,j o h a n n s e n 在菜豆的粒重遗传研究中提出了纯系学说该理论认为 数量性状的基因型效应的不连续性可由环境加以修饰,从而使表现型呈连续型变 异,因此可以将表型变异区分为遗传变异和非遗传变异,从而引出了基因型和表 现型的概念,为在孟德尔遗传学的框架内理解生物性状的连续变异提供了基础。 1 9 0 9 年,n i l s s o n - e h l e 通过小麦种皮颜色的遗传研究提出了数量性状的多因子假 说。该假说认为,数量性状受一系列微效多因子的支配;每个遗传因子的效应相 等,而且彼此间的作用可以累加,后代分离表现为连续变异;单个因子的遗传仍 符合基本的孟德尔遗传规律。纯系学说和多因子假说的提出明确了数量性状的遗 传基础,即数量表型是由多个遗传因子和环境效应交互作用的结果 1 9 1 8 年,l l a f i s h e r 最早提出了数量性状遗传的加性显性遗传模型,将基因 型效应及遗传方差分解为相应的遗传分量,用于研究亲属问的相关 3 1 。1 9 3 1 年, w r i g h t 对群体的交配模式进行总结,提出了近交系数的概念,通过不同胚子间近 交系数的分析研究不同交配模式遗传特征1 4 】。1 9 4 1 年,m a t h e r 将这些微效基因称 为多基因( p o l y g e n e ) 嘲,以区别于孟德尔式的寡基因( o h g o g e n e ) 。该理论的基本 观点是:连续性变异的数量性状是由一个多基因系统控制的,该系统由很多效应 相等且对环境反应敏感的基因组成;多基因系统中的各个微效基因仍都遵循孟德 尔方式遗传,虽然个别微效基因的遗传效应不能识别或追踪,但作为多基因系统 整体,其遗传特征是明显的,可研究的。这些学说的提出为经典数量遗传学体系 的建立奠定了基础但是由于这些方法是将多基因作为整体加以研究,因此不能 三兰垫! 墨主翌兰坚! 塑里丝盐盟墅墨堡鉴坠丝望查堕:! : 追踪单一座位数量性状基因的作用 1 9 2 3 年,s a x 在研究菜豆种子大小与种皮颜色之间的遗传关系中发现,种皮 颜色与种子体积大小之间存在关联嘲s a x 认为,这种关联是由于控制种子大小的 多基因与控制种皮颜色的单基因之间存在连锁造成的,并初次提出了基于形态标 记的数量性状基因定位设想。1 9 6 1 年,t h o d a y 提出将两个标记用于微效多基因的 定位川。1 9 8 0 年,r f l p 标记发现以后,遗传学家开始将分子标记用于数量遗传研 究由于分子标记数量多且使用方便,应用分子标记大大提高了连锁图谱的构建 效率。之后,许多作物建立了日趋饱和的高密度分子标记连锁图谱,这些信息为 数量性状遗传研究带来了前所未有的机遇。1 9 8 9 年,l a n d e r 和b o t s t e i n 的基于分 子标记的q t l 区间作图方法的提出和应用 s l ,极大地推动了数量性状的遗传研究。 利用分子标记连锁图谱,在染色体上寻找数量性状基因座位的位置及其效应,已 逐步成为数量遗传学领域的研究重点。至此,数量性状遗传研究已经进入所谓的 现代数量遗传学时期。目前已发展了多种构建q t l 图谱的方法,包括:单标记分 析方法( s i n g l e - m a r k e r a n a l y s i s ) 、l a n d e r 和b o 臼t e “羽( 1 9 8 9 ) 的区间作图方法( 1 m 。 i n t e r v a lm a p p i n g ) 、z e n g 嗍( 1 9 9 3 ) 的复合区间作图方法【1 0 l ( t h ec o m p o s i t ei n t e r v a l m a p p i n g ,e l m ) 、k a o 和2 ,棚9 1 1 u ( 1 9 9 9 ) 的多区间作图法( t h em u l t i p l ei n t e r v a l m a p p i n g ,m l m ) 、近年发展起来的b a y e s i a n 作图方法、将经典q t l 作图方法与微 阵列数据相结合的e q r l ( e x p r e s s i o nq u a n t i t a t i v et r a i tl o c i ,e q 厄) 分析方法、以及 x u 1 2 1 ( 1 9 9 6 ) 和b r o m a n l l 3 】( 2 0 0 5 ) 提出的多亲本杂交群体的q t l 作图方法等。 然而,由于胚乳为三倍体组织,其遗传基础要比通常的二倍体农艺性状复杂得多, 胚乳性状q t l 分析无法直接套用上述作图方法 1 1 谷类作物胚乳性状的遗传特征 早在2 0 年前,谷类作物品质性状的遗传改良已成为国际性的一大育种目标。 品质性状的遗传研究则是品质改良的基础谷类作物的品质性状大多通过胚乳表 达的。有关研究表呼q 稻米的直链淀粉含量、小麦的高产分子量谷蛋白亚基等品 质性状的遗传表达的确受三倍体遗传控制。由于胚乳是由雌性的两个极核和雄性 王学枫l 基于n c l i i 和1 r c 设计的胚乳性状q - n 作圈方法 7 的一个精核受精发育而形成的三倍体组织。因此,胚乳性状的遗传表达要比通常 的二倍体农艺性状复杂在1 9 8 7 年国际第2 届数量遗传学会议上,莫惠栋首先提 出胚乳性状的数量遗传模型,为正确分析谷类作物品质性状的数量遗传奠定了理 论基础 概括来说,胚乳品质性状与株高、穗长等普通植株= 倍体农艺性状相比有以 下4 个差别1 1 s l :( 1 ) 倍性特征。胚乳是由雌性的两个极核和雄性的一个精核融合 后发育而成的因此,它是一种三倍体组织,具有3 n 的染色体组成,其性状受3 n 遗传控制这一特性产生两个直接后果:其一,不同基因型的正交和反交表现不 同;其二,对于一个q - q 位点,它具有) q 、q q 吁、q q q 和q q q 4 种基因型而不 是通常二倍体性状的q q 、q g 和q q3 种基因型。( 2 ) 世代特征。胚乳是双受精的 产物,而受精是新世代的开始。因而,胚乳是产生该胚乳植株的子代,胚乳性状 是母株的子代性状。例如,在两个亲本杂交时f i 代胚乳,即杂交当代母株( f o ) 上所结种子的胚乳,f 2 代胚乳则是f l 植株上所结种子的胚乳。( 3 ) 分离特征。对 于胚乳,一粒种子是一个个体。胚乳基因型的遗传分离,发生在杂合母株的种子 甸,而不是杂合母株间。( 4 ) 表达特征胚乳有其自身基因型,但它又是在母株 上生长发育的。母株为艇乳提供了发育的库容、需要的灌浆物资和相应的灌浆强 度因此,胚乳性状的遗传表达就可能受胚乳基因型或母体基因型控制或兼而有 之。此外,也还可能存在细胞质效应。 1 2 胚乳性状的数量遗传模型 胚乳性状的数量遗传模型必须适合胚乳性状的3 n 特点,并能够分解出各种可 能的基因效应。考虑一个位点的简单情况:设该位点只有q 和叮两个等位基因且它 们对某一胚乳性状分别具有增效和减效作用,则在三倍体情况下,其有关基因型、 基因型值和以中亲值肌为原点的缩减值,定义【”1 见表1 此处,口是加性效应,即以q 代q 的平均替代效应;吐是第一显性效应,即9 q 与留在一个位点上的交互作用效应;吐是第- - 显性效应,即q 与钾在一个位点上 王学枫:基于n c i i i 和t 1 设计的胚乳性状q t l 作图方法 袭l 胚乳性状的数量遗传模型 t a b l elt h eq u a n t i t a t i v eg e n e t i cm o d e l sf o rt r i p l o i de n d o s p e r mt r a i t s c , e n o t y 弦c , e n o t y p i cv a l u e c o d e dg e n o t y p i cv 蚰i t 的交互作用效应。上述模型说明:( 1 ) 若不存在显性效应( 磊= 噍= o ) ,则基因型 值随q 数目的增加而等差地增加,其公差即为加性效应a ;( 2 ) 若存在显性效应, 则西和吐分别为基因型q q 咛和勿g 的实际值与它们的加性期望值的离差,即显性 偏差;( 3 ) 若d o 表示q 为显性,若d o 则q 为显性。因此,a 、反和如3 个参 数能够描述一个三倍体位点的各种可能的基因效应。 1 3 三倍体胚乳性状q t l 作图的主要方法及特点 1 3 1 最小平方法 徐辰武等【1 6 1 将三倍体胚乳性状数量遗传模型和二倍体数量性状基因( q t l ) 图构建方法相结合,导出了双侧标记基因型下胚乳性状q t l 的遗传组成、平均数 和遗传方差分量,据之提出以某一区间双侧标记基因型胚乳性状的平均值为依变 数,以该区问内任一点假定存在的q t l 的加性效应、第一显性效应和第二显性效 应的系数为自变数,进行有重复观察值的多元线性回归分析,根据多元线性回归 的显著性测验该点是否存在q t l ,并估计出q t l 的遗传效应。给定区问内任一点, 皆可以此进行分析,从而实现对整条染色体的q t l 作图,并以之确定q t l 的数且 及其在基因组上的位置。同时,在检测某一区间时,利用多元线性回归方法消除 该区间外q t l 对分析的干扰,以降低剩余方差,从而提高q t l 检测功效以及参数 估计的精确度和准确度。 该方法主要优点是:( 1 ) 保留了双侧标记回归法简单、系统和易扩展的优点, 王学枫t 基于n c l i i 和t t c 设计的胚乳性状q 儿作圈方法 - 9 且有较快的运算速度( 2 ) 通过统计控制消除了连锁q t l 的干扰,从而提高了q t l 作图的精度( 3 ) 可以同时适用于单粒胚乳观察值以及胚乳性状株平均值两种数 据模式。该方法存在的不足之处在于:( 1 ) 忽略了标记基因型内q t l 基因型混合 分布的特性。( 2 ) 忽略了分离群体同一标记基因型内的方差异质性。( 3 ) 只能合 并估计第l 显性效应和第2 显性效应 1 3 2 迭代重新加权最小平方法 x u t l 7 1 明最早将迭代重新加权最小平方( i t e r a t i v e l yr e w e i g h t e dl e a s ts q u a r e s , i r w l s ) 法用于二倍体性状的q t l 作图,2 0 0 3 年,x u 等1 1 9 】将i r w l s 与三倍体遗 传模型相结合提出了适合胚乳性状基因作图的迭代重新加权最小平方法。该方法 的主要思想是根据不同双侧标记基因型的q t l 的遗传方差给予相应的权重,然后 利用最小平方法进行胚乳性状q t l 的定位及相应的参数估计与h a l e y 和k n 硼d 2 0 l 的最小平方法以及l a n d e r 和b o t s t e i n s l 的极大似然方法相比,该方法的主要优点是 0 7 - t 9 :( 1 ) i 爱w l s 方法是基于回归方法实现的,运算速度比极大似然方法快。( 2 ) 与最小平方法相比,该方法考虑了不同标记基因型下q t l 遗传方差的异质性,其 作图效果比最小平方法好。( 3 ) 该方法既可用于单粒胚乳观察值的胚乳性状q t l 作图也可适用于以胚乳性状株平均值为数据模式的q t l 作图。该方法的主要不足 是:( 1 ) 与最小平方法一样,忽略了标记基因型内q t l 基因型混合分布的特性。 ( 2 ) 仍不能分别估计第1 显性效应和第2 显性效应 1 3 3 极大似然法 2 0 0 2 年,w u 等【2 1 媲出了基于e m 算法实现的三倍体胚乳数量性状作图的极 大似然估计( m l e ) 方法该方法的遗传模型充分考虑了胚乳基因组的倍性特征, 以及胚乳和其母株之间的世代差异 与l a n d e r 和b o s t e i n i s j 的模型相比,w u 等1 2 1 j 方法的主要优点是:( 1 ) 该模型 有效地降低了i i 类错误,从而提高了胚乳性状q t l 检测的功效例如,与直接套 用二倍体遗传模型相比,将三倍体遗传模型用于胚乳性状研究有助检测到更多的 王学枫;基于n c i i i 和t 1 设计的胚乳性状a i l 作图方法 l o 一 效应显著的q t l 。( 2 ) 使用该方法可以更准确地估计q t l 的位置( 3 ) 该方法对 q t l 各遗传效应的估计值更准确可靠。( 4 ) 由于该模型中充分考虑了三倍体胚乳 的形成机制,故能够有效减少i 类错误,从而提高了发现正确q t l 的漶力。然而, 该方法的分析模型是基于单粒种子观察值的,无法分析以胚乳性状株平均值为数 据模式的胚乳性状。 w h 等啕进一步提出基于二阶系统设计的胚乳性状q t l 分析方法,该方法同 时利用母本植株和子代( 胚) 的分子标记基因型信息共同推断胚乳性状相关q t l 的基因型。w u 等l 通过模拟研究发现,由于二阶系统设计从母本获取了更多的遗 传信息,因此可以提高各种效应( 尤其是显性效应和上位性效应) 估计值的精确 度和准确度。但是,该方法仍然存在缺陷,主要表现在:( 1 ) 该方法仍是基于单 粒胚乳性状观察值的,且同时要求测定母本植株和种子的分子标记基因型,在当 前的实验条件下利用一粒种子胚的d n a 同时检测一套分子标记并不现实。( 2 ) 该 方法是利用胚的分子标记基因型推断胚乳性状相关q t l 基因型,无法有效分辨两 种杂合胚乳基因型,因而即使采用该方法,实际上仍然难以准确估计胚乳性状的 两个显性效应。 c u i 等叫在w u 等的工作基础上,进一步提出基于简单回交群体的种子性状 q t l 作图新方法,用于研究母体和子代的直接遗传效应及上位性遗传效应。c u i 等的模拟研究结果表明,该方法能够准确估计不同世代的加性效应和显性效应。 其主要优点为:( 1 ) 由于间接遗传效应在遗传方差中占据较为重要的地位,该模 型更好地阐明了种子性状表达的遗传学本质。( 2 ) 由于考虑了更多的遗传效应( 间 接遗传效应) ,该方法具有更高的统计功效最近,c u i 等聊】又发展了适用于= 倍 体胚和三倍体胚乳基因组之间上位性效应分析的m l 作图方法。将该方法用于一 组水稻实例数据的分析,找到了一个对胚乳的胶稠度性状具有显著影响的q t l , 该q t l 以胚乳和胚基因组问上位性互作方式存在,不存在主效应。大量模拟研究 显示,该方法在中等样本容量和遗传力下就可以获得q t l 位置和效应的准确估计 值c u i 等】的模型是在q t l 作图框架中研究种子发育调控的有力尝试但其模 型的主要问题在于。( 1 ) 该模型仍然是仅利用了母本植株的分子标记基因型信息, 王学枫t 基于n l = i l l 和1 1 设计的胚乳性状q t l 作图方法 1 i 因此对于子代q t l 基因型的推断存在一定的问题。( 2 ) 即使该方法引入了w u 等 刚的二阶系统设计,该方法对于q t l 基因型的判定亦可能存在问题。( 3 ) 基因同 时在胚和胚乳中表达,并共同对某种子性状产生影响的情况,该方法未能提供有 效的解决方案。 上述3 种胚乳性状q t l 作图方法中,以极大似然方法为优【埘。这是因为,极 大似然方法可充分考虑标记基因型内q t l 基因型混合分布的特性以及标记基因型 内的方差异质性。但上述w u 等劂以及c u i 等冽的方法均是以单粒胚乳观察值为 数据模式进行的,无法直接用于分析那些以多粒胚乳混合样品测定的胚乳性状 为此,徐辰武等嘲以及w a n g 等嘲,先后发展了基于株平均值或混合样品测定结 果的胚乳性状q t l 作图的极大似然方法,该方法以分离群体植株的分子标记基因 型以及植株上若干粒自交种子胚乳混合样本观察值为数据模式,采用e m 精确算 法和近似算法两种策略实现q t l 参数的极大似然估计。该方法已被成功用于玉米 爆裂特征的q t l 分析鲫但由于这一方法是采用分离群体各单株上若干粒自交种 子胚乳的平均数为目标性状,无论精确算法还是近似算法,均无法区分胚乳q t l 的两种杂合基因型,因此,无法分辨胚乳q t l 的两种显性效应。温永仙等嘲率先 提出一种基于随机交配设计的胚乳性状q r l 作图方法,该方法以分离群体的个体 的成对杂交衍生的家系平均数为数据模式,模拟分析结果表明该方法确实可以分 辨胚乳性状的两种显性效应其不要不足是,由于分离群体通常具有较多的个体, 随机成对杂交需要较大的杂交工作量,难以适合于白花授粉作物胚乳性状的q r l 分析此外,温等的方法也未提供基于家系平均数的精确解法。 1 4 本文主要研究内容 基于以上分析可以看出,虽然国际上已经发展了一些适合于三倍体胚乳性状 的q t l 作图方法,包括基于单粒胚乳观察值以及胚乳性状株平均值两种数据模式 的q t l 分析方法然而,在已有基于胚乳性状株平均值的q r l 作图方法中,或无 法区分胚乳q t l 的两种显性效应,或涉及到的杂交工作量太大。为此,本文根据 三倍体胚乳性状的遗传模型,提出基于n c i i i 以及t t c 两种遗传设计的胚乳性状 王学枫,基于n c i i i 和1 1 设计的胚乳性状q t l 作圈方法1 2 q t l 作图新方法。方法的可行性和有效性通过计算机模拟数据进行分析验证主 要内容包括:( 1 ) 基于n c i h 设计的胚乳性状q t l 作图方法;( 2 ) 基于t t c 设计 的胚乳性状q t l 作图方法;( 3 ) 模拟研究不同q t l 遗传力以及抽样策略下方法的 有效性 王学枫。基于n c m 和n 设计的胚乳性状g i l 作圈方法 2 统计方法 2 1 基于平均值的胚乳性状的统计遗传模型 设控制某一胚乳性状的单个q 几涉及q 和碍2 个等位基因,则胚乳性状单一 座位可能有q q q ,q q 孥,q q q 和q q q 4 种基因型。各基因型的基因型值可仿m o 2 9 和b o g y o 等【3 川的定义为3 a 1 2 ,a 1 2 + d i ,口,2 + 畋和- 3 a 1 2 ,其中口为加性效应, 磊为第一显性效应,以为第二显性效应。第f 植株上第_ ,粒胚乳的观察值巧可表示 为 巧= + 五# 口+ z i 磊+ 如蟊+ ( 1 ) 其中,是胚乳性状的群体均值勺表示误差效应,并假定勺一( o ,z ) 五f , 和是胚乳q 1 l 基因型的指示变量对q q q 基因型,= 3 1 2 , 砀= = o ;对q 卿基因型,= 1 1 2 ,五口= l ,= o ;对q g g 基因型, = - 1 2 ,如= o ,= 1 ;对删基因型,= - 3 2 ,如= = o 假 设仅有混合样本表型值,即第f 植株上珥粒种子胚乳性状观察值的平均数,上述模 型可以表示为 只= + h a + 点z a + b 岛+ 虿 ( 2 ) 其中 ;,岛:口,6 2 ;磊。岛:以。只:艺巧,啊。毛,:窆五口,啊,毛,= 窆一, 州- s川 毛= 艺,q ,巧。艺勺,一显然,剩余方差亏服从均值为0 ,方差为z ,啊的正 j - tj - 1 态分布 如上所述,胚乳性状的平均数虽然可以参数加性效应和显性效应的函数关系 表示,但在q t l 作图时,由于胚乳q t l 的基因型未知,所以需采用混合模型策略, 即假设性状平均数的分布,为多个潜在分布的混合在此基础上,采用e i v l 算法【3 1 l 王学枫,基于n c l i i 和t i c 设计的胚乳性状a r l 作田方法 1 4 实现的极大似然方法估计未知参数。此处,有两种构建混合模型的策略:( 1 ) 将 混合样本所有可能基因型组合进行逐一分解。以此模型实现的e m 算法称为精确 算法。( 2 ) 将混合样本按母株的q t l 基因型进行分类。此时若干粒胚乳平均值的 分布可以近似看成3 个分布分量的混合。这种简化模型下实现的e m 算法又称为 近似算法。精确算法虽具有更高的精度,但是,当混合样本所包含的籽粒数较多 时,精确算法往往会带来巨大的计算量。 2 2 基于n c i u 设计的胚乳性状的遗传组成及其平均数 n c l l i 设计( n o r t hc a r o l i n ad e s i g nm ) 是经典数量遗传学常用的遗传设计之 一。其主要做法是从两个纯系杂交衍生的f 2 霹体中,随机抽取,个单株,每一单株 皆分别与两个亲本回交,每一f 2 单株均衍生两类家系( 见图1 ) t 2 1 。对胚乳性状 ep 2 占 e j , f 2 xx eb 上山 ee 山山 l i ikl 比l 蕾l l ,l 2 , 图ln c u l 设计示意图 f i g u r e1s c h e m e f o r n o r t h c a r o l i n a d e s i g n i l i 而言,n c m 设计是以f 2 植株群体的随机个体为母本,分别授以p i 和p 2 花粉,从 而可以在同一母株上获得两类不同的胚乳世代家系群体利用n c i i i 设计进行胚乳 性状q t l 分析时,与我们之前提出的基于f 2 。株平均值的分析方法嘲一样,f 2 植 株用于标记分析,各母株上两类家系的胚乳混合样品用于性状测定第, ( j = l ,2 ,) 母株上的两类家系分别用l l ,和场表示 对于l i ,家系,q q 植株上的所有胚乳的基因型均为q 旦q ;q 咛植株上的种子 胚乳按( q q ! q + q q q ) 2 分离;婀植株上的胚乳基因型均为q q q 对于k ,家系, x b 山 王学枫l 基于n c i i i 和t t c 设计的胚乳性状a r l 作圈方法1 5 a 口植株上着生的胚乳基因型均为q q 咛;旦l g 植株上着生的胚乳c o q q + q q q ) 2 分 离;钾植株上的胚乳基因型均为q q q 不同胚乳家系群体的遗传组成列于表2 。据 此,可以导出不同家系群体的平均数,结果一同列于表2 表2n c m 设计下胚乳性状的遗传组成及其平均值 t a b l e 2g e n e t i cc o n s t i t u t i o n a n d m e a n o f e n d o s p e r m t r a i t u n d e r n c h i d e s i g n 2 3 基于t t c 设计的胚乳性状的遗传组成及其平均数 t i c ( t r i p l et e s tc r o s s ) 设计也是经典数量遗传学常用的遗传设计之一。其主 要做法是从两个纯系杂交衍生的e 群体中,随机抽取,个单株,每一单株皆分别与 两个亲本以及f l 回交,每一f 2 单株均衍生三类家系( 见图2 ) 掰而对胚乳性状 来说,t i c 设计则是以f 2 植株群体的随机个体为母本,分别授以p l 、p 2 和f i 花 l xx ebi j l上上 l i il 2 il ,i b l e 上 f 2 2 x c xxx ep 2e p ip 2e l山山工上山 l nl 越l ,ll l jl 甜l 甜 圈2r r c 设计示意圈 f i g u r e2 s c h e m ef o r t r i p l et e s ta 懈d e s i g n 王学枫t 基于n c i i i 和t 1 设计的珏乳性状a i l 作田方法 - 1 6 - 粉,从而可以在同一母株上获得三类不同的胚乳世代家系群体。与前述的n c m 设计一样,f 2 植株用于标记分析,各母株上三类家系的胚乳混合样品用于性状测 定第,( t = 1 ,2 ,) 母株上的三类家系分别用l i nb 和【d j 表示 在 i t c 设计下,不同的母株q t l 基因型,其上着生的l l ,和k ,家系的群体组 成与n c i i i 设计完全相同。而对l 3 i 家系,q q 植株上着生的胚乳的遗传组成为 ( 匹独+ q q i g ) 2 ;q 嘧植株上的胚乳的遗传组成为( q 9 q + q q 咛+ q q q + q q q ) 4 ; g g 植株上的胚乳的遗传组成则为( q q q + q q q ) 2 不同胚乳家系群体的遗传组成及 其平均值一同列于表3 。 表3t i c 设计下胚乳性状的遗传组成及其平均值 t a b l e3g e n e t i cc o n s t i t u t i o na n dm e a no f e n d o s p e r mt r a i tu n d e rt t cd e s i g n 2 4 胚乳q t l 参数估计的精确算法 以凡,如和幽分别表示f 2 群体中第i 植株的3 种q t l 基因型的条件概率, 该概率可用双侧标记基因型( 标记基因型信息完全时) 或整条染色体上的所有标 记基因型( 标记基因型信息不完全时) 联合推断口2 1 由a 。,p 2 , 和p 3 ,可以进一步 计算出第1 植株上任一粒种子胚乳4 种可能基因型q 9 q ,q q 留,q q q 薷o q q q 的条 件概率巩,0 ,蹦和几。例如,无论是n c m 设计还是r r c 设计,其l l ,家系 的4 种q t l 基因型的概率分别为硝,= ,i 。+ 如,2 ,砖= p h l 2 + p u ,砖;威,= o ; 而i 甜家系的4 种q t l 基因型的概率则分别为= - - 0 ,磊,- - p u + p 7 。1 2 , 乩= 如,2 + ; i r c 设计的b ,家系的4 种q t l 基因型的概率则分别为 王学枫t 基于n c i l l 和t r c 设计的胚乳性状q t l 作圈方法 巩= 儿= p u l 2 + p 1 4 ,西= 成,= 如1 4 + p 3 2 以两、死,和风分别表示第i 母 株上3 类家系各、和粒胚乳混合样品的性状平均值,( 七= l ,2 。3 代表3 类不同家系) 粒胚乳中4 种q r l 基因型出现次数i 、2 、3 和为一多项式 分布,具有概率 p ( ,心4 ) 2 瓦瓦赫魄产慨j ( 以p 瓴产 ( 3 ) 已知粒胚乳中4 种q t l 基因型的可能出现次数共有 ( + l x n _ + 项+ 3 ) 6 种因此,死的分布为( + l x + 2 ) ( + 3 ) 6 个分布的 混合,具有密度函数 _ ,饥) = p ( ,) ,魄i ,嘞2 ,) ( 4 ) n 其中,( 死l 叭,:,啊m ,4 ) 为对应于某一观察次数、2 、_ 和条件下死的 正态概率密度函数q 表示( + l x n b + 2 x + 3 ) 6 种可能哆枷、碍眈、刀k 和取 值域。 在本文的两种设计中,由于每一f 2 母株上有两个( n c i i i 设计) 或三个( t t c 设计) 家系平均数,因此,模型( 2 ) 有关符号的下标需进一步细化为 死= 6 0 + 而店+ 屯以+ 毛_ 6 2 + 瓦 ( 5 ) 对应于,和,具有关系= ( 3 + 一- 3 h e , , ) ( 2 n , d , 而矗;2 ,和而- = r i m ,h e 因此,死的条件期望为 - e ( l ,i ,2 ,f h $ ,。) = 6 0 + 毛- 魂+ 屯打6 2 + 焉村6 , 死的条件方差为 w r y _ i ,。,) = 砖, 从而有 ,( _ - f ,。嘞,) - 碌咧一魄一岛一岛一岛一鸟) ,2 司j 丢哥 对n c i i i 设计,个f 2 母株2 ,个独立平均值的联合对数似然值可以表示为 王学枫t 基于n c m 和t i c 设计的胚乳性状a r l 作田方法 i2 l n l = l 瓯) ( 6 ) _ _ 一 i - ! 扣d 对t t c 设计,个f 2 母株甜个独立平均值的联合对数似然值则可以表示为 , , i n = l 矿魄)_ _ t i lk - i ( 7 ) 为了描述的方面,以下引入新变量,用于表示每一f 2 母株上的家系数,显 然= 2 对应于n c m 设计,= 3 对应子t t c 设计。因此,公式( 6 ) 和( 7 ) 可 以统一描述成 , h 工= 1 v 魄) ( 8 ) ,l li - i 公式( 8 ) 中的参数6 0 ,岛,6 2 ,毛和司可用e m 算法实现的极大似然方法进行估 计 令】k = ( 1 而矗而h 而矗) ,b = ( 6 0 岛岛岛) t ,公式( 5 ) 可用矩阵形式表示为 死= x 曲+ 瓦 ( 9 ) 参数b 和司估计p 1 1 程序如下: 以当前参数0 0 - 1 ) 和表型观察值y - - t - - 为条件,按下式计算信息完全下对数似 然函数的期望:。 l ( o lo ( “) ;e x 【工( o ,蜀i o ,y 1 ( 1 2 x t n 2 x 。- ( 1 2 x t n 2 x + l n 司) 杰壹专杰兰e i 【( 瓦一k b ) 。i o ,巾,y 】( 1 0 )+ l n 司) 专e i 【( 瓦一k b ) 。i o ,巾,y 】“ h i u 扭il 对b 和z 分别取偏导数,获得 解方程可得 鼬 嚣 上研h 挚旦耐 斟 孝缸套鲁,圭t , 4 兰i 1 ,孝粪,_h_ 一一 害砉懒) 圭4 壹j , , 4 - 4b , 4 僦) 喜善 i e ( h h ) 妻善)“h h 喜砉,妻喜喇铀,喜喜僦,喜喜幔- ,_ “_h hh 一 套善,喜善啦,窑喜幔帆,害砉僦, 一“ _hh 一一 蝴- b 阮 杰e ( h ) 死 竞 目高现 ( 1 2 ) 和p 2 砭1i 备i 驴n 阮一概弘甜甜) 】2m , lj 。l 。l 公式( 1 2 ) 和( 1 3 ) 中的“e ”表示缺失变量的期望值各期望值的计算,首先需 要计算第f 植株上第七家系( + l x n j , + 2 x n - + 3 ) 6 种基因型组合的后验概率 ,c ,:,= 差舞筹老蔫量等芫者篙揣n 4 , b - ;,o k 。e 砖+ i i 一1 2 n 。一; 仉 e ) 。;,札,t k 饥 8 ( ) 。;,札 k 饥 b 屺) - ;,o k ,x ;3 + ;一1 2 n “一;r 嵋 冀。三,专7 1 ( 1 5 ) e 五) ,。k 。埔啊 。 e “ - ) - ;,札。 ,磅+ ;一一; ,埘佛 z - ) - ;,札磅一一+ ;一;一; k 憾 b h ) 。莓,虬, h ,k 啊 晰一屯一m 一砒一u r - ;,饥。,x 无一气- 弓+ ;一;一;m 饥一啪,一,讷,r 从而有e m 算法的步骤如下; ( 1 ) 初始化;为参数b 设定初值蹦0 ,群。,6 o ) ,和 ( 2 ) e 步:根据公式( 1 4 ) 计算第,植株第k 家系所有可能基因型组合的后验概率。 再根据公式( 1 5 ) 计算所有缺失变量的期望值 壬学枫。基于n c 和t i c 设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论