(动物遗传育种与繁殖专业论文)基于遗传标记的亲缘关系估测方法及遗传参数估测软件研制.pdf_第1页
(动物遗传育种与繁殖专业论文)基于遗传标记的亲缘关系估测方法及遗传参数估测软件研制.pdf_第2页
(动物遗传育种与繁殖专业论文)基于遗传标记的亲缘关系估测方法及遗传参数估测软件研制.pdf_第3页
(动物遗传育种与繁殖专业论文)基于遗传标记的亲缘关系估测方法及遗传参数估测软件研制.pdf_第4页
(动物遗传育种与繁殖专业论文)基于遗传标记的亲缘关系估测方法及遗传参数估测软件研制.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(动物遗传育种与繁殖专业论文)基于遗传标记的亲缘关系估测方法及遗传参数估测软件研制.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于遗传标记的亲缘关系估测方法及遗传参数估测软件研制 摘要 在实际情况下存在动物谱系缺失或诸如野生群体根本没有系谱的情况,但亲缘 关系对于动物遗传改良又必不可少,所以利用分子标记重构动物之阀的亲缘关系成 为禳凌这实际需求的关键。本研究剩焉分子标记的霹源褶藏( i d e n t i c a lb yd e s c e n t , i b d ) 特性,通过霹一个随梃交配的大群体巾任意甄个个体在某个标记位点四个等位 基因的比较,同时考虑样本含量、标记位点数目、等位基因数目及基因频率等因素, 建立了估测群体中任意两个个体之间的亲缘关系的方法( 记为胁模型) 。用蒙特卡 罗模拟法( m o n t ec a r l os i m u l a t i o n ,) 对l i u 模型进行比较研究。 设定理论群体,样本含量( s a m p l es i z e ,s s ) 、标记位点( n u m b e ro f l o c i ,n l ) 、 等位基因数目( n u m b e ro f a l l e l e sp e rl o c u s ,n a ) 等三个指标均为l o ,模拟两种群体 分剐是菲亲属( n o n r e l a t i v e s ,n r ) 、亲予( p a r e n to f f s p r i n g , p o ) 、全闲胞( f u l ls i b s ,f s ) 帮半阏臆( h a l f s i b s ,h 辩群体来研究l i u 模型豹估测效采。计算结果如下:不相关群 体的平均相关度为0 + 0 6 5 4 ,方差为0 。0 0 4 3 ;亲子群体的平均相关度为0 。5 4 6 4 ,方差 为0 0 0 4 3 ;全同胞的平均相关度为0 5 0 3 9 ,方差为0 0 0 1 7 ;半同胞群体的平均相关 度为0 2 8 7 3 ,方差为0 0 0 6 4 。结果表明:在四种特定的亲缘关系下,三伽模型都能 够较准确的估测个体之间的亲缘关系,其中以亲子群体和半同胞群体的估测效果最 佳。分别改变样本含量、标记位点和等位基因数目三个因素,研究l i u 模型在黯种 群体下静彳鑫测效采,结果表鞠纽模型在三种因素改变麓条辞下,估测结果都比较 稳定;用圈群的数据集分别比较了纨模型与灶模型、模型、冀模型、默模 型、妒模型在飚神模拟群体下的 古测效果,结果表明:从总体上恧富,l i u 模型较 其它模型能更好的对相关度进行估测,是目前最好的估测模型。 同时,集成开发了基于v b 的软件系统,是一个较好的、人性化的、高扩展性 的估测遗传参数的软件。主要功能包括采用单个或多个模型估测随机大群体中任意 两个个体之间的相关度以和用蒙特卡罗模拟法模拟、计算、比较各个模型的估测效 采。 关键词;同源相同;个体相关度;分子标记;蒙特卡罗模拟法:遗传参数;亲缘 关系;软件开发 华中农业大学2 0 0 8 届硕士学位论文 a b s t r a c t t h er e l a t i o n s h i pb e t w e e na n i m a l sw h i c hd e p e n d so np e d i g r e er e c o r d sp l a y sac e n t r a l r o l ei nm a n ya r e a so fq u a n t i t a t i v ea n dc o n s e r v a t i o ng e n e t i c s ,e s p e c i a l l yi na n i m a l b r e e d i n g i nt h ea b s e n c eo fk n o w np e d i g r e es t r u c t u r e ( s u c ha sw i l dp o p u l a t i o no rl a c ko f p e d i g r e e ) ,w ec a no n l yu s em o l e c u l a rm a r k e rt or e b u i l dt h er e l a t i o n s h i pb e t w e e na n i m a l s t om a k ee f f e c t i v em a t i n gp l a n sa n de s t i m a t et h eg e n e t i cp a r a m e t e r s i nt h i s p a p e r , i p r o p o s ean o v e lm o d e lf o re s t i m a t i n gp a i r w i s e r e l a t e d n e s sf r o mr a n d o m l ym a t i n g p o p u l a t i o nw i t hc o - d o m i n a n tg e n e t i cm a r k e r s ,c o m p a r i n gt h ef o u ra l l e l e sf r o mt w ol o c i i n t w oi n d i v i d u a l sa n dt a k i n gt h es a m p l es i z e ,n u m b e ro fl o c i ,n u m b e ro fa l l e l e sp e rl o c u s a n dt h ea l l e l ef r e q u e n c yd i s t r i b u t i o ni n t oc o n s i d e r a t i o n a n dia l s os e tu pm o n t ec a r l o s i m u l a t i o nw h i c hc a ns i m u l a t et h ei d e a lp o p u l a t i o no fp a r e n t - o f f s p r i n g ,f u l ls i b s ,h a l fs i b s a n dn o n r e l a t i v e st oe v a l u a t et h en e wm o d e la n dc o m p a r eb e t w e e nd i f f e r e n tm o d e l sb y m e a na n ds a m p l i n gv a r i a n c e so fr e l a t e d n e s s g i v i n g10l o c i ,10a l l e l e sp e rl o c u sa n d10c a r d i n a ln u m b e r sf o rs a m p l es i z e ,w e s i m u l a t e4t y p e so fr e l a t i v ep o p u l a t i o nf o re v a l u a t i n gt h ep r e c i s i o na n da c c u r a c yo ft h e n e wm o d e l t h er e s u l tf o l l o w s :m e a na n dv a r i a n c eo fp a i r w i s er e l a t e d n e s sf o rf s ,p o ,h s a n dn ra l eo 5 0 3 9a n do 0 017 ,0 5 4 6 4a n do 0 0 4 3 ,0 2 8 7 3a n d0 0 0 6 4 ,o 0 6 5 4a n d0 0 0 4 3 r e s p e c t i v l e l y i ti n d i c a t e st h a tt h en e wm o d e li sw e l lb e h a v e du n d e r4 a c t u a lr e l a t i o n s h i p s c o m p a r i n gw i t hp r e v i o u se s t i m a t o r s ,t h en e wo n ea l s o h a ss t a b l e p r o p e r t ya n d i s g e n e r a l l ym u c hm o r ea d v a n t a g e o u st h a nt h eo t h e r sb yc h a n g i n gt h ev a r i a b l eo fs a m p l e s i z e ,n u m b e ro fl o c ia n dn u m b e ro fa l l e l e sp e rl o c u s f i n a l l y , id e s i g nn o v e ls o t h v a r ew h i c hh a saf r i e n d l yi n t e r f a c ea n dh i 【g he x t e n s i o n b a s eo nv i s u a lb a s i c6 0 ,a n da l s oc a nb ea p p l i e de a s i l ya n de f f e c t i v e l y i t sm a i nf u n c t i o n i n c l u d e s :e s t i m a t i n gt h ep a i r w i s er e l a t e d n e s sb e t w e e np a i r w i s ei n d i v i d u a l su s i n gl o a d i n g d a t ab yt h en e we s t i m a t o ra n dt h eo t h e r s ,a n dc o m p a r i n gt h er e s u l t sb e t w e e nd i f f e r e n t e s t i m a t o r s b e s i d e s ,w ec a na l s oe v a l u a t et h ep r e c i s i o na n da c c u r a c yo fe a c hm o d e la n d m a k ea c o m p a r i s o nt h r o u g ht h es i m u l a t i n gs y s t e m k e yw o r d s - 一i d e n t i c a lb yd e s c e n t ;p a i r w i s er e l a t e d n e s s ;m o l e c u l a rm a r k e r ;m o n t e c a r l o ;g e n e t i cp a r a m e t e r s ;r e l a t i o n s h i p ;s o f t w a r ed e v e l o p i n g 2 基于遗传标记的亲缘关系估测方法及遗传参数估测软件研制 r a n d o ma m p l i f i e dp o l y m o r p h i cd n a r e s t r i c t e df r a g m e n t 蚴p o l y m o r p h i s m a m p l i f i e df i 驾m e n t 蚴p o l y m o r p h i s m s s i n g l en u c l e o t i d ep o l y m o r p h i s m s i m p l es e q u e n c er e p e a t i d e n t i c a lb yd e s c e n t i d e n t i c a l i ns t a t e h a l fs i b s f u l ls i b s p a r e n to f f s p r i n g n o n r e l a t i v e m o n t ec a r l os i m u l a t i o n s i m i l a r i t yi n d e x p a i r w i s er e l a t e d n e s s s a m p l i n gv a r i a n c e s s a m p l es i z e g e n ef r e q u e n c y r e f e r e n c ei n d i v i d u a l p r o b a n di n d i v i d u a l t r i g u l a rd i s t r i b u t i o n u n i f o r md i s t r i b u t i o n d i a l l e l i cl o c i m u l t i a l l e l i cid c i p a p d i u l p a f l p s n p s s r i b d i i s h s f s p o n r m c s r s v s s g f r i p i t d u d d l m l 随机扩增多态性d n a 限制性片段长度多态性 扩增片段长度多态性 单核苷酸多态性 简单重复序列 同源相同 同态相同 半同胞 全同胞 亲子关系 非亲属关系 蒙特卡罗模拟 相似系数 个体间相关度 样本方差 样本含量 基因频率 参考个体 推测个体 三角分布 均匀分布 双等位基因位点 多等位基因位点 3 华中农业大学2 0 0 8 届硕士学位论文 英文英文缩写 中文 e n g l i s hn a m e m i c r o s o f tv i s u a lb a s i c6 0 p r o b a b i l i t y h e r i t a b i l i t y g e n e t i cm a r k e r m o r p h o l o g i c a lm a k e r c y t o l o g i c a lm a k e r b i o c h e m i c a lm a k e r m o l e c u l a rm a r k e r m i c r o s a t e l l i t ed n a c o e f f i c i e n to fc o a n c e s t r y p a i r w i s er e l a t i o n s h i p g e n e t i cp a r a m e t e r a c t u a lr e l a t i o n s h i p r a n d o mm a t i n gp o p u l a t i o n c o m b i n a t i o n so fg e n o t y p e l o c u so rl o c i a l l e l e g e n o t y p e c o e m c i e n t i n d i c a t o rv a r i a b l e i s o l a t i o nb yd i s t a n c e c o n s e r v a t i o ng e n e t i c s i n b r e e d i n gd e p r e s s i o n r a n d o mg e n e t i cd r i f t e v o l u t i o no fs o c i a lb e h a v i o r 鼬ns e l e c t i o n s o f t w a r ed e v e l o p i n g a b b r e v i a t i o nc h i n e s en a m e v b6 0 p h 4 可视化编程语言 概率 遗传力 遗传标记 形态标记 细胞标记 生化标记 分子标记 微卫星d n a 共祖系数 个体间亲缘关系 遗传参数 实际亲缘关系 随机交配群体 基因型组合 位点 等位基因 基因型 系数 指示变量 遗传间隔距离 保种遗传学 近交衰退 随机遗传漂变 社会行为进化学 亲缘选择 软件开发 华中农业大学学位论文独创性声明及使用授权书 学使论文 否如需保密,解密时间年 月日 是否保密 独创性声明 本人声明所呈交昀论文是我个人在导师指导下进行的研究工律及取得的研究成 果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他入已经发 表或撰写过的研究成果,也不包含为获得华中农业大学或其他教育机构的学位或证书 而使用过的材料,指导教师对此进行了审定与我一同工作的同志对本研究所做的任 何贡献均已在论文书做了明确的谎唆,并表示了谢意 研究生签名:囊i j 丧蜩 时间:勘略年6 月f 芝日 学位论文使用授权书 本人完全了解华中农业大学关于保存、使用学位论文的规定,即学生必须按照学 校要求提交学位论文的印刷本和电予版本;学校有权保存提交论文的印刷版和电子版, 并提供目录检索和阕览服务,可以采用影印、缩印或扫描等复制手段保存、汇编学位 论文。本人同意华中农业大学可以用不同方式在不圈媒体上发表、传播学位论文的全 部或部分内容,并授权中国科学技术信息研究所和北京万方数据股份有限公司将本人 学位论文收录到中国学位论文全文数据库,并进行信息服务( 包括但不限于汇编、 复制、发行、信息网络传播等) ,同时本人保留在其他媒体发表论文的权力。 注:保密学位论文( 即涉及技术秘密、商业秘密或申请专利等潜在需要提交保密的论 文) 在解密后适用予本授权书。 学位论文储始灿如糊戥孙寺 签名基期:洳略年6 月l 2 窭 签名疆期:卵辨? 月f 己疆 注:请将本表直接装订在学位论文的扉页和目录之间 基予遗传标记熬亲缘关系估测方法及遗传参数估测较彳拳研制 第一章文献综述 1 引言 明了动物亲缘关系是改良和有效利用动物的必要知识。传统上亲缘关系是基于 系谱记录推导而来,进一步的遗传参数估计依赖有效的系谱和性能测量。但在生产 或育种实践中,系谱记录非常有限,对于一些起始群体或野生群体根本没有系谱记 录,即使我们可以获得性能测量资料,也不能制定有效的选配计划和估计遗传参数 或遗传进展。例妇,在估测猪的遗传参数时,由于同时具有系谱记录和生产成绩的 样本非常有限,不仅使我们估测这些参数的成本高昂,而且精度相对较低( 吴常信, 1 9 9 7 ) 。若是突破系谱记录的限制,我们可以获得大量的性能记录,例如屠宰企业有 大量的胴体和肉质记录,由分子标记重构亲缘关系后,就可以比较容易和经常性的 估计猪的遗传参数。 分子标记是继形态标记、细胞标记和生化标记之惹发展起来的一种较为理想靛 遗传标记形式,它以蛋白质、核酸分子的突变为基础,检测生物遗传结构与其变异( 赵 淑清,2 0 0 0 :白玉,2 0 0 7 ) 。分子标记的种类很多,各种分子标记因其技术特点而应 用各异,常用的分子标记及其特点见表1 1 。分子标记技术从本质上讲,都是以检 测生物个体在基因或基因型上所产生的交异来反映生物个体之间的差异。每一种分 子标记都有其鸯身的特点和特定的应用范圉,但就一般意义而言,d n a 分子标记 具有许多独特的优点( 刘华,1 9 9 7 ;朱玉贤,2 0 0 2 :林亚秋等,2 0 0 3 ) :不受组织类 别、发育阶段、环境等因素的影响;标记数量多,遍布整个基因组;多态性高,自 然存在许多等位变异;有许多标记表现为共显性,能够鉴别纯合基因型和杂合基因 型,提供完整的遗传信息;d n a 分子标记技术简单、快速、易于自动化;提取的 d n a 样品,在适宣条件下可长期保存。分子标记以其独特的优点在动物遗传育种 方面展示了广阔的应用前景 黎裕等,1 9 9 5 ;杜立新,1 9 9 5 ) 。 分子标记是从d n a 分子水平诠释个体之间的差异,因此它能够反映个体特异性 的遗传特征( 李千军,1 9 9 9 ;王志林等,2 0 0 1 ;索效军等,2 0 0 3 ) ,可以作为估测个 体之间遗传相似程度的依据。近年来,大量分子标记的涌现和分子标记技术应用的 目趋成熟与完善,隽利用分子标记估测群体闯的亲缘关系提供了成熟的技术背景。 为此,人们在此方向上展开了积极的研究,本研究是在前入所做的诸多研究的基础 上,对利用分子标记估测随机大群体中个体之间的亲缘关系作进一步的研究和探讨, 为分子标记运用于动物遗传育种提供理论指导。 5 华中农业大学2 0 0 8 届硕士学位论文 表1 - 1 常用分子标记的分类简表 t a b l e l - 1s u m m a r yo fc o m m o nm o l e c u l a rm a r k e r 注:文献引用( 熊立仲等,1 9 9 8 ;祝军,2 0 0 0 ;卢孟柱等,2 0 0 0 ;李太平等, 2 0 0 3 :罗文永等,2 0 0 3 ;闫华超等,2 0 0 3 ;谢皓等,2 0 0 5 ;代金霞,2 0 0 5 ;周 延清,2 0 0 5 ;李小白等,2 0 0 6 :刘光兴,2 0 0 7 ;石磊等,2 0 0 7 ;杨慧珍,2 0 0 7 ; l y n c h ,e ta 1 ,1 9 9 4 ;a u t h o n y , e ta 1 ,1 9 9 8 ;a l a i n ,e ta 1 ,2 0 0 2 ) 6 基于遗传标记的亲缘关系估测方法及遗传参数估测软件研制 2 利用分子标记估测相关度的研究 从国内在相关领域的研究看来,利用分子标记研究群体的亲缘关系主要是侧重 在品种或品系之间,通过对选定的分子标记( r a p d 或微卫星标记) 进行多态性分析, 根据检测结果的相似程度,计算它们之间的遗传距离,然后依据遗传距离来推测品 种或品系之间亲缘关系的远近( 赵凯等,2 0 0 0 ;赵凯等,2 0 0 i ) 。 例如: s = 2 n 。b ( n 。+ n b ) d = l - s 上式中:s 为带纹相似系数,d 为遗传距离,为品种口和b 共同具有的r a p d 标 记数,m ,分别为品种订和b 的r a p d 标记数。然后根据遗传距离用最短距离法绘 制聚类树状图,就能推测出品种之间的亲缘关系了。申学林等( 2 0 0 5 ) 利用2 7 对微卫 星引物,检测4 类型的香猪,采用类似的方法分析了它们之间的亲缘关系。不难看出, 这种对于分子标记的利用是很有限的,无论是推测物种的起源,还是推测品种或品 系之间的亲缘关系,对于研究结果都没有了可持续利用的潜力,而且其准确度也需 要衡量的。本研究是将分子标记技术应用于一个随机交配的大群体中,克服实际生 产中由于缺乏系谱记录导致的困难,估测个体之间的亲缘关系,为制定有效的选配 计划和进行群体遗传参数的估测提供理论指导。 2 1基本概念 随机交配的大群体中,个体之间的亲缘关系可以用个体间相关度( p a i r w i s e r e l a t e d n e s s ) 来衡量。两个体间之所以存在亲缘关系,从本质上来说,是由它们从一 个共同的祖先那里继承某一相同基因拷贝或是基因的同源, 相m ( i d e n t i c a lb yd e s c e n t ) 引起的,l y n c hm ,w a l s hb ( 1 9 9 8 ) 给出了个体间相关度的经典定义:两个体石和j , 来自工常染色体某一位点的一个基因与来自y 的相同位点的一个基因同源相同的概 率的两倍即是x 和y 两个体之间的相关度。用公式表示就是: 22 0 砂 ( 1 ) 其中,o x y 指的是共祖系数( c o e f f i c i e n to fc o a n c e s t r y ) ,即分别来自个体石和个 体y 的常染色体上某一位点上的一个基因同源相同的概率。对于比较特殊的几种亲 7 华中农业大学2 0 0 8 届硕士学位论文 缘关系而言,同卵双生胎之间的相关度为1 ;亲子或全同胞之间的是o 5 ;半同 胞之间的是0 2 5 ;而表兄妹之间则是0 1 2 5 。从这里可以看出,亲缘关系越近,其 相关度值越大。 l y n c h 和r i t l a n d ( 1 9 9 9 ) 将两个体x 和y 之间的相关度定义为两个高秩系数的一 个线性函数,如下: 2 孚坞 上式中,如果考虑石和y 两个体某一位点上各二个等位基因,锄指的是工个体 的一个基因与y 个体的相同位点的一个基因同源相同的概率;a 叫指的是工个体的两 个基因与y 个体两个基因都是同源相同的概率。此时,对于几种特定的亲缘关系而 言,亲子关系之间,前者是l ,后者为o ;全同胞之间这两个系数分别是0 5 和0 2 5 ; 半同胞之间分别是0 2 5 和0 ,最终计算的个体间相关度值与( 1 ) 式是相同的。 2 2 研究现状 目前为止,国外已经报道的主要有五种估测个体问相关度的模型,以下根据模 型提出时间的先后顺序作简要描述。 2 2 1 l y n c h 和l i 的模型 l y n c h ( 1 9 8 8 ) 首次正式使用d n a 指纹提供的数据建立了估测个体间相关度的模 型。但是由于等位基因的同态相同与同源相同可能会导致该等位基因不确定的同源 性,所以后来经过l i ( 1 9 9 3 ) 改进,发展成为一个“相似性指数”( s i m i l a r i t yi n d e x ) 模 型,以下简称为比模型。其单个位点估测两个体之间相关度的公式如下: s 。一s o 勺5 商 ( 3 ) 其中,岛指的是工个体和y 个体之间的相似性指数,其定义为参考( r e f e r e n c e i n d i v i d u a l ) 个体0 或力与推测( p r o b a n di n d i v i d u a l ) 个体或功的等位基因同态相同 ( i d e n t i c a li ns t a t e ) 的平均指数。 假定某个位点有n 个共显性等位基因,以i ,j 和k 、j 分别表示两个个体x 和y 在该位点拥有的四个等位基因“z 七- - 1 ,2 ,3 n ) ,当工和y 个体的两个等位基因分 基于遗传标记的亲缘关系估测方法及遗传参数估测软件研制 别都是同源相同时,即它们有完全相同的基因型0 4 州4 f 或a 呜卅瑚,其相似性指 数驴l ;当两个个体的四个等位基因有三个同源相同时a 4 ,- 4 4 ,) ,其相似性指数 为驴0 7 5 :当两个个体分别只有一个等位基因同源相同时似琦0 4 0 ,相似性指 数为驴0 5 :当两个个体的四个等位基因都不是同源相同的时候,相似性指数为 岛为0 。 岛指的是随机交配群体中不相关个体之间的某个位点的相似性指数的期望值, 表示为:s o2 :。p ? ( 2 一p ,其中p i 表示等位基因f 的基因频率。 2 2 2 q u e l l e r 和g o o d n i g h t 的模型 q u e l l e r 和g o o d n i g h t s ( 1 9 8 9 ) 提出估测随机交配的大群体中两个个体之间的相关 度,以下简称为q g 模型。模型公式如下: :一0 5 q l 。+ s 耐+ s 6 c + s 鲥) 一p 。一p 6,删一 。 l + s n 6 一p n p b ( 4 a ) 假设个体工和个体少某一个位点上分别有等位基因a b 和c ,d 。( 4 a ) 式是以j 个体为参考个体的估测模型,其中勖为指示变量( i n d i c a t o rv a r i a b l e ) ( i ,j = a ,b ,c 或d ) , 其取值是由两个体在该位点的等位基因的同源性所决定,如果i 和j 同态相同,那 么勋= 1 ,否则曲= o 。例如:z 个体为纯合子,则a = b ,所以品6 = l ;若是a - c , 则s a cl 。其中,胁和胁分别为等位基因a 和b 的基因频率。 当以j ,个体为参考个体的时候,( 4 a ) 式中的6 替换为勋,胁和办分别替换为 p 。和肋,可得出: 元,:塑墅譬掣过墨虹( 4 b ) 肛 l + s 叫一p c p d 、7 最后取( 4 a ) 和( 4 b ) 两式的算术平均数,所得即是工和y 之间的相关度。 2 2 3r i t l a n d 的模型 r i t l a n d ( 1 9 9 6 b ) 通过考虑某个位点上的,1 个等位基因可能的出现的概率,综合它 们提供的差异信息,将观测到的数据归类为一个 维的数组,第i 个元素西( 卢l 、2 、 3 n ) 的取值如下:当两个个体在该位点的四个等位基因最多只含有一个i 基因时, s i = 0 ;当两个个体分别各含有一个i 基因时,墨= o 2 5 ;当两个个体含有三个i 基因 9 华中农业大学2 0 0 8 届硕士学位论文 丢上n - 1 l k l - - ip tj 一 四 厂矽= | i72 i 1i i,、 其中,其中p f 表示等位基因i 的基因频率o = j ,2 ,3 ,以) 。 2 2 4 l y n c h 和r i t l a n d 的模型 值,将这两个参数带入( 2 ) 式中,即可得出两个个体之间的相关度,此为l y n c h 和 确,= 哗高跨舻 其中,指示变量曲“j = 珥6 ,c 或回与( 4 a ) 式中的取值是一致的。p 口和肋分别为 础) 2 南5 一 赫去知咖) 形,= w ,( f ) = i ( 9 ) 同理,衄模型与q g 模型相似,当以y 个体为参照个体的时候,可以得出一个 伽,取两者的平均数,即是最后两个个体的相关度,。 1 0 纂予遗传标记的亲缘关系估测方法及遗传参数估测软件研制 2 2 5 w a n g 的模型 w a n g ( 2 0 0 2 ) 希l j 用l y n c h 和r i t l a n d ( 1 9 9 9 ) 提出的个体相关度定义,按照q u e l l e r 和g o o d n i g h t s ( 1 9 8 9 ) 提出的相似性指数。将两个个体的基因型组合分为四大类,然 后根据各种基因型组合出现的条件概率计算相关度参数疹和么,最后带入( 2 ) 式1 1 1 j - - i 褥出计算结果。这就是w a n g ( 2 0 0 2 ) 提趣的两位点四等位基因估测模型,以下简称为 妙模型。两个参数妒和么分别为: ;:j 够酩+ g x l 卅却+ 厂) ( 怠一t ) 瑚一6 妇m 卅m 删怠= 卜0 6 妊( 1 6 一厂) + d ( c + g ) 】怠 a = y o o a ) 【l o b ) 其中 r = 0 6 ) 2 g 2 f + d 9 2 ) 一o 一6 胁一妇) 2 + 2 阿( 1 一西妇+ p ) + c 2 矽0 + f ) ( 1 0 c ) 上面三式中,p ,p 2 ,e j 和n 分别指的是四种基因型组合发生的概率,且p ,+ 局+ 岛+ t 4 = 1 ,实际观测到的两个个体的基因型组合只能是这四种类型中的一种, 所以其中一个概率是1 ,其它的就全部为0 。例如,当瘸测到么西囊西基因型组合 时,那么髓= l ,蔼e 2 = p j = p r = 0 。 觑c 西只,g 分别是基因频率功效之和a 小( m :2 ,3 ,4 ) 的函数。其中露辨= :t p , 鼽表示等位基因i 的基因频率。 将参数痧和么带入( 2 ) 式,可以求得某个位点i 两个个体之闻的相关度r 力。位 点的加权值为:硼) = 2 a :一露,。对各位点计算的相关度进行加权,将哟和w g ) 带入( 8 ) 和( 9 ) 式,即可求出最后的相关度。 2 2 6 相关软件的研发现状 目前,在国外有研究人员已经开发出了相关的计算软件,例如基于矿模型设计 y 、|o磋川 b 铲 + 弓 、, , 谚, 嬉 一,一 1 够, 露 吖 何 d 、l l , 一, 一 妇 。足 + 汁 2 j 咎代r x 矿观谚 、厂 o 2卜。 办, 筋 一 l, 卜 弓 露 暑叉 气矿h 可 r 伽 够 w 华中农业大学2 0 0 8 届硕士学位论文 的m e r 软件和由r i t l a n d 开发的m a r k 软件等。它们有一个共同的特点,就是都 是用f o r t r a n 语言编写的。f o r t r a n 虽然在进行科学计算的设计上具有优势, 但是在界面的设计上明显存在许多弊端。m e r 软件的计算程序是在d o s 中运行的, 它没有人机交互界面,而且其输入输出的数据文件都是固定在某个位置,用户需要 首先要按照一定的格式填写好输入的数据,然后运行主程序,之后再打开结果文件 读取计算结果。而m a r k 软件的主界面的设计显的很单调、视觉效果较差。而且 其数据文件的格式很复杂,稍微有点不注意就会导致程序运行出错。此外,其计算 过程以及结果的输出都显的人机交互性不强。 任何发展和创新都是以人为本的。随着计算机技术及其语言的发展,具有高效 人机交互性的应用软件是一个发展的必然趋势。f o r t r a n 语言虽然在科学计算方 面具有优势,但是忽略了人的因素,其开发的软件并不方便用户的使用。采用基于 w i n d o w s 系统的v i s u a lb a s i c 语言进行开发设计,不仅能够适应大多数用户的系统 环境,而且其可视化的程序设计也能为开发者提供高效快捷的开发环境。v i s u a l b a s i c 语言在进行科学计算的程序设计时,虽然略显繁冗,但是由它设计的高效人 机交互系统能够进行弥补,所以利用v i s u a lb a s i c 语言对计算模型进行设计是比较 理想的选择。 2 3 各种模型的估测瓶颈 从模型的估测公式来看,q g 、l r 和r 三个模型都有一个很大缺陷,就是在 某些特殊的情况下,其相关度估测的结果没有任何意义( c a s t e e l e ,e ta 1 ,2 0 0 1 ;) 。如: q g 模型在双等位基因位点下( 只手尸6 - - 1 ) ,且当参考个体为杂合体( & 6 = o ) 的时候, 其估测模型的分母为0 ,计算结果在数学上没有意义,所以q g 模型只能用于多等 位基因位点:职模型在双等位基因位点下,当参考个体为杂合体( 品6 = 0 ) ,而且基 因频率都相等的时候( 只= p 6 = o 5 ) ,其估测模型的分母也等于o ;对于r 模型,当 基因频率为0 5 或o 2 5 的时候,其估测模型的有些公式也是无意义的。而且对于上 面三个模型,当基因频率非常接近这些值的时候,导致分母很接近0 ,继而使得这 三个模型的估测结果非常大( k a t a l i n ,e ta 1 ,2 0 0 6 ) 。 从模型估测结果的取值范围来看( r i t l a n d ,2 0 0 5 ) ,l l 模型估测的相关度不会大 于l ,但是当观测到的值小于岛,其估测结果就会小于o ;和q g 模型的估测 的相关度也不会大于l ,但是同样会小于0 1l r 和r 两个模型估测的相关度则既有 1 2 基于遗传标记的亲缘关系估测方法及遗传参数估测软件研制 可能大于l ,也可能小于0 ( p i e t e r , e ta 1 ,2 0 0 6 ) 。 在模型的加权来看,比和q g 两个模型使用了相等的加权( 实际上没有使用加 权) ,估测的样本方差很大,这种方法显然不可取( r i t l a n d ,2 0 0 4 ) 。r 模型和尺模型 则是在假设估测相关度的两个体不相关的前提下获得加权的,尺模型使用等位基因 的数目作为该位点的加权,对于一个位点有以个等位基因,将有2 组n ( n + 5 ) 2 个计 算加权的线性方程( w a n g ,2 0 0 2 ) 。而衄模型在某一个位点的特定加权就是这两个个 体间相关度的方差的倒数。虽然在某种程度上降低了非亲属个体间的样本方差,但 是在某些情况下,反而还会增加估测的样本方差( w a n g , 2 0 0 4 ) 。 综上所述,通过分析各个模型的特征以及比较它们估测相关度的样本方差,发 现各个模型在不同的因素下,都有可能出现较大的样本方差,这里一部分原因来自 模型本身的计算设计,还有一个很大的原因就是对每个位点计算的相关度如何进行 加权。进一步的研究有望在以下几个方面展开: 首先,解决模型在估测上的误区。理想的估测模型应该在双等位基因位点和多 等位基因位点都能够很好的进行估测,而且也不受估测个体的基因型以及某些特殊 的基因频率的影响。 其次,随机群体中个体之间的相关度在一定范围内应该是连续分布的,而且这 个范围应该是0 与1 之间,包括两个端点,估测的相关度若是大于l 或小于0 ,都 认为是不合理的估测结果。所以让估测的相关度返回其真实的范围也是我们努力改 进的一个重要方面。 再次,由于在实际应用中,通常包含有多个标记位点的信息,因此必须对多个 位点进行综合估测,为了消除各个位点之间的差异,必须对每个位点估测的相关度 进行加权。上述五个模型中的加权只是在一定程度上,降低了某些因素的影响,因 此综合多方面的因素,建立一套完善的加权法则也是很重要的。 最后,在进行蒙特卡罗模拟的时候,对部分因素都进行了固定,而且在变量因 素的取值上面也没有一定的限度,这一点使得人们在使用这套方法的时候会产生系 统误差,从而影响估测的样本方差的准确性,不能正确反映各个模型的性能。所以 有必要对这一套评价标准进行对照研究和改进。 华中农业大学2 0 0 8 届硕士学位论文 2 4 研究目的意义 个体间相关度研究能够反映个体之间的亲缘关系,在近期可望在以下几个方面 有益于解决畜牧上的相关问题: 2 4 1 应用于估测群体遗传参数 首先,通过分子标记估测出群体中个体之间的相关度,可用于进一步研究群体 结构,尤其是估计群体的各种遗传参数( c r o w , e ta 1 ,1 9 7 0 ) 。r i t l a n d ( 2 0 0 0 ) 禾l j 用分子标 记推测的相关度来估测某些状的遗传力;h a r d y ( 1 9 9 9 ) 、l y n c h ( 1 9 9 9 ) 和o l i v i e r ( 2 0 0 3 ) 等用于估测连续分布群体的遗传隔离距离( i s o l a t i o nb yd i s t a n c e ) ;这一点对于育种工 作具有很重要的指导意义( k e n ,1 9 9 3 ) 。 2 4 2 应用于保种遗传学 个体间相关度的测定在保种遗传学( c o n s e r v a t i o ng e n e t i c s ) 中起着重要作用 ( w r i g h t ,1 9 5 1 ;j a c q u a r d ,1 9 7 4 ) 。在育种群中,如果父母代是直接由野生个体或是由遗 传关系不明确的个体繁殖而来的,那么它们之间的亲缘关系只能通过分子标记的信 息推论出来( a v i s e ,1 9 9 5 ) ,通过分子标记估测个体之间的相关度可以重构个体之间 的亲缘关系,为育种群制定有效的选配计划,降低群体中近亲交配发生的概率,防 治近交衰退( i n b r e e d i n gd e p r e s s i o n ) ( f u ,e ta 1 ,19 9 6 ) ,减少由于随机遗传漂变( r a n d o m g e n e t i cd r i t t ) 弓l 起的遗传突变,为动物育种提供有效的理论保障。 2 4 3 应用于研究动物的社会进化学 个体间的相关度在社会行为进化学( e v o l u t i o no fs o c i a lb e h a v i o r ) 也有重要应用 价值。这方面的研究主要集中在h a m i l t o n ( 1 9 6 4 ) 的亲缘选择( k i ns e l e c t i o n ) 理论。由 于大多数这种研究使用的群体中,有亲缘关系的个体的所占的百分比不易通过观察 获得,所以还是要通过分子标记进行间接的估测个体之间的亲缘选择。亲属选择理 论展示了亲属之问的协作行为是如何进化的。此外,还可以拓展到研究野生的群居 动物,例如:研究群居昆虫群体的亲属选择( h a m i l t o n ,1 9 6 4 ) 。 1 4 基于遗传标记的亲缘关系估测方法及遗传参数估测软件研制 第二章材料与方法 月i j 吾 由于本研究的主要涉及数量遗传学,统计学和计算机编程方面的知识,对于试 验材料也没有太多要求。现代计算机技术及其网络技术的高速发展,为本研究提供 了优越的硬件和软件环境。 1 试验材料 1 1 开发语言 开发语言:m i c r o s o f tv i s u a lb a s i c6 0p r o f e s s i o n a l 编程模式:模块化、可扩展性设计 1 2 硬件环境 1 2 1 计算机 主板:j e t w a y9 4 5 g z c p u :i n t e lc e l e r o nd2 6 6 g h z 内存:5 1 2 m b 硬盘:8 0 g b 1 2 2 服务器 使用虚拟主机技术构建网络服务环境,实现试验程序的网络功能。首先,建立 网络互动平台,用户可以通过平台浏览相关信息和进行交流沟通;其次,用户可以 利用试验程序导入自己的数据,实现在线实时估测;再次,用户可以利用网络程序 获得大量的模拟数据,可以保留也可以对各个模型进行估测、比较和评价。 1 3 软件环境 操作系统:w i n d o w sx pp r o f e s s i o n a ls e r v i c ep a c k2 网络语言:v i s u a lb a s i c n e t 、a s p 服务器组合配置:w i n 2 0 0 0 x p 2 0 0 3 + a p c h e + p h p + m y s q l + p y t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论