已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 重组率在遗传连锁分析中起着非常关键的作用,尤其是在建立连锁图谱进行 基因定位时,对重组率进行统计推断是一个必不可少的环节遗传学中连锁分析 是指通过对基因数据的分析在基因组上去寻找感兴趣的基因的位置人类基因组 测序工作的完成,为寻找感兴趣的基因提供了很多已知的标记位点目前,科学家 们已经定位了许多单基因疾病的位点,并且每年都有新的发现基因定位本质上 就是对基因组上一个给定的标记位置,利用统计方法确定感兴趣的性状位点距离 这个标记位置有多远从统计学的角度来讲就是要估计重组率,从而确定两个位 点间的距离,这个距离可以经图谱函数由重组率转换而来;或者做假设检验来回 答这个感兴趣的性状位点是否与已知的标记位点比较近这一问题然而目前已有 的有关重组率的推断方法几乎没有考虑到重组率自身应该满足的一些自然而又必 要的约束条件,忽略了这些约束势必会对遗传学中的统计推断带来影响,最终会 导致与实际不相符的结论出现本文的主要工作之一就是强调了重组率应满足的 一些自然且必要的约束条件,给出了这些约束下的两位点重组率的统计推断方法; 此外,本文还考虑了远交群体中的连锁分析和数量性状位点定位中的统计推断问 题 本文首先就相型信息未知的三回交家庭情况进行讨论,并给出了在一些自然 的不等式约束下的重组率推断方法针对每个观测家庭有两个后代时,我们提出 了一种约束期望最大化( e m ) 算法,称之为r e m 算法鉴于多个观测后代能提 供更多的信息,我们把所研究的问题推广到了多后代情形,并给出了任意后代个 数时表型的分类方法和分类数公式;同时我们推广了不同相型的等概率先验假设, 结果显示我们提出的r e m 算法是适合于多种情况的一种通用的算法其次,我们 还介绍了远交群体中连锁分析所关心的问题以及解决办法最后,本文就当前比 较流行的数量性状位点定位进行了一些研究,考虑了基因组上存在交换干扰时数 量性状位点的区问定位问题我们通过模拟研究或实例分析考察了上述各种方法 t 在应用中的可行性,并且通过和其他方法的模拟比较研究分析了其优劣性无论 是理论分析还是模拟研究都显示我们的方法在实际应用中是可行的,而且还能提 高重组率推断的效率 关键词:重组率;基因型效应;连锁分析;模型选择;数量性状;最大似然方 法;b a y e s i a n 方法 a b s t r a c t r e c o m b i n a t i o nf r a c t i o np l a y sav e r yi m p o r t a n tr o l ei ng e n e t i cl i n k a g ea n a l y s i s e s p e c i a l l y , i nt h eh n k a g em a pc o n s t r u c t i n ga n d g e n em a p p i n g ,t h es t a t i s t i c a li n f e 卜 e n c ef o rr e c o m b i n a t i o nf r a c t i o ni sa nn e c e s s a r ys t e p g e n e t i cl i n k a g ea n a l y s i sr e f e r 8 t od e t e r m i n i n gt h ec h r o m o s o m a ll o c a t i o no ft h eg e n e ( s ) f o rat r a i to fi n t e r e s ts u c h 2 l sac o m m o nd i s e a s eb yt h ea n a l y s i so fg e n ed a t a w i t ht h cf u l f i l l m e n to fh u m a n g e n o m es e q u e n c i n g ,p e o p l eh a v ef o u n dm a n ym a r k e rl o c it h a tc a nb eu s e dt od e t e c t g e n e so fi n t e r e s t s of a r ,s c i e n t i s t sh a v em a p p e dm a n yl o c io fs i n g l e g e n ed i s e a s e a n do b t a i n e dn e wd i s c o v e r i e se v e r yy e a r ab a s i cp r o b l e mi ng e n e m a p p i n gi st o d e t e r m i n eh o wf a ri st h et r a i tl o c u sf r o mt h em a r k e rl o c u sb ys t a t i s t i c a lm e t h o d s g w e nac o n c r e t em a r k e rl o c a t i o n f r o ms t a t i s t i c a la s p e c t ,i tn e e d st oe 8 t i m a t er e h c o m b i n a t i o nf r a c t i o n ,s ot h a tt h ed i s t a n c eb e t w e e nt h et w ol o c ic a nb ed e t e r m i n e d a n dt h ed i s t a n c ec a l lb et r a n s f o r m e db yr e c o m b i n a t i o nf r a c t i o nu s i n g m a pf u n c t i o n : o ri tc a nb ea n s w e r e db yt e s t i n gh y p o t h e s e sw h e t h e rt h et r a i tl o c u si sf a r t h e rf r o m t h em a r k e rl o c u s h o w e v e r ,i na l m o s ta l lo ft h ee x i s t i n gs t u d i e s o fl i n k a g ea n a l y s i s a n dg e n em a p p i n gs o m en a t u r a la n dn e c e s s a r yr e s t r i c t i o n so np a r a m e t e r sh a v en o t b e e nc o n s i d e r e ds u f f i c i e n t l y n e g l e c t i n gt h e s er e s t r i c t i o n sm u s ta g e c tt h e s t a t i s t i c a l i n f e r e n c ei ng e n e t i c s ,s ot h a ti l l e g i m a t er e s u l t so f t e n a p p e a r t h i sd i s s e r t a t i o na i l i l 8 t oe m p h a s i z et h en a t u r a lr e s t r i c t i o n so nr e c o m b i n a t i o nf r a c t i o n s ,a n dp r o p o s e st h e s t a t i s t i c a li n f e r e n c em e t h o d sf o rr e c o m b i n a t i o nf r a c t i o n su n d e rt h er e s t r i c t i o n s :i n a d d i t i o n ,w ea l s oc o n s i d e rt h ep r o b l e mo fq u a n t i t a t i v et r a i tl o c i ( q t l ) m a p p i n g , a n dl i n k a g ea n a l y s i si no u t c r o s s i n gp o p u l a t i o n i nt h i sd i s s e r t a t i o n ,w ef i r s td i s c u s st h et h r e e - l o c u sl i n k a g ea l l a l y s i so fd h a s e - u n k n o w nt r i p l eb a c k c r o s s ,a n dp r e s e n ta ni n f e r e n c em e t h o df b rr e c o m b i n a t i o nf a c t i o nu n d e rr e s t r i c t i o n s f o rt w o - o f f s p r i n gf a m i l i e s ,w ed e v e l o par e s t r i c t e de x p e c t 孙 t i o nm a x i m i z a t i o n ( e m ) a l g o r i t h m ,c a l l e dr e m w h e r e a sm o r e o f f s p r i n gi ne a c h i i t f a m i l yw i l lp r o v i d em o r ei n f o r m a t i o ni nh n k a g ea n a l y s i s ,w ee x t e n dt h er e ma l - g o r i t h mt oe a s e so fm u l t i p l eo f f s p r i n g ( s i b s h i p ) i ne a c hf a m i l y , g i v eam e t h o df o r o f f s p r i n gp h e n o t y p ec l a s s i f i c a t i o no fm u l t i p l eo f f s p r i n gf a m i l y , a n dp r e s e n tae x p l i c i t f o r m u l ao ft h en u m b e ro ft h eo f f s p r i n gp h e n o t y p ec l a s ! s i f i c a t i o n ;w ea l s oc o n s i d e r t h ec a s eo fu n e q u a lp r i o rp r o b a b i l i t i e so fl i n k a g ep h a s e s ,r e s u l t ss h o w i n gt h a tt h e r e ma l g o r i t h mc a l lb et a k e na sau n i f i e dm e t h o d s e c o n d l y , l i n k a g ea n a l y s i si n o u t c r o s s i n gp o p u l a t i o ni sa l s om e n t i o n e d f i n a l l y , w ep e r f o r ms o m er e s e a r c ho n t h em o r ep o p u l a rq t lm a p p i n g ,c o n s i d e r i n gt h ei n t e r v a lm a p p i n gf o rq t lw h e n c r o s s o v e ri n t e r f e r e n c ei sp r e s e n t w ec a r r yo u ts i m u l a t i o n st oe v a l u a t ea l lt h ep r o - p o s e dm e t h o d s a n dt oc o m p a r et h e mw i t ho t h e rm e t h o d s ,a n dw ea l s oa p p l yo u r m e t h o d st or e a ld a t as u c c e s s f u l l y b o t ht h e o r e t i c a la n dn u m e r i c a ls t u d i e ss h o w t h a to u rp r o p o s e dm e t h o d sw o r kw e l li np r a c t i c ea n dc a ni m p r o v et h ep r e c i s i o no f i n f e r e n c eo fr e c o m b i n a t i o nf r a c t i o n s k e yw o r d s :r e c o m b i n a t i o nf r a c t i o n ;g e n o t y p ee f f e c t s ;h n k a g ea n a l y s i s ;m o d e l s e l e c t i o n ;q u a n t i t a t i v et r a i t ;m a x i m u ml i k e h h o o dm e t h o d ;b a y e s i a nm e t h o d i v 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究 成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经 发表或撰写过的研究成果,也不包含为获得东北师范大学或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了 明确的说明并表示谢意。 学位论文作者签名: 固鸯 嗍 学位论文版权使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东 北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和磁盘,允许论 文被查阅和借阅。本人授权东北师范大学可以将学位论文的全部或部分内容编入有关 数据库进行检索,可以采用影印、缩印或其它复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:敬 日期:美垒笈:! 多 学位论文作者毕业后去向: 工作单位: 通讯地址: 电话: 邮编: 东北师范大学博士学位论文 第一章绪论 1 1 概述 u- 一 世纪之交,人类基因组计划( h u m a ng e n o m ep r o j e c t ,h g p ) 已经取得了决定 性的胜利该计划于1 9 9 0 年正式启动,旨在精确测序由3 0 亿个碱基对构成的人 类基因组序列,发现人类所有的基因,确定这些基因在染色体上的具体位置,并最 终解析所有基因的具体功能人类基因组计划草图于2 0 0 0 年6 月宣告完成,2 0 0 1 年发表了人类基因组初稿,并于2 0 0 3 年宣布全部完成这就意味着从新的世纪开 始,人类基因组的研究将全面进入信息提取和数据分析的高级阶段人类将逐步 解读基因组这部。天书”,研究遗传信息与生物体代谢、分化、发育、进化等之间 的关系,从而更深刻的去认识生命 2 0 世纪7 0 年代以来,分子遗传学研究得到了蓬勃发展,产生了一些崭新的生 物技术如核酸分子杂交技术、d n a 重组技术、d n a 片断或基因片断的聚合酶链反 应技术( p o l y m e r a s ec h a i nr e a c t i o n ,p c r ) 等这些技术为人类基因组的研究提供 了强有力的工具,从而加速了基因组计划的完成,也加快了人类认识生命的脚步 目前人类已经积累了海量的基因组数据,现在有关分子生物学和遗传学的文献每 年都以万篇为基本单位进行增长,而且逐年递增,如此海量的数据也根本无法再 以传统的文献形式来发表,这时欧美等一些国家开始构建大型的数据库以满足存 储数据的要求,如美国于1 9 8 2 年开始运行的核酸数据库g e n b a n k 【1 】,欧洲分子生 物学实验室于同年开始服务的e m b l 数据库等同时,生物数据或遗传数据也是 比较复杂的,这主要是由生物体的结构和功能以及生命活动过程本身的多样性和 复杂性造成的;高维、样本量小也是一些遗传数据的显著特点,而潜在于这些数据 背后的许多重大的统计规律还尚未被发现,因此可以说统计遗传学以及生物信息 1 东北师范大学博士学位论文 学正面临着千载难逢的机遇和十分严峻的挑战,目前也是这些学科迅猛发展的黄 金时段 随着人类基因组计划的完成,人类疾病基因的定位、鉴别与克隆的速度也大 大加快了。现已证实大多数人类疾病都与遗传有关,许多简单的单基因病如多指 病、镰刀型细胞贫血症等的遗传原理已被阐明,但是有许多常见疾病如心脏病、高 血压、糖尿病、精神分裂症等受多个基因的共同控制,其遗传规律较为复杂如 何在整个基因组上认识和研究人类这些常见的复杂疾病,进而在整个基因组上寻 找和定位基因、研究基因与疾病之间的关系以及研究基因与环境如何共同作用导 致疾病成为本世纪亟待解决的问题基因定位( g e n em a p p i n g ) 2 ,3 】已经有了几十 年的研究历史,传统的单基因病的基因定位方法已无法适用于复杂疾病基因的定 位,目前已经产生了许多行之有效的多基因基因定位方法【4 】一f 圳人们在基因组上 已找到了大量的多态性位点,特别是单核苷酸多态性( s n p s ) 位点,这为我们给出 更好的基因定位方法创造了条件基因定位的方法主要有两种:连锁分析( 1 i n k a g e a n a l y s i s ) 方法和关联分析( a s s o c i a t i o na n a l y s i s ) 方法,二者的出发点和考虑对象 有所不同,但本质上并无严格差异【1 1 】重组率在遗传连锁分析中起着非常关键的 作用,无论是建立连锁图谱,还是最终定位基因,对重组率进行统计进行推断是一 个必不可少的环节因此要想更好地利用连锁分析的方法去定位疾病基因,需要 对重组率推断进行更加细致和深刻的研究 本文着重介绍了连锁分析中重组率的推断方法,强调了重组率应满足的一些 自然的约束,并给出了在这些约束下的重组率的推断方法,以及远交群体中的连 锁分析和存在交换干扰时定位数量性状位点的统计推断方法下面我们首先了解 一些必要的背景知识 1 2 遗传学发展简史与统计遗传学研究的重要意义 遗传学( g e n e t i c s ) 是研究生物遗传和变异的一门科学它的任务是通过研究 遗传和变异的现象,深入地去探讨生命的本质,并利用所得成果,能动地改造生 2 东北师范大学博士学位论文 物,更好地为人类服务【1 2 】2 0 世纪以来,社会发展与科技进步促进了生命科学的 的创立和发展经过实践、归纳、演绎和认识论升华,遗传学已经成为生命科学中 的重要学科,在最近二十几年中,其发展速度令世人瞩目 遗传学是在人们的社会生产和实践活动中发展起来的1 9 世纪中叶,达尔文 ( d a r w i n ) 以动植物为对象进行调查研究,总结出以自然选择为中心的进化学说, 出版了不朽的专著( 物种起源,使生物学有了突破性的进展,但其规律尚不能用 数学来概括和抽象,直至2 0 世纪,它还没有成为一门理性的学科,更谈不上我们 今天的遗传学而同一时期的科学家孟德尔( m e n d e l ) 在遗传学上作出了划时代的 贡献他根据前人的经验和自己多年的豌豆杂交试验,提出了遗传学中两大著名的 定律:独立分离定律和自由组合定律,因其巨大贡献被后人誉为遗传学之父1 9 0 9 年乔汉森( j o h a n n s e n ) 第一次把遗传因子称作基因( g e n e ) ,1 9 1 0 年左右,摩尔根 ( m o r g a n ) 的实验组以果蝇为材料研究性状的遗传方式,得到了遗传学中又一重要 定律:连锁交换定律,确定了基因在染色体上呈直线排列这样就逐渐形成了一整 套经典的遗传学理论体系一以遗传的染色体学说为核心的基因论到了2 0 世 纪四五十年代,科学家们通过大量的实验证明了脱氧核糖核酸( d n a ) 是生命的遗 传物质1 9 5 3 年,两位年轻的科学家沃森( w a t s o n ) 和克里克( c r i c k ) 提出了脱氧 核糖核酸的双螺旋分子结构,使得人们开始从分子的水平上去认识和研究遗传和 变异,从而开辟了分子生物学的新纪元,两人因此也获得了1 9 6 2 年的诺贝尔生理 学和医学奖 2 0 世纪以来,生物技术作为人类科技史上最为令人瞩目的高新技术之一,它 为解决疾病预防、食物短缺等一系列问题带来了希望,国际上的科学家公认信息 技术和生物技术是2 1 世纪关系到国家命运的决定性因素在我国悠久的历史中, 传统的生物技术在民族经济中一种发挥着重要作用在旧石器时代的后期,我国 人民就掌握了酒精发酵技术;周代后期,我国人民就能制作豆腐、酿造酱油和醋, 其所用基本技术一直沿用至今;公元1 0 世纪,就有了预防天花的活疫苗,不仅造 福于本国人民,后来还通过著名的丝绸之路传到了欧洲国家( 1 3 当今世界上最为 流行的生物技术主要有核酸分子杂交技术、d n a 重组技术、d n a 片断或基因片 断的聚合酶链反应技术( p o l y m e r a s ec h a i nr e a c t i o n ,p c r ) 等,这些技术都为人类 3 东北师范大学博士学位论文 基因组的研究提供了锐利的工具,从而加速了基因组计划的完成,也加快了人类 认识生命的脚步,相信在“后基因组”( p o s t g e n o m i c s ) 时代一定还会涌现出更多 更新的生物技术 遗传学基于孟德尔遗传法则,而孟德尔法则的产生就在于用概率统计方法分 析了杂交中基因的行为,可见遗传学从诞生之日起,就与数学和统计学有着密不 可分的关系,具有内在的数学美统计学在遗传学的发展过程中一直起着极为重 要的作用,现代统计学的奠基人k p e a r s o n 和r a f i s h e r 都是研究统计遗传学 的大家从孟德尔两大定律到哈代一温伯格平衡( h w e ) 定律,其本身在数学上并 没有多大困难,但是这些定律一经发表之后,就为以后人们利用统计的方法去寻 找致病基因提供了强有力的理论依据 统计遗传学( s t a t i s t i c a lg e n e t i c s ) 是统计学与遗传学有机结合的- - f 交叉学 科它以生物群体为研究对象,依托遗传学的已有知识,运用统计学这件有力的 工具去揭示群体和与个体的遗传学规律、解析遗传学特征、量化逻辑关系,使人 们从更加科学的基础上去认识和理解生命科学 1 4 1 统计遗传学也称生统遗传学 ( b i o m e t r i c a lg e n e t i c s ) f i s h e r 于1 9 1 8 年发表了一篇题为根据孟德尔遗传假说的亲属间相关的研 究的重要文献,文中成功地运用了多基因假设去分析数据,首次将数量变异划分 为各个分量,从而开创了数量性状遗传研究的思路和方法。此后,s w r i g h t 、j b s h a l d a n e 以及k m a t h e r 等人都为统计遗传学体系的构建作出了重大的贡献 到了最近几十年,从事统计遗传学的工作者越来越多,使得遗传学的发展更是日 新月异 在遗传学中,各种现象总是以一定的概率出现的,因此不能以决定论的方式 对观测结果进行解释运用统计遗传学的方法去分析问题,一般分为以下几个步 骤:根据假设对观测数据建立模型、估计模型中参数、检验事先的假设以及结合实 际问题做出合理的解释也就是说它通过必要的量化表达与统计分析将遗传学的 各个学科分支联系在一起,拉近了理论与实际、常规技术与高新技术之间的关系, 对于新基因的挖掘和动植物遗传改良等都具有较高的理论指导与应用价值因而 统计遗传学是- - f 应用性较强的理论学科,具有其它学科无法替代的作用 4 东北师范大学博士学位论文 1 3 重组率推断的重要性与研究现状 在遗传的染色体学说建立之后,当时需要进一步了解的就是染色体与基因之 间的关系,然而每种生物的染色体数目很少,而基因相对很多,因此在当时要解 决这个问题存在一定困难,直至连锁现象的发现,才使该问题得到了逐步的解 决b a t e s o n 和p u n n e t t 在1 9 0 6 年研究香豌豆两对性状的遗传时,发现从同一 亲本来的基因较多的联着一起,这就是所谓基因的连锁而后遗传学工作者又逐 渐证实了染色体上带有很多基因,而且这些基因在染色体上是以直线方式排列的 连锁和重组是相互对应的两个重要概念,简单的说,重组就是指减数分裂过程中 不同位点上基因的重新组合在通常的两对基因的杂交试验中,我们一般都会发 现子二代分离的比例数与期望的比例数9 :3 t3 :l 具有一定差异,即重组合类型 会明显少于亲组合类型,这正说明了有连锁的存在 1 3 1 重组率推断的重要性 重组率指的是两个位点之间发生奇数次交换即发生重组的概率它是用来度 量两个位点在遗传方面相依性的一种测度,进一步还可以用它来衡量两个位点之 间的遗传距离目前国际上有许多学者都在从事重组率推断和基因定位方面的研 究,并且作出了大批的优秀成果,以自己的鲜明特色推动着生命科学的持续和快 速发展下面我们通过图1 3 11 1 5 】具体介绍一下重组的发生过程 从图1 3 1 中,我们可以看到这是一个由父、母和三个孩子所组成的核心家庭, 图中演示了染色体上d 2 s 1 7 8 8 、d 2 s 1 3 4 6 、d 2 s 2 3 2 8 和d 2 s 1 3 5 6 四个基因位点的 重组和连锁情况每个个体在每个位点上的等位基因都由数字标出,而且他们在 两条染色体上的排列情况是明确可知的,即每个个体都对应着两条标有等位基因 代码的染色体片段,其中阴影的一条表示可能携带致病基因方形个体表示男性, 圆形个体表示女性,黑色实心的方形或圆形个体表示处于发病状态我们可以看 到,三个孩子从母亲那里继承的单倍型都是3 1 3 1 ,即在三次减数分裂过程中,母 亲的四个位点都是经连锁形成的配子;而父亲在三次减数分裂过程中形成的三个 5 东北师范大学博士学位论文 d 2 s 1 d 2 s 1 d 2 s 2 d 2 s 1 8 8 4 6 2 8 5 6 46 37 46 旷 、 一, l8 353 6 25 1l i一 豳 图1 3 1 :位点重组示意图 配子则情况不一:对于第一个后代,位点d 2 s 2 3 2 8 和d 2 s 1 3 5 6 间发生了重组,形 成配子4 4 3 5 ;对于第二个后代,位点d 2 s 1 7 8 8 和d 2 s 1 3 4 6 问发生了重组,形成配 子6 4 3 2 ;而对于第三个后代,则是经连锁形成配子4 4 3 2 因而可以初步的估计位 点d 2 s 1 7 8 8 和d 2 s 1 3 4 6 间的重组率为1 3 ,d 2 s 2 3 2 8 和d 2 s 1 3 5 6 问重组率也为 1 3 ,但是要想把重组率估计的更为精确通常都是需要更多的家庭数据,而且在实 际情况中,我们一般只知道每个位点的基因型,不同位点上等位基因在两条染色体 上的排列情况是未知的,这里只是为了演示的目的另外,在该家庭中,父母都未 发病,而三个孩子都表现发病状态,显然这是一种隐性疾病,而且可进一步判断, 疾病位点应该在位点d 2 s 1 3 4 6 或d 2 s 2 3 2 8 ,或者二者共同作用导致疾病 在统计遗传学中,重组率主要是用于刻画遗传距离、构建遗传图谱( g e n e t i c m a p ) 和基因定位从图谱函数( m a pf u n c t i o n ) 我们就可以很清楚地看出重组率 具有刻画遗传距离的作用所谓构建遗传图谱,就是指在染色体上构建一种由标 记位点所组成的图谱,该图谱上标记位点间的顺序以及遗传距离都是已知的,这 里的遗传距离便是由重组率的推断得到的构建遗传图谱的最终目的是为了定位 基因,因为遗传图谱上的标记就好比是染色体这条公路上的路标,如果利用统计 方法能够判断出性状位点距离哪个。路标”近,人们就可以进一步地把它探测到 在基因定位中,重组率更是起着十分重要的作用,它估计的精确与否会直接影响 到能否把决定性状的基因定位在染色体的正确位置上上世纪6 0 年代就已经有学 6 东北师范大学博士学位论文 者研究性状位点与标记位点之间的连锁关系,即检验重组率满足下面哪个假设: h o :p = 0 5 口s h i :0 1 比如说对某一个位点( 随机变量) x ,对于整个 群体来说它的取值是a 或a ( 或者是两个以上的值) ,并且取这两个值的概率都 1 ,我们就称这一现象为多态性,该位点x 称为多态性位点多态性位点在人 类中是普遍存在的,多是由突变导致的对于一个多态性位点来说,我们感兴趣的 是它的信息含量( d e g r e eo fp o l y m o r p h s i m ) ,从信息的角度去理解,我们认为具有 3 种等频率等位基因比具有2 种等频率等位基因的信息含量多我们在做连锁分 析的时候,也经常希望关心的位点是杂合的,就是因为它具有多态性,能够提供连 1 4 东北师范大学博士学位论文 锁信息 遗传标记物( g e n e t i cm a r k e r ) 遗传标记物指的是染色体上位置已定形式已知的多态性位点,它可以是有功 能的或者是没有功能的d n a 片段,在一般的情况下,遗传标记物没有功能,不过 彼此位置很近的d n a 片段容易连在一起传给下一代,因此遗传标记物可以作为 标记物进行基因定位比如说a b o 血型位点,小卫星( v a r i a b l en u m b e ro ft a n d e m r e p e a t s ,v n t r s ) 、微卫星( s h o r tt a n d e mr e p e a t s ,s t r s ) 等等都可作为遗传标记 物,目前最常用的遗传标记物是单核苷酸多态性位点( s n p s ) 基因型( g e n o t y p e ) 在遗传学里,基因型是个体的遗传组成,表示个体从父母得到的所有遗传物 质或特性如果在一个位点上的两个等位基因分别是a 和口,则称个体在该位点 的基因型为a a 如果这个位点上两个等位基因相同,比如说a a 则称为纯合基 因型( h o m o z y g o u sg e n o t y p e ) ,否则称为杂合基因型( h e t e r o z y g o u sg e n o t y p e ) 以 决定人类血型的a b o 位点为例,该位点上有3 种可能的等位基因a ,b 和0 ,这 就决定了人类群体中有6 种基因型,其中a a ,b b 和d d 为纯合的,a b ,a o 和 b d 是杂合的 表现型( p h e n o t y p e ) 表现型或表型指的是生物体的可以观测到的性状的不同形态,例如人的肤色, 身高以及是否患病等等需要注意的是,表型的特征可以是也可以不是遗传导致 的如果个体在一个位点上的基因型为a a ,观测到该个体的表型表现为a 的特 性,则称a 相对于a 是显性的( d o m i n a n t ) ,a 相对于a 是隐性的( r e c e s s i v e ) ; 如果观测到的个体的表型表现的是a 和a 共同的特性,则称a 和a 是共显性的 ( c o d o m i n a n t ) 在上面的a b o 血型的例子中,a 和b 相对于。都表现为显性,a 和b 表现为共显性,这就决定了群体中有4 中血型,a 型,b 型,a b 型和o 型 在统计学里,表型经常被视为连续性或者离散型的随机变量,因此生物性状主要 分为两类,即数量( q u a n t i t a t i v e ) 性状和定性( q u a l i t a t i v e ) 性状前者是指性状 的取值是连续的,相应的遗传位点称为数量性状位点( q t l ) 对于这类性状,通 1 5 东北师范大学博士学位论文 常都是用正态分布去拟合,然而在现有的文献中也有对计数( c o u n t ) 性状和有序 ( o r d i n a l ) 性状的研究,这两类性状也可归到数量性状的范畴定性性状指的是所 有可能的取值只有有限个的性状,例如两值( b i n a r y ) 性状到目前为止,已有大 量文献在研究如何定位控制某数量定性性状的基因位点( 6 4 】, 8 2 】一【8 4 】 多位点基因型( m u l t i l o c u sg e n o t y p e ) 类似于单个位点的情形,比如说我们考虑两个位点,第一个位点上的基因型 为a o ,第二个位点上的基因型为b 6 ,则这两个位点的基因型记为a a b b 需要 注意的是,仅从个体的多位点基因型上看,我们不能判断哪些等位基因是位于同 一条染色体上的如果总共考虑三个位点,设第i 个位点上有仡种可能的等位基 因,则群体共有兀h i ( h 。i + 1 ) 种可能的多位点基因型 i = 1 一 单倍型( h a p l o t y p e ) 单倍型指的是多个位点上位于同一条染色体上的等位基因的组合,相当于单 个位点上的等位基因若我们把一个位点看作是一个随机变量,则l 个位点就可 以视为一随机向量x = ( x ”,虬) 7 ,而单倍型就是这个随机向量的一个可能的 取值【8 5 ,踮】类似于上面的定义,仍考虑三个位点,则群体中共有n 啦种可能的 i = l 单倍型 连锁( 1 i n k a g e ) 用来描述两个位点之间的关系如果两个或两个以上位点间距离比较近的话, 那么在减数分裂过程中发生交叉并且同一条染色体两个位点上的等位基因被分离 的概率就比较小,也就是说这两个位点的等位基因传递给下一代时是不独立的( 比 如说,它们上面的等位基因倾向于一起传递) ,这一生物现象称为连锁 连锁相( 1 i n k a g ep h a s e ) 连锁相指的是同源染色体上紧密连锁的位点上的等位基因的具体排列形式, 连锁相信息告诉我们哪些等位基因位于同一条染色体上因此我们说,多位点基 因型的连锁相是未知的 1 6 东北师范大学博士学位论文 双倍型( d i p l o t y p e ) 一个单倍型对就称为一个双倍型双倍型的连锁相信息是已知的双倍型与 多位点基因型相对应,或者称为连锁相信息已知的基因型从个体的双倍型我们能 够知道哪些等位基因位于同一条染色体上例如,考虑两个位点的基因型a a b b , 如果我们知道a b 在同一条染色体上,则个体的双倍型就是a b a b ,这里a b 和 ll ( 兀7 l i ) ( 兀t i t + 1 ) 口6 是两条单倍型仍考虑l 个位点,则群体中共有上l 一种可能的双倍 型当一个个体的杂合位点多于一个时,根据基因型不能唯一的确定其双倍型设 一个个体有n ( n 1 ) 个杂合位点,则与其基因型匹配的双倍型共有2 _ 1 种 异位显性( e p i s t a s i s ) 异位显性指的是不同位点上的等位基因可能同时影响同一种表型,比如说共 同决定某一种疾病的发生与否,并且他们之问的作用不是简单的可加作用,在统 计学中我们称异位显性作用为交互作用 减数分裂( m e i o s i s ) 减数分裂是指形成配子细胞( 精子或卵子) 染色体的过程减数分裂过程中, 染色体首先要复制一次,然后细胞连续分裂两次而形成单倍体的精子或卵子,通 过受精作用又恢复为二倍体减数分裂过程中同源染色体间发生交换,使配子的 遗传呈现多样化,增加了后代的适应性,因此减数分裂不仅是保证物种染色体数 目稳定的机制,并且也是物种适应环境不断变化的机制 重组( r e c o m b i n a t i o n ) 重组是通过基因重新结合产生配子的过程,具体指的是在给定的减数分裂过 程中,如果配子在两个位点上的遗传基因分别来自不同的祖先染色体,即一个来 自父系,另一个来自母系,我们就说这两个位点发生了重组在高等动物中,重组 通过交换发生,如果两个位点间发生了奇数次交换,则我们就说发生了重组 重组率( r e c o m b i n a t i o nf r a c t i o n ) 重组率表示两个位点a 和b 之间发生奇数次交换的概率,一般记做o a b ( 或 r a b ) 它是用来度量两个位点在遗传方面相依性的一种测度重组率用数学语言可 1 7 东北师范大学博士学位论文 其中i 表示第i 次减数分裂过程,最a ( 或& b ) 表示减数分裂指示器( m e i o s i s i n d i c a t o r ) m ,它是如下定义的一个随机变量, f0 ,第i 次减数分裂中,位点a 继承的是 1 父亲( 或母亲) 的母系基因, 乩a2 1l ,第i 次减数分裂中,位点a 继承的是 l父亲( 或母亲) 的父系基因 在图2 2 1 中,我们用b a y e s 网描绘了一个两后代家庭中一个位点等位基因的分离 和传递过程其中1 1 ,1 0 分别表示父亲的父系基因和母系基因,2 1 ,2 0 分别表示母 亲的父系基因和母系基因,3 1 ,3 0 和4 1 ,4 0 分别表示两个孩子的父系基因和母系基 因,岛3 ,岛,3 为两个亲本指向第一个孩子的减数分裂指示器,研,4 ,岛,4 为两个亲本 指向第二个孩子的减数分裂指示器例如,s 1 3 = l = 令3 1 = 1 1 ,可以看出引进 减数分裂指示器,能把减数分裂过程描绘得更清晰,这为我们利用统计方法分析 遗传学问题奠定了基础 3 0 4 0 图2 2 1 :等位基因分离和传递过程 一般地,0 0 a b 1 2 ,当两个位点距离很近时,o a b 接近0 ,当两个位点距 离比较远我们认为是独立分离的情况下,钆b 接近1 2 ;当位点数多于两个时,也 1 8 zv 、i , 日&长a& “ p i l b钆 为示表 东北师范大学博士学位论文 可以类似的定义多位点的联合重组率,以三位点为例, g l l = p r ( 鼠a & b ,最b s c ) ,vi , 表示位点区间a b 和位点区间b c 同时发生重组的概率,类似的,可以给出夕0 0 ,卯l 和g l o 的定义注意对于多个位点时,两位点重组率之间还应满足一些自然的约束 条件【1 7 鸥1 连锁不平衡( 1 i n k a g ed i s e q u i l i b r i u m ,l d ) 如果群体中单倍型的频率不等于各个位点上等位基因频率的乘积,则称该群 体处于连锁不平衡,否则称为连锁甲衡对于两个位点之间的连锁不平衡,我们 可以用数学语言来描述,令p a ,分别表示第一个位点上等位基因a 和a 的频 率,如,m 分别表示第二个位点上等位基因b 和b 的频率,纵b ,p a b ,p a b ,p 曲分别 表示4 条相应的单倍型的频率,则当群体处于连锁不平衡时有s p a b p a p b , p a b p a p b , p 。b p a p b , p 口b p 。p b 连锁不平衡通常由连锁不平衡系数来度量,根据上面的定义,连锁不平衡系数定 义如下【8 9 】, b a b = p a b p a _ p b , 当以b = 0 时,称群体处于连锁甲衡,而当以日0 时,称群体处于连锁不平衡 从统计上讲,如果以b = 0 ,我们说这两个位点是独立的当然除以b 以外,还有 其它的连锁不平衡系数来度量连锁不平衡 遗传图距( g e n e t i cm a pd i s t a n c e ) 遗传图距是指在一条染色体上,两个位点之间发生交换的平均次数,简称图 距,它是遗统计传学中为了研究的方便而定义的一个相对距离,单位是摩尔根 ( m o r g a n ) 从定义上我们就可以看出遗传图距与重组率之间有一种天然的联系。 这种关系可以通过下面的图谱函数反映出来 1 9 东北师范大学博士学位论文 图谱函数( m a pf u n c t i o n ) 图谱函数是建立图距z 和重组率p 之间关系的一类函数最简单的图函数是 m o r g a n 图函数,它的定义为:z = o ,该图函数形式简单,适用于一段较短的染色 体;另一种常用的图函数是h a l d a n e 图函数,它定义为:z = 一 n ( 1 2 占) 图函 数一般都是单调函数,因此口也可以表示成z 的函数每种图函数都是在一定的 假设下得到的,读者可以参考相关文献 1 7 2 7 1 交换干扰( c r o s s o v e ri n t e r f e r e n c e ) 交换干扰指的是在一条染色体上相邻的位点区间中交换不随机出现的一种现 象如果把两个区问内发生的交换视为两个随机变量,则存在交换干扰意味着这 两个随机变量不独立 遗传力( h e r i t a b i l i t y ) 遗传力是遗传效应与总效应的比值在遗传学里分为广义遗传力( h e r i t a b i l i t y i nt h eb r o a ds e n s e ) 和狭义遗传力( h e r i t a b i l i t yi nt h en a r r o ws
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年社区工作者考试题库及答案
- 小金2025年事业编招聘考试模拟试题及答案解析24
- 卫生管理(副高)高级职称考试题库及答案
- 2024北华大学辅导员招聘笔试真题及答案
- 2025年副高(护理学)考试真题卷一
- 国家职业技能鉴定焊工初级工题库(有答案)
- 2018年二级建造师公路工程考试真题及答案完整版
- 小学六年级课外阅读题及答案
- 圆的周长测试题
- 全国cad技能一级考试样题
- 冬季防冻防烫伤指南
- 【飞瓜数据】2025年休闲零食线上消费市场洞察
- 2025广东深圳市龙岗区国资国企系统面向全市集中选聘中层管理人员考试及考察笔试历年参考题库附带答案详解
- 2025年吉林事业单位招聘考试职业能力倾向测验试卷(石油化工)
- 水利渠道安装光伏施工方案
- 跨部门项目团队沟通记录表
- 2025年高标准农田建设项目第三方质量检测服务方案投标文件(技术方案)
- 实施指南(2025)《JB-T 13116-2017钢丝缠绕式热等静压机》
- 湿包的处理流程
- 学堂在线 中国经济概论 章节测试答案
- 堤防工程施工规范(2025版)
评论
0/150
提交评论