单核苷酸多肽及等位频率_图文_第1页
单核苷酸多肽及等位频率_图文_第2页
单核苷酸多肽及等位频率_图文_第3页
单核苷酸多肽及等位频率_图文_第4页
单核苷酸多肽及等位频率_图文_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、群体遗传学的基本概念与原理-单核苷酸多态及等位频率 摘要:群体遗传学是研究生物群体的遗传结构和遗传结构变化规律的科学,应用数学和统计学的原理和方法研究生物群体中基因频率和基因型频率的变化,以及影响这些变化的环境选择效应、遗传突变作用、迁移及遗传漂变等因素与遗传结构的关系,由此来探讨生物进化的机制并为育种工作提供理论基础。 而利用大分子序列特别是DNA序列变异来进行群体遗传学研究后,人们可以从数量上精确地推知群体的进化演变, 并可检验以往关于长期进化或遗传系统稳定性推论的可靠程度。同时, 对生物群体中同源大分子序列变异式样的研究也使人们开始重新审视达尔文的以“自然选择”为核心的生物进化学说。20

2、世纪60年代末、70年代初,Kimura、King和Jukes相继提出了中性突变的随机漂变学说: 认为多数大分子的进化变异是选择性中性突变随机固定的结果。群体指的是孟德尔群体,即一群相互繁育的个体。一个最大的孟德尔群体是一个物种。一个群体中全部个体所共有的全部基因称为基因库。群体中各种基因的频率,以及由不同的交配体制所带来的各种基因型在数量上的分布称为群体的遗传结构。获知了不同世代中遗传结构的演变方式就可探讨生物的进化过程并据以培育各种新的生物品系和品种。可是群体遗传学并不等同于进化遗传学。后者探讨的是物种内变异转化为物种间变异的过程,即物种的形成和绝灭,而前者则仅仅涉及品系间、品种间和亚种间

3、等的变迁。如果就群体遗传学作历史性地考查,可以认为它是由生物统计学方法结合达尔文的自然选择与孟德尔遗传定律而形成的。群体遗传学的核心是以群体中的突变基因的动态,作为概率过程来进行理论处理的。群体遗传学起源于英国数学家哈迪和德国医学家温伯格于1908年提出的遗传平衡定律。基本内容:1、遗传物质染色体的基本概况 2、单核苷酸多态3、单核苷酸多态的测定及数据格式 4、基因频率与基因型频率 5、全基因组范围内分析SNP应注意的问题 一、染色体的基本概况1、人类基因组的构成人类基因组包含23对染色体,其中22对常染色体(按照染色体长短编码1-22),一对性染色体(男性为X+Y;女性为X+X)。同源染色体

4、的一条来自于父亲,另一条来自于母亲。2、同源染色体与DNA双链同源染色体(homologous chromosomes):是指在二倍体生物细胞中,形态、结构基本相同的染色体,并在减数第一次分裂的四分体时期中彼此联会,最后分开到不同的生殖细胞(即精子、卵细胞)的一对染色体,在这一对染色体中一个来自母方,另一个来自父方。DNA双链:一对同源染色体共包含两条染色体,每一条都是由两条链构成的,每一条链都是由四种碱基排列而成,两条链之间碱基互补配对。这四种碱基为:腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)。其中配对规则是A与T配对、G与C配对,也称之为碱基对(base pair)。3、同源

5、染色体数据的抽象表述 我们通常用A、G、C、T的组合来抽象的表述染色体的碱基排列。由于DNA是双螺旋结构,因此一对同源染色体共包含四条链,即两对互补配对的DNA链。对于其中的一对互补链,只要我们知道一条链的序列碱基排列,就可以依据互补原则确定另一条链的碱基排列。因此对于一对互补链来说,我们只要检测一条链的序列信息即可。这样,一对同源染色体(原本四条序列)就可以用两条序列来表述。以后,我们将用两条由A、G、C、T组合而成的序列代表一对同源染色体。4、物理位置:是将染色体短臂端在上,长臂端在下放置,至上而下计算碱基对的个数,第一个碱基对处为1bp,第二个碱基处为2bp,依次类推。(注:此时假定一对

6、同源染色体等长)。每个位置也成为一个位点。单位换算:1kb=1000bp;1mb=1000kb。二、单核苷酸多态(多为2态SNP)突变率低,一次突变,自然选择使得等位扩增单核苷酸多态性(single nucleotide polymorphism,SNP) 主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种。为了加深理解,可以理解为:突变是一次性历史事件,自然选择使得突变碱基在群体扩张。另外,为了描述方便,我们通过一个示例来进行阐述。例:假定某个人群中有N个个体、某位点原有的碱基为G,则初始状态中任何个体在该位点处均为纯合子G/G,如果该位点发

7、生了一次突变(假设核辐射引起),使得部分个体的G突变为A,则突变个体具有的基因型状态为G/A或者A/A,如果A能够使得个体更适应外部环境(也就是说含有A的个体更容易生存),则A将会在群体中扩张,含有A的个体所占的比例会越来越多。、SNP等位(Allele)从上例中,我们可以看出包含该位点的染色单体共2N条(因为同源染色体,所以乘以2),这2N个染色单体一共有两种碱基类型G和A,每个碱基类型成为一个等位(Allele)。野生型:上例中,G为群体初始状态具有的等位,称为野生型。突变型:上例中,A为突变后新产生的等位,称为突变型。SNP基因型(genotype)对于群体中的每个个体,一对同源染色体中

8、的每条在该位点处的取值为G或A。因此,每个个体的同源染色体在该位点处的相型为G/G(野生型纯合)或G/A(杂合)或A/A(突变型纯合)。、SNP基因型:同源染色体在同一位点的两个等位组成的相型。大多数的单核苷酸多态都是二态的SNP等位的数学抽象:通常用A、a或1、2表示两个等位。SNP基因型的数学抽象:通常用AA,Aa,aa,或0,1,2来表示三个基因型。SNP的数学编码在后面的分析中会经常用到。注:理论上讲,SNP既可能是二等位多态性,也可能是3个或4个等位多态性,但实际上,后两者非常少见,几乎可以忽略。占所有已知多态性的90%以上。SNP数目:人类基因组中SNP的数目还是个未知数,据估计人

9、类所有群体中存在大约3000 万个SNP 位点(平均约每300 600 bp ) 存在一个碱基突变。 SNP以其分布广、易于分型、检查速度快和频率易于估计的特性,作为第三代遗传标记已被广泛的应用。、非同义SNP与同义SNP从对生物的遗传性状的影响上来看,SNP又可分为2种:同义SNP(synonymous SNP):即SNP所致的编码序列的改变并不影响其所翻译的蛋白质的氨基酸序列,突变碱基与未突变碱基的含义相同。非同义SNP(non-synonymous SNP):指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改变,从而影响了蛋白质的功能。、非多态SNP(Nonpolymorphic SN

10、P) 在理解SNP的概念需要注意的一个问题是,SNP是一个群体上的定义。对于多个群体而言,同一个SNP位点在所有的个体中存在两种等位,但在单独的某一个群体中只存在一个等位,此时我们称这个SNP为这个群体中的非多态SNP。、dbSNP中SNP数据的格式:三、单核苷酸多态的测定及数据格式、传统检测方法假定,某个SNP两个等位为T和A,PCR产物大小是:427bp,Kpnl限制性内切酶识别T并将序列切断,对于含有A的序列不切断,经过酶切后的产物是246bp+171bp两个片段。然后片段通过琼脂糖凝胶就会产生一些条带信息,条带信息分为3类:1个条带、2个条带和3个条带。具体表示的分型信息如下(见下图)

11、:(1)如果个体是T/T纯合子,同源染色体PCR产物相同,都含有T,都被酶切断,共形成246bp长度和171bp长度的段,经过扩增后开始电泳,由于长度不同、质量不同导致运动速度不同(短的速度快,长度速度慢),经过一段时间后会形成两个条带。(2)如果个体是T/A杂合子,同源染色体PCR产物为不同的两个,其中含有T的被酶切断,形成246bp长度和171bp长度的段,而含有A的则没有被酶切,长度仍然是427bp,最后的片段共三个长度:246bp、171bp和427bp。经过扩增后开始电泳,经过一段时间后会形成三个条带。(3)如果个体是A/A杂合子,同源染色体PCR产物相同,都含有A,而含有A的没有被酶切断,长度仍然是427bp,最后的片段共一个,长度:427bp。经过扩增后开始电泳,经过一段时间后会形成一个条带。、SNP芯片新一代测序技术指的是高通量测序技术(High-throughput sequencing)又称“下一代”测序技术("Next-generation" sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论