基因组结构、分子标志和检测方法_第1页
基因组结构、分子标志和检测方法_第2页
基因组结构、分子标志和检测方法_第3页
基因组结构、分子标志和检测方法_第4页
基因组结构、分子标志和检测方法_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基因组结构、分子标志和检测方法基因组的C值悖理一、基因组与C值基因组(genome):一个物种单倍体全套染色体的全部DNA序列C值(C value):一个物种单倍体的DNA含量水稻全套单倍染色体DNA序列的分布几种代表性生物的基因组的大小门(phylum)种(Species)C值(C-value)藻类(algae)Pyrenomas salina6.6105bp支原体(mycoplasma)M. pneumoniae1.0106bp细菌(bacterium)E. coli4.2106bp酵母(yeast)S. cerevisiae1.3107bp霉菌(slime mold)D. discoid

2、eum5.4107bp线虫(nematode)C. elegans8.0107bp昆虫(insect)D. melanogaster1.4108bp鸟(bird)G. domesticus1.2109bp两栖动物(amphibian)X. laevis3.1109bp哺乳动物(mammal)H. sapiens3.3109bp(爬行类)(两栖类)(硬骨鱼类)(软骨鱼类)(棘皮类)(甲壳类)(软体动物)(蠕虫类)(霉)(澡)human(7109)(支原体)不同类群生物的C值变化范围每类生物最小基因组的大小基本上对应于生物在进化上所处地位的高低;进化地位高, 形态结构复杂的一类生物,其最小基因组也

3、较大每一类生物的最小基因组比较:二、C值悖理(C value paradox): 指C值的大小并不能完全说明生物进化的程度和遗传复杂性的高低,即物种的C值和它的进化复杂性之间没有严格的对应关系。具体表现在:1.在显花植物内部、两栖类内部、爬虫类内部,不同物种之间尽管结构、功能复杂程度相似,尽管亲缘关系相近,C值却可以相差10倍甚至百倍。两栖类的C值高于进化程度更高、结构和功能更为复杂的哺乳类的C值。 (见图:不同类群生物的C值变化范围)2. C值(基因组DNA含量)高于预期的编码蛋白质基因所需要的DNA含量,两者之间的差异在进化程度高的生物中尤其显著。例如哺乳类的DNA含量可编码40万-60万

4、个基因,但实际上只有3万-4万个基因。 C值悖理现象促使人们探究基因组的结构,即基因组中是否存在基因以外的DNA序列,这些序列具有怎样的组织形式和功能,它们对生物的生存和进化具有怎样的意义,于是诞生了一们新兴的学科基因组学。 基因组学(genomics): 研究生物体基因组的结构组成、稳定性及功能的一门学科。主要包括以下两个方面:结构基因组学(structural genomics):研究基因组的结构,各种遗传元件的序列特征,基因组作图、基因定位乃至整个生物体遗传物质的核苷酸序列的测定等。功能基因组学(functional genomics):研究不同的序列结构具有的不同功能,基因的表达调控,

5、基因与环境之间(包括基因与基因之间,基因与其它DNA序列之间,基因与蛋白质之间)相互作用以及基因对表型的作用等。三、基因组学第二节 原核生物的基因组 结构简单。例如噬菌体的各种基因在基因组中只出现一次 。X174噬菌体甚至存在不同基因共用一部分DNA序列的现象,称为重叠基因。 一、重叠基因(overlapping gene)X174噬菌体的重叠基因二、操纵子(operon)发现大肠杆菌乳糖操纵子的F Jacob(左) 和J Monod(1961)大肠杆菌的乳糖操纵子示意图 原核生物中的细菌,基因组结构略比噬菌体复杂。 1.首先表现在一些功能相关的基因,在染色体上彼此靠近地排列成为操纵子为共同的

6、表达元件所调控。 例如大肠杆菌的乳糖操纵子有3个结构基因串连排列在基因组上,其表达和关闭为共同的启动子和调控序列所调控。 2.操纵子以外的其他基因则多以单一序列存在;但也有例外,例如rRNA基因是一个由7个基因构成的基因簇。3.约75%的染色体DNA用于编码基因,其余25%则是 “基因间DNA。一些基因间DNA具有重要功能,例如细菌染色体的复制起点即在此处。其他基因间区域可能与DNA的包装蛋白相作用。 4.几乎所有基因都在染色体基因组中,只有少数基因位于染色体外DNA。 一、基因在基因组中的组织形式1单一序列 基因组中的大多数基因,只在基因组中出现一次,属于单一序列。大多数结构基因都是这种单一

7、序列,它们具有高度的表达能力。第三节 真核生物的基因组 2. 基因家族 基因家族(gene family)指真核生物基因组中有许多来源相同、结构相似、功能相关的一组基因,它们可归为一个基因家族。 基因家族成员的分布存在两种形式: (1)分别散布在基因组不同部位。如果蝇的肌动蛋白基因家族的成员。 (2)大多数是集中地、彼此靠近地、成串地排列在一起,形成 “基因簇”(gene cluster)。例如人的血红蛋白基因家族成员,形成珠蛋白基因簇和珠蛋白基因簇。 人血红蛋白基因家族上: 基因簇 : 下: 基因簇 基因簇在11号染色体,包括3个活跃基因和2个假基因。基因簇在16号染色体,包括5个活跃基因和

8、一个假基因。chromosome 11chromosome 16GA1人类簇2121人类 簇假基因()与有功能的基因同源,原来可能属有功能的基因,由于缺失、倒位或突变等原因使该基因失去活性而成为无功能的基因。各种生物的组蛋白基因的组织形式3.串联重复基因在基因家族中,DNA序列完全相同或一致性很高的许多基因,串联在一起成为基因簇的,特称为串联重复基因。 (1)组蛋白基因 在真核生物中,组蛋白H1,H2A,H2B,H3,和H4是染色体的重要成分。现在知道,许多真核生物编码这五种组蛋白的基因彼此靠近,构成一个单位;许多这样的单位又串联在一起构成组蛋白的串联重复基因。(2)rRNA基因 高等真核生物

9、一般以200500个拷贝的rRNA基因组成串联重复单位。 rRNA基因的大量转录产生大量rRNA,形成核仁。含有rRNA基因串联重复单位的染色体区域即次缢痕区域。一个细胞核内有多少RNA基因串联重复单位,就会形成多少个核仁。 非洲爪蟾每个卵母细胞中含有几百个核仁(3)tRNA基因 研究比较多的酵母tRNA基因,已知也是串联重复序列,但是不同重复单位中的各个tRNA基因互不相同。 二、基因外序列在基因组中的组织形式根据基因外序列在每个基因组中出现的拷贝数,可将它们分为以下四类。单一序列:主要指在每个基因组只出现1个拷贝的序列。但常将在每个基因组只出现2-3个拷贝的序列也包括在内。低度重复序列:在

10、每个基因组出现2-10个拷贝的序列。中度重复序列:在每个基因组出现10个到几百个拷贝的序列。高度重复序列:在每个基因组出现几百到几百万拷贝的序列。1簇状重复序列(clustered repitative sequence) 高度重复序列中常有一些AT碱基对含量很高的简单序列,例如螃蟹DNA含有简单的AT高度重复序列,以致 AT含量高达97%。 由于AT段的浮力密度比较小,因而在将DNA切成几百个碱基对的片段进行超速离心时,常常会在主要的DNA带的上面出现一个次要的DNA带,这就是通常所说的“卫星DNA”。 这些卫星DNA呈簇状重复,位于着丝粒、端粒等附近的异染色质区,不产生RNA和蛋白质,起着

11、保证染色体正常分配,或维持染色体正常结构的作用。电泳DNA片段时显示的卫星DNA (箭头所指)卫星DNA的分布区域各个异染色质区(图中着色深的区域)着丝粒(亮点) 端粒(染色体两端亮点)端粒区域的DNA示意图端粒示意图卫星DNA的应用 有的簇状重复序列,在一个固定位点出现的重复次数经常是不相同的。这种可变性存在于个体之间,和同一个体的一对同源染色体之间。因此,这些序列被称为变数串联重复序列(简称VNTR)。使用PCR反应能扩增这种VNTR,产物的长度取决于重复序列的重复数。 这种长度的变化可用于鉴定个体之间的差异,和鉴定同一个体一对同源染色体之间的差异,已被广泛应用于法学领域,例如用于排除犯罪

12、嫌疑(或结合其他证据确定罪犯),和用于亲子鉴定等,因而被称为DNA指纹。 DNA指纹技术发明人杰夫里斯利用卫星DNA进行亲子鉴定的基本原理亲子鉴定实验室她们真是母女吗?法医利用DNA指纹鉴定罪犯现场DNA(3)和罪犯DNA(4)DNA指纹曾用于鉴定一个坟墓的墓主是否路易十七本人,从而解决了法国历史上的一个悬案。原来法国资产阶级革命胜利后,路易十六被送上断头台,他的儿子按照王室惯例自动登基。这个尚未成年的路易十七被革命党囚禁,后来病死并被就地安葬。保皇党则宣扬他已越狱逃到了国外,并声称坟墓的主人是他的替身。这事一时成为法国历史上的悬案。到20世纪80年代,法国利用DNA指纹技术才确定了坟墓的主人

13、是路易十七本人。右图是防腐药剂浸泡着的路易十七的心脏,曾被偷运出国和辗转在国外,历史真相大白后才送回法国公开展览。2弥散重复序列(dispersed repitative sequence) 弥散重复序列是指广泛分散在整个基因组的重复序列。它们又可以分为长、短两种:短序列称为“短弥散因子”(short interspersed elements,简称SINEs)。这种序列的长度少于500个碱基对。在基因组中重复出现700 000900 000次,存在于大部分地方,有的甚至存在于基因之中。长的序列称为“长弥散因子”(long interspersed elements,简称LINEs)。一个序列

14、大约含有数千个碱基对,在基因组中重复出现3 0004 000次。以上两种序列的作用还有待进一步研究。基因组的作图,需要利用某种遗传标记表示等位基因的位置。遗传学中通常将可识别的等位基因称为遗传标记(genetic marker)。RFLPAFLPRAPDSSR遗传标记可用于基因的连锁分析、基因定位、遗传作图和基因转移的鉴定。限制性酶消化和分子杂交技术为基础以PCR技术为基础遗传标记形态学标记生化标记分子标记细胞学标记第四节 遗传标记一、形态学标记形态学标记即生物的外部形态特征,如矮秆、白化、变态叶、雄性不育等,就是一种特定的肉眼可见的外部特征。玉米甜粒/非甜粒番茄红果/黄果番茄连萼/非连萼甜椒

15、果色 、果形二、细胞学标记染色体的变化常常会引起某些表型性状的异常,从而可以将染色体的变化作为一种遗传标记,来分析测定基因所在的染色体及相对位置,也可通过染色体置换等进行基因的定位。染色体数目的变化(如单体、缺体、三体、四体)染色体结构的变异(如缺失、易位、倒位、重复等)染色体组型(染色体数目、大小、随体有无、着丝粒位置等)和带型(C带、N带、G带等)人类染色体组型三、生化标记同工酶(isozyme):同一种酶具有多种不同形式,它们催化同样的生化反应。这类结构不同、功能相似的酶称为同工酶。同工酶标记的特点:可用两点或三点测验定位于染色体编码同工酶的等位基因是共显性的同工酶标记的不足:具有组织特

16、异性发现的同工酶标记有限四、分子标记遗传标记多态性形成的分子基础均是基因组DNA的变异,而分子标记所揭示的多态性是直接反映基因组DNA间的差异。(一) 分子标记的优越性直接以DNA的形式表现数量多,遍及整个基因组,检测位点近乎无限多态性高,自然存在着许多等位变异,不需要专门创造特殊的遗传材料表现为“中性”,即不影响目标性状的表达,与不良性状无必然的连锁有许多分子标记表现为共显性(二) 分子标记技术分类第一类是以分子杂交为基础的DNA标记技术,主要有限制性片段长度多态性标记(Restriction fragment length polymorphisms,简称RFLP标记)、可变数目串联重复序

17、列标记(Variable number of tandem repeats,简称VNTR标记)、原位杂交(in situ hybridization)等第二类是以聚合酶链式反应(Polymerase chain reaction,简称PCR反应)为基础的各种DNA指纹技术第三类是一些新型的分子标记,如单核苷酸多态性(Single nucleotide polymorphism,简称SNP),表达序列标签(Expressed sequence stags,简称EST)和反转录转座子(Retro-transposon)等1. RFLP标记RFLP(restriction fragment leng

18、th polymorphism)称为限制性片段长度多态性,是指用限制性内切酶酶切不同个体的基因组DNA后,含有与探针序列同源的酶切片段在长度上的差异基因组DNARestriction enzymedigestionDNA小片段琼脂糖电泳按DNA分子大小顺序分开尼龙膜转移杂交32P探针同源序列结合探针的限制性酶切片段多态性X光片放射自显影(1)RFLP标记的原理电泳检测E1E1P1P2插入、缺失、酶切位点突变等造成DNA片段长度大小的变化P1 P2Probe BProbe AProbe BProbe B Probe AProbe AProbe BProbe AC H H N H N C HH N

19、 H C H H C N1 2 3 4 5 6 7 8Probe BProbe AH N H C H H C NH N H C H H C N1 2 3 4 5 6 7 8Columbia生态型Niederenz生态型F1杂合子表型:CColumbiaNNiederenzH杂合型例1:A与B不连锁例2:A与B连锁子代子代 重组 亲型 亲型 亲型 亲型 亲型(2) RFLP标记的特点无表型效应RFLP标记具有共显性的特点RFLP具有种族特异性RFLP标记范围遍及全基因组(3)RFLP标记不足之处DNA量大(515ug)检测步骤繁琐,需要的仪器、设备较多,周期长用作探针的DNA克隆其制备与存放较麻

20、烦检测中要利用放射性同位素(通常为32P),易造成环境污染虽然也可以用非放射性物质(如Biotin系统,Dig系统及Ecl系统)替代同位素,其杂交信号相对较弱,灵敏度较同位素标记低得多且价格较高1944 - The Nobel Prize in Chemistry 19932. PCR标记PCR是Mullis等(1985)首创的在模板DNA、引物和4种脱氧核糖核苷酸存在的条件下,依赖于DNA聚合酶的体外酶促反应,以合成特异DNA片段的一种方法 , 其特异性取决于引物与模板DNA结合的特异性.genetic moviesPCR动画.movPCR检测DNA多态性的优点(与RFLP相比) :模板DN

21、A用量少对模板DNA纯度要求不高程序简单,分析周期大大缩短PCR的特点3. PCR的扩展单引物PCR标记随机扩增多态性DNA标记(Random amplification polymorphism DNA,简称RAPD标记):引物为10个随机核苷酸组成任意引物PCR标记(Arbitary primer polymerized chained reaction,简称AP-PCR标记): 引物长度与一般PCR引物相当,开始退火温度低允许错配,后正常PCR,具有随机性单重复序列中间区域标记(Inter simple sequence repeats polymorphisms,简称ISSR标记):在

22、SSR引物端加2-4个简并核苷酸组成,具有较好的随机性和稳定性RAPD标记RAPD标记是用随机排列的寡聚脱氧核苷酸单链引物(通常长度为10个核苷酸)通过PCR扩增染色体组中的DNA所获得的长度不同的多态性DNA片段RAPD经典PCR引物个数1对1个5560复性温度36扩增产物特异扩增随机扩增10bp20bp引物长度RAPD与经典PCR区别B. 双引物选择性扩增的PCR标记: 主要通过引物3端碱基的变化获得多态性,这种标记主要指扩增片段长度多态性标记(Amplified fragment length polymorphism),简称AFLP标记)AFLP标记AFLP标记的基本原理基因组DNA双

23、酶切选择(frequent cutter+rare cutter)EcoRIMseI连接(ligase)合成接头、连接合成引物(接头(1-3)选择碱基)选择性扩增变性聚丙烯酰胺凝胶电泳分离扩增产物电泳选择EcoRI EcoRIMseI MseI剔除双酶切EcoR IEcoR IMse IMse I5-GAATTCEcoR I酶切位点AATT-3Mse I酶切位点3-CTTAAGTTAA-5连接上接头的片段选择EcoR I和Mse I的酶切粘性末端的片段5-AATTCA-33-GTTAA-5特定引物接头5-NNNN-33-NNNNTTAA-55-ATTNNNN-33-NNNN-5限制性片段lig

24、ase连接接头5-NNNNAATTCAATTNNNN-33-NNNNTTAAGTTATNNNN-5增加引物选择性碱基 正向引物系列 反向引物系列 扩增片段数目正向0,反向0 5-NNNNAATTC-3 3-TTATNNNN-5 所有正向+1,反向+1 5-NNNNTATTCT-3 3-ATTATNNNN-5 1/4正向+2,反向+1 5-NNNNTATTCTC-3 3-AGTTATNNNN-5 1/16正向+1,反向+2 5-NNNNTATTCT-3 3-AGTTATNNNN-5 1/41/16=1/64选择性引物PCR扩增限制片段C. 需要通过克隆、测序来构建特殊双引物的PCR标记简单序列重

25、复标记(Simple sequence repeats,简称SSR标记)SSR标记Nakamura(1987)发现生物基因组内有一种短的重复次数不同的序列,统称可变数目串联重复序列(Variable number tandem repeat, 简称VNTR )。VNTR标记包括小卫星(minisatellites)标记和微卫星(microsatellites)标记微卫星DNA又称SSR(simple sequence repeats),它是一类由16个碱基组成的基序(motif)串联重复而成的DNA序列,如(CA)n、 (AT)n、(GCT)n、(GATA)n等重复,其中n代表重复次数SSR分

26、子标记的特点数量几乎无限,检测出多态性的频率极高。SSR一般检测的是一个单一的多等位基因位点SSR标记为共显性标记,可鉴别出杂合子和纯合子结果重复性高,稳定可靠。为了提高分辨力,通常使用可检测出单拷贝差异的聚丙烯酰胺凝胶电泳兼具PCR反应的优点,即所需DNA样品量少,对DNA质量要求亦不苛刻 明恢63与珍汕97杂交,回交BC1F1,wx基因SSR图谱1 21.珍汕97 2.明恢634. CAPS标记利用PCR产物专门检测内切酶位点变异间的差异如PCR产物无多态性,通过测序,可能发现它们之一的酶切位点(如EcoR I)具有突变EcoR I电泳5. 单核苷酸多态性(SNP)标记 单核苷酸多态性(S

27、ingle nucleotide polymorphism,SNP)是指不同个体基因组DNA序列之间单个核苷酸的差异。SNP共有4种转换形式CT(GA) 转换最为常见,约占4种SNP转换的2/3。 CA(GT)CG(GC)TA(AT)(1) SNP的分类在基因组DNA中,任何碱基均有可能发生变异,因此SNP既有可能在基因序列内,也有可能在基因序列外。基因组内的SNP分为两种形式:一是遍布于基因组非编码区中的大量单碱基核苷酸变异另一是主要分布于基因编码区内(Coding region)的突变,故又称其为cSNP。从对生物遗传性状的影响上来看,cSNP又可分为两种:一种是同义cSNP(Synony

28、mous cSNP),即SNP导致的突变碱基与未突变碱基在氨基酸密码的变异上属于同义突变,从而使得基因编码序列的改变并不影响其所翻译蛋白质的氨基酸序列的改变;另一种是非同义cSNP (Non-synonymous cSNP),指突变碱基序列的改变导致氨基酸的改变,从而使其蛋白质序列发生改变,影响蛋白质的功能。 (2) SNP的检测方法直接测序法。直接测序对不同个体进行的PCR扩增,然后对扩增片段测序比较是发现SNP的最常用方法。DNA芯片法。检测SNP的最佳方法是新近发展起来的DNA芯片技术。SNPs的大规模发现和识别与DNA芯片技术的发展和应用关系密切。基于生物信息学的SNP候选位点搜索。公

29、共数据库中公布有大量的序列信息,其中包括表达序列标签(ESTs)、序列标签位点(STSs)、cDNA文库和基因组测序DNA序列。在这些序列之间必然存在大量的重叠区域,通过比较这些重叠区域,就可获得大量的SNP,并且成本可以大大降低。(3) SNP作为遗传标记的优越性 位点丰富,数量多,分布广泛具有较高的遗传稳定性易于基因分型SNP适于快速、高通量检出因SNP的二态性,更有利于发展自动化的筛选或检测技术。 6. 插入缺失(InDel)标记 InDel标记是指通过比较基因组学发现不同基因组中缺失或者插入DNA片段,表现出的多态性 InDel标记的设计主要是在插入/缺失片段的两侧设计PCR引物,然后,通过扩增两特定引物之间的片段,从而

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论