版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章
基因与基因组的结构3.1基因的概念3.1.1基因与DNA分子3.1.2基因与多肽链3.2基因命名简介3.3真核生物的断裂基因3.4基因及基因组的大小与C值矛盾3.5重叠基因3.5.1原核生物的重叠基因组3.5.1真核生物的重叠基因3.6基因组3.6.1原核生物的基因组3.6.1真核生物基因组3.7真核生物序列组织3.7.1单拷贝序列3.7.2轻度重复序列、3.7.3中度重复序列3.7.4高度重复序列。3.8基因家族3.8.1基因家族和基因族3.8.2基因外的DNA重复序列3.9人类基因组研究进展3.1基因的概念3.1基因:具有遗传效应的核苷酸序列。它包括编码蛋白质和tRNA、rRNA的结构基因,以及具有调节控制作用的调节基因,是遗传的基本单位。它可以通过复制、转录和翻译,以及不同水平的调节机制,来实现对遗传性状发育的控制。它还可以发生突变和重组。基因研究的历史:①染色体遗传阶段1953年以前②分子生物学阶段1953年以前③反向生物学阶段1972年以后3.1.1基因与DNA分子基因是DNA分子上的功能单位,在染色体或DNA分子上,基因成串排列。3.1.2基因与多肽链基因的碱基序列与蛋白质分子中氨基酸的序列之间的对应关系是通过遗传密码实现的,多肽链是基因的主要编码产物。3.2基因命名简介表示基因3个小写斜体字母,lac---半乳糖苷酶基因表示基因座3个小写斜体字母+1个大写斜体字母。lacZ-----半乳糖苷酶表示质粒自然质粒3个正体字母,首字母大写重组质粒在2个大写字母前面加小写p基因一般为小写斜体lacZ,蛋白质为正体lacZ人类基因为大写斜体3.3真核生物的断裂基因割裂基因的发现:1977,通过成熟mRNA(或cDNA)与编码基因的DNA杂交试验而发现真核生物的基因是不连续的,大大改变了原来对基因结构的看法,现在知道大多数真核生物的基因都是不连续基因或割裂基因(splitgene)。割裂基因的概念:编码序列在DNA分子上不连续排列而被不编码的序列所隔开的基因。构成割裂基因的DNA序列被分为两类:基因中编码的序列称为外显子(exon),外显子是基因中对应于信使RNA序列的区域;不编码的间隔序列称为内含子(intron),内含子是从信使RNA中消失的区域。割裂基因由一系列交替存在的外显子和内含子构成,基因两端起始和结束于外显子,对应于其转录产物RNA的5’和3’端。如果一个基因有n个内含子,则相应地含有n+1个外显子。割裂基因的性质割裂基因的性质a)真核生物(Eukaryots)中普遍存在绝大部分结构基因tDNA,rDNA、mtDNA,cpDNA但在酵母基因组中大部分不是割裂基因。b)原核生物(Prokaryots)中很少见古细菌、大肠杆菌的噬菌体为割裂基因外显子和内含子的特点:割裂基因的外显子在基因中的排列顺序和它在成熟mRNA产物中的排列顺序是相同的;某种割裂基因在所有组织中都具有相同的内含子成分;核基因的内含子通常在所有的可读框中都含有无义密码子(nonsensecodon),因此一般没有编码功能。内含子上发生的突变不能影响蛋白质的结构,所以其突变往往对生物体是没有影响的;
但也有例外,例如一些发生在内含子上的突变可通过抑制外显子的相互剪接阻止信使RNA的产生。利用结构基因的特殊DNA限制片段作为探针,我们可以检测基因组中与之有亲缘关系的序列,结果表明一个基因的外显子常与其他基因的外显子有亲缘关系。两个相关基因内含子之间的亲缘关系远远不如其外显子之间的亲缘关系紧密。这是因为在进化过程中,相关基因的内含子比外显子变化得更快。Splittinggene概念的相对性a)Intron并非“含而不露”Yeast细胞色素b基因IntronII编码成熟酶b)Exon并非“表里如一”人类尿激酶原基因ExonI不编码氨基酸序列c)
并非真核生物所有的结构基因均为splittinggeneHistonegenefamily(组蛋白)干扰素Yeast中多数基因(酵母)3.4基因及基因组的大小与C值矛盾由于割裂基因的存在,人们认识到基因比实际编码蛋白质的序列要大得多。外显子的大小与基因的大小没有必然的联系。不同种类的生物体中外显子的大小并没有明显的不同,基因可能是由一些小的、编码较小的独立蛋白质分区的单位在进化过程中加合起来的。基因的大小取决于它所包含的内含子的长度内含子之间有很大不同,它们的大小从200个碱基对左右到上万个碱基对。在一些极端的例子里,甚至有50-60kb的内含子。由于基因的大小取决于内含子的长度和数目,导致酵母和高等真核生物的基因大小有很大的不同。大多数酵母基因小于2kb,很少有超过5kb的。与此相反,在高等的真核生物中,开始出现长的基因,蝇类和哺乳动物基因很少小于2kb,大多数长度在5~100kb之间。但当基因的长度大到一定程度后,DNA的复杂性与生物体的复杂性之间开始失去必然的联系。例如虽然属于同一个门,果蝇细胞的DNA总量较小而家蝇细胞的DNA总量却是它的6倍。3.4基因及基因组的大小与C值矛盾基因组狭义:单倍体细胞中的全套染色体(人:22条常染色体+X,Y+线粒体DNA)。广义:一物种的全部遗传物质及其携带的遗传信息。人类染色体的编号人体细胞:男女均46条,含2个染色体组是二倍体。含有2个基因组。人类染色体数量一个单倍体基因组的全部DNA含量总是恒定的。这是物种的一个特征,通常称为该物种的C值,以pg表示(1pg=10-12g)。不同物种的C值差异很大,最小的枝原体只有直106bp,而最大的如某些显花植物和两栖动物可达1011bp。Rangeofgenomesizeindifferentphyla门
由图表可见,随着生物的进化,生物体的结构和功能越来越复杂,其C值就越大,例如真菌和高等植物同属于真核生物,而后者的C值就大得多。这一点是不难理解的,因为结构和功能越复杂,需要的基因产物的种类越多,也就是说需要的基因越多,因而C值越大然而另一方面,随着进一步的进化,生物体复杂性和DNA含量之间的关系变模糊了,出现了很多令人不解的现象。一些生物类群基因组大小的变化范围很窄,而另一些类群的变化范围则很宽。突出的例子是两栖动物,C值小的可以低至109bp以下,C值大的可以高达1011bp。而哺乳动物的C值均为109bp的数量级。人们很难相信不同的两栖动物,所需基因的数量会有100倍的差别,而且两栖动物的结构和功能会比哺乳动物更复杂。由于人们无法用已知功能来解释基因组的DNA含量,所以产生了C值矛盾(Cvalueparadox,又称C值悖理)。它表现在两个方面:一个方面是,与预期的编码蛋白质的基因的数量相比,基因组DNA的含量过多。另一个方面是一些物种之间的复杂性变化范围并不大,但是C值却有很大的变化范围。这些问题的解决有待于进一步的研究。C值矛盾:真核生物中DNA含量与其进化地位不一致的反常现象。主要表现在:C值不随生物的进化程度和复杂性而增加,如肺鱼为112.2,而人为3.2;亲缘关系密切的生物C值相差很大,如豌豆为4,而蚕豆为2;高等真核生物具有比用于遗传高得多的C值,如人的染色体DNA含量在理论上包含300万个基因,但有实际用途的基因只有5万~10万个。3.5重叠基因3.5.1原核生物的重叠基因组原核生物的重叠基因(overlappinggene)在细胞基因中,一般一段DNA序列只以三种蛋白质可读框的一种被阅读,但是在一些病毒或线粒体基因中,两个邻近的基因以一种巧妙的方式发生重叠,并以不同的可读框被阅读并表达,因此一段相同的DNA序列可以编码两个非同源蛋白质。φXl74的DNA序列组织上有重叠基因(overlap-pinggene)和基因内基因基因内基因部分重叠基因一个碱基重叠重叠基因有以下几种情况:一个基因完全在另一个基因内部如:B和A*E和D其读码结构互不相同基因内基因部分重叠基因3.5.2真核生物的重叠基因通常割裂基因的每个外显子编码一段单一的氨基酸序列,对应于整个蛋白质上的相应部分,而内含子不在最终的蛋白质产物中表达,二者的作用是迥然不同的。但是有些基因中内含子和外显子的定义是相对的,与它表达的途径有关。在这些基因中,选择性的基因表达模式引起了外显子连接途径的转变。一个特定的外显子可能选择性地与不同的外显子连接形成信使RNA。这种选择性形式产生的两种蛋白质中,一部分相同而其他部分不同。一段区域以一种途径表达时作为外显子,而以另一种途径表达时作为内含子。因为此时一段DNA序列通常以多种方式起作用,所以不能被简单地称为外显子或内含子。3.6基因组3.6.1原核生物的染色体基因3.6.1真核生物基因组3.7真核生物序列组织3.7.1单拷贝序列3.7.2轻度重复序列、3.7.3中度重复序列3.7.4高度重复序列。3.8基因家族3.8.1基因家族和基因族3.8.2基因外的DNA重复序列卫星DNA、分散重复的DNA序列3.9人类基因组研究进展3.6基因组基因组狭义:单倍体细胞中的全套染色体(人:22条常染色体+X,Y+线粒体DNA)。广义:一物种的全部遗传物质及其携带的遗传信息。3.6.1原核生物的基因组细菌染色体基因组结构的一般特点:1细菌的染色体基因组通常仅由一条环状双链DNA分子组成,细菌的染色体相对聚集在一起,形成一个较为致密的区域,称为类核(nucleoid)。类核无核膜与胞浆分开,类核的中央部分由RNA和支架蛋白组成,外围是双链闭环的DNA超螺旋。染色体DNA通常与细胞膜相连,连接点的数量随细菌生长状况和不同的生活周期而异。
2具有操纵子(trnascriptionaloperon)结构,其中的结构基因为多顺反子(polycistron),即数个功能相关的结构基因串联在一起,受同一个调节区的调节。数个操纵子还可以由一个共同的调节基因(regulatorygene)即调节子(regulon)所调控。
X174D-E-J-F-G-H→mRNA→外壳蛋白J、F、G、H组装蛋白D裂解蛋白EE.coli色氨酸操纵子9个顺反子9个酶真核很少,如18s5.8s及28srRNA基因3.在大多数情况下,结构基因在细菌染色体基因组中都是单拷贝。4.不编码的DNA部份所占比例比真核细胞基因组少得多。5.具有编码同工酶的同源基因(isogene)例如,在大肠杆菌基因组中有两个编码分支酸(chorismicacid)变位酶的基因,两个编码乙酰乳酸(acetolactate)合成酶的基因。6.细菌基因组编码顺序一般不会重叠,和病毒基因组不同的。7.在DNA分子中具有各种功能的识别区域如复制起始区OriC,复制终止区TerC,转录启动区和终止区等。这些区域往往具有特殊的顺序,并且含有反向重复顺序。8.在基因或操纵子的终末往往具有特殊的终止顺序,它可使转录终止和RNA聚合酶从DNA链上脱落。例如大肠杆菌色氨酸操纵子后尾含有40bp的GC丰富区,其后紧跟AT丰富区,这就是转录终止子的结构。质粒基因组指细菌的染色体外基因组,大约几十种。质粒DNA呈线状或环状双链结构大小约1×103~300×103bp,相对分子质量1×106~200×106。质粒基因可通过复制、转录、翻译而赋予寄主细胞某种性状。质粒基因组特点:①基因组小;②结构简练;③存在转录单元;④有基因重叠现象。3.6.2真核生物基因组真核生物基因组是真核生物细胞中全部基因,包括染色体基因组、细胞质的线粒体及叶绿体基因组真核染色体(Eukaryoticchromosome)1.概述2.组蛋白(Histone)3.核小体(Nuclearsome)4.染色体结构的形成5.着丝粒(centromere或中心粒)和端粒(telomere)真核生物基因组结构与功能的特点:1)含两份同源的基因组2)结构复杂,基因数庞大,具有许多复制起点,每个复制子大小不一。3)真核基因由一个结构基因与相关的调控区组成,转录产物为单顺反子。4)含有大量重复序列。5)非编码序列(non-codingsequenceNCS)占90%以上。6)断裂基因(splitgene)。基因与基因间的非编码序列为间隔DNA(spacerDNA).7)功能相关的基因构成各种基因家族,可串联在一起,也可相距很远。8)可移动因素(mobilegeneticelement),又称为自私基因(selfishDNA).真核生物与原核生物基因组特点的异同:1)真核生物基因分布在多个染色体上,而原核生物只一个染色体;2)真核生物基因组远大于原核生物基因组;3)真核生物细胞中DNA与组蛋白和大量非组蛋白结合,并有核膜将其与细胞质隔离,结果真核细胞的转录和翻译在时间上和空间上都是分离的,而原核细胞的基因转录和翻译是同步的;4)真核生物的基因是不连续的,中间存在不被翻译的内含子序列,而原核生物几乎每一个基因都是完整的连续的DNA片段;5)基因组中非编码序列远多于编码序列;6)存在着重复序列,重复次数从几次到几百万次不等;7)真核生物基因组的复制起点多,缺少明显的操纵子结构,而原核生物的基因组一般是一个复制子;8)真核生物基因组与原核相同,存在转座因子。线粒体基因组(mitochondrialgenome,mtDNA)双链环状分子相对分子质量约1×103~2×105,动物<植物,大小为15.4—16.3kb;含有编码2个核糖体RNA(12SrRNA,16SrRNA)、22个tRNA、1个细胞色素b、3个细胞色素氧化酶(COⅠ、COⅡ、COⅢ)、6个NADH降解酶(ND1~6)和2个ATP酶(6和8)的基因(Flook,1995)。线粒体是半自主性的细胞器,只能编码部分所需产物,需与核基因互作编码一些重要物质。遗传密码与核DNA的不完全一致。图1-1线粒体DNA结构示意图叶绿体基因组也是半自主性的细胞器,需与核基因互作编码一些重要物质。叶绿体基因组较大,在高等植物中通常为140kb。3.7真核生物DNA序列组织1、单拷贝序列:在一个基因组中只有一个拷贝,大多数编码蛋白质的结构基因属这一类。2、轻度重复序列:2~10个拷贝。如组蛋白基因,酵母tRNA基因。3、中度重复序列:重复次数为10~102。不编码,在基因表达调控起重要作用。4、高度重复序列:重复次数>102的DNA序列,如卫星DNA,反向重复序列,rRNA,某些tRNA3.8基因家族(genefamily)3.8.1基因家族和基因簇基因家族:真核生物基因组中来源相同,结构相似,功能相关的一组基因。假基因(pseudogene):
在多基因家族中有的成员并不能表达出有功能的产物,用ψ表示。基因家族的特点:1、核酸序列相同:即为多拷贝基因如rRNA基因家族,tRNA基因家族,组蛋白基因家族。2、核酸序列高度同源:如人类生长激素基因家族包括三种激素的基因,人生长激素、人胎盘促乳素和催乳素,它们之间高度同源。3、编码产物有同源功能:基因序列的相似性可能较低,但基因编码的产物具有高度保守的功能区。如src癌基因家族4、编码产物具有小段保守基序:有些基因家族中各成员的DNA序列可能不明显相关,而所编码的产物却有共同的功能特征,存在小段保守的氨基酸基序。基因超家族(genesuperfamily):一组由多基因家族及单基因组成的更大的基因家族,它们的结构有不同的同源性,但功能并不一定相同。如免疫球蛋白基因超家族。基因簇(genecluster):基因家族中的各成员紧密成簇排列成大段的串联重复单位,定位于染色体的特殊区域。它们属于同一个祖先的基因扩增产物。
3.8.2基因外的DNA重复序列除了基因家族外,染色体上还有大量无转录活性的重复DNA序列家族。与在基因家族中的组织形式类似,它们也有两种组织形式:
串联重复DNA(卫星DNA):成簇存在于染色体的特定区域。分散重复的DNA:重复单位并不成簇存在,而是分散于染色体的各个位点上。1.卫星DNA(1)概念:卫星DNA有些高度重复DNA序列的碱基组成和浮力密度同主体DNA有区别,在浮力密度梯度离心时,可形成不同于主DNA带的卫星带。卫星DNA的名称由此而来。(2)卫星DNA的分类卫星DNA(satelliteDNA)小卫星DNA(minisatelliteDNA)微卫星DNA(microsatelliteDNA)大卫星DNA(macrosatelliteDNA)又称为经典DNA。总长度100kb~数个Mb。根据浮力密度的不同分为Ⅰ、Ⅱ、Ⅲ、Ⅳ和α、β卫星DNA。各类型都由不同的重复顺序家族组成。小卫星DNA(minisatelliteDNA)由中等大小的串联重复序列构成,总长约0.1~20kb,分布在所有染色体,往往近于端粒处。高度可变的卫星DNA、端粒DNA(串联的短片段重复序列(TTAGGGG)n)微卫星DNA(microsatelliteDNA):重复单位为1~5bp,重复次数为10~60次,总长度小于150bp,常见以(AC)n和(TG)n二聚核苷酸为重复单位,由Miesfeld1981年发现。分散重复的DNA序列在高度分散的重复DNA家族中含有少量转座元件,根据其大小不同,可分为短散在核元件(shortinterspersednuclearelements,SINEs),长散在核元件(longinterspersednuclearelements,LINEs)。
1)短散在核元件(shortinterspersednuclearelements,SINEs),主要是Alu重复序列家族。序列中有限制酶Alu的酶切位点(AGCT)而得名。重复次数30~50万,散在分布于基因组中,与基因表达调控有关。2)长散在核元件(longinterspersednuclearelements,LINEs):KpnⅠ重复顺序。3.9人类基因组研究进展人类基因组的基本特点断裂基因;主要由大量的非编码序列和少量的编码序列构成;存在多基因家族;含有多种类型的重复序列。基因组大小2.91GbpA+G含量54%G+C含量38%重复序列(不含异染色质)35%编码序列数目26588功能未知基因比例42%外显子最多的基因Titin(234)SNP数量300万个SNP密度1/1250bp最长的染色体2(240Mbp)最短的染色体Y(19Mbp)基因最多的染色体1(2453)基因最少的染色体Y(104)基因密度最大的染色体19(23/Mb)基因密度最小的染色体13,Y(5/Mb)重复序列含量最高的染色体19(57%)重复序列含量最低的染色体2,8,10,13,18(36%)重复序列基因组中有多个拷贝,但不编码蛋白质的序列,是人类基因中的主要成分;分为串联和散布重复序列卫星DNA——高度重复的串联重复序列;重复序列是一种重要的分子标记。SNP即单核苷酸多态性,是由于单个核苷酸的改变而导致的核酸序列多态性。一般来说,一个SNP位点只有两种等位基因,因此又叫双等位基因。SNP在人基因组中的发生频率比较高,大约平均每1000个碱基中就有一个多态位点。
人类基因组计划(HGP)1986年Dulbecco提出、1990启动的人类基因组计划(HumanGenomeProject,HGP),被誉为生命科学的“登月”计划。1990年10月美国政府决定出资30亿美元,用15年时间(1991—2005年)完成“人类基因组计划”。“人类基因组计划”是生物学有史以来最巨大和意义深远的一项科学工程。2003年4月14日美国联邦国家人类基因组研究项目负责人弗朗西斯·柯林斯博士隆重宣布,美、英、日、法、德和中国科学家经过13年努力共同绘制完成了人类基因组序列图。内容目标(93-98)完成情况98-2003遗传图谱2-5cM1cM完成(1cM)物理图谱30,000STSs52,000STSs完成序列图谱80Mb人:180,其它:111完成基因图谱30,000ESTs测序技术大规模测序YAC,全自动测序,基因组信息学多态性SNPs模式生物5种人类基因组的研究带动了相关技术的突破和发展完成数十种生物基因组全序列的测定后基因组时代来临
基因控制着细胞中的蛋白质合成,控制着生物的各种遗传性状。基因组是生物体内遗传信息的集合,是某个特定物种细胞内全部DNA分子的总和。人体是一个多细胞体系,每个细胞中都包含46条两两配对的染色体,每23条染色体构成一个染色体组。大约有30亿对核苷酸,编码了5-6万个基因,人类基因组中携带了有关人类个体生长发育、生老病死的全部人类基因组计划的科学意义在于:(1)确定人类基因组中约5万个编码基因的序列及其在基因组中的物理位置,研究基因的产物及其功能。
(2)了解转录和剪接调
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025~2026学年重庆市西南大学附属中学九年级下学期3月英语阶段学情自测
- 2025~2026学年河南驻马店市正阳县度第一学期期末学业水平测试七年级英语(仁爱版)
- 临床脚气(足癣)常用药物详细作用及特点
- 2026辽宁大连市瓦房店市教育系统自主招聘教师(第三批)8人备考题库及答案详解(考点梳理)
- 2026新疆塔城地区消防救援支队第一批面向社会招聘政府专职消防员51人备考题库及答案详解(有一套)
- 2026重庆新华文化产业有限公司招聘2人备考题库(含答案详解)
- 2026福建漳州漳浦县赤湖中心卫生院招聘3人备考题库有答案详解
- 2026云南昆明供电局招聘48人备考题库附答案详解ab卷
- 2026广东中山市南区街道办事处招聘编外聘用人员7人备考题库完整参考答案详解
- 2026广东广州市增城区第一实验小学招聘编外聘用制教师备考题库及参考答案详解1套
- 2025年高考化学试题(浙江卷) 含答案
- 避免电磁辐射课件
- 诊所管理规章制度及诊疗技术操作规程
- 足疗店安全管理制度范本
- 激光器调试知识培训总结
- 国际道路运输安全生产管理制度文本
- 2025年6月浙江省高考化学试卷真题(含答案及解析)
- 电脑打印机耗材采购项目方案投标文件(技术方案)
- 青海“8·22”川青铁路尖扎黄河特大桥施工绳索断裂事故案例学习安全警示教育
- DB32∕T 4082-2021 采煤塌陷地生态修复基础环境治理技术规范
- 《井冈翠竹》课件
评论
0/150
提交评论