




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第2章 染色质、染色体、基因和基因组,1,本章内容,第一节 染色体和染色质 第二节 基因 第三节 基因组,2,一、染色体和染色质的形态 二、染色质和染色体的化学成分及组成 三、染色质和染色体的功能,第一节 染色体和染色质,3,一、染色体和染色质的形态,染色体和染色质其实是同一种物质的两种形态。1882年由Flemming首先提出染色质这一概念。 “染色体”用光学显微镜就可以清楚的观察到。在细胞不进行细胞分裂的时候,染色体呈现出松散堆积的形态,无法使用光学显微镜从细胞核中分辨出来,这时的染色体称为“染色质”。后来发现,原来细胞的遗传信息就储存在染色质上,所以是细胞内最为重要的东西。,4,染色体的
2、形态,5,染色体,黄色为中心粒,6,真核生物染色体数目,7,染色质有两种不同的形态:常染色质和异染色质,常染色质是属于松展状态的染色质,其中的DNA在一定的条件下可以进行活跃的复制和转录,使用染料染色时着色较浅,又可以称为功能性染色质。,异染色质与染料染色较深,其中的DNA处于不活跃不转录状态,呈高度卷曲紧缩状态,又称为非功能性染色质。,8,颜色深的部分为异染色质部分,颜色浅的为常染色质部分,9,有的染色质为永久性染色质,称为组成性染色质。雌性哺乳动物细胞中两条X染色体中的一条可以转变为异染色质,其中只有非常少的基因表达。,X和Y染色体,10,(一) 染色质的结构,使用一种特殊的技术,将染色体
3、中的DNA全部慢慢释放出来。,11,组蛋白除去之后的染色体只由DNA和蛋白支架组成,12,至今为止,我们人类对染色体的结构还没有达到完全的了解,染色体组装的许多细节还不清楚,染色质是由DNA、RNA、组蛋白和非组蛋白等组成的高度有序的复合物。由于呈纤维状,又叫染色质丝,其基本组成单位是核小体。,13,(1)核小体 (nucleosome),1974年 Olins 和Wood Cock等观察到真核细胞间期染色质经过温和处理,可以看到呈串念珠状的结构。每一个小颗粒叫做“核小体”。使用核酸酶可以将核小体分开。,核小体是染色质的基本结构单位,14,电子显微镜照片-串念珠状的结构的染色质,15,电子显微
4、镜照片-串念珠状的结构的染色质,16,17,核小体的结构,中心是由8个蛋白质分子构成的核心结构(八聚体),DNA就缠绕在蛋白质外面。,缠绕在外面的DNA分子的长度是146 bp,缠绕将近2圈(1.75圈)。,18,19,蛋白质分子叫做组蛋白,8个蛋白质分子可以分成4种,分别叫H2A、H2B、H3 和H4,各有2个分子。8个组蛋白分子排成2层。每层有4个组蛋白分子,各由一种组蛋白分子构成。,20,在每一个核小体的外面还有一个组蛋白H1,与缠绕在核小体上DNA的两端结合,起到封闭DNA的作用。,21,在核小体之间还有一段DNA分子,长度在不同的物种有所差异。酵母中长度为18 bp,是已知最短的连接
5、DNA;人类大约为60 bp。人的连接DNA加上核小体外面缠绕的DNA长度一共大约为200 bp。,22,每个核小体单位包括200 bp左右的DNA,其中大约146 bp缠绕在组蛋白八聚体上面,其余的是位于相邻的核小体之间的连接DNA;此外,在DNA分子的外面还有一个组蛋白分子H1,起到封闭DNA两端的作用。核小体外形呈念珠状。直径11 nm左右,核小体核心颗粒仅指组蛋白八聚体与外面缠绕的DNA所构成的单位,不包括H1和连接DNA。,23,(2)螺线体(管),是在核小体结构的基础上进一步紧缩而成的一种结构。主要依靠组蛋白H1的相互作用将核小体之间连接起来,形成直径为30 nm左右的螺线体(管)
6、结构。这是在电镜下最常看到的结构,呈纤维状。,24,25,螺线体的横切面图,一般每一圈有6个核小体,呈左手螺旋。,26,显微镜下常见的染色体结构就是由螺线体组成的直径30nm结构,27,(3)超螺线体(super solenoid),直径30 nm的螺线体进一步螺旋形成直径为400 nm的圆桶状结构,叫做超螺线体。这种超螺线体再进一步螺旋化并盘绕、压缩。就形成中期染色体的形态。,中期染色体,28,29,30,在这个过程中,DNA分子被高度压缩,最后的压缩比大约有8400倍,甚至更多。,可将染色质分为几个层次的结构: 一级结构:核小体结构,直径11nm 二级结构:螺线体(管)结构,直径30nm
7、三级结构:超螺线体结构,直径200-400nm 四级结构:细胞中期染色体单体结构,31,一级结构:核小体结构, 二级结构:螺线体(管)结构 三级结构:超螺线体结构 四级结构:细胞中期染色体单体结构,32,大肠杆菌的染色体结构,33,染色体的组成结构,34,动画:染色体的结构和组装* 染色质和染色体,35,(二) 中期染色质的形态结构,细胞分裂到中期时,染色体紧缩成在光镜下清晰可见的染色体,这时染色质的拧缩到达顶点,轮廓最为清楚,最有利于观察分析。一般可以看到以下的结构:,染色单体、着丝粒(主缢痕)、副缢痕、核仁组织区、随体、端粒等。,36,中期染色体形态,37,(1)染色单体:中期染色体由两条
8、染色单体组成,在着丝粒处连接。,(2)着丝粒(主缢痕):细胞有丝分裂时纺锤丝附着的部位,(3)副缢痕:着丝粒以外的缢痕,每种生物的染色体组中至少有一条或一对染色体上有副缢痕。有的副缢痕可以形成核仁组织区。,38,(4)核仁组织区:在染色体的一端的缢痕,叫核仁组织区,此处进行rRNA的合成,与核仁的形成有关,故名。有核仁组织区的染色体叫做核仁组织染色体。,(5)随体:染色体末端部分的球形或圆柱形的片段结构,通过副缢痕与染色体的主要部分相连。是识别染色体的重要特征之一。又有中间随体和端随体之分。,(6)端粒:染色体末端的特化部分,由端粒DNA和端粒蛋白组成,可以维持染色体的稳定。,39,染色体DN
9、A的关键序列:,酵母人工染色体 (Yeast Artificial Chromosome) 细菌人工染色体 (Bacteria Artificial Chromosome ),(1)自主复制序列 (2)着丝粒DNA序列 (3)端粒DNA序列,40,(三) 染色体末端的端粒和端粒酶,线性染色体的末端不是开放松散的形态,而是有一种特殊的结构,称为端粒(telomere),它(1)保持染色体末端结构的完整,防止染色体末端的降解、融合和缺失;(2)稳定和保护染色体的完整性,保证遗传信息的完整性;(3)指导染色体和核膜连接;(4)端粒的长度反应细胞的分裂能力。,41,端粒的组成,端粒实际上是一个复合体,
10、由端粒DNA和端粒结合蛋白组成。,端粒DNA是富含G的重复序列,如脊椎动物的端粒DNA序列是(TTAGGG)n。端粒结合蛋白提供帽子状结构以稳定端粒。,42,因为DNA聚合酶的特点所致,线性染色体在复制时末端总是有一段DNA无法复制,导致新的染色体长度有所缩短。,端粒长度的维持有2条途径,通过端粒酶或非端粒酶途径。,43,端粒酶由RNA和蛋白质组成,其中的RNA是合成端粒RNA 的模板,具有催化功能(核酶)。而其中的蛋白质亚基可能具有反转录酶的功能。所以端粒酶被认为是一个具有RNA模板的反转录酶。,44,端粒酶与染色体结构的完整性有关,在正常情况下,体细胞中端粒酶的活性较低,生殖细胞中端粒酶的
11、活性较高;而在一些恶性肿瘤细胞中也发现具有较高的端粒酶活性,有人就将肿瘤细胞中的端粒酶作为抑制肿瘤生长的药物靶点。,45,二、染色质和染色体的化学成分及组成,染色质由DNA、RNA、组蛋白和非组蛋白等组成。,46,(一)DNA,DNA是染色体的最重要和最主要的成分。染色体中的DNA根据其复性动力学研究,可以分为以下几种类型:,1 非重复序列(单一序列):,2 轻度重复序列,3 中等重复序列,4 高度重复序列,47,在基因组中只有一个或少数几个拷贝,占基因组总量的40%-80%。例如牛细胞中占55%,小鼠中占70%,果蝇中占79%。,1 非重复序列(单一序列),一般来说,原核生物的染色体中,这种
12、非重复序列(单一序列)所占比例较真核生物大。大肠杆菌中几乎所有的基因都是单一序列。,一般结构基因大多属于单一序列的基因。,48,一个基因组中含有少数低于10个拷贝的基因序列。但是这些重复序列并不是完全相同的重复,他们之间总有一些差异。有人将这类基因也归入非重复序列(单一序列)中。,2 轻度重复序列,49,基因组中有10到几百到几千个拷贝的基因序列。占基因组DNA的10%-40%。如小鼠占20%,果蝇占15%。,3 中等重复序列,各种rRNA、tRNA基因以及某些结构基因如组蛋白基因属于中等重复序列。,50,一般认为中等重复序列在基因转录开始或终止、DNA复制以及细胞内hnRNA的后处理方面等有
13、重要作用,一般不编码蛋白质。,中等重复序列平均长度为300 bp左右,重复几百次,称为基因家族。如人基因组中的Alu基因家族就是中等重复序列,占整个基因组长度的3%到6%之多。,51,4 高度重复序列,目前仅在真核生物中发现,占基因组DNA总数的10%-60%,一般是一个短小的序列,由6-100个碱基组成,但是重复几万次或几百万次更多。,如基因组中的卫星DNA、微卫星DNA等均是由一些短小的DNA序列多次重复组成。,52,实验证明,这些卫星DNA位于染色体的着丝粒部分,有一部分在染色体的臂上。卫星DNA一般不转录,是异染色质的组成成分,可能与染色体的稳定有关,详细的功能未知。,53,DNA指纹
14、技术(亲子鉴定),可以用来鉴定人类之间亲源关系的DNA指纹技术(亲子鉴定)就是利用的小卫星DNA的重复序列。,因为一些卫星DNA序列的排列中拷贝数是高度可变的,在不同的个体中差异极大,表现出基因的多态性。,通过酶切、Southern杂交,可以确定几个不同的卫星DNA排列组中DNA的精确长度,从而鉴别一个个体。,54,(二)组蛋白,细胞内染色体上的组蛋白含量非常丰富,和DNA等量,比例是1:1。,组蛋白共有5类或5个家族,其中H2A、H2B、H3 和H4各2个分子组成核心核小体;H1位于DNA分子的外面,起着“封口”的作用。,组蛋白带有大量的正电荷,序列中20%到30%由碱性氨基酸组成,这样可以
15、和DNA分子表面的负电荷结合,对于稳定DNA分子起重要作用。,55,染色体中的主要组蛋白性质比较,56,同一类的组蛋白在不同的物种中非常保守,无组织特异性,例如植物和动物之间的组蛋白差异很小。这说明组蛋白对于染色体结构的重要性。,57,组蛋白H1在某些性质方面与其他的组蛋白有所不同。分子量较大,在不同的物种之间的差异较其他的组蛋白要大,比其他的组蛋白容易失活。在含量方面H1是其他几类组蛋白含量的一半左右。这些说明H1在染色体中具有特殊的独特的功能。,58,有一些物种中(鸟类、鱼类和两栖类红细胞)没有H1而有另外一种组蛋白,叫做H5,与染色质紧密结合,与不进行转录的DNA相连。,59,组蛋白上的
16、一些特定的氨基酸能够进行一些化学修饰,例如磷酸化(丝氨酸的羟基和组氨酸)、乙酰基化(赖氨酸的的自由氨基)、甲基化(赖氨酸的的自由氨基和精氨酸、组氨酸等)等。,60,组蛋白的修饰,61,组蛋白化学修饰的结果就是降低了组蛋白的正电荷数,与组蛋白的功能改变有关。各种组蛋白发生化学修饰的时间不一致,而且发生在细胞周期的某一阶段中,可能与细胞分裂、染色质的浓缩等有关。,62,DNA一般情况下与组蛋白组成的核小体结合,如果组蛋白发生修饰而导致电荷减少,则DNA与核小体的结合力就会减弱,DNA就会从核小体上释放出来,从而开启基因的转录复制等过程。,因此组蛋白的修饰与基因的表达有关,63,(三)非组蛋白,染色
17、体上还含有一些非组蛋白蛋白质,含有酸性氨基酸较多,带负电荷,故又称为酸性蛋白质,,非组蛋白占总蛋白量的60%-70%,大约有20-100种之多,分子量在15000 到180000 之间。,非组蛋白的含量很少,每一种仅有1万个分子左右,而每一种组蛋白具有6000 万个分子。,64,非组蛋白具有组织特异性和种属特异性,而且含量随着外界环境改变而变化。其中包括酶(如RNA聚合酶)以及与结构蛋白如细胞分裂有关的收缩蛋白、骨架蛋白、核孔复合物以及肌动蛋白、肌球蛋白、微管蛋白、原肌蛋白等。,65,非组蛋白与DNA的结合方式与组蛋白不同,它可以从DNA的大小沟中识别出特定的碱基序列与之结合,故这些非组蛋白又
18、被称为序列特异性DNA结合蛋白。,66,非组蛋白的功能可能是 (1)参与染色体的构建 (2)启动基因的复制 (3)调节基因的转录等。,67,非组蛋白中的氨基酸可以进行磷酸化,且磷酸化的程度也非常高。大约平均每100个氨基酸中就有几个磷酸化位点。磷酸化可能与基因表达调控有关。,68,染色体上的RNA有一些人认为是DNA转录后所形成的mRNA,也有人认为有一些RNA结合在组蛋白上面,对基因的转录表达有调节作用。,(四)RNA,69,(五)酶,其实在染色体上发现的酶并不是染色体的组成成分,而是那些以染色体为底物的酶。如DNA聚合酶、RNA聚合酶以及对DNA进行修复、修饰的酶等等,在分离染色体时被一同
19、提取出来了。,70,三、染色质和染色体的功能,染色质是遗传物质的载体,储存重要的遗传信息。生物的遗传信息从DNA流向RNA,再流向蛋白质,这就是中心法则。,71,如果染色体发生突变,则细胞的生物学功能会受到影响,甚至死亡。,染色体的改变,72,染色体数目的变化举例,73,人的Down氏综合症是21号染色体三体所致。,Edward综合症是18号染色体三体。 Patau综合症是13号染色体三体。,74,一些性染色体的非整数倍变化 单体X (特纳氏综合症) 三体X(XXX综合症) 多体X和Y 二体Y (超雄综合症):身材高,有暴力和反社会倾向?,许多突变导致胎儿死亡,表现为流产,所以无法存活。,75
20、,Turner syndrome (XO),76,一、基因的生物学定义 二、基因的分子生物学定义 三、原核生物基因特征 四、真核生物基因特征 五、细胞器基因 六、亚细胞结构基因特征 七、基因与顺反子的关系 八、癌基因与抑癌基因,第二节 基因,77,一、基因的生物学定义,基因最早一词是在1909年为Wilhelm Johansen 采用来描述传递和表达特定的生物性状的可遗传因子,并没有涉及到任何特殊的遗传理论。基因这个词最初的含义中并不包含特殊的遗传物质基础,纯粹是作为一个抽象的名词使用的,因为当时根本不知道“基因”是什么东西。,78,20世纪前半叶,几个独立的工作导出了基因物理和功能基础的更为
21、精确的概念。,1902年Archibald Garrod提出,代谢紊乱中的尿黑酸症是由于某一种特殊的酶的失活引起的,并且以常染色体隐性遗传方式传代。Garrod并将这种现象称为“先天性代谢缺陷”。,79,射线诱导的真菌突变导致特定的生化缺陷才被认识,并提出一个基因一个酶的理论。,由于Garrod不熟悉孟得尔的遗传,这个发现的重要性一直到30年后George Beadle 和Edward Tatam 发现了用X,80,1911年 Thomas Hunt Morgan指出基因定位在染色体上并且在物理上相连。,1944年Oswald Avery和同事通过实验证明,DNA就是遗传物质,这样便勾勒出基因
22、概念的轮廓,即位于染色体上的一段DNA,它可以编码一个酶。,81,后来,随着分子生物学的发展,人们对基因的概念又有了新的认识。,发现有的基因不是编码蛋白质,而是编码功能性的RNA分子;,一些基因编码具有不同功能的肽链;,在一些病毒中基因还可以是RNA分子;,一个基因中的信息可以经过加工而被产生一种以上的产物;,82,现在已经认识到,一个基因可以影响到生物的多个性状(基因多效性),多个基因可以相互合作而控制同一个性状。,因此,现在可以比以前更加精确地从功能和结构方面来定义基因这个概念了,但是这个定义在真核和原核中将有所差异。,83,现在发现基因的形式远比原来想像的要复杂,如出现了重叠基因、断裂基
23、因、复等位基因以及假基因等多种形式,极大的丰富了基因的内涵,也导致精确给基因下定义是比较困难的了。,84,重叠基因是发现在病毒中的一种基因形式,主要有几种重叠的方式:一个基因全部位于另外一个基因内部;部分基因序列重叠;只有一个核苷酸重叠。,85,病毒基因组中重叠基因,86,噬菌体X174具有重叠基因,87,断裂基因(split gene)是真核细胞基因存在的一种常见方式,1977年科学家们发现真核中许多编码蛋白质的基因DNA序列被很多虽转录但不翻译的序列所隔开。这些转录后又被除去的DNA序列称为内含子(intron),而最终参与编码多肽链的DNA序列称为外显子(exon)。,88,真核细胞的基
24、因大多含有内含子,且数目长度不等,变化很大。另外,一个基因被转录出来后,在随后的加工过程中,会采取不同的剪接方式,而最终形成多种形式的mRNA,翻译成不同的蛋白质分子。在这些对内含子的剪接过程中,一种剪接方式中的内含子可能是另外一种剪接方式中的外显子,所以内含子是相对的。,89,虽然内含子不参与最后蛋白质分子的编码,但是不是没有任何意义的,对于蛋白质的正确产生还有重大意义;如有的内含子编码内切酶,可以对内含子进行正确的剪切等。,90,复等位基因 一个基因的形式是多种多样的,对于一个二倍体的生物来说,某种基因只能有2种形式(即含有1对等位基因);而从一个生物群体中来看,某种基因座上的所有基因形式
25、的数量是非常大的。在一个群体内,同源染色体的某个相同座位上的等位基因超过2个以上时,就称作复等位基因。,91,人的血型系统共发现有24种,最常见的是ABO型系统。ABO型系统就是由3种复等位基因控制的,分别称为IA、IB和i控制。,92,另外,组织相容性抗原(MHC)基因也是含有多种基因的复等位基因。,93,1978年科学家发现一些DNA序列与基因序列类似,但是又不完全相同,由于缺少一些序列,导致这些基因不能被转录或转录后无法被翻译,或翻译成没有生理功能的多肽。这样的DNA序列称为假基因。,94,细胞中存在大量的假基因,有的是由于基因突变产生的,这种假基因含有与正常基因类似的内含子和外显子等结
26、构;第二种是不含有内含子的假基因,可能是加工后的基因RNA被反转录后,又被插到基因组中的某个地方而形成的,这种假基因称为“加工假基因”。,95,二、基因的分子生物学定义,随着我们对基因认识的逐步加深,我们发现基因的概念是个动态的,仅使用一句话来给基因下定义是非常困难的。,96,使用分子生物学的术语给基因下的定义是这样的:基因是遗传的基本单位,是有一定长度的DNA或RNA片段,产物是蛋白质或RNA分子。基因不仅包含编码多肽链或RNA的核酸编码序列(ORF),也包含为保证该编码序列转录所必须的调控序列。调控序列包含有位于编码区前端的前导区,编码区后端的尾部区以及插在编码区中间的内含子等。,97,这
27、个概念也不是终极概念,随着我们对基因认识的再次深入,将来这个概念一定还会改变的。,98,三、原核生物基因特征,以大肠杆菌为例,说明原核生物基因的特征。,大肠杆菌的DNA长度为4.6X106 个碱基对,存在于一个单一闭环的DNA分子上,并且存在于一个称为拟核的区域内。,在正常细胞生长时,DNA保持复制能力,在生长速率达到最大时,平均每一个细胞中含有基因组的2个以上的拷贝。,99,大肠杆菌的DNA与RNA、蛋白质结合在一起,形成的复合物也被叫做染色体。,由50-100个环(或结构域)组成,这些环(或结构域)的末端与细胞膜上的蛋白质相连而被固定。,100,大肠杆菌的染色体呈负超螺旋状态存在,其中的蛋
28、白质与真核染色体中的组蛋白不同,而是另外一种叫做HU的蛋白质,又叫“类组蛋白”,以及一种分子量比较小的碱性二聚体蛋白。这些蛋白质对于细菌DNA的压缩、包装进入拟核以及染色体的稳定非常重要。虽然没有发现类似核小体的结构,但是拟核的结构也是非常复杂的。,101,质粒是细菌染色体DNA的补充。大肠杆菌的DNA分子包含大约4300个基因,其中许多基因已经被定位。大肠杆菌的全基因组序列已经被测定完毕。,绝大部分细菌基因都存在于染色体上,少数存在于一种叫做质粒的小环状DNA分子上。,102,基因组测序表明,在寄生类细菌中基因的数目在5001200个,自由生活的细菌中基因的数目为1500-7500 ,古细菌
29、中基因数目为1500-2700。,103,原核细胞的基因特征:,1 功能相关的基因一般高度集中,组成操纵子的形式。同一个操纵子中的基因共同转录成一个多顺反子。,104,2 编码蛋白质的基因是单拷贝基因。,3 RNA基因多是多拷贝基因。,4 绝大多数的基因是连续的,结构基因之间少有居间序列。细菌中的75%DNA是用来编码基因的,另外的25%是基因间DNA,与染色体的复制、染色体DNA的包装等有关。,105,5 基因DNA序列中几乎没有或很少内含子,6 基因组中重复序列少。,7 单个染色体成环状。,8 几乎所有的细菌都有染色体外的基因,存在于质粒中,是对染色体基因的补充,106,1 真核细胞基因转
30、录产物为单顺反子。而原核细胞多为多顺反子。,四、真核生物基因的特征,107,2 存在重复序列,重复次数可达百万次以上,3 基因组中不编码的区域多于编码区域。,4 多数基因含有内含子,是断裂基因, DNA中的内含子在转录后要被除去。,5 基因组中有基因家族存在。,108,(1)断裂基因(割裂基因,split gene),断裂基因是指基因的编码序列在DNA分子上不是连续的,而是被不编码的序列所隔开,其中编码的序列叫做外显子(exon),不编码的序列叫做内含子(intron)。,109,1977年10-12月,3个实验室同时报道有断裂基因的存在。他们发现老鼠的-珠蛋白基因、鸡的卵清蛋白基因和兔子中的
31、-珠蛋白基因的DNA与mRNA不一致的情况。,110,最初是通过电子显微镜观察到的,后来通过比较序列发现。很快,许多实验室宣布也发现断裂基因,证明断裂基因的广泛存在。,111,112,113,不仅在编码蛋白质的基因中发现有内含子,在rRNA和tRNA基因中也有。,在细菌和噬菌体中也发现有内含子的存在。酵母中基因大部分没有内含子。真核基因大多数有内含子,有一些基因如组蛋白、干扰素基因等没有内含子。但是真细菌中没有发现有内含子。,114,Phillip A. Sharp,USA,Richard J. Roberts,UK,他们获1993年诺贝尔医学奖,115,内含子在转录后的加工过程中被切除,功能
32、相似的基因含有的内含子的数目和位置也类似。,内含子虽然不编码最后的产物,但是如果没有内含子则基因不能正确剪切,所以内含子决不是可有可无的东西,或是没用的东西。,116,近来发现,内含子和外显子的概念是相对的,选择性剪接(alternative splicing),一个基因的转录产物在不同的发育阶段、分化细胞和生理状态下,通过不同的拼接方式,可以得到不同的mRNA和翻译产物,称为选择性剪接(alternative splicing)。所产生的多个蛋白质称为同源体(isoform)。,117,如原肌球蛋白基因可得到10个不同蛋白质产物。肌钙蛋白可产生64个蛋白质同源体。果蝇的性分化是由一系列基因产
33、物相互作用的结果,通过关键基因转录物的选择性拼接决定了雄性和雌性的差别。选择性拼接广泛存在,在基因表达的调节控制中起了十分重要的作用。,目前发现在真核生物中这种剪接机制广泛存在。,118,选择性剪接,119,(2) 基因组中含有许多来源相同、结构相似、功能相关的基因,它们被称为基因家族。,一类是编码蛋白质的基因家族,另一类是编码RNA的基因家族。基因家族的各个成员中,有的成簇排列在一起,有的在染色体上分散排列。其中有的家族成员已经不能再产生有功能的产物,这样的基因成员叫做“假基因”。,120,由基因家族和单基因组成的较大的基因家族被称为超基因家族(supergene family),在超基因家
34、族中,各个成员之间的结构有不等的同源性,虽然他们起源于共同的祖先基因,但是他们的功能已经发生了较大的改变,各不相同了。,121,低等生物中的rRNA基因中,28S、18S、5.8S和5S rRNA基因都是串联重复的基因家族。高等真核生物中,28S、18S、5.8S的rRNA基因是串联排在一起成一个转录单位,然后这个转录单位再重复排列成基因簇,每个转录单位之间有间隔区分开。这些真核rRNA基因均重复100次以上。,(a)串联重复的基因家族,122,同种的tRNA基因也是串联在一起形成一个基因簇,每个基因之间有非转录区隔开,有的基因有内含子,123,串联重复的组蛋白基因家族,124,(b)分散重复
35、的基因家族,珠蛋白基因由2个基因家族构成,和类,分布在不同的染色体上。人类的类基因簇分布在第16号染色体上,由5个基因组成基因簇,基因簇总长度24 kb;类基因在第11号染色体上,由5个有功能的基因和一个假基因组成基因簇,基因簇总长度60 kb。,125,人的生长激素基因家族有3种:人胎盘促乳素、人生长激素和催乳素,其中人胎盘促乳素、人生长激素排列在第17号染色体上,催乳素基因位于第6号染色体上。,126,(3) 基因组中有大量的重复序列,a 非重复序列(单一序列):,b 轻度重复序列,c 中等重复序列,d 高度重复序列,根据序列重复的次数不同,重复序列可以分为几种:,127,a 非重复序列(
36、单一序列):,基因在基因组中只有一个或几个拷贝,真核细胞中占40%-70%。真核细胞的大多数基因是单拷贝的,但是单一序列中只有百分之几的序列是编码基因的。而原核基因组中,大多数的单一序列是编码基因的。,128,b 轻度重复序列,基因在整个基因组中的拷贝数在2-10之间,有的人将其归入单拷贝序列中。如酵母的tRNA基因、人和小鼠的珠蛋白基因等。,129,c 中等重复序列,是指长度在300 bp左右在基因组中约有10到几千个拷贝的序列,例如rRNA和tRNA基因。,130,有2个概念用来描述这种中等重复序列的:,基因簇:是指一组相同或相关的基因排列在一起而形成的结构。,基因家族:是指由一个祖先基因
37、经过重复和变异所产生的一组同源基因。,131,不同的基因家族中成员的数目不等,功能也各异。基因家族的成员有的位于同一条染色体上,串联在一起,而有的分散在不同的染色体上。,如果有的成员因为变异而失去了原有的功能,或不能再进行表达形成有功能的产物,则称为假基因。,132,人类的Alu家族 小鼠的B序列,在人基因组中Alu基因家族是一个中等重复序列,长度在300bp左右,单倍体基因组中有30万份,分散在各染色体上。,在170 bp处有一个限制性酶切位点Alu。基因组中平均每5 kb出现一次Alu序列,因此在基因的内含子以及基因附近的序列中有许多。,133,Alu家族的每一个成员都很相似,由130 b
38、p的串联重复组成,常见的是二聚体形式,在右半部分的中部有一个31 bp的无关序列插在中间。这个插入序列(IS)来自7SL(是信号识别蛋白SRP的一个成分)。,31 bp IS,134,Alu家族的广泛存在说明其可能具有某种功能,但是目前还不十分了解。,135,在小鼠体中有一种和Alu序列同源的序列叫做B1家族,约有5万个成员。重复单位为130 bp,相当于Alu序列的一个单体,和Alu序列的同源性为70%-80%。,136,Kpn家族是中度重复顺序中仅次于Alu家族的第二大家族。用限制性内切酶Kpn消化人类及其它灵长类动物的DNA,在电泳谱上可以看到4个不同长度的片段,分别为1.2,1.5,1
39、.8和1.9kb,这就是所谓的Kpn家族。Kpn家族成员顺序比Alu家族更长(如人Kpn顺序长6.4kb),而且更加不均一,呈散在分布,属于中度重复顺序的长分散序列。 Kpn家族的拷贝数约为30004800个,占人体基因组的1 。,137,Hinf家族:这一家族以319bp长度的串联重复存在于人体基因组中。用限制性内切酶Hinf消化人体DNA,可以分离到这一片段。Hinf家族在单位基因组内约有50100个拷贝,分散在不同的区域。319bp单位可以再分成两个亚单位,分别为172bp和147bp,它们之间有70%的同源性。,138,d 高度重复序列,高度重复是一种简单的重复序列,有的重复单位不超过
40、6 bp,但是重复的次数可以达到几十万次之多,故称为高度重复序列,也叫做卫星DNA。,139,一般这些序列中的GC含量与其他的主体DNA不同(例如小鼠中为30%,低于其主体DNA的42%GC含量)。所以在进行氯化铯密度梯度超离心时,这些DNA由于密度小,会与主体的DNA带分开而出现在上面,所以称为卫星DNA。,140,也有的卫星DNA密度比主体DNA密度大,出现在主体DNA的下面。隐秘的卫星DNA是指与主体DNA的密度类似,使用氯化铯密度梯度超离心不能分开的高度重复序列,但是可以通过其他的方法将其分离出来。,141,人们开始时认为这些高度重复的DNA序列没有什么功能。近来发现与DNA复制、基因
41、表达的调节、基因的转位、减数分裂时染色体的配对等过程有重要关系。,142,在高度重复序列中,有一种是反向重复序列,也叫回文结构;长度不等,从几个核苷酸到几百个核苷酸等。,143,这种反向重复序列在基因组中很多,据推测可能与基因的复制、转录等调控有关。,与DNA结合的蛋白质多以二聚体的形式结合,这时会发现结合位点的DNA多具有回文结构的特点。,144,卫星DNA:是高等真核生物基因组重复程度最高的成分,由非常短的串联多次重复DNA序列组成,一般占基因组的10%-30%。因为其序列复杂性不高,所以有时称为简单序列DNA;卫星DNA以大的基因簇分布(100-3000 kb),常位于异染色质的着丝粒,
42、可能在染色体的功能中起作用。,145,有一些比较复杂的卫星DNA据推测可能是从简单的短序列重复发展变化而来的。,146,等位小卫星DNA是指小卫星中含有的重复序列数目相同;反之,不等位小卫星DNA是指小卫星中含有的重复序列数目不同。,147,卫星DNA : 基本单位长度 171 bp 小卫星DNA:基本单位长度15-65 bp 微卫星DNA:基本单位长度2-8 bp,卫星小卫星 微卫星DNA之间的基本差异,148,(4) 跳跃基因,跳跃基因(jumping gene),又做移动基因(movable gene)或转位因子(transposable elements),可以在基因组中从一个位置转移
43、到另一个位置,或在染色体之间移动跃迁。,目前在细菌、噬菌体、植物、酵母、果蝇和哺乳动物中均发现有跳跃基因的存在。,149,五、细胞器基因,染色体外的基因主要存在于线粒体、叶绿体以及细菌的质粒等中,另外中心粒中也有DNA的报告,但是功能不明。,150,线粒体和叶绿体中均含有DNA,其中都含有基因,可以编码一定数量的蛋白质和RNA活性分子,如tRNA等。他们基因编码的产物一般不输送到细胞质中,只能在本细胞器中使用。,151,细胞器中所需的大部分蛋白质和RNA分子都是由核基因编码,在细胞质中形成有功能的产物,然后再输送到细胞器中。线粒体中编码的基因主要是与呼吸链有关的一些蛋白,叶绿体中基因编码的主要
44、是与光合作用有关的蛋白质、酶等。,152,(1)线粒体,线粒体中DNA含有的基因的遗传方式是母性遗传,或叫做非孟得尔遗传。,线粒体中的DNA与细菌的染色体类似,均呈环状,双链,但是两条链的碱基在组成上有差异,在氯化铯密度梯度超离心时可以分开,其中一条链叫做轻链(L),另外一条链叫做重链(H),两条链均编码有基因。,153,人体细胞线粒体数目平均为800个,每个线粒体中含有10个基因组拷贝,酵母平均为65个线粒体,每个线粒体中有100个基因组拷贝。但是其遗传行为表现为单一基因型,我们还不知道生物是如何控制的,也不清楚如果不同的拷贝中发生了突变,是否会遗传保留在后代的拷贝中。,154,线粒体中DN
45、A的大小:高等植物2502000 kb,酵母为75kb,曲霉 32kb,爪蟾17533 bp,牛16338 bp,小鼠16295 bp,人仅为16569 bp。,155,已经有多种生物的线粒体DNA序列被测定完毕,从原生动物到脊椎动物都有。脊椎动物的线粒体DNA长度一般为16-17 kb,含有37个基因,有些原生动物和植物的线粒体DNA为330 kb到2500 kb,但是编码能力有限。,156,157,人的线粒体基因组含有 22 tRNA 基因, 2 rRNA基因,13个蛋白质基因。,158,线粒体基因类似于原核基因,没有内含子或极少。基因之间的间隔顺序很少,人的线粒体基因组中只有87bp是无
46、功能的。,有一些基因无终止密码子,需要在RNA编辑时产生。,159,蛋白质翻译时使用的密码子系统与标准的密码子系统有所不同。,只编码负责线粒体中的一小部分的基因, 线粒体中的大部分蛋白和RNA还需要由核基因编码并输送到线粒体中。自身合成的蛋白质或RNA仅供自身使用,不外运到细胞质中。,160,不同生物的线粒体基因组大小不同,虽然一些生物的线粒体基因组很大,但编码能力有限。线粒体中编码的基因基本相同,包括rRNA、tRNA基因、线粒体膜蛋白基因和氧化代谢基因等。线粒体的两条链均编码基因。,161,人线粒体基因突变会引起几百种疾病。,在美国,曾有一个看起来很健康的男孩,5岁时莫明其妙地听觉减退,1
47、8岁时听力完全丧失。在此期间,他被诊断是机能亢进兼有癫病。23岁时,他视力下降,患有白内障、青光眼,且视网膜进行性退化。28岁时死于肾功能衰竭和全身感染。后研究发现,他患病的根源在于基因中微小的异常,但这种异常并非出现在核染色体DNA上,而是在不太为人注意的线粒体DNA上。,162,近来发现,少数非胰岛素依赖型糖尿病的发生与线粒体基因突变有关。,163,利用人的线粒体基因特征可以研究人类的起源和进化问题。如走出非洲(Out of Africa) 假说的提出。,该假说认为,所有的现代人类均起源于15万年前至7万年前之间生活在非洲的古人类。,164,(2)叶绿体,叶绿体由蓝细菌入侵而来。,叶绿体的
48、基因的特征在许多方面与线粒体中的基因有类似的特点:,(1)大多数植物的叶绿体中含有的基因数目大致相同,为200个左右,包括rRNA基因、tRNA基因以及核糖体蛋白质基因和与光合作用有关的一些蛋白质的基因。,165,(2)高等植物中的叶绿体DNA一般为140 kb左右,低等植物为200 kb。,(3)各种生物的叶绿体基因非常保守,基因编码光合作用有关的蛋白,有的基因有内含子。,(4)基因组是双链环状,没有组蛋白,不形成超螺旋。,166,(5)叶绿体中含有的基因均是多拷贝的,具体数目在物种之间存在差异。,(6) 叶绿体基因工程,167,六、亚细胞结构基因特征,168,169,病毒基因组具有的特征,
49、(1)一种病毒中含有的核酸是RNA或DNA,只有一种。,(2)大部分病毒的核酸是一条单链或双链分子,只有少数几种病毒由几个核酸片段组成。它们都必须被包装到衣壳中,如呼吸道与肠道病毒有10个双链RNA片段;有的植物病毒基因组由多种片段组成,每种片段必须包装到不同的衣壳中,如苜蓿花叶病毒有4种不同的单链RNA。,170,(3)不同病毒的核酸大小差异很大,一般DNA病毒较大,RNA病毒较小。从最小的3kb到大的300 kb以上。,(4)病毒基因组中含有启动子和操纵基因的结构,这方面以噬菌体研究的最为清楚。,(5)噬菌体基因组中没有内含子,但是感染真核细胞的病毒基因中有内含子。,171,(6)病毒的基
50、因中有重叠基因存在。如X174含有的核酸长度为5386 bp,其中基因编码10个基因,其中有5个基因是重叠基因。,172,七、基因与顺反子的关系,在原核细胞中,顺反子的概念可以认为与基因是等同的。,173,在真核细胞中,比较复杂。由于基因含有内含子,而且存在复杂的转录后加工方式,顺反子与基因不再成这种简单的对等关系,一般认为顺反子仅相当于外显子。,174,八、原癌基因、癌基因与抑癌基因,原癌基因(proto-oncogene)是细胞内与细胞增殖相关的基因,是维持机体正常生命活动所必须的,在进化上高度保守。当原癌基因失去调控,使细胞过度增殖时会形成肿瘤。,175,一些原癌基因的功能,176,大多
51、数原癌基因编码的蛋白质都是复杂的细胞信号转导网络中的成份,在信号转导途径中有着重要的作用。原癌基因产物可分为以下几类:,177,1 生长因子,如sis(PDGF-),fgf家族(int-2,csf-1等) 2 生长因子受体(质膜):具酪氨酸蛋白激酶活性,如neu,ht,met,erbB,trk,fms,ros-1等。 3 非受体酪氨酸蛋白激酶(质膜/胞质) 如src家族:src,syn,fyn,abl,lck,ros,yes,fes,ret等,178,4 丝氨酸/苏氨酸蛋白激酶(胞质):如raf,raf-1,mos,pim-1, 5 G蛋白(质膜内侧),具GTP结合作用和GTP酶活性,如ras
52、家族中的 H-ras,K-ras,N-ras,以及mel和ral等 , 6 核内DNA结合蛋白(转录因子)如myc家族,fos家族,Jun家族,ets家族,rel,erb A(类固醇激素受体),179,原癌基因表达的特点 1 正常细胞中原癌基因的表达水平一般较低,而且是受生长调节的。 2 肿瘤细胞中一些原癌基因具有高水平的表达成过度表达,而且原癌基因的表达程度和次序发生紊乱,不再具有细胞周期特异性。,180,正常细胞内的原癌基因突变后变成癌基因,导致细胞产生肿瘤。,这种变化的原因包括原癌基因的点突变、过度扩增、基因重排、基因缺失等。,181,正常细胞中癌基因实际上是一些参与细胞生长、分裂和分化
53、的基因。我们身体中的每个细胞内有许多基因,控制正常的细胞功能,这些基因在正常细胞中以非激活的形式存在,故又称为原癌基因。当原癌基因受到多种因素的作用使其结构发生改变时,激活成为癌基因。,182,现已知道,大约有60种癌基因与癌的发生有关。由于癌基因是作为引起恶性肿瘤的逆转录病毒的部分而被发现和命名的。实际上癌基因是涉及细胞重要功能的一些正常基因的突变型,所以原癌基因的正常功能被描述为产生癌基因的概念是不正确的,然而由于这一名称已被广泛应用,再要改变已为时过晚。,183,抑癌基因是细胞正常生长发育的负调节基因,其产物的功能是抑制细胞过度增殖分裂。反之,抑癌基因失活会导致细胞过度分裂增殖而产生肿瘤
54、癌细胞。,184,目前了解最多和最重要的两种抑癌基因是Rb基因和p53基因。其他还有NF-l基因、WT-1基因、结肠腺瘤性息肉(APC)基因和结肠癌缺失(DCC)基因等。,185,p53基因位于第17号染色体上,产物分子量为53KD,故名。在各种人体肿瘤中,有50%以上的p53发生缺失或变异,所以p53的研究在分子生物学、细胞生物学及肿瘤学界受到极大关注。p53通常依靠对其下游因子的激活或抑制来调节细胞的生长与凋亡。,186,p16基因位于第9号染色体上,产物P16的分子量是15.8KD,可与细胞周期素D竞争结合CDK4,使细胞分裂停止,抑制细胞的增殖。多种恶性肿瘤内均发现有p16基因的突变失
55、活。,187,在正常情况下,抑癌基因通过它们的蛋白产物(核蛋白)控制细胞生长(如Rb、p53)或通过酶激活蛋白使癌基因失活(如NF-1)若抑癌基因的功能丧失,则可能促进细胞的恶性转化。,188,除了p53p16外,新的抑癌基因正在不断涌现,如与乳腺癌发生有密切关系的BRCA1和BRCA2,与胰腺癌有关的DPC4,与肾细胞癌有关的VHL等抑癌基因已被发现;还有与肝癌有关的M6P/IGF2r基因,以及FHIT基因等也是抑癌基因的候选者。,189,一、基因组定义 二、基因组的结构特点 三、基因组的染色体倍数性和数目 四、遗传图谱、物理图谱和基因图谱 五、人类基因组,第三节 基因组,190,一、基因组
56、定义,基因组是细胞中全部遗传物质的总和。对于噬菌体和细菌来说,就是指单个染色体上的全部基因,对于二倍体真核生物来说,基因组是指维持配子或配子体正常功能的最基本的一套染色体以及所携带的全部基因。,191,真核生物的基因组中绝大部分的DNA存在于细胞核中的染色体上(核基因组),还有一小部分存在于线粒体或叶绿体中(细胞器基因组)。,对于个别的RNA病毒来说,他们的基因组是由RNA组成的。,192,基因组不是基因的简单随机组合,而是有功能性的高级结构。不同生物的基因组的复杂程度是不同的,表现在组成基因组的碱基大小不同、基因的结构不同、基因在基因组中的组织方式不同。,193,194,二、基因组的结构特征
57、,1 原核生物基因组的结构特征,细菌的一条DNA分子就是一条染色体,由DNA 、RNA和蛋白质等构成,其中DNA占80%。,195,(1)基因组较小,单个基因也较小,平均在1 kb左右。,(2)单个染色体呈环状,其中有的蛋白质与DNA特异性结合,有的不是特异性结合。没有真核染色体中的组蛋白。,(3)功能相关的基因串联存在而高度集中,组成操纵子形式进行基因表达控制。例如大肠杆菌中有260多个操纵子。,196,(4)大部分基因是单拷贝的单一序列DNA,有一些基因是多拷贝的;重复序列少,不存在高度重复序列。蛋白质基因多为单拷贝基因,RNA基因多为多拷贝,(5)DNA大部分用来编码蛋白质。,(6)有重
58、叠基因。 (7)基因几乎没有内含子。 (8)基因转录成多顺反子。,197,2 真核生物基因组的结构特征,(1)真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即二倍体)。,(2)基因组较大,单个基因平均16 kb,并且变化较大,最小基因与细菌中的基因类似,最大的基因是人的肌肉营养不良蛋白基因2500 kb。,198,(3)DNA和组蛋白结合形成染色体,而且一般是多条。,(4)大多数基因是断裂基因,含有内含子。内含子的数目在不同的基因中不同,且差异很大。,(5)基因中有重复序列,而且存在高度重复序列。卫星DNA是高等真核生物基因组中重复程度最高的重复序列。,199,(6)基因有单拷贝和多拷贝两种形式。,(7)基因家族化是基因组中最显著的特征之一,它们来源于共同的一个祖先基因。,(8)基因多转录成单顺反子,但可以翻译成多种多肽链(可变剪切)。,200,人的基因组中只有1的序列是用来编码蛋白质的,201,酵母基因组排列的非常紧凑,202,真核生物的基因数目从6千到4万,但是与基因组的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年零售行业新零售模式下的运营模式创新报告
- 2025年互联网行业大数据精准营销策略与技术分析报告
- 智能建筑系统集成与智能监控系统在节能降耗中的技术路径报告
- 2025年新零售市场下实体店线上线下融合服务模式研究报告
- 工业互联网网络运维 课件 任务6.1-2 工业互联网平台管理-IoT平台设备管理
- T-CWAN 0131-2025 焊缝疲劳分析 等效结构应力法
- 树叶鸟阅读测试题及答案
- 数据结构试题库及答案
- 四川理科语文试题及答案
- 所罗门断案题目及答案
- 2025年7月27日宁波市直遴选笔试真题及答案解析
- 美妆售后管理办法
- 2025工商银行房贷借款合同
- 医院检验科实验室生物安全管理手册
- 特变电工哲学手册课件
- 2023年军队文职人员(司机岗)考试核心考点题库300题(含详解)
- GB/T 31586.1-2015防护涂料体系对钢结构的防腐蚀保护涂层附着力/内聚力(破坏强度)的评定和验收准则第1部分:拉开法试验
- 技术研发中心职位职级管理制度(试行版)
- 公司内部资金调配的管理制度
- 人工湿地运行维护手册范本
- 机械零件加工出厂检验报告
评论
0/150
提交评论