真核生物的基因表达调控机制.doc_第1页
真核生物的基因表达调控机制.doc_第2页
真核生物的基因表达调控机制.doc_第3页
真核生物的基因表达调控机制.doc_第4页
真核生物的基因表达调控机制.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、 真核基因组的复杂性 与原核生物比较,真核生物的基因组更为复杂,可列举如下。 1.真核基因组比原核基因组大得多,大肠杆菌基因组约4106bp,哺乳类基因组在109bp数量级,比细菌大千倍;大肠杆菌约有4000个基因,人则约有10万个基因。 2.真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,核外还有遗传成分(如线粒体DNA等),这就增加了基因表达调控的层次和复杂性。 3.原核生物的基因组基本上是单倍体,而真核基因组是二倍体。 4.如前所述,细菌多数基因按功能相关成串排列,组成操纵元的基因表达调控的单元,共同开启或关闭,转录出多顺反子(polycistron)的mRNA;真核生物则是一个结构基因转录生成一条mRNA,即mRNA是单顺反子(monocistron),基本上没有操纵元的结构,而真核细胞的许多活性蛋白是由相同和不同的多肽形成的亚基构成的,这就涉及到多个基因协调表达的问题,真核生物基因协调表达要比原核生物复杂得多。 5.原核基因组的大部分序列都为基因编码,而核酸杂交等实验表明:哺乳类基因组中仅约10%的序列为蛋白质、rRNA、tRNA等编码,其余约90%的序列功能至今还不清楚。 6.原核生物的基因为蛋白质编码的序列绝大多数是连续的,而真核生物为蛋白质编码的基因绝大多数是不连续的,即有外显子(exon)和内含子(intron),转录后需经剪接(splicing)去除内含子,才能翻译获得完整的蛋白质,这就增加了基因表达调控的环节。 7.原核基因组中除rRNA、tRNA基因有多个拷贝外,重复序列不多。哺乳动物基因组中则存在大量重复序列(repetitivesequences)。用复性动力学等实验表明有三类重复序列:1)高度重复序列(highlyrepetitivesequences),这类序列一般较短,长10300bp,在哺乳类基因组中重复106次左右,占基因组DNA序列总量的1060%,人的基因组中这类序列约占20%,功能还不明了。2)中度重复序列(moderatelyrepetitivesequences),这类序列多数长100500bp,重复101105次,占基因组10-40%。例如哺乳类中含量最多的一种称为Alu的序列,长约300bp,在哺乳类不同种属间相似,在基因组中重复3105次,在人的基因组中约占7%,功能也还不很清楚。在人的基因组中18S/28SrRNA基因重复280次,5SrRNA基因重复2000次,tRNA基因重复1300次,5种组蛋白的基因串连成簇重复30-40次,这些基因都可归入中度重复序列范围。3)单拷贝序列(singlecopysequences)。这类序列基本上不重复,占哺乳类基因组的50-80%,在人基因组中约占65%。绝大多数真核生物为蛋白质编码的基因在单倍体基因组中都不重复,是单拷贝的基因。 从上述可见真核基因组比原核基因组复杂得多,至今人类对真核基因组的认识还很有限,使现在国际上制订的人基因组研究计划(humangeneproject)完成,绘出人全部基因的染色体定位图,测出人基因组109bp全部DNA序列后,要搞清楚人全部基因的功能及其相互关系,特别是要明了基因表达调控的全部规律,还需要经历很长期艰巨的研究过程。 二、真核基因表达调控的特点 尽管我们现在对真核基因表达调控知道还不多,但与原核生物比较它具有一些明显的特点。 (一)真核基因表达调控的环节更多 如前所述,基因表达是基因经过转录、翻译、产生有生物活性的蛋白质的整个过程。同原核生物一样,转录依然是真核生物基因表达调控的主要环节。但真核基因转录发生在细胞核(线粒体基因的转录在线粒体内),翻译则多在胞浆,两个过程是分开的,因此其调控增加了更多的环节和复杂性,转录后的调控占有了更多的分量。 右图总结了以前章节叙述过的基因表达过程,并作了一些新补充。图中标出了真核细胞在分化过程中会发生基因重排(generearrangement),即胚原性基因组中某些基因会再组合变化形成第二级基因。例如编码完整抗体蛋白的基因是在淋巴细胞分化发育过程中,由原来分开的几百个不同的可变区基因经选择、组合、变化,与恒定区基因一起构成稳定的、为特定的完整抗体蛋白编码的可表达的基因。这种基因重排使细胞可能利用几百个抗体基因的片段,组合变化而产生能编码达108种不同抗体的基因,其中就有复杂的基因表达调控机理。此外,真核细胞中还会发生基因扩增(geneamplification),即基因组中的特定段落在某些情况下会复制产生许多拷贝。最早发现的是蛙的成熟卵细胞在受精后的发育过程中其rRNA基因(可称为rDNA)可扩增2000倍,以后发现其他动物的卵细胞也有同样的情况,这很显然适合了受精后迅速发育分裂要合成大量蛋白质,需要有大量核糖体。又如MTX(methotrexate)是叶酸的结构类似物,一些哺乳类细胞会对含有利用叶酸所必需的二氢叶酸还原酶(dihydrofolatereductase,DHFR)基因的DNA区段扩增40-100倍,使DHFR的表达量显著增加,从而提高对MTX的抗性。基因的扩增无疑能够大幅度提高基因表达产物的量,但这种调控机理至今还不清楚。 (二)真核基因的转录与染色质的结构变化相关 真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结构、染色质中NA和组蛋白的结构状态都影响转录,至少有以下现象: 1.染色质结构影响基因转录 细胞分裂时染色体的大部分到间期时松开分散在核内,称为常染色质(euchromatin),松散的染色质中的基因可以转录。染色体中的某些区段到分裂期后不像其他部分解旋松开,仍保持紧凑折叠的结构,在间期核中可以看到其浓集的斑块,称为异染色质(heterochromatin),其中从未见有基因转录表达;原本在常染色质中表达的基因如移到异染色质内也会停止表达;哺乳类雌体细胞2条X染色体,到间期一条变成异染色质者,这条X染色体上的基因就全部失活。可见紧密的染色质结构阻止基因表达。 2.组蛋白的作用 早期体外实验观察到组蛋白与DNA结合阻止DNA上基因的转录,去除组蛋基因又能够转录。组蛋白是碱性蛋白质,带正电荷,可与DNA链上带负电荷的磷酸基相结合,从而遮蔽了DNA分子,妨碍了转录,可能扮演了非特异性阻遏蛋白的作用;染色质中的非组蛋白成分具有组织细胞特异性,可能消除组蛋白的阻遏,起到特异性的去阻遏促转录作用。 发现核小体后,进一步观察核小体结构与基因转录的关系,发现活跃转录的染色质区段,有富含赖氨酸的组蛋白(H1组蛋白)水平降低,H2AH2B组蛋白二聚体不稳定性增加、组蛋白乙酰化(acetylation)和泛素化(ubiquitination),以及H3组蛋白巯基化等现象,这些都是核小体不稳定或解体的因素或指征。转录活跃的区域也常缺乏核小体的结构。这些都表明核小体结构影响基因转录。 3.转录活跃区域对核酸酶作用敏感度增加 染色质DNA受DNase作用通常会被降解成100、400bp的片段,反映了完整的核小体规则的重复结构。但活跃进行转录的染色质区域受DNase消化常出现100200bp的DNA片段,且长短不均一,说明其DNA受组蛋白掩盖的结构有变化,出现了对DNase高敏感点(hypersensitivesite)。这种高敏感点常出现在转录基因的5侧区(5flankingregion)、3末端或在基因上,多在调控蛋白结合位点的附近,分析该区域核小体的结构发生变化,可能有利于调控蛋白结合而促进转录4.DNA拓扑结构变化 天然双链DNA的构象大多是负性超螺旋。当基因活跃转录时,RNA聚合酶转录方向前方DNA的构象是正性超螺旋,其后面的DNA为负性超螺旋。正性超螺旋会拆散核小体,有利于RNA聚合酶向前移动转录;而负性超螺旋则有利于核小体的再形成。 5.DNA碱基修饰变化 真核DNA中的胞嘧啶约有5%被甲基化为5-甲基胞嘧啶(5-methylcytidine,m5C),而活跃转录的DNA段落中胞嘧啶甲基化程度常较低。这种甲基化最常发生在某些基因5侧区的CpG序列中,实验表明这段序列甲基化可使其后的基因不能转录,甲基化可能阻碍转录因子与DNA特定部位的结合从而影响转录。如果用基因打靶的方法除去主要的DNA甲基化酶,小鼠的胚胎就不能正常发育而死亡,可见DNA的甲基化对基因表达调控是重要的。 由此可见,染色质中的基因转录前先要有一个被激活的过程,但目前对激活机制还缺乏认识。 (三)真核基因表达以正性调控为主 真核RNA聚合酶对启动子的亲和力很低,基本上不依靠自身来起始转录,需要依赖多种激活蛋白的协同作用。真核基因调控中虽然也发现有负性调控元件,但其存在并不普遍;真核基因转录表达的调控蛋白也有起阻遏和激活作用或兼有两种作用者,但总的是以激活蛋白的作用为主。即多数真核基因在没有调控蛋白作用时是不转录的,需要表达时就要有激活的蛋白质来促进转录。换言之:真核基因表达以正性调控为主导。三、真核基因转录水平的调控 真核细胞的三种RNA聚合酶(、和)中,只有RNA聚合酶能转录生成mRNA,以下主要讨论RNA聚合酶的转录调控。 (一)顺式作用元件(cisactingelements) 真核基因的顺式调控元件是基因周围能与特异转录因子结合而影响转录的DNA序列。其中主要是起正性调控作用的顺式作用元件,包括启动子(promoter)、增强子(enhancer);近年又发现起负性调控作用的元件棗沉寂子(silencer)。 1.启动子 与原核启动子的含义相同,是指RNA聚合酶结合并起动转录的DNA序列。但真核同启动子间不像原核那样有明显共同一致的序列,而且单靠RNA聚合酶难以结合DNA而起动转录,而是需要多种蛋白质因子的相互协调作用,不同蛋白质因子又能与不同DNA序列相互作用,不同基因转录起始及其调控所需的蛋白因子也不完全相同,因而不同启动子序列也很不相同,要比原核更复杂、序列也更长。真核启动子一般包括转录起始点及其上游约100200bp序列,包含有若干具有独立功能的DNA序列元件,每个元件约长730bp。 以上所述是典型的启动子上转录复合体的形成,但有的真核启动子不含TATA盒或不通过TATA盒开始转录。例如有的无TATA盒的启动子是靠TFI和TFD共同组成稳定的转录起始复合体开始转录的。由此可以看到真核转录起始的复杂性。 不同基因由不同的上游启动子元件组成,能与不同的转录因子结合,这些转录因子通过与基础的转录复合体作用而影响转录的效率。现在已经发现有许多不同的转录因子,看到的现象是:同一DNA序列可被不同的蛋白因子所识别;能直接结合DNA序列的蛋白因子是少数,但不同的蛋白因子间可以相互作用,因而多数转录因子是通过蛋白质蛋白质间作用与DNA序列联系并影响转录效率的。转录因子之间或转录因子与DNA的结合都会引起构象的变化,从而影响转录的效率。 如下图所示,作为蛋白质的转录因子从功能上分析其结构可包含有不同区域:1)DNA结合域(DNAbindingdomain),多由60100个氨基酸残基组织的几个亚区组成;2)转录激活域(activatingdomain),常由30100氨基酸残基组成,这结构域有富含酸性氨基酸、富含谷氨酰胺、富含脯氨酸等不同种类,以酸性结构域最多见;3)连接区,即连接上两个结构域的部分。不与DNA直接结合的转录因子没有DNA结合域,但能通过转录激活域直接或间接作用于转录复合体而影响转录效率。 与DNA结合的转录因子大多以二聚体形式起作用,与DNA结合的功能域常见有以下几种: 1)螺旋-转角-螺旋(helix-turn-helix,HTH)及螺旋-环-螺旋(helix-loop-helix,HLH)这类结构至少有两个螺旋,其间由短肽段形成的转角或环连接,两个这样的motif结构以二聚体形式相连,距离正好相当于DNA一个螺距(3.4nm),两个螺旋刚好分别嵌入DNA的深沟(见下图)。 2)锌指(zincfinger)其结构如下图所示,每个重复的“指”状结构约含23个氨基酸残基,锌以4个配价键与4个半胱氨酸、或2个半胱氨酸和2个组氨酸相结合。整个蛋白质分子可有20个这样的锌指重复单位。每一个单位可以其指部伸入DNA双螺旋的深沟,接触5个核苷酸。例如与GC盒结合的转录因子SP1中就有连续的3个锌指重复结构。3)碱性亮氨酸拉链(basicleucinezipper,bZIP),该结构的特点是蛋白质分子的肽链上每隔6个氨基酸就有一个亮氨酸残基,结果就导致这些亮氨酸残基都在螺旋的同一个方向出现。 两个相同结构的两排亮氨酸残基就能以疏水键结合成二聚体,该二聚体的另一端的肽段富含碱性氨基酸残基,借其正电荷与DNA双螺旋链上带负电荷的磷酸基团结合。若不形成二聚体则对DNA的亲

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论