原核基因表达的调控_第1页
原核基因表达的调控_第2页
原核基因表达的调控_第3页
原核基因表达的调控_第4页
原核基因表达的调控_第5页
已阅读5页,还剩138页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2022-4-141一、操纵子 二、乳糖操纵子的表达调控 三、色氨酸操纵子的表达调控 四、翻译水平的调控五、翻译后调控六、原核生物基因表达其他调控方式2022-4-142(operon) 细菌能随环境的变化,迅速改变某些基因表达的状态,这就是很好的基因表达调控的实验模型。人们就是从研究这种现象开始,打开认识基因表达调控分子机理的窗口的。2022-4-143 大肠杆菌可以利用葡萄糖、乳糖、麦芽糖、阿拉伯糖等作为碳源而生长繁殖,当培养基中含有葡萄糖和乳糖时,细菌优先利用葡萄糖,当葡萄糖耗尽,细菌停止生长,经过短时间的适应,就能利用乳糖,细菌继续呈指数式繁殖增长。2022-4-144 大肠杆菌利用乳

2、糖至少需要两个酶:促使乳糖进入细菌的半乳糖透过酶(lactose permease)和催化乳糖分解第一步的 半乳糖苷酶( -galactosidase)。2022-4-145 在环境中没有乳糖或其他 -半乳糖苷时,大肠杆菌合成 -半乳糖苷酶量极少,加入乳糖2-3分钟后,细菌大量合成 -半乳糖苷酶,其量可提高千倍以上,在以乳糖作为唯一碳源时,菌体内的 -半乳糖苷酶量可占到细菌总蛋白量的3%。 在上述二阶段生长细菌利用乳糖再次繁殖前,也能测出细菌中 -半乳糖苷酶活性显著增高的过程。2022-4-146这种典型的诱导现象,是研究基因表达调控极好的模型。针对大肠杆菌利用乳糖的适应现象,法国的Jocob

3、和Monod等人做了一系列遗传学和生化学研究实验,于1961年提出乳糖操纵子(lac operon)学说。2022-4-147 乳糖操纵子模型已被许多研究实验所证实,对其有了更深入的认识,并且发现其他原核生物基因调控也有类似的操纵子组织,操纵子是原核基因表达调控的一种重要的组织形式,大肠杆菌的基因多数以操纵子的形式组成基因表达调控的单元。 下面就以乳糖操纵子为例子说明操纵子的最基本的组成元件(elements)。2022-4-148 操纵子中被调控的编码蛋白质的基因可称为结构基因(structural gene, SG)。一个操纵子中含有2个以上的结构基因,多的可达十几个。每个结构基因是一个连

4、续的开放阅读框(open reading frame), 5端有起始密码ATG,3端有终止密码TAA、TGA或TAG。各结构基因头尾衔接、串连排列,组成结构基因群。2022-4-149 至少在第一个结构基因5侧具有核糖体结合位点(ribosome binding site, RBS),因而当这段含多个结构基因的DNA被转录成多顺反子mRNA,就能被核糖体所识别结合、并起始翻译。核糖体沿mRNA移动,在合成完第一个编码的多肽后,核糖体可以不脱离mRNA而继续翻译合成下一个基因编码的多肽,直至合成完这条多顺反子mRNA所编码的全部多肽。2022-4-1410 乳糖操纵子含有、和3个结构基因。 基因

5、长3510bp,编码含1170个氨基酸、分子量为135,000的多肽,以四聚体形式组成有活性的-半乳糖苷酶,催化乳糖转变为别乳糖(allolactose),再分解为半乳糖和葡萄糖; 2022-4-1411基因长780bp,编码有260个氨基酸、分子量为30,000的半乳糖透过酶,促使环境中的乳糖进入细菌; 基因长825bp,编码275氨基酸、分子量为32,000的转乙酰基酶,以二聚体活性形式催化半乳糖的乙酰化。2022-4-1412 基因5侧具有大肠杆菌核糖体识别结合位点(RBS)特征的Shine-Dalgarno(SD)序列,因而当乳糖操纵子开放时,核糖体能结合在转录产生的mRNA上。 由于

6、、三个基因头尾相接,上一个基因的翻译终止密码靠近下一个基因的2022-4-1413翻译起始密码,因而同一个核糖体能沿此转录生成的多顺反子(polycistron)mRNA移动,在翻译合成了上一个基因编码的蛋白质后,不从mRNA上掉下来而继续沿mRNA移动合成下一个基因编码的蛋白质,一气依次合成这基因群所编码所有的蛋白质。2022-4-14142022-4-1415 启动子(promoter, P)是指能被RNA聚合酶识别、结合并启动基因转录的一段DNA序列。操纵子至少有一个启动子,一般在第一个结构基因5侧上游,控制整个结构基因群的转录。用RNA聚合酶与分离的一段DNA双链混合,再加入外切核酸酶

7、去水解DNA,结果只有被RNA聚合酶识别结合而被保护的那段DNA不被水解,由此可以测出启动子的范围及其序列。2022-4-1416虽然不同的启动子序列有所不同,但比较已经研究过的上百种原核生物的启动子的序列,发现有一些共同的规律,它们一般长40-60bp,含A-T bp较多,某些段落很相似的,有保守性,称为共有性序列(consensus sequences)。 启动子一般可分为识别(R,recognition)、结合(B,binding)和起始(I,initiation)三个区段。 2022-4-1417转录起始第一个碱基(通常标记位置为+1)最常见的是A;在-10bp附近有TATAAT一组共

8、有序列,因为这段共有序列是Pribnow首先发现的,称为Pribnow盒(Pribnow box);在-35bp处又有TTGACA一组共有序列。2022-4-14182022-4-1419不同的启动子序列不同,与RNA聚合酶的亲和力不同、启动转录的频率高低不同,即不同的启动子起动基因转录的强弱不同,例如:PL、PR、PT7属强启动子,而Plac则是较弱的启动子。2022-4-1420 操纵区(operator)是指能被调控蛋白特异性结合的一段DNA序列,常与启动子邻近或与启动子序列重叠,当调控蛋白结合在操纵子序列上,会影响其下游基因转录的强弱。2022-4-1421 以 前 将 操 纵 区 称

9、 为 操 纵 基 因(operator gene)。但现在基因定义是为蛋白质或RNA编码的核酸序列,而操纵序列并不是编码蛋白质的基因,却是起着调控基因表达强弱的作用,正如启动序列不叫启动基因而称为启动子一样,操纵序列就可称为操纵区。operon译为操纵子,即基因表达操纵的单元之意。2022-4-1422以乳糖操纵子中的操纵区为例,其操纵区(o)序列位于启动子(p)与被调控的基因之间,部分序列与启动子序列重叠。 仔细分析操纵区序列,可见这段双链DNA具有回文(palindrome)样的对称性一级结构,能形成十字形的茎环(stem loop)构造。不少操纵区都具有类似的对称性序列,可能与特定蛋白质

10、的结合相关。2022-4-1423阻遏蛋白与操纵区结合,就妨碍了RNA聚合酶与启动子的结合及其后 -半乳糖苷酶等基因的转录起始,从而阻遏了这群基因的表达。 最早只把与阻遏蛋白结合、起阻遏作用的序列称为操纵区,但其后发现有的操纵子中2022-4-1424同一操纵序列与不同构像的蛋白质结合,可以分别起阻遏或激活基因表达的作用,阿拉伯糖操纵子中的操纵序列就是典型的例子。因而凡能与调控蛋白特异性结合、从而影响基因转录强弱的序列,不论其对基因转录的作用是减弱、阻止或增强、开放,都可称为操纵区。2022-4-1425 调控基因(regulatory gene)是编码能与操纵序列结合的调控蛋白的基因。调控蛋

11、白有: 阻遏蛋白(repressive protein):与操纵区结合后能减弱或阻止其调控的基因转录,其介 导 的 调 控 方 式 为 负 调 控 ( n e g a t i v e regulation); 2022-4-1426激活蛋白(activating protein):与操纵区结合后能增强或起动其调控的基因转录,所介导的调控方式为正调控(positive regulation)。2022-4-1427某些特定的物质能与调控蛋白结合,使调控蛋白的空间构像发生变化,从而改变其对基因转录的影响,这些特定物质可称为效应物(effector)。有两种: 诱导剂(inducer):能引起诱导发

12、生的分子;阻遏剂或辅助阻遏剂(corepressor):能导致阻遏发生的分子。2022-4-1428例如在乳糖操纵子中,调控基因lac I位于Plac邻近,有其自身的启动子和终止子,转录方向和结构基因群的转录方向一致,编码产生由347个氨基酸组成的调控蛋白R。 在环境没有乳糖存在的情况下,R形成分子量为152,000的活性四聚体,能特异性与操纵区紧密结合,从而阻止利用乳糖的酶类基因的转录,所以R是乳糖操纵子的阻遏蛋白;2022-4-1429 当环境中有足够的乳糖时,乳糖与R结合,使R的空间构像变化,四聚体解聚成单体,失去与操纵区特异性紧密结合的能力,从而解除了阻遏蛋白的作用,使其后的基因得以转

13、录合成利用乳糖的酶类。 在这过程中乳糖就是诱导剂,与R结合起到去阻遏作用(derepression),诱导了利用乳糖的酶类基因转录开放。2022-4-1430 许多调控蛋白都是变构蛋白(allosteric protein),通过与上述类似的方式与效应物结合改变空间构像,从而改变活性,起到调节基因转录表达的作用。2022-4-1431 终止子(terminator,T)是给予RNA聚合酶转录终止信号的DNA序列。在一个操纵子中至少在结构基因群最后一个基因的后面有一个终止子。2022-4-1432终止子至少可以分为两类:一类是不依赖因子(蛋白性终止因子)的终止子,这类终止子在序列上有一些共通的特

14、点,即有一段富含GC的反向重复序列(inverted repeat sequence),其后跟随一段富含AT的序列,因而转录生成的mRNA的序列中能形成发夹式结构,后继一连串U,2022-4-1433正是RNA聚合酶转录生成的这段mRNA的结构阻止RNA聚合酶继续沿DNA移动、并使聚合酶从DNA链上脱落下来,终止转录。 另一类是依赖因子的终止子,即其终止转录的作用需要因子的协同,或至少是受因子的影响。2022-4-14342022-4-1435 不同的终止子的作有强弱之分: 有的终止子几乎能完全停止转录; 有的则只是部分终止转录,一部分RNA聚合酶能越过这类终止序列继续沿DNA移动并转录。如果

15、一串结构基因群中间有这种弱终止子的存在,则前后转录产物的量会有所不同,这也是终止子调节基因群中不同基因表达产物比例的一种方式。 2022-4-1436有的蛋白因子能作用于终止序列,减弱或取消终止子的作用,称为抗终止作用(antitermination),这种蛋白因子就称为抗终止因子(antiterminator)。以上5种元件是每一个操纵子必定含有的。其中启动子、操纵区位于紧邻结构基因群的上游,终止子在结构基因群之后,2022-4-1437它们都在结构基因的附近,只能对同一条DNA链上的基因表达起调控作用,这种作用在遗传学实验上称为顺式作用(cis-action),启动子、操纵子和终止子就属于

16、顺式作用元件(cis-acting element)。调控基因可以在结构基因群附近、也可以远离结构基因,它是通过其基因产物调控蛋白来发挥作用的,因而调控基因不仅能对同一条DNA链上的结构基因起表达调控作用,而且2022-4-1438能对不在一条DNA链上的结构基因起作用,在遗传学实验上称为反式作用(trans-action),调控基因就属于反式作用元件(trans-acting element),其编码产生的调控蛋白称为反式调控因子(trans-acting factor)。 由此也可窥测到基因表达调控机理的关键在蛋白质与核酸的相互作用上。2022-4-14392022-4-14402022-

17、4-14412022-4-1442 当大肠杆菌在没有乳糖的环境中生存时,lac操纵子处于阻遏状态。此基因在其自身的启动子Pi控制下,低水平、组成性表达产生阻遏蛋白R,每个细胞中仅维持约10个分子的阻遏蛋白。R以四聚体形式与操纵子结合,阻碍了RNA聚合酶与启动子Plac的结合,阻止了基因的转录起动。R的阻遏作用不是绝对的,R与2022-4-1443偶尔解离,使细胞中还有极低水平的半乳糖苷酶及透过酶的生成。 当有乳糖存在时,乳糖受 半乳糖苷酶的催化转变为别乳糖,与R结合,使R构象变化,R四聚体解聚成单体,失去与的亲和力,与解离,基因转录开放,使 半乳糖苷酶在细胞内的含量可增加1000倍。这就是乳糖

18、对lac操纵子的诱导作用。2022-4-14442022-4-1445 一些化学合成的乳糖类似物,不受 半乳糖苷酶的催化分解,却也能与R特异性结合使R构象变化,诱导lac操纵子的开放。例如异丙基硫代半乳糖苷(isopropylthiog-alactoside,IPTG)就是很强的诱导剂;不被细菌代谢而十分稳定。X-gal(5-溴-4-氯-3-吲哚-半乳糖苷)也是一种人工化学合成的半乳糖苷,可被 半乳糖苷酶水解产生兰色化合物,因此可以用作 半乳糖苷酶活性的指示剂。IPTG和X-gal都被广泛应用在分子生物学和基因工程的工作中。2022-4-14462022-4-1447 细菌中的cAMP含量与葡

19、萄糖的分解代谢有关,当细菌利用葡萄糖分解产生能量时,cAMP生成少而分解多,cAMP含量低;相反,当环境中无葡萄糖可供利用时,cAMP含量就升高。细菌中有一种能与cAMP特异结合的cAMP受体蛋白CRP(cAMP receptor protein),当CRP未与cAMP结合时它是没有活性的,当cAMP浓度升高时,CRP与cAMP结合并发生空间构象的变化而活化,称为CAP(CRP-cAMP activated protein),能以二聚体的方式与特定的DNA序列结合。2022-4-1448在lac操纵子的启动子Plac上游端有一段序列与Plac部分重叠的序列,能与CAP特异结合,称为CAP结合位

20、点(CAP binding site)。CAP与这段序列结合时,可增强RNA聚合酶的转录活性,使转录提高50倍。相反,当有葡萄糖可供分解利用时,cAMP浓度降低,CRP不能被活化,lac操纵子的结构基因表达下降。2022-4-14492022-4-1450由于Plac是弱启动子,单纯因乳糖的存在发生去阻遏使lac操纵子转录开放,还不能使细菌很好利用乳糖,必需同时有CAP来加强转录活性,细菌才能合成足够的酶来利用乳糖。lac操纵子的强诱导既需要有乳糖的存在又需要没有葡萄糖可供利用。通过这机制,细菌是优先利用环境中的葡萄糖,只有无葡萄糖而又有乳糖时,细菌才去充分利用乳糖。2022-4-1451细菌

21、对葡萄糖以外的其他糖(如阿拉伯糖、半乳糖、麦芽糖等)的利用上也有类似对乳糖利用的情况,在含有编码利用阿拉伯糖的酶类基因群的阿拉伯糖操纵子(ara operon)、半乳糖操纵子(gal operon)中也有CAP结合位点,CAP也起类似的正性调控作用。所以CAP的通用名称是分解代谢基因激活蛋白(catabolic gene activator protein)。2022-4-1452不难看出:CAP结合位点就是一种起正性调控作用的操纵子,CAP则是对转录起正性作用的调控蛋白激活蛋白,编码CRP的基因也是一个调控基因,不过它并不在lac操纵子的附近,CAP可以对几个操纵子都起作用。从上所述,乳糖操

22、纵子属于可诱导操纵子(inducible operon),这类操纵子通常使是关闭的,当受效应物作用后诱导开放转录。这类操纵子使细菌能适应环境的变化,最有效地利用环境能提供的能源底物。2022-4-1453乳糖操纵子的诱导乳糖操纵子的诱导 2022-4-1454图例说明: 一些基因调控蛋白可以控制基因转录的开启和关闭,大肠杆菌的乳糖操纵子就是这样一个双重控制的例子。葡萄糖和半乳糖的水平控制着乳糖操纵子转录的起始,决定操纵子是“开”还是“关”。 1.培养大肠杆菌时,如果不加入半乳糖,一个抑制蛋白就会结合到操纵子上,阻止RNA聚合酶转录操纵子基因。此时操纵子就处于关闭状态; 2.当加入诱导物半乳糖后

23、,半乳糖就会和抑制蛋白结合,并改变抑制蛋白的构象使得它不能结合到操纵子上。只要没有抑制蛋白的结合,RNA聚合酶就可以识别启动子并转录操纵子的结构基因,得到mRNA。此时操纵子是开启的。2022-4-14552022-4-1456 色氨酸是构成蛋白质的组分,一般的环境难以给细菌提供足够的色氨酸,细菌要生存繁殖通常需要自己经过许多步骤合成色氨酸,但是一旦环境能够提供色氨酸时,细菌就会充分利用外界的色氨酸、减少或停止合成色氨酸,以减轻自己的负担。细菌所以能做到这点是因为有色氨酸操纵子(trp operon)的调控。2022-4-14572022-4-1458 合成色氨酸所需要酶类的基因E、D、C、B

24、、A等头尾相接串连排列组成结构基因群,受其上游的启动子Ptrp和操纵子的调控,调控基因trpR的位置远离P-结构基因群,在其自身的启动子作用下,以组成性方式低水平表达其编码分子量为47000的调控蛋白R,R并没有与结合的活性,当环境能提供足够浓度的色氨酸时,R与色氨酸结合后构象变化而活化,就能够与特异性亲和结合,阻遏结构基因的转录。2022-4-1459 因此色氨酸操纵子属于一种负性调控的、可阻遏的操纵子(repressible operon),即这操纵子通常是开放转录的,有效应物(色氨酸为阻遏剂)作用时则阻遏关闭转录。细菌不少生物合成系统的操纵子都属于这种类型,其调控可使细菌处在生存繁殖最经

25、济最节省的状态。2022-4-1460 实验观察表明:当色氨酸达到一定浓度、但还没有高到能够活化R使其起阻遏作用的程度时,产生色氨酸合成酶类的量已经明显降低,而且产生的酶量与色氨酸浓度呈负相关。仔细研究发现这种调控现象与色氨酸操纵子特殊的结构有关。2022-4-1461在色氨酸操纵子Ptrp-与第一个结构基因trpE之间有162bp的一段先导序列(leading sequence,L),实验证明当色氨酸有一定浓度时,RNA聚合酶的转录会终止在这里。 这段序列中含有编码由14个氨基酸组成的短肽的开放阅读框,其序列中有2个色氨酸相连,在此开放阅读框前有核糖体识别结合位点(RBS)序列,提示这段短开

26、放阅读框在转录后是能被翻译的。2022-4-1462 mRNA前导区序列分析 trp前导区的碱基序列已经全部测定, 发现完整的前导序列可分为1、2、3、4区域,这四个区域的片段能以两种不同的方式进行碱基配对(图9-10),2022-4-1463图图9-10 色氨酸操纵子的转录与翻译调控色氨酸操纵子的转录与翻译调控2022-4-1464有时以1-2和3-4配对,有时只以2-3方式互补配对。核糖体经过前导区继续翻译的能力控制着这两种结构的转换,它决定mRNA是否形成终止所需的结构。前导序列的终止区与一般的转录2022-4-1465 终止位点特点相同,具有成串的 U和潜在的能形成茎环的二重对称结构。

27、通过RNaseT1降解实验(此酶不水解配对的RNA)表明纯化的trp前导序列中只有1-2和3-4的配对方式。由此定位的3-4配对区正好位于终止密码子识别区,当这个区域发生破坏自我碱基突变,有利于转录的继续进行。 2022-4-1466 转录的弱化理论认为,mRNA转录的终止是通过前导肽基因的翻译来调节的,在前导肽基因中有两个相邻的色氨酸密码子,在翻译时对tRNATrp的浓度十分敏感。当培养基中色氨酸的浓度很低时,负载有色氨酸的tRNATrp也少,由此推断,翻译通过两个相邻色氨酸密码子的速度就会很慢,当4区被转录完成时,核糖体才进行到1区(或停留在两个相邻的色2022-4-1467氨酸密码子处)

28、,这时的前导区结构是2-3配对,不形成3-4配对的终止结构,所以转录可继续进行,直到将色氨酸操纵子中的结构基因全部转录完毕为止。测定结果发现,在缺乏色氨酸时所有的RNA聚合酶都能经过弱化子继续参与转录。加上取消阻遏增加的约70倍的表达,总表达量可增加约700倍。 2022-4-1468当培养基中色氨酸浓度高时,核糖体可顺利通过两个相邻的色氨酸密码子,在4区被转录之前,核糖体就到达2区,这样使2-3不能配对,3-4区可以自由配对形成茎-环式的终止子结构,使得只有约10的RNA聚合酶能继续参与色氨酸操纵子结构基因的转录(图9-10 )。由此可见,弱化子对RNA聚合酶转录的终止依赖于前导肽翻译中核糖

29、体所处的位置,而细胞中色氨2022-4-1469 酸存在与否,决定了mRNA 转录的弱化子结构,使弱化子中1、2、3、4区域呈现竞争性配对,从而产生弱化效应,这是色氨酸操纵子第二水平调控的机制。应该指出,色氨酸含量变化对阻遏过程和弱化过程的作用方向是相同的。前者主要控制操纵子基因表达的启动,而后者主要决定转录和翻译是否能继续进行下去。2022-4-1470衰减子作用2022-4-14712022-4-14722022-4-1473 原核基因表达转录水平调控的基本方式:1. 通过特殊的代谢物调控基因的活性 可诱导调节方式 负调控:阻遏蛋白的调节 正调节:激活蛋白的调节 可阻遏调节方式2022-4

30、-14742.通过衰减方式进行调节;3.通过异化抑制作用进行调节;4.应急调节 2022-4-1475通过异化抑制作用进行调节:当细菌在含有葡萄糖和其它糖的培养基中生长时,通常优先利用葡萄糖,而不利用其它糖。只有当葡萄糖耗尽后,细菌经过一段停滞期,不久在其它糖的诱导下,合成利用其它糖的酶类,这种现象称为葡萄糖效应,或叫异化抑制作用。这种作用也是在转录水平上进行的。不过葡萄糖对转录的作用并不是直接的,而是由于葡萄糖降解物抑制了腺苷酸环化酶活性或活化磷酸二酯酶,使cAMP浓度降低,造成cAMPCAP浓度不够,使许多分解代谢酶的基因不能转录。2022-4-1476通过异化抑制作用进行调节:受cAMP

31、CAP系统调节的操纵子,即对葡萄糖降解物敏感的操纵子,包括许多负责糖分解代谢的可诱导操纵子,如乳糖、半乳糖、阿拉伯糖、麦芽糖等的操纵子,以及负责氨基酸合成代谢的阻遏操纵子,如异亮氨酸、缬氨酸操纵子。这一调节机制是积极的,开源式的,有很重要的意义。2022-4-1477应急调节:当细菌处于十分危急的状态时,比如食物全面匮乏,这时必须紧缩开支,减少消耗,借以渡过艰难时期,等待培养条件的改善。为此必须一下子关闭几乎所有的基因,合成维持生命最低限度需要的物质基因除外,这种现象称为严紧控制。严紧控制造成稳定RNA(rRNA和tRNA)的合成显著下降。mRNA合成的降低程度较小,而且只有某些种类的mRNA

32、合成才有降低现象。2022-4-1478应急调节:任何一种氨基酸的缺乏,或突变导致任何一种氨基酰tRNA合成酶的失活都将引起严紧控制生长代谢的反应。其调节物质是鸟苷四磷酸(ppGpp)和鸟苷五磷酸(pppGpp),它们是由空载的tRNA诱导活化焦磷酸转移酶而合成出来的。关于它的作用机制有一些说法,这个调节因子可以调节许多基因,是一个超级的调控因子,其中有两个突出的效应,一是抑制rRNA操纵子启动子的转录起始作用;另一是增加RNA聚合酶在转录过程中的暂停,因而放慢延长相。2022-4-1479一、真核基因组的复杂性真核基因组的复杂性二、真核基因表达调控的特点三、真核基因转录水平的调控四、真核基因

33、转录前的调控五、翻译水平的调控六、翻译后水平的调控2022-4-1480真核基因组比原核基因组大得多,大肠杆菌基因组约4106bp,哺乳类基因组在109bp数量级,比细菌大千倍;大肠杆菌约有4000个基因,人则约有35万个基因。真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,核外还有遗传成分(如线粒体DNA等),这就增加了基因表达调控的层次和复杂性。2022-4-1481原核生物的基因组基本上是单倍体,而真核基因组是二倍体。如前所述,细菌多数基因按功能相关成串排列,组成操纵子的基因表达调控的单元,共同开启或关闭,转录出多顺反子(polycistron)的mRNA;真核生物则是一个结

34、构基因转录生成一条mRNA,即mRNA是单顺反子(monocistron),基本上没有操纵子的结构,而真核细胞的许多活性蛋白是由相同和不同的多肽链形成的亚基构成的,这就涉及到多个基因协调表达的问题,真核生物基因协调表达要比原核生物复杂得多。2022-4-1482原核基因组的大部分序列都为基因编码,而核酸杂交等实验表明:哺乳类基因组的中仅约10%的序列是编码蛋白质或rRNA、tRNA等的基因,其余约90%的序列功能至今还不清楚。原核生物的基因为蛋白质编码的序列绝大多数是连续的,而真核生物为蛋白质编码的基因绝大多数是不连续的,即有外显子(exon)和内含子(intron),在转录后经剪接(spli

35、cing)去除内含子,才能翻译获得完整的蛋白质,这就增加了基因表达调控的环节。2022-4-1483原核基因组中除rRNA、tRNA基因有多个拷贝外,重复序列不多。哺乳动物基因组中则存在大量重复序列(repetitive sequences)。用复性动力学等实验表明有三类重复序列: 高度重复序列(high repetitive sequences),这类序列一般较短,长10-300bp,在哺乳类基因组中重复106次左右,占基因组DNA序列总量的10-60%,人的基因组中这类序列约占20%,功能还不明了。2022-4-1484中度重复序列(moderate repetitive sequence

36、s),这类序列序列多数长100-500bp,重复101-105次,占基因组10-40%。例如哺乳类中含量最多的一种称为Alu的序列,长约300bp,在哺乳类不同种属间相似,在基因组中重复3-5105次,在人的基因组中约占7%,功能也还不很清楚。在人的基因组中18S/28SrRNA基因重复280次,5SrRNA基因重复2000次,tRNA基因重复1300次,5种组蛋白的基因串连成族重复30-40次,这些基因都可归入中度重复序列范围。2022-4-1485单拷贝序列(single copy sequences)。这类序列基本上不重复,占哺乳类基因组的50-80%,在人基因组中约占65%。绝大多数真

37、核生物生物为蛋白质编码的基因在单倍体基因组中都不重复,是单拷贝的基因。2022-4-1486从上述可见真核基因组比原核基因组复杂得多,至今人类对真核基因组的认识还很有限,即使现在国际上制订的人基因组研究计划(human gene project)完成,绘出人全部基因的染色体定位图、测出人基因组3109bp全部DNA序列后,要搞清楚人全部基因的功能及其相互关系、特别是要明了基因表达调控的全部规律,还需要经历很长期艰巨的研究过程。2022-4-14872022-4-1488真核生物和原核生物基因表达的对比真核生物和原核生物基因表达的对比2022-4-1489如前所述:基因表达是基因经过转录、翻译、

38、产生有生物活性的蛋白质的整个过程。同原核生物一样,转录依然是真核生物基因表达调控的主要环节。但真核基因转录发生在细胞核(线粒体基因的转录在线粒体内),翻译则多在胞浆,两个过程是分开的,因此其调控增加了更多的环节和复杂性,转录后的调控占有了更多的分量。 2022-4-1490真核细胞在分化过程中会发生基因重排(gene rearrangement),即胚原性基因组中某些基因会再组合变化形成第二级基因。例如编码完整抗体蛋白的基因是在淋巴细胞分化发育过程中,由原来分开的几百个不同的可变区基因经选择、组合、变化、与恒定区基因一起构成稳定的、为特定的完整抗体蛋白编码的可表达的基因。这种基因重排使细胞可能

39、利用几百个抗体基因的片段,组合变化而产生能编码达109种不同抗体的基因,其中就有复杂的基因表达调控机理。2022-4-1491此外,真核细胞中还会发生基因扩增(gene amplification),即基因组中的特定段落在某些情况下会复制产生许多拷贝。最早发现的是蛙的成熟卵细胞在受精后的发育程中其rRNA基因(可称为rDNA)可扩增2000倍,以后发现其他动物的卵细胞也有同样的情况,这很显然适合了受精卵其后迅速发育分裂要合成大量蛋白质要求有大量核糖体的需要。2022-4-1492真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结构、染色质中DNA和组蛋白的结构状态都影响转录

40、。2022-4-1493染色质结构影响基因转录 细胞分裂时染色体的大部分到间期时松开分散在核内,称为常染色质(euchromatin),松散的染色质中的基因可以转录。染色体中的某些区段到分裂期后不像其他部分解旋松开,仍保持紧凑折叠的结构,在间期核中可以看到其浓集的斑块,称为异染色质(hetrochromatin),其中从未见有基因转录表达;原本在常染色质中表达的基因如移到异染色质内也会停止表达;哺乳类雌体细胞2条X染色体,到间期一条变成异染色质者,这条X染色体上的基因就全部失活。可见紧密的染色质结构阻止基因表达。2022-4-1494 真核生物基因组至少包括两类遗传信息:第一类是三联体密码所编

41、码的蛋白质的基因信息,其遗传信息的传递包括基因转录和蛋白质合成过程,例如现在已经知道由于存在真核生物基因的不连续性,转录后的剪接、特别是可变剪接、RNA编辑2022-4-1495 (例如在单个前体mRNA编码序列中单个碱基的插入或删除等)以及翻译后的蛋白质肽链剪接等,可导致DNA序列与蛋白质氨基酸序列的不完全对应关系;而第二类遗传信息则指非编码蛋白质序列能调节基因选择性表达的遗传信息。已经知道,蛋白质基因只占整个真核生物基因组序列的较少部分,因此基因组中大部分DNA是用来编码第二类遗传信息的。 2022-4-1496在真核RNA聚合酶对启动子的亲和力很低,基本上不能独靠其自身来起始转录,而是需

42、要依赖多种激活蛋白的协同作用。真核基因调控中虽然也发现有负性调控元件,但其存在并不普遍;真核基因转录表达的调控蛋白也有起阻遏和激活作用或兼有两种作用者,但总的是以激活蛋白的作用为主。即多数真核基因在没有调控蛋白作用时是不转录的,需要表达时就要有激活的蛋白质来促进转录。换言之:真核基因表达以正调控为主导。2022-4-1497真核细胞的三种RNA聚合酶(、和)中,只有RNA聚合酶能转录生成mRNA,以下主要讨论RNA聚合酶的转录调控。2022-4-1498真核基因的顺式调控元件是基因周围能与特异转录因子结合而影响转录的DNA序列。其中主要是起正调控作用的顺式作用元件,包括启动子(promoter

43、)、增强子(enhancer);近年又发 现 起 负 调 控 作 用 的 元 件 沉 默 子(silencer)。2022-4-1499与原核启动子的含义相同,是指RNA聚合酶结合并起动转录的DNA序列,但真核不同启动子间不像原核那样有明显共同一致的序列,而且单靠RNA聚合酶难以结合DNA而起动转录,而是需要多种蛋白质因子的相互协调作用,不同蛋白质因子又能与不同DNA序列相互作用,不同基因转录起始及其调控所需的蛋白因子也完全相同,因而不同启动子序列也很不相同,要比原核更复杂、序列也更长。2022-4-14100真核启动子一般包括转录起始点及其上游约100-200bp序列,包含有若干具有独立功能

44、的DNA序列元件,每个元件约长7-30bp。最常见的哺乳类RNA聚合酶启动子中的元件序列见下表 。2022-4-14101表 哺乳类RNA聚合酶启动子中常见的元件元件名称元件名称共同序列共同序列结合的蛋白因子名称结合的蛋白因子名称 分子量分子量 结合结合DNA长度长度 TATA boxTATAAAA TBP 30,000 10bpGC box GGGCGG SP-1 105,000 20bpCAAT box GGCCAATCT CTF/NF1 60,000 22bp2022-4-14102启动子中的元件可以分为两种:核心启动子元件(core promoter element) 指RNA聚合酶起

45、始转录所必需的最小的DNA序列,包括转录起始点及其上游-25/-30bp处的TATA盒。核心元件单独起作用时只能确定转录起始位点和产生基础水平的转录。2022-4-14103上游启动子元件(upstream promoter elements) 包括通常位于-70bp附近的CAAT盒和GC盒、以及距转录起始点更远的上游元件。这些元件与相应的蛋白因子结合能提高或改变转录效率。不同基因具有不同的上游启动子元件组成,其位置也不相同,就使得不同的基因表达分别有不同的调控。2022-4-14104) ) 是一种能够提高转录效率的顺式调控元件,最早是在SV40病毒中发现长约200bp的一段DNA,可使旁侧

46、的基因转录提高100倍,其后在多种真核生物、甚至在原核生物中都发现了增强子。增强子通常占100-200bp长度,也和启动子一样由若干组件构成,其基本核心组件常为8-12bp,可以单拷贝或多拷贝串连形式存在。增强子的作用有以下特点:2022-4-14105增强子提高同一条DNA链上基因转录效率,可以远距离起作用,通常可距离1-4kb、个别情况下离开所调控的基因30kb仍能发挥作用,而且在基因的上游或下游都能起作用。增强子的作用与其序列的正反方向无关,将增强子方向倒置依然能起作用。而将启动子倒置就不能起作用,可见增强子与启动子是很不相同的。2022-4-14106增强子要有启动子才能发挥作用,没有

47、启动子存在,增强子不能表现活性。但增强子对启动子没有严格的专一性,同一增强子可以影响不同类型启动子的转录。例如当含有增强子的病毒基因组整合入宿主细胞基因组时,可能够增强整合区附近宿主某些基因的转录;当增强子随某些染色体段落移位时,也能提高移到的新位置周围基因的转录。使某些癌基因转录表达增强,可能是肿瘤发生的因素之一。2022-4-14107增强子的作用机理虽然还不明确,但与其他顺式调控元件一样,必须与特定的蛋白质因子结合后才能发挥增强转录的作用。增强子一般具有组织或细胞特异性,许多增强子只在某些细胞或组织中表现活性,是由这些细胞或组织中具有特异性蛋白质因子所决定的。2022-4-14108 最

48、早在酵母中发现,以后在T淋巴细胞的T抗原受体基因的转录和重排中证实这种负调控顺式元件的存在。目前对这种在基因转录降低或关闭中起作用的序列研究还不多,但从已有的例子看到:沉默子的作用可不受序列方向的影响,也能远距离发挥作用,并可对异源基因的表达起作用。2022-4-14109以反式作用影响转录的因子可统称为转录因子(transcription factors,TF)。在真核细胞中RNA聚合酶通常不能单独发挥转录作用,而需要与其他转录因子共同协作。与RNA聚合酶、相应的转录因子分别称为TF、TF、TF,对TF研究最多。下表列出对真核基因转录需要基本的TF。2022-4-14110表 RNA聚合酶的

49、基本转录因子转录因子转录因子分子量分子量(kD)功能功能TBP30与与TATA盒结合盒结合TF-B33介导介导RNA聚合酶聚合酶的结合的结合TF-F30,74解旋酶解旋酶TF-E34,37ATP酶酶TF-H62,89解旋酶解旋酶TF-A12,19,35稳定稳定TF-D的结合的结合TF-I120促进促进TF-D的结合的结合2022-4-14111以前认为与TATA盒结合的蛋白因子是TF-D,后来发现TF-D实际包括两类成分:与TATA盒结合的蛋白是TBP(TATAbox binding protein),是唯一能识别TATA盒并与其结合的转录因子,是三种RNA聚合酶转录时都需要的;其他称为TBP

50、相关因子TAF(TBP-associated factors),至少包括8种能与TBP紧密结合的因子。2022-4-14112作为蛋白质的转录因子从功能上分析其结构可包含有不同区域:DNA结合域(DNA binding domain),多由60-100个氨基酸残基组 成 的 几 个 亚 区 组 成 ; 转 录 激 活 域(activating domain),常由30-100氨基酸残基组成,这结构域有富含酸性氨基酸、富含谷氨酰胺、富含脯氨酸等不同种类;连接区,即连接上两个结构域的部分。2022-4-14113与DNA结合的转录因子大多以二聚体形式起作用,与DNA结合的功能域结构常见有以几种:螺

51、旋-转角-螺旋(helix-turn-helix,HTH)及 螺旋-环-螺旋(helix-loop-helix,HLH) 这类结构至少有两个螺旋其间由短肽段形成的转角或环连接,两个这样的motif结构以二聚体形式相连,距离正好相当于DNA一个螺距(3.4nm),两个螺旋刚好分别嵌入DNA的深沟。 2022-4-14114图 HTH结构及其与DNA的结合 2022-4-14115锌指(zinc finger) 其结构如下图 所示,每个重复的“指”状结构约含23个氨基酸残基,锌以4个配价键与4个半胱氨酸、或2个半胱氨酸和2个组氨酸相结合。整个蛋白质分子可有2-9个这样的锌指重复单位。每一个单位可以

52、其指部伸入DNA双螺旋的深沟,接触5个核苷酸。例如与GC盒结合的转录因子SP1中就有连续的3个锌指重复结构。2022-4-14116图 蛋白质的锌指结构2022-4-14117碱性-亮氨酸拉链(basic leucine zipper,bZIP) 这结构的特点是蛋白质分子的肽链上每隔6个氨基酸就有一个亮氨酸残基,结果就导致这些亮氨酸残基都在螺旋的同一个方向出现。两个相同的结构的两排亮氨酸残基就能以疏水键结合成二聚体,这二聚体的另一端的肽段富含碱性氨基酸残基,借其正电荷与DNA双螺旋链上带负电荷的磷酸基团结合。2022-4-14118若不形成二聚体则对DNA的亲和结合力明显降低。在肝脏、小肠上皮

53、、脂肪细胞和某些脑细胞中有称为C/EBP家族的一大类蛋白质能够与CAAT盒和病毒增强子结合,其特征就是能形成bZIP二聚体结构。2022-4-14119从上述可见:转录调控的实质在于蛋白质与DNA、蛋白质与蛋白质之间的相互作用,构象的变化正是蛋白质和核酸“活”的表现。但对生物大分子间的辨认、相互作用、结构上的变化及其在生命活动中的意义,人们的认识和研究还只在起步阶段,其中许多内容甚至重要的规律我们可能至今还一无所知,有待于努力探索。2022-4-14120真核生物基因组中只有10%的基因是工作的,而且,真核细胞有高度的分化,各个细胞并不表达全部的基因。因此,在基因表达之前,真核基因组要进行一系

54、列的调整,即通过改变DNA序列和染色质结构从而影响基因表达,使该表达的基因进入工作状态,而不该表达的基因则被很好地安置,以免干扰了整个机体的代谢,这就是转录前的调节,包括五个方面:2022-4-14121这是一种用激烈手段来处理掉不转录基因的方法。在胚胎发生时,已决定了一些细胞将要发育为种细胞,为了保持物种在遗传上的稳定性,而保留完整的基因组,不会被削减掉。但对于发育成体细胞的来说,它们只需保存生活必须的基因,其它无关基因可以削减去除。 2022-4-14122 基因削减现象在许多生物细胞中都已见到,比如,原生动物、线虫、昆虫、甲壳类都见到染色体的丢失,研究得比较多是尖毛虫和马蛔虫。在哺乳动物

55、的淋巴细胞分化,形成浆细胞时,由于免疫球蛋白基因的重排,也发生了基因削减的现象。2022-4-14123为了得到大量的专一的基因产物,一是调节基因的工作量,使一个基因能产生出许多的基因产物来,这也叫蛋白质合成的放大。另一种方式是增加这个基因的拷贝数,即基因的扩增。2022-4-14124某些脊椎动物和昆虫的卵母细胞,在分裂时要合成大量的蛋白质,这需要大量的核糖体。尽管作为核糖体主要成分的rRNA的基因是中度重复顺序,但此时仍嫌不够,于是rDNA基因必须扩增。例如非洲爪蟾的二倍体卵母细胞发育到四倍体时,rDNA扩增了二千多倍。这时细胞核的核仁数目也由4个变成6001000个。由于rDNA的扩增,

56、使每个卵母细胞迅速蓄积起105个核糖体。如果没有基因的放大,要在一个细胞中积累105个核糖体,就需要500年的时间。2022-4-14125rDNA扩增的机制被认为带有rDNA的核小体从染色体上掉下来,然后rDNA与组蛋白分离,rDNA再以原核生物DNA复制的方式滚动环复制大量复制自己。当然rDNA扩增只发生在卵生成时,一旦细胞分裂完成,rDNA就不再扩增,扩增的便逐渐消失,而以正常的状态工作。 另外有些体细胞(如癌细胞)基因,在某种选择压力下也会被迫扩增。有些基因在进化过程中就已经扩增了许多倍。2022-4-14126基因重排是基因表达调节控制的重要方式之一。 基因重排会导致基因的活化。比如

57、,许多原致癌基因在它们处于原先的染色体时,是不活化的。一旦发生基因重排,这些基因由一个染色体转座到另一个染色体时,就被激活,而最终导致细胞的癌变。如cmyc基因在人第八号染色体上面时,是无活性的。但当它转座到第14号染色体时就活化了,产生cmyc蛋白,2022-4-14127使人患上Burkit淋巴癌。又如,cabl基因在正常情况下位于9号染色体上,生产P150蛋白,当它转座到22号染色体时,就活化产生P210蛋白,这种蛋白质有激酶活性,使细胞癌变。 基因重排也是细胞分化的机制之一。哺乳动物在受到外源蛋白侵染时,淋巴细胞会发生分化,变成浆细胞,每一个浆细胞只能产生一种或几种抗体(免疫球蛋白),

58、无数的浆细胞就能产生无数种类的抗体。2022-4-14128抗体分子由两条轻链(L)和两条重链(H)所组成,它们分别由三个独立的基因族所编码,分别位于不同染色体上。轻链包括可变区、恒定区以及二者之间的连接区。每个区域都由位于同一染色体不同位置的DNA片段编码,在形成活性基因前,一个可变区基因和一个恒定区基因及其上游的某一个连接区通过染色体内重组而连到一起。2022-4-14129对于重链,除上述三区外,还包括一个介于可变区和连接区之间的歧化区,歧化区由同一染色体上另一DNA片段中几个患联的D编码,重链活性基因的形成涉及到将这些区通过染色体内重组而连接起来。除可变区外,歧化区和连接区也是增加特异性抗体数目的因素,因此淋巴细胞可根据抗原的不同情况,连接不同的可变区、歧化区和连接区使细胞产生各种不同的特异

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论