在大肠杆菌中高效表达外源蛋白的策略_第1页
在大肠杆菌中高效表达外源蛋白的策略_第2页
在大肠杆菌中高效表达外源蛋白的策略_第3页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、在大肠杆菌中高效表达外源蛋白的策略本世纪 60 至 70 年代对大肠杆菌的研究使之成为自然界中最普遍为人们所认识的生物 体。大肠杆菌具有两个显著特征: 操作简单和能在廉价的培养基中高密度培养, 它的这些特 征加上十多年外源基因表达的经验使其在大多数科研应用中成为高效表达异源蛋白最常用 的原核表达系统。 尽管大肠杆菌有众多的优点, 但并非每一种基因都能在其中有效表达。 这 归因于每种基因都有其独特的结构、 mRNA 的稳定性和翻译效率、蛋白质折叠的难易程度、 宿主细胞 蛋白酶 对蛋白质的降解、 外源基因和 E.coli 在密码子利用上的主要差别以及蛋白质 对宿主的潜在毒性等等。 但知识的大量积累

2、还是有助于为表达方面某些特定的困难提供一般 的解决方法。大肠杆菌作为表达系统的主要障碍包括: 不能象真 核蛋白那样进行翻译后修饰、 缺乏将蛋白质有效释放到培养基中的分泌机制和充分形成二硫键的能力。 另一方面, 许多真 核蛋白 在非糖基化的形式下能保留其生物学活性, 因而也就可以用大肠杆菌来表达。 如何实 现外源基因在原核细胞中的有效表达,自 60 年代以来,对影响外源基因在其表达体系中表 达效率的各个因素作了大量实验研究,并有多篇归纳性综述发表1, 2,3。国内针对外源基因在原核细胞中高效表达的关键因素,构建了高效表达载体 4 ,并在此基础上成功表达 了一系列 细胞因子 的基因 5,6,7 。

3、我们在分析了国内外有关在原核系统中表达蛋白的实 验资料的基础上,对在大肠杆菌中高效表达外源蛋白的策略所涉及的内容进行全面的总结, 以期有助于我国在这方面的研究。1.有效表达载体的构型构建表达质粒需要多种元件, 需要仔细考虑它们的组合, 以保证最高水平的蛋白质合成。 E. coli 表达载体的基本结构如图 1 所示 8。RBS1mRHA 5J UAAGGAGG (N)s AUG (9瑰)16S rRNA 3詁UUCCUCCGUG(8粘)UUG (1%)启动子(以杂和的tac启动子为例)位于核糖体结合位点(RBS)上游10-100bp处,由调节 基因(R)控制,调节基因可以是载体自身携带,也可以整

4、合到宿主染色体上。E.coli的启动子由位于转录起始位点上游约35bp的六核苷酸序列(-35区)和一短序列隔开的另一六核苷酸序列(-10区)组成9,10,11。有许多启动子可用于在E.coli中的基因表达,包括来源于革兰氏阳性菌和噬菌体的启动子。理想的启动子具有以下特性:作用强;可以严格调控;容易转导入其他E.coli以便筛选大量的用于生产蛋白的菌株,而且对其诱导是简便和廉价的12。在启动子下游是RBS,其跨度约为 54个核苷酸,两端限定在-35 (戈)和mRNA编码序列的+19到+22之间13。 Shine-Dalgarno(SD)位点14,15在翻译起始阶段与 16S rRNA的3'

5、;端相互作用16。SD与起始密码子间的距离约为5-13bp17,而且此区的序列在mRNA转录物中应避免出现二级结构,否则将会降低翻译起始的效率18。在RBS的5'和3'端均为A丰富区19。转录终止子位于编码序列的下游,作为转录终止的信号20和组成发卡结构的保护性元件,阻止核酸外切酶对mRNA的降解,从而延长 mRNA的半衰期21。除了上述对基因表达的效率有直接影响的元件以外,载体还含有抗生素抗性基因,以方便质粒的筛选和传代。氨苄青霉素是最常用的抗性标记。但在生产人用治疗性蛋白时,最好选择其他抗性标记(如Tet)以避免可能发生的过敏反应 22。质粒的拷贝数由复制起点决定。在特殊情

6、况下,选用失控复制子能够获得大量的质粒拷贝数和较高产量的质粒编码蛋白23,24。但在另外一些情况下,选用超过pBR322的高拷贝质粒似乎并没有好处。而且已有资料表明,增加质粒的拷贝数降低 E.coli中胰酶的产量,在高拷贝质粒中,强启动子的存在严重影 响了细胞的活性25,26。转录水平调控1.启动子能在 E.coli 中发挥作用的启动子很多。 这些启动子必须具有适合高水平蛋白质合成的某些特 性。首先启动子的作用要强, 待表达基因的产物要占或超过菌体 总蛋白 的的 10-30% ;第二, 它必须表现最低水平的基础转录活性。 若要求大量的基因表达, 最好选用高密度培养细胞和 表现最低活性的可诱导和

7、非抑制启动子。如果所表达的蛋白具有毒性或限制宿主细胞的生 长,选用可抑制的启动子则至关重要 27,28 。例如,轮状病毒的 VP7 蛋白能有效地杀死 细胞,因此必须在严格控制的条件下表达29 。但在某些情况下, 启动子的严格性并不合理,因为即使最小量的基因产物也能由于其毒性而杀死细胞。 如能灭活核糖体或破坏膜渗透压的 分子对细胞来说是致死性的 30 。对宿主的毒性并不仅限于外源基因,某种自身蛋白的过量 表达也能造成同样的结果。 如编码外膜磷脂蛋白的 traT 基因 31 。另外, 不完全抑制的表达 系统会造成质粒的不稳定,细胞生长速度的下降和重组蛋白产量的降低32 , 33。Lanzer和 B

8、ujard 曾对常用的 lac 启动子 -操纵子系统进行了广泛的研究,证明操纵子放在启动子序 列的不同位置会造成 70倍差异的抑制。将17bp的操纵子置于-10和-35六聚体区之间所形 成的抑制比将其放在 -35 区的上游或 -10 区的下游要高 50-70 倍34。启动子的第三个特性 是其简便和廉价的可诱导性。大量生产蛋白质最常用的启动子是热诱导(入PL和化学诱导(trp)启动子。异丙基硫代-B-D-半乳糖苷(IPTG )诱导的杂交启动子 tac35或trc36都是 强启动子, 在基础研究中应用很广。 但在大量生产人用治疗性蛋白时用 IPTG 做诱导剂是不 可取的,因为 IPTG 具有毒性而

9、且价格昂贵 37。 IPTG 的这些不足至今仍限制 tac 或 trc 强 启动子在大量生产人用治疗性蛋白中的应用。编码热敏 lac 阻遏蛋白 38的突变 lacI(Ts) 基因的出现使得目前能够对这些启动子进行热诱导 39, 40。另外, 还出现了一些新型载体, 它们允许在30 C对trc启动子进行严紧调节。最近还报道了两种不同的lac阻遏蛋白突变体, 能够同时允许热诱导和 IPTG 诱导41 , 42。尽管野生型 lacI 基因也能热诱导,但不能对其 进行严紧型调节,且不能用于 lacIq 菌株,因为温度的变化不能遏制由 lac 阻遏蛋白的过量 表达所造成的严紧性抑制 43。因此,该系统只

10、能用用于生产对宿主菌无害的一些蛋白。冷反应启动子尽管不象其他启动子那样得到广泛的研究, 但已经被证明能在低温条件下进行 有效的基因表达。噬菌体APl启动子的活性在20 C时最高,随着温度的升高,其活性逐渐降低44。Pl启动子的冷反应由 E.coli整合宿主因子,一种与DNA结合的序列特异性多功能蛋白来正调控 45, 46。主要冷应激基因 cspA 启动子同样也被证明在低温具有活性 47。对 cspA 和 PL 启动子进行分子剖析,鉴定了在较低温度下参与增强转录的特异性 DNA 区 域。从而开发了一系列在 20 C低温具有高活性的 PL衍生启动子48。选用冷反应启动子 的基本原理是在15-20

11、C的条件下,蛋白质的折叠速度只受到轻微的影响, 而作为生物化学 反应, 转录和翻译的速度将被充分降低。 这就为蛋白质折叠、 产生有活性的蛋白和避免非活 性蛋白聚合体即包涵体的形成提供了充足的时间, 而目的蛋白的最终产量并未减少。 最近新 报道的一些启动子具有诸多诱人之处,为选择新的高效表达系统提供了方便。如非常强的 pH启动子 49, 50,重组蛋白的产量可达 总蛋白 的 40-50%51 。但表达的水平会因不同的基因 而有差异。因为蛋白质的合成不仅依赖于启动子的强弱,而且有赖于转录的效率。人们通常只考虑 E.coli 启动子的核心区域,即 -10 和-35 六核苷酸区和一 15-19bp 的

12、间隔序 列。但有人提出核心序列以外的元件也能刺激启动子的活性 52。许多研究也已证明,核心 启动子上游的序列能够在体内提高转录起始的效率 53, 54, 55。 Gourse 等证明,位于 E. coli rRNA 启动子 rrnB P1 -35 区上游的 DNA 序列即 UP 元件,能够在体内和体外提高转 录效率 30 倍 56 。 UP 元件是作为一个独立的启动子组件发挥作用的,因为将其融合到其 他启动子如 lacUV5 中也能刺激转录 57,58 。 UP 元件与其他启动子融合所表现的这种转录 增强子效应,使其有望通用于高效表达系统。 尽管已经证明 rRNA 启动子 P1 、P2 的超强

13、能 力59 ,但它们仍未被用于 E.coli 进行高水平表达,其主要原因是难以对其进行调控。 rRN A 的体内合成从属于细胞增殖速度的控制。在细胞快速增殖期,P1 和 P2 是活化的,当细胞处于生长的静息期,则 P1 、P2 被负调节。因此, rRNA 启动子在前诱导期将持续活化。 在体内快速增殖的细胞中, P2 的活性很弱,而且可诱导性差,但若与 P1 分开, P2 启动子 的活性明显升高(达到 P1 的 70% ),且对应激反应敏感。这表明在天然的串联体中, P2 是部分关闭的 60 。 Brosius 和 Holy61 将 lac 操纵子序列插入到 rrnB rRNA P2 启动子的

14、下游,在带有 lacIq 基因的菌株中成功地抑制了 P2 的活性。转录活性是以氯霉素乙酰 转移 酶的产生和 4.5s RNA 的表达为标准的。然而, P2 构建体的活性只相当于 tac 启动子活性 的 1/2 ,而且当 rrnB P1 启动子被置于 P2 启动子下游时,不能完全抑制转录。有人试图利 用反转启动子的方向来严格调控 rRNA 启动子。 将 rRNA 启动子克隆于目的基因的上游, 但 转录方向相反。利用入整合位点和可调控的入整合酶来实现启动子的反转,从而达到进行诱 导的目的, 而且, 在高度活化的启动子上游有一强转录终止子将避免在前诱导期可能出现的 载体的不稳定性。2. 转录终止子在

15、原核生物中, 转录终止有两种不同的机制。 一种是依赖六聚体蛋白 rho 的 rho 依赖性转录 终止, rho 蛋白能使新生 RNA 转录本从模板解离。另一种是 rho 非依赖性转录终止,它特 异性依赖于模板上编码的信号,即在新生 RNA 中形成发卡结构的一回文序列区,和位于该 回文序列下游 4-9bp 处的 dA、dT 富含区 62,63 。虽然转录终止子在表达质粒的构建过程中 常被忽略,但有效的转录终止子是表达载体必不可少的元件, 因为它们具有极其重要的作用。 贯穿启动子的转录将抑制启动子的功能,造成所谓的启动子封堵 64 。这种效应可以通过在 编码序列下游的适当位置放置一转录终止子, 阻

16、止转录贯穿别的启动子来避免。 同样地, 在 启动目的基因的启动子上游放置一转录终止子,将最大限度地减小背景转录 65 。另有资料 证明,由强启动子启动的转录会使转录通读到复制区,造成控制质粒拷贝数的 ROP 蛋白的 过量表达,从而导致质粒的不稳定 66 。另外,转录终止增强 mRNA 的稳定性 67 ,从而提 高蛋白质的表达水平。如果来源于 E.coli rrB rRNA 操纵子的两个转录终止子 T1 和 T2 串 联,则效果更好 68 。但其他的许多转录终止子通常情况下都是十分有效的。3转录抗终止子细菌中许多参与 氨基酸 生物合成的操纵子在其第一个结构基因的5'端含有转录衰减子。 衰

17、减子由特定操纵子的 氨基酸 产物调节。 这样关联的带电荷 tRNA 的存在就会在核糖体剪切之后 引导初始转录本中二级结构的形成。 如果没有关联的带电荷 tRNA ,则会形成抗终止子结构, 从而抑制终止子中发卡结构的形成和转录的终止 69 。抗终止元件能使 RNA 多聚酶越过核 糖体 RNA 操纵子中的 rho 依赖性终止子即 boxA70,71 。转录抗终止是有一个极其复杂的 过程, 其中包含许多已知和未知因子。 有关这方面的知识已有详尽的综述。 在此我们主要讨 论抗终止元件在 E.coli 中表达外源基因的应用。在 E.coli 表达系统中作用比较强、应用较广的一个启动子是噬菌体 T7 晚期

18、启动子 72,73 。 该系统的活性依赖于提供 T7 RNA 多聚酶的转录单元。 RNA 多聚酶的严格阻遏对防止 T7 启动子的渗漏是必需的。有许多用于调节 T7 多聚酶表达的途径,但每一种方法都有其各自 的缺陷。Merten等通过构建一基于入P调节的反转衰减 T7 RNA多聚酶表达盒阐明了这一问题。可以通过在启动子和编码 T7 多聚酶的基因之间插入三个串联排列的转录终止子来削 弱T7多聚酶的基础表达水平。在诱导的情况下,噬菌体 入来源的nutL依赖的抗终止功能 也可以协同来阻止转录终止 74。来源于 E.colirrnB rRNA 操纵子的转录抗终止区已被用于 某些表达载体如 pSE420

19、。该载体应用 trc 启动子 75 。其基本原理是使得转录通过重度二 级结构区,从而减少宿主 RNA 多聚酶引起的转录提前终止的可能性。但是 rrnB 抗终止子 在这种情况下似乎并不十分有效。4严紧型调节表达系统可严紧调节的启动子的优点使得我们能够设计许多巧妙、 可高度抑制的表达系统。 这在表达 那些产物对宿主的生长不利的基因时尤其有用。所用的策略包括 “铺平板 ”法76 ;提高抑制 基因和操纵基因的比例 77 ;用突变的噬菌体感染诱导 28 ;致弱高拷贝数载体上的启动子 活性 78;利用转录终止子和抗终止子 79 ;在拷贝数可控的质粒中使用可诱导的启动子80;使用 “交叉调节 ”系统 81

20、;共转导使用 SP6 RNA 多聚酶的质粒 82 ;利用与 克隆 基因 mR NA互补的反义RNA31。最后一个巧妙的方法是反转启动子:在启动子两侧为两个入整合位点,启动子的方向与基因的表达方向相反,而且只通过由入整合酶介导的诱导位点特意性遗传重组来完成反转 83,84 。上述这些系统也各有其优缺点。 即依赖固体培养基的方法不适用于大批量表达, 高水平抑制 系统常造成蛋白质产量的下降 85,这就有必要优化抑制基因和操纵基因的比例86。由入噬菌体介导的诱导更增加了系统的复杂性, 利用反转启动子迂回方法又引入了复杂的载体结 构。尽管这些表达系统大多数尚未用于蛋白质的大规模、 高产量生产, 但是它们

21、为基因表达 提供了重要的工具。翻译水平的调控1 mRNA 翻译起始 有关转录过程的大量知识使得能够在不被附近核苷酸序列影响的情况下,在表达盒中使用原核启动子 87。对于决定蛋白质合成的起始因素, 虽然尚不能完全弄清楚, 但目前已经明白, mRNA 转录本 5'末端的独特结构是 mRNA 翻译起始效率的最主要决定因素。 至今还没有发 现通用的有效起始翻译的共同序列。已知序列的绝大部分(91 % )E.coli 基因的翻译起始区均含有起始密码子 AUG , GUG 的利用率为 8%,而 UUG 的利用率则为 1%88,89 。 Shine -Dalgarno(SD) 位点在翻译起始阶段与

22、16S rRNA 的 3'端相互作用。 SD 与起始密码子间的 距离约为 5-13bp ,这一距离影响翻译起始的效率 90。人们对此进行了深入的研究, 以确定 最佳的SD区序列和SD与起始密码子之间的最有效间隔91,92。Ringquist等93研究了 RBS 的翻译功能,得出了以下结论:( 1)在间隔相同的情况下, UAAGGAGG 的 SD 序列 比 AAGGA 的 SD 序列能使蛋白质的产量提高 3-6 倍;( 2 )对于同一 SD 序列,存在一最 佳的间隔。 AAGGA 的间隔为 5-7 个核苷酸, 而 UAAGGAGG 的间隔为 4-8 个核苷酸; (3) 对于同一 SD 序

23、列,有一翻译所必需的最小间隔。 AAGGA 的最小间隔为 5个核苷酸,而UAAGGAGG 的最小间隔为 3-4 个核苷酸。这些间隔提示,在 16S rRNA 的 3'末端和结合 于核糖体 P 位点的 fMet-tRNA f 的反义密码子之间存在精确的物理关系。在 mRNA 的翻译起始区的二级结构在决定基因表达效率方面具有重要作用 94,95,96 。如用 一发卡结构封闭 SD 区和 /或 AUG 密码子就会阻止其与 30S 核糖体亚单位的结合,从而抑 制翻译 97 。已经设计了几种不同的策略以使 mRNA 形成二级结构的可能性最小。提高 RB S中A、T残基的丰度能增强某些基因的表达

24、98。同样地,突变 SD区上游或下游的某些 特定核苷酸就会抑制 mRNA 二级结构的形成和提高翻译效率 99 。另一途径得益于在 E.col i 中自然发生的一种翻译偶联现象 100 。翻译偶联的机制已被用来解释来自多顺反子 mRNA 的不同基因的并列表达。已经证明,当 galK 与上游基因偶联翻译时,经修饰的 gal 强启动 子能够指导半乳糖 激酶的高水平合成。这提示即使很弱的RBS,如果与核糖体结合也能非常有效。 这种调节机制有可能在蛋白质超量生产生物技术中发挥重要作用。事实上, 翻译偶联已经被广泛用于不同基因的高效表达。除了 SD 区与 16S rRNA 结合之外, mRNA 和核糖体的

25、其他相互作用也参与翻译的起始。 如核糖体 S1 蛋白直接参与 30S 亚基对 mRNA 的识别和结合 101。2翻译增强子 已经在细菌和噬菌体中鉴定了一些在 E.coli 中显著增强异源基因表达的序列。 Olins 等从 T 7 噬菌体基因 10 前导序列( g10-L )中鉴定了一 9bp 的序列,该序列似乎能替代有效的 R BS。同SD共有序列相比,g10-L能使多种基因的表达水平提高40-340倍102。若将其置于合成SD序列的上游,按照 伊半乳糖苷酶的活性与 LacZ mRNA的水平来估计,g10-L 序列能使 LacZ 的翻译水平提高 110 倍103。另外的研究小组在 mRNA 的

26、 5'非翻译区( U TR )鉴定了一 U 富含序列,该序列同样具有翻译增强子活性。McCarthy 等104在 E.coliatpE 基因中紧接于 SD 位点下游鉴定一类似区域。有文献用一 30bp 的序列超量产生 IL-2 和IFN- 3 105。另有人证明在编码 RNase D的rnd mRNA SD位点的上游, 有一 U8序列 对该 mRNA 的有效翻译是必需的。 缺失这一区域会显著降低翻译, 但不影响 rnd mRNA 的 水平和转录起始位点 106。研究证明这些类似序列的靶位是 30S 核糖体亚单位的 S1 蛋白1 07。在另一项有趣的研究中,研究者证明在紧接起始密码子下游

27、的序列在翻译起始过程中 发挥重要作用。 位于 T7 基因 0.3 编码区 +15 至+26 之间或位于 T7 基因 10 编码区 +9 至+21 之间被称做下游框(DB )的特定区域具有翻译增强子的功能。DB区与16S rRNA的1469-1483核苷酸互补,这一区域称做反下游框( ADB )。缺失DB将废除翻译活性。相反,女口 果优化 DB 和 ADB 之间的互补则会以最高水平表达 dhfr 融合基因。有趣的是,如果将 DB 从起始密码子的上游移到 SD 序列的位置, DB 则失去功能。 DB 序列存在于一些 E.coli 和 噬菌体基因中 108,109 。上述这些发现充分证明,除了 SD

28、 位点和起始密码子以外, mRNA 中的其他序列对于有效 的翻译也是重要的。尽管其精确的机制还不太清楚, 但有可能利用翻译增强子来达到超量表 达蛋白质的目的。3mRNA 的稳定性mRNA 的快速降解势必影响蛋白质的产生。因此在这一部分重点阐述决定 mRNA 稳定性的 因素,这将在 E.coli 高效表达外源基因中有实际应用。在 E.coli 中有多种不同的 RNase 参 与mRNA的降解,其中包括内切 核酸酶(RNase E, RNase K 和RNase III )和3'外切核酸 酶(RNase II和多聚核苷酸磷酸化酶PNPase),目前尚未在原核细胞中发现5'外切核酸酶

29、110。mRNA的降解并非由非特异性的外切核酸酶随机剪切而引起,因为在mRNA的长度和半衰期之间并没有反向相关性 111 。已经证明,在 E.coli 中有两类保护性元件能够稳定 mRNA。一类由mRNA的5' UTRs中的序列组成112;另一类由 3' UTRs和多顺反子间区 的发卡结构组成 113。其中一些元件与异源 mRNA 融合后起稳定剂作用,但只在严格的条 件下如此。例如,噬菌体T4基因32的5' UTR在 T4噬菌体感染的细胞中延长非稳定mRNA在 E.coli 中的半衰期 114。革兰氏阳性菌如金黄色葡萄球菌和枯草杆菌的红霉素抗性基因(erm )编码的mR

30、NA 5 UTR含有稳定元件。但 ermC和ermA 5' UTRs的稳定作用需要由抑制翻译和引起核糖体失控的 抗生素来诱导115。同样,噬菌体 入PL对于入PLtrp转录本 的稳定作用需要 入噬菌体的感染116。与此相反,E.coli ompA转录本能够在细胞快速增殖 的正常情况下延长一系列异源mRNA在E.coli中的稳定性117。Emory等证明,在接近或紧接ompA 5' UTR的 5'末端存在发卡结构对于其稳定效果是必需的。而且可以通过在5'末端添加发卡结构来延长在正常情况下不稳定的 mRNA 的半衰期 118。这样看来,对异源基 因添加ompA 5&

31、#39;稳定元有可能提高 E.coli中的基因表达。另一类由3' UTF组成的mRNA保 护性元件能够形成发卡结构,因而能够阻断外切核酸酶从3'末端对转录本的降解 113。Wong 和 Chang119 在苏云金杆菌的晶体蛋白基因的转录终止子中鉴定了一个这样的元件。将该阳性反调节子”与地衣杆菌的青霉素酶基因(penP)的3'末端和人IL-2 cDNA融合,能够延长 mRNA 的半衰期,且提高了相应多肽在枯草杆菌和E.coli 中的产量。然而,同某些 5'稳定元一样,这类 3'反向调节子不可能作为一个通用的mRNA 稳定元。而且有证据表明,可以通过选用缺乏

32、某些特定 RNase 如 RNaseII 或 PNPase 的宿主菌来提高基因的表达。 这同样并非一有效途径。因为缺乏 RNaseII 或 PNPase 与 RNase 过量表达一样,对于 E.coli 整体 mRNA 的平均半衰期并无多大影响。 而且缺乏 RNaseII 或 PNPase 的菌株常常是不稳 定的 120,121 。4翻译终止在 mRNA 中存在终止信号是翻译终止过程必不可少的。除了三个终止密码子UAA 、UGA 、和 UAG 外, 翻译终止这一复杂事件还包括核糖体、 mRNA 和终止位点的几种释放因子的特 异相互作用 122 。在 E.coli 中, RF-1 在终止密码子

33、UGA 处终止翻译; RF-2 在 UAA 密码 子处终止翻译 123 。最近还 克隆 了另外一个因子 RF-3124 。在设计表达载体时, 通常插入三个终止密码子以防止核糖体的跳跃。 在 E.coli 中偏向于使用 UAA 密码子 125 。一项对于 2000 多个 E.coli 基因的统计分析表明,在终止密码子和紧接 三联体的核苷酸序列中存在局部非随机性 126 。同时他们还利用体内终止试验测定 12 个可 能的四核苷酸 “终止信号 ”( UAAN 、UGAN 、UAGN )的终止力量。在体内终止试验中,通 过其与框架移位的竞争测定其终止效率。 转录效率依据终止密码子和第四个核苷酸而有显著

34、 的差异,这种差异从 80% (UAAU )到 7%(UGAC )不等。这些研究表明,紧接终止密码 子后的核苷酸特性强烈地影响E.coli中的翻译终止效率127。 UAAU是E.coli中最有效的转录终止序列。此外,终止密码子5'末端的邻近序列也影响终止的效率。因此,新生肽中倒数第二位(-2位)C-末端氨基酸残基的电荷和疏水性能引起多达30倍不同的UGA终止效率,而在UAG位的终止对于-2位氨基酸残基的特性不敏感 128。对于-1位,a螺旋、俟 链和回转倾向是 UGA 终止中的决定因素 129。蛋白质靶向确定将目的蛋白表达在特定的细胞室, 即细胞质、 细胞间质或是培养基中, 需要权衡各

35、自的 利弊。1 细胞质表达 包涵体的形成仍然是在细胞质中进行基因表达的一个主要障碍。包涵体虽然具有多方面的好处,但这些优越之处与后期繁琐的蛋白重新折叠工作、 重叠蛋白的生物活性的未知性以及重 叠和纯化后蛋白的总产量降低相比, 则显得微不足道。 至今尚不明了包涵体形成的精确机制。 对于形成和不形成包涵体的 81 种蛋白质的统计学分析表明, 有 6 个主要的理化指标与此有 关。这 6 个指标是电荷平均数、转变形成的残基组分、半胱氨酸组分、脯氨酸组分、亲水 性和残基总数。 其中前两个指标与包涵体形成密切相关。 一种基于这些指标的模型可以根据T 细胞受体某种蛋白质的氨基酸组成来预测包涵体形成的可能性。

36、该模型曾成功地预测人V3 5.3在E.coli中的可溶性130。已经建立了多种策略以帮助蛋白质天然空间结构的形成 1 3 1 。这些策略包括在较低温度下培养细菌 132,选择不同的 E.coli 菌株1 33 ,替换某些氨基酸残基 1 34 ,与分子伴侣共表 达135,136,137 ,利用高溶解性的多肽作为共表达分子1 38 ,在山梨糖醇和甘氨酸三甲内盐存在时,以低渗透压培养和诱导细胞 1 39 ,改变培养基的 pH 值140 。与分子伴侣共表 达或许是一种有望提高蛋白质可溶性和折叠效率的途径141 。但这种策略似乎具有蛋白质特异性 142 。即便在分子伴侣存在的条件下,仍有多种因素使得过量

37、表达的蛋白不能折叠 成其天然构象。这些因素包括缺乏二硫键和/或翻译后修饰;细胞质的氧化还原状态妨碍了二硫键的形成。在 E.coli 中,有两条途径参与二硫键的还原。即硫氧还蛋白系统,该系统由 硫氧还蛋白 还原酶 和硫氧还蛋白组成; 谷氧还蛋白系统, 该系统由谷胱甘肽 还原酶 、谷胱甘 肽和三种谷氧还蛋白组成 143。制造次还原细胞质环境,以利于二硫键形成的策略包括选 用硫氧还蛋白还原酶( trxB )缺陷的 E.coli 菌株 ,这有助于巯基还原势能。 蛋白质在细胞质中被降解的可能性比其他细胞室要大得多。 因为在细胞质中含有大量的 蛋白 酶。另外, 从细胞质蛋白 混合物中纯化目的蛋白相对比较困

38、难, 因为在此细胞室包含总细胞 蛋白的绝大部分蛋白 144。2细胞外周质表达在细胞外周质进行蛋白质表达有许多优越之处。在外周质只有4% 的总细胞蛋白,这显然有利于目的蛋白的纯化, 外周质的氧化环境有利于蛋白质的正确折叠, 在转移到外周质的过程 中,信号肽在细胞内剪切更有可能产生目的蛋白的天然N-末端。此外,外周质中的蛋白质降解也少得多 145 。蛋白质通过内膜转运到外周质需要信号肽 146, 147, 148 。许多原核 和真核细胞来源的信号肽已成功地用于 Ecoli 中蛋白质从内膜到外周质的转运。如 E.coli 的 PhoA 信号 149 、OmpA150 、OmpT151 、LamB 和

39、 OmpF152 以及金黄色葡萄球菌的 A 蛋白 153,鼠 RNase154 和人生长 激素信号肽 155等。 但是, 蛋白质转运到细菌外周质是 一个特别复杂和尚未完全明了的过程, 信号肽的存在并不总能保证有效的蛋白质通过内膜转 运156。改善蛋白质转运到外周质的策略包括提供蛋白质转运和加工所需的成分:过量表 达信号肽酶 I157 ,利用 prlF 突变株158,共表达参与膜转运的几种蛋白质,降低蛋白质 的表达水平以防止转运工具的过载 159。3 细胞外分泌(外泌) 将蛋白质分泌到细胞外是人们最期望的一种策略。 因为这样容易纯化目的蛋白质, 减少细菌 的蛋白酶对目的蛋白质的裂解。但是, E.

40、coli 在正常情况下只有很少量的蛋白质分泌到细胞外。要解决蛋白质外泌方面的难题,必须弄清 E.coli 的分泌途径。 Pugsley160 对革兰氏 阴性菌的分泌途径进行了详细的研究。 在 E.coli 中将蛋白质分泌到培养基中的方法大致分为 两类:(1)利用已有的 “真正”的分泌蛋白所采用的途径 161 ;(2)利用信号肽序列、融合伴 侣和具有穿透能力的因子。 第一种方法具有将目的蛋白质特异性分泌的优点, 并最小限度地 减少了非目的蛋白的污染。 最突出的例子是溶血素基因, 该基因曾被用于构建分泌的杂交蛋 白 162 , 163 ;第二种方法依赖于有限渗透的诱导而导致蛋白质的分泌。例如应用

41、pelB164 、ompA165 和 A 蛋白引导序列 153 , 166 ;与细菌素释放蛋白的共表达167 ;丝裂霉素诱导的细菌素释放蛋白和在培养基中添加甘氨酸 168 以及与 kil 基因共表达而进行 膜穿透 169 。但通常情况下,外泌蛋白质的产量是中等的。有文献报道 170 ,在大肠杆菌 表达系统中,金黄色葡萄球菌 A 蛋白的信号肽能引导带有 E 结构域的 A 蛋白片段或融合产 物从细胞质外泌到培养基中,蛋白的外泌表达发生于细胞生长后期。但所用的启动子为 A 蛋白自身的启动子, 该启动子在大肠杆菌中为非可控性的组成性表达, 且强度较弱。 如果能 利用可控的强启动子进行 A 蛋白信号肽引

42、导的基因表达,则有望在蛋白质外泌方面有所突 破。目前我们正在进行这方面的尝试,且已经取得初步成效。密码子的使用 原核和真核生物的基因对同义密码子的使用均表现非随机性171 ,172 。对 E.coli 中密码子的使用频率进行系统分析得到以下结论 173 :(1 )对于绝大多数的简并密码子中的一个或 两个具有偏好; ( 2)某些密码子对所有不同的基因都是最常用的,无论蛋白质的含量多少, 例如 CCG 是脯氨酸最常用的密码子; ( 3)高度表达的基因比低表达的基因表现更大程度的 密码子偏好;( 4)同义密码子的使用频率与相应的tRNA 含量有高度相关性。 这些结果暗示 ,富含 E.coli 不常用

43、密码子(表 1 )的外源基因有可能在 E.coli 中得不到有效表达。已经证明 174 ,微精氨酸 tRNAArg(AGG/AGA) 是多种哺乳动物基因在细菌中表达的限制因子。 因为 AGA 和 AGG 在 E.coli 中不常用。如果共表达编码 tRNAArg(AGG/AGA) 的 argU(dnaY) 基 因,就会高水平表达目的蛋白 174 。但利用同方法所进行的另外几项研究的结果却不一致 175 ,176。其他的研究表明,通过用常用密码子替换稀有密码子或与稀有” tRNA基因共表达可以提高外源基因在 E.coli 中的表达水平 177, 178 。许多研究者对有关密码子使用模 式的进化意

44、义和密码子使用效果的机制进行了研究, 但至今尚未找到协调密码子的使用和转 录本翻译的精确规则。似乎在转录本5'末端附近存在稀有密码子将会影响翻译效率。另外,基因5'编码区中GC含量似乎也影响其表达。 这在人胸苷酸 激酶(TS )中已经得到证明179。在不改变所编码蛋白的前提下,将 TS cDNA 的第三、四、五密码子的嘌呤碱基变成胸腺嘧 啶,使得 TS 基因的表达占到 E.coli 中总蛋白量的 25-30% 。综上所述,有许多可变因素可 能影响实验结果,如位置效应、稀有密码子的群集和 mRNA 的二级结构等等。 蛋白质的蛋白酶解 蛋白酶解是一个选择性的、高度调节的过程,该过程

45、参与许多代谢活动。 E.coli 在细胞质、 细胞外周质、内膜和外膜有许多蛋白酶180 ,181 。这些蛋白酶参与宿主的代谢活动,如选择性地清除异常和错误折叠的蛋白。 到目前为止, 蛋白酶解的机制尚未完全明了, 但已有一 些策略和方法以减少 E.coli 中异源蛋白的降解。 虽然使得蛋白质不稳定的精确结构特点还不 清楚,但是通过系统研究已经明确了一些蛋白不稳定的决定因素。蛋白酶解途径的“N末端规则”在 E.coli 中能够发挥作用,即蛋白质的稳定性与其氨基端的残基有关 182 。在 E.coli 中,N 末端 Arg、Lys、Leu、Phe、Tyr和Trp的半衰期为2分钟,而除脯氨酸外的其他

46、氨基酸的半衰期均超过 10 小时。有研究表明,在多肽的第二位带有较小侧链的氨基酸有利 于甲硫氨酸氨肽酶催化的N-末端甲硫氨酸的去除,从而暴露出位于第二位的亮氨酸,使得该蛋白不稳定 183。蛋白质的第二个决定因素是位于近氨基端的特异性内源赖氨酸残基142, 143。该残基是多遍在蛋白链的受体,多遍在蛋白链在真核细胞中有利于遍在蛋白依 赖的蛋白酶对蛋白质的降解。 有趣的是在一个多遍在蛋白中, 它的两个决定簇可以位于不同 的亚基上,却能靶向同一个蛋白进行加工 184 。 氨基酸成分和蛋白质不稳定性的另一个 关系体现在 PEST 假说中 185 。根据对短寿命真核蛋白的统计分析,蛋白质如果富含 Pro

47、、Glu 、 Ser 和 Thr 的区域,且在该区域附近有某些特定的氨基酸,则该蛋白就会不稳定。这 些 PEST 结构域的磷酸化导致钙的结合能力提高,从而利于钙依赖性蛋白酶对蛋白质的降 解。这提示可以在缺乏 PEST 蛋白裂解系统的 E.coli 中表达 PEST 富含蛋白。 减少 E.coli 中重组蛋白裂解的策略有以下几种:(1)将蛋白质靶向细胞周质或培养基145,186 ;( 2)在较低的温度下培养细菌187 ;(3)选用蛋白酶缺陷的菌株188 ;( 4)构建N-末端或C-末端融合蛋白186 ; ( 5)将目的基因多拷贝串联188 ; ( 6)与分子伴侣 共表达 189;( 7)与 T4

48、 pin 基因共表达 190; (8)替换特定的氨基酸残基以消除蛋白 酶裂解位点 191;(9)改善蛋白质的亲水性 1 92 ;( 1 0 )优化培养条件 193为 E.coli 中高效表达和纯化重组蛋白提供了极融合蛋白表达 在 E.coli 中表达外源蛋白, 尤其是真核蛋白时, 蛋白质的稳定性是经常遇到的问题。 最近几 年,众多巧妙的蛋白质 融合系统的发展,大方便。融合表达具有多方面的优点:如防止包涵体的形成, 促进蛋白质的正确折叠, 限制 蛋白酶解和利于纯化 159 ,194 。Uhlen和其同事195利用葡萄球菌A蛋白和合成的结构域 (Z)开发了一种多功能的融合伴 侣,除了能够作为纯化标

49、记外, A 蛋白组分还作为一种可溶性伴侣促进蛋白质的折叠, A 蛋 白信号肽的存在可使表达蛋白分泌到培养基中。另一个融合伴侣是链球菌G 蛋白( SPG),它是一种细菌胞壁蛋白,在其氨基端具有分离的白蛋白结合区,在OH 端具有 免疫球蛋白 IgG 结合区 196 。最小的白蛋白结合区由来源于 SPG 的 46 个氨基酸残基组成, 作为亲和纯 化标记纯化 cDNA 编码的蛋白。 如果将 A 蛋白和 SPG 结构域联合组成三联融合蛋白, 则为 纯化提供了更为广泛的选择,可以更进一步防止蛋白酶解。 SPG- 白蛋白的一个重要应用是 其能够稳定哺乳动物外周循环中的短寿命蛋白,这一效应是通过SPG 结构域

50、与一种长寿命蛋白 血清白蛋白的结合来介导的 197。最近又建立了一种更为复杂和巧妙的亲和系统 198。这种多元系统利用了七种不同的亲和 标记,从而允许使用多种结合和洗脱条件, 为重组蛋白的生产、 检测和纯化提供了一个有力 的工具。使用基因融合表达系统在 E.coli 中表达外源基因已经越来越受欢迎。 这在很大程度上归因于 融合系统能够产生大量的可溶性的融合蛋白。谷胱甘肽S-转移酶(GST )、麦芽糖结合蛋白( MBP )以及硫氧还蛋白( Trx )均已经被证实能非常成功地生产正确折叠、有生物活 性的蛋白质, 能明显提高在 E.coli 细胞质中产生的融合蛋白的可溶性, 并能抑制包涵体的形 成1

51、59 ,194 。其中每一种都备有方便的纯化方法,可将融合蛋白与细胞污染物分开。已经 建立了多种对融合蛋白进行位点特异性裂解的方法, 方法的选择通常由特定蛋白的组成、 序 列及物理性质决定199。可采用诸如溴化氰(MetJ)、羟胺(As nJ Gly)、等试剂或低 p H(AspJ Pro)来进行融合蛋白的化学裂解。化学裂解的方法较便宜而且有效,甚至常常可以 在变性的条件下裂解非变性不能溶解的蛋白质。 但有时目的蛋白中存在裂解位点, 或因发生 副反应而导致对蛋白质进行不必要的修饰, 从而阻碍了它们的应用。 作为一个备选方案, 酶 解的方法相对来说其反映条件较温和, 更重要的是, 普遍用于此用途

52、的蛋白酶都具有高度的 特异性。其中常用的酶有: Xa 因子、凝血酶、肠激酶、凝乳酶和胶原酶。所有这些酶都具 有较长的底物识别序列, 从而降低了蛋白质中其他无关部位发生断裂的可能性。 在上述提及 的各种酶中, Xa 因子和肠激酶应用最多,因为它们切割各自的识别序列的羧基端,使带有 天然氨基酸的被融合部分得以释放。分子伴侣目前已经达成共识, 有效的蛋白质翻译后折叠、 多肽装配成寡聚体结构以及蛋白质的转位都 是由一种被称为分子伴侣的专职蛋白来介导的 200 。原核生物的核酮糖 -1,5- 二磷酸羧化酶 在 E.coli 中的有效合成和装配需要 GroES 和 GroEL 蛋白的证据,使得利用分子伴侣

53、在 E.c oli 中进行基因高效表达成为近来研究的热点 201 。但是,利用分子伴侣所得到的实验结果 并不一致, 而且迄今为止, 伴侣分子的共表达对基因表达的影响似乎都具有蛋白质特异性 2 02。目前尚不清楚在基因过度表达的情况下,分子伴侣的体内水平是否受到限制。正常情 况下,蛋白质的折叠最终达到一种热力学的稳定状态。 特别不稳定的蛋白即使在伴侣分子存 在的情况下,或许也不能正确折叠。 因此,多肽链的截断、多亚基蛋白复合物单个结构域的 产生、 缺乏维持蛋白质正常结构的二硫键的形成以及缺乏翻译后的修饰如糖基化等,都将不可能达到热力学的稳定状态。 现在已经明白不同类型的伴侣分子正常情况下是协同发

54、挥作用 的203 。因此,只过度表达单一的伴侣分子可能不太有效。在某些情况下,共表达与靶蛋白来源相同的伴侣分子可能是必要的。还有一个需要考虑的变量是培养温度。例如,在30 C时GroES-GroEL共表达能够提高 3-半乳糖苷酶的产量,而在37 C或42 C则不能204。最后,伴侣分子的共表达有可能导致表型的改变如细菌丝状生长,这有可能对细菌的生存和蛋白质的产生不利 205。最近有报道表明,将人或鼠的蛋白质二硫键异构酶( PDI )与靶基 因共表达,能提高在 E.coli 细胞质中正确折叠蛋白质的产量 206, 207。 E.coli 细胞质中二 硫键的形成是由维持氧化还原电势的一组蛋白质来促

55、进的208。有人认为DsbA (种可溶性的细胞外周质蛋白)直接催化蛋白质中二硫键的形成,而DsbB (一种内 膜蛋白 )则参与DsbA 的再氧化。真核生物的 PDI 能够补充 dsbA 缺失突变株的表型,但其功能在 dsbB 突 变株中完全丧失。另外,通过额外添加谷胱甘肽可以提高 PDI 增强靶蛋白产生的能力。这 些证据表明, PDI 有赖于细菌氧还蛋白来完成自身的再氧化 207。培养条件E.coli 中的蛋白质产量可以通过高细胞密度培养系统而获得显著提高。高细胞密度培养系统可以分成三类:分批培养、补料分批培养和连续培养。这些方法能获得超过100g/ 升的细胞浓度,从而获得廉价的重组蛋白。有关

56、大规模培养系统的资料已有详细的综述193, 209。培养基的组成需要仔细地计算和监控,因为这对细胞和蛋白质的产生具有重要的代谢效应。例如,不同 mRNA 的翻译可以因温度和培养基的变化而受到不同程度的影响 210。营养成 分和培养参数如pH、温度和其他参数都会影响蛋白酶的活性、分泌和产量211。已经证明对培养基的特殊操作能明显提高蛋白质释放到培养基中。例如, 在培养基中添加甘氨酸能增 强外周质蛋白释放到培养基中,且不引起明显的细菌裂解 212 , 213 。同样,在山梨糖醇 和甘氨酰甜菜碱存在的渗透压力下培养细菌,可以使可溶性的活性蛋白产量提高多达 400 倍139 。高细胞密度培养系统也有其

57、自身的缺陷。 这些缺陷包括在高细胞密度情况下, 溶解氧的量有 限;二氧化碳水平能够降低生长速度、 刺激乙酸形成降低发酵罐的混合效率和产热等。 有关 这些问题的解决方案已经有详细的介绍 193 。利用高细胞密度培养系统生产重组蛋白质的 一个主要问题是乙酸的积累,这种亲脂性成分对细胞的生长是有害的 193 。虽然有多种解 决这一问题的方案, 但是均各有缺点。 近来这一问题通过将来自 B. subtilis 编码醋酸盐合成 酶的 alsS 基因导入 E.coli 细胞中得以解决 141 。该酶催化丙酮酸转化为非酸性和低毒性的 副产品。 乙酸积累的减少极大地改善了重组蛋白的产生。另外, 其他酶缺陷的 E.coli 突变株也已经建立,这些突变株产生较少的乙酸,从而提高了人重组蛋白的表达水平214 。总结 一种高效的原核表达载体需要包括一个强大并且可以严紧调节的启动子; 一位于翻译起始密 码子 5'端大约 9bp 的 SD 序列;位于目的基因 3'末端的一个高效转录终止子。除此之外, 载体还需要一个复制起点, 筛选标记和利于对启动子活性进行严紧调节的基因。 这种调节元 件可以插入载体自身, 也可以插入宿主的染色体。 其他的元件包括转录和翻译增

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论