模式生物的功能基因组学060320.doc_第1页
模式生物的功能基因组学060320.doc_第2页
模式生物的功能基因组学060320.doc_第3页
模式生物的功能基因组学060320.doc_第4页
模式生物的功能基因组学060320.doc_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

11模式生物的功能基因组学:从新的视角看老问题Dorothea K. Thompson and Jizhong Zhou申剑、金颖译;金颖初校;魏华校11.1引言要全面综合地描述活细胞的内部作用关系是一项十分艰巨的任务。不足为奇的是,描述基因功能和相互作用方面最大的进步最初来源于基因组序列数据的使用,这些数据来源于简单的原核和真核模式生物。原核生物如大肠杆菌(Escherichia coli)和枯草芽孢杆菌(Bacillus subtilis),单细胞真核生物如啤酒酵母菌(Saccharomyces cerevisiae)都被作为传统的模式生物,这是因为它们结构简单、功能复杂、在实验系统中具有内在的优势。E.coli 的非致病实验菌株(K-12)被列为最早的全基因组测序对象,它在原核遗传学、分子生物学、生物技术、尤其是DNA重组技术领域是首选的模式生物(Blattner et al.,1997)。B. subtilis 是第一个进行全基因组测序的革兰氏阳性菌(Kunst et al.,1997),并且被作为研究生物化学、生理学、系统发育的遗传学范例。因为S. cerevisiae 具有真核细胞的所有基本功能,并且人类疾病30的阳性克隆与酵母同源(Bassett et al., 1997),对S. cerevisiae 基因产物的生物学作用做准确的测定是极其重要的一步,这有助于我们提高对遗传学上更复杂的、不易研究的多细胞动物的认识(Lashkari et al., 1997; Winzeler et al., 1999)。尽管有40多年的大量研究,但基因组序列信息表明,超过30的开放阅读框(ORFs),包括E.coli的染色体(Blattner et al.,1997)和B. subtilis 的染色体(Kunst et al.,1997)没有实际的功能。这个问题在已测序的S. cerevisiae 基因组中反复提到,在S. cerevisiae中大约6000个预测基因中的三分之一仍被归为未知细胞功能的阅读框(Goffeau et al., 1996; Uetz et al., 2000)。因此,很明显,除了基因组结构分析以外,其它的系统研究得到的信息对大量的序列数据归类于生物学上有意义的位置是十分必要的。功能遗传学和相关的高通量综合技术学和方法学(例如,DNA微阵列、全基因组突变、双向凝胶电泳、双杂交系统、蛋白微阵列)试图在转录组学、蛋白组学、代谢组学、内部作用组学的细胞区域中确定新的基因(图11.1)。一些最好的功能遗传学作用的例子来自于对E.coli、B.subtilis、S. cerevisiae的研究。因此,这些生物将成为这一章的焦点。我们将对其它模式生物进行简短的讨论以总结这一章。11.2 Escherichia coli(大肠杆菌):模式真细菌E.coli作为原核生物学中的模式实验生物,它的地位是无可比拟的。毫无疑问,E.coli是最具特征的可自由生长的单细胞生物,并且它已用于研究细胞过程的生物学模式,如DNA的复制和修复、转录、代谢途径、应激反应、信号传导和遗传学规律。E.coli K-12基因组的获得是一项巨大的挑战。因为许多不典型的基因与数据库中已知的序列不具有显著的同源性。尽管遗传学研究已有几十年,但E.coli K-12基因组中编码4,288个蛋白的38%的基因仍然不清楚生物学功能。那些基因中的1853个之前已经被描述过(Blattner et al.,1997)。这表明我们的认知还存在严重的不足,甚至是对于那些已被很好地研究过的模式生物。在生物学环境中,从功能上理解未分类的基因要求要超过序列的注释水平,并且要综合转录组学、蛋白组学、代谢组学、相互作用组学等方面的全基因组功能分析。我们将在后几部分讨论那些能为功能预测提供信息线索的功能基因组学方法所起的作用。11.2.1 Escherichia coli(大肠杆菌)基因组我们从E.coli K-12基因组的结构分析中得到了什么样的新信息?E.coli 序列数据除了使全基因组功能分析的方法成为可能,同时也揭示了一些新的基因。六个以前没发现的tRNA编码基因在揭示E.coli 基因组的过程中被鉴定出来(Blattner et al.,1997)。这些新的tRNA基因中的四个,名为valZ、 lusY、 lysZ、 lysQ组成了lysT操纵子,而其它两个基因(asnW、ileY)形成了单基因转录单位。基因组序列的生物信息学分析也已经预测了一些结构和调控元件,这些是各种生物化学途径或细胞机制方面知识所不能预见的。在搜索序列相似性的基础上,芳香族化合物,如苯酚丙酸盐的降解途径的未知步骤被其他四个假定的mhp基因所揭示。在基因组序列确定之前,mhp基因是已经存在的,但没有被鉴定。保守序列单元的出现确定了其中的一个mhp基因可能是由操纵子编码的代谢途径的转录调节子。序列研究揭示了第二个以前没有认识到的操纵子,该操纵子含有一些类似于假单胞菌(Pseudomonas)基因,能够降解芳香族化合物,如甲苯、苯、联苯(Blattner et al.,1997; Tan et al.,1993)。假设的操纵子由三个基因组成,包括能够打开芳香环和氧化C1,C2的1,2-双加氧酶,一个类似于二氢-1,2-双加氧酶的开放阅读框和基因编码的铁氧化还原蛋白还原酶。这是最后的双加氧酶的元件。在假设的操纵子前面的各种转录的开放阅读框已经被假定在调控基因方面起作用。而且作为结构分析的结果,已经发现了剩下的12个鞭毛合成基因,且表明它们与沙门氏菌的基因几乎一致。这一信息在生物学、序列数据的构成假设和实验的新方向等方面均有价值。11.2.2 E.coli 转录组学正如第6章中详细讨论的那样,全基因组核酸序列使研究者们能够应用cDNA方法或者基于寡核苷酸的微阵列分析方法,根据特异性刺激物、遗传变异或者生理紊乱来评价基因组转录图。在对全基因组测序和生物信息学分析后,进一步理解生物生理潜质的方法是研究基因表达图谱。根据序列信息,能够设计出一组完整的引物,用于扩增基因组中所有的已知的开放阅读框。每个基因转录(mRNA)水平的变化可以用PCR产物来监测。用于解释全基因组序列功能的强有力的方法是根据各种环境刺激物和生理紊乱或特定调节基因的变异来检测mRNA水平的改变。这一部分使用了一些例子来说明功能基因组学是如何增加E.coli 细胞过程的新内容的。这些过程已经在过去用传统的方法很好地研究过了。热激应答热激应答,有时一般也称作应激应答,是一种内环境稳定的机制。这种机制是由活细胞在对温度升高不适应的情况下显示出来的。这种进化学上保守的分子对热反应的应答是一种限制性蛋白热激蛋白诱导合成的。除了热激外,其他不利的生理条件,如暴露在乙醇中或转入重金属,都能引起热激蛋白产量的提高(Morimoto et al., 1992)。在过热条件下,热激蛋白除了防止细胞蛋白变性和聚集外,也表现出一些对普通的生理生长所必要的功能,如辅助纠正多聚结构的组装,使新翻译的多肽折叠到它们自然的三级结构(Hendrick and Hartl,1993; Georgopoulos and Welch, 1993; Lund,2001)。因此,热激蛋白通常更多地被称为分子陪伴。细胞对热的反应(如热激反应)已被很好地研究了,在进化上许多不同的生物间是保守的(Ang et al.,1991)。在细菌中,细胞对热激的反应首先在E.coli中被发现并得到细致地研究。由于热激反应的保守性,它已被作为一种模式系统来研究其他原核生物(如古菌)的调节基因的表达(Kuo et al.,1997)。在E.coli和其他细菌中,热激蛋白的优先级别和短暂的过量生产已经在转录水平通过调节因子rpoH(32)(Grossman et al., 1984)或rpoE(E)(Erickson and Gross,1989; Wang and Kaguni,1989)的量和活性而得到控制。在E.coli中,决定热诱导基因表达的启动子被携带32而不是70的亚基的RNA聚合酶全酶所识别(reviewed in Mager and de Kruijff,1995)。当与RNA聚合酶的核心复合在一起时,E.coli 32转录因子允许转录机制启动特异的转录,热激调节启动子特异性转录(Grossman et al.,1984;Cowing et al.,1985)用于稳态和热激水平的热激基因的表达(Cowing et al.,1985; Zhou et al.,1988)。然而,值得注意的是,尽管很多关于原核生物热激反应的研究已经用E.coli作为实验模型得以进行,其他新的热激调节子机制,如负顺式作用反相重复元件,已经在一些革兰氏阳性菌中起作用(Hecker et al.,1996)。微阵列包含PCR扩增的全长编码序列,这些序列代表了E.coli K-12基因组所有蛋白编码能力的97,它们被用来再现这种细菌的热激因子(Richmond et al.,1999)。用Cy3标记的对照cDNA和Cy5标记的热激样品的图谱比较了在适宜生长温度(37)下与在热激温度(50)下的全基因表达图,大部分E.coli基因的表达没有受到热激的影响,然而一小部分特异的基因在50热激处理后转录水平发生了改变。最重要的发现是观察到基于同源研究的35个未知功能的开放阅读框在转录水平上受到了热激的影响,第一次提供了它们的表达和潜在的生物学作用的分子证据(Richmond et al.,1999)。除了以前鉴定的作为E.coli热激元的基因外,对应于热激上调的开放阅读框还包括一些在本微阵列研究之前,基于序列相似注释的假定功能,而不被描述成热激诱导的那些基因。其中的一些基因曾被报道过它们能在转录水平上被其他应激条件所诱导,如低pH或高赖氨酸浓度和营养应激。(cadAB 操纵子分别编码赖氨酸脱羧酶和赖氨酸/尸胺转运装置,Watson et al.,1992)(cspD编码冷激蛋白,Yamanaka and Inouye,1997)。E.coli热激因子新鉴定的成员也包括rseA,是E的负调节子(Missiakas et al.,1997;De Las Penas et al.,1997);prlC,是一种类胰蛋白酶(Conlin et al.,1992;Jiang et al.,1998),clpA是ClpAP蛋白酶的ATP酶的元件(Katayama et al.,1988;Gottesman et al.,1990)。Richmond及其同事(1999)的研究证实了用DNA微阵列技术准确检测在细胞转录量上的变化,说明了功能基因组学是如何允许已经被很好地定性的细胞过程从一个新的角度来进行完整的检测。然而,研究也指出了以基因组范围测定转录丰度研究一个复杂细胞反应的限制。尽管微阵列提供了E.coli中对应于温度升高时的一系列潜在的参与者,但需要用与基因表达图谱相结合的其他方法给出一个完整的描述:细胞是如何整合和调控这些功能,对环境应激产生一致和快速的适应反应(Richmond et al.,1999)。细胞代谢生长的转录组学分析尽管我们已经知道一些与特定的生物合成或者代谢过程(如色氨酸生物合成)相关的必要的操纵子或基因,但不是出于这一目的的其它的基因在还没有发展更综合更全面的实验方法之前还没有被鉴定,这些基因影响着某些代谢行为或者受到某些代谢行为的影响。例如,DNA微阵列已经被用于分析在E.coli中影响色氨酸代谢的生理学和遗传学的变动(Khodursky et al., 2000)。E.coli的色氨酸操纵子是分析的最透彻的细菌生物合成操纵子之一。色氨酸操纵子的五个基因(依次是trpE、trpD、trpC、trpB、trpA)编码分支酸转化为色氨酸途径的酶(Pittard综述,1996)。色氨酸操纵子的转录受抑制蛋白TrpR的抑制调控,也受一种称为转录弱化作用的完全不同的调节模式的抑制调控(Pittard,1996)。从广义基因组角度用cDNA微阵列观察色氨酸代谢,Khodursky和他的同事们(2000)能够得到主要受TrpR抑制剂控制的表达图谱,能够鉴定转录受色氨酸代谢影响的基因。之前Pittard(1996)的工作表明,所有的五个主要的与色氨酸的生物合成、转运和调节有关的操纵子(如,trp、aroH、mtr、trpR、aroL)在转录水平上受色氨酸活化的trp操纵子抑制剂的控制。Khodursky和他的同事用微阵列检测mRNA量的整体变化,发现trp(色氨酸生物合成)操纵子基因、mtr(色氨酸特异透性酶)操纵子基因、aroH(三个已被鉴定的催化芳香族氨基酸生物合成一般途径最初反应的酶之一)操纵子基因组成核心,易受trp抑制调节子的影响。这个结论基于这样一个事实,只有这些基因符合被过量色氨酸下调、色氨酸饥饿时上调、trp抑制子失活时上调的标准。尽管在微阵列分析中没有鉴定得到新的转录目标特异性的TrpR抑制子,但许多基因的表达直接受色氨酸代谢的影响,最主要的例子是精氨酸生物合成基因对色氨酸饥饿极为敏感。功能基因组学,主要体现在微阵列介导的转录图,允许我们看到的不仅仅是微生物生理的某一焦点方面,如色氨酸代谢、特异性基因或调节子如何与基因表达的所有其他方面相互作用;而且还提供了一个观察基因组表达的视窗,如细胞在葡萄糖上生长的生理能力。功能基因组学的价值在一项分析基因组表达的研究中得到了证实,即E.coli在含0.2葡萄糖的基本培养基上和在含0.2的肉汤培养基上对数生长后期的基因组表达(Tao et al., 1999)。将PCR扩增的与E.coli K-12基因组的4290个注释的基因对应的开放阅读框特异性DNA片段排列在尼龙膜上,与从两种不同的培养基上得到的细胞的放射性标记的cDNA进行杂交探测。正如预料的那样,E.coli细胞在含葡萄糖的富营养培养基上的生长速度(世代时间G=25min)是含葡萄糖的基本培养基的两倍(G=57min)(Tao et al., 1999)。不同的生长速度在细胞大分子成分(如,rRNA,tRNA)中得到反应,这些反过来在基因表达水平得到实现。总的说来,DNA阵列表明,某些功能上的基因转录的差异性与两种生长条件下细胞生理性状一致,因此提供了依赖于基因表达和生物合成调节子全面调节的生长速率研究(Tao et al., 1999)。与119个(占所有标注基因的2.8)在富营养培养基上生长的基因相比,225个(占所有标注基因的5.2)在含葡萄糖的基本培养基上生长的基因有很高的表达水平(比例2.5倍)。影响生长速度的开放阅读框被分成以下几种功能类型:1、翻译装置;2、氮代谢;3、氨基酸生物合成;4、维生素、辅助因子、辅基、载体的生物合成;5、核苷酸生物合成;6、脂肪酸生物合成和降解;7、碳源和能源代谢;8、细胞过程和整体调节子。在以葡萄糖为碳源和能源的丰富培养基上E.coli生长的标志性特征是快速的生长速度,生物合成途径的停止,大分子合成基因,最显著的是蛋白质合成基因表达的增多。所有这些生理方面的特征在基因组表达水平通过利用全基因组序列信息和使用DNA阵列技术得以揭示。很多年前,我们就知道快速生长的细胞相应的在蛋白质合成和核糖体丰度上有所增加(Grunberg-Manago,1996;Keener and Nomura,1996)。在128个基因编码的E.coli翻译元件中,在丰富培养基上生长的细胞有53个基因(41.4)比在基本培养基上生长的细胞在更高水平上被转录。这些基因中的大部分(42/53)编码核糖体蛋白,而其他的基因编码遗传因子,这些因子出现在翻译和核糖体修饰过程中(如翻译延长因子基因tsf, tufB, tufA,dfp,fusA)。结果与翻译因子和核糖体元件的偶联合成相一致(Grunberg-Manago,1996;Tao et al.,1999)。与在丰富培养基上细胞生长的表达图谱相比,转录图表明,在基本培养基上生长的细胞氨基酸生物合成中的基因被普遍诱导,发现与从唯一碳源(这些例子中是葡萄糖)的培养基上生长的细胞产生氨基酸的需求相平行。这些生物合成基因,包括第一个ilvGMEDA操纵子基因(用于异亮氨酸和缬氨酸的合成),整个leuABCD操纵子(用于亮氨酸合成),五个trpEDCBA操纵子中的四个基因(用于色氨酸合成)。亮氨酸和缬氨酸生物合成基因的高表达率表明细胞中这些氨基酸相对高的含量,这与E.coli的生理机能相一致(Neidhardt and Umbarger,1996;Tao et al.,1999)。22个高表达的氨基酸生物合成酶基因中的8个基因与途径的最初步骤相对应,这是常用的调节策略,表明细胞在基本培养基上生长时控制前体代谢到生物合成途径的流向(Tao et al.,1999)。微阵列分子也揭示了在基本葡萄糖培养基上生长的细胞,其碳和能量代谢基因的表达量是丰富培养基上生长时的4倍。当然,最值得注意的是这样一些基因,它们与D-乳酸盐的利用(dld),醋酸盐的形成(poxB),poxB表达的调节(rpoS,它编码稳定期因子),醋酸盐的利用(aceA,aceB,gltA,icd,mdh),葡萄糖和醋酸盐的共代谢相偶联(uspA,一种编码通用应激蛋白的基因)。这些基因的诱变意味着醋酸盐的代谢作为一种E.coli在以葡萄糖为唯一碳源和能源的培养基上生长的重要特征(Tao et al.,1999)。最后,在两种培养基上生长都引起了不同的调节基因表达的增加,有些控制了生理状态下细胞的反应。例如,rpoS表达在基本培养基上大量提高(Tao et al.,1999),并且已知被严紧反应信号分子ppGpp所调节。ppGpp在细胞受氨基酸限制时过量产生(Hengge-Aronis,1996)。RpoS依赖性基因的功能表明了这些细胞中RpoS调节可能的作用。如前所提到的那样,在葡萄糖基本培养基上生长的主要特征被称为醋酸盐代谢产物的过剩。微阵列结果表明,RpoS能控制防止细胞自身酸应激基因的表达(Tao et al.,1999)。hdeA和hdeB是两种表达依赖于RpoS的未知基因,提示它们的开放阅读框能够耐酸。在Tao和他的同事们(1999)处理的微阵列图形分析中,在基本培养基上表现出较高表达比例的225个基因中的43个基因和在丰富培养基上表现出高转录的119个基因中的26个基因作为未知生物功能的开放阅读框进行分类。类似的,在另一项应用微阵列技术来监测基因表达的研究中,25的基因表现出对应于缺少功能分配的生长条件的不同表达水平(Wei et al.,2001)。 利用综合的转录图谱,我们能够开始对这些未分类的基因根据它们与相似的或相关的基因共调节来描述一项假定的功能。此外,从微阵列实验中得到的可测试的假设可能提供证据来证实未知基因的生物学功能。因此,基于微阵列的转录图谱为进一步研究特征性模式生物如E.coli提供了进一步的动力(Wei et al., 2001)。NtrC调节子微阵列遗传学技术具有很多优势,它能够在特异性调节蛋白转录控制下检测所有的基因和操纵子。DNA微阵列技术促进了多基因网络的出现,如Ntr(氮调节)系统,它能根据E.coli细胞的生理状态信息执行一项细胞功能,通过吸收环境中可利用的氨得到氮,从而进行氨基酸生物合成。氮的吸收要求有两种中心介质的合成谷氨酸盐、谷氨酰胺(Ikeda et al., 1996)。细胞内谷氨酰胺浓度的减少使细胞意识到外部的氨含量不足(Ikeda et al., 1996)。对外部有限的氮的分子反应是在氮调节蛋白C(NtrC)的控制下基因转录的活化。NtrC蛋白激活54-基因的转录,然而氮的吸收控制(Nac)蛋白通过激活氮限制条件下70-基因的转录,从而作为NtrC和70-操纵子的适配器(Pomposiello et al., 1998;Zimmer et al., 2000)。细胞以这种方式整合各组基因和操纵子的表达以获得全面的适应反应。这种多基因条件导致了基因产物的表达,这些产物能够允许细胞利用环境中任何残留的氨,然后转变为其他的氮源,从而在氮限制条件下能够最小化生长。为了完全揭示E.coli的NtrC/Nac调节子,Zimmer和他的同事们(2000)使用DNA微阵列将NtrC激活基因过表达的突变株的整体转录水平与具有ntrC无效等位基因菌株中的整体转录水平相比较。尽管氮的网络已经在E.coli中得到很深入的研究,但综合的基因表达图谱鉴定了许多新的NtrC调节子。这些新的与ATP特异性结合的操纵子转运腐胺(potFGHI)、寡肽(oppABCDF)、二肽(dppABCDF)、核苷酸(nupC)和D-丙氨酸/D-丝氨酸/甘氨酸(cycA)的次级离子共转运(Zimmer et., 2000)。 其他一些新鉴定的NtrC/Nac-控制基因,包括几个编码假定蛋白(ycdGHIJKLM, yeaGH, yedL)操纵子,再次证明了微阵列表达图谱对于在某些细胞功能中说明未知基因的能力。从全基因组的角度检测NtrC/Nac调节子表明,NtrC控制了大约2的E.coli基因,其中大部分是底物转运的操纵子(Zimmer et al., 2000)。这些基因的假定功能强调了E.coli在清除环境中含氮化合物的能力,作为抵御氮饥饿的第一道防线。11.2.3 E.coli蛋白组学除了基因组结构分析和转录组学特征分析使用阵列技术外,蛋白组学分析依然是功能研究的重要组成,因为蛋白组学分析能够观察到基因表达的最基本水平。与蛋白组学分析相关的中心问题是序列分析预测的开放阅读框的可靠性,蛋白质的物理特征是否与那些开放阅读框预测的一致。而且,已测序生物的蛋白组学的研究揭示了重要的特征,这些特征仅从基于基因组序列的理论蛋白组学是推断不出的。其它的信息包括生物体内蛋白的丰度,后翻译修饰,蛋白水解(Link et al.,1997b)。蛋白组学分析的方法通常包括双向凝胶电泳(2-DE),然后是用N-末端测序或质谱的点鉴定(例如,基质辅助性激光脱附电离时间flight (MALDI-TOF MS)。详见第9章质谱的详细讨论。已有的全基因组序列对从双向凝胶中提取的蛋白种类进行快速鉴定很重要。E.coli K-12的蛋白组用双向凝胶电泳得到了测定。接着用氨末端Edman序列分析对364个双向凝胶电泳斑点进行点杂交来鉴定和定量(Link et al.,1997b,Edman测序的综述,见Walker,1994)。从Edman序列产生的N-末端蛋白序列标签被用来研究完整的E.coli基因组序列。在生物活体条件下表达的蛋白的N-末端序列用来证实与基因组中预测的开放阅读框的对应性。氨末端能处理诸如蛋氨酸起始密码子和信号肽裂解之类的事情,氨基末端也能通过将观察到的蛋白质序列和那些从概念上预言的基因组序列的翻译进行比较而得到。Link和他的同事们(1997b)的许多研究发现还不能单独从基因组序列得到预言,这些发现表明“旧”模式生物具有一些新的信息。例如,已经鉴定了大量的蛋白质:YjbJ、YjbP、YggX、HdeA、AhpC。尽管YjbJ是E.coli稳定期早期中观察到的最丰富的蛋白质之一,之前还没有描述过它的特征(Link et al.,1997b)。在这项研究中分析的最丰富的蛋白在一个窄的等电点(pI)范围47之间被检测到,分子量在10100KDa之间,这指出了作为综合蛋白组学工具的2-DE分析的限制性(见第9章)。E.coli蛋白组的其他特征包括观察到223个独特的编码蛋白质的座位,其中的60能进行蛋白水解,这是一种调控蛋白活性的分子策略,也观察到由Edman序列鉴定的18的2-DE上的位点具有异构体。这些异构体组成了相同基因的蛋白质产物,它们具有不同的等电点和分子量,这表明具有遗传翻译后的过程(Link et al.,1997b)。仅是基因组序列不能对最终在细胞中产生的翻译产物在生化特性和功能上提供一个全面准确的描述。除了个别存在差异,大部分情况下,由实验得到的等电点值和分子量值与基因组序列预测得到的值相当一致。观察值和预期值之间的偏差可能由基因组序列的高度加工蛋白或错译造成(Link et al.,1997b)。用转录组学分析,蛋白表达和丰度的主要差异能在不同的细胞状态下测得。在Link和他的同事们的研究报道中(1997b),作者分别在最低限度的葡萄糖培养基中的指数生长期和丰富培养基中的稳定生长期检测了E.coli蛋白组的动态特性。2-DE分析不能全面的分析细胞的蛋白组学,几个在丰富培养基上稳定生长期早期鉴定的高丰度的蛋白质在葡萄糖最低限度培养基上生长的细胞中没有观察到。这些蛋白质是:色氨酸酶(TnaA),用于色氨酸的降解和合成(Morino and Snell,1967);半乳糖结合蛋白(MglB),在半乳糖转运入细胞的过程中起作用;饥饿诱导蛋白(Dps),它与DNA形成了稳定的复合物,因此保护DNA不被氧化毁坏(Almiron et al.,1992)。这项研究表明了一个生物学原则:细胞改变它们的蛋白成分以适应变化的环境条件(Link et al.,1997b)。此外,还表明,更综合的分析方法,如最近发展的基因组学和蛋白组学的方法,正在改变我们观察活细胞的方法,甚至改变对已经被很好地描述过的模式生物的认识,如E.coli。蛋白组学能够被用来加强和支持由基因组序列分析提供的预测信息。E.coli K-12基因组的获得提供了用双向凝胶电泳分析蛋白质排列,用质谱鉴定蛋白质的方法来确定E.coli外膜蛋白成分的机会(详细的蛋白组技术的讨论见第9章)。Molloy和他的同事们(2000)用一种新的方法来分离基于碳酸盐培养的细菌的外膜蛋白(OMPs),它们能够鉴定跨膜细胞表面蛋白是E.coli外膜中含量最丰富的蛋白种类(图11.2A)。可被预测的已知有转录活性的E.coli完整的OMPs中,总计有78的OMPs用2-DE和质谱相结合而得到了证实(Molloy et al.,2000)。此外,一些蛋白质(如铁受体FhuF, FepA, CirA)以前没有出现在E.coli双向凝胶电泳图上,两个DMPs在蛋白组学研究前仅从它们的基因组序列了解它们。关于E.coli的某些新的深奥的发现也已经获得。在铁限制的条件下检测相对的DMP表达,观察到一个假设的指定蛋白YbiL表达的剧增,这表明YbiL在铁转运中具有假定功能(图11.2B; Molloy et al.,2000)。YbiL可能代表了一个之前在E.coli中没有鉴定的铁受体。在一项补充实验中,Molloy和他的同事们(2000)证实另一种OMP(Ag43)的表达在低的生长温度下受到抑制。11.2.4 E.coli的模式代谢:计算机代谢组学近来的基因组科学的重要目标是将细胞的核苷酸序列信息与生理功能相联系(Edwards et al.,2001)。由于从基因组序列和功能研究得到的大量数据还在不断的积累,迫切需要能够在硅片上建立系统的阐述和发展复杂而完整的细胞系统的代表或数学模型。随着基因组时代的开始,传统的生物学简化方法正在被整合的方法所取代,这种整合的方法能够在整体上处理多成分遗传回路(Edwards and Palsson,2000a;McAdams and Shapiro,1995)。微生物精确模式的目标是模拟完成基因基本的物理化学性质的细胞代谢,这种模拟整合了传统获得的生物化学动力学数据(Edwards and Palsson,2000a)。遇到的挑战是如何整合和综合全面的“分子归类”和这些部分的关系,目的是为了产生具有说明和预测能力的全细胞模型(Edwards and Palsson,2000b)。在多基因代谢网络中,代谢通量分配物能被用来定义“代谢表型”;通量平衡分析能用于分析基于质量平衡和反应限制(如,物理化学限制)的重组代谢网络的能力(Edwards et al.,2001;Edwards and Palsson, 2000a,b;Varma and Palsson,1994)。解释和预测代谢通量分配物需要有数学建模和计算机模拟(Edwards et al.,2001)。在细胞模式中,基于物理化学限制的方法意在回答细胞能够做什么和不能做什么,而不是预测细胞如何在特定条件下的准确的行为活动(图11.3; Edwards and Palsson.,2000b)。E.coli已作为一种模式生物来研究在利用计算机演示代谢能力的可能性和潜在的应用价值(Edwards and Palsson.,2000b)。Edwards and Palsson.(2000b)用通过常规实验得到的生物化学数据,已注解的基因组序列信息和菌株特异性信息来重建E.coli的代谢图。在计算机模型中的E.coli代谢的限制条件被用来确定在细胞生长的中心代谢途径中基因缺失的生物学作用。当与实验的观察结果比较时,E.coli代谢能力的芯片分析能够在86的已检测的基因缺失的例子中定量预测不同突变株的生长潜能(Edwards and Palsson,2000b)。同样地,其他的研究证明芯片代谢模式能用来解释突变行为(Edwards and Palsson,2000a);与实验生物学相结合,芯片代谢模式能够提供关于在细菌细胞代谢途径中,基因型与表型关系的重要信息(Edwards et al.,2001)。这些研究表明:代谢行为的计算机分析能够简化生长实验的设计和报告基因敲除的鉴定(Edwards and Palsson,2000b)。此外,芯片分析可能会有助于鉴定丢失的(例如,假定的)或者不正确的功能分配,这些功能分配从基因组序列注释中得到(Edwards and Palsson,2000a,b)。然而,这一领域的最新研究还处于初期,这种计算机模式和计算机模拟需要反复的实验研究来改进芯片模式(Edwards and Palsson,2000a)。11.3 Bacillus subtilis:革兰氏阳性菌的典范Bacillus subtilis是革兰氏阳性菌中最具特色的典型。它是一种需氧的杆状菌,能够形成内生孢子,在土壤和水中普遍存在。Bacillus subtilis和它关系相近的菌具有商业意义,因为它们具有代谢多样性,尤其是它们产生胞外水解酶(如,淀粉酶和蛋白酶)的能力,这些水解酶能够降解多糖、核酸、脂质。降解产物将作为生物体的碳源。除了大分子水解酶的产生,Bacillus subtilis在营养饥饿的条件下开始次级代谢途径,如抗生素(如surfactin、fengycin、difficidin)的产生。营养性缺乏的条件使细菌可形成很独特的结构化学物质、辐射和干旱抗性的芽孢,这种条件下细菌生长难以重建(Levin and Grossman,1998,综述Bacillus subtilis孢子形成)。这些生理特征和遗传操纵的特征导致Bacillus subtilis成为研究革兰氏阳性菌的模式实验生物。它的全基因组序列在1997年发表,是第一个得到全基因组序列的革兰氏阳性真细菌(Kunst et al.,1997)。这一部分将讨论基因组如何测序,如何进行功能分析,以及蛋白组学对Bacillus subtilis生物学的提高。11.3.1 B.subtilis基因组在已经完成测序的基因组中,即使是研究透彻的模式物种,在全部预测能编码蛋白的基因中也有3060不能根据序列的同源性来划分其功能。B.subtilis也不例外,它有42的基因功能是未知的(Kunst et al., 1997)。尽管几十年来进行着大量的研究,但B.subtilis中只有约1,200个基因(约30)的功能有实验证明(Kunst et al., 1997),这说明我们要完全了解B.subtilis的生理特征,必须在发现和确认新基因功能方面付出更多的努力。土壤微生物,如B.subtilis,在进化中得到复杂的调控系统以快速应对周围多变的环境条件和胁迫。原核和真核生物中共有的许多调控蛋白属于转录因子的“螺旋转角螺旋”(HTH)家族。B.subtilis基因组的序列分析表明,许多假定是HTH转录调控基因的特殊功能需要确认,包括20个GntR家族调节基因中的18个,19个LysR家族调节基因中的15个,12个LacI家族调节基因中的5个,11个AraC家族调节基因中的10个(Kunst et al., 1997)。细胞对环境压力适应性的调节在很大程度上受双组分信号转导途径的影响,该途径在原核生物中广泛存在。双组分调控系统包括一个传感蛋白激酶和与它同源的应激因子。在B.subtilis中,利用与已知蛋白序列的相似性,37个传感蛋白激酶和34个编码应激因子的基因已经被确定(Kunst et al., 1997)。下文将举例说明全基因组序列信息如何为确认这些双组分调控系统的功能提供实验设计策略。微生物经常面临着许多环境压力的胁迫(如温度、湿度或可用营养物质的变化)。B.subtilis的基因组序列表明,有43个温度休克蛋白和总应激蛋白在细菌适应环境变化中起到重要作用(Kunst et al., 1997)。这些蛋白和它们在大肠杆菌中的同源蛋白有很高的相似性,说明革兰氏阴性菌和阳性菌的细胞应激反应在进化上是保守的。ABC转运蛋白是B.subtilis中确定的功能最多的一组蛋白(Kunst et al., 1997),反映了两大类细菌外荚膜的结构差异。另外一些ATP结合转运蛋白可能增强了B.subtilis抗毒害的能力。B.subtilis基因组中预测共有77种ABC转运蛋白,已经通过克隆基因对它们有深入的了解(Kunst et al., 1997)。E.coli和B.subtilis全基因组的测定,可全面地研究它们相关的基因组多样性。这种比较基因组的分析提出了一个观点,即可能在10亿多年前,真细菌进化分为革兰氏阴性和阳性两大类。尽管在基因组大小上B.subtilis(4.2Mb)和E.coli(4.6Mb)类似,并且预测的B.subtilis基因约有1,000种(25)和E.coli完全同源,但在基因的功能和操纵子结构上两个基因组之间存在一些明显的差异。例如,和E.coli不同的是,许多B.subtilis基因参与次生代谢物如抗生素的合成。B.subtilis将近有4的基因编码大量的多功能酶,这些酶和链霉菌参与抗生素合成的蛋白质序列相似。基因组序列分析还清楚表明至少有10种原噬菌体或原噬菌体的痕迹,说明噬菌体侵染在遗传信息空间传递上起了重要作用(Kunst et al., 1997;Nicolas et al., 2002)。第四章中已讲到,基因的水平转移是细菌进化的动力(Ochman et al., 2000)。最后,通过观察氨基酸和嘌呤合成基因来研究两个基因组在基因组织方面的差异,显示一些E.coli合成精氨酸和嘌呤的基因分散在染色体上,而在B.subtilis的同源基因则整合在操纵子上。E.coli和B.subtilis的基因组中大量未知基因功能的确定将使我们更深入的了解这些模式物种的进化、生理以及功能分化。11.3.2 B.subtilis转录组学自1997年B.subtilis的全基因测序完成以来,人们建立了许多系统的功能分析来描绘不同生长条件、环境胁迫或抗逆、遗传突变情况下基因的功能和调控网络。这一章中,我们将讨论基于微阵列技术的B.subtilis热休克反应的功能分析,双组分调控系统和B.subtilis在不同环境下的生长。这些研究说明了功能基因组如何为B.subtilis的生理学提供充足的实验证据。B.subtilis中的热休克 如同之前关于E.coli热休克刺激的讨论,细菌中许多基因的转录被热应激适应性反应激活。B.subtilis遇到不同的限制其生长的环境压力,如热休克、渗透压和机械压力时,激活大量应激调节子基因来反应,这些调节子受一种转录因子B调节(Hecker et al., 1996;Price,2000),同时转录调节因子HrcA(Schultz and Schumann,1996)或CtsR(Derre et al., 1999;Kruger and Hecker,1998)调控另外一些热诱导基因。转录因子B 是革兰氏阳性菌的总应激因子。代谢、环境压力或饥饿情况下B 因子的活化是应激调节子诱导中重要的一步。许多总应激基因的转录在植物依赖A启动子下发生,但是遇到压力或饥饿依赖B因子途径就会急剧增强。发现新的受B调节的基因并且确定其功能将有助于我们了解总抗逆调节子在B.subtilis抗逆适应中起到的生理作用(Petersohn et al., 1999)。像DNA阵列技术这样的综合方法,可将抗逆的转录水平反应做比较分析。 DNA微阵列包含了约4,100个已知的B.subtilis开放阅读框中将近90的PCR扩增片断,它用来检测热休克的整体转录水平(Helmann et al., 2001)。在这项研究中,培养的B.subtilis细胞从37(最佳生长温度)转到48(热休克温度)来引发热休克反应。从生长在两个不同温度的细胞中提取总RNA,用带有两种荧光的反转录酶标记,然后在B.subtilis的微阵列中做差异显示。在基因组水平分析,B.subtilis整个复杂的热休克反应在单个微阵列实验中就可阐明:超过10的基因表达在热激下呈现明显的上调,同时超过5的转录水平激活的基因表达量上升至少3倍(Helmann et al., 2001)。微阵列实验确定了70种已知或之前假定的依赖B 因子总抗逆调控元在转录水平上诱导,通过鉴定另外72种调控元包括24个编码设想的保守蛋白或无已知同源蛋白的基因,更综合地确定庞杂的B 调节系统。将这些功能未确定的基因划分为B 调控元是因为它们的蛋白行使帮助细胞抵抗不利的环境或代谢压力的功能。假定的依赖B 因子的启动子中相同的序列与新鉴定的热诱导基因相近,有力地支持了转录水平表达谱的数据(Helmann et al., 2001)。基于微阵列的转录表达技术的局限性在于这种方法只说明了基因在某一特定的细胞途径中存在,因此需要详细的功能分析来确定这些蛋白在抗逆适应性中的确切功能。从微阵列实验中得到的最令人惊奇的结果是精氨酸合成(argCJBDcarABargF 和argGHytzD)和转运(yqiXYZ)中的三个操纵子的高水平转录诱导(50倍)。然而,介导它们热诱导表达的调控因子目前仍未知。B.subtilis阵列技术也用于研究对乙醇应激的整体转录水平反应(Price et al., 2001),确定依赖B 因子的抗逆现象,最受关注的是胞质外W 因子的诱导以及抗盐反应中的整个调控元(Petersohn et al., 2001)。双组分调控系统 原核生物、低等真核生物和植物中的一类重要的适应性反应系统由两类信号传导蛋白组成:感受胞外刺激的传感组氨酸激酶和在转录水平上介导适应性反应的同源反应调节基因(Stock et al., 2000)。双组分调控系统作为基本的应激相伴机制使得物种检测到环境变化并对之作快速反应。该调控系统通过控制蛋白质磷酸化的变化来调节目的基因的表达。信号接受使膜结合的组氨酸激酶将ATP上的磷酸基团转移到高度保守的组氨酸残基上的能力发生变化,该残基一般在激酶的磷酰基转移二聚体结构域。组氨酸上的磷酸基团随后转移到同源反应调节基因的天冬氨酸残基上,使得后者与目标启动子的亲和力增强。 B.subtilis的基因组测序已经表明大量假定的双组分调控系统的存在:37个传感激酶和34个反应调节基因已被确定,其中30个激酶应激调节基因组合在B.subtilis的染色体上相近排列(Kunst et al., 1997)。诱导这些双组分调控系统的环境信号还未知,因此通过适当地刺激细胞来确定它们的目标基因显得很困难(Ogura et al., 2001)。为解决这个问题,Ogura 和他的伙伴(2001)在一个多拷贝质粒(pDG148)中,将应激调节基因置于受IPTG诱导的启动子控制下,然后在B.subtilis突变株中过量表达,破坏它们的同源传感激酶基因。应激调节基因的过量表达预期的结果是看到缺乏特定环境信号和同源传感激酶而无法磷酸化时目标基因表达情况的改变。利用DNA微阵列分析确定了应激调节基因的过量表达在基因组转录水平上的影响。为验证双组分调控系统中的调节子,实验中引用已知的DegU,ComA和PhoP作为模式应激调控子,因为它们的目标基因有部分是已知的(Ogura et al., 2001)。B.subtilisDegS/DegU双组分系统控制外源蛋白酶合成,遗传学发育和运动性等细胞行为(Msadek et al., 1995)。细胞密度信号激活ComP/ComA双组分系统(Lazazzera et al., 1999),而磷酸缺乏条件下感应Pho调节子的是PhoP/PhoR系统(Hulett,1996)。基于微阵列的对双组分调节子的综合性分析检测到了大部分的已知目标基因。某些情况下,微阵列分析检测不到预期的目标基因,如指向ComP/ComA系统的rapC和rapE,和指向PhoP/PhoR系统的tagAB和tagDEF(Ogura et al., 2001)。然而通过这种比较分析B.subtilis双组分调节系统的方法,许多之前并没有观察到应激调节表达的基因被确定。例如,DNA微阵列分析显示116个目标基因的表达受DegU过量合成的影响,包括了已知的目标基因(如aprE,nprE,ispA)和一些新确定的DegU调节子的成员(如bpr,yukL,ycdA,murD)。ComA和PhoR调节子的转录谱显示分别有33和23个目标基因,包括了新确定的基因rapF(ComA调节子)和yycP、yidB(PhoR调节子)。在同一研究中,Kobayashi和伙伴(2001)应用未磷酸化应激调节子的过量表达和DNA微阵列分析,来全面确定B.subtilis基因组中24个功能未知的双组分调节系统的目标基因。编码24个不同应激调节子的基因克隆到多拷贝质粒pDG148中,然后转到B.subtilis缺失同源感应激酶的突变体中供进一步研究。对于一些未知的双组分系统,根据被影响的基因来猜测可能的细胞内功能(Kobayashi et al., 2001)。YdbF过量的情况下mcpA,mcpB,flgK和flgM基因表达水平发生变化,这说明YdbG/YdbF双组分系统可能与化学趋向性有关。此外,YufL/YufM系统可能在调节感受性中起作用,因为它的许多目标基因同时也是受ComK调控的调节子成员,而ComK是B.subtilis中调控遗传感受性发育的转录因子(Hamoen et al., 1998)。最后,YvrG/YvrH系统假定的调节作用被揭示,该系统与细胞膜和细胞壁的功能相关,因为它的目标基因编码

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论