




已阅读5页,还剩54页未读, 继续免费阅读
(计算机应用技术专业论文)苏云金芽胞杆菌代谢网络的重建与分析.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 苏云金芽胞杆菌是目前世界上研究最多应用最广的杀虫微生物,但当前的研究主要 集中在以还原论为指导思想的传统实验方法上。为了从系统水平上来描述、解释和预测 苏云金芽胞杆菌细胞的功能和行为,加深对其细胞组织原则的理解,并最终用于指导菌 种优选、发酵过程优化等,本文由基因组数据重建了苏云金芽胞杆菌的代谢网络,并从 系统生物学的观点出发,分析了此代谢网络的整体拓扑结构、网络的模块化以及相关的 代谢途径。 代谢网络的重建是对其进行结构和功能分析的前提,本文首先从k e g g 等相关数据 库中获取苏云金芽胞杆菌的基因组与所有代谢途径信息,然后参照m a 和z e n g 在k e g g 代谢反应数据库基础上进行修正补充后得到的数据库并查阅相关文献对所得的网络进 行必要的修正。最后,用节点表示代谢物,连线表示代谢物之间的反应,箭头表示反应 的方向,即用代谢物图来表示所得的代谢网络。 随后,本文根据复杂网络的蝴蝶结结构对苏云金芽胞杆菌代谢网络进行简化处理, 通过对蝴蝶结的巨强连通体部分的研究,发现该部分包含了重要的生物学功能模块,其 关键节点具备重要的生物学意义。并且从以下几个方面研究了该巨强连通体部分:1 ) 平均路径长度,即任意两个结点能通过几条边的路径建立连接;2 ) 结合度分布,也就 是一个结点有k 条边的概率p ( k ) ;3 ) 鲁棒性,主要是研究网络的容错与抗攻击能力。 结果表明该巨强连通体部分具备典型的“小世界 和“无标度”特征。此外,由于细胞 网络是高度模块化的且具有与社会网络类似的模块化结构,为了进一步分析复杂代谢网 络中蕴含的功能信息,使用模拟退火算法对巨强连通体部分进行了模块化分析,发现所 得各模块大多具备一定的生物学意义。最后,本文使用极端途径方法对苏云金芽胞杆菌 的聚羟基丁酸酯( p h b ) 代谢进行分析,发现了一组不同于传统实验方法所得到的p h b 合成途径,有望为优化其合成过程提供理论指导。 关键词:代谢网络,模块化,途径分析,系统生物学,拓扑结构 a b s t r a c t a b s t r a c t 丑t h u r i n g i e n s i si sa p p l i e da n dr e s e a r c h e dw o r l d w i d e 嬲a ni n s e c t i c i d a lb a c t e r i u m n o w a d a y s ,h o w e v e rc u r r e n tr e s e a r c hh a v ef o c u s e do nt r a d i t i o n a le x p e r i m e n t a t i o nw h i c hi s s u p e r v i s e db yr e d u c t i o n i s m t od e s c r i b e ,i n t e r p r e ta n dp r e d i c tt h ef u n c t i o n a lc a p a b i l i t i e so f b t h u r i n g i e n s i sf r o mas y s t e m o r i e n t e dp e r s p e c t i v e ,d e e p l yu n d e r s t a n dt h eo r g a n i z a t i o no f f u n d a m e n t a l ,a n dw i t ht h ep u r p o s eo fs e l e c t i o no fs t a i n s ,o p t i m i z a t i o no ff e r m e n t a t i o np r o c e s s e t c ,t h ed i s s e r t a t i o nr e c o n s t r u c t e dt h em e t a b o l i cn e t w o r ko fb t h u r i n g i e n s i sf r o mi i sg e n o m e 。 a n da n a l y z e di t sg l o b a lt o p o l o g i c a lp r o p e r t i e s ,m o d u l a r i t ya n dc o r r e l a t i v em e t a b o l i cp a t h w a y s f r o mas y s t e m sb i o l o g i cp e r s p e c t i v e t h eb a s i so fs t r u c t u r a la n df u n c t i o n a la n a l y s i so fm e t a b o l i cn e t w o r ki si i sr e c o n s t r u c t i o n w ef i r s to b t a i n e da l lm e t a b o l i cr e a c t i o n si n v o l v e di nm e t a b o l i cn e t w o r ko fb t h u r i n g i e n s i s f r o mk e g ga n dc o r r e l a t i v ed a t a b a s e a n da l lo ft h er e a c t i o n sa r er e v i s e db a s e da k e g g - - b a s e dd a t a b a s ed e v e l o p e db ym aa n dz e n ga n dc o r r e l a t i v el i t e r a t u r e s t h 朗t h e m e t a b o l i cn e t w o r kr e c o n s t r u c t e di sr e p r e s e n t e db ys o c a l l e dm e t a b o l i t eg r a p hi nw h i c ht h e n o d e sa r em e t a b o l i t e sa n dt h el i n k sa r er e a c t i o n s s u b s e q u e n t l y , w es i m p l i f i e dr e c o n s t r u c t e dn e t w o r kb a s e do ni t s ”b o wt i e ”,b y i n v e s t i g a t i n gt h eg i a n ts t r o n gc o m p o n e n t ( g s c ) o f ”b o wt i e ”,w ef o u n dt h a ti tc o n t a i n st h e m o s ti m p o r t a n tm o d u l e sa n di 伍h u b sa r ef u n c t i o n a ls i g n i f i c a n t t h e n w ei n v e s t i g a t e dt h e g s cf r o mt h ef o l l o w i n ga s p e c t s :1 ) a v e r a g ep a t hl e n g t h ,i e t h es t e p so fc o n v e r s i o nb e t w e e n t w om e t a b o l i t e s ,2 ) d e g r e ed i s t r i b u t i o n ,i e t h ep r o b a b i l i t yo fan o d ew i t hd e g r e ek ,a n d3 ) r o b u s t n e s s ,w h i c hf o c u s e do ne r r o ra n da t t a c kt o l e r a n c e t h er e s u l t sh a v es h o w nt h a tt h eg s c o fb t h u r i n g i e n s i sm e t a b o l i cn e t w o r ki sa l s oas m a l l w o r l da n ds c a l e f r e en e t w o r k f u r t h e r m o r e ,i ti ss u g g e s t e dt h a tm e t a b o l i cn e t w o r k ss h o u l dh a v em o d u l a r i t yw h i c hi ss i m i l a r t os o c i a ln e t w o r k s ,t oe x p l o r eu n d e r l y i n gf u n c t i o n a lc a p a b i l i t i e s ,w eu s e ds i m u l a t e da n n e a l i n g a l g o r i t h mf o rd e c o m p o s i t i o no fg s c ,a n df o u n dt h a tt h e s ed i v i s i o n sa r ef u n c t i o n a ls i g n i f i c a n t a tl a s t ,w ee m p l o y e de x t r e m ep a t h w a y st o i n v e s t i g a t ep o l y - b e t a - h y d r o x y b u t y r a t e ( p r m ) m e t a b o l i s m , t h er e s u l t ss u g g e s t e dt h a tt h e r ea r es o m en o v e lp a t h w a y sw h i c hw i l lp r o v i d ea p o t e n t i a lm e c h a n i s mt oo p t i m i z et h ea c c u m u l a t i o no fp h b k e y w o r d s :m e t a b o l i cn e t w o r k ,m o d u l a r i t y , p a t h w a ya n a l y s i s ,s y s t e m sb i o l o g y , t o p o l o g i c a ls t r u c t u r e i i 独创生声明 本人声明所呈交的学位论文是泰人在导师指导下进行的研究工 作及取得的研究成果尽我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 本人为获得江南大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 关于论文使用授权的说明 本学位论文作者完全了解江南大学有关保留、使用学位论文的规 定:江南大学有权保留并向国家有关部门或机构送交论文的复印件和 磁盘,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编 入有关数据库进行检索,- j - 以采用影印、缩印或扫描等复制手段保存、 汇编学位论文,并且4 支j , - 电子文档的内容和纸质论文的内容相一致。 保密的学位论文在解密后也遵守此规定。 签名:工缝2 弘 导师签名: 22 主l 遵 日 期: z ! 呈星:z 匕 第一章绪论 第一章绪论 1 1 生物信息学与系统生物学 i i i 生物信息学 观察与实验是传统生物学的主要方法。近年来,随着人类基因组计划的启动和生物 科学技术的迅猛发展,随着以测序为代表的多种高通量、自动化实验方法的广泛使用, 实验数据海量生成、堆积如山,已经不能局限于用传统的观察和实验方法来分析理解这 些数据,急需结合数学、信息科学以及计算机科学等学科的理论和技术方法来更好地分 析理解这些数据,更深入地理解生命现象。因此,上世纪9 0 年代,生物信息学应运而 生。 一般说来,生物信息学是研究生物信息的采集、处理、存储、传播、分析和解释等 各方面的一门交叉科学,它综合运用数学、生物学以及计算机科学等学科的理论和技术 来理解和揭示海量数据所包含的生物学奥秘1 1 1 。具体地说,生物信息学是把基因组d n a 序列信息分析作为源头,破译隐藏在d n a 序列中的遗传信息,在发现蛋白质编码区的 信息之后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行必要的药物 设计 2 1 。 从目前生物信息学的研究情况来看,国际上公认的生物信息学的研究内容,主要包 括以下几个方面【l - 2 1 : 生物信息的收集、存储、管理与提供 基因组序列信息的提取和分析 功能基因组相关信息分析 生物大分子结构模拟和药物设计 生物信息分析的技术与方法研究 在生物信息学的发展史中,“计算生物学”( c o m p u t a t i o n a lb i o l o g y ) ,“计算分子生物 学 ( c o m p u t a t i o n a lm o l e c u l a rb i o l o g y ) 以及生物分子信息学( b i o m o l e c u l a ri n f o r m a t i c s ) 等名字都曾被使用过,其中“计算生物学这个名字最为常用。然而严格地说,计算生 物学的范围应该更广泛一些,它包括知识发现和基于模拟的分析两个分支【3 1 。知识发 现也称为数据挖掘,是从生物学各实验平台产生的大量数据和信息中抽取隐含其内的规 律并形成假说,目前已在生物信息学中广泛应用,如根据核酸序列预测内含子、外显子 等。基于模拟的分析是用计算机验证所形成的假说,并对拟进行的生物学实验进行预测。 1 1 2 系统生物学 一直以来,人们均采用“个体一器官一组织一细胞一亚细胞一分子 的思路来进行 生物学研究。生物学家采用这种还原论的方法,力图将复杂的生物体分解成若干简单的 部分,直至分解的结果对研究条件来说已经足够简单了,再对那些相对简单的生物体组 成部分进行研究。但是,这样获得的生物信息是局部的、片面的,同时也是零散的。然 而,生物体本身是一个具有高度复杂性的系统,只有通过各种分子机制、途径和网络的 整合才能全面、系统地阐明复杂的生物学现象。近来,人们已经认识到目前采用的还原 江南大学硕士学位论文 论方法可能无法满足科学研究的需要。于是,面对还原论的囚笼,一些走在该领域前治 的科学家们认识到,有必要将目前己掌握的生物信息整台起来站在生物系统整体的高 度考察生物体作为一个复杂系统应具有的性质和功能也就是整合论的研究观点i 州。 自此,分子生物学时代逐渐被推向系统生物学时代,图1 1 给出了这种研究方法与思路 的转变f s i 。 还原论方法 组分生物学 粪燮骱法 2 0 世纪的生物学 综合的方法 系统生物学 2 1 世纪的生物掌 图1 - 1生物学研究方法的转变 f ig 卜1t h e s h i f ti nm e t h o d so fb i o l o g i c a lr e s e a r c h 2 0 0 0 年,第一届国际系统生物学大会的召开标志着系统生物学的诞生。此后,系统 生物学这一概念及其研究思想得到了学术界的广泛认同,包括哈佛大学在内的众多国际 知名大学和科研机构纷纷成立了系统生物学系或科研小组,开展系统生物学研究,我国 也在2 0 0 5 年成立了第一个系统生物学系。一般认为,系统生物学是后基因组研究最具 挑战性的一个研究领域,该领域以实验生物学和生物信息学提供的海量生物信息为数据 基础,以探索和揭示生物系统复杂性为研究目标,强调从整体的高度把握生物系统的功 能和特性。它在细胞、组织、器官和生物体整体水平上研究一个生物系统中所有组成成 分( 基因、m r n a 、蛋白质等) 的构成阻及在特定条件下这些组分间的相互关系,并通 过计算生物学来定量阐明和预测生物功能、表型和行为捌,是一门集成生物学、数学、 物理学、工程学、计算机科学等学科综合起来理解复杂的生物调节系统的前沿交叉科学 研。系统生物学的研究需要系统科学的理论指导,需要生命科学的数据支撑和实验支持, 需要计算机科学提供建模及分析工具。目前的研究大体可以划分为如下的几类【l0 1 : 生物系统结构的测量与辨识 这包括基因相互作用网络、生化代谢途径以及这些相互作用以何种机制调节生物系 统的等研究内容。 生物系统的行为分析 这主要是研究生物系统在不同时间不同条件下的行为,要对生物系统进行代谢分 析、敏感性分析、动态分析等多方面综合分析,从而发现生物系统特定行为的机理 , _ 习 尸、 第一章绪论 机制。 生物系统的建模与仿真 利用仿真、模拟等设计方法,对生物系统的所有内容如基因和代谢网络、染色体的 高水平结构、蛋白质之间的相互作用等等变成数据流,最终达到建立数据系统模型 的目的。 系统生物学与基因组学、蛋白质组学等各种“组学”的不同之处在于:它是一种整 合型大科学。首先,它要把系统内不同性质的构成要素( 基因、m r n a 、蛋白质、生物 小分子等) 整合在一起进行研究。其次,对于多细胞生物而言,系统生物学要实现从基 因到细胞、到组织、到个体的各个层次的整合。这就需要一套原理和方法将系统内部各 个组分的行为与系统的特性及功能连接起来,从而避免机械唯物主义。系统生物学的发 展预计需要一个世纪或更长时期,因此常把系统生物学称为2 1 世纪的生物学【8 】。 1 2 代谢网络的研究内容与现状 传统的生化途径一般定义为确定的单独反应的链式组合,通常说来是不考虑辅因子 和副产物的。现阶段,由于可以获取更加完备的信息和大量重建的代谢网络,逐渐形成 了基于网络的途径定义( 包括辅因子和副产物) h i ,见图1 - 2 。目前,传统的途径已经 只能作为一个观念上的框架来交流、教学以及作为建立代谢网络的一个基础,由于它们 通常只是一组反应的链式组合,因而不能用于系统层次的分析。 ( a ) ( b ) + ( c ) i l7 矽 阜 一厶 : 弋 io ! j 飞 : : 霉、 l 铹 1 弋,哕 图卜2 代谢途径的演化( a ) 精确刻画的单独反应 ( b ) 单独的反应组合成传统的途径( 不考虑辅因子和副产物)( c ) 一个完整的网络 f i g 1 - 2d e v e l o p m e n to fm e t a b o i cp a t h w a yn 1 1 ( a ) t h ep r e c i s ec h a r a c t e r i z a t i o no fi n d i v i d u a l r e a c t i o n s ( b ) m o s to ft h e s er e a c t i o n sh a v eb e e ng r o u p e di n t o t r a d i t i o n a lp a t h w a y s t h a td on o ta c c o u n tf o rc o f a c t o r sa n db y p r o d u c t s ( c ) ac o m p l e t en e t w o r k 3 代谢途径的演化 江南大学硕士学位论文 另一方面,生物信息学时代的主要研究对象是序列,通过序列分析来发现基因、确 定基因功能、对蛋白结构进行分析预测等1 1 2 1 。近年来,随着系统生物学的诞生和不断发 展,随着完成测序的生物数量的迅速增加及对基因功能的不断深入和广泛的了解,对生 物网络( 包括代谢网络、基因调控网络、信号转导网络等) 的研究在生命科学领域中越 来越受重视 1 3 - 1 6 。 在各种生物网络中,代谢网络的信息是最完备最可靠的,此外,代谢网络是唯一整 合了多种不同类型数据( 基因、蛋白、代谢物等) 的生物网络,因而成为系统生物学领 域的一个重要研究对象。代谢网络理论把细胞的生化反应看作是一个完备的相互作用体 系,在网络整体的层面上加以研究,而不是孤立地进行考虑。广义的代谢网络包括物质 代谢网络和能量代谢网络。细胞代谢的网络由上万种酶催化的系列反应系统、膜传递系 统、信号传递系统组成,并且既受精密调节,又互相协调。各种代谢都不是孤立地进行 的,而是相互作用、相互转化、相互制约的一套完整、统一、灵敏的调节系统。 t a b 1 - lm a i nd i s c i p l i n e sf o ri l w e s t i g a t i n gm e t a b o l i cn e t 、v o r k s ? 一 代谢网络的特征涉及学科 复杂 自治 数学、计算机科学、生物信息学 控制论 ? 鲁棒系统科学 ;? i反应生命现象 。生物科学 扩 蒡。? 善描述物化过程 动力学 器 毒 参能调整i 进化动力学 代谢网络的研究是一个多学科交叉的研究领域,结合了生物化学、分子生物学、细 胞生理学、化学工程以及计算机科学等众多学科( 表1 1 ) 。目前的研究主要集中在代谢 网络的重建及其结构功能分析方面( 详见第2 章) ,研究人员已经成功地重建了多种生 物的代谢网络 1 1 5 】,并且建立了多个代谢网络数据库 1 9 - 力o l 。在代谢网络被重建和i ns i l i c o 模拟之后,我们就可以通过分析网络来对细胞的生物学功能进行分析、解释和预测【2 1 1 。 然而由于大量反应的动力学参数都是未知的,因此,目前在代谢网络结构功能分析方面, 基于网络拓扑结构的静态分析方法得到了广泛的应用,而图论方法和基于网络的途径分 析是目前采用的主要方法。 自2 0 0 0 年j e o n g 等在n a t u r e 撰文【1 3 1 使用图论方法描述代谢网络以来,相关的研究 工作越来越多,这种形式的研究主要关注下列四个方面【1 5 l :1 ) 小世界效应,即任意两 个结点能通过最少几条边的路径建立连接,研究表明所有生物的平均路径长度都很小 ( 约3 2 ) ,呈现“小世界”特性。2 ) 结合度分布,也就是一个结点有k 条边的概率p ( k ) , 4 第一章绪论 大量的研究表明代谢网络的度分布服从幂律分布p ( k ) k r ( r 2 2 ) 。3 ) 聚集性,这是网 络潜在模块化的标志。大量的研究表明,细胞网络是高度模块化的且具有与社会网络类 似的模块化结构。众多基于代谢流的网络模块化方法和图形聚类算法被用于识别和提取 代谢网络中的功能模块,以便进一步分析复杂代谢网络中蕴含的功能信息。4 ) 鲁棒性, 主要是研究网络的容错与抗攻击能力。 与图论方法相比,基于网络的途径分析方法已经历了一段时间的发展【1 1 ,2 2 。早在 1 9 8 8 年,c l a r k e 就开始用化学计量法来进行网络分析【2 3 1 。后来,s e r e s s i o t i s 和b a i l e y 开 发了用数学理论形成代谢途径的方法,但是这种代谢途径只有个底物和一个产物【2 4 i 。 随后,m a v r o v o u n i o t i o s 等开发出改进的算法,不过在计算代谢途径之前需要先将代谢物 分成四类,这限制了该方法的使用1 2 5 l 。f e l l 用线性代数理论计算代谢途径【2 6 1 ,但是其缺 点也非常明显:一是由于组成系数矩阵的线性无关解不是惟一的,因而对应的途径组也 不是惟一的;二是由于这些线性无关解可正可负,而实际上有些反应是不可逆的,这就 会导致了有些解实际上并不能作为代谢途径。自凸分析被用于定义代谢途径开始,代谢 途径分析方法得到了长足发展,逐渐形成了目前国际上普遍承认的两种代谢途径分析方 法:基元模式 2 j - 2 s 1 和极端途径 2 9 - 3 们。这两种方法在识别没有被途径利用的反应、确定酶 子集、分析网络的冗余性、优化途径和生长速率、分析最小切割子集、简单预测转录调 控、标注未知孤独基因功能、探索热力学可行性等众多方面都有所应用。 代谢网络与代谢途径的研究前景非常广阔,并且具有重要的现实意义,例如在医药 领域,该方向的研究成果可以用于识别药物作用靶点来进行药物设计,以及基因疗法的 设计。相对于传统的以疾病相关单个酶促反应步骤为靶标的研究策略,基于网络的策略 有助于在基础医学研究及临床处理中对实验结果进行更好的分析,并且更加合理的选择 药物靶标 3 1 - 3 2 1 。 1 3 研究意义与主要研究内容 1 3 1 立论依据 苏云金芽胞杆菌( b a c i l l u st h u r i n g i e n s i s ) 是一种能在其芽胞期产生杀虫晶体蛋白的 革兰氏阳性细菌,是目前研究最为深入、应用最为广泛的杀虫微生物。目前,苏云金芽 胞杆菌制剂作为一种对人畜安全无毒、不污染环境的高效微生物杀虫剂,广泛应用于防 治农业和林业害虫如鳞翅目、鞘翅目等,其商品制剂的销售额占整个生物杀虫剂市场的 9 0 ,还具有迅速而稳定增长的趋势。近年来,世界年销售额均突破l 亿美元,并且以 每年1 0 2 0 的速度增长。 自从1 9 0 1 年苏云金芽胞杆菌被发现以来,全世界范围内对其进行了广泛的研究: 在微生物方面,涉及到分类、生长和代谢、遗传学和生态学等领域;在生化与分子生物 学方面,涉及到伴胞晶体的形态、结构、理化性质,以及杀虫机理和相关基因的克隆、 改造以及功能研究等;在工业化方面,涉及到菌种的改造、发酵工艺的优化、剂型、标 准化以及安全性和登记等;在应用方面涉及到应用目标和范围、应用技术以及影响效果 的因素等。随着苏云金芽胞杆菌制剂产量的不断增长、分子生物学和基因工程的发展、 江南大学硕士学位论文 转基因抗虫植物的巨大成功和广泛应用,以及害虫对苏云金芽胞杆菌抗性的产生等均促 使人们对该菌进行更广泛的研究和深入的发掘【3 3 。3 4 j 。 为了从系统水平上来描述、解释和预测苏云金芽胞杆菌细胞的功能及其行为,加深 对其细胞组织原则的理解,并最终用于指导菌种优选、发酵过程优化等,本文由基因组 数据重建了苏云金芽胞杆菌的代谢网络,并从系统生物学的观点出发,分析了由此得到 的代谢网络的整体拓扑结构、网络的模块化以及相关的代谢途径。 1 3 2 主要研究内容 本文主要对苏云金芽胞杆菌的代谢网络的拓扑结构和功能进行分析,主要研究内容 有以下几个部分: 基于现有的数据库如k e g g 等和相关的文献信息重建苏云金芽胞杆菌的代谢网 络。为了使得在用图论方法分析代谢网络拓扑结构时有更好的生物学意义,本 文将省略一些普遍存在的小分子代谢物,如a t p ,a d p ,n a d p ,h ,o 等。 用图论方法对苏云金芽胞杆菌代谢网络的拓扑特征进行分析,包括平均路径长 度、网络直径、连接度分布和鲁棒性等。 运用模拟退火聚类算法研究苏云金芽胞杆菌代谢网络的模块化结构,即对代谢 网络进行模块化分解,使得划分出的模块内部的点连接得尽可能紧密,而模块 之间的点连接得尽可能稀疏。 使用基于网络的途径分析方法对苏云金芽胞杆菌的p h b 代谢进行分析。 第一章是绪论部分,简要介绍了生物信息学与系统生物学的产生和研究内容,以及 由之引发的代谢网络与代谢途径研究思路、流程和方法的转变,从宏观上介绍了本文的 研究内容、意义以及论文的整体结构组织。 第二章首先详细介绍了用于代谢网络重建的主要数据类型( 一般包括生物化学、基 因组学和相关的代谢生理学信息) 以及相关数据库,然后介绍了重建和精炼代谢网络的 一般方法并完成了苏云金芽胞杆菌代谢网络的重建工作,为接下来的拓扑分析以及基于 网络的途径分析提供了直接材料。 第三章分析了苏云金芽胞杆菌代谢网络的整体拓扑结构特征,首先借助代谢网络的 “蝴蝶结”结构特征对网络进行简化处理,随后从网络的小世界效应、节点度分布和鲁 棒性等三个方面对巨强连通体进行分析。 第四章首先描述了代谢网络模块化的基本概念,介绍了代谢网络模块化分解的基本 算法,随后基于复杂网络的“蝴蝶结”结构,先前重建的苏云金芽胞杆菌代谢网络被分 解成四个部分,并使用模拟退火算法进一步分解了最主要的巨强连通体部分。将分解结 果与k e g g 数据库的代谢途径相比较,发现这里所得的模块具有一定的功能意义,并且 模拟退火算法得到的模块性较高,适合于代谢网络的模块化分析。 6 第一章绪论 第五章首先简单地介绍了基于网络的途径分析方法发展简史,随后着重说明了基于 凸分析的两种代谢途径分析方法:基元模式和极端途径及它们之间的异同,并详细阐述 了这两种方法的具体应用,然后使用后者详细分析了苏云金芽胞杆菌的p h b 代谢。 第六章是工作总结和展望。 7 江南大学硕士学位论文 第二章重建苏云金芽胞杆菌代谢网络 2 1 引言 系统生物学的一个重要问题是解释细胞中涉及的代谢和调节网络,迅速发展的基因 组测序技术与功能基因组学提供了这些生物网络的大量信息,这使得我们可以方便的理 解细胞生理学以及从系统层次上比较不同的有机物。另一方面,生命是一个远离热力学 平衡态的过程,一系列酶促反应链( 即代谢反应) 必需不停地运作以尽可能地阻止有机 体达到热力学平衡态,因为那意味着死亡【3 5 l 。亦即,代谢处于生命活动调控的末端,是 驱动生命活动的化学引擎,细胞是通过新陈代谢产生的能量来驱动各种细胞活动、降解 和合成不同分子的。代谢网络把细胞内所有的代谢反应表示为一个网络,它反映了所有 参与代谢过程的化合物以及所有催化这些化学反应的酶之间的相互作用,是对细胞整个 代谢活动的抽象表达。研究代谢网络能够帮助我们预测和模拟细胞的功能及其行为,从 而更好地认识和利用细胞代谢过程,进而促进发酵工程、制药工业等产业的发展。事实 上,最近这些年已经有大量的关于基因组规模代谢网络的研究 1 3 , 3 6 - 4 0 1 。 本章首先详细介绍了用于代谢网络重建的几类主要数据以及相关数据库,然后介绍 了重建和精炼代谢网络的一般方法并完成了苏云金芽胞杆菌代谢网络的重建工作。 2 2 网络重建:数据类型 细胞的功能依赖多种不同的化学成分的相互作用,迅速发展的基因组测序技术与功 能基因组学等高通量( h i g h t h r o u g h p u t ,i - r r ) 技术使得我们能够在基因组层次上确定它 们的化学成分,这包括:全基因组的测序与注释( 基因组) ,给定情形下探测信使r n a 的合成( 转录组) ,蛋白质的交互和功能状态( 蛋白组) ,代谢物及其浓度以及代谢通量 的测量( 代谢组) 等。结合基因组数据、生物化学以及相关的代谢生理学信息使得我们 能够建立包含全细胞组分的生物化学反应网络,这样就可以从系统水平上来描述、解释、 预测和模拟细胞的功能及其行为【4 1 j 。基因组规模代谢网络的重建实际上是一个将所有有 关“组学”数据整合的过程,这需要大量的相关数据资源【8 】,主要包括( 按照可靠性排 列) : 1 、生物化学。这是重建基因组规模代谢网络的最直接强有力的证据。如果生物体 中某种酶的功能被确定了,那么该酶催化的代谢反应就应该被包括在重建的网络内。对 于大肠杆菌( ec o l i ) 和酵母( y e a s t ) 等模式生物而言,这些数据非常充分。但对于苏 云金芽胞杆菌来说,相应的数据是很不完善的。 2 、基因组学。基于d n a 同源性的序列相似性比对识别基因组序列中的开放阅读框 ( o r f ) ,也可以作为证实生物体中存在某代谢反应的有力证据。 3 、生理学等其他间接的信息。生理学的证据,比如知道生物体实际上可以产生某 种氨基酸,而网络中缺少可以产生该氨基酸的途径,那么就要加入相应的反应。这个过 程叫“g a p 分析”,其它的间接信息常用于诊断重建后的网络以作必要的精炼。 第二章重建苏云金芽孢杆菌代谢网络 4 、i ns i l i c o 模拟数据。模拟与仿真学习通常也可用于精练重建后的网络。比如,代 谢网络必须能够产生所有细胞生存必需的代谢成分,如果不能生成某必需的成分,那么 也要加入相应的反应,这种反应成为“推断的反应”。 组合所有通过这些不同数据资源得到的反应就可以重建基因组规模的代谢网络,这 种网络之所以称为“基因组规模的”,是由于一般来说整个过程是从注释的基因组数据 开始的,它包含了所有已经发现的与生物体代谢有关的基因组信息。 2 2 1 生物化学信息 直接的生物化学信息是确定生物体中是否存在某反应的最可靠信息。此外,生物化 学信息还给出了反应的可逆性及其化学计量系数。例如,催化葡萄糖与a t p 反应生成 6 磷酸葡萄糖与a d p 的酶是葡萄糖激酶,编码这个酶的基因一般是g k ,与这个反应相 对应的e c 号是2 7 1 2 。于是,可以得到这组关联信息: t a b 2 一lg c n e - p r o t c i n - r c a c t i o n ( g p r ) a s s o c i a t i o n s 其中,e c 号是国际生物化学和分子生物学协会( i n t e m a t i o n a lu n i o no f b i o c h e m i s t r y a n dm o l e c u l a rb i o l o g y ) 为每个酶分配的一个确定的命名分类号( 如1 1 1 1 ) ,用于系统 地刻化酶促反应( h t t p :w w w c h e n t q m u l a c u k i u b m b e n z y m e ) 。 互连网上有大量的生物化学信息数据库可用,如s w i s s p r o t ( h t t p :u s e x p a s y o r r d s p r o t l ) 包含了参考文献、序列、分配的功能基因以及其它一些有用的信息,可以作为核查生物 化学信息的一个标准。 2 2 2 基因组注释信息 由于只有大肠杆菌( ec o l d 和酵母( y e a s t ) 等模式生物才具备充分的生物化学信 息。对于苏云金芽胞杆菌而言,基因组规模代谢网络的重建主要依赖于基因组注释信息: 识别基因组序列中的所有开放阅读框。这个过程可以通过基因敲除等实验手段完成,或 者更普遍地,使用序列的同源比对等生物信息学方法。对于新测序的物种而言,i ns i l i c o 的预测大约可以识另u 4 0 - 7 0 的开放阅读框,因此不断有改进的方法用于基因组注释1 4 2 1 ( 见表2 2 ) 。 9 江南大学硕士学位论文 t a b 2 2m e t h o d sf o ra n n o t a t i n gg c n o m e s 类别方法 o r fi d e n t i t i c a t i o nc 虻m c a n s t o pc o d o n s t r a d i t i o n a lm e t h o d e x p e r i m e n t a l s 0 q u e i 硷eh o m o l o g y n e wm e t h o d sc o r r e l a t e dm r n a e x p r e s s i o nl e v e l s o l r o nc l u s t e r i n g p r o t e i n - p r o t e i ni n t e m e a i o n s p r o t e i nf u s i o nc l u s t e r i n g 此外,为了得到高质量的网络,需要仔细校对涉及的所有组分,可以借助一些包含 基因组信息的数据库完成这一过程,常用的基因组数据库见表2 3 。 t a b 2 3p u b l i c l ya v a i l a b l eg e n o m ed a t a b a s c s 类别 数据库 站点 l o 第二章重建苏云金芽孢杆菌代谢网络 2 2 3 其它信息 一个完整的基因组规模代谢网络的重建还需要考虑以下两点:首先,需要考虑到生 物体的生存需求。一般情况下,代谢网络应该能够完成这些功能,比如合成生物体在某 一生存条件下必需的所有成分。在某些情况下,如果不能通过实验得到某生物体在某一 生存条件下必需的所有成分,那么可以使用与之相近的一个生物体来代替,举个例子来 说,本文在苏云金芽胞杆菌代谢网络的重建过程中,综合考虑了k e g g 可得的三个不同 菌株。其次,重建的网络应能够产生实验上观察到的生理现象,因此获取生理学信息以 确定之是非常重要的。另外,生理学的数据反应了网络的功能,是代谢网络拓扑结构分 析的一个基础。 2 3 网络重建:方法 代谢网络的重建是一个复杂的反复的过程。一般来说,细胞都包括三类主要的高分 子代谢物( 蛋白、核酸、多糖) 和几类小分子代谢物( 如氨基酸、脂肪酸、核苷、糖、 无机离子等) 。首先,需要获取所要重建的目标物种代谢网络中的所有基因酶以及酶 反应的列表。随后,需要仔细核查建立一个包含参与细胞新陈代谢的所有代谢组分及其 代谢反应的列表。其中,酶是连接基因和相应的代谢反应的关键角色,由于确定酶的 e c 号是唯一的,所以它被广泛运用于代谢网络的重建中。 一般说来,基于某一物种的基因组注释信息,结合相关的酶反应数据库如b r e n d a ( h t t p :w w w b r e n d a u n i k o e l n d e ) 等( 详见表2 4 ) ,就可以确定包含在代谢网络中所有 的代谢反应。其主要步骤概述如下【4 3 1 : 1 、识别基因组序列中的所有开放阅读框( o i 心) ; 2 、通过序列相似性比对,预测该物种的所有酶基因的列表; 3 、查询酶命名数据库,如e n z y m ed a t ab a n k ( h t t p :e x p a s y h c u g e o h ) ,将酶对应上 相应的编号( e cn u m b e r ) : 4 、查询酶与反应关系的数据库,如k e g gl i g a n d ( h t t p :h w w w g e n o m e j p & e g g ) 数据库,将酶的编号对应上它所催化的代谢反应。 t a b 2 - 4p u b l i c l ya v a i l a b l ee n z y m ea n dp a t h n a yd a t a b a s e s 类别 数据库 站点 酶 代谢反应 b r e n d a i n t e n z k e g g b i o c y c b i o s i l i c o h t t p :w w w b r e n d a u n i & o e h l d e h t t p :w w w e b i a c u k i n t e n z h t t p :w w w k e g g c o r n h t t p :a v w w b i o c y c o r e , h t t p :b i o s i l i c o k a i s t a c k ro rh t t p :b i o s i l i c o o r g 江南大学硕士学位论文 一 e m p h t t p :w w w e m p p r o j e c t c o r n “k e g g m e m c y c 乙 p 1 7 m a 2 。:w 玎 h t t p :a v w w g e n o m e j p k e g g h t t p :m e t a c y c o r e , h t t p :c a p b d b i u d e l e d u w h i s l e r h t t p :w w w g e n e d a t a c o m p h y l o s o p h e r p h p h t t p :c o m p b i o a l e s a n l g o v p u m a 2 c g i - b i n i n d e x c g i 重建工具。:m e t a f l u x n e t h t t p :m b e l k a i s t a c k r m f n 倒f a a p a t h f m d e r r 弧a h t t p :b i b i s e r v t e c h f a k u n i - b i e l e f e l d d e p a t h f i n d e r h t t p :w w w p a t i k a o r g _:=:_一-一c 。 大肠杆菌j : o l i b r i h 1 1 p :饴e 肿l i s t p a s t e 盯两瓦蕊面一 : c y b e r c e l l h t t p :r e d p o l l p h a r m a c y u a l b e r t a c a c c d b i n d e x h t l i l i ; 。 “e c h o b a s e h t t p :w w w e c o l i - y o r k o l 酵母 幽门螺杆菌 e c o
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教版数学六年级上学期 6.1解决问题(一)同步测试(含解析)
- 2025河南南阳财和投资有限公司招聘工作人员(第九号)备考练习试题及答案解析
- 水库水源保护区划定方案
- 2025山西吕梁市孝义市市属国有企业招聘68人备考练习题库及答案解析
- 四年级上册试卷及答案
- 七年级下册历史试卷及答案
- 2025夏季重庆川仪自动化股份有限公司招聘56人备考练习试题及答案解析
- 2025年合肥市兴华苑小学相山路校区招聘教师备考练习试题及答案解析
- 2025中铝材料应用研究有限公司面向中铝集团内部招聘4人考试参考试题及答案解析
- 2025年环保试题及答案
- 《四川省房屋建筑工程消防验收现场评定技术标准》宣贯课件
- 中间人垫付合同协议书
- 2025年图书情报专业考研试题及答案
- 系统规划与管理师教程(重点+版)
- 与法相伴 健康成长-法治教育第一课班会
- T-CACM 1256-2019 中医整脊科临床诊疗指南 腰椎间盘突出症
- 2024年农业经理人考试题库试题及答案
- 2025年全国硕士研究生考试(政治)真题答案及解析真题及答案(完整版)
- 农贸综合体项目可行性研究报告
- 管理学基础(第三版) 课件 徐洪灿 第1-5章 管理概述-组织与组织设计
- 《中国园林艺术文化》课件
评论
0/150
提交评论