




已阅读5页,还剩73页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 摘要 代谢流量分析是代谢l :捍中的重要i :具,上要包括计量碲i 碳标记实验两人方 法, f 1 的魁对稳态情况f 的生物体体山代谢途径中的物质流最进行定最分析,获 得生物系统的代谢通量、代谢能力极限等信息。返唯信息埘刘域生物系统的生理 特性,评估遗传和q :境对细胞的影响具有重要作用。 本文针对代谢流量分析中的一些关键讣算技术进行了深入的探讨和研究,完成 哟! ! 要i :作包括:给出了一种s b m l 兼容的代谢流量分析模型描述语言,语言同 时支持基于计鼍的通最平衡分析年l i 基于碳标记实验的精确通鼋分布分析。并在这 种格式的毖础上设计开发了服务于微生物稳态代谢漉定毋分析的计算系统:通 过分析利用通量宁h j 的,、特性,提抖 了。利,基于进化优化的通量估汁算法,算法 在收敛速度、全局寻优能力和稳定性等方面都具卡f 较好表观:通过分析收敛情况 下测量数据拟合残差的概率分布,运用m e t r o p o l i s 算法对乍珲状态附近的通量分 布进行采样,定义通量估讣的置信范同,从而对通量估计结果的u ,锘性丰准确性 进行定话描述;丛于g i b b s 算法,提出了个均匀采样算法米研究高维通鼋空闻 的形状特性相对于普通m o l l t ec a r l o 采样,算法速度可以提高数百倍,为研究 大规模f 谢删络列应的通量守日j 提供了可能。所有卜述工作均以实现存i 十算系统 j j i ,并应用到大肠杆蔚代谢系统分析等实陆的牛物问题巾,取得了较好的效果。 关键词: 代谢流量分析,碳同位索标记实验,通量平衡分析,m c m c 采样,进化优 化,标记语言 英文摘要 a b s t r a c t m e t a b o l i cf l u x a n a l y s i s ( m f a ) ,w h i c hg e n e r a l l y c a nb ed i v i d e di n t o s t o i c h i o m e t r y - b e s e da n dc a r b o nl a b e l i n ge x p e r i m e n t ( c l e ) 一b a s e dt w om e t h o d 8 , h a sb e c o m ea ni n d i s p e n s a b l et o o li nm e t a b o l i ce n g i n e e r i n g i t sg o a li st oq u a n - t i t a t et h em e t a b o l i t ec o n v e r s i o nr a t e s ( o rf l u x e s ) t h r o u g hb i o e h e m i c a lr e a c t i o n si u t h em a j o rp a t h w a y so fam i c r o o r g a n i s mf r o i nm e a s u r e m e n td a t ar e p r e s e n t i n gt h ei n 撕u om e t a b o l i cs t a t eo ft h ec e l l i n f o r m a t i o nr e l a t i n gt or e a c t i o nr a t e sa n dm e t a b o - h t ec a p a b i l i t i e s l i m i t si si 1 1 v a t u a b l ef o rc h a r a c t e r i z i n gd i f i e r e n ts t r a l l l 8o rd i i r e r e n t , p h y s i o l o g i c a ls t a t e so fam i c r o o r g a n i s m a n du s e f u lf o re v a l u a t i n gt h ec o r r e l a t i o n b e t w e e ng e n o t y p e ,p h e n o t y p ea n de n v i r o n m e n t t h i sp a l ; e ri sd e d i c a t e dt os o m ec r i t i c a lc o m p u t a t i o nt e c h n i q u e si n v o l v e di n m f a f i r s t ,w ed e v e l o pa ns b m lc o m p a t i b l em f am o d e ld e s c r i p t i o na n de x c h a n g e f o r m a t ,w h i c hs h p p o r t sb o t hs t o i c h i o m e t r y b a s e dm f aa n dc l e b a s e dm f ar 1 3 c m f a ) b a s e do nt h i sf o r m a t a nm f a o r i e n t e dc o m p u t a t i o ns y s t e mh a sb e e ni n p p l e m e n t e da sap l a t f o r mo nw h i c hb i o l o g i s tc a uc a r r yo u tav a r i e t yo fm e t a b o l i c q u a n t i t a t i v ea r i a l y s e a s e c o n d ,t oe s t i m a t ef l u xd i s t r i b u t i o ni n ”cm f a w ep r o - p o s ea ne v o l u t i o n a r y - b a s e dg l o b a lo p t i m i z a t i o na l g o r i t h mt a k i n ga d v a n t a g eo ft h e c o u v e xf e a t u r eo ft h ep r o b l e m ss o l u t i o ns p a c e t 1 1 ea l g o r i t h mw a sa p p l i e dt oe s t i m a t et h ec e n t r a lm e t a b o l i cf l u x e si ne s c h e r i c h i ac o l ia n dc o m p a r e dw i t hc o n v e r t - t i o n a lo p t i m i z a t i o nt e c h n i q u e e x p e r i m e n t a lr e s u l t si u u s t r a t e dt i i a to u ra l g o r i t h m i sc a p a b l eo fa c h i e v i n gf a s tc o n v e r g e n c et og o o dn e a r - o p t i m aa n dm a i n t a i n i n gt i l e r o b u s tn a t u r eo fe v o l u t i o n a r ya l g o r i t h m sa tt h es a m et i m e t h i r d ,t oa d d r e s st h e p r o b l e mo fr e l i a b i l i t yo ff l u xe s t i m a t i o n ,w ep r e s e n ta l lm e t r o p o l i s - b a s e da l g o r i t h m t od e t e r m i n ea c c u r a t ec o n f i d e n c ei n t e r v a l sf o rf l u x e se s t i m a t e df r o l nj s o t o p es t u d i e s f i n a l l y , w ed e s i g na ne f f i c i e n tg i b b ss a m p l i n gs t r a t e g yt ou n i f o r m l ye x p l o r et h e h i g h - d i m e n s i o n a lf l u xs p a c e ,c o m p a r e dw i t hc o n v e n t i o n a lm o n t ec a r l om e t h o d a 1 g o r i t h mc a ne v e ni m p r o v et h es p e e dh u n d r e d so ft i m e s ,t h e r e f o l ep r o v i d eap o t e n t i a l a p p r o a c hf o re f f e c t i v ee x p l o r a t i o no ff l u xs p a c ed e r i v e df r o ml a r g e - s c a l em e t a b o l i c n e t w o r k 苤奎塑兰 k e y w o r d s : m e t a b o l i cf l u xa n a l y s i s ,c a r b o n l a b e l i n ge x p e r i m e n t ,f l u xb a l a n c ea n a l y s i s m c m cs a m p l i n g ,e v o l u t i o n a r y - b a s e do p t i m i z a t i o n m a r k u pl a n g u a g e 中国科学技术大学学位论文相关声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究 工作所取得的成果。除已特别加以标注和致谢的地方外,论文中 不包含任何他人已经发表或撰写过的研究成果。与我一同工作的 同志对本研究所做的贡献均已在论文中作了明确的说明。 本人授权中国科学技术大学拥有学位论文的部分使用权, 即:学校有权按有关规定向国家有关部门或机构送交论文的复印 件和电子版,允许论文被查阅或借阅,可以将学位论文编入有关 数据库进行检索。可以采用影印、缩印或扫描等复制手段保存、 汇编学位论文。 保密的学位论文在解密后也遵守此规定。 储签名败钍也作者签名: j :! 幺 少日 第一章绪论 第一章 绪论 1 1m f a 概论 代谢流量分析( m e t a b o l i cf l u xa n a l y s i s ,m f a ) 是代谢工程 ( m e t a b o l i ce n g i n e e r i n g ) 中的重要工具f 1 1 ,它的目的是对稳态情况下 的生物体内代谢途径中的物质流量( 代谢通量) 进行定量分析,获得生物 系统的代谢通量、反应速率等定量化信息,评估细胞代谢能力和极限。这 些信息在代谢途径优化,提高产物得率【2 】、刻画生物系统的生理特性【3 】 逆向工程重构生物体的代谢网络f p 6 j 和药物设计f 7 1 等应用中都具有重要作 用。 生命是一个异常复杂的大系统,它向我们呈现的信息往往是片面的。 层次性的,例如螭因的变化会导致转录,蛋白合成等发牛相应的变化。需 要将这些各个层次的部分信息综合起来分析评估,来揭示生物体基因型, 表现型和环境之问的作用关系。而相比于基凶组,转录组,蛋白组等信 息,代谢通量数据有着自身的优势,因为代谢通量分布直接刻画了生物体 生理状态,足遗传、代谢调控和环境等因素综合作用的结果,而其它组学 只是分别从各自的角度描述了生命系统。将通量组信息与其它组学信息 ( 基因组,转录组,蛋白组等) 相结合对细胞进行全面分析已经成为目j i 和今后研究的一个重要方向。而m f a 是定量分析稳态条件下微牛物代谢系 统最有效的方法,适合用来精确地确定代谢网络中的通量分布,分析系统 的代谢能力,评估基因和环境对细胞的影响等。 m f a 主要分为两大类:基于计量平衡的m f a 和基于碳标记实验 1 1m f a 概论 ( c a r b o nl a b e l i n ge x p e r i m e n t ,c l e ) 的m f a 。前者以通量平衡分析 ( f l u xb a l a l i c ea n a l y i s ,f b a ) 为代表,根据代谢网络中的物质守恒原 理分析平衡代谢流的分配情况,输入数据主要来源于胞外通量的测量,足 种传统方法。而基十碳标记实验的m f a ( ”cm f a ) 是后来发展起来的 更为强大的定量方法,碳标记测量数据为方法提供了大量的输入信息,是 目前唯一的代谢流分布精确分析方法。尽管两类方法在原理、实旆和结果 上都存在不同,但运用m f a 来分析稳态条件下微生物代谢流分布的过程却 是统一地遵循系统生物学方法论( 图1 - i ) 。首先,我们根据定性的生物学 知识建立系统模型,刚开始时这个模型可能还不足以允分描述生物系统, 表现为模犁中存存一系列的参数需要进一步调整确定。存系统模荤! 的基础 上,运用计算机米模拟乍物系统的运作( 称为干性实验) ,由于模型中参 数的原因,前期的模拟结果会跟真实生物试验( 称为湿性实验) 得到的值 有较大的差异,接下来根据这种差异,不断调整模型中参数的取值,再考 察模拟结果和真实结果间的吻合程度。循环继续这个过程,直到i 实验 和。湿实验的结果误差落存可容忍范围之内,此时认为两者吻合,调整得到 的模型就能够较真实地反映生物系统的性质了。系统生物学分析方法的口 标是在定性知识的基础卜获得了关于生物系统的定量知识,得以更全面、 更深入地认识生物系统,解释和发现一些有意义的生命现象。 具体在m f a 中,定件的生物学知识主要足代谢网络的结构( 图1 2 ) , 代谢通量约束关系和代谢目标的选择等,这些内容i - 有的是从教科书上 可以直接获得的。而有的却没台现成的答案可用,需要在分析中调整改 进,例如代谢目标是对细胞代谢行为的某种假定,假设的成立与否是有待 验正的。分析中用到的数学模型包括f b a 中刘代谢网络建立的计量平衡方 程组【8 1 8 。1 3 cm f a 中构建的i s o t o p o m e r 平衡方程组1 9 】等,这哆模型反应了 网络中通量之问的线性联系,定义了表征代谢状态集合的通量空间,以及 嘲络中通骨= 分布与碳同位素分布之间的非线性关系。模犁中待调整的参 数是通量分布的具体取值,m f a 做精确量化分析的月标是给出一组充分逼 近系统中真实情况的通量分布网,通量分布网是细胞内部基因调控和外 部环境综合作用确定的,是细胞的一种表现型,刻画了细胞所处在的独特 的生理状态,对应于通量空间中的某个具体的解。在模型的基础上,1 3 c m f a 在计算机上模拟碳标记实验,f b a 存计量中衡定义的通晕空间中优化 日标函数,得到稳态情况下i s o t o p o m e r 和姬量在网络中的分布情况,这就称 为m f a 中的干性试验。湿性试验包括细菌的培养,碳同位索标记,测量 2 第一章绪论 圈1 1 :系统生物学办法论。 胞外的通量,通过n m r 或者g c - m s 来获得i s o t o p o m e r 在网络中的分布等。 1 2 基于计量平衡的代谢流量分析 代谢流量分析是在上个世纪8 0 年代中后期发展起来的,当时流量分析 的基础是代谢网络的计量平衡模型( 称为s t o i c h i o m e t r i cm f a ) f 1 0 1 ,以 测量得到的胞外通量作为主要的输入数据,据此米推断胞内的代谢流量 分布f 1 1 ,1 2 1 。该方法自产生以来,得到了长足的发展,是早期m f a 最基 本的方法,1 9 9 3 年v a l l i n o 等人f l l l 用这个方法首次描绘了完整中心代谢的 代谢通量图( m e t a b o l i cf l u xm a p ) 。这种方法构建的系统往往是不定的 ( u n d e r - d e t e r m i n e d ) ,方程组中存在一定的自由度,没法唯一确定胞内的 所有通量。常常需要引入目标函数来对牛化系统作一些假设,以这些假设 作为优化的目标,例如常见的假发有能量平衡,a t p 产率最小、最大增长 率等。这种计量方法以通量平衡分析为代表,是一类基于约束的方法,具 有实验相对简单,擞作性强,模型构建容易,方法灵活,理沦较完善,代 谢删络分析能力强,适合分析中大规模删络等优势,现存依然是研究的热 点。代谢目标的引入,既是力法灵活和分析能力强的体现,同时也让疗法 实施的合理性存在一定的疑问因为目标函数的引入是对细胞代谢行为的 3 1 2 基于计量平衡的代谢流量分析 罔1 - 2 :代谢网络示例。( a ) 细胞中生化反应形成的网络结构( b ) 生化反应中碳 原子转移关系( 丰要用于a 3 cm f a 中) 4 第一章绪论 特定假设,这些假设是否真的成立是值得怀疑的,至少在有些代谢网络上 已经证明了能量平衡是不成立的【1 3 ,1 4 3 。而且这种纯粹的计量方法也无法 处理代谢网络中的宅循环、双向反应,并行反应和交换通量等f 15 1 6 1 。 汁量方法发展过程小的重要事件有: 1 9 8 4 :p a p o u t s a k i s 就开始运用线形规划方法来计算代谢的最大理论产 出【1 7 】。 1 9 8 6 :f e l l 和s m a l l 则用线形规划来研究脂肪的生成1 1 8 1 。 1 9 9 2 :进入9 0 年代后,f b a 开始迅速发展,s a v i n e l l 和p a l s s o n 对f b a 作 了详细的分析,从而奠定了其理论基础f 1 9 ,2 0 l 。 1 9 9 3 :v a r m a 和p a l s s o n 运用f b a 描述了大肠杼菌的性质f 2 1 ,2 2 1 1 9 9 7 :p r a m a n i k 和k e a s l i n g 使用f b a 研究了细胞牛长速率和b i o m a s s 浓度的关系f 2 3 1 。 2 0 0 0 :e d w a r d s 和p a l s s o n 对大肠杆菌进行了基凶敲除,相平面 ( p h a s ep l a n e ) 和鲁棒性等分析【2 4 ,2 5 】,s c h i l l i n g 等则将f b a 与极限代谢 途径分析( e x t r e m ep a t h w a ya n a l y s i s ) 进行了结合【2 6 】。 2 0 0 1 :b u r g a r d 和m a r a n a s 研究了大肠杆菌的性能极限,得到了最小 反应集合1 2 7 1 ,c o v e r t 等将调控约束加入到了f b a 模型【2 8 1 。 2 0 0 2 ;m a h a d e v a n 等发展了动态的通量平衡分析,用来研究基迭i 调控 中的动态变化情况【2 9 1 。b e a r d 等在f b a 中引入了非线性的能量平衡约束, 用来量化胞内代谢物的浓度,但足无法保证得到的解足令局最优【3 0 卜 f 一代f b a 的发展方向主要包括【8 ) :1 ,探索新的目标函数束更全面、 更深刻地研究微乍物代谢的能力、极限和鲁棒性等。2 ,引入更多的牛物知 识作为系统约束,如调控约束和热动力学约束等。3 ,发展动态f b a ,分析 非稳态条件下的细胞代谢彳亍为。 1 3 基于碳标记实验的代谢流量分析 最精确的m f a 方法是基于碳同位素标记实验的”cm f a 3 1 1 ,与计量方 法相比,最主要的区别在于”cm f a 使用了碳标记实验。碳同位素标记实 验以特定的1 3 c 标记后的底物( 例如f 1 1 3 c 】葡萄糖和天然葡萄糖的混合物) 作为牛物系统的摄取物,经过一段时问的内部反应,待整个系统达到稳 定,此时带标记的碳原予分布到了代谢网络的各个位置,这样就可以通过 5 1 3 基于碳标记实验的代谢流量分析 核磁共振或者质谱等仪器来测量其中一些位置上的1 3 c i 司位素的标记量,这 些数据为代谢网络胞内通量的量化分析带来了大量的额外信息根据这些 信息可以对生物体内的通量进行精确的分析。到目前为止,1 3 cm f a 足唯 “不依赖于代谢网络的通_ j 的、精确的通量分析方法,在国际上得到了广 泛的研究和应用【1 5 】。与计量方法相比,这是一种更强大,更可靠的通量 定量分析方法,同时也是一种更复杂的方法。首先,实验操作非常复杂。 微生物细胞需要粉碎,大分子需要水解,还需要准备大量的测量样本,碳 同位素标记实验需要长时间的连续培养。其次,碳同位素标记实验中使用 的标记底物价格不菲,例如口前市场上l 克| l - ”c 1 葡萄糖大约需要1 0 0 美元。 而曰,实验要求的前提条件也更多,细胞需耍同时达到代谢和同位素标记 稳态,还假定同位素标记和实验测量对细胞代谢无影响。另外,计算也更 加复杂,内部的数学模型常常涉及上千维的矩阵运算,经常需要迭代和随 机搜索,计算一般都须花费几个小时甚至几天。 然而,1 3 cm f a 近年来得到了迅猛发展实验技术和计算方法的进一 步改进和完善使得其操作复杂性有所缓解,例如运用现代更为成熟的样本 准备程序和高精度的测量仪器。可以将实验时间从原束的几个晕期缩短到 几天,而且不断涌现的强大计算分析系统和硬件计算能力也降低了数据分 析的难度。总体而言,1 3 cm f a 的发展经历了下面几个主要的里程碑: 1 9 8 2 :b l u m 和s t e i n 将基于1 4 c 标记的代谢流量分析应用到 了t e t r a h p m e n a 细胞,在当时该分析方法极度地耗时 3 2 】。 1 9 8 8 :m a l l o y 等人在研究心脏内柠檬酸循环活动时,在同位素分析方 面做了初创性t 作f 3 3 1 。 1 9 9 5 :z u p k e 和s t e p h a n o p o u l o s 基于个通用的数学建模方法完成了第 一例代谢流量分析【3 4 1 1 9 9 6 :m a r x 等人生成了第个标记数据集,有超过2 5 种1 i - in m r 测量 数据包含存内f 3 1 1 。 1 9 9 7 :w i e c h e r t 等人第一次详细论述了带有1 hn m r 测量数据的1 3 c 代 谢流量分析中的通用统计分析方案f 3 5 】。 1 9 9 8 :s c h m i d t 等人在大肠杆蔺上用参数拟合方法对1 h 1 3 cm f a2 d c o s yn m r 数据进行评估( s c h m i d t ,n i e l s e ne ta i 1 9 9 8 ) 。 1 9 9 9 :s a u e r 和b a i l e y 对”c 代谢流量分析中最有前途的方向一细胞能鼋代 谢作了研究f 3 6 l 。 1 9 9 9 :1 3 c 代谢流量分析中质谱仪数据的引入带来了新的数学问 6 第一章绪论 题,p a 呔等人用一种适用广泛但并非通用的建模方法研究了dg l u t a m - i e u m 中的回补通量【3 7 1 。 1 9 9 9 :运用1 3 c 代谢流量分析来比较不同的生理状态足1 3 cm f a 最为普 遍的应用,g 删 肖人在z y m o m o n a sm o b i l i s 上作了相关工作【3 8 卜 2 0 0 0 :c h r i s t e n s e n 和n i e l s e n 针对p e n i c i l i u mc h r y s o g e n u m 提卅了第一个 通用的质谱数据评估方法【3 9 | ,然而他们对数据中蕴含的信息没有加以完全 利用 2 0 0 0 :w i e c h e r t 和w u r z e l 提出了一个通用的、易于计算的”cm f a 框 架【4 0 卜 2 0 0 0 :p e t e r s e n 等人第一次结合通用建模方法和实验设计方法,确定 了dg l u t a m i c u m 的四个回补通量f 1 4 1 。 2 0 0 2 :v a nw i n d e n 等提出了基于b o n d o m e r 标记实验的”cm f a1 4 1 1 , 相对于i s o t o p o m e r 模型,节省了计算时日j 。 2 0 0 3 :j o h n 等将微量滴定板技术成功应用到产赖氨酸产氨棒杆菌的生 物反应体系中,实现了培cm f a 存微犁规模培养条件下的进行【4 2 1 。 2 0 0 3 :d r y s c h 等利用产氨棒杆菌进行l r 赖氨酸巾等规模生产时,首次 将生物传感器反应器技术与1 3 cm f a 相结合1 4 3 ) 。 2 0 0 4 :f i s c h e r 等采用微量滴定板技术与摇瓶培养平行实验,分析了底 物不同标记模式对大肠杆菌中心碳代谢通量讣算的影响【4 4 卜 2 0 0 5 :w i e c h e r t 等系统地介绍了”c 标记实验中引起系统“震荡”的因 素,以及如何最大限度地克服系统“震荡”,从而使1 3 cm f a 住可允许的非 稳态条件- 卜进行【4 5 】。 1 3 cm f a 特别需要实验技术和计算技术的紧密结合,二者的共同发展 才能极好地推动这种代谢流精确分析方法进步。在实验方面,微量滴定板 ( m i c r o t i t e rw e l l p l a t e ) 技术将推动1 3 cm f a 朝着小犁化、高通鼍和降低实 验成本发展。而传感反应器( s e n s o rr e a c t o r ) 技术则有可能引入牛物大规 模培养体系,推动1 3 cm f a 应用到工业化水平。计算方而的重点是降低分 析模型的复杂度,通量估计结果的可靠性评估和非稳态条件通量分析等 总的趋势是推动1 3 cm f a 朝着降低复杂度、实施容易、成本更低,非稳态 分析和更大规模网络应用发展。另外,计量方法一般用来分析中大规模代 谢系统的能力等,而标记分析方法更适合对网络中心代谢途径通量的精确 量化,它们两者的优势和劣势基本上是互为补充的,将它们结合起来分析 7 1 4 论文主要工作与结构 也是代谢方法研究的一个新颖方向。 1 4 论文主要工作与结构 2 0 0 5 年7 月,我们开始与牛命科学学院代谢研究组合作,运用m f a 米 定量地分析微生物代谢系统,我们的主要工作是构建服务于这个目标 的m f a 计算分析系统,工作受到了中国科学院知识创新项目( k s c x 2 s w - 3 2 9 ) 和科技部重大科学研究计划项目( 2 0 0 6 c b 9 1 0 7 0 5 ) 的支持。经过跨 学科双方近两年的共同努力,整个系统基本完成,主要功能包括m f a 模型 的描述、解析、验证,基十碳标记的代谢通量分布估汁,通量分布估汁结 果的置信范围分析,高维通量空间形状分析和基于化学计量平衡的通量平 衡分析。该论文是对这些工作的总结和归纳,涉及的主要工作包括: 1 定义m f a 计算系统框架,其中包括了从用户模型输入到模型定量分析 过程中的重要处理部件,从整体上介绍了m f a 计算过程,返部分手要 在第一章介绍。 2 分析利用通量审间的凸特件,设计一个高效的进化优化算法来估计碳 标记实验中的通量分布,沦文第j 章对这部分有详细硷述。 3 分柝收敛情况下测量数据拟合残差的概率分布,运用m e t r o p o l i s 算法 对细胞生理状态附近的通量分布进行采样,根据样本的统计分析结果 来定义通量估计的置信范围,这些内容是论文第四章的重点。 4 ,基于g i b b s 算法,实现对高维通量空日j 的快速均匀采样,见第五章第 二节。 5 讨论了计最下衡分析模型的组成内容,探讨了方法中额外约束条仆的 引入,目标函数的选择和对应优化模型的求解方法等。见第五章第 节。 6 设计基于s b m l 的m f a 模型描述语言c l e m l ,c l e m l 与s b m l 完全 保持兼容,同时支持1 3 cm f a 和计量m f a ,完成对m f a 模型的统一 描述,见第二章第二节。 本论文分为六章,除了包括上述内容之外,论文第一章概述了m f a 的 目的,意义和两类常用方法,历数了m f a 发展过程中重要事件。最后一章 总结了全文内容,展望了m f a 发展方向。 8 第二章m f a 计算系统 第二章 m f a 计算系统 2 1 m f a 计算系统架构 m f a 平衡代酣流分析汁算是个非常复杂的过程,涉及到输入模型表 示、系统建模、大规模方程组求解和数值优化等多方面的内容。一个功能 强大,用户友好、性能优良的m f a 计算系统对于成功地实施微牛物代谢流 定量分析是不可或缺的。计算系统的主要功能是根据定性知识舟动构建模 型,执行t 干,件实验,完成干湿实验的结合,调整模型,直到最后给出代 谢系统分析的定蹙结果和知识。 目前国际卜已经存在不少的m f a 分析工具,如服务于拈cm f a 的软件 主要有瑞十的f i a t f l u xf 4 6 l 和德国的1 3 c f l u x 4 0 1 。其中f i a t f l u x 运行在 w i n d o w s 系统下,具有用户友好的g u i 操作界而,它根据质谱仪( m s ) 测 量得到的同位素标记质量分布( m a s si s o t o p o m e rd i s t r i b u t i o n s ) 确定通量比 率,专门处理质曙测量数据,提供了很多质谱数据处理相关的工具( 如 数据的校正等) ,在这方面非常出色。但是它1 i 能处理核磁等其它测锗数 据,而这两种辛垂的同位素标记测量手段各有优缺点。应该共同使用,使 之能够互为补充,而且从我们的经验来看,n m r 数据对于代谢通量的量化 往往更为有效。”c - f l u x 是德国锡根大学w i e c h e r t 等人在r e dh a tl i n u x 上开发的m f a 软件,由m e t e x 公司( w w w m e t a b o l i c - e x p l o r e r c o m ) 进行 后续歼发维护。1 3 c - f l u x 对1 3 c 标记数据的使用比较充分,能够同时处理质 谱和核磁等多种测量数据,碳标记实验模拟效率较高,通量估计和误差分 析是它提供的主要分析手段。它的重点是支持1 3 cm f a ,是目前最优秀的 9 2 1m f a 计算系统架构 u s e r - d e f i 1 w df _ x t e m a l 娜m o d e l i r m o d e lc o n v c n i n gi n i c r f a c e j a n a l y s i s m o d u l e c l e m l u n i f i e dm f am o d e ld e s c r i p t i o nf o r m a t c o n f u l e r i e - 一 i l 陋 ; ; 喜l f n e r v a l 墨 g d e t e r m i m t i m o d c lp a r s i n g 1 i c o n e c t o e s $ c h e c k i h g r u xs p a c e c o m p u t a t i o nk e r n e l s l l i d ca n a l y s i s c o m p u t a t i o n a lm o d e la u t o m a t i cc o n s t r u c t i o n a t -c l es i m u l a 6 0 n _ m a s sb a l a n c e 同t t x n 匐 c o r r e l a t i o np a r a m e t e r f i t t i n g 孓 f l t l xc o n s t r a i n t s 兽 a n a l y s i s啊 r u xe s t i m a t j o n o b j e c t i v e + , ;”。 。l i b r a r i e s ( m a t l a b c + + m a t h l i b r a r y ,g l p k g s l i i b s b m l , l i b c l e m l ) 图2 - 1 :服务于微生物平衡代谢流定量分析的m f a 汁算系统架构图 碳标记代谢流分析工具之一,但它不支持f b a 分析。 其它用做计最分析的工具有m e t a f l u x n e tf 4 7 ,f l u x a n a l y z e r1 4 8 和 m e t a t o o lf 4 9 等。它们用物质平衡米描述网络中代谢反应之问的关系,通 过计算各种约束条件,研究可行解空间的性质,用来计算、解释和预测代 谢流量的分布,分析代谢网络的能力。南于没有使用碳j 一位素标记实验中 的信息,系统分析的复杂度有所降低,一般是线性和二次性的系统,町以 使用成熟的数学分析方法来对代谢系统进行深入的分析,被研究的代谢9 。9 络的规模也可以非常犬,常常包含几百甚至上干个反应。倪这类分析t 具 一般不能用来精确计算网络的通量分布 1 0 第二章m f a 计算系统 现在,还没有一个同时拥有1 3 cm f a 和f b a 两大分析功能的计算系 统,而这两种主要的m f a 分析手段各有优缺点,具有很明显的优势互补 性,应该结合起来分析。从而开发和应用这样的m f a 计算系统成为了我们 的主要工作内容。我们实现的m f a 计算系统的体系结构如图2 一l 所示,这个 系统相比于其它的分析工具有如卜特点: 1 既支持基于1 3 c 标记的精确流量分析,也支持暴于计量平衡的代谢能 力分析,能够计算、解释和预测代谢流量分布。 2 对代谢网络没有限制,可以分析任意的网络结构。 3 支持包括通量测量、n m r 测量和m s 测量在内的多种实验数据,内部 计算基于i s o t o p o m e r 平衡实现,而i s o t o p o m e r 是表示1 3 c 标记信息的 最小粒度,理论上所有的标记数据都可以用i s o t o p o m e r 米表示,所 以系统理论卜支持任意的测量数据形式。 4 高效的测量数据拟合算法用来精确估计1 3 c 标记数据约束下的通量分 布。 5 对通量估计做置信范围分析,定量分析计算结果的可靠件。 6 快速地对通量空间进行采样,分析通量空问的形状。 7 考察通量之间的相关性( 有无生理状态约束) ,发现新的关联信 息。 8 s b m l 兼容的m f a 模型描述方式,方便模型的交换共享。 9 模型验证功能,从语法和语义多方面检查输入模型的正确件,帮助用 户定义模型。 m f a 计算系统接受用户定义的外部m f a 模犁,这种输入可以采用表 格和图形界面等用户较友好的方式来定义,方便用户使用。首先,外部 模型经过初步的语法检查( 如代谢网络中的一致性等) ,检查通过后, 模型转换接口将模型自动生成为c l e m l ( c a r b o nl a b e l i n ge x p e r i m e n t m a r k u pl a n g u a g e ) 格式,c l e m l 基于s b m l 【5 0 l 定义而成。是一种统一 的m f a 模裂描述语言,同时支持”cm f a 和f b a ,方便模犁的管理和交换 共享。语言描述的内容主要包括:代谢网络,通量约束,测量数据( 通量 和1 3 c 标记量) 和代谢目标,c l e m l 格式的详细内容在接f 来还有介绍。 c l e m l 格式的模犁接下来接受进一步的语义检查,例如通晕约束之间 的矛盾和冗余,代谢网络中的t r a p 【5 1 】等,尽可能地将模型的i 口j 题在计算 的前期发现,保证模型和后期计算分析的正确性,降低用户定义止确可靠 2 2m f a 模型描述i 吾$ c l e m l 模型的难度。 语法和语义检查确认为正确的模型接下来转移到讣算核心处理。在这 里,供计算和模拟的数学模型首先被自动地构建,例如| 化学计量平衡方程 组和i s o t o p o m e r 平衡方程组等,它们定义了代谢通量之间和代谢通量分布 与1 3 c 标记分布之间的关系。然后,”cm f a 和f b a 以构建得到的计算模 型为基础,开始对应的计算分析。1 3 cm f a 经过碳同位素标记实验模拟、 参数拟合和通量估计等步骤最后给出计算结果,即跟实验测量数据拟合的 最好的一组通量分布,它定量地刻画了细胞的生理状态。f b a 主要包括三 个部分:代谢网络定义的化学汁量平衡关系,通量约束条件和代谢口标, 它们分别形成优化问题中的等式不等式约束和目标函数,通过求解优化 问题,得到满足目标的最优解,对应着通量空闸中的某个点,表示某组特 定的通量分布。 系统的分析模块在此基础上还提供了更多、更强大的分析手段,其中 通量估计的置信范围分析通过在生理状态附近的随机采样,统讣分析通量 样本信息,得到每个通最取值的概率分布,从而给出了通器估计的置信范 用,定量地表征了汁算结果的可靠性,为接下来运用这些结果解释说明生 物现象提供了依据。通量空间形状分析以全空间的均匀采样为基础,采样 得到的样本的统计信息反应了岛维凸通量空洲的形状特性。置信范围分析 和空间形状分析都是采样为基础,它们的区别在于一个是在细胞真实的生 理状态附近的非均匀采样,另一个并不关心具体的生理状态,在伞审问内 均匀随机漫步。前者的目的是为了明确地考虑细胞代谢行为l | l 的随机l 夭i 索,评估随机因素的影响。而后者借助随机采样手段来间接地解决数学解 析方法无法完成的问题,特别是在高维情况下,这种方法显得尤其有效。 基于这两种采样得到的样本,还可以开展其它的分析,例如通量相关性分 析,均匀采样样本给出的通量相关性主要足由代谢网络确定的,足在通量 空间处处成立的。而生理状态附近的非均匀采样得到的样本不仪能够给出 这种生理状态无关的相天性信息,还可以给出只有存特定生理状态才成赢 的额外信息,相信这种信息对于评估分析细胞当前牛理状态是有帮助的。 2 2 m f a 模型描述语言c l e m l m f a 的日标是对稳态条件下微牛物代谢系统进行定量分析,包括精确 地量化所有胞内通量的分布、分析代谢能力等等。目前,m f a 尸, 经是代 1 2 第二章m f a 计算系统 谢工程中使用到的最主要的分析工具之一【2 】。根据使用到的信息的类型 不同,m f a 可以分为两大类:基于计量平衡的m f a 和基于同位素标记实验 的m f a 。其中,基于计量平衡的m f a 以代谢网络中中问代谢物的化学计量 平衡为基础,系统状态信息主要来源十胞外通量的测量数据,同时作为额 外知识引入的通量约束和代谢目标也是计量模型的重要组成部分。而基于 同位素标记实验的m f a 常以1 3 c 作为标记物质,因此被简称为”cm f a 。它 的测量数据不仅包括胞外通量,还包括n m r 和g c - m s 预j 量得到的大量中间 代谢物同位素标记状态数据。显然,基于计量平衡的和基于同位素标记实 验的m f a 模型各涉及不同的内容,但它们作为代谢系统的定量分析工具的 目的却是相同的,而日,将这两类方法结合起来,发挥各自的优势从多个角 度分析微生物代谢,也是一种新颖而可行的代谢流平衡分析思路。 目前系统生物学领域已经存在一些与代谢系统建模分 析柏关的标记语言,例如s b m l ( s y s t e m sb i o l o g ym a r k u pl a n - g u a g e )f 5 2 1 和m f a m l ( m e t a b o l i cf l u xa n a l y s i sm a r k u pl a n g u a g e ) 1 5 3 1 。s b m l ( h t t p :w w w ,s b m l o r g ) 始于2 0 0 0 年中期,是计算模型表示 和交换的机读( m a c h i n e - r e a d a b l e ) 格式,独立于各种计算分析工具而存 在,足色们之间模型数据交换的中介。s b m l 描述的重点足模型的生化反 应系统,可以描述代谢网络、细胞信号传导途径和调控网络等。它特别适 合于各种软件工具间计算模型的共享和交流。目前已经得到了超过1 1 0 个 软件系统的支持,享有较高的知名度,得到了j “泛的应用,是系统生物 学领域的开放标准。m f a m l ( h t t p :m b e l k a i s t a c k r m f a m l , ) 是一种服 务于计量m f a 的计算模型表示格式,主要描述的内容有代谢网络结构, 代谢流量测量数据,优化目标和计算结果等。这个格式是仿s b m l 设汁而 成,x m l 元素( e l e m e n t ) 和j 商性( a t t r i b u t e ) 与s b m l 中的类似,但它并 不能够与s b m l 完全兼容。现在,m f a m l 的应用还不是很广泛,支持它 的软件系统也不多,它主要还是在其作者开发的计量m f a 计算分析工具 m
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中语文写作教学中的家庭参与策略研究论文
- 新时代背景下高中生传统文化素养提升策略研究论文
- 艺术部主任管理制度
- 苏州燃气罐管理制度
- 茶水炉卫生管理制度
- 高校重修后管理制度
- 一年级《小青蛙》课件
- 视频监控系统防雷方案
- 道德与法治(陕西卷)(考试版A3)
- 2025年四川省德阳市中考历史真题试卷(含答案)
- 采购招标廉洁培训课件
- 2025年大学英语四六级考试试卷及答案
- 2024年山东省济南市中考生物模拟试卷(二)
- 第十二章定义命题证明小结与思考(单元复习课件)-七年级数学下册(苏科版2024)
- 外科肝癌患者护理课件
- 八五普法自查自评情况报告
- 2024年企业所得税年度纳税申报表(A类2017 年版2025年01月修订)-(2025 0323)
- 商务谈判实务-形考任务一-国开(ZJ)-参考资料
- esg考试试题及答案
- 重庆市大足区2023-2024学年四年级下学期语文期末考试试卷(含答案)
- 四川省成都市金牛区2023-2024学年五年级下学期语文期末试卷(含答案)
评论
0/150
提交评论