




已阅读5页,还剩61页未读, 继续免费阅读
(计算机应用技术专业论文)一种可视化代谢通量建模系统的设计与应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
论文原创性和授权使用声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究工 作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包 含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对 本研究所做的贡献均已在论文中作了明确的说明。 本人授权中国科学技术大学拥有学位论文的部分使用权,即: 学校有权按有关规定向国家有关部门或机构送交论文的复印件和电 子版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进 行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论, 文。 保密的学位论文在解密后也遵守此规定。 作者签名:叁趄 妒绛臼钿 第一章绪论 第一章绪论 代谢通量( m e t a b o i i cf l u x ) 是细胞生理学的一个基本决定因素,也是代谢 途径中的重要参数,在稳态条件下代谢通量一般以代谢物质的生成速率来表示。 代谢通量分析( m e t a b o l i cf l u x a n a l y s i s ,m f a ) ( z u p k ea n ds t e p h a n o p o u l o s1 9 9 4 ; m a r x ,d eg r 勰w i e c h e r te ta i 1 9 9 6 ;s z y p e r s k i1 9 9 8 ) 是根据代谢路径中各反应的 计量关系以及实验中所测得的数据来确定整个代谢反应网络中代谢通量、反应速 率等定量信息的一种方法,在代谢工程( m e t a b o l i t ee n g i n e e r i n g ) 中占有重要地 位( s t e p h a n o p o l o u s ,a r i s t i d o ua n dn i e l s e n19 9 8 ;s t e p h a n o p o l o u s ,a r i s t i d o ua n d n i e 置s e nl9 9 8 ;赵学明,自冬梅2 0 0 3 ) 。通过计算不同途径或不同条件下的代谢通 量分布,可以表征细胞的代谢能力,研究遗传修饰对细胞代谢状态的影响,从而 为更加合理的遗传改造提供理论依据( w i e c h e r t2 0 0 l c ) 。m f a 综合了底物吸收及 产物形成速率、生物合成需求、化学计量反应以及中间代谢物的生物合成等数据, 为重新构建细胞代谢提供了关键的量化信息。而且m f a 已经成功应用到了有机 酸、维生素、乙醇等目标产物的代谢途径优化中,在提高代谢物生产率、刻画生 物系统的生理特性、逆向生物工程和药物设计等应用中都发挥着重要作用。经过 近2 0 年的迅猛发展,m f a 涉及的实验方法、测量手段和数据分析与估计技术等 日趋完善,已经成为代谢工程中应用广泛的标准诊断工具( w i e c h e r ta n d 、u 院e l 2 0 0 1 b ;w i e c h e r t2 0 0 l c ;n o h ,w 撕l 锄dw i e c h e r t2 0 0 6 ;李晓静,陈涛,陈洵等 2 0 0 6 ) 。 本章主要介绍一下现行m f a 方法中的两种重要手段,阐述它们的建模原理 和主要实施步骤,探讨了与之相关的工具软件研发现状,并对两种手段的优缺点 进行对比,提出结合两种分析方法和研发相关软件的重要性。 1 1 通量平衡分析 1 1 1 通量平衡分析原理 对细胞的中心代谢途径进行定量分析是代谢通量分析的主要任务( w i e c h e n 2 0 0 1 c ) ,而通量平衡分析( f b a ) ( v a 册aa n dp a l s s o n1 9 9 4 ) 能根据代谢路径中各 反应的化学计量关系和实验的某些底物、产物的通量及细胞构成等确定整个代谢 网络的通量分布。该方法的基础是准稳态假设:细胞内的中间代谢物均处于准稳 态,即其浓度变化速率为0 。在这一假设条件下,目标代谢网络中的n 个中间代 谢物可以得到数量相等的生化反应速率约束式( 由计量关系确定) ,若待定速率的 总数目为j ,则所求问题解空间的自由度f = j n ,只要计算出f 个相关速率 l 第一章绪论 即可确定整个代谢网络的通量分布。 在活体实验中进行胞内通量分析时,需要测量技术不影响待测微生物的代谢 状态。在生物反应容器中建立起稳态生理条件之后,代谢过程中所有与细胞内部 和外界媒质之间产生的代谢通量一如基质摄取、产物生成、b i o m a s s 的生长或者 气体的释放一都能够通过标准的分析仪器测得,这些通量统称为胞外通量( e x 吮- c c l l u l a r f l u x e s ) ,以区别位于细胞内部的胞内通量( i n t r a c e l l u i a r f l u x e s ) 。 f b a 能够基于这些胞外通量数据确定胞内通量。实践证明,可用的胞外通 量测量数据在没有进一步假设( 如对酶活性和能量所作的假设) 辅助之下,并不 总是能够确定中心代谢途径的全部胞内通量,因此需要把生物系统原型必须满足 的条件作为f b a 的基本约束。这些约束是生物原型的物理、化学、代谢网络拓 扑和周围环境所决定的( v a 册a ,b o e s c h 蝴dp a l s s o n1 9 9 3 a ;v a m l aa n dp a l s s o n l9 9 3 b ;v r a n n aa n dp a l s s o nl9 9 3 c ;s c h i i i i n 函e d w a r d s ,l e t s c h e re ta 1 2 0 0 0 ; l h m a s h n a ,e d w a r d s ,m c c u l i o c he ta 1 2 0 01 ;s e g r e ,、,i t k u pa n dc h u r c h2 0 0 2 ; c o v e r t ,f a m i l ia n dp a l s s o n2 0 0 3 ;p r i c e ,r e e da n dp a i s s 0 n2 0 0 4 ) 。物理化学约束有质 量和能量守恒之类的规则,拓扑约束则体现了细胞c o m p a 胁c n t 内代谢物的空问 限制,环境约束包括随着时间和空间变化的养分有效性、p h 值和温度等( s c h i l l i n 氍 e d w a r d s ,l e t s c h e re ta 1 2 0 0 0 ;l e e ,g i a n c h a n d 硼ia n dp a p i n2 0 0 6 ) 。这些约束都可以 用数学公式来表示,而这些数学描述的解空间限定了生物系统有效状态的范围, 提供了更为准确地刻画细胞代谢功能的方法,因此广泛运用于代谢分析和信号传 导研究中( e d w a r d sa n dp a i s s o n2 0 0 0 ) 。 要从建立的数学模型中推导出可行的稳态通量向量,f b a 还需要为该代谢 系统提供以生物假设为基础的优化目标函数。常见的假设有能量平衡、a t p 产率 最大( r a m a k r i s h n a ,e d w a r d s ,m c c u l i o c he ta i 2 0 0 1 ) 、最大增长率( s e g r e ,t k u pa n d c h u r c h2 0 0 2 ) 和服从一组质量守恒约束的的生物量( b i o m a s s ) 最大增长等 ( e 嫩a _ r d sa n dp a i s s o n2 0 0 0 ;b u 唱a r da n dm a r a n a s2 0 0l ;m a h a d c v a n ,e d w a r d sa n d d o y l e2 0 0 2 ) 。待系统的稳态通量确定后,最优化技术还可以用来估计各种扰动条 件下的代谢系统性能。 1 1 2 通量平衡分析数学模型 建立f b a 模型并对其进行分析主要有以下四个实施步骤( e d w a r d s ,c o v e r t a n dp a l s s o n2 0 0 2 ;k a u 胁a n ,p r a k a s ha n de d w a r d s 2 0 0 3 ) : s t e pi :系统定义( s y s t e md e f i n i t i o n ) 代谢通量平衡模型首先需要根据系统中所有代谢物和生化反应确定代谢网 络结构。代谢网络重构的理想起点是完成标记的基因序列:先对每个基因进行同 2 第一章绪论 源查找和标记来识别所有的代谢酶,接着描述用这些酶催化的反应,刻画每个反 应中的反应物和生成物,即可逐步确定整个代谢网络。 s t e pi i :物质平衡( m a s sb a l 锄c e ) 代谢网络中的代谢物之间存在一种动态的质量平衡,这种平衡关系是通过代 谢通量和通量的化学计量建立起来的,最终能够得到一组常微分方程: 尘= s y ( 1 1 ) m。 s 表示生化网络的化学计量矩阵,v 表示代谢通量向量。 根据f b a 的假设,在稳态条件下,所有反应中某化合物x 的量随着时间f 的 变化值为0 ,这一假设适用于绝大多数胞内反应,因为这些反应比细胞生长和动 力过程的变化要快很多。所以上面的微分方程就变为: s y = 0( 1 2 ) f b a 的目标是在代谢网络处于稳态时确定代谢通量。因为反应数量比代谢 物数量大得多,一般情况下该方程组是非定系统,所以需要额外的约束来确定代 谢通量向量。 s t e pi i i :定义可测量通量( m e a s u r a b l ef l u x ) 为了计算网络中的所有通量值,获取系统约束的途径之一是测量代谢网络中 的通量,一般这些通量值不能完全确定,只能获得它们的取值范围,而且通常测 量的只是代谢网络中的胞外通量。其它的诸如反应可逆性和细胞维持所需的能量 也可以作为f b a 的约束条件。 s t e pi v :最优化( o p t i m i z a t i o n ) 对上述的非定系统,在不做额外实验测量的条件下确定通量分布,就需要考 虑对某个目标进行优化,从而把该系统转化为一个最优化问题。所以f b a 一般 需要一个最优化代谢目标,才能得到未知通量的解( e d w a r d s ,i b a 盯aa n dp a l s s o n 2 0 0l ;i b a 玎a ,e d w a r d sa n dp a l s s o n2 0 0 2 ) 。 系统的目标函数也可以表示成线性形式: z = c v ( 1 3 ) c 是v 中每个通量的系数或权重组成的向量。 f b a 中采用的最优化策略通过求解一组v 来最优化z ,而且不超出约束条件 所限定的解空间。假设目标函数是线性的,f b a 的求解就成为一个线性规划问 题。如下图( k a u f r m a n ,p r a l ( a s ha n de d w a r d s2 0 0 3 ) 所示: 第一章绪论 筹一,一v :刚 鲁+ v 4 曲2 普砷飞- v 4 - b 3 图1 1f b a 原理示意图 1 2 通量平衡分析工具 在代谢通量分析领域,目前已开发出不少支持f b a 分析的工具,其中具有 代表性的有m e t a f l u x n e t ,f l u x a n a l y z e r ,m e t a t o o l 等 1 2 1m e t a t o o l m e t a t o o l ( p f e i 仃e r ,s a n c h e z v a l d e n e b r o ,n u n oe ta 1 1 9 9 9 ) 用c 语言开发( 6 0 版本改为c + + 开发) ,能够对代谢网络进行结构分析,利用了化学计量和热力学 约束,可以计算代谢系统的凸基( c o n v e xb a s i s ) ( r o c k a f e l l a r1 9 7 0 ) 和基本模式 ( e l e m e n 伽ym o d e s ,即能够稳定运作的酶的最小集合) ,能够检测出代谢网络中 所有酶的子集( e n z y m es u b s e t s ) ,还可以进行代谢途径分析( m e t a b o i i cp a t h w a y a n a l y s i s ,m p a ) 。 1 2 2m e t a f l u x n e t m e t a f l u x n e t ( l e e ,y u n ,p a r ke ta 1 2 0 0 3 ) 开发环境是n e t 下的c 撑,并利用一些 j a v a 工具包实现了部分功能,能够处理代谢反应网络中的各种信息,能够定量分 析代谢通路,具有友好的m f a 图形用户界面,很好地支持了网络模型的构建, 能够对处于各种环境条件下的不同表现型进行m f a 对比分析,还能动态显示代 v 一 豳肾一 0 0一 p 一 懿! 一 o 1一 s 一 刊 一 一 一0 , 一 一1 0 t 一雌 第一章绪论 谢通路计算结果。 1 2 3f i u x a n a l y z e r f l u x a n a l y z e r ( k l a m t ,s t e i l i n 岛g i n k e le ta 1 2 0 0 3 ) 是一个m a t l a b 程序包,方便 地集成了m p a 和m f a ,有着友好的g u i ,用户可以在图形界面上对代谢模型进 行修改,计算结果也可以直观地显示出来。该软件有一个强大的分析工具包,实 现了代谢通量分析、通量优化、拓扑检查和代谢途径分析。f l u x a n a i y z e r 的代谢 网络由用户提供,也可以利用k e g g a n e h i s a 锄d g o t 0 2 0 0 0 ) 或b i o p a t h ( g a s t e i g e r 粕dm m b a c h2 0 0 0 ) 提供的网络结构,用户也可以合成不同的网络到自定义的代 谢网络中,还能检查网络拓扑中的d e a d e n d 代谢物,即只参与一个反应或没有 参与反应的代谢物。它还能够计算网络中的基本模式( e x t r e m ep a t h w a y s ,c o n v e x b a s i s ) ,进行可行性检查,确定可计算通量,处理系统冗余和进行敏感度分析等, 计算产生的结果也能灵活显示和记录。 1 2 4c o b r a c o b r a ( c o n s t r a i n t b a s e dr e c o n s t r u c t i o na n da n a l y s i s ) ( b e c k e r ,f e i s t ,m oe t a 1 2 0 0 7 ) 能够进行基因尺度上的代谢网络重构和分析,它的主要功能是利用基于 约束的方法对细胞行为作预测。它能在稳态和非稳态两种状况下估算细胞的最优 生长行为,能够进行复杂的鲁棒性分析,对细胞代谢的可能状态采样,确定代谢 网络中的成分。c o b r a 支持s b m l 格式描述的代谢网络模型,并能对代谢模型 进行快速分析。它的各种分析功能有内在的垂直关系,底层的分析需要上层分析 结果的支撑,可以用下图说明但e c k e r ,f e i s t m oe ta 1 2 0 0 7 ) : d a t a s e t u p f e 盆d c b m o f i e 图i 2c o r b a 分析功能图 第一章绪论 1 2 5 曩l u x e x p l o r e r f l u x e x p l o 阳门( l u o ,l i a o ,z e n gc ta 1 2 0 0 6 ) 是以f b a 为主的代谢网络建模分析 平台,用户可以通过直观的图形化操作构建代谢网络,参数通过软件提供的一个 公式编辑器输入,分析方法还包括代谢调整最小化分析( s e 伊e ,v i t k u pa n dc h u r c h 2 0 0 2 ) ( m i n i m i z a t i o no fm e t a b o l i ca d i u s t m e n t ,m o m a ) 方法,端途径分析( e x t f e m e p a t l l w a y sa n a l y s i s ,e p a ) 方法,影子价格分析( s h a d o wp f i c e sa n a l y s i s ,s p 八) 和奇异值分析( s i n g u l a rv a l u ea n a l y s i s ,s 、,a ) ,还有一个曲线分析模块,用于描 述不同约束条件下的通量变化情况。该工具支持s b m l 语言描述的模型,并能 自动查找模型中不符合规则的节点。 1 31 3 c 代谢通量分析 1 3 1 碳标记实验和1 3 c 代谢通量分析原理 胞内代谢丰度( 1 s e 咖舳n 如dw i e c h e r t2 0 0 3 ) 是在生理学研究中长期使用的信 息源,能够精确刻画生物系统内部的生理状态,是代谢工程相关研究领域重要的 高精度定量信息。为了获取这些数据,所谓的碳标记实验( m a 仪,d eg r a a ew i e c h e r t e ta i 19 9 6 ;w i e c h e r t2 0 01c ) ( c a r b o nl a b e l i n ge x p e r i m e n t ,c l e ) 被提了出来。在 实验中,已知标记状态的代谢物( 如i c 葡萄糖) 作为生物系统的摄取物,在 反应容器中经过一段时间的内部反应,待整个系统达到稳定状态后,此时带碳标 记的碳原子已经分布到了代谢网络的各个位置,再利用质谱( m 嬲ss p e c t r o m e t 叫, m s ) ( w i 伉i n a n na n dh e 池【l e1 9 9 9 ;w i t t m a n n2 0 0 2 ) 或者核磁共振n ,瞄e a rm a g n e 如 r e s o n 卸c e ,n m r ) ( m a ,d eg r a a ew i e c h e r te ta 1 19 9 6 :s z y p e r s k il9 9 8 ) 等手段来 测量其中一些位置上的1 3 c 同位素的标记量。 最近碳标记方法的一个重大进步就是胞内聚合体诸如蛋白质和核苷酸能够 被水解和分离出来。随后对氨基酸和核苷酸的b cn m r 分析就能采集到从前难 以企及的大量的高精度片断( f r a c t i o n ) 标记信息。测量数据能够直接对应到中 心代谢途径中相应的代谢物标记状态上,因此在进行通量分析的时候就有两种测 量数据可以利用: 胞外代谢通量:位于细胞内部和周围媒质之间或生物质之间,如物质的摄取, 产物的生成、气体的释放等。通常f b a 分析只利用这些数据。 碳标记丰度:利用n m r 等技术测得的胞内代谢物池中特定碳原子位置上的 ” x 第一章绪论 系( 应用坐标) 来表示,称为净通量y _ 和交换通量v _ ,这两种坐标之间的转 换关系为( w i e c h e r ta n dd eg r a a f1 9 9 7 a ;w i e c h e n m o i l n e y i s e f m a n ne ta 1 1 9 9 9 ) : l ,= l ,- 一y - ( 1 4 ) = m i n ( f ,矽- ) ( 1 5 ) 实际应用中为了减少数值计算的难度,方便统计分析,会对交换通量做归一 化处理,处理后的交换通量称为交换系数( e x c h a n g ec o e 衔c i e n t s ) 1 ,棚 v 删o 1 = 土一 ( i 6 ) i 8 + v 】! 漓 计算过程不是同时计算网络中的全体通量,只对系统中的自由通量( 也称独 立通量) 进行处理,能够提高计算效率。其它通量表示为自由通量的形式为: v = y 似 ( 1 7 ) 称为计量矩阵s 的零空间矩阵( n u l is p a c em a t r i x ) ,肛是自由通量向 量。当计量矩阵的秩,= ,口刀尼( s ) 刀时,零空间矩阵是一刀( 刀一,) 的矩阵,自由通量的个数为( 托一,。 可以借助碳同位素标记实验的测量信息确定方程的解,同位素标记方法的数 学模型是所有中间代谢物i s o t o p o m e r 的平衡方程组( m a l l o y s h e r r ya n dj e 衢e y 1 9 8 8 ;s c h m i d t ,c a r l s e n ,n i e l s e ne ta 1 1 9 9 7 ) ,表示网络中通量分布与同位素标记分 布之间的关系: 厂( v ,x ) = 0 ( 1 8 ) 由( 1 7 ) ( 1 8 ) 司以得到: 工= x ( y 肚) ( 1 ,9 ) 即稳态条件下的i s o t o p o m e r 分布可以表示为自由通量的函数。胞内通量的估 计过程是通过逐步拟合实验测量数据完成的,该拟合过程本质上对应于下面的约 束最小化问题: m i ny 触( 历( v 加) 一历咖) r :( ( 1 ,加) 一朋咖) ( 1 。l o ) s f y 似渺( 1 1 1 ) 其中目标函数是数据拟合残差。胁( y 加) 是根据公式( 1 7 ) 租( 1 9 ) 得 到的拟合结果,班曲9 是真实测量数据,包括通量测量数据和同位素标记数据。 艺,咒是测量协方差矩阵,矩阵对角线上的元素对应于每一项测量的测量误差。 约束条件( 1 1 1 ) 定义了通量取值的可行解范围。 8 第一章绪论 1 41 3 c 代谢通量分析工具 对碳标记进行建模和分析的工具,尤其是同时支持各种高精度测量数据的工 具,目前发布的不多,其中具有代表性的是h c f l u x 和f i a t l :i u x 。 1 4 11 3 c f l u x 1 3 c f l u x 是w i e c h e r 等人开发的用于碳标记实验分析和计算的软件( w i e c h e r t , m o l i n e y ,p e t e r s e nc ta 1 2 0 0 l a ) ,它不但能分析特定实验条件下的各种测量数据, 而且不对代谢网络作任何限制,能够处理任意条件和假设下的代谢网络,能对碳 标记代谢模型进行建模、仿真、设计和估计,它有高效的方程求解和最优化能力, 能利用统计优化从测量数据中搜集出最多的信息。可以说它迄今仍是碳标记实验 分析软件中的翘楚,很多具有相似功能的分析工具或多或少都借鉴了c f l u x 的 设计思想。但是它的重点是b cm f a ,不支持f b a 分析,没有图形用户界面, 不利于非专业人士使用,而且代谢模型复杂,模型描述使用私有格式,不利于信 息共享。 1 4 2f i a t f l u x f i a t f l u x ( z a m b o n i ,f i s c h e r 锄ds a u e r2 0 0 5 ) 将代谢通量分析过程分解成为两 个任务,既带来了概念上的简化,同时也得到了合理的分析处理能力。首先,用 概率方程分析解释m s 测量的”c 数据,即用所谓的代谢通量比率分析( m e t a b o l i t e f l u xr a t i oa n a l y s i s ) 确定通量分割比率:然后将这些通量比率作为通量平衡计算 的约束条件,从一个相对简单的代谢网络模型的胞外测量通量估计它的胞内通 量。对一个非专业人士,该方法的主要优点是模型相对简单。因为f 】u xr a t i o 是 从m s 数据中单独计算而来的,也有助于简化实验设置。因此f i a t f l u x 由两个独 立的模块组成,分别用于对代谢通量比率的分析和1 3 c 约束的通量分析。1 f i a t f l u x 的o p t i m i z a t i o n 工具箱由两大部分组成:在黜玎i o 模块中用m s 数 据计算代谢通路比率;n e t t o 模块利用测量的胞外通量、之前计算的代谢通路 比率和b i o m a s s 所需量估计网络中的碳通量。这两个模块是各自独立运行的。 f i a t f l u x 提供了很多质谱数据校正处理工具,在这方面的工作非常出色。但 是它不能处理核磁等其它测量数据,而n m r 测量有m s 测量所不具备的特性, 二者应该共同使用,互为补充,而且f i a t f i u x 的模型描述也比较复杂,不利于非 专业人士使用,也不利于信息在其它平台之间共享。 1 5 本文主要工作与内容安排 代谢通量分析m f a 是实施代谢工程的重要工具( w i e c h e r t ,m o l l n e y ,p e t e r s e n 9 第一章绪论 e ta 1 2 0 0 l a ) ,它的目标是对生物体内代谢通量进行定量分析,获得生物系统的代 谢通量、反应速率等量化信息。f b a 和1 3 cm f a 都是功能强大的代谢通量分析 方法,二者各有特点,在代谢工程中发挥着重要作用。 f b a 本质上是一种基于约束的建模方法,它利用生化约束,如物质平衡、 能量平衡和各种通量约束来描述有机体的内在行为。如果一个代谢系统的约束不 能被完全确认( b o n a r i u s ,s c h m i da n d1 r a m p e r1 9 9 7 ) ,则它的化学计量约束会产生 一个未定系统,在分析过程中可能出现多种稳定状态。因此需要在代谢系统引入 目标函数,再利用优化算法寻找满足系统约柬和特定目标函数的最优解( e d w a f d s , r 丑m a l ( r i s h n a ,s c h i l l i n ge ta 1 19 9 9 ;k a u 胁a n ,p r a l ( a s ha n de d w a r d s2 0 0 3 ;l e e , g i a n c h a l l d a n ia n dp a p i n2 0 0 6 ) 。 f b a 模型基本上是根据代谢网络的化学计量平衡关系建立起来的,而这些 网络都是已知的,其上的各种约束和系统目标通常也由该代谢网络的生化意义决 定,测量数据只有胞外通量( w i e c h e 心m o l l n e y p e t e r s e ne ta 1 2 0 0 1 a ) ,即使没有这 些实验数据,也不影响对代谢系统的分析。所以f b a 实验相对简单,操作性强, 模型构建容易,方法灵活,理论较完善,代谢网络分析能力强,在分析中大规模 网络时有很大优势。 同时f b a 的缺点也很明显,代谢系统引入的目标函数大多是根据理论分析 对细胞代谢能力做出的假设,正确性有待检验,使得通量分析结果存在与实际不 符的风险。为了解决该问题,f b a 正在探索新的目标函数以期更全面深刻地描 述代谢网络,并且引入更多的生物知识作为系统约束( k a u f h n a n ,p r a k a s h 锄d e d w a r d s2 0 0 3 ) 。而且,这种纯粹的计量方法无法处理代谢网络中的空循环、双向 反应、并行反应等( s c h m i d t ,m a ,d eg r 勰f e ta 1 1 9 9 8 ;w i e c h e 屯m o l l n e y ,p e t e f s e n e ta 1 2 0 0 1 a ;w i e c h e r t2 0 0 l c ) 。 基于日c 标记实验的m f a 是一种功能强大的代谢网络定量分析诊断方法, 因为利用了大量的高精度实验数据,它就能够精确量化代谢系统,很好解决了 f b a 不能处理的各种特殊情况,是一种更强大可靠的通量分析技术。同时与计 量方法相比,它也是一种更复杂和昂贵的方法( w i e c h e r t 2 0 0 l c ) ,实验要求条件也 更高,而且计算过程耗时,只能适用于规模较小的网络( w i e c h e n ,m o l l n e y , p e t e r s e ne ta i 2 0 0l a ) 。 通过以上对比可以看出,f b a 方法可以用来分析中大规模代谢系统,而1 3 c 眦分析方法更适合对网络中心代谢途径通量的精确量化,它们的优势和劣势 基本上是互为补充的( w i e c h e n2 0 0 l c ) ,将这两种方法结合起来,发挥各自的优势, 就可以对不同规模的代谢网络进行系统分析和精确量化,加深对代谢系统的认识 和理解。 1 0 第一章绪论 随着高流量测量技术的发展和实验技术的进步,涌现出海量的基因序列、标 记和蛋白生物学数据。与十多年前不同的是,当前生物学研究不是受制于生物数 据的获取,而是受制于没有合适的软件工具分析和解释这些实验数据( e d w a r d s , c o v e r t 锄dp a l s s o n2 0 0 2 ) 。从代谢通量分析工具研发现状来看,虽然有不少能够 单独进行f b a 和u cm f a 分析的软件存在,而且有些软件在计算分析或建模方 面表现卓越,但是迄今还没有一款能够完全支持f b a 和1 3 cm f a 建模分析的软 件出现。已发布的软件工具,有些侧重分析计算功能而忽视了用户界面,给非专 业人士使用带来很多不便,也增加了软件的应用成本。有些工具在模型描述方面 采用本地格式,造成不同工具相互之间信息共享困难,很不利于代谢模型的综合 分析和仿真。因此在代谢通量分析领域开发具有友好的图形用户界面,通用的模 型描述语言,能够对一个模型同时进行f b a 和b cm f a 分析的软件工具,是非 常必要和有意义的研究课题,也成为开展代谢通量计算和仿真研究的当务之急。 针对上述闯题,我们设计并研发了代谢通量可视化建模软件系统v f :a ( v i s u a l f l 峨a n a l y z e r ) ,该系统前端基于系统生物学建模框架c y t o s c a p e 实现,具有良好 的图形用户界面和丰富的可视化功能。在代谢模型描述上采用继承自系统生物学 标记语言s b m l 的格式,能够和支持s b m l 语言的大量建模工具共享模型。而 且系统的计算分析模块同时支持模型的f b a 和1 3 cm f a 分析,还能进行相关的 估计和精确度分析等工作。 论文内容安排如下:首先介绍代谢通量分析研究工作的相关知识和软件研发 现状;接下来概述了我们实验小组进行代谢通量分析的架构设计和建模软件 a 的功能结构;第三章介绍了与v f a 相关的两种代谢模型描述语言,并重点叙述 了v 1 1 a 内部使用的一种具有很强通用性和扩展性的模型描述格式;随后两章详, 细阐述了v f a 的设计和实现技术,并利用认对大肠杆菌删1 0 i 进行了建模分 析;第六章是本文内容的总结和相关工作的展望。 第二章代谢通量分析系统及a 的结构和功能 第二章代谢通量分析系统及v f a 的结构和功能 代谢通量分析m f a 在生物代谢工程中占有重要地位,是根据代谢路径中各 反应的计量关系以及实验中所测得的数据来确定整个代谢反应网络通量信息的 一种方法。m f a 的实施过程涉及到复杂的生物实验设计、数据采集、输入模型 表示、系统建模、大规模方程组求解和数值优化等多方面的内容。在现有的两种 分析方法中,f b a 方法功能强大,计算理论和方法成熟,对实验要求简单,可 以分析有上千代谢物的大规模代谢系统。3 cm f a 分析方法利用m s 和n m r 等 技术测量出来的高精度实验数据,能够解决f b a 方法难以处理的情况,更适合 对代谢网络中心代谢途径通量的精确量化。结合二者的优点可以更好地对特定代 谢网络进行系统分析和精确计算,比较f b a 和b cm f a 方法对同一网络的优化 结果,也有助于发现给定代谢网络的新特性。 2 1 代谢通量建模分析软件的发展趋势 计算机建模和分析工具在上述研究过程中发挥着无可替代的作用。随着生物 测量技术的发展和测量数据的急剧膨胀,亟需适用的软件工具辅助实施代谢通量 分析,已经成为生物学家和计算机技术人员共同努力解决的问题。近几年该领域 的软件研发和更新速度也达到了令人称奇的地步( b u c k i n 曲a m2 0 0 7 ) ,分析目前已 发布的代谢通量分析工具,可以看出这些专用软件呈现出以下趋势: 通用的模型描述格式。从最初直接建立数学模型,发展到后来采用文本格式 描述代谢模型,及至前几年基于各种数据标准和文件格式的模型描述语言的出现 ( a c h a r d ,、7 a y s s e i xa n db a r i l l o t2 0 0l ;l i o y d ,h a l s t e a da n dn i e l s e n2 0 0 4 ;s t r o m b a c k a n dl a m b r i x2 0 0 5 ;s t r o m b a c k ,h a l la n dl 锄b r i x2 0 0 7 ) ,最后广泛应用的有s b m l 和c e l i m l 等描述格式( s t r o m b a c ka n dl 锄b r i x2 0 0 5 ) ,其中尤以s b m l 更适合代 谢系统的计算模型描述。这类语言都以x m l 为基础,定义了适合代谢模型描述 的语法和元素,具有良好的通用性和扩展性。 友好的用户界面和丰富的可视化功能。最初的代谢通量分析工具注重模型的 数学表达和分析,对用户界面考虑较少,很多都运行在字符界面下。后来的软件 都把友好的g u i 作为前端实现的重要任务,开发出直观易用的可视化图形界面。 在诸如代谢网络结构分析和代谢网络重构等领域,也应用了不少图形图像技术, 将代谢结构拓扑和分析计算结果形象地展示出来。 强大的数据计算分析能力。随着计算方法和分析技术的进步,与之相应的软 第二章代谢通量分析系统及v 1 1 a 的结构和功能 件也随之开发出来,并在后续维护中得到改善和优化。而这些新出现的方法很快 又被应用到其它软件之中,并有可能扩大其分析对象的范围( n i e i s e n2 0 0 3 ) 。这种 计算方法的更新和发展使得现在的软件软件拥有越来越复杂和强大的数学计算 分析能力。 支持网络数据库。生物测量数据的急剧增加不可避免地要涉及数据存储和交 换,通用的方法是采用生物数据库存储各种测量信息,并在发布数据库的同时提 供基于该数据库的应用软件( b a x e v a n i s2 0 0 2 ) 。网络数据库无疑是进行生物系统建 模分析时取之不竭的数据源,因此近些年开发的软件工具将访问生物数据库作为 基本功能之一( s h a n n o n ,m a r k i e l ,o z i e re ta 1 2 0 0 3 ) 。 2 2 代谢通量分析系统 为了满足综合分析代谢通量的要求,需要功能强大、用户界面友好、性能优 良且同时支持f b a 和1 3 cm f a 的建模工具辅助实施代谢通量研究,才能对同一 代谢系统使用两种方法分别进行分析和计算,才能从不同角度研究和理解目标代 谢网络。因此我们从2 0 0 6 年开始研发满足上述需求的代谢通量分析系统,目前 该系统的开发工作已经完成,总体上可分为可视化建模子系统、代谢通量计算分 析子系统和代谢模型描述语言定义解析子系统三部分,系统结构如图2 1 所示。 下面简要介绍该计算分析系统的特点。重点描述系统中可视化建模系统v l 认的 结构及功能。 2 2 1 代谢通量分析系统的特点 该分析系统服务于代谢通量建模和计算研究,概括起来有如下特点: 今既支持基于1 3 c 标记实验的精确通量分析,也支持基于计量关系的通量 平衡分析,能够计算、解释和预测代谢通量分布; 夺代谢模型描述格式c l e m l 与系统生物学标记语言s b m l 相兼容,有利 于代谢模型的交换共享; 令既支持图形化模型输入,同时能够解析f t b l ,c l e m l ,s b m l 文件描; 述的代谢模型,保证了分析数据源的多样性; 丰富的图形建模和可视化功能,在扩展c ”o s c a p e 的同时继承了强大的 代谢网络可视化功能,有利于代谢模型的综合计算和分析; 今支持包括通量测量、n m r 测量和m s 测量在内的多种实验数据,内部 计算基于i s o t o p o m e r 平衡实现,理论上支持任意生物测量数据。 夺高效的测量数据拟合算法( c h e n ,z h e n g ,l i ue ta 1 2 0 0 7 ) 能够用来精确估 1 4 第二章代谢通量分析系统及v f a 的结构和功能 计”c 标记数据约束下的通量分布。 令能够对通量估计值做置信区间分析,定量分析计算结果的可靠性。 能够快速地对通量空间进行采样,分析通量空间的形状,预测代谢系统 的代谢能力。 令能够考察通量之间的相关性( 有无生理状态约束) ,发现新的关联信息。 模型验证功能,从语法和语义多方面检查输入模型的正确性,帮助用户 定义正确的代谢模型。 m e t a b o li cn e t w o r k c 脚s c a p e 国 国 圉 m o d 迸c 0 n v c r t i l l 瘩i n 岍蠡啦o ( 上l = m l 。u h i _ f i 。dm 1 7 am o d e id c s c r i p 6 0 nf o m 擒t 园圆圈圆圆 m o d c ip a r s i l l 琴 c b r r “l 麟c h “k i n g c o m p u 妇l i d nk c m d c l e s m u l a f o n 墨 p a m m c 耐f i t | i b g 蓉 一o f j l l x 幽西m 徼j o n 1 匐 , l i b r a r i 鼢 “ , t m a n a bc 斗+ m a l hl 珀f i | 哕g l p k g s l 。1 l b s b m l 1 i b c l e m i ,爹 。, 图2 1 代谢通量分析系统结构图 2 2 2 代谢通量分析系统的结构设计 该计算系统的结构设计以代谢通量建模分析为核心,可分为代谢模型输入输 出,可视化建模,模型描述和通量计算分析等部分。 1 ) 代谢模型输入输出 第二章代谢通量分析系统及v l _ a 的结构和功能 m f a 计算系统的输入数据来源既有文件形式,如正确定义的s b m l 、c l e m l 和f t b l 文件,同时也有图形界面下建立的可视化模型,能够将正确定义的代谢 模型以c l e m l 格式输出到本地文件系统中。s b m l 语言是系统生物学领域应用 广泛的模型描述语言,有很多与之相关的计算和分析工具,本身也有良好的软件 支持。而f t b l 是w i e c h e r t 等人在进行代谢通量分析研究时采用的一种代谢模型 描述格式,我们开发了f t b l 转换成c l e m l 的功能。c l e m l 是在开发m f a 计 算系统时从s b m l 扩展而来的代谢模型描述语言,它既支持碳标记实验模型, 同时支持通量平衡分析模型,描述的代谢模型组件有:代谢网络( 主要包括代谢 物和生化反应) ,通量约束,代谢目标和实验测量数据。关于该语言的结构和解 析程序将在第三章详细阐述。 2 ) 可视化建模 如果选择在图形环境下建模,系统提供了友好的图形用户界面,能够方便地 通过简单的组件拖拽直观地构建出符合特定实验环境的模型。代谢网络经过抽象 简化为节点和边的集合,节点表示代谢物和模型中的生化反应,边表示代谢反应 的方向,分别利用节点形状和有向无向边加以区分。每个节点都有属性,表示 代谢网络中的约束条件和实验测量数据等,这些信息在网络拓扑中不可见,但在 代谢模型中有相应元素与之对应。上述过程涉及到代谢网络的创建、修改和显示 等功能,将在后面加以阐述。 3 ) 代谢模型描述及验证 前端输入的模型经过转换和解析,在系统中统一表示成c l e m l 语言定义的 语法树。在模型输入过程中需要经过语法检查,如命名规则、数值有效性、代谢 网络一致性等,该功能由前后端的检测模块共同实现。接下来模型还需接受语义 检查,如通量约束之间的矛盾和冗余,代谢网络中的t r a p ( w i e c h e r ta n dw u r z e i 2 0 0 l b ) 等。这些实时的检测功能可以保证模型有效性和后期计算分析的正确性。 4 ) 代谢通量计算和分析 通过验证的模型需要进入计算核心由计算模块自动构建数学模型,如化学计 量平衡方程组和i s o t o p o m e r 平衡方程组等,它们定义了代谢通量之间和代谢通量 分布与”c 标记之间的关系。然后系统就能够根据需要对模型进行”cm f a 和 f b a 计算分析。计算系统还提供了通量估计值的置信区间分析、通量空间形状 分析、通量相关性分析、随机采样和蒙特卡洛采样算法等。 需要指出的是,在系统开发过程中陈久生等人完成了系统的计算分析子系统 ( 陈久生2 0 0 7 ) ,并对大肠杆菌成功进行了数学分析。我们在此基础上又基于 c y t o s c a p e 开发了代谢建模子系统,最终完成如前所述的代谢通量计算分析系统。 下面主要介绍可视化建模软件v f a 的结构和功能。 1 6 第二章代谢通量分析系统及v f a 的结构和功能 2 3 代谢通量建模系统v f a 为了解决在代谢通量分析中遇到的问题,我们利用c ”o s c a p e 提供的插件接 口开发了同时支持f b a 和b cm f :a 建模的代谢通量建模系统v f a ( s u a lf l u x a n 出z e r ) ,该系统有便利的代谢网络可视化编辑和显示功能,支持多种实验测 量数据,能够同时进行1 3 c m f a 和f b a 建模,代谢模型描述格式扩展自系统生 物学标记语言s b m l
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 海南省东方市2025年上半年公开招聘村务工作者试题含答案分析
- 2025版汽车租赁公司驾驶员合同续签与安全驾驶承诺合同正本
- 2025年抵押贷款装修项目质量保证合同范本
- 2025版水暖安装与老旧管网改造合同范本
- 贵州省贞丰县2025年上半年事业单位公开遴选试题含答案分析
- 2025版线下实体店团购业务合作协议
- 2025版万达商业广场购物中心商户信用评价管理服务合同范本
- 2025版汽修行业培训基地厂房租赁服务协议
- 2025年度商场场地租赁与物业管理合同
- 2025年度绿色建筑项目营销推广服务合同
- 房屋建筑学说课省公开课金奖全国赛课一等奖微课获奖课件
- 数字经济:大国经济体系下人工智能领航数字经济新阶段
- 注射用甲苯磺酸瑞马唑仑-临床用药解读
- 班组长质量管理意识培训
- 四川省普通高中2024届高三上学期学业水平考试数学试题(解析版)
- 史丹利化肥的营销策划
- 气管切开套管脱出应急预案及处理流程
- 融媒体新闻报道实务 教学大纲
- 《橡胶制品工艺》考试复习题库(含答案)
- 《数据结构与算法》教案
- 《现代教育技术》课件-第一章 现代教育技术概述
评论
0/150
提交评论