生物代谢组学研究现状与展望_第1页
生物代谢组学研究现状与展望_第2页
生物代谢组学研究现状与展望_第3页
生物代谢组学研究现状与展望_第4页
生物代谢组学研究现状与展望_第5页
已阅读5页,还剩4页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物代谢组学研究现状与展望

在后基因组时代,分析各组功能成为科学研究的热点。基于基因功能的复杂性和生物系统的完整性,有必要从“整体”层面上来理解构成生物体系的各个模块功能。随着生物学研究的深入和生物信息的大量积累,加上新的测量技术、高通量的分析方法、先进的信息科学和系统科学新理论的发展,使得在系统水平上研究由分子生物学发现的组件所构成的生命体系成为可能。系统生物学家们认为,将生命科学上升为“综合”科学的时机已经成熟,生命科学再次回到整合性研究的新高度,逐步由分子生物学时代进入到系统生物学时代。因此,由基因组学(genomics)衍生出来的转录组学(transcriptomics)、蛋白质组学(proteomics)以及代谢组学(metabonomics)等整体性研究方法成了解析功能基因组的新的重要手段。代谢组学研究生物体系受到外界因素干预后所产生的各种代谢物的质和量及其变化规律;由于代谢(物)处于生物系统生化活动调控的末端,包含着反映生理表型的直接而全面的生物标记物(biomarker)信息,因此,代谢组学日益成为整体性研究生命体系功能变化的非常有力的分析手段。1代谢组理论及其研究目标1.1系统论观点的代谢组学代谢组学相关研究可追溯到始于上世纪70年代的代谢谱分析(metabolicprofiling),但一直发展缓慢。然而近来,尤其在上世纪末提出“代谢物组”(metabolome)、“代谢物组学”(metabolomics)和“代谢组学”(metabonomics)等概念后,该领域研究在短短几年内获得了迅猛发展,并开始成为全球性关注的新热点。发表的相关科学文献和综述的数量呈指数上升。基于系统论观点的代谢组学新领域研究已引起国际企业界和科学界的高度重视。2001~2003年包括辉瑞(Pfizer)等六大药厂联合英国帝国理工学院专门组织了COMET计划(ConsortiumforMetabonomicToxicology),用代谢组学的方法来评价药物毒性,取得了令人鼓舞的成果。美国NIH也在年发布的通向生命科学未来的中长期发展规划“路线图”中专门设立了代谢组学专题。1.2生物系统的结构和代谢功能的系统实现功能基因组时代的到来掀起了人们对众多生物“组学”(-omics)的研究热潮。除了基因组、转录组、蛋白组和代谢物组等四大基本组学层次(omicscascade)外,还涌现出了包括脂类组学(lipidomics)、肽组(peptidome)、相互作用组(interactome)、代谢通量组(fluxome)、表型组(phenome)、生理组(physiome)等“组学”新概念近200余个。以众多组学为代表的现代生物学方法强调科学研究的整体性思维和系统论观点,其精髓是以整体论方法研究生物体系中的构件分子族之间以及机体与环境之间的相互作用网络,以系统解析基因组功能(图1)。生物机体是一个动态的、多因素综合调控的复杂体系,在从基因到性状的生物信息传递链中,机体需通过不断调节自身复杂的代谢网络来维持系统内部以及与外界环境的正常动态平衡。DNA,mRNA以及蛋白质的存在为生物过程的发生提供了物质基础,而代谢物质和代谢表型所反映的是已经发生了的生物学事件,是基因型与环境共同作用的综合结果,是生物体系生理和生化功能状态的直接体现。因此,作为系统生物学的一个重要组成部分,代谢组可以更好地反映体系表型。细胞的功能在很大程度上体现于代谢水平的调节,比如,某些相关基因的表达谱相似,但代谢物谱或代谢通量(flux)却差异明显;fluxome是基因组功能的终端体现,在扰动情况下,由于基因或蛋白的补偿作用,使最终代谢通量维持相对稳定以抵消干扰效应,但代谢物水平却变化显著,因此,细胞代谢物的浓度改变要比代谢通量变化敏感得多。可见,基因和蛋白表达的细微变化都可能在相应的代谢物水平上得到放大。而且,代谢组变化揭示的是系列关联生物标记物的综合差异,因此要比传统依赖单一标志物的诊断方法具有更高的准确性。此外,与核酸和蛋白质等大分子相比,小分子代谢物的数量以及空间结构的复杂性要小得多,加上其检测技术的多样化(图1),这对我们借助多种甚至是全代谢物系统分析、快速准确寻找相应的生物标记物和应用代谢组新技术进行代谢表型和功能基因组研究提供了极大的便利。1.3研究对象的界定对于广泛应用于植物和微生物的代谢物组学,Fiehn曾把研究策略分为4个层次,即代谢物靶分析(targetanalysis)、代谢谱分析(metabolicprofiling)、代谢物组(metabolome)和代谢指纹分析(metabolicfingerprinting)。从定义上看,仅第3种层次的代谢物组学才是一种整体性的分析方法,目标是通过对生物机体在一定生化和环境条件下的所有小分子代谢物组分进行无偏差地定量测定。然而Villas-Boas等认为目前仅有两种研究策略即代谢物靶标和代谢谱。前者限定为对特定代谢组分的定量测量;后者常指对样品代谢物进行快速扫描、定性表征和分类,通常包括指纹分析和“足印”分析(metabolicfootprinting)。足印分析是最近发展起来的新方法,采用的技术与指纹分析的相同,但由于研究对象从细胞内代谢物组(endometabolome)转移到胞外媒介中的代谢物组(exometabolome),其样品处理和检测要简便得多。对于在动物系统中应用较多的代谢组学,Nicholson最初给出的定义是定量测量生物体因病理生理刺激或基因改变而引起的代谢应答变化;随后又强调系统性的代谢组学概念应将机体的代谢过程与微生物代谢以及外源环境因子的相互作用因素综合起来。此外,在其它文献的描述中还突出了代谢组学的时空动态性和全局性观点,体现出了代谢组学与静态的代谢物组学的差别。因此,代谢组学是一个更具广泛意义的系统生物学概念,它可定义为对生命体系因环境刺激、病理生理扰动或基因改变等所引起的体现为所有代谢物动态应答的系统性度量。由于代谢组学为新兴学科领域,许多术语的含义在不同文献中不尽相同。本文总结了目前代谢组学的一些关键概念、相关的分析层次和研究策略,主要包括:代谢物(metabolite):生命过程中所产生的低分子量(一般指低于1000或3000Da)反应产物或中间体。代谢物组(metabolome)或代谢物组学(metabolomics):代谢物组为生物机体在一定生化和环境条件下的所有代谢物组分;代谢物组学的目标是通过整体分析方法对全部的这些小分子代谢物进行无偏差的定量测定。代谢物靶分析(metabolitetargetanalysis):对生物样品中的一个或数个特定代谢物进行有选择的定性或定量测定。代谢谱分析(metabolicprofiling):采用针对性的分析技术,对特定代谢过程中的结构或性质相关的预设代谢物系列进行定量或半定量测定(有时含转化途径分析)。代谢指纹分析(metabolicfingerprinting):对样品进行整体性定性分析,比较谱图差异对样品进行快速鉴别和分类,而不分析或测量具体组分。代谢足印(metabolicfootprinting)或胞外代谢物组(exometabolome):对分泌到胞外媒介中的代谢物进行整体性定性分析,可作为对代谢指纹分析的补充。代谢组(metabonome)或代谢组学(metabonomics):代谢组指生物体对体系内、外因素作出动态应答的所有代谢物分子集合;代谢组学定义为对生命体系因环境刺激、病理生理扰动或基因改变等引起的体现为所有代谢物动态应答的系统性度量。代谢通量组(fluxome):功能表型研究中,从代谢工程学角度,对复杂生物代谢网络的代谢物流量进行数学动态模拟、计算和定量分析。2代谢组理论的分析策略和技术特点2.1代谢组学的发展过程生命科学领域的巨大进步往往受益于先进分析技术的伟大变革。归根结底,进行代谢组学研究首要解决的是分析方法上的理论和技术问题,因为无论是数据获取还是信息处理上,分析科学和技术都将在系统生物学研究中扮演重要角色。常规的代谢组(实际为代谢物组)分析流程可分为生物分析和数据分析两大部分:生物分析的任务是产生数据,主要包括生物样品收集、生物反应灭活、预处理、以及运用先进分析技术的代谢物整体性化学分析(如代谢谱或代谢指纹分析)等步骤;数据分析的目的是揭示出反映样品内在机理的、整体性差异的关键性生物标记物,主要包括数据采集、原始数据前处理、以及通过现代化学信息学和生物统计学领域的新方法对获得的多维复杂数据进行降维和信息挖掘。当前,代谢组学的发展目标还包括通过对生物标记物的功能分析和确认,最终转化为整体认知和系统解析生化反应机理和生命现象的新的重要手段。一般的代谢物组学分析流程如图2所示,其中包括目前常采用的实验步骤和技术方法。2.2代谢学生物分析技术的现状和进步2.2.1技术应用的特点进行代谢组学研究的核心挑战首先来自于如何满足对生物样品的无偏测量和整体分析的要求。代谢组学分析技术的运用特点具体表现在:2.2.1.提取最终目标必须为最终目标由于现阶段的任何分析技术都无法满足对全部小分子代谢物进行无偏差的定量测定,故其最终目标尚不能实现;代谢组学的分析目标可表述为力求尽可能精确地分析生物体系中尽量多的代谢组分,整个分析过程应尽可能保留样品中代谢物的整体信息。2.2.1.含量极微且动态范围不清的原因与构成核酸的4种碱基和蛋白质的20多种氨基酸不同,小分子代谢物的结构种类繁多、理化性质差异巨大、含量极微且动态范围极宽(达7~9数量级)、时空分布的差异明显、相互作用方式复杂;无论定性、定量还是动态追踪,目前尚无完善的代谢物扩增技术和分析平台,当前代谢组学分析中常用的两种检测手段是核磁(NMR)和质谱(MS)技术,如GC/MS和1H-NMR很早以来就获得了广泛的运用。2.2.1.生物特征特点通量的生物分析特点代谢组学分析方法学力求符合高选择性、高灵敏度和高通量的生物分析特点,快速、精确的结构解析能力以及原位、多维、动态、多参量的测试要求,并力求在分析方法测量效度、信息涵量和分析效率之间的协调与平衡。2.2.2新一代生物测定技术由于NMR具备快速、动态、非偏向、非破坏、多参数检测以及无需样品前处理等优点,特别是新发展的高分辨魔角旋转(HR-MAS)、活体磁共振波谱(MRS)和磁共振成像(MRI)等技术能够无创、整体、快速地获得机体某一指定活体部位的NMR谱,直接鉴别和解析其中的化学成分,1HNMR和LC/NMR一直成了代谢组学研究领域最主要的分析技术之一。相对于NMR灵敏度低、检测动态范围窄等弱点,现代MS技术的优势是具有很高的灵敏度和专属性,可以实现对多个化合物的同时快速分析与鉴定;而且LC/MS避免了GC/MS中繁杂的样品前处理,能鉴别和分析各类化合物及其在复杂生物样品基质中含量极低的代谢物类型,现已成为生物分析中的首选方法。最近几年,随着质谱及其联用技术的发展,新一代MS也开始在代谢组学研究和代谢通量分析中倍受青睐[14,53,62,63,64,65]。相关的MS技术进展主要有:2.2.2.生物代谢组学分析结果Waters公司率先采用先进的UPLC/TOF-MS分析技术以及联机的MicromassMarkerLynx自动化数据处理软件,为代谢组学研究提供了从样品分析到数据分析全过程的整体解决方案。最近,Plumb等利用UPLC/MSE方法,在单次分析中提高了常规MS/MS模式的数据采集效率。2.2.2.超分辨率mse由于复杂体系中对未知标记物结构的准确鉴定仍是技术难点,FT-ICR质谱仪为目前质量解析度最高的质谱仪系统,具有超高分辨率和准确度的突出优点,并可以配备大气压电离(API)、纳升级电喷雾(nano-ESI)和基质辅助激光解吸(MALDI)等各种离子源,将在代谢组学研究中发挥出更大的作用。2.2.2.dims的应用在代谢指纹的快速扫描中,除了常规的NMR和分子振动光谱等方法外,直接输注(directinfusion)DIMS技术的应用日趋广泛。2.2.2.质谱/质谱条件的确定最近报道的电喷雾解吸电离(DESI)的质谱技术(ambientMS),其突出特点是在常压下能将表面吸附的分析物进行解吸电离(无需样品前处理也不受基体背景干扰),从而实现MS对复杂样品进行原位、高通量、非破坏的分析,获得更直接和全面的样品信息。与GC/MS相比,现代MS技术多不采用标准的电子轰击(EI)模式,而且色谱保留与“软”电离图谱的重复性欠佳,尽管许多尝试工作致力于建立LC/MS标准质谱图库,但目前尚无可供检索的完整图库。Halket等列出了当前一些未经公开确认的LC/MS质谱图库,表明在标准化试验条件下,许多基准化合物在不同仪器上可以获得非常类似的图谱。此外越来越多的基于化学衍生(chemicalderivatization)和电荷修饰(chargederivatization)的LC/MS方法则是另一种新的解决思路。2.2.3分析技术的整体化趋势由于现有的分析技术都有各自的优缺点和适用范围,代谢组学综合分析的现实策略是进行技术联用和方法整合,目前的整体化策略主要包括:2.2.3.不同测定技术联用通过包括色谱(GC、LC)或毛细管电泳(CE)在内的多维分离技术,以及不同测定技术的联用[37,77,88,89,90,91]达到分析平台的优势互补;此外,采用二维核磁(2D-NMR)可减弱复杂生物样品中大分子的信号干扰,提高小分子物质的检测能力。2.2.3.2.代谢组分析数据的整合通过数学统计方法对不同代谢组学数据进行整合,如LC/MS数据和GC/MS数据的融合,NMR与UPLC-MS数据的合并等。2.2.3.代谢组学研究通过整合代谢组学(integratedmetabonomics)方法,即同时对机体中不同来源的生物样品(尿样、血样、组织样等)进行代谢组学分析、数据比较和综合评价。2.2.3.评价和研究方法通过综合代谢组与基因组、转录组和蛋白质组等组学的整体研究方法[100,101,102,103,104,105,106,107],对深刻揭示和全面阐明基因组的生物学功能是一种非常有效的方法。2.3ms-ms分析技术代谢组学的实验方案的设计与实施内容主要涉及样品收集、样品处理和测试分析的完整过程(图2)。基于代谢物组分变化对分析结果的巨大影响,实验设计中首先需要对所收集样品的剩余代谢活性进行快速淬灭(quenching)。代谢灭活的方法很多,但基本原理大都是通过快速改变样品的温度或pH值来实现。基于代谢组分析的系统性目标,整个样品处理和测试分析过程应尽可能保留和体现样品中完整的代谢物组分信息,而且需要对所有实验操作条件的基本参数实行规范化限定和记录,如样品来源、采样环境、处理过程、提取方法、样品基质(如pH、离子强度等)以及仪器参数等,以确保不同数据之间的可交换性[55,108,109,110]。样品处理方案是代谢组学实验设计中的重要内容。采用MS分析技术的代谢物组样品处理方法相对简单,已有不少的综述文献报道,但尚不存在一种具备普遍性的标准化方法。样品制备可采用连续步骤和同时操作两种方式,但过多的环节降低了过程精度和处理效率,基于此,Schaub等建立的综合样程序,集样品快速转移、灭活和定量化提取于一体,有效提高了整个处理过程的回收率、准确性和重复性。分析结果的变异性来源于生物样品的内在差异和检测方法的系统误差,生物性变异往往大于方法性变异。样品混合或组织匀浆是降低生物性变异的有效方法,但要考虑抽样和稀释对分析结果的影响。为减小分析试验过程带来的系统偏差,最近,除了有效实施生物分析的方法学综合性确证外,生物样品的收集、灭活、储存、处理和仪器分析等环节的标准化问题已提上议程[33,111,115,116,117]。2.4数据处理与分析代谢组学分析产生的是信息含量丰富的多维数据,因此充分运用化学计量学理论和多元统计分析新方法,对采集的多维海量原始信息进行压缩降维和归类分析,从中有效挖掘出有用信息,对代谢组学分析结果的最终解释至关重要。解决复杂体系中归类问题和标记物鉴别的主要手段是模式识别,通常包括监督和非监督两种分类方法:非监督方法不需要有关样品分类的任何背景信息,而监督分类便于由已知有效推测未知。目前在代谢组学中运用较多的包括主成分分析(PCA)、层次聚类分析(HCA)、非线性影射(NLM)等非监督分类方法,以及偏最小二乘法-判别分析(PLS-DA)、k-最近邻法(KNN)、神经网络(NN)等监督分类方法,其中以PCA方法最为常用。经典PCA线性降维的基本思想是对原变量空间进行旋转变换(方差最大化)以形成新的变量矩阵和误差矩阵;即:先计算原变量(n维)相关系数的协方差矩阵,再按矩阵特征根由大到小顺序确定出原变量线性组合后的新变量主成分,目标是尽量用较少(一般2或3维)的独立主成分综合体现原多维变量中蕴含的绝大部分(习惯上>85%)整体信息;在代谢组学分析中,常通过PCA得分图(scoreplot)以获得对样品分类的信息;通过PCA载荷图(loadingplot)以发现可作为生物标记物的变量(图2)。数据输出的最终目的是将代谢组数据转化为标准化和统一的格式。分析仪器直接导出的元数据(metadata),由于原始谱图的信号量大、噪音复杂、格式各样、尺度迥异、基线漂移和测试重现性等问题,不能直接用于模式识别分析,此前须经过原始数据的预处理,如采用多种方法[53,122,123,124,125,126]进行原始图谱的分段积分、滤噪、峰匹配、标准化和归一化等处理(图2),最后提取出二维数据表形式,即行代表样品或试验数目;列表示相应的单个测定指标(通常为信号强度等)。另一方面,基于投射原理和特征值分解的普通PCA模式识别方法,在数据分析时常存在较严重的“鲁棒性”(robustness)问题,对数据预处理和离群“污点”样本(outlier)非常敏感,甚至导致分类错误和出现假阳性生物标记物,严重影响分析结果。目前,修正的PCA算法主要是解决如何实现输出的各主成分之间相互独立,以及如何减弱或消除有限的样本中少量离群样本点对新变量主方向准确判定的影响。例如,采用正交信号校正(OSC)可以有效排除与判别不相干因素的影响;运用独立成分分析(ICA)能将多维数据分解成若干个不仅是互不相关而且是相互统计独立的分量,改善了PCA的鲁棒性;通过对代谢物水平(或检测信号)差异的尺度归一化数据预处理,采用稳健PCA对离群样品点的诊断,以及对“非保守性”代谢组分的判断和排除等处理方法大大提高了PCA的运算准确度。在数据处理和分析的各阶段,对数据的质量控制和统计算法的有效性验证也逐渐受到重视[116,117,127,135,136]。在数据预处理中,由于数据格式的多样性阻碍了不依赖于分析平台的统一的软件的开发,软件商或仪器制造商开发出用于输出代谢物组学数据的软件如MarkerLynx、XCMS、GENTLE、MET-IDEA等控制数据的录入质量,以减少出错率;数据输入时应尽量减少数据缺失率,必要时可进行估计填补;结合生物体系的真实变化和统计学专业知识,科学诊断并慎重处理离群点。在PCA分析中常借助交互验证法(cross-validation)确定主成分的个数,如采用去一法(leave-one-out)对选用模型进行评价。2.5生物组学数据资源由于代谢组学分析技术和操作条件的多样化,使得大量产生的数据缺乏规范性,这给代谢组学数据的采集、存储、查询、比较、共享和整合等带来诸多不便。代谢组数据的标准化也开始尝试类似转录组和蛋白质组的方法,用以规定有关具体实验和分析方法的数据格式和必要信息。如Bino等提出了MIAMET的代谢物组学数据模式,涉及实验设计、样品收集、处理和分析等各环节;基于MIAMET,Jenkins等提出了更为细致和完整的基于GC/MS的植物代谢物组学数据标准ArMet;Kell等采用XML标记语言,可将信息标准扩展到包括应用NMR和FT-IR等技术的代谢组学数据中。代谢组数据的标准化工作需要科研、企业及政府机构等多方面力量的共同参与,倡导者之一的SMRS工作组发挥了重要作用,该小组已于2005年3月制订和发布了有关代谢组分析方法的标准化报告的详细草案。从遗传基因到蛋白再到代谢表型的生物信息流中,代谢物与蛋白质、代谢物与基因之间并非直接的线性关系,生命现象是由生物体系内部复杂代谢途径网络与外部环境相互作用的综合调控的结果。因此,要获得对生物网络复杂性的准确理解,需要对体现基因活动的各类表达产物进行综合分析和整体研究,对各层次生物组学数据资源进行信息整合和系统性认识[85,107,143,144,145]。随着生物分析工作的不断深入,如何在海量数据中进行信息提取和综合、如何对数据库进行有效管理成了对未知认识准确与否的关键。从数据形式上,采用XML通用标记语言的质谱数据可同时适用于蛋白质组和代谢组,同时系统生物学标记语言SBML也正发展成XML形式;采用SysBio-OM数据记录平台,可将PEDRo形式的蛋白质组数据和代谢组(NMR和MS方法)数据整合至MAGE-OM模式的转录组数据中。从数据内容角度,组学数据整合可以通过代谢网络支架(scaffold)分析、建模方法或借用有关专业软件来实现。3代谢组学发展的机遇与挑战3.1研究新领域的研究成果作为应用驱动的新兴科学,代谢组学已在微生物和植物研究、药物毒性和机理研究[15,106,148,149,150]、疾病诊断和动物模型[24,102,151,152,153,154]、基因功能的阐明等领域获得了较广泛的应用。作为国际生命科学领域备受关注的新的研究思路和手段,代谢组学近来又在中药成分的安全性评价、药物代谢的组学分析、“毒性基因组学”(toxicogenomics)、“营养基因组”(nutrigenomics)、“药理代谢组学”(pharmaco-metabonomics)、整合药物代谢和系统毒理学(systems-ADME/Tox)等研究方面取得了新的突破和进展。例如,在药物毒性应用中,Nicholson研究组采用基于生物体液的NMR分析,建立了一种有效检测生物整体代谢过程的新方法,并应用于研究和发现外在毒性因素影响下,时间依赖性代谢整体轨迹(geometrictrajec

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论