生物信息学在生命科学领域中的应用_第1页
生物信息学在生命科学领域中的应用_第2页
生物信息学在生命科学领域中的应用_第3页
生物信息学在生命科学领域中的应用_第4页
生物信息学在生命科学领域中的应用_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学在生命科学领域中的应用

近年来,人类科学研究和其他生物因素的提出和实施,以及人类在生命周期、结构和功能方面的迅速积累了大量数据。尤其是在核酸和蛋白质等生物分子的序列、结构和功能方面。人们渴望从这些巨量数据挖掘出有用的信息。生物信息学这门新兴学科应运而生。微生物全基因测序,不仅是人类最早和首先完成的第一种生物的全基因组分析,也是迄今为止完成测序基因组种类最多的领域。生物信息学研究方法的运用为病原微生物的研究注入了新的血液。通过生物信息学研究平台,人们不仅能够实时在线检索丰富的微生物资源、共享海量的信息数据,还可以利用不断优化的系统平台、新的算法对微生物学各方面作进一步的研究。本文对近年来生物信息学方法在分子微生物学多方面的研究作一简要综述。1生物生态学的应用现有研究内容和应用目生物信息学是在生命科学、计算机科学和数学的基础上逐步发展而形成的一门新兴的边缘学科,它以核酸和蛋白质为主要研究对象,以数学、计算机科学为主要研究手段,对生物学实验数据进行获取、加工、存储、检索与分析,从而达到揭示数据所蕴含的生物学意义的目的。生物信息学的发展大致经历了前基因组时代、基因组时代和后基因组时代。目前,它的主要研究内容已经从对DNA和蛋白质序列比较、编码区分析、分子进化转移到大规模的数据整合、可视化,转移到比较基因组学、代谢网络分析、基因表达谱网络分析、蛋白质技术数据分析处理、蛋白质结构与功能分析以及药物靶点筛选等。在后基因组时代的今天,生物信息学已经成为目前极其热门的系统生物学研究的重要手段。利用各种功能的软件系统平台,目前生物信息学方法主要通过序列比对与分析、功能基因组与基因表达数据的分析、蛋白质结构预测以及基于结构的药物设计等方面应用于各个生命科学研究领域。1.1基于gc-gm多序列比对算法的多重序列优化序列比对是生物信息学的基础,是比较两个或两个以上符号序列的相似性或不相似性。两个序列的比对现在已有较成熟的动态规划算法,以及在此基础上编写的比对软件包——BLAST和FASTA;两个以上序列的多重序列是生物信息学中尚未解决的一个NP完全的组合优化问题,是目前研究的热点。比较经典的算法有SAGA算法、CLUSTAL算法以及隐马尔可夫模型(HiddenMarkovModels,HMM)多重序列比对算法,另外,如Notredame等开发的T-Coffee算法、Timo等设计的Kalign算法、张琎等设计的基于GC-GM多序列比对穷举遗传算法,是通过穷举某个特定范围内的所有序列的长度取值,来确定最终最佳比对长度的一种多序列比对算法。这些算法已应用于各种多序列比对软件,并在应用中不断得到优化。1.2基因组学研究中的基因表达研究在后基因时代的今天,基因组学的研究已从结构基因组学(Structuralgenomics)转向功能基因组学(Functionalgenomics)。功能基因组的任务是进行基因组功能注释(Genomeannotation),了解基因功能、认识基因与疾病的关系、掌握基因的产物及其在生命活动中的作用。基因的时空差异表达是功能基因组学研究的理论基础。经典的减法杂交、差式筛选、cDNA替代差异分析以及mRNA差异显示等技术已被广泛应用于鉴定和克隆差异表达的基因。近年来应用较热的主要是基因表达系列分析(Serialanalysisofgeneexpression,SAGE)、cDNA微阵列(cDNAmicroarray)和DNA芯片(DNAchip)等差异表达分析技术。如由Liang和Pardee等发明的差异显示反转录PCR(Differentialdisplay-reversetranscriptasePCR,DDRT-PCR)技术。1.3结构的预测方法蛋白质结构预测是生物信息学的重要应用,分为二级结构预测和空间结构预测。二级结构预测的目标就是预测某一个片段中心的残基是α螺旋,还是β折叠,或是其他结构,常用的方法有立体化学方法、图论方法、统计方法、最邻近决策方法、基于规则的专家系统方法、分子动力学方法和人工神经网络方法。在空间结构预测方面,比较成功的理论方法是同源模型法。运用同源模型法可以完成所有蛋白质10%到30%的空间结构预测工作。目前尚没有普遍可行的方案实现蛋白质结构的准确预测,大多数方案为启发式的。1.4计算机技术设计基于生物大分子结构的药物设计是生物信息学研究的热点。利用现有的海量生物数据进行潜在药物靶点定位是生物信息学药物设计的主要策略。目前研究比较热的是计算机辅助药物设计(Computeraideddrugdesign)。计算机辅助药物设计就是通过模拟和计算受体与配体的这种相互作用,进行先导化合物的优化设计,大致包括活性位点分析法、数据库搜索、全新药物设计。目前活性位点分析软件主要有DRID、GREEN、HSITE等。通过搜索数据库来获得药物靶点是其中一个手段,主要分为基于配体的方法和基于受体的分析方法;另外,全新药物设计的方法越来越受到人们的重视,现已开发出一批实用性较强的软件,主要有LUDI、Leapfrog、GROW、SPROU等,其中LUDI最为常用。2生物生物学特性由于在微生物遗传物质表达中存在高频率的变异现象,微生物表现出来的时间与空间上的多态性是微生物研究的一个挑战。尤其是对病原微生物的研究,如最近提出的研究热点超级细菌的耐药性、HIV病毒的大范围蔓延、新型病毒人博卡病毒(Humanbocavins,HboV)的出现、甲型H1N1的全球蔓延等,因此对病原微生物的研究一直都是生命科学研究的热点。生物信息学方法的出现无疑是分子微生物学研究的一种强有力的手段。目前各种微生物生物信息数据库日益完善,为各种微生物的研究奠定了良好基础。通过生物信息学方法,不仅可以快速准确地实现微生物分型鉴定、溯源分析,还可以研究新型疫苗的开发,甚至是微生物致病机理的深入分析。2.1序列为基础的病原菌分型鉴定微生物高度的遗传多样性是微生物鉴定及溯源的一个难题。对此,基于DNA序列、蛋白质序列、蛋白质结构的生物信息学方法为人们在基因水平上鉴定微生物提供了一个快速精确的手段,特别是对于新发现微生物的鉴定。通过DNA测序鉴定方法已经被证明比传统的生化分型和表型分型方法更加准确、快捷,如多位点测序分型技术(Multilocussequencetyping,MLST)。MLST是一种以核酸序列为基础的病原菌分型方法,是高通量测序技术与成熟的群体遗传学相结合的产物。目前MLST已被广泛应用于原核病原菌及一些真核病原菌的分型鉴定中。脑膜炎奈瑟菌(Neisseriameningitidis)为革兰氏阴性致病菌,主要引起流行性脑脊髓炎(简称流脑)和菌血症,菌体外膜蛋白porA蛋白和porB蛋白是疫苗研发的关键抗原,由外膜蛋白基因porA、porB编码。管大伟等采用MLST方法对1965~2006年流脑患者分离的66株脑膜炎奈瑟菌进行基因分析,同时采用测序技术对菌体外膜蛋白基因porA、porB测序分型,探讨抗原的多态性。通过MLST测序得出了8个克隆体系,其中ST-5为优势克隆系,指出人脑膜炎奈瑟菌外膜蛋白的表达与克隆体系的分布有一定关联。发现广东省流脑患者脑膜炎奈瑟菌OMPs基因porA、porBVRs型高度集中,多态性较低,有利于疫苗的研发和选用。Quiñones等利用MLST方法对2000~2005年来自古巴不同地区的23个从临床上分离出来的大肠埃希菌致病基因和耐药基因进行分型鉴定。结果显示,23株大肠埃希菌共有13种基因分型(ST),其中5种分型较为罕见。各种分型在不同地区的分布有差异。通过聚类分析发现,大肠杆菌的耐药基因的分布与其基因型存在着一定关联,这对大肠杆菌的耐药机制的研究有一定的指导作用。2.2hbov、非基因引领的病毒系统发育分析微生物的系统发育关系非常复杂。通过构建进化树(phylogenetictree)来描述物种或分子间的进化关系,是生物信息学方法在微生物领域溯源分析中的重要应用。2005年8月瑞典科学家运用分子病毒筛查方法,首次在儿童呼吸道分泌物中发现了一种新型的人类细小病毒,并完成了该病毒的全基因测序,他们将这种病毒命名为人博卡病毒(Humanbocavins,HboV)。2006年8月,在我国也发现了首例人博卡病毒的存在。这种不易区别于其他呼吸道病毒感染的病毒,引起了许多专家、学者的密切关注。修文琼等在我国福州地区检测出两株HboV(FZ1和FZ40),与GenBank基因库中的10株HboV、同属的另外2种病毒:牛细小病毒(BPV,bovineparvovirus)和犬细小病毒(MVC,canineminutevirus),以及细小病毒亚科的其它4个属的病毒进行系统发育分析,得出系统发育树。发育树显示了FZ1株和FZ40株与其它病毒株的亲缘关系,HboV与BPV及MVC属于不同的进化簇,与另一人细小病毒B19在进化上相距更远。从进化角度看,人HboV与BPV、MVC具有高度同源性,且与MVC的同源性更高,进化距离更短,说明HboV很可能是MVC变异后从犬传染给人后形成的一种新物种。2003年SARS冠状病毒(SARS-CoV)的突然出现及其潜在杀伤力引起了研究人员的关注。现发现能引起人类上呼吸道感染的冠状病毒主要有5种,分别是:HCoV-OC43、HCoV-229E、SARS-CoV、HCoV-NL63以及HCoV-HKU1。为了研究HCoV-NL63与其它冠状病毒的进化关系,Minosse等根据意大利北部分离的HCoV-NL63的部分S基因和ORF1a编码区基因分别构建进化树。分析结果显示意大利HCoV-NL63分离株与其它冠状病毒存在一定的进化差异,根据ORF1a编码区基因簇构建的进化树与根据S基因构建的有所不同。由以上进化树分析可知ORF1a编码区基因簇与S基因存在着不同的进化关系,基因之间是独立进化的;如其他地区报道,HCoV-NL63基因通常以混合链的方式与其他病毒关联传播。2.3筛选和筛选疫苗片段的鉴定自第一个基于微生物基因组序列开发疫苗的实例——B群脑膜炎奈瑟菌(GroupBNeisseriameningitides,MenB)的出现,以全基因组为基础的疫苗发展策略被证明适用于大范围病原微生物的新型疫苗开发。随着微生物基因组学和生物信息学的发展,该策略为疫苗研究带来了新的变革。血链球菌(Streptococcussanguinis)是形成牙菌斑的多种微生物之一,通常对人体无害,但进入血液后有可能引起细菌性心内膜炎,有致死性。Ge等运用生物信息分析软件对血链球菌进行开放阅读框架(Openreadingframe,ORF)分析和膜外蛋白预测,得到43种候选蛋白抗原。通过动物模型试验及亲和层析净化得到9种抗体。后期的抗血清试验、竞争法ELISA试验和流式细胞术试验(Fluorescentactivatedcellsorter,FACS)结果表明,纯化后的抗体与这9种蛋白和血链球菌均反应强烈,且这9种蛋白暴露在血链球菌表面。研究结果表明,血链球菌表面的这9种膜外蛋白可以作为新型疫苗开发的参考抗原。幽门螺杆菌(HelicobacterPylori,HP)是全球范围内高感染率的慢性感染性致病菌,全世界约有50%以上的人口感染本菌。王涛等应用生物信息学SignalP、PredTMBB、LipoP、TMHMM、Phobius、PSORT-B和SubLoc等分析软件,对HP26695株和J99株的基因序列进行信号肽和一些特异性蛋白的预测,筛选新的外膜蛋白和分泌蛋白疫苗候选抗原。最终从HP26695株筛选得到54个编码β-桶型跨膜蛋白、脂蛋白或分泌表达蛋白的疫苗候选蛋白抗原,从HPJ99株得到了61个呈现上述表达方式的疫苗候选蛋白抗原。经分析得知这两株菌株的候选蛋白抗原中有43个是相同的和保守的。选择这43个候选蛋白抗原进行克隆、表达纯化和免疫学评价,可最终确定是否为HP的保护性抗原,对HP的新型疫苗的开发有重要指导意义。2.4嗜肺军团菌毒力岛的基因组织毒力岛作为细菌染色体上一段具有典型结构特征的基因簇,与多种致病菌毒力因子的产生和细菌的进化有着密切的关系。研究毒力岛序列和毒力因子蛋白质结构,对于阐述病原菌的致病机理及预测新病原菌的出现有着十分重要的意义。军团菌(Legionella)是一种兼性细胞内致病菌,可感染人巨噬细胞,在其胞内繁殖和杀死人巨噬细胞,是引起军团菌肺炎的重要病原体。军团菌的IV型分泌系统(分为IVA型和IVB型)和II型分泌系统与该菌致病性有关,细菌通过该系统可将自身合成的蛋白质等物质转运到菌体外或直接作用于靶细胞。其中编码IVB型分泌系统的基因座包括7个基因(分别为icmV,icmW,icmX,dotA,dotB,dotC,dotD)和18个icm同源基因。序列分析表明,所有已完成测序的嗜肺军团菌基因组中都包含该基因座,且序列高度保守。Icm/Dot分泌系统是引起军团菌的重要致病因子,能阻止巨噬细胞中吞噬体和溶酶体的融合,使菌体逃脱溶菌作用,在细胞中存活。也有研究表明该系统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论