现代生物信息学研究_第1页
现代生物信息学研究_第2页
现代生物信息学研究_第3页
现代生物信息学研究_第4页
现代生物信息学研究_第5页
已阅读5页,还剩1页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

现代生物信息学研究

近20年来,尤其是现代医学的发展,人类在生物科学领域的序列、结构和功能方面迅速积累了大量数据和信息,如原子能和养分。同时,以计算机和网络技术为代表的信息科学也在近20年中蓬勃发展。作为世界上的两个主要科学,它们相互交织,与其他学科重叠,为许多新的研究领域提供了许多发展。生物信息。作为世界上的两个主要学科,它们已经相互应用,并与其他学科重叠,因此产生了许多新的研究领域。其中,生物信息的交叉学科,尤其是微生物信息处理技术的紧密结合,得到了高度促进的相关研究发展。它被称为“生命机器的先知的洞察力”。在今后的很长一段时间里,尤其是在完成生物信息序列后的“后基因组时代”,生物信息可以发挥更重要的作用。1生物信息的定义1.1生物克氏体学对生物生物学的主要研究内容由于生物信息学是一门新兴的、正在迅速发展的交叉学科,目前国内外对生物信息学的定义众说纷纭,没有形成统一的、普遍公认的认识.以下是一些较有影响的定义.美国国家基因组研究中心认为,生物信息学是一个代表生物学、数学和计算机的综合力量的新兴学科(Bioinformaticsisanemergingscientificdisciplinerepresentingthecombinedpowerofbiology,mathematics,andcomputers).美国乔治亚理工大学认为,生物信息学是采用数学、统计学和计算机等方法分析生物学、生物化学和生物物理学数据的一种综合(Bioinformaticsisanintegrationofmathematical,statisticalandcomputermethodstoanalyzebiological,biochemicalandbiophysicaldata).美国密苏里大学认为,生物信息学是获知、管理和处理生物学信息的科学与技术(Bioinformaticsisthescienceandtechnologyaboutlearning,managingandprocessingbiologicalinformation).美国加利福尼亚大学洛杉矶分校认为,生物信息学是对生物学信息和生物学系统内在结构的研究.它将大量系统的生物学数据与数学和计算机科学的分析理论和实用工具联系起来(Bioinformaticsisthestudyoftheinherentstructureofbiologicalinformationandbiologicalsystems.Itbringstogethertheavalancheofsystematicbiologicaldatawiththeanalytictheoryandpracticaltoolsofmathematicsandcomputerscience).W网站认为,生物信息学是以加快生物学研究为目的而建立计算机数据库和运算方法的科学(Bioinformaticsisthescienceofdevelopingcomputerdatabasesandalgorithmsforthepurposeofspeedingupandenhancingbiologicalresearch).中国军事医学科学院欧阳曙光等认为,生物信息学是研究生物信息的采集、处理、存储、传布、分析和解释的科学,它通过综合数学、计算机科学与工程和生物学的工具与技术揭示大量而复杂的生物数据所赋有的生物学奥秘.中国北京生物技术和新医药产业中心认为,生物信息学是在生命科学研究中以计算机为工具对生物信息进行储存、检索和分析的科学.以上对生物信息学的种种不同定义都从不同的角度反映了生物信息学这一新学科的主要特点或其主要研究内容.1.2生物信息论与海洋学论在中国,传统意义上的生物信息学是指研究生物发光、生物电、生物磁和激素等信息物质的传递现象及其相应测定技术的科学,属于生物物理学的范畴.事实上,现代生物信息学已在广度和深度上得以大大扩展,例如与众多学科形成的各种交叉研究领域以及在分子生物学领域的极度深入.国内曾一度出现过“细胞信息学”、“细胞通讯学”、和“信息生物学”等关于生物信息学的多种别称.纵观现代生物信息学丰富多彩的相关学科和研究领域及其由信息流方向主导的研究过程,不难归纳出如下较为合理的定义:现代生物信息学是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、储存、传递、检索、分析和解读的科学,是现代生命科学与信息科学、计算机科学、数学、统计学、物理学和化学等学科相互渗透而形成的交叉学科.2现代生物信息的主要研究领域和进步2.1生物生态学研究基因组学(Genomics)和蛋白组学(Proteomics)的实质就是分析和解读核酸和蛋白质序列中所表达的结构与功能的生物信息.这方面的研究已成为生物信息学的主要研究内容之一.2.1.1全基因组研究内容一种生物的全部遗传构成被称为该种生物的基因组.有关基因组的研究称为基因组学.其中,序列基因组学(Sequencegenomics)主要研究测序和核苷酸序列;结构基因组学(Structuralgenomics)着重于遗传图谱、物理图谱和测序等方面的研究;功能基因组学(Functionalgenomics)则研究以转录图为基础的基因组表达图谱;比较基因组学(Comparativegenomics)的研究内容包括对不同进化阶段基因组的比较和不同种群和群体基因组的比较.1985年,美国能源部(DOE)基于研究核辐射对人类核酸伤害的需要,首次提出对约含30亿碱基对的人类基因组全部碱基序列进行测序.美国1990年启动了预期15年、投资30亿美元的人类基因组计划.由于很多国家的参与,现已发展成人类科学史上规模空前的国际人类基因组计划(HGP).中国参加了这一计划并承担了其中1%的测序任务.2000年5月11日,该计划宣布完成了人类基因组草图,全部测序将提前于2001年6月完成.自1995年完成第一个全基因组序列(流感嗜血杆菌,Haemophilusinfluenzae)以来,随着人类基因组计划、水稻OryzasativaL.基因组计划、拟南芥Arabidopsisthaliana和果蝇Drosophilamelan-ogaster等模式动植物基因组计划以及各种微生物基因组计划的成功实施,全基因组的研究已成为基因组学的重要内容.目前包括大肠杆菌Escher-ichiacoli和酵母菌Saccharomycescerevisiae在内的数十个全基因组的测序已经完成并另有数十个全基因组序列即将完成.2.1.2蛋白组学的主要研究内容蛋白组和蛋白组学的概念是随基因组和基因组学的出现而出现的.蛋白组(proteme)的概念是由于基因表达水平并不能代表细胞中活性蛋白质的数量,基因组序列并不能描述活性蛋白质所必需的翻译后修饰和反映蛋白质种类和含量的动态变化过程而提出的.在一定条件下某一基因组蛋白质表达的数量类型称为蛋白组,代表这一有机体全部蛋白质组成及其作用方式.有关蛋白组的研究称为蛋白组学.其中,蛋白组的研究技术与方法、双向凝胶电泳图谱以及对不同条件下蛋白组变化的比较分析是蛋白组学的主要研究内容.目前蛋白组学研究的常用技术是利用双向聚丙烯酰胺凝胶电泳分离复杂的蛋白质组分,并利用专用软件采集和分析凝胶电泳图谱资料,结合氨基酸组成分析和质谱分析对蛋白质斑点进行精确鉴定,以获得蛋白质组成、表达差异和修饰情况等方面的大量信息.蛋白组学研究首先在一些基因组研究已经完成的原核生物和简单真核生物等方面取得了丰富的研究成果.例如,已从流感嗜血杆菌的蛋白组中鉴定出300余种蛋白质,从果蝇的蛋白组电泳图谱中分离了2000多个蛋白斑点.2.1.3生物信息组研究基因组和蛋白组研究是生物信息学的主要内容.同样,生物信息学是基因组和蛋白组研究中必不可少的工具.最近,有人进一步提出了“基因组信息学”和“蛋白组信息学”的概念,作为生物信息学在基因组和蛋白组研究领域的分支.生物信息学在基因组和蛋白组研究中所起的作用主要有:(1)基因组信息结构的计算分析.即对基因组数据进行大规模并行计算并预测各种新基因和功能位点,研究大量非编码区序列的信息结构和可能的生物学意义.(2)模式生物全基因组信息结构的比较研究.即对已完成全基因组测序的各种模式生物的基因组信息结构进行比较分析,包括同源序列的搜索比较和指导基因克隆.(3)功能基因组的相关信息分析,包括对基因表达图谱及其相关算法和软件的研究,与功能基因组信息相关的核酸、蛋白质的空间结构的预测模拟以及蛋白质的功能预测.2.2u2004核心分子探针生物基检测芯片生物芯片是近年由分子生物学发展而来的一种新技术,是一个学科高度交叉、产业化前景极为广阔的研究领域,具有巨大的理论意义和实用价值.生物芯片通常指通过微加工技术和微电子技术在固体芯片表面构建的微型生物化学分析系统,能够高速率、高通量地完成对细胞、蛋白质、DNA以及其他生物组分的检测并实现分析过程的连续化、集成化、微型化和自动化.目前已有每平方厘米含40万个DNA探针分子的芯片,正在制备每平方厘米约含100万个DNA探针的人类基因检测芯片.现已能在约1cm2的生物芯片上,用分子探针检测数万至数十万碱基对区域中的任何区段.2.2.1.4基因芯片生物芯片主要包括基因芯片(DNA芯片,genechip,DNAchip,DNAmicroarray)、蛋白芯片(proteinchip)和芯片实验室(lab-on-a-chip)等.其中,基因芯片是生物芯片中研究最早、最先商品化的产品.它利用核酸双链的互补碱基之间的氢键作用,形成稳定的双链结构,通过检测目的单链上的荧光信号而实现样品的检测.基因芯片可广泛应用于DNA测序、基因突变检测、疾病诊断、新基因的寻找、基因转录分析、基因表达检测、药物筛选、农作物育种、环保检测、食品卫生监督和司法鉴定等用途.生物芯片将改变生命科学的研究方式,是继大规模集成电路之后的又一次具有深远意义的技术革命.此外,近来发现一些半醌类化合物和某些蛋白质分子具有类似于晶体管的开关状态,推断由此可能设计出生物“计算芯片”和“生物计算机”.事实上,这类研究还刚刚起步,与一些媒体的夸大宣传相去甚远.2.2.2生物芯片技术中的生物信息检测生物芯片技术主要包括芯片方阵的构建、样品的制备、生物反应和信号检测及分析等环节.信号检测是将芯片置入专用扫描仪中,通过采集各反应点的荧光位置、荧光强弱,再经相关软件分析图像,以快速准确地获取样品中的生物信息.因此,生物芯片技术中整个检测及分析技术环节都属于生物信息学的研究领域.2.3生物信息数据库的特点极其复杂的生物和生物界本身和日新月异的生命科学研究产生出大量的生物学信息.对这些信息的储存、检索、比较分析必须借助于计算机数据库技术,包括各类生物学信息数据库的建立与维护、数据的添加与注释、更新与查询、数据库资料的网络化等研究内容.生物信息数据库已成为生物信息学的主要研究领域之一,其研究表现出以下的特点:(1)种类不断增加(表1).除较早的核酸序列数据库外,近年来大量出现了基因组数据库、基因图谱数据库、蛋白质序列和蛋白质结构数据库、酶类数据库、细胞系数据库、免疫学数据库、生物反应数据库等.此外,还有生物学文献数据库、生物学软件数据库以及一体化的综合生物信息学数据库等类型,几乎涉及了生物学研究中的所有研究领域.(2)结构日益复杂.在数据库的种类迅速增加的同时,生物信息数据库的规模(记录数)和数据结构的复杂程度也在不断增加.例如核酸和蛋白质数据库,其数据除基本的序列数据外,还包含了大量的注释和参考文献以及与其他数十个相关数据库的连接指针.对蛋白质序列的注释数据还包括了蛋白质功能、空间结构以及结构域与活性中心等大量相关内容.(3)使用日趋便捷.尽管生物信息数据库的种类、规模和结构日益复杂,但数据库的管理和使用却越来越便捷.这主要是得益于计算机硬件和数据库管理软件的不断升级.目前大多数数据库能实现自动投送数据、在线查询、在线计算和空间结构的可视化浏览等功能.2.4生物信息论与计算(1)生物信息论.生物信息论最初是信息理论应用于神经科学等领域而产生的,尝试用信息论的方法研究神经细胞内及细胞间信息传递的问题.后来激素研究和免疫学研究中有关细胞间信息传递的研究也广泛应用了信息理论.目前生物信息论主要讨论生物学信息源、信息源的信息度量和信息通道(信道)以及信道的信息传递等问题.(2)生物计算与生物学应用软件.根据量子化学算法,预测生物大分子的空间结构需要大量的计算.计算技术包括机器学习、知识重现、随机模型、字符串和图形算法等;其计算内容包括序列的分析比较、分子结构及其可视化、基因的模式识别、代谢途径和调节机制、进化和种群发生等等.(3)生物学文献.生物信息的来源特别是对国际互联网上的生物信息学资源的收集整理也是生物信息学研究的重要内容之一.例如对国际互联网上各种核酸、蛋白质数据库的网址、数据特点、查询方法的收集和介绍、对各种生物信息学研究机构、出版物、新闻组、论坛等相关网站资源的收集整理.3生物信息网络和应用信息技术对重视高值学科(1)生物信息学作为现代信息科学、计算机科学、生命科学、数学、统计学

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论