生物信息学课堂(1)_第1页
生物信息学课堂(1)_第2页
生物信息学课堂(1)_第3页
生物信息学课堂(1)_第4页
生物信息学课堂(1)_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.1 绪论 v什么是生物信息学? v生物信息学的产生 v生物信息学发展过程 v生物信息学的基本方法 v生物信息学的研究内容 v生物信息学的应用 v基因组信息学的首要任务 v生物信息学的重要研究课题 v生物信息学的商业价值 v通过学习应逐渐掌握的内容 .2 产生产生(分子生物学研究中获得的大量数据) 收集收集(数据库) 维护维护(产生高质量数据) 传播传播(互联网,搜索引擎) 分析分析(主要研究内容) 应用应用(多个领域) 什么是生物信息学? 主要由数据库、计算机网络和应用软件三大部分构成 .3 定义 v收集、维护、传播、分析以及利用在分子生物学研究中获得的大量数据。 生物信息学(bioinfo

2、rmatics)是生物学与计算机科学以及应用数学等学 科相互交叉而形成的一门新兴学科。它通过对生物学实验数据的获取、 加工、存储、检索与分析,进而达到揭示数据所蕴含的生物学意义的目 的。由于当前生物信息学发展的主要推动力来自分子生物学,生物信息 学的研究主要集中于核苷酸和氨基酸序列的存储、分类、检索和分析等 方面,所以目前生物信息学可以狭义地定义为:将计算机科学和数学应 用于生物大分子信息的获取、加工、存储、分类、检索与分析,以达到 理解这些生物大分子信息的生物学意义的交叉学科。现代分子生物学的 发展,特别是人基因组计划的实施,使生物学家所面对的数据不再是实 验记录本上或文献上的几行简单数字,

3、而是公共数据库中数以千兆计的 记录。 .4 v基因组信息是生物信息中最基本的表达形式,并且 基因组信息量在生物信息量中占有极大的比重,但 是,生物信息并不仅限于基因组信息,生物信息学 也不等于是基因组信息学。广义的说,生物信息不 仅包括基因组信息,如基因的DNA序列、染色体定 位,也包括基因产物(蛋白质或RNA)的结构和功 能及各生物种间的进化关系等其他信息资源。 定义 .5 生物信息学的产生产生 v80年代未人类基因组计划(Human genome project)的启动 v生物实验和衍生数据的大量储存 v涉及生物学、数学、计算机科学和工程学,依赖于计算机科 学、工程学和应用数学的基础 v建

4、立、更新生物数据库及获取生物数据而联合使用多项计算 机科学技术的应用性学科 v不仅仅是只限于生物信息学这一概念的理论性学科。事实上, 它是一门理论概念与实践应用并重的学科 vbioinformatics这一名词在1991年左右才在文献中出现,还 只是出现在电子出版物的文本中。 .6 生物信息学的产生产生 v世纪后期,生物科学技术迅猛发展,无论从数量上还是从质量上都 极大地丰富了生物科学的数据资源。数据资源的急剧膨胀迫使人们寻求 一种强有力的工具去组织这些数据,以利于储存、加工和进一步利用。 而海量的生物学数据中必然蕴含着重要的生物学规律,这些规律将是解 释生命之谜的关键,人们同样需要一种强有力

5、的工具来协助人脑完成对 这些数据的分析工作。 v另一方面,以数据分析、处理为本质的计算机科学技术和网络技术迅猛 发展,并日益渗透到生物科学的各个领域。于是,一门崭新的、拥有巨 大发展潜力的新学科生物信息学悄然兴起。 生物信息学=生物学数据+计算机科学技术+网络技术 .7 生物信息学发展过程 v早在年,在美国田纳西州盖特林堡召开的首次“生物学中的信 息理论研讨会”上,便产生了生物信息学的概念。 v20世纪50年代末 数学模型、统计学方法和计算机处理宏观生物学数据。 数量分类学、数学生态。 v年,这一学科被正式命名为“生物信息学”(bioinformatics)。 此后,其内涵随着研究的深入和现实

6、需要的变化而几经更迭。 v应用于分子生物学:分子生物学数据库、蛋白质结构分析与预测。 v年,在美国人类基因组计划第一个五年总结报告中,给出了一 个较为完整的生物信息学定义 v人类基因组计划(human genome project,HGP):1990年启动,10年 时间完成草图(3x10e9个碱基对,并对30,000多个基因进行了注释)。 v越来越多的微生物和其他模式生物也完成了全基因组测序工作。 .8 生物信息学的发展过程 大致经历了3个阶段: v前基因组时代-生物数据库的建立、检索工具的开 发、DNA和蛋白质序列分析、全局和局部的序列对 位排列; v基因组时代-基因寻找和识别、网络数据库系

7、统的 建立、交互界面的开发; v后基因组时代-大规模基因组分析、蛋白质组分析。 .9 生物信息学的重要性重要性 v生物信息学不仅是一门学科,更是一种重要的研究开发工具。 v从科学的角度来讲,生物信息学是一门研究生物和生物相关 系统中信息内容与信息流向的综合系统科学。只有通过生物 信息学的计算处理,人们才能从众多分散的生物学观测数据 中获得对生命运行机制的系统理解。 v从工具的角度来讲,生物信息学几乎是今后所有生物(医药) 研究开发所必需的工具。只有根据生物信息学对大量数据资 料进行分析后,人们才能选择该领域正确的研发方向。 v生物信息学不仅具有重大的科学意义,而且具有巨大的经济 效益。它的许多

8、研究成果可以较快地产业化,成为价值很高 的产品。 .10 生物信息学的基本方法: v建立生物数据库:核苷酸顺序数据库(GENBANK)、Protein Data Bank(PDB)、氨基酸顺序数据库(SWISS-PRO)、酵母基因组数据库 (YEASTS)、美国种质保藏中心(ATCC)、美国专利局数据库(USPO)。 v数据库检索:Blast v序列分析:序列对位排列、同源比较、进化分析。 v统计模型:如隐马尔可夫模型(hidden Markov model, HMM)-基因识别、 药物设计。最大似然模型(maximun likelihood model, ML)、 最大简约法 (Maximu

9、n Parsimony, MP)-分子进化分析。 v算法:如自动序列拼接、外显子预测和同源比较、遗传算法、人工神经 网络(artificial neural network)。 .11 生物信息学的研究内容 v对基因组研究相关生物信息的获取、加工、存储、分配、分 析和解释: v一是对海量数据的收集、整理与服务,即管理好这些数据; v二是从中发现新的规律,也就是使用好这些数据。 v具体地说,生物信息学是把基因组(脱氧核糖核酸) 序列信息分析作为源头,找到基因组序列中代表蛋白质和 (核糖核酸)基因的编码区。同时,阐明基因组中大量 存在的非编码区的信息实质,破译隐藏在序列中的遗 传语言规律。在此基础

10、上,归纳、整理与基因组遗传信息释 放及其调控相关的转录谱和蛋白质谱的数据,从而认识代谢、 发育、分化、进化等的规律。 .12 生物信息学的研究内容 v获取人和各种生物的完整基因组 v基因组注释:新基因、单核苷酸多态(SNP). v基因组中非编码区信息结构分析 v在基因组水平研究生物进化 v完整基因组的比较研究 v从功能基因组到系统生物学 v蛋白质结构模拟与药物设计 .13 生物信息学的研究内容 v获取人和各种生物的完整基因组 基因组研究的首要目标是获得人的整套遗传密码。人 的遗传密码有亿个碱基,而现在的测序 仪每个反应只能读取几百到上千个碱基。这样,要 得到人的全部遗传密码,首先要把人的基因组

11、打碎, 测完一个个小段的序列后再把它们重新拼接起来。 而基因组大规模测序的每一个环节,都同信息分析 紧密相关,每一步都紧密依赖于生物信息学的软件 和数据库。 .14 生物信息学的研究内容 实验数据 -转换为-计算机信息 v高度自动化的实验数据的获得、加工和整理如何将实验室中 得到的生物学信息转化为计算机能够处理的数字信息,是生 物信息学的一个重要课题。这种转化大量地体现在各种自动 化分子生物学仪器应用上,如DNA测序仪,PCR仪等。这类 仪器将实验所得的物理化学信号转化为数字信息,并对其作 简单分析,再将分析结果用于实验条件的控制,完成高度自 动化的实验过程。从事大规模EST测序和DNA物理图

12、谱构建 的实验室都已建立起高度自动化的机器人系统来完成大部分 的实验工作。 .15 数据管理系统 v伴随着实验过程的高度自动化甚至工厂化,从事大规模分子生物学项目 的实验室,每天需要存储的数据可以轻易地超过几千兆字节。这样大的 数据量必须用专门的实验室数据管理系统进行处理,以自动完成包括实 验进程和数据的记录,常规数据分析,数据质量检测和问题的自动查找, 常规的数据说明和数据输人数据库在内的各项工作。由于不同实验室需 处理的数据类型各不相同,很多实验室都是各自开发自己的系统。随着 测序逐渐成为实验室的常规工作,对这种系统的需求会越来越大。 生物信息学的研究内容 .16 生物信息学的研究内容 序

13、列片段的拼接 DNA自动测序仪每个反应只能测序500bP左右。如何将这些序列片段拼 接成完整的DNA顺序就成为接下来的一个重要工作。传统的测序技术通 常将克隆进行亚克隆并对亚克隆进行排序。这些工作需要大量的人力物 力。现在生物信息学提供了自动而高速地拼接序列的算法,即根据 Lander-Waterman模型利用鸟枪法进行测序,再将大量随机测序的片段 用计算机进行自动拼接。这种技术不仅避免了亚克隆排序所需的大量繁 琐的工作,还使序列具有一定的冗余性以保证序列中每个碱基的准确性。 序列拼接算法的进一步发展,需要在以下方面进行改进:1将已知的基因 组知识应用与拼接算法,以进一步提高拼接真核基因组的有

14、效性。2自动 处理自动测序造成的差错,特别是对差错倾向的EST顺序更是如此。 .17 v目前最为常见的基因测序方法是鸟枪法(Shotgun method)。鸟枪法测序的结果使我们只能得到大量的随机 的基因片段 v更廉价和更高效的新一代测序技术,基因片段越来越短,基 本上是25-30个碱基对的片段,与以前的长达几百几千的基 因拼接在算法上就有了差异性。为了能够在超短序列上拼接 出完整的基因序列,就必须加大测序的覆盖率,这样将会导 致庞大的初始序列文件,通常达到了GB级别。最新的序列 拼接软件ALLPATHS V3.0 需要至少32GB的内存,这种昂贵 的代价是一般机器无法提供的。 v超短基因片段

15、导致了大量的overlap(重叠区域),这将是传 统的拼接算法所无法承受的计算量。还有大量的repeat(重 复区域)也将使传统的算法更加的不可靠。同时初始文件的 庞大导致传统的内存算法已经不再适用。 生物信息学的研究内容 序列片段的拼接 .18 基因区域的预测(基因注释) v在完成序列的拼接后,我们得到的是很长的DNA序列,甚至 可能是整个基因组的序列。这些序列中包含着许多未知的基 因,下一步就是将基因区域从这些长序列中找出来。 v所谓基因区域的预测,一般是指预测DNA顺序中编码蛋白质 的部分,即外显子部分。不过目前基因区域的预测已从单纯 外显子预测发展到整个基因结构的预测。这些预测综合各种

16、 外显子预测的算法和人们对基因结构信号(如TATA box和加 尾信号)的认识,预测出可能的完整基因。 生物信息学的研究内容 .19 基因组注释 有了完整基因组,人类对自身的认识就更为细致、更为精确。 比如:发现在我们的基因组中真正编码蛋白质(称为外显子) 等的部分很少,只占11;外显子与外显子之间的区域 (称为内含子)占了24;而基因与基因之间的间隔序列却 占了75,也就是说在人类基因组中不编码蛋白质的区域占 了绝大部分。发现人类编码蛋白的基因较之其它生物体的基 因更为复杂,有更为丰富的剪接方式。发现基因组中片段重 复现象很普遍。发现人的第13号染色体比较稳定,而男性的 第12号染色体和女性

17、的第16号染色体是易变的,等等。 生物信息学的研究内容 .20 发现新基因 发现新基因是当前国际上基因组研究的热点,使用生物信息 学的方法是发现新基因的重要手段。比如:啤酒酵母完整基 因组所包含的约6000个基因,大约60是通过信息分析得 到的。 生物信息学的研究内容 Example: Take a protein sequence and use it as a query in a blastp search of the nr database at NCBI If there is a match with less than 100% identity If there is a m

18、atch with100% identity, but to a different species .21 发现新基因 -(1)基因的电脑克隆 利用 E ST数据库发现新基因也被称为基因的电脑克隆。 E ST序列是基因表达的短 c DNA序列,它们携带着完整基因 的某些片段的信息。到2001年10月,GenBank的EST数据 库中人类 E ST序列已超过380万条,它大约覆盖了人类基因 的90以上。 我国早在1996年就开始了通过电脑克隆寻找新基因的研究。 它的原理非常简单,就是找到属于同一基因的所有 E ST片 段,再把它们连接起来。由于 E ST序列是全世界很多实验 室随机产生的,所以

19、属于同一基因的很多 E ST序列间必然 有大量重复小片段,利用这些小片段作为标志就可以把不同 的 E ST连起来,直到发现了它们的全长,这样我们就可以 说通过电脑克隆找到了一个基因。如果这个基因以前未曾发 现过,那我们就找到了一个新基因。但是进行电脑克隆程序 设计是复杂的,计算量是巨大的。 生物信息学的研究内容 .22 发现新基因 -(2)从基因组 DNA序列中预测新基因 从基因组序列预测新基因,本质上是把基因组上编码蛋白质 的区域和非编码蛋白质的区域区分开来。对于理论方法来讲 就是要找到在编码区和非编码区哪些数学、物理学特征是不 一样的。将这些序列与已知基因数据库进行比较,就可以发 现新的基

20、因了。 发现了新基因就会使我们对生命活动的认识加深一步。1999 年12月2日自然杂志,人的第22号染色体数据已鉴定出 679个基因,其中55的基因是未知的。有35种疾病与该染 色体突变相关,像免疫系统疾病、先天性心脏病和精神分裂 症。但是,要将人类的所有基因及其相应的蛋白质以及与它 们相关的功能完整而正确地整合到一个索引中,依然是一个 十分重要、十分艰巨的任务。 生物信息学的研究内容 .23 发现单核苷酸多态(S NP) 有的人吸烟喝酒却长寿,也有人自幼就病痛缠身;同一种治疗 肿瘤的药物对一些人非常有效,对另一些人则完全无效。这 是为什么?答案有可能是他们基因组中存在的差异。这种差 异很多表

21、现为单个碱基上的变异,也就是单核苷酸的多态性 (SNP)。 现在普遍认为 SNP研究是人类基因组计划走向应用的重要步骤。 这主要是因为 SNP将提供一个强有力的工具,用于高危群 体的发现、疾病相关基因的鉴定、药物的设计和测试以及生 物学的基础研究等。 SNP在基因组中分布相当广泛,近来 的研究表明在人类基因组中每300碱基对就出现一次。大量 存在的 SNP位点,使人们有机会发现与各种疾病,包括肿 瘤相关的基因组突变;从实验操作来看,通过 SNP发现疾 病相关基因突变要比通过家系来得容易;有些 SNP并不直 接导致疾病基因的表达,但由于它与某些疾病基因相邻,而 成为重要的标记。 SNP在基础研究

22、中也发挥了巨大的作用。 生物信息学的研究内容 .24 基因组中非编码区信息结构分析 近年来的研究表明,在细菌这样的微生物中,非编码蛋白质的区域只占整 个基因组序列的10到20。随着生物由低等到高等,非编码区越来越 多,在高等生物和人的基因组中非编码序列已占到基因组序列的绝大部 分。这表明:这些非编码序列必定具有重要的生物功能。普遍的认识是, 它们与基因的表达调控有关。 对人类基因组来说,迄今为止,人们真正掌握规律的只有 D NA上的编码蛋 白质的区域(基因),最新资料说明这部分序列只占基因组的11。 仅占人类基因组11的编码区的相关研究已经缔造了数十名诺贝尔奖 获得者,98非编码区蕴含的成果数

23、量将是十分可观的,因此寻找这些 区域的编码特征、信息调节与表达规律是未来相当长时间内的热点课题, 是取得重要成果的源泉。 生物信息学的研究内容 .25 基因功能预测 v序列同源比较; v寻找蛋白质家族保守顺序; v蛋白质结构的预测。 生物信息学的研究内容 .26 基因功能预测 mRNA芯片分析 多伦多大学的Tim Hughes和同事利用一种先前只用于简单生物体(如酵母 和线虫)的技术对小鼠的基因组进行了研究。在酵母和其它简单有机体 中,具有相同功能的基因的表达往往具有同步调节的特征。在这些有机 体中,确定已知和未知基因的相关联的表达能够帮助预测一个新基因的 功能。一直以来人们认为这种技术无法用

24、在哺乳动物上,同一个组织中 表达的基因最有可能具有一种功能上的联系并因此产生了组织特异性。 在新的研究中,Hughes和同事创造出了含有在55种组织中表达的40000个 已知的小鼠mRNA的芯片并对其进行分析。分析结果表明来自同一个 GO-BP(Gene Ontology Biological Process)类别的基因在转录水平 上被协同调节而不取决于它们在何种组织中表达。 生物信息学的研究内容 .27 分子进化的研究:分子进化的研究: v通过上述种种方法我们可以预测出一个新基因的可能具有的 功能。然而预测新基因只是生物信息学研究的一个方面,这 门学科的根本目标是探究隐藏在生物数据后面的生物

25、学知识。 对于基因组研究来说,一个重要的研究方向就是分子序列的 进化。通过比较不同生物基因组中各种结构成分的异同,可 以大大加深我们对生物进化的认识。这种研究已逐步形成一 个称为比较基因组学的新学科。从各种基因结构与成分的进 化,密码子使用的进化,到进化树的构建,各种理论上和实 验上的课题都等待生物信息学家的研究。 生物信息学的研究内容 .28 分子进化的研究:分子进化的研究: v科学家们对处于不同进化阶段物种的基因组 结构和功能进行比较分析,企图最终弄清人 类10 万个基因的起源和进化、结构和功能的 演变,发现其间的亲缘关系,像元素周期表 那样把基 因和蛋白质分类、排序,得到生物 学的周期表

26、,根据基因在进化树上的位置, 或一小段核苷 酸序列,或蛋白质的基序、模 块、折叠等,即可预测其来源、结构、功能 等。这项浩大的工 程显然需要大量生物信息 学家长期不懈努力才能完成。 生物信息学的研究内容 .29 v在基因组水平研究生物进化 随着基因组序列数据的大量增加,对序列差异和进化关系的争论也越来越 激烈。首先发现同一种群基于不同分子序列所重构出的进化树可能不同。 同时,对“垂直进化”和“水平演化”之间关系的讨论正逐渐引起人们 的重视。也就是近年来发现了基因的“横向迁移现象”。即:基因可以 在同时存在的种群间迁移,其结果虽可导致序列差异,但这种差异与进 化无关。甚至,对人类基因组的分析发现

27、,有几十个人的基因只与细菌 基因相似,而在果蝇、线虫中都不存在。如果以人的这些基因序列来研 究进化将会得到荒谬的结论。所以在当前的分子进化研究中必须选择垂 直进化的分子作为样本。特别是:在分子进化分析中,“相似性”和 “同源性”是两个不同的概念。相似性只反映两者类似,并不包含任何 与进化相关的暗示。同源性则是与共同祖先相关的相似性。 生物信息学的研究内容 .30 v完整基因组的比较研究 在后基因组时代,完整基因组数据越来越多,有了这些资料人们就能对若 干重大生物学问题进行分析研究,如:生命是从哪里起源的?生命是如 何进化的?遗传密码是如何起源的?估计最小独立生活的生物体至少需 要多少基因?这些

28、基因是如何使生物体活起来的?等等。这些重大的问 题估计只有在基因组水平上才能回答。举例来说,鼠和人的基因组大小 相似,都含有约30亿碱基对,基因的数目也类似,且大部同源。可是鼠 和人差异却如此之大,这是为什么?同样,有的科学家估计不同人种间 基因组的差别仅为01;人猿间差别约为1。但他们表型间的差异 十分显著。因此,这种差异不仅应从基因、 D NA序列找原因,也应考 虑到整个基因组、考虑染色体组织上的差异。这一工作开创了比较基因 组学。 生物信息学的研究内容 .31 v完整基因组的比较研究 科学家们发现:全部基因可以按照功能和系统发生分为若干类,其中包括 与复制、转录、翻译、分子伴娘、能量产生

29、、离子转运、各种代谢相关 的基因。当我们比较鼠和人的基因组就会发现,尽管两者基因组大小和 基因数目类似,但基因组的组织却差别很大。例如存在于鼠1号染色体上 的基因已分布到人的1、2、5、6、8、13、18号7个染色体上了。研究表 明在同一界中,某些核糖体蛋白排列顺序的差异能反映出物种间的亲缘 关系,亲缘关系越近,基因排列顺序越接近。这样就可以通过比较基因 的排列顺序来研究物种间的系统发育关系。 生物信息学的研究内容 .32 v从功能基因组到系统生物学 在不同的组织中表达基因的数目差别是很大的,脑中基因表达的数目最多, 约有34万个转录子,有的组织中只有几十或几百个基因表达。同一组 织在不同的个

30、体生长发育阶段,表达基因的种类、数量也是不同的,有 些基因是在幼年时期表达的,有些是中年阶段表达的,有些要到老年时 期才表达。我们不仅需要了解基因的序列,还要了解基因的功能,也就 是要了解在不同的时间、不同的组织中基因的表达谱。这就是通常所说 的功能基因组研究。 为了得到基因的表达谱,国际上在核酸和蛋白质两个层次上都发展了新技 术。这就是在核酸层次上的基因芯片(或称 D NA芯片)技术和在蛋白 质层次上的大规模蛋白质分离和序列鉴定技术,也称蛋白质组技术。由 于芯片上样品点的密度很大,可以达到每片几十万,因此表达谱数据挖 掘和知识发现就成了该研究成功与否的关键。无论是生物芯片还是蛋白 质组技术的

31、发展,都更强烈地依赖于生物信息学的理论、技术与数据库。 下一步,功能基因组研究将朝着复杂系统的方向发展,即:探讨生物系 统中各部分、各层次的相互作用,从而进入系统生物学的领域。 生物信息学的研究内容 .33 v蛋白质结构模拟与药物设计 蛋白的空间结构模拟和药物设计已有二三十年的历史。 随着人类基因组研究的飞速发展,这一领域面临着 新的态势,即:在找到人类34万个基因的碱基序 列并确定它们表达产物的氨基酸顺序后,如何预测 这些蛋白的空间结构,进而实现针对性的药物设计。 (蛋白质的功能和它们的空间结构密切相关 ) 生物信息学的研究内容 .34 生物信息学的应用: v基因组分析 v基因芯片 v药物开

32、发 v其他 .35 生物信息学的应用 基因组(测序组装): v基因组研究的首要目标是获得人的整套遗传密码。人的遗传 密码有亿个碱基,而现在的测序仪每个反应只能 读取几百到上千个碱基。这样,要得到人的全部遗传密码, 首先要把人的基因组打碎,测完一个个小段的序列后再把它 们重新拼接起来。而基因组大规模测序的每一个环节,都同 信息分析紧密相关,每一步都紧密依赖于生物信息学的软件 和数据库。 .36 基因组分析 将已知的序列与功能联系在一起、从基于常规克隆的 基因分类转向基于序列及功能的分析的基因分类、 从单个基因致病机制的研究转向多个基因致病机制 的研究、从组织与组织之间的比较来研究功能基因 组和蛋

33、白质组、 从基因组和蛋白质组的结构与功能 关系来预测三级结构和功能,并从三级结构和功能 反推可能的序列、通过比较不同生物物种的基因组 来进行分子进化研究。 生物信息学的应用 .37 生物信息学的应用 蛋白质组:蛋白质组: v基因组对生命体的整体控制必须通过它所表达的全部蛋白质来执行。由 于基因芯片技术只能反映从基因组到的转录水平上的表达情况, 而从到蛋白质还有许多中间环节的影响,这样,仅凭基因芯片技 术人们还不能最终掌握生物功能的具体执行者蛋白质的整体表达状 况。因此,近年在发展基因芯片的同时,人们还发展了一套研究基因组 所有蛋白质产物表达情况的技术蛋白质组研究技术,包括二维凝胶 电泳技术和质

34、谱测序技术。然而,最重要的是如何运用生物信息学的方 法去分析获得的海量数据,从中还原出生命运转和调控的整体系统的分 子机制。 .38 生物信息学的应用: 1.基因组分析 人类基因组计划人类基因组计划(HGP): v人类基因组计划(Human Genome Project,简称HGP)是美 国科学家在1985年率先提出的,其目的在于阐明人类基因组 DNA3109核苷酸序列,破译人类全部遗传信息,HGP于 1990年正式启动。随着HGP产生的数据爆炸,一门新兴学 科-生物信息学应运而生。生物信息学是以计算机为主要 工具,开发各种软件,对日益增长的DNA和蛋白质的序列和 结构等相关信息进行收集、储存

35、、发行、提取、加工、分析 和研究,同时建立理论模型,指导实验研究,它由数据库、 计算机网络和应用软件三大部分构成,在基因组计划中发挥 不可替代的作用。 .39 生物信息学的应用: 1.基因组分析 人类基因组计划人类基因组计划(HGP): vHGP目的之一,就是找到人类基因组中的所有基因。除功能 克隆和定位克隆策略之外,生物信息学为分子生物学家提供 了一条寻找和研究新基因的新思路,即从高度自动化的实验 出发,经过数据的获取与处理、序列片段的拼接、可能基因 的寻找、基因功能的预测一直到基因的分子进化研究。这个 过程的每一个环节,都是生物信息学研究的重要内容。 .40 生物信息学的应用: 1.基因组

36、分析 人类基因组计划人类基因组计划(HGP)HGP的目标大致如下: v(1)建立一高分辨力的人体基因组图谱。(2)建立 某 些选择性模型机体(如大肠杆菌、线虫等)的 DNA和人体染色体的基因物质图谱。(3)测定这 些人体和选择性机体的DNA序列,以俾更好了解正 常基因调控、基因遗传性疾病及其演化过程。(4) 建立软件和数据库以提高应用和判断这些基因信息 的效能。(5)发明有关的创新技术。(6)建立 HGP的伦理学、法律和社会参与的程序。 .41 生物信息学的应用: 2.基因芯片基因微阵列或DNA芯片(gene microarray 或DNA chips)的原理是将几万个 寡核苷酸或DNA作为探针,密集排列于硅片 等固相支持物上,将研究样品标记后与微点 阵杂交并进行检测。根据杂交信号强弱及探 针位置和序列,可以确定靶DNA的表达情况 以及突变和多态性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论