版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.1 .2 l第一节第一节 概念概念 l第二节第二节 生物信息学的发展历史生物信息学的发展历史 l第三节第三节 生物信息学主要研究内容生物信息学主要研究内容 l第四节第四节 生物信息学的研究意义生物信息学的研究意义 .3 生命信息的组织、生命信息的组织、 传递、表达传递、表达 天文技术天文技术 空间技术空间技术 物理物理 化学化学 分子分子 生物学生物学 遗传学遗传学 信息技术信息技术 .4 l生物不是物质的简单堆积,生物体的生 长发育是生命信息控制之下的复杂而有 序的过程。 信信 息息 科科 学学 ? .5 HGP 生物数据的激增生物数据的激增 (每(每12个月翻一番个月翻一番) 生物学家生
2、物学家 数学家数学家 计算机计算机 科学家科学家 生物信息学生物信息学 (bioinfomatics) 的诞生的诞生 .6 生物体系和生物过程中信息 的存贮、传递和表达 细胞、组织、器官的生理、病理 和药理过程的中各种生物信息 信息科学 生 命 科 学 中 的 信 息 科 学 .7 分子生物信息学分子生物信息学 Molecular Bioinformatics 应用信息科学的理论、方法和技术,管理、应用信息科学的理论、方法和技术,管理、 分析和利用生物分子数据。分析和利用生物分子数据。 生物 分子数据 深层次 生物学知识 挖掘 获取 提高研究的科 学性及效率 .8 l生物体是一个复杂的系统 物
3、理、化学和生物学方法物理、化学和生物学方法 l生物体也是一个信息系统 信息科学方法信息科学方法 .9 细胞存贮、复制、传递和表达存贮、复制、传递和表达 遗传信息的系统遗传信息的系统 分子 生物信息的载体生物信息的载体 .10 l生物信息学主要研究两种信息载体生物信息学主要研究两种信息载体 DNA分子分子 蛋白质分子蛋白质分子 .11 From the Cell to Protein Machines .12 生物分子至少携带着三种信息生物分子至少携带着三种信息 遗传信息遗传信息 与功能相关的结构信息与功能相关的结构信息 进化信息进化信息 .13 遗传信息的载体主要是DNA 存储氨基酸序列编码信
4、息、基因表达调控信息及存储氨基酸序列编码信息、基因表达调控信息及 遗传信息遗传信息 生物体生长发育的本质就是遗 传信息的传递和表达 .14 基因控制着蛋白质的合成 DNARNA 蛋白 质 转录翻译 DNA通过自我复制,在生物体的繁衍过 程中传递遗传信息 基因通过转录和翻译,使遗传信息在生物 个体中得以表达,并使后代表现出与亲代 相似的生物性状。 .15 基因的基因的DNADNA序列序列 DNA 前体RNA mRNA 多肽链多肽链 蛋白质序列蛋白质序列 对对 应应 关关 系系 遗遗 传传 密密 码码 .16 l蛋白质蛋白质功能功能取决于蛋白质的空间取决于蛋白质的空间结构结构 l蛋白质结构决定于蛋
5、白质的蛋白质结构决定于蛋白质的序列序列(这是(这是 目前基本共认的假设),蛋白质结构的目前基本共认的假设),蛋白质结构的 信息隐含在蛋白质序列中。信息隐含在蛋白质序列中。 .17 l通过比较通过比较相似的蛋白质序列相似的蛋白质序列,如肌红蛋白和,如肌红蛋白和 血红蛋白,可以发现由于基因复制而产生的血红蛋白,可以发现由于基因复制而产生的 分子进化证据。分子进化证据。 l通过比较来自于不同种属的同源蛋白质,即通过比较来自于不同种属的同源蛋白质,即 直系同源蛋白质直系同源蛋白质,可以分析蛋白质甚至种属,可以分析蛋白质甚至种属 之间的系统发生关系,推测它们共同的祖先之间的系统发生关系,推测它们共同的祖
6、先 蛋白质蛋白质 。(或基因组)或基因组) .18 生 物 分 子 信 息 DNA序列数据 蛋白质序列数据 生物分子结构数据 生物分子功能数据 最基本 直观 复杂 生物分子数据类型生物分子数据类型 .19 DNA 核酸序列 蛋白质 氨基酸序列 蛋白质 结构 蛋白质 功能 最基本的 生物信息 维持生命活 动的机器 第一部 遗传密码 第二部 遗传密码? 生命体系千姿 百态的变化 生物分子数据及其关系生物分子数据及其关系 .20 l第一部遗传密码已被破译,但对密码的转录过程第一部遗传密码已被破译,但对密码的转录过程 还不清楚,对大多数还不清楚,对大多数DNA非编码区域的功能还知非编码区域的功能还知
7、之甚少。之甚少。 l 对于第二部密码,目前只能用统计学的方法进行对于第二部密码,目前只能用统计学的方法进行 分析。分析。 l无论是第一部遗传密码,还是第二部遗传密码,无论是第一部遗传密码,还是第二部遗传密码, 都隐藏在大量的生物分子数据之中。都隐藏在大量的生物分子数据之中。 生物分子数据是宝藏,生物信息数据库是金矿,等待我们去挖掘和利用。生物分子数据是宝藏,生物信息数据库是金矿,等待我们去挖掘和利用。 .21 l生物分子信息数据量大生物分子信息数据量大 l生物分子信息复杂生物分子信息复杂 l生物分子信息之间存在密切联系生物分子信息之间存在密切联系 .22 l研究目标研究目标:揭示生物分子数据的
8、内涵 生物分子数据具有深刻的内涵,数据之间存在 着复杂的联系,丰富的生物学知识和规律。 .23 l收集和管理生物分子数据收集和管理生物分子数据,使研究人员能方便,使研究人员能方便 地使用这些数据,并为信息分析和数据挖掘打地使用这些数据,并为信息分析和数据挖掘打 下基础。下基础。 数据来自于生物学实验,应用信息学技术收集数据来自于生物学实验,应用信息学技术收集 和管理数据,建立数据库,并提供数据查询、和管理数据,建立数据库,并提供数据查询、 搜索等工具。搜索等工具。 .24 l 数据分析和挖掘数据分析和挖掘 发现数据间的关系,认识数据的本质,上升为发现数据间的关系,认识数据的本质,上升为 生物学
9、知识。生物学知识。 解释与生物分子信息复制、传递和表达有关的解释与生物分子信息复制、传递和表达有关的 生物过程;生物过程; 解释生物过程中出现的信息变化与疾病的关系,解释生物过程中出现的信息变化与疾病的关系, 帮助设计新的药物分子。帮助设计新的药物分子。 .25 实验 数据 信息 知识 收集 表示 分析 建模 刻画特征 比较 推理 应 用 基因工程 蛋白质设计 疾病诊断 疾病治疗 开发新药 生物分子信息处理流程 .26 l目前生物信息学主要研究对象是目前生物信息学主要研究对象是DNA和蛋白质和蛋白质。 l DNA分析方面分析方面:分析:分析DNA序列中的基因信息及序列中的基因信息及 基因表达调
10、控信息、基因表达数据、基因间的相基因表达调控信息、基因表达数据、基因间的相 互作用及不同种属基因组的比较。互作用及不同种属基因组的比较。 l蛋白质分析方面蛋白质分析方面:分析蛋白质序列与蛋白质结构、:分析蛋白质序列与蛋白质结构、 功能间的关系,预测蛋白质的结构和功能,研究功能间的关系,预测蛋白质的结构和功能,研究 蛋白质的进化关系。蛋白质的进化关系。 .27 l 开发分析工具和实用软件开发分析工具和实用软件 生物分子序列比较工具生物分子序列比较工具 基因识别工具基因识别工具 生物分子结构预测工具生物分子结构预测工具 基因表达数据分析工具基因表达数据分析工具 .28 数据源数据源数据量数据量生物
11、信息学任务生物信息学任务 DNA序列序列11.5百万条序列百万条序列 125.0 亿个碱基亿个碱基 分离编码与非编码区域分离编码与非编码区域 识别内含子与外显子识别内含子与外显子 基因产物预测基因产物预测 基因功能注释基因功能注释 基因调控信息分析基因调控信息分析 蛋白质序列蛋白质序列100万条序列(每条序列万条序列(每条序列 平均有平均有300氨基酸氨基酸 ) 序列比较序列比较 多重序列比对多重序列比对 识别保守的序列模式识别保守的序列模式 进化分析进化分析 大分子结构大分子结构2 万个结构万个结构 (每个结构平均(每个结构平均 1000个原子坐标)个原子坐标) 二级结构、空间结构预测二级结
12、构、空间结构预测 三维结构比对三维结构比对 蛋白质几何学度量蛋白质几何学度量 表面和形态计算表面和形态计算 分子间相互作用分析分子间相互作用分析 分子模拟分子模拟 基因组基因组300个基因组个基因组 标注重复序列标注重复序列 基因结构分析基因结构分析 系统发生分析系统发生分析 基因与疾病的连锁分析基因与疾病的连锁分析 基因组比较基因组比较 遗传语言分析遗传语言分析 基因表达基因表达酵母酵母6000个基因个基因 在约在约20时间点表达值时间点表达值 基因表达模式相关分析基因表达模式相关分析 表达调控信息分析表达调控信息分析 .29 lGenBank核酸序列数据库核酸序列数据库 lSWISS-PR
13、OT蛋白质序列数据库蛋白质序列数据库 lPDB生物大分子结构数据库生物大分子结构数据库 .30 .31 n20世纪世纪50年代,生物信息学开始孕育年代,生物信息学开始孕育 1956年年 在美国首次召开了在美国首次召开了“生物学中的信息理生物学中的信息理 论研讨会论研讨会” .32 n20世纪世纪60年代,生物信息学形成雏形年代,生物信息学形成雏形 一一些计算生物学家开始进行相关研究,些计算生物学家开始进行相关研究, 生物分子信息生物分子信息在在 概念上将计算生物学和计算机科学联系起来。概念上将计算生物学和计算机科学联系起来。 1962年,年,Zucherkandl和和Pauling研究了序列变
14、化与进化间研究了序列变化与进化间 的关系的关系分子进化分子进化 1967年,年, Dayhoff研制出蛋白质序列图集(氨基酸序列的研制出蛋白质序列图集(氨基酸序列的 收集)收集) .33 n20世纪世纪7080年代初期年代初期 ,许多生物分子序列数据产生,许多生物分子序列数据产生, 一部分计算机科学家应用计算机技术解决生物学问题,尤其一部分计算机科学家应用计算机技术解决生物学问题,尤其 与生物分子序列相关的问题。与生物分子序列相关的问题。 n序列比较方法序列比较方法 1970年,年,Needleman和和Wunsch提出序列比对算法提出序列比对算法 Gibbs和和McIntyre发表矩阵打点作
15、图法发表矩阵打点作图法 Dayhoff提出提出PAM矩阵矩阵 1981年,年,Smith和和Waterman提出公共子序列识别法提出公共子序列识别法 1983年,年,Wilbur和和Lipman发表了数据库相似序列搜索法发表了数据库相似序列搜索法 1985年,蛋白质序列搜索法年,蛋白质序列搜索法FASTP/FASTN出现出现 1988年,年,Pearson和和Lipman发表著名的序列比较法发表著名的序列比较法FASTA 1990年,快速相似序列搜索法年,快速相似序列搜索法BLAST问世问世 .34 n生物信息分析方法生物信息分析方法 1972年,年,Gatlin证实自然的生物分子序列是高度非
16、随机证实自然的生物分子序列是高度非随机 1975年,年,Pipas和和McMahon提出计算机预测提出计算机预测RNA二级结构二级结构 1977年,年,DNA序列翻译成蛋白质序列法出现序列翻译成蛋白质序列法出现 1978年,年,Gingeras研制出核酸序列中限制性酶切位点的识研制出核酸序列中限制性酶切位点的识 别软件别软件 .35 n20世纪世纪80年代后年代后 1982年,核酸序列数据库年,核酸序列数据库GenBank公开发行公开发行 1986年,日本核酸序列数据库年,日本核酸序列数据库DDBJ诞生诞生 蛋白质序列数据库蛋白质序列数据库SWISS-PROT出现出现 1988年,年,NCBI
17、生物信息中心成立生物信息中心成立 欧洲分子生物学网络(欧洲分子生物学网络(EMBnet)成立)成立 .36 n20世纪世纪90年代后年代后 1990年,年,HGP计划启动计划启动 1995年,第一个细菌基因组被完全测序年,第一个细菌基因组被完全测序 1996年,酿酒酵母基因组被完全测序年,酿酒酵母基因组被完全测序 Affymetrix生产出第一块生产出第一块DNA芯片芯片 1998年,线虫的基因组被完全测序年,线虫的基因组被完全测序 1999年,果蝇的基因组被完全测序年,果蝇的基因组被完全测序 获得人类第获得人类第22对染色体的遗传序列对染色体的遗传序列 2000年年6月月24日,完成人类基因
18、组的工作框架图日,完成人类基因组的工作框架图 .37 关于生物信息学发展历程中的重要大事,关于生物信息学发展历程中的重要大事, 请参见下面两个网站的介绍:请参见下面两个网站的介绍: /Education /bioinformatics/ .38 PubMed中与生物信息学相关论文统计中与生物信息学相关论文统计 .39 n20世纪世纪80年代初,个别单位开展计算分子生物学的工作年代初,个别单位开展计算分子生物学的工作 n1993年,年, 参与参与HGP,列入生物信息学的相关研究内容,列入生物信息学的相关
19、研究内容 n19951996 年年 开始发展开始发展 n1997年,年, 香山会议召开,专题讨论生物信息学的发展香山会议召开,专题讨论生物信息学的发展 n 1999年,年, 北京召开生命科学中的信息科学问题北京召开生命科学中的信息科学问题 近几年,成立了一些生物信息学服务机构,如北京大学、近几年,成立了一些生物信息学服务机构,如北京大学、 中科院上海生命科学研究院分别成立了生物信息中心。中科院上海生命科学研究院分别成立了生物信息中心。 .40 .41 1、 生物分子数据的收集与管理生物分子数据的收集与管理 2、 数据库搜索及序列比较数据库搜索及序列比较 3、 基因组序列分析基因组序列分析 4、
20、 蛋白质结构预测蛋白质结构预测 .42 100多万个蛋白质序列多万个蛋白质序列 2万多个蛋白质空间结构万多个蛋白质空间结构 核酸序列呈指数级增长核酸序列呈指数级增长 .43 l构建数据库系统构建数据库系统 l建立网络服务器建立网络服务器 l开发数据查询和搜索工具开发数据查询和搜索工具 l设计数据分析软件和数据可视化软件设计数据分析软件和数据可视化软件 .44 DAN序列序列 蛋白质序列蛋白质序列 蛋白质结构蛋白质结构 .45 核酸 序列 数据库 蛋白质 序列 数据库 蛋白质 结构 数据库 DDBJ EMBL GenBank SWISS-PROT PDB PIR .46 l搜索同源序列在一定程度
21、上就是通过序列比较搜索同源序列在一定程度上就是通过序列比较 寻找相似序列寻找相似序列 l 一个普遍规律:序列决定结构,结构决定功能一个普遍规律:序列决定结构,结构决定功能 新序列新序列已知序列已知序列功能预测功能预测 .47 l对于对于DNA序列,同源搜索有助于确定功能、编序列,同源搜索有助于确定功能、编 码区及基因码区及基因 l 对于蛋白质序列,有助于预测蛋白质的结构、对于蛋白质序列,有助于预测蛋白质的结构、 功能及进化信息功能及进化信息 序列的比较可以同类,也可以不同类,但比较序列的比较可以同类,也可以不同类,但比较 前需转换成相同类型的序列。前需转换成相同类型的序列。 .48 l两序列比
22、较两序列比较 l数据库中某个序列或每个序列数据库中某个序列或每个序列 .49 数据库搜索的数据库搜索的 序列比较法序列比较法 .50 多重序列比对多重序列比对研究的是多个序列的共性。序列的研究的是多个序列的共性。序列的 多重比对可用来搜索多重比对可用来搜索基因组基因组序列的功能区域,也序列的功能区域,也 可用于研究可用于研究一组蛋白质一组蛋白质之间的进化关系。之间的进化关系。 .51 .52 在蛋白质研究方面,通过在蛋白质研究方面,通过结构数据库结构数据库的搜的搜 索,能发现蛋白质间更深层的关系。索,能发现蛋白质间更深层的关系。 .53 在在DNA序列分析方面,序列分析方面,识别蛋白质编码区或
23、识别蛋白质编码区或 识别基因识别基因是最关键的。是最关键的。 l如发现一个新基因,通过如发现一个新基因,通过实验实验了解与其相关的生了解与其相关的生 理功能或疾病的本质。理功能或疾病的本质。 l大量大量DNA序列数据的存在促使发展序列数据的存在促使发展识别编码区和识别编码区和 基因算法。基因算法。 l有些情况下,实验测定的编码区域不一定完整,有些情况下,实验测定的编码区域不一定完整, 需结合需结合计算计算找到并证实所有的外显子。找到并证实所有的外显子。 .54 l 蛋白质序列蛋白质序列测定测定麻烦麻烦 l 蛋白质序列蛋白质序列预测预测并非容易:并非容易: 非编码区域存在非编码区域存在 编码区编
24、码区基因结构和蛋白质序列基因结构和蛋白质序列 .55 蛋白质编码区的统计特征、基因结构中一些特蛋白质编码区的统计特征、基因结构中一些特 殊信号位点、基因转录调控区的蛋白质结合位殊信号位点、基因转录调控区的蛋白质结合位 点等都有助于识别基因。点等都有助于识别基因。 l预测蛋白质的编码区预测蛋白质的编码区 l利用相关的数据以提高基因识别的准确性利用相关的数据以提高基因识别的准确性 l 理论识别与分子生物学实验结合理论识别与分子生物学实验结合 基基 因因 识识 别别 .56 分析与基因表达调控相关的信息、各种功能位分析与基因表达调控相关的信息、各种功能位 点及基因转录调控元件。点及基因转录调控元件。
25、 lDNA序列上特殊的片段,是蛋白质因子作用的序列上特殊的片段,是蛋白质因子作用的 位点,是与基因转录、翻译有关的信号序列。位点,是与基因转录、翻译有关的信号序列。 l 通过模式识别及生物信息软件分析。通过模式识别及生物信息软件分析。 非编码区的分析非编码区的分析 .57 l分析基因组的结构和信息,发现与功能密切相关分析基因组的结构和信息,发现与功能密切相关 的保守序列。的保守序列。 l研究物种间的进化关系。研究物种间的进化关系。 基因组比较基因组比较 .58 l蛋白质是生物体的基本物质,一切生命活动都蛋白质是生物体的基本物质,一切生命活动都 与蛋白质有关。与蛋白质有关。 l蛋白质的结构由蛋白质的序列决定?蛋白质的结构由蛋白质的序列决定? l蛋白质的生物功能由蛋白质的结构所决定蛋白质的生物功能由蛋白质的结构所决定 ,蛋,蛋 白质结构预测成为了解蛋白质功能的重要途径。白质结构预测成为了解蛋白质功能的重要途径。 .59 l蛋白质结构预测的基础:蛋白质的变性及重折蛋白质结构预测的基础:蛋白质的变性及重折 叠实验叠实验 l蛋白质结构预测分为蛋白质结构预测分为: 二级结构预测二级结构预测 空间结构预测空间结构预测 蛋白质折叠蛋白质折叠 .60 l不同的氨基酸残基在不同的局域环境下具有形成特定不同的氨基酸残基在不同的局域环境下具有形成特定 二级结构的倾向性。二级结构的倾向性。 l预测某一个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年大学中药学(中药制剂工艺)试题及答案
- 2025年中职(蜂产品加工与营销)蜂蜜加工技术阶段测试试题及答案
- 2025年大学汽车服务工程(汽车售后服务管理)试题及答案
- 2025年大学环境科学(环境营养研究)试题及答案
- 巴西介绍英语
- 中国银行新员工培训课件
- 养老院老人紧急救援人员培训制度
- 养老院老人活动参与制度
- 养老院老人医疗护理服务制度
- 养老院消防安全管理制度
- 耳鼻喉科2025年工作总结及2026年工作规划
- 上海市徐汇区2026届初三一模英语试题(含答案)
- 2026年酒店服务员考试题及答案
- 普速铁路行车技术管理课件 项目二 行车组织基础
- 《(2025年)中国类风湿关节炎诊疗指南》解读课件
- 炎德·英才·名校联考联合体2026届高三年级1月联考语文试卷(含答及解析)
- 麦当劳行业背景分析报告
- 中国心理行业分析报告
- 2025至2030中国生物芯片(微阵列和和微流控)行业运营态势与投资前景调查研究报告
- 结核性支气管狭窄的诊治及护理
- 2025年铁岭卫生职业学院单招职业适应性考试模拟测试卷附答案
评论
0/150
提交评论