第01章 生物信息学导论_第1页
第01章 生物信息学导论_第2页
第01章 生物信息学导论_第3页
第01章 生物信息学导论_第4页
第01章 生物信息学导论_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学主讲人:张宏胡银岗西北农林科技大学农学院遗传教研组主要参考书《基础生物信息学及应用》,蒋彦等,清华大学出版社《生物信息学—基因和蛋白质分析的使用指南》,李衍达,清华大学出版社《生物信息学概论》,罗静初,北京大学出版社《生物信息学》,赵国屏,科学出版社《生物信息学手册》,郝柏林,上海科学技术出版社

bioinform-nwafu@163.com,密码:bioinform

主要教学内容章次教学内容第一章生物信息学导论第二章生物学数据库第三章序列比较与数据库检索第四章核酸序列分析第五章蛋白质序列分析第六章系统进化分析第七章基因组测序与分析第八章功能基因组学分析

第一章生物信息学导论第一节引言

第二节生物信息学的发展历史

第三节生物信息学的主要研究内容

第四节生物信息学的方法和技术第五节生物信息学的前景展望第一节引言生命信息的组织、传递、表达物理化学分子生物学遗传学信息技术1、

生物信息学概念HGP生物数据的激增(每15个月翻一番)生物学家数学家计算机科学家生物信息学(bioinfomatics)的诞生概念(广义)生物体系和过程中信息的存贮、传递和表达细胞、组织、器官的生理、病理、药理过程的中各种生物信息信息科学生命科学中的信息科学

概念(狭义)生物分子数据深层次生物学知识分子生物信息学MolecularBioinformatics挖掘获取生物分子信息的获取、存贮、分析和利用Bioinformatics生物分子数据计算机计算+定义:以数据库为载体,利用数学知识建立计算模型,以计算机为工具对实验生物学中获得的大量数据进行存储、处理、分析和检索,并以生物学知识对结果进行解释,揭示蕴藏在DNA和蛋白序列中的生物遗传本质。2、分子生物信息细胞分子存贮、复制、传递和表达遗传信息的系统生物信息的载体生物信息学主要研究两种信息载体DNA分子蛋白质分子FromtheCelltoProteinMachines

基因的DNA序列DNA前体RNAmRNA多肽链蛋白质序列对应关系遗传密码生物分子至少携带着三种信息遗传信息功能相关的结构信息进化信息生物分子信息的特征生物分子信息数据量大生物分子信息复杂生物分子信息之间存在着密切的联系3、生物信息学的目标和任务

收集和管理生物分子数据数据分析和挖掘开发分析工具和实用软件生物分子序列比较工具基因识别工具生物分子结构预测工具基因表达数据分析工具

实验

数据

信息知识收集表示分析建模刻画特征比较推理

应用基因工程蛋白质设计疾病诊断疾病治疗开发新药生物分子信息处理流程数据源数据量生物信息学任务DNA序列11.5百万条序列125.0亿个碱基分离编码与非编码区域识别内含子与外显子基因产物预测基因功能注释基因调控信息分析蛋白质序列40.0万条序列(每条序列平均有300氨基酸)序列比较多重序列比对识别保守的序列模式进化分析大分子结构1.5万个结构(每个结构平均1000个原子坐标)二级结构、空间结构预测三维结构比对蛋白质几何学度量表面和形态计算分子间相互作用分析分子模拟基因组300个基因组标注重复序列基因结构分析系统发生分析基因与疾病的连锁分析基因组比较遗传语言分析基因表达酵母6000个基因在约20时间点表达值达模式相关分析基因表基因调控网络分析表达调控信息分析表1.1至2001年初已经得到的各类数据及基本数据处理任务4、生物信息学研究意义认识生物本质了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系。改变生物学的研究方式改变传统研究方式,引进现代信息学方法博物学----实验性学科-----设想、实验验证在医学上的重要意义为疾病的诊断和治疗提供依据为设计新药提供依据生物信息学将是21世纪生物学研究的核心工具生物信息学与实验生物学的关系实验生物学(传统生物学or现代生物学):是实验性的;为生物信息学提供相应的数据生物信息学:生物信息的搜集、整理、注释、管理;建立并利用生物信息学数据库;开发生物信息学软件;研究生物信息学算法生物信息学对实验数据分析与利用的结果,为进一步合理、有效地设计实验方案,研究方向等提供有力的指导和合理的建议。使得新的生物学研究的出发点是理论的生物信息学分析的结果必须通过生物实验科学来进一步验证二者是相互依赖,相互促进的关系第二节生物信息学的发展历史生物信息学基本思想的产生生物信息学的迅速发展二十世纪50年代二十世纪80-90年代生物科学和技术的发展人类基因组计划的推动20世纪50年代,生物信息学开始孕育“生物学中的信息理论讨论会”20世纪60年代,生物分子信息=计算生物学+计算机科学20世纪70年代,生物信息学的真正开端20世纪70年代到80年代初期,出现了一系列著名的序列比较方法和生物信息分析方法20世纪80年代以后,出现一批生物信息服务机构和生物信息数据库正式定名bioinformatics

美国:NCBI欧洲:EMBL日本:DDBJ20世纪90年代后,HGP促进生物信息学的迅速发展关于生物信息学发展历程中的重要大事,请参见下面两个网站的介绍:/Education/BLASTinfo/milestones.html/bioinformatics/。生物信息学国内外发展现状

PubMed中与生物信息学相关论文统计

90002%模式生物的基因组测序酵母大肠杆菌果蝇线虫老鼠3Mb30Mb400Mb3000Mb人类基因组计划随着实验数据和可利用信息急剧增加,信息的管理和分析成为HGP的一项重要的工作发现生物学规律,解读生物遗传密码认识生命的本质研究基因组数据之间的关系分析现有的基因组数据利用数学模型和人工智能技术第三节生物信息学主要研究内容1、生物分子数据的收集与管理2、数据库搜索及序列比较3、基因组序列分析4、基因表达数据的分析与处理5、蛋白质结构与功能预测6、代谢途径分析与解析基因组数据库蛋白质序列数据库蛋白质结构数据库DDBJEMBLGenBankSWISS-PROTPDBPIR1、生物分子数据的收集与管理2、数据库搜索及序列比较搜索同源序列在一定程度上就是通过序列比较寻找相似序列序列比较的一个基本操作就是比对(Alignment),即将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这是序列相似程度的一种定性描述多重序列比对研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。3、基因组序列分析

遗传语言分析——天书

获得物种整套遗传密码。如:细菌、人、水稻、拟南芥、小麦。“鸟枪法”基因组结构分析非编码蛋白(内含子)和编码蛋白(外显子)、转录因子基因识别新基因的发现、基因单核苷酸多态性(SNP)分析基因功能注释基因调控信息分析基因组比较生命起源?进化?生命体至少要多少基因?基因如何表现为生命?如:人~~鼠基因组(300Mbp)、数目、大部分同源。鼠ch1分布到人ch1、2、5、6、8、13、18,基因排列差异造成系统发育差异。4、基因表达数据的处理与分析基因表达数据分析是目前生物信息学研究的热点和重点基因表达数据的处理主要是进行聚类分析,将表达模式相似的基因聚为一类,在此基础上寻找相关基因,分析基因的功能所用方法主要有:相关分析模式识别技术中的层次式聚类方法人工智能中的自组织映射神经网络主元分析方法5、蛋白质结构与功能预测

蛋白质的生物功能由蛋白质的结构所决定,蛋白质结构预测成为了解蛋白质功能的重要途径。蛋白质结构预测分为:二级结构预测空间结构预测蛋白质折叠第四节生物信息学的方法和技术

1、数学统计方法2、动态规划方法3、机器学习与模式识别技术4、数据库技术及数据挖掘5、人工神经网络技术6、专家系统7、分子模型化技术8、生物分子的计算机模拟9、

因特网(Internet)技术

1、数学统计方法生物活动常常以大量、重复的形式出现,既受到内在因素的制约,又受到外界环境的随机干扰。因此概率论和数学统计是现代生物学研究中一种常用的分析方法数据统计、因素分析、多元回归分析是生物学研究必备的工具隐马尔科夫模型(HiddenMarkovModels)在序列分析方面有着重要的应用。与隐马尔科夫模型相关的技术是马尔科夫链(MarkovChain)2、动态规划方法动态规划(DynamicProgramming)是一种解决多阶段决策过程的最优化方法或复杂空间的优化搜索方法动态规划解决问题的基本过程是:将一个问题的全局解分解为局部解,逆序递推求出局部最优解,随着执行过程的推进,“局部”逐渐接近“全局”,最终获得全局最优解3、机器学习与模式识别技术机器学习机器学习是模拟人类的学习过程,以计算机为工具获取知识、积累经验遗传算法采用随机搜索方法,具有自适应能力和便于并行计算神经网络的理论是基于人脑的结构,其目的是揭示一个系统是如何向环境学习的,这一种方法被称为联接主义。模式识别模式识别是机器学习的一个主要任务。模式是对感兴趣客体定量的或者结构的描述,而模式识别就是利用计算机对客体进行鉴别,将相同或者相似的客体归入同种类别中根据对象的统计特征进行识别根据对象的结构特征进行识别

4、数据库技术及数据挖掘数据库技术数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论