生物信息学的概念及其发展PPT课件_第1页
生物信息学的概念及其发展PPT课件_第2页
生物信息学的概念及其发展PPT课件_第3页
生物信息学的概念及其发展PPT课件_第4页
生物信息学的概念及其发展PPT课件_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 生物信息学概论IntroductiontoBioinformatics 任课教师 李继刚办公室 逸夫楼1107 2 本课程参考书籍 陈铭主编 生物信息学 科学出版社 2012Lesk A M IntroductiontoBioinformatics OxfordUniversityPress 2005其他资源 包括网络资源 3 考核方式 作业 期末测验要求 课堂听讲 课下实践 教学辅助 互联网资源 4 第一章生物信息学的概念及其发展 5 二战后 生物学及计算机技术发展迅猛 将信息技术 IT 应用于生物学研究就成为必然 特别是随着组学时代的到来 海量的生物学数据必须通过生物信息学的手段进行收集 分析和整理 生物信息学技术就成了生物学研究的必需 一 生物学信息学的发展历史 6 1 生物信息学的发展历史可分为3个阶段 1 萌芽期 60 70年代 以Dayhoff的替换矩阵和Needleman Wunsch算法为代表 这是生物信息学的一个最基本的内容和思路 序列比较 7 2 形成期 80年代 以分子数据库和BLAST等相似性搜索程序为代表 1982年三大分子数据库的国际合作使数据共享成为可能 同时为了有效管理与日俱增的数据 以BLAST FASTA等为代表工具软件和相应的新算法大量被提出 极大地改善了人类管理和利用分子数据的能力 在这一阶段 生物信息学作为一个新兴学科已经形成 并确立了自身学科的特征和地位 8 http www ddbj nig ac jp http www embl org http www ncbi nlm nih gov 9 3 高速发展期 90年代 至今 以基因组测序与分析为代表 基因组计划 特别是人类基因组计划的实施 分子数据以亿计 基因组水平上的分析使生物信息学的优势得以充分表现 基因组信息学成为生物信息学中发展最快的学科前沿 10 生物学 信息技术以及生物信息学相关大事记 11 12 13 二 生物信息学定义 定义一 生物信息学是一门收集 分析遗传数据以及分发给研究机构的新学科 Bioinformaticsisanewsubjectofgeneticdatacollection analysisanddisseminationtotheresearchcommunity 林华安 Dr HwaA Lim 1987 定义二 生物信息学是在大分子方面的概念型的生物学 并且使用了信息学的技术 这包括了从应用数学 计算机科学以及统计学等学科衍生而来各种方法 并以此在大尺度上来理解和组织与生物大分子相关的信息 Luscombe 2001 14 生物信息学定义 2 Bioinformaticsisthefieldofscienceinwhichbiology computerscience andinformationtechnologymergeintoasinglediscipline Theultimategoalofthefieldistoenablethediscoveryofnewbiologicalinsightsaswellastocreateaglobalperspectivefromwhichunifyingprinciplesinbiologycanbediscerned Biologyinthe21stcenturyisbeingtransformedfromapurelylab basedsciencetoaninformationscienceaswell 15 广义生物信息学观点 Biologymaybeviewedasthestudyoftransmissionofinformation frommothercelltodaughtercell fromonecellortissuetypetoanother fromonegenerationtothenext andfromonespeciestoanother Thisinformationalviewpointistermedbioinformatics生物学研究可以被看成是研究信息的传递 从DNA经转录翻译到蛋白质 从细胞质中到细胞核内 从母细胞到子细胞 从一个细胞或一个组织到另一个细胞或另一个组织 从一代到下一代 从一个物种到另一个物种的进化演变 这种信息论的观点即可称为生物信息学 Eisenbergetal 2006 16 17 3 生物信息学的发展历程 1952年 Sanger根据胰岛素蛋白质的测序结果 推断蛋白质是排列完美的分子 最早的信息论观点 1955年 Sanger与合作者分别对牛 猪和羊的胰岛素蛋白质进行了测序并做了序列上的比较 最早的序列比对 1962年 鲍林提出分子进化的理论 推测在人中可能存在50 000 100 000个不同的基因 蛋白质 分子进化理论的奠定 1965年 MargaretDayhoff构建蛋白质序列图谱1970年 Needleman Wunsch算法 全局优化比对 1981年 Smith Waterman算法开发 局部优化比对 1990年 快速序列相似性搜索工具BLAST的开发 18 生物信息学发展过程中的里程碑 19 80年代 DNA序列数据库 1 1974年 GeorgeI Bell等人收集DNA序列 构建GenBank数据库 1982 1992开发第一个版本 2 1980年 EMBL数据库成立 3 1984年 日本DDBJ数据库成立 4 核酸序列数据的去冗余 Refseq数据库 对于相同的序列只列一条目录 20 核酸数据库数据的增长 21 22 获取序列及检索公共数据库 1 Entrez的开发 D Lipman等人 2 提供关键字的搜索的方法 3 硬搜索 包含关键字的 完全匹配的结果 4 软搜索 与查询内容相关的信息 5 查询内容 基因 蛋白质的名称 标识符 文献 蛋白质结构 等等 23 http www ncbi nlm nih gov sites gquery 24 序列比对工具的开发 1 1970年 GibbsAJ和McIntyreGA 点阵法进行氨基酸和核酸的序列比较 当相同的字母在两条序列中同时出现时 在交叉处置点 2 1970年 Needleman Wunsch 全局优化的序列比对算法 允许匹配 错配和缺失 动态规划的算法 任务可分割 分成更小的子问题进行解决 3 1981年 Smith Waterman 局部优化的序列比对算法 4 FASTA BLAST的开发 启发式优化算法 5 多序列比对 CLustalW X POA MUSCLE 25 序列 分子进化 1 寻找Ortholog 直系同源物 或者Paralog 旁系 同源物 2 构建进化树 分析蛋白质的超家族及亚家族分类 3 分子进化树的构建方法 邻接法 Neighbor Joining 最大简约法 MaximumPasimony 最大似然性法 MaximumLikelihood 以及贝叶斯类算法 MCMC 4 构建进化树的前提 可靠的多序列比对 26 Orthologvs Paralog 直系同源物 两个基因通过物种形成的事件而产生 或 源于不同物种的最近的共同祖先的两个基因 或者两个物种中的同一基因 一般具有相同的功能 旁系同源物 两个基因在同一物种中 通过至少一次基因复制或分歧的事件而产生 同源性研究 哪种同源物 Experimentallyveryhardtoanswer 27 基因进化 物种形成vs 基因复制 28 北京大学 清华大学 浙江大学及中科院生物物理所 上海生命科学研究院 遗传与发育生物学研究所 公司 华大基因 国内情况 29 三 生物信息学的研究内容 1 开发新的算法及统计学的方法来揭示大规模数据之间的联系 2 分析和解释各种类型的生物学数据 包括核酸 氨基酸序列 蛋白质功能结构域以及蛋白质三级结构等 3 开发 设计一系列相关的工具 能够方便有效的获取 管理以及使用各种类型的数据和信息 30 生物信息学的主要应用 1 生物信息学数据库1 数据库建设2 数据库整合和数据挖掘 31 2 序列分析 1 序列比对2 基因序列注释 32 3 其他主要应用 1 比较基因组学 2 基因和蛋白质的表达分析 3 生物芯片大规模功能表达谱的分析4 蛋白质结构的预测 5 蛋白质与蛋白质相互作用 6 生物系统模拟 33 7 代谢网络建模分析 1 预测调控网络2 网络普遍性分析3 建立模型分析 34 8 计算进化生物学 9 生物多样性研究 10 合成生物学 35 四 学习 生物信息学 的要求 懂一些计算机软件及硬件的常识 36 需要学会编写复杂程序吗 不必 除非你想专门研究 生物信息学 学会使用web上的工具软件 学会创建并维护一个web站点 具备使用计算机操作系统的技巧 具备一点编写简单脚本程序 如PERL 的基本知识 37 PERL和Linux 学习生物信息学需要具备一定的Linux操作系统与PERL语言知识 MS Windows DOS HomeandofficePCs Unix Workstationandservers MacOS AppleMacintosh 38 WorkingonaUnixSystem Youareprobablyaccustomedtoworkingwithpersonalcomputers youmaybefamiliarwithwindowsinterfaces wordprocessors andevensomedata analysispackages However ifyouwanttousecomputersasaseriouscomponentinyourresearch youneedtoworkoncomputersystemsthatrununderUnixorsomeUnix likeoperatingsystems 39 WhyuseUnix 稳定性好 Over25yearsinindustryandacademia 开放性好 Supportingpossibletasksinfuture Internet上的操作系统 ThesoftwarethatpowerstheWebwasinventedinUnix andmanyifnotmostwebserversrunsonUnixservers 科学软件的载体 Manygood quality interestingandimportantscientificsoftwarearewrittenforUnix 共享的乐园 ManyprogramscanbedownloadedandinstalledonUnixsystemsforfree 几乎所有的大型数据库都运行于Unix之上 或至少有基于Unix的版本 如Genbank和EMBL 40 Linux Linuxisafree opensourceversionofUnix LinuxcanturnanordinaryPCintoapowerfulworkstation Command line 需要硬件资源低 更高效 X windows 需要硬件资源更高 更直观 41 Bioinformaticsworkstation ByconfiguringyoursystemwithLinuxandotheropensourcesoftware youcanhaveaccesstoalotofpowerfulcomputationalbiologyandbioinformaticstoolsatalowcost 42 操作系统发展 DOS UNIX MSWindows linux MacOs ReadHat Ubuntu CentOs Fedora MyComputer 多用户 开源性 字符操作 43 MS操作系统的文件结构 文件树 我的电脑 本地磁盘 C 本地磁盘 D 本地磁盘 E Windows Programfiles Documentsandsettings musics movies MyDocuments Allusers Administrator MyWork training useoflinux pptx Betterman mp3 baby mp3 44 Linux操作系统常用命令 45 网上浏览 46 Perl PracticalExtractionandReportLanguage 语言 Perl最初只是Unix系统管理员的一个工具 在工作日里被用在无数的小任务中 从那以后 它逐步发展成为一种全功能的程序设计语言 特别是在各种计算平台上 它被用作Web编程 数据库处理 XML处理以及系统 Perl是一门自由且功能强大的编程语言 自1987年初次登台亮相以来 它的用户数一直急剧膨胀 从最初被当作一种在跨平台环境中书写可移植工具的高级语言开始 Perl就已经被广泛地认为是一种工业级的强大工具 可以在任何地方用来完成你的工作 Perl实际上已经被所有Unix 包括Linux 捆绑在一起作为标准部件发布 而且也被广泛用于MicrosoftWindows和几乎所有其他操作系统 47 生物信息学中Perl应用的例子 在一个报道大规模RNAi技术研究C elegans基因功能的网站资源中 file1 根据表型描述 找出和运动相关的基因名 在WormPep库 19 000个预测基因 file2 中 根据基因名 找出它们的表达蛋白质序列 将基因名和其对应的蛋白质序列按一定格式存为 file3 并投递给一个判断信号肽剪切的 SignalP 服务器 attheTechnicalUniversityofDenmark 希望得到这些蛋白质序列可能的剪切图 在word文档中手工操作 运用Perl 48 49 Bioperl Bioperl是一组Perl模块 它主要目的在于利用Perl解决生物学研究中的一些问题 主要是生物信息学中的各种实际问题 如获取分子生物学数据 分析序列文件 序列间比对 大批量BLAST 数据挖掘 等等 它并非直接提供可以使用的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论