生物信息学01-导论_第1页
生物信息学01-导论_第2页
生物信息学01-导论_第3页
生物信息学01-导论_第4页
生物信息学01-导论_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学Bioinformatics,先修课遗传学、分子生物学、细胞生物学等生命科学相关专业的本科生考研毕业论文工作生命科学相关专业的研究生课题研究发表文章,先修课及适用对象,32学时平时成绩(20%)论文总结/其他(80%),课程考核,了解、掌握和利用Internet上各种生物数据库、软件何处查找所需各种生物数据信息如何分析和解释所得数据信息,学习本课程的目的,理论课讲授内容,第一讲生物信息学导论第二讲生物信息数据库第三讲数据库检索第四讲DNA序列分析第五讲基因预测和基因结构分析第六讲蛋白质序列分析第七讲生物文献查找和下载第八讲常用生物软件的使用,第一讲生物信息学导论,生物信息学简介生物信息学的历史与发展趋势生物信息学的研究内容生物信息学当前的主要任务生物信息学的研究意义生物信息学所用的方法和技术生物信息学的相关文献,主要内容,什么是生物信息学?,一、生物信息学简介,生物信息学(Bioinformatics)这一名词的来由,八十年代末期,马来西亚的美籍学者林华安(HwaA.Lim)认识到将计算机科学与生物学结合起来的重要意义,开始留意要为这一领域构思一个合适的名称。起初,考虑到与将要支持他主办一系列生物信息学会议的佛罗里达州立大学超型计算机计算研究所的关系,他使用的是“CompBio”;之后,又将其更改为“bioinformatique”,但是看起来仍有些古怪。因此不久,他便进一步把它更改为“bio-informatics(或bio/informatics)”。但由于当时的电子邮件系统与今日不同,名称中的-或/符号经常会引起许多问题,林博士于是将其去除,“bioinformatics”就正式诞生了,林博士也因此赢得了“生物信息学之父”的美誉。,Dr.HwaA.Lim,Whatisbioinformatics?fromfttp://wiki/Bioinformatics,Bioinformaticsandcomputationalbiologyinvolvetheuseoftechniquesincludingappliedmathematics,informatics,statistics,computerscience,artificialintelligence,chemistry,andbiochemistrytosolvebiologicalproblemsusuallyonthemolecularlevel.Researchincomputationalbiologyoftenoverlapswithsystemsbiology.Majorresearcheffortsinthefieldincludesequencealignment,genefinding,genomeassembly,proteinstructurealignment,proteinstructureprediction,predictionofgeneexpressionandprotein-proteininteractions,andthemodelingofevolution.,生物信息学,说文解字:生物+信息+学(bioinformatics)biology+information+theory广义:应用信息科学的方法和技术,研究生物体系和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。狭义:应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。,广义概念图示,狭义概念图示,生物信息学的生物学基础生物信息学的历史生物信息学的发展趋势,二、生物信息学的生物学基础、历史与发展趋势,分子水平细胞个体生命环境,(一)生物信息学的生物学基础,生命活动的基本单位是什么?,生命活动的执行者是什么?,蛋白质结构与功能的关系,一级结构氨基酸顺序,高级结构,生物学功能,蛋白质一级结构是高级结构的基础蛋白质的高级结构决定其功能,核酸,DNA结构,RNA和核糖体,RNA是单链分子,RNA主要有三种:信使RNA(mRNA)-转录遗传信息核糖体RNA(rRNA)-蛋白质合成转运RNA(tRNA)-转运氨基酸核糖体是蛋白质合成的场所,核糖体主要由蛋白质分子和rRNA组成,RNA和核糖体,反密码子,氨基酸,新生肽链,核糖体,mRNA,mRNA,tRNA,rRNA,tRNA,16SrRNA可识别mRNA起始位点,中心法则,基因(Gene):具有遗传效应的DNA分子片段原核生物真核生物,基因与基因组,原核生物,操纵子模型,结构基因,调节基因,操纵基因,操纵子,真核生物,基因组(Genome):一个细胞或者生物体所携带的全部遗传信息。,人类基因组:3.2109bp,人类基因数:30000个,思考题:基因组就是所有基因的集合?,从人类基因组计划(HGP)说起,(二)生物信息学的历史,60年代初,美国总统Kennedy提出两个科学计划:登月计划攻克肿瘤计划人类遗传信息的复杂性,人类基因组计划(HGP,HumanGenomeProject)目标:整体上破解人类遗传信息的奥秘,1990年人类基因组计划(HGP)启动;2000年完成了基因组草图;2004年绘制出341个空隙、覆盖基因组99%、碱基错误率十万分之一的完整基因图;耗时10余年、花费约30亿美元、6个国家的16所实验室的约1100多名生物学家和计算机专家参与。,HGP的历史回顾,HGP完成后,我们将进入“后基因组学”(post-genomics)时代;基因组学研究重心已开始从揭示生命的所有遗传信息转移到在分子整体水平对功能的研究上,即功能基因组学(functionalgenomics)。功能基因组学的任务是:进行基因组功能注释(Genomeannotation)认识基因与疾病的关系掌握基因的产物及其在生命活动中的作用研究基因的表达调控机制,功能基因组学,Human,Arabidopsis,Thermotogamaritima,Escherichiacoli,Buchnerasp.APS,Rickettsiaprowazekii,Ureaplasmaurealyticum,Bacillussubtilis,Drosophilamelanogaster,Thermoplasmaacidophilum,Plasmodiumfalciparum,Helicobacterpylori,mouse,Caenorhabitiselegans,rat,Borreliaburgorferi,Borreliaburgorferi,Aquifexaeolicus,NeisseriameningitidisZ2491,Mycobacteriumtuberculosis,小麦、西瓜、牡蛎、梨、棉花、白菜、木薯、花生、柑橘、甜橙、蓖麻、油菜,大规模基因组测序带来的科学挑战,随着实验数据和可利用信息急剧增加,信息的管理和分析成为一项非常重要的工作,发现生物学规律,解读生物遗传密码,认识生命的本质,研究基因组数据之间的关系,分析现有的基因组数据,利用数学模型和计算技术,1、信息的整合2、信息的储存3、信息的比较4、信息的分析5、信息的分解,基因组学,功能基因组学,这些过程都需要生物信息学的帮助!,大规模基因组测序带来的科学挑战,尽管最近十年来,高通量检测技术与信息技术的结合让人们认识了大量的基因和蛋白质,但是和物理学、化学相比较,生物学仍旧是一门不成熟的学科,因为对于生命过程,我们无法根据一般性原理做出像卫星轨道那样精确的预测。随着数据的不断膨胀和知识的积累,借助于生物信息学,这种情形很有可能发生改变。生物信息学最终目标:从大规模数据中抽象出知识与原理;提出细胞以至整个生物体的完整数学与计算机表示;进而预测高度复杂的生物系统的基本原理,例如,预测在细胞过程中相互作用网络和整个生物体的表型。,(三)生物信息学的发展趋势,生物信息学的过去、现在和将来,三、生物信息学的研究内容,1、生物分子数据的收集与管理2、数据库搜索及序列比较3、基因组序列分析4、基因表达数据的分析与处理5、蛋白质结构预测,生物分子信息的特征,生物分子信息数据量大生物分子信息复杂生物分子信息之间存在着密切的联系,1、生物分子数据的收集与管理,生物分子信息,DNA序列数据,蛋白质序列数据,生物分子结构数据,生物分子功能数据,最基本,直观,复杂,生物分子数据类型,基因组数据库,蛋白质序列数据库,蛋白质结构数据库,DDBJ,EMBL,GenBank,SWISS-PROT,PDB,PIR,数据库!搜索!,2、数据库搜索及序列比较,搜索同源序列在一定程度上就是通过序列比较寻找相似序列(Blast搜索工具)序列比较的一个基本操作就是比对(Alignment),即将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这是序列相似程度的一种定性描述多重序列比对研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。,数据库搜索及序列比较,3、基因组序列分析,遗传语言分析天书基因组结构分析基因识别基因功能注释基因调控信息分析基因组比较,4、基因表达数据的分析与处理,基因表达数据分析是目前生物信息学研究的热点和重点。目前对基因表达数据的处理主要是进行聚类分析。将表达模式相似的基因聚为一类,在此基础上寻找相关基因,分析基因的功能。,5、蛋白质结构预测,蛋白质的生物功能由蛋白质的结构所决定,蛋白质结构预测成为了解蛋白质功能的重要途径。蛋白质结构预测分为:二级结构预测空间结构预测,蛋白质折叠,当前生物信息学界的大部分人都把注意力集中在基因组、转录组、蛋白质组、蛋白质结构等的研究上,随蛋白组学、代谢组学等进一步的发展,将在整体水平进行。,四、生物信息学当前的主要任务,基因组是一个细胞或者生物体所携带的全部遗传信息;转录组是一个细胞或组织内全部转录产物的集合;蛋白质组是一个细胞或组织内所有类型蛋白质的集合;代谢组是生物体内源性代谢物质的集合。以此类推,我们还可以定义其它的“组”,例如蛋白质相互作用组就是一个细胞或组织内蛋白质间所有相互作用的集合。,几个概念,MochidaK,ShinozakiK.PlantCellPhysiol2011;52:2017-2038.,生物信息学将是21世纪生物学的核心,认识生物本质了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系改变生物学的研究方式改变传统研究方式,引进现代信息学方法在医学上的重要意义为疾病的诊断和治疗提供依据为设计新药提供依据,五、生物信息学的研究意义,生物信息学系统化概图,生物信息学不仅仅是一门科学学科,它更是一种重要的研究开发工具。从科学的角度来讲,它是一门研究生物和生物相关系统中信息内容物和信息流向的综合系统科学,只有通过生物信息学的计算处理,我们才能从众多分散的生物学观测数据中获得对生命运行机制的详细和系统的理解。从工具的角度来讲,它是今后几乎进行所有生物(医药)研究开发所必需的舵手和动力机,只有基于生物信息学通过对大量已有数据资料的分析处理所提供的理论指导和分析,我们才能选择正确的研发方向,同样,只有选择正确的生物信息学分析方法和手段,我们才能正确处理和评价新的观测数据并得到准确的结论。,病人健康人,基因芯片诊断,及早治疗,对症下药,此外,生物信息学和人类基因组计划为药物靶标的发现和新药的研制开创了新天地,未来的药物设计将是基于生物信息学的知识挖掘的过程。,通过数据分析首先确立靶标分子,预测蛋白质分子结构,设计药物分子与靶标分子相互作用,1、数学统计方法(高维、样本量的问题)2、动态规划方法3、机器学习与模式识别技术(从数据中学习)4、数据库技术及数据挖掘5、人工神经网络技术6、专家系统7、分子模型化技术8、量子力学和分子力学计算9、生物分子的计算机模拟,六、生物信息学所用的方法和技术,科学前沿问题生命过程的定量研究和系统整合主要研究方向:基因及其调控功能基因组学模式生物学表观遗传学及非编码核糖核酸生命体结构功能及其调控网络生命体重构生物信息学计算生物学系统生物学极端环境中的生命特征生命起源和演化系统发育与进化生物学等。,时刻铭记实验永远起着决定作用计算/理论生物学的发展离不开实验生物学的贡献实验生物学日益依赖计算/理论生物学的指导重视基础研究,原创!,21世纪生命科学,理论,计算,实验,数学与物理科学,计算生物学/理论生物学与传统生物学的关系,生物信息的相关文献,BioinformaticsandComputationalBiology-RelatedJournals,BioinformaticsBulletinofMathematicalBiologyComputersandBiomedicalResearchGenomeResearchGenomicsJournalofComputationalBiologyJournalofMolecularBiologyNatureScience,BMCBioinformaticsBMCGenomicsBriefingsinBioinformaticsBMCSystemsBiologyNucleicAcidsResearchPLoSComputationalBiologyOMICS:AJournalofIntegrativeBiologyMolecularbiologyandEvolution,参考教材,DavidW.Mount.Bioinformatics:SequenceandGenomeAnalysis.(2ndedition)NewYork:ColdSpringHarborLaboratoryPress,2004.,钟扬等译,生物信息学(第一版),高等教育出版社,2003。,周艳红、王石平,生物信息学,高等教育出版社,2007。,A.D.BoxevanisandB.F.F.Ouellette.Bioinformatics:APracticalGuidetotheAnalysisofGenesandProteins.(3rdedition)NewYork:Wile-Interscience,2004.,BioinformaticsandComputationalBiology-RelatedBooks,CalculatingtheSecretsofLife:ApplicationsoftheMathematicalSciencesinMolecularBiology,byEricS.LanderandMichaelS.Waterman(1995)IntroductiontoComputationalBiology:Maps,Sequences,andGenomes,byMichaelS.Waterman(1995)IntroductiontoComputational

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论