版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物信息学Bioinformatics生物科学与技术学院1/56初步计划讲授内容第一章概论(2)第二章生物学基础(略)第三章生物信息数据库及其信息检索(4-6)第四章序列比对与算法(6)第五章核酸序列分析(6)第六章蛋白质结构预测和分子设计(4-6)第七章基因组信息学(4)第八章蛋白质组信息学(4)第九章生物信息学前沿(自学)2/56参考书籍1、《生物信息学教程》蔡禄.化学工业出版社,2、《生物信息学》(第二版)张阳德主编.科学出版社,3、《生物信息学》陶士珩主编.科学出版社,4、《生物信息学应用技术》王禄山,高培基.化学工业出版社,5、《生物信息学与功效基因组学》(美)乔纳森•佩夫斯纳著;孙之荣译.化学工业出版社,3/56网上资源1、华中农业大学国家精品课程生物信息学网站(/kech/swxxx/index.htm)2、西南交通大学生物信息学精品课程网站(/C54/Course/Index.htm)3、东南大学生物信息学网络学习平台(/chenyuan/xsun/courses_on_net.htm)4、美国国立生物技术信息中心()期刊《生物信息学》、《Bioinformatics》、《BMCBioinformatics》4/56生物信息学概述
5/56什么是生物信息学:生物信息学(Bioinformatics):是硕士物信息采集,处理,存放,传输,分析和解释等各方面学科。是伴随生命科学和计算机科学迅猛发展而快速突起一门学科。是生命科学、生物统计学、当代数学、信息科学和计算机科学结合学科,可揭示大量而复杂生物数据所蕴藏生物学奥秘。6/56生物信息学?--新兴交叉学科MathematicalsciencesComputersciencesLifesciences生物学背景?★★★
分子生物学/基因工程数学?★
统计学,模型,算法计算机科学背景?
★
Linux/Perl/PHP/JAVA/C++/VisualBasic7/56生物信息学学习人员:1)学习生物信息学是为了发展生物信息学
——计算机科学家2)学习生物信息学是为了应用生物信息学
——生物学家我们属于……8/56BioinformaticsintheUniverseUniverse(宇宙=空间+时间)HumancivilizationsciencesartsreligionsNaturalsciencesSocialsciencesbiologymathematicsphysicsbiostatisticsbioinformaticsComputationalbiologyNon-humanworld9/56生物信息学主要研究两种信息载体一级结构二级结构三级结构1、DNA分子2、蛋白质分子生物分子一级结构二级结构三级结构四级结构10/5611/56DNA前体RNAmRNA多肽链基因DNA序列蛋白质序列对应关系遗传密码12/56(1)遗传信息载体——DNADNA经过自我复制,在生物体繁衍过程中传递遗传信息;DNARNA转录翻译蛋白质基因经过转录和翻译,使遗传信息在生物个体中得以表示,并使后代表现出与亲代相同生物性状。复制(2)蛋白质结构决定其功效蛋白质功效取决于蛋白质空间结构蛋白质结构决定于蛋白质序列(这是当前基本公认假设),蛋白质结构信息隐含在蛋白质序列之中。三个主要信息13/56(3)DNA分子和蛋白质分子都含有进化信息经过比较相同蛋白质核苷酸序列,如肌红蛋白和血红蛋白,能够发觉因为基因复制而产生分子进化证据。经过比较来自于不一样种属同源蛋白质,即直系同源蛋白质,能够分析蛋白质甚至种属之间系统发生关系,推测它们共同祖先蛋白质。总结:生物分子最少携带着三种信息遗传信息与功效相关结构信息进化信息14/56
DNA核酸序列蛋白质氨基酸序列蛋白质结构蛋白质功效最基本生物信息维持生命活动机器第一部遗传密码第二部遗传密码生命体系千姿百态改变生物分子数据及其关系蛋白质结构决定功效15/56第一部遗传密码已被破译,但对密码转录过程还不清楚,对大多数DNA非编码区域功效还知之甚少对于第二部密码,当前则只能用统计学方法进行分析不论是第一部遗传密码,还是第二部遗传密码,都隐藏在大量生物分子数据之中。生物分子数据是宝藏,生物信息数据库是金矿,等候我们去挖掘和利用。16/56生物分子信息DNA序列数据蛋白质序列数据生物分子结构数据生物分子功效数据最基本直观展示生命体系千姿百态改变复杂剖析生物信息学包括生物分子数据库17/56生物分子数据计算机计算+特征:生物分子信息数据量大生物分子信息复杂生物分子信息之间存在着亲密联络特征:信息存放量大计算性能高速、有效信息交流方便生物分子数据与计算机计算18/56生物信息学发展历史生物信息学基本思想产生生物信息学快速发展二十世纪50年代二十世纪80-90年代生物科学和技术发展人类基因组计划推进19/5620世纪50年代,生物信息学开始孕育20世纪60年代,生物分子信息在概念上将计算生物学和计算机科学联络起来,是生物信息学形成雏形阶段
1962Zucherkandl和Pauling提出分子进化理论
1967Dayhoff研制出蛋白质序列图集,后演变为著名蛋白质信息源PIR20世纪70年代,核酸测序技术成熟,开始了少许基因组测序工作,标志着生物信息学真正开端(1)前基因组时代(20世纪90年代前)20/5620世纪70年代到80年代早期,出现了一系列著名序列比较方法和生物信息分析方法1970Needleman-Wunsch提出序列比对算法1970Gibbs和McIntyre发表矩阵打点作图法1972Gatlin将信息论引入序列分析,证实自然生物分子序列是高度非随机1977出现将DNA序列翻译成蛋白质序列算法。1975Pipas和McMahon首先提出利用计算机技术预测RNA二级结构1978Gingeras等研制出核酸序列中限制性酶切位点识别软件1981Smith-Waterman算法出现1981Doolittle提出序列模式概念 1983Wilbur和Lipman提出序列数据库搜索算法1985快速蛋白质序列相同性搜索程序FASTP/FASTN公布1988Pearson和Lipman发表著名序列比较算法FASTA
21/5620世纪80年代以后,出现一批生物信息服务机构和生物信息数据库1982GenBank数据库(Release3)公开1986日本核酸序列数据库DDBJ诞生1986出现蛋白质数据库SWISS-PROT1988美国国家生物技术信息中心NCBI创建1988成立欧洲分子生物学网络(EMBnet),专门公布各种生物数据库22/5620世纪90年代后,HGP促进生物信息学快速发展,标志工作是人类基因组测序,基因寻找和识别等。1986“基因组学”概念产生,研究基因组作图、测序和分析1990国际人类基因组计划开启1993成立Sanger中心,专门从事基因组研究1995第一个细菌基因组测序完成1996酶母基因组测序完成1998第一个多细胞生物——线虫基因组测序1999果蝇基因组测序完成人类基因组测序基本完成人类基因组初步分析结果公布(2)基因组时代(20世纪90年代后至21世纪初)Saccharomycescerevisiae酿酒酵母(1996-1997)Caenorhabditiselegans秀丽线虫(1998)23/56冲击24/56我国对人类基因组计划贡献NoCenterRegionSize(Mb)6/1-8/31/99ProjectedKr4/1-11/30/99ProjAccum.Mr.4/99-3/00ActualKGenbankKr1SangerCentre1,6,9,10,13,20,22,X85013009414200>122WIBR(ClonesfromWashU)837296290083WashU2,3,4,7,11,15,18,Y90086555923007.94JGI5,16,1925068746121006.45Baylor1,2,3,X2304622616603.16Riken21,18,11q1601361955202.17IMB8,21,X50180321801.58GenoscopeMostof14851001183001.49U.Wash(Olson)10Beijing3p3012.512.5>1000.511GTC(Smith)105051500.4512MPIMG17,21,X6.94012400.313GBF21,regof96500.314Stanford(Davis)8231370.2915Keio2,6,8,22,213011751100.2316U.Wash(HoodLAB)1417Total2671Mb4663Kr2950Kr13687Kr32.64Mr25/56人类基因组计划给生物信息学提出挑战伴随试验数据和可利用信息急剧增加,信息管理和分析成为HGP一项主要工作发觉生物学规律,解读生物遗传密码认识生命本质研究基因组数据之间关系分析现有基因组数据利用数学模型和人工智能技术26/5627/56(3)后基因组时代(21世纪后至今)21世纪后,发展重点逐步转移到功效基因组学研究领域,主要标志技术是进行高通量基因组分析(megabace、3700、454测序技术)、蛋白质组分析和各种数据比较整合等,出现了转录组、蛋白质组和代谢组等各种组学概念。megabace370028/56Sanger,UK29/56大规模测序基本策略逐一克隆法:小片段针对图谱!!全基因组鸟枪法:大片段-测序-组装(美国Celera企业)Contig:重合群,基因组测序中将许多序列片段经过比对找到重合区,从而连接成长片段。30/56ABCDEFGHIJKLCONTIGGAP31/56基因组比较32/56蛋白质结构
蛋白质序列蛋白质功效关系
核苷酸序列高通量测序技术注释、解析预测验证33/56基于生物信息学新药设计34/56基因组数据库蛋白质序列数据库蛋白质结构数据库DDBJEMBLGenBankSWISS-PROTPDBPIR(1)生物分子数据搜集与管理生物信息学主要研究内容EMBL欧洲分子生物学试验室,于1974年由欧洲14个国家加上亚洲以色列共同发起建立,包含一个位于德国Heidelberg关键试验室,三个位于德国Hamburg,法国Grenoble及英国Hinxton研究分部。GenBank是美国国家生物技术信息中心建立DNA序列数据库,从公共资源中获取序列数据,主要是科研人员直接提供或起源于大规模基因组测序计划。DDBJ日本DNA数据库,于1984年建立,是世界三大DNA数据库之一,与NCBIGenBank,EBIEMBL数据库共同组成国际DNA数据库。SWISS-PROT是经过注释蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。PIR全称TheProteinInformationResource,是一个集成了关于蛋白质功效预测数据公共资源数据库,其目标是支持基因组/蛋白质组研究。PIR与MIPS(theMunichInformationCenterforProteinSequences)、JIPID(theJapanInternationalProteinInformationDatabase)合作,共同组成了PIR-国际蛋白质序列数据库(PSD):一个主要已预测蛋白质数据库,包含250000个蛋白。蛋白质数据库PDB是由美国国家科学基金会、能源部生物和环境研究所、国家健康组织中两个单位:药品科学研究所和医药图书馆共同资助。它们设置这个机构共同目标是经过PDB尽可能广泛地传输其搜集信息。35/5636/5637/5638/5639/5640/5641/56经过数据库搜索能够找到目标基因相关信息经过序列比较寻找同源基因(2)数据库搜索及序列比较AAGCTTAACGTAATCTTA-CGT42/56(3)基因组序列分析基因组结构分析、基因识别、基因功效注释基因调控信息分析、基因组比较UTR内含子开启子基因之间序列……43/56基因相关信息44/56基因组结构分析45/56基因表示数据分析是当前生物信息学研究热点和重点。对基因表示数据处理主要是进行聚类分析,将表示模式相同基因聚为一类,在此基础上寻找相关基因,分析基因功效。(4)基因表示数据分析与处理46/56蛋白质生物功效由蛋白质结构所决定,蛋白质结构预测成为了解蛋白质功效主要路径。(5)蛋白质结构预测各种基序(motif)识别酸/碱性氨基酸位置和统计富含某种氨基酸特征亚细胞定位预测分子进化蛋白质互作等等…47/56生物结构组成蛋白质与蛋白质之间相互关系48/56(6)生物信息分析技术与方法研究改进和创造一些理论分析方法统计方法、模式识别方法、多序列比较方法等各种算法开发分析工具和实用软件序列比较工具
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年危险化学安全培训内容实操要点
- 2026年卷烟装车安全培训内容核心要点
- 2026年周末安全培训内容实操要点
- 2026年实操流程照片分类工作总结报告
- 大庆市肇州县2025-2026学年第二学期五年级语文第六单元测试卷(部编版含答案)
- 运城市平陆县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 延安市宜川县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 常德市鼎城区2025-2026学年第二学期五年级语文期中考试卷(部编版含答案)
- 怀化市新晃侗族自治县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 秦皇岛市卢龙县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 白酒贴牌合作合同协议
- IATF16949全套乌龟图-带风险分析
- 2025年仪器仪表维修工(高级)职业技能鉴定参考试指导题库(含答案)
- 苗族银饰课件
- 儿童保健工作规范和八大技术规范标准
- 2025年贵州开磷控股集团有限公司招聘笔试参考题库含答案解析
- 《更年期的中医调理》课件
- 2024年江苏省常州市中考英语真题卷及答案解析
- 氦氖激光物理治疗
- 《工业机器人工作站应用实训》项目三工业机器人涂胶工作站的应用实训课件
- 变电场景一体化通信技术方案
评论
0/150
提交评论