




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物信息学概述第一页,共五十九页,2022年,8月28日一.生物信息蛋白质结构与功能细胞染色体核酸第二页,共五十九页,2022年,8月28日生物分子信息生物分子至少携带着三种信息遗传信息与功能相关的结构信息进化信息生物分子信息的特征生物分子信息数据量大生物分子信息复杂生物分子信息之间存在着密切的联系第三页,共五十九页,2022年,8月28日遗传信息的载体——DNA
遗传信息的载体主要是DNA
控制生物体性状的基因是一系列DNA片段生物体生长发育的本质就是遗传信息的传递和表达DNA通过自我复制,在生物体的繁衍过程中传递遗传信息基因通过转录和翻译,使遗传信息在生物个体中得以表达,并使后代表现出与亲代相似的生物性状2023/2/154蛋白质RNA转录DNA翻译第四页,共五十九页,2022年,8月28日DNA前体RNAmRNA多肽链2023/2/15第五页,共五十九页,2022年,8月28日生命机器的执行者--蛋白质蛋白质功能取决于蛋白质的空间结构
蛋白质结构决定于蛋白质的序列(这是目前基本共认的假设),蛋白质结构的信息隐含在蛋白质序列之中。2023/2/15第六页,共五十九页,2022年,8月28日DNA分子和蛋白质分子都含有进化信息通过比较相似的蛋白质序列,如肌红蛋白和血红蛋白,可以发现由于基因复制而产生的分子进化证据。通过比较来自于不同种属的同源蛋白质,即直系同源蛋白质,可以分析蛋白质甚至种属之间的系统发生关系,推测它们共同的祖先蛋白质。2023/2/157第七页,共五十九页,2022年,8月28日生物分子信息DNA序列数据
蛋白质序列数据
生物分子结构数据
生物分子功能数据
最基本直观复杂生物信息数据类型2023/2/15第八页,共五十九页,2022年,8月28日
DNA核酸序列蛋白质氨基酸序列蛋白质结构蛋白质功能最基本的生物信息维持生命活动的机器第一部遗传密码第二部遗传密码?生命体系千姿百态的变化生物分子数据及其关系2023/2/159第九页,共五十九页,2022年,8月28日第一部遗传密码已被破译,但对密码的转录过程还不清楚,对大多数DNA非编码区域的功能还知之甚少对于第二部密码,目前则只能用统计学的方法进行分析。破译“第二遗传密码”:即折叠密码(foldingcode),从蛋白质的一级结构得到立体结构,即可直接从基因推测其编码蛋白质所对应的生物学功能。破解折叠密码被列为“21世纪的生物学”的重要课题。生物分子数据是宝藏,生物信息数据库是金矿,等待我们去挖掘和利用2023/2/15第十页,共五十九页,2022年,8月28日Bioinformatics,生物
+信息
+学--新兴的交叉学科ComputersciencesMathematicalsciencesLifesciences二、生物信息学的概念第十一页,共五十九页,2022年,8月28日定义一:生物信息学是一门收集、分析遗传数据以及分发给研究机构的新学科(1987)定义二:生物信息学特指数据库类的工作,包括持久稳固的在一个稳定的地方提供对数据的支持(1994)定义三:采用信息科学技术,对各种生物信息(包括核酸、蛋白质等)的收集、加工、储存、分析、解释的一门学科。收集、加工、储存:计算机科学家分析、解释:生物学家第十二页,共五十九页,2022年,8月28日三、生物信息学发展简史(一)前基因组时代的生物信息学
起源于20世纪70-80年代。这一阶段的主要成就包括核酸和蛋白质序列的初步分析、生物学数据库的建立以及检索工具的开发。例如Dayhoff的替换矩阵、Neelleman和Wunsch的序列比对及GenBank(由美国国立生物技术信息中心建立和维护的核酸与蛋白质序列数据库)等大型数据库的建立,形成了生物信息学的雏形。第十三页,共五十九页,2022年,8月28日1967:Dayhoff研制出蛋白质序列图集,即后来著名的蛋白质信息源PIR;1970:Needleman和Wunsch提出了著名的序列比对算法,是生物信息学发展中最重要的贡献;1978:Gingeras等人研制了核酸序列中酶切位点识别程序;1981:Doolittle提出了关于序列模式的概念;1986:日本核酸序列数据库DDBJ诞生;1986:蛋白质数据库SWISS-PROT诞生;1988:美国国家生物技术信息中心NCBI诞生;1988:成立欧洲分子生物学网络(EMBNet),EMBL数据库诞生第十四页,共五十九页,2022年,8月28日(二)基因组时代的生物信息学以基因组计划的实施为标志的基因组时代(1990年至2001年)是生物信息学成为一个较完整的新兴学科并得到高速发展的时期。这一时期生物信息学确立了自身的研究领域和学科特征,成为生命科学的热点学科和重要前沿领域之一。这一阶段的主要成就包括大分子序列以及表达序列标签(expressedsequencetag,EST)数据库的高速发展、BLAST(basiclocalalignmentsearchtool)和FASTA(fastalignment)等工具软件的研制和相应新算法的提出、基因的寻找与识别、电子克隆(insilicocloning)技术等,大大提高了管理和利用海量数据的能力。第十五页,共五十九页,2022年,8月28日人类基因组计划开始(HumanGenomeProject,HGP)人类基因组计划带来了
生物信息学20世纪90年代第十六页,共五十九页,2022年,8月28日人类基因组计划(HGP,HumanGenomeProject)目标:整体上破解人类遗传信息的奥秘由美国NIH和能源部提出和带头,美、英、德、法、日、中共同参与的国际合作项目。完成人全部24(22+X+Y)条染色体中3.2×109个碱基对的序列测定,主要任务包括做图(遗传图谱、物理图谱以及转录图谱的绘制)、测序和基因识别,其根本任务是解读和破译生物体的生老病死以及与疾病相关的遗传信息。第十七页,共五十九页,2022年,8月28日基因组(Genome):包含细胞或生物体全套的遗传信息的全部遗传物质
包括:细胞核基因组DNA细胞质(线粒体、叶绿体)基因组DNA
人类基因组:3.2×109bp18第十八页,共五十九页,2022年,8月28日第十九页,共五十九页,2022年,8月28日曼哈顿原子弹计划阿波罗登月计划人类基因组计划人类自然科学史上的3大计划第二十页,共五十九页,2022年,8月28日AttheWhiteHouseonJune26,FrancisCollins(r),DirectoroftheNationalHumanGenomeResearchInstitute,PresidentClinton,andJ.CraigVenter,PresidentofCelaraGenomics,laudedthethousandsofscientistswhocontributedtothegenomesequence.21第二十一页,共五十九页,2022年,8月28日2001年2月15日《Nature》封面2001年2月16日《Science》封面22第二十二页,共五十九页,2022年,8月28日我国对人类基因组计划的贡献第二十三页,共五十九页,2022年,8月28日24第二十四页,共五十九页,2022年,8月28日第二十五页,共五十九页,2022年,8月28日humanArabidopsis拟南芥ThermotogamaritimaEscherichiacoli大肠杆菌Buchnerasp.APSRickettsiaprowazekiiUreaplasmaurealyticumBacillussubtilisDrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparumHelicobacterpylorimouseCaenorhabitiselegansratBorreliaburgorferiBorreliaburgorferiAquifexaeolicusNeisseriameningitidisZ2491Mycobacteriumtuberculosis第二十六页,共五十九页,2022年,8月28日第二十七页,共五十九页,2022年,8月28日数据库中的蛋白质序列Swiss-prot:≈550,000条蛋白质序列第二十八页,共五十九页,2022年,8月28日29结构与功能信号网络代谢途径细胞重建系统重建基因组基因(三)后基因组时代的生物信息学第二十九页,共五十九页,2022年,8月28日四、生物信息学的研究领域基因组序列装配基因识别基因功能预报基因多态性分析基因进化mRNA结构预测基因芯片设计基因芯片数据分析疾病相关基因分析蛋白质序列分析蛋白质家族分类蛋白质结构预测蛋白质折叠研究代谢途径分析转录调控机制蛋白质芯片设计蛋白质芯片数据分析药物设计第三十页,共五十九页,2022年,8月28日大规模核酸测序及拼接基因识别与定位基因相关的SNP研究非编码区信息结构分析比较基因组学
(一)核酸及基因组信息第三十一页,共五十九页,2022年,8月28日大规模基因组测序第三十二页,共五十九页,2022年,8月28日33第三十三页,共五十九页,2022年,8月28日运用计算机软件进行序列拼接第三十四页,共五十九页,2022年,8月28日基因识别与定位
第三十五页,共五十九页,2022年,8月28日基因相关的SNP研究:
单核苷酸多态性(SingleNucleotidePolymorphisms,SNP):主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。第三十六页,共五十九页,2022年,8月28日SNP的研究意义寻找疾病相关的突变位点法医学研究器官移植中供体/受体配对分析
37第三十七页,共五十九页,2022年,8月28日
全基因组关联分析(Genome-wideassociationstudy,GWAS):是指在人类全基因组范围内找出存在的序列变异,即单核苷酸多态性(SNP),从中筛选出与疾病相关的SNPs
第三十八页,共五十九页,2022年,8月28日非编码区信息结构分析:基因表达调控分析在微生物中,非编码区只占整个基因组序列的10%-20%;但在高等生物和人类基因组中,非编码序列则占了基因组序列的绝大部分。在人的基因组中,非编码序列超过95%。非编码区有调控作用的核苷酸序列,包括位于编码区上游的RNA聚合酶结合位点。第三十九页,共五十九页,2022年,8月28日比较基因组学(ComparativeGenomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科第四十页,共五十九页,2022年,8月28日(二)蛋白质及蛋白质组信息蛋白质结构预测蛋白质功能预测基因表达及蛋白质组信息学第四十一页,共五十九页,2022年,8月28日蛋白质三维结构测定主要方法:X射线晶体结构分析、多维核磁共振(NMR)波谱分析和电子显微镜二维晶体三维重构(电子晶体学,EC)等物理方法Difficult!Expensive!TooMuchTime!蛋白质结构及功能预测第四十二页,共五十九页,2022年,8月28日第四十三页,共五十九页,2022年,8月28日蛋白质组研究
蛋白质组(proteome):即包括一种细胞乃至一种生物所表达的全部蛋白质。蛋白质组本质上指的是在大规模水平上研究蛋白质的特征,包括蛋白质的表达水平,翻译后的修饰,蛋白与蛋白相互作用等,由此获得蛋白质水平上的关于疾病发生,细胞代谢等过程的整体而全面的认识。
第四十四页,共五十九页,2022年,8月28日基因组数据库蛋白质序列数据库蛋白质结构数据库DDBJEMBLGenBankSWISS-PROTPDBPIR(三)生物分子数据的收集与管理2023/2/15第四十五页,共五十九页,2022年,8月28日(四)数据库搜索及序列比较
搜索同源序列在一定程度上就是通过序列比较寻找相似序列序列比较的一个基本操作就是比对(Alignment),即将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这是序列相似程度的一种定性描述多重序列比对研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。
2023/2/1546第四十六页,共五十九页,2022年,8月28日发现同源分子2023/2/1547第四十七页,共五十九页,2022年,8月28日48生物信息学和人类基因组计划为药物靶标的发现和新药的研制开创了新天地,未来的药物设计将是基于生物信息学的知识挖掘的过程通过数据分析首先确立靶标分子预测蛋白质分子结构设计药物分子与靶标分子相互作用(五)
在药学领域应用第四十八页,共五十九页,2022年,8月28日
所谓基因组药物(Genomicdrug)是指利用基因序列数据,经生物信息学分析、高通量基因表达、高通量功能筛选和体内外药效研究开发得到的新药候选物.
基于机理的药物发现:基因组药物实际上利用了反向生物学的原理.沿着从基因序列一蛋白质一功能一药物的途径研制新药,其优势是取自庞大的人类基因资源及其编码蛋白质做为原材料,具有巨大的开发潜力。基因组药物第四十九页,共五十九页,2022年,8月28日人类基因组约有10万左右的基因.编码10万以上的蛋白质,其中至少5%即5000以上的基因编码蛋白质可能具有药物开发前景。大量基因特别是疾病相关基因申请专利,如肥胖。第五十页,共五十九页,2022年,8月28日
理想的抗生素靶标应为微生物细胞存活所必须,在病原体中高度保守,且在人体中不存在或与人类基因有根本差异第五十一页,共五十九页,2022年,8月28日诊断类药物设计:生物芯片设计
遗传病:基因诊断(腺苷脱胺酶基因突变可引起重症联合免疫缺陷症(SCID);而淋巴细胞表面分子CD40或其配体(CD40L)基因突变则可引起无丙种球蛋白血症)
感染性疾病
癌症?
第五十二页,共五十九页,2022年,8月28日
预防类药物设计:
计算机辅助疫苗设计计算机预测抗原表位第五十三页,共五十九页,2022年,8月28日第五十四页,共五十九页,2022年,8月28日计算机辅助药物设计(Computer-AidedDrugDesign,CADD)是近年来发展起来的研究与开发新药的一种崭新技术,以数学、药物化学、生物化学、分子生物学、分子药理学、结构化学、结构生物学、细胞生物学等学科为基础,以量子化学、分子力学和分子动力学等为理论依据,借助计算机数值计算和逻辑判断、数据库、图形学、人工智能等处理技术,进行合理的药物设计。第五十五页,共五十九页,2022年,8月28日数据库、文献、合成小分子的三
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年家政服务员执业能力水平考核试题及答案解析
- 2025年香道师面试问题解析大全
- 2025年计算机科学试题及答案解析
- 2025年护理学专业资格考试试题及答案解析
- 2025年汉语教师职业技能考试试题及答案解析
- 2025年国际贸易法务专家资格考试试题及答案解析
- 2025年导盲犬训练师面试高频题
- 课件中任务卡模板制作步骤
- 课件中video的缩写形式
- 2025年小美容院美容安全考核题及答案
- 第四节道亨slw2d架空送电线路评断面处理及定位设计系统部分操作说明
- 测振仪使用方法
- 2023-2024学年湖南省耒阳市小学语文六年级下册期末自测测试题
- 12YJ4-1 常用门窗标准图集
- 表- 邻二氯苯的理化性质和危险特性表
- 工程项目全过程造价管理课件PPT超详细
- 成人手术后疼痛处理专家共识
- 读书分享-《教育的情调》
- 《材料力学》说课-课件
- 物资采购付款报销单
- 政务云收费标准 云托管收费标准
评论
0/150
提交评论