生物信息学概述_第1页
生物信息学概述_第2页
生物信息学概述_第3页
生物信息学概述_第4页
生物信息学概述_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,第一章生物信息学概述,郑珩副教授中国药科大学生物信息学教研室zhengh1813951647416,.,什么是生物信息学?(What)为什么要学习生物信息学?(Why)怎样学好这门课程?(How)通过本课程学习,要达到什么要求,.,1.什么是生物信息学,信息是用符号、信号或消息所包含的内容,来直接或间接描述客观世界,.,生物信息,分子:,细胞,核酸,蛋白质,多糖,.,DNA-遗传密码的携带者,.,引自NeilCampbell著Biology第4版,1996,.,从基因组序列信息到基因功能,染色体,基因,蛋白质,功能,.,8,采用信息科学技术,借助数学、生物学的理论、方法,对各种生物信息(包括核酸、蛋白质等)的收集、加工、储存、分析、解释的一门学科。收集、加工、储存:计算机科学家分析、解释:生物学家,生物信息学,Whatisbioinformatics?,.,9,生物信息学:研究对象:生物学(核酸蛋白质)研究内容:数学模型;生物学范畴研究工具:计算机科学(程序)研究人员:计算机科学家生物学家,.,10,生物信息学新兴的交叉学科,Mathematicalsciences,Computersciences,Lifesciences,.,2.Why?,AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGT,ACGT,.,hisnationundergodshallhaveanewbirthoffreedooooooooomandthatgovernmentofthepeoplebythepeopleandforthepeoooooooooooooooopleshallnotperishfromtheear,.,hisnationundergodshallhaveanewbirthoffreedooooooooomandthatgovernmentofthepeoplebythepeopleandforthepeoooooooooooooooopleshallnotperishfromtheearthatthisNation,underGOD,shallhaveanewbirthoffreedom;andthatgovernmentofthePeople,bythePeopleandforthePeopleshallnotperishfromtheearth,.,AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGT,ACGT,.,15,人类基因组计划开始(HumanGenomeProject,HGP)人类基因组计划带来了生物信息学。,第一节生物信息学发展简史,.,16,曼哈顿原子弹计划,阿波罗登月计划,人类基因组计划,人类自然科学史上的3大计划,.,17,基因组(Genome):包含细胞或生物体全套的遗传信息的全部遗传物质。细胞核基因组DNA细胞质(线粒体、叶绿体)基因组DNA,人类基因组:3.2109bp,.,18,人类基因组计划准备用15年时间投入30亿美元,完成人全部24(22+X+Y)条染色体中3.2109个碱基对的序列测定,主要任务包括做图(遗传图谱物理图谱以及转录图谱的绘制)、测序和基因识别,其根本任务是解读和破译生物体的生老病死以及与疾病相关的遗传信息。,.,19,HGP的历史回顾,1984.12犹他州阿尔塔组织会议,初步研讨测定人类整个基因组DNA序列的意义1985Dulbecco在Science撰文“肿瘤研究的转折点:人类基因组的测序”美国能源部(DOE)提出“人类基因组计划”草案1987美国能源部和国家卫生研究院(NIH)联合为“人类基因组计划”下拨启动经费约550万美元1989美国成立“国家人类基因组研究中心”,Watson担任第一任主任1990.10经美国国会批准,人类基因组计划正式启动1998.5塞莱拉遗传公司成立,宣布3年内完成HGP,JamesWatson,.,20,2000Celera公司宣布完成果蝇基因组测序国际公共领域宣布完成第一个植物基因组拟南芥全基因组的测序工作2001.2.15Nature刊文发表国际公共领域结果2001.2.16Science刊文发表Celera公司及其合作者结果,Drosophilamelanogaster果蝇,Arabidopsisthaliana拟南芥,.,21,AttheWhiteHouseonJune26,FrancisCollins(r),DirectoroftheNationalHumanGenomeResearchInstitute,PresidentClinton,andJ.CraigVenter,PresidentofCelaraGenomics,laudedthethousandsofscientistswhocontributedtothegenomesequence.公共领域和Celera公司同时宣布完成人类基因组工作草图,.,22,2001年2月15日Nature封面,2001年2月16日Science封面,.,23,我国对人类基因组计划的贡献,.,24,.,.,human,Arabidopsis拟南芥,Thermotogamaritima,Escherichiacoli大肠杆菌,Buchnerasp.APS,Rickettsiaprowazekii,Ureaplasmaurealyticum,Bacillussubtilis,Drosophilamelanogaster,Thermoplasmaacidophilum,Plasmodiumfalciparum,Helicobacterpylori,mouse,Caenorhabitiselegans,rat,Borreliaburgorferi,Borreliaburgorferi,Aquifexaeolicus,NeisseriameningitidisZ2491,Mycobacteriumtuberculosis,.,.,1,0001,000,0001,000,000,0001,000,000,000,0001,000,000,000,000,0001,000,000,000,000,000,0001,000,000,000,000,000,000,0001,000,000,000,000,000,000,000,000,103Kilo106Mega109Giga1012Tera1015Peta1018Exa1021Zetta1024Yotta,100Tera-bytes(1014)/atypicalgenelab/yearAllthewordseverspokenbyhumanbeingsaccounttoabout5exa-bytes(51018)Soonusing1zetta-bytes(1021)and1yotta-bytes(1024)生物信息量至少是所有人类说过的话的200倍!,.,至2004年,国际数据库记录的核酸碱基数目已超过200亿!如果用传统的纸张来书写,以每个核苷酸作为一个字符,则需要印制2万本每本1000页每页1000字的书!另外,二维凝胶电泳技术、测序质谱技术以及生物芯片技术的高速发展和广泛应用,也使得大量的数据信息已经无法用传统的文献形式发表,而更多的需以数据库形式,通过文字、图象、超链接等多种方式来记录。,计算机工具的介入,.,30,生物分子信息的特征,生物分子信息数据量大生物分子信息复杂生物分子信息之间存在着密切的联系,.,31,生物信息学(Bioinformatics)这一名词的来由,八十年代末期,马来西亚的美籍学者林华安(HwaA.Lim)认识到将计算机科学与生物学结合起来的重要意义,开始留意要为这一领域构思一个合适的名称。起初,考虑到与将要支持他主办一系列生物信息学会议的佛罗里达州立大学超型计算机计算研究所的关系,他使用的是“CompBio”;之后,又将其更改为兼具法国风情的“bioinformatique”,看起来似乎有些古怪。因此不久,他便进一步把它更改为“bio-informatics(或bio/informatics)”。但由于当时的电子邮件系统与今日不同,名称中的-或/符号经常会引起许多问题,林博士于是将其去除,“bioinformatics”就正式诞生了,林博士也因此赢得了“生物信息学之父”的美誉。,.,32,Bioinformatics,.,第二节生物信息学的研究领域,基因组序列装配基因识别基因功能预报基因多态性分析基因进化mRNA结构预测基因芯片设计基因芯片数据分析疾病相关基因分析,蛋白质序列分析蛋白质家族分类蛋白质结构预测蛋白质折叠研究代谢途径分析转录调控机制蛋白质芯片设计蛋白质芯片数据分析药物设计,.,(一)、核酸及基因组信息1、大规模核酸测序及拼接2、基因识别与定位3、基因相关的SNP研究4、非编码区信息结构分析5、比较基因组学,一、生物学领域,.,35,1.大规模基因组测序,.,36,.,37,运用计算机软件进行序列拼接,.,2、基因识别与定位,.,3.基因相关的SNP研究,SingleNucleotidePolymorphisms(SNP),是指在基因组上单个核苷酸的变异,一般而言,SNP是指变异频率大于1%的单核苷酸变异,.,40,基因变异与疾病,.,4、非编码区信息结构分析,在微生物中,非编码区只占整个基因组序列的10%20;但在高等生物和人类基因组中,非编码序列则占了基因组序列的绝大部分。在人的基因组中,非编码序列超过95%,.,5、比较基因组学,比较基因组学(ComparativeGenomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。,.,(二)蛋白质及蛋白质组信息1、蛋白质结构模拟2、蛋白质功能预测3、基因表达及蛋白质组信息学,.,44,蛋白质三维结构测定主要方法:X射线晶体结构分析、多维核磁共振(NMR)波谱分析和电子显微镜二维晶体三维重构(电子晶体学,EC)等物理方法,Difficult!Expensive!TooMuchTime!,蛋白质结构及功能预测,.,蛋白质组研究,.,(三)、分子相互作用及代谢调控网络,对生物功能的分析表明基因和蛋白质很少单独起作用,它们倾向于成组地通过网状的交互作用而影响生物系统的功能,分子相互作用信息和单个分子的信息一样重要。,.,.,48,结构与功能,信号网络代谢途径,细胞重建,系统重建,基因组,基因,后基因组时代,单个基因的结构与功能基因家族代谢途径基因组,.,(四)、生物进化的研究,序列相似性比较,.,生物信息数据库数据库接口和检索工具的研制新的算法和软件1、多序列比较方法2、序列拼接与分析3、基因组大尺度作图和功能基因组分析方法4、蛋白质结构和功能预测5、生物大分子结构图形化显示6、细胞代谢过程模拟7、药物设计相关软件开发,二、在计算机领域,.,第三节在药学领域应用,一、初始阶段:信息收集初步调研确定合适的药物作用靶可行性分析:靶点结构、化合物信息,.,1、诊断类药物:生物芯片设计遗传病:基因诊断感染性疾病:抗体、基因芯片、PCR技术,二、药物设计:,.,53,病人健康人,基因芯片诊断,及早治疗,对症下药,.,2、预防类药物:计算机辅助疫苗设计计算机预测抗原表位,.,EPIMMUNEIMGT/HLADatabasehttp:/www.ebi.ac.uk/imgt/hlaHLASequenceDatabase.uk/HIGEpiMatrix/Research/TB-HIV_Lab/epimatrix/epimatrix.htmlEPIPREDICThttp:/www.epipredict.de,.,http:/www.jenner.ac.uk/MHCPred/,MHCPred,.,所谓基因组药物(Genomicdrug)是指利用基因序列数据,经生物信息学分析、高通过基因表达、高通量功能筛选和体内外药效研究开发得到的新药候选物实际上利用了反向生物学的原理沿着从基因序列一蛋白质一功能一药物的途径研制新药,其优势是取自庞大的人类基因资源及其编码蛋白质做为原材料,具有巨大的开发潜力。,3、开发基因组药物,.,58,.,人类基因组约有10万左右的基因编码10万以上的蛋白质,其中至少5即5000以上的基因编码蛋白质可能具有药物开发前景而目前利用常规技术开发的人类重组蛋白质药物已上市的只有20多种,进入临床实验的只有100多种。,.,美国的人类基因组科学公司(HGS公司)。根据其1999年2月公布的消息,在功能基因组研究领域,HGS公司己发现95的人类cDNA;克隆了9000个人类分泌蛋白质的全长cDNA;发现了3000个基因的可能医学应用;发现了35个新的白细胞介素类分子和40个新的生长因子类分子;已有3个基因组药物进入临床。,.,4、寻找药物作用新靶点,基因组比较:抗微生物同源性搜索表达差异分析,.,理想的抗生素靶标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论