生物信息学资源.ppt_第1页
生物信息学资源.ppt_第2页
生物信息学资源.ppt_第3页
生物信息学资源.ppt_第4页
生物信息学资源.ppt_第5页
已阅读5页,还剩64页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,生物信息学 Bioinformatics,2,复习:,细胞 蛋白质 核酸,3,Questions: 1. 蛋白质二级结构有哪些? 2. 真核生物的启动子有什么作用? 3. TSS,外显子和内含子的概念。 4. 如何判断起始密码子和终止密码子?内含子? 5. 基因表达调节有哪些?,4,请画出示意图:,1. 中心法则 2. 真核生物基因的一般结构,5,核酸,中心法则,复制,DNA,转录,逆转录,复制,RNA,蛋白质,翻译,调控,6,TATA盒,翻译起始 植物C/GAANNATGG 动物A/GNNATGG,各内含子,加poly(A)信号 植物 G/AATAA1-3 动物 AATAAA,终止密码子,各个外显子,AGGA或 CAAT盒,加帽位点 5m7GpppNp,5端,真核基因的一般结构,TSS,7,8,第三章 生物信息学数据库资源,9,提纲:,模式生物测序 3大核酸数据库 蛋白质数据库,10,提纲:,模式生物测序 3大核酸数据库 蛋白质数据库,11,human,Arabidopsis,Thermotoga maritima,Escherichia coli,Buchnerasp. APS,Rickettsia prowazekii,Ureaplasma urealyticum,Bacillus subtilis,Drosophila melanogaster,Thermoplasma acidophilum,Plasmodium falciparum,Helicobacter pylori,mouse,Caenorhabitis elegans,rat,Borrelia burgorferi,Borrelia burgorferi,Aquifex aeolicus,Neisseria meningitidis Z2491,Mycobacterium tuberculosis,一、模式生物,12,模式生物基因组计划,模式生物基因组计划 酵母、线虫、果蝇、细菌、拟南芥等共约50多种已完成,70余种正在进行。目前总量已达60亿碱基对!,viruses,plasmids,bacteria,fungi,plants,algae,insects,mollusks,reptiles,birds,mammals,Genome sizes in nucleotide pairs (base-pairs),104,108,105,106,107,1011,1010,109,bony fish,amphibians,14,模式生物(Model Organism),病毒(Virus) 不具有细胞形态结构,仅由核酸和蛋白质构成; 如:人艾滋病毒HIV、SARS冠状病毒 体积小,10300nm; 严格的专性细胞内寄生; 对抗生素不敏感。,电子显微镜下的SARS冠状病毒,100nm,15,Escherichia coli 大肠杆菌,大肠杆菌是研究得最为详尽的一个模式生物。这种只有1.6微米长的、可以迅速繁殖的单细胞原核生物,已经成为实验室和基因工程的重要工具。,Escherichia coli O157:H7,Escherichia coli K12,模式生物(Model Organism),16,Saccharomyces cerevisiae 酿酒酵母,真菌界的单细胞真核生物,它的全基因组已在2019年测定。,模式生物(Model Organism),17,秀丽线虫Caenorhabditis elegans 一种透明的、生活在海滩泥沙中的小虫。,细胞数目一定:成虫细胞数目只有959个,其中包括302个神经元; 有6条染色体,全基因组于2019年测定,长9.7Mb,模式生物(Model Organism),18,Drosophila melanogaster 果蝇,繁殖很快、容易诱发变异的小昆虫。总长达1.8亿核苷酸。,模式生物(Model Organism),19,Arabidopsis thaliana 拟南芥,个体生活周期只有6周的十字花科小草,是一种理想的模式植物。,模式生物(Model Organism),20,Oryza sativa 水稻,单子叶植物模式植物,390-430MB,模式生物(Model Organism),21,模式生物(Model Organism),非洲瓜蟾(Xenopus lavias) 1个受精卵在24小时内分裂到各种器官初具雏形的程度;,22,模式生物(Model Organism),斑马鱼(Danio rerio) 身体透明的小鱼,生活周期约3个月,是研究脊椎动物发育过程的良好对象。,23,模式生物(Model Organism),小鼠(Mus musculus) 基因组大小与人类相近,约30亿个核苷酸对;,24,25,26,提纲:,模式生物测序 3大核酸数据库 蛋白质数据库,27,主要的数据库资源,核酸序列数据库主要有GenBank, EMBL, DDBJ等. 蛋白质序列数据库主要有SWISS-PROT, PIR, TrEMBL等, 蛋白结构数据库有PDB, MMDB等, 与基因组有关的数据库还有dbEST, OMIM等,,28,3大核酸数据库,基因组数据库的相关背景。 主要的基因组数据库资源。 重点介绍GenBank,29,30,DNA序列数据库最早于1982年在欧洲分子生物学实验室诞生,随即就开始了一个数据库爆炸的时代。 此后不久因一项美国国家健康研究中心与洛斯阿拉莫斯国家实验室的合同而诞生了GenBank。 日本的DNA数据库(DDBJ),在几年后加入了数据收集的合作。,基因组数据库的发展历史,31,基因组数据库的发展历史,1988年一次三方会议之后(现在称之为“国际DNA序列数据库合作计划”)达成协议,对数据库的记录采用共同的格式 现在三个中心都收集直接提交的数据,并在三者之间发布。,32,三大基因数据库,Genbank Genbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(NCBI)建立和维护的。 NCBI的网址是:。 EMBL核酸序列数据库 由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,查询检索可以通过通过因特网上的序列提取系统(SRS)服务完成。 数据库网址是:ebi.ac.uk/embl/。 DDBJ数据库 日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库,与Genbank和EMBL核酸库合作交换数据。使用其主页上提供的SRS工具进行数据检索和序列分析。 DDBJ的网址是:ddbj.nig.ac.jp/。,33,GenBank,Public free Available via Internet,EMBL Data Library,DDBJ (DNA Data Bank of Japan),三大基因数据库之间的关系,34,/,ddbj.nig.ac.jp/searches-e.html,www.ebi.ac.uk/embl/,35,美国的核酸数据库GenBankBanson,D.A. et al. (2019) Nucleic Acids Res. 26, 1-7从1979年开始建设,1982年正式运行;,36,37,欧洲分子生物学实验室的EMBL数据库也于1982年开始服务,38,39,日本于1984年开始建立国家级的核酸数据库DDBJ,并于1987年正式服务。,40,41,/,ddbj.nig.ac.jp/searches-e.html,www.ebi.ac.uk/embl/,42,GenBank /,43,44,45,46,47,提纲:,模式生物测序 3大核酸数据库 蛋白质数据库,48,蛋白质数据库,49,主要的数据库资源,核酸序列数据库主要有GenBank, EMBL, DDBJ等. 蛋白质序列数据库主要有SWISS-PROT, PIR, TrEMBL等, 蛋白结构数据库有PDB, MMDB等, 与基因组有关的数据库还有dbEST, OMIM等,,50,60年代“蛋白质信息资源”(Protein Information Resource,简称PIR)雏形产生 1984年,“蛋白质信息资源”(Protein Information Resource,简称PIR)计划正式启动,蛋白质序列数据库PIR也因此而诞生。 1988年,美国的NBRF、日本的国际蛋白质信息数据库JIPID和德国的慕尼黑蛋白质序列信息中心MIPS合作成立了国际蛋白质信息中心(PIR-International),共同收集和维护蛋白质序列数据库PIR。,51,除了PIR外,另一个重要的蛋白质序列数据库则是SwissProt。 该数据库由瑞士日内瓦大学于1986年创建,目前由瑞士生物信息学研究所和欧洲生物信息学研究所 EBI共同维护和管理。,52,PIR和SwissProt是创建最早、使用最为广泛的两个蛋白质数据库。 蛋白质序列数据库TrEMBL是从EMBL中的cDNA序列翻译得到的。该数据库采用SwissProt数据库格式,包含EMBL数据库中所有编码序列的翻译。,53,SWISSPROT 1. 瑞士日内瓦大学医学生物化学系和欧洲生物信息学研究所(EBI)合作维护(1986年); 2. 在EMBL和GenBank数据库上均建立了镜像站点; 3. 数据库包括了从EMBL翻译而来的蛋白质序列,这些序列经过检验和注释; SWISS-PROT的网址: /sprot,54,55,PIR(protein information resource) 1. 由美国NCBI翻译自GenBank的DNA序列(1984年); 2. 在EMBL和GenBank数据库上均建立了镜像站点; 3. 数据依据注释的质量分为4类。 网址: /,PIR数据库的分类情况(Release 51.03),56,57,蛋白质结构数据库,58,主要的数据库资源,核酸序列数据库主要有GenBank, EMBL, DDBJ等. 蛋白质序列数据库主要有SWISS-PROT, PIR, TrEMBL等, 蛋白结构数据库有PDB, MMDB等, 与基因组有关的数据库还有dbEST, OMIM等,,59,PDB(protein data bank) 1. 目前最主要的蛋白质分子结构数据库; 2. 1970年代建立,美国Brookhaven国家实验室维护管理; 3. 1988年,由美国RCSB(research collaboratory for structural biology)管理; 4. 以文本格式存放数据,包括原子坐标、物种来源、测定方法、提交者信息、一级结构、二级结构等; PDB的网址:/pdb(美国),60,61,62,如何 Access PDB记录?,63,如何 Access PDB记录?,64,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论