生物信息学第4章蛋白质序列数据库分析解析课件_第1页
生物信息学第4章蛋白质序列数据库分析解析课件_第2页
生物信息学第4章蛋白质序列数据库分析解析课件_第3页
生物信息学第4章蛋白质序列数据库分析解析课件_第4页
生物信息学第4章蛋白质序列数据库分析解析课件_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第4章 DNA、RNA和蛋白质序列数据库生物信息学数据库 生物信息数据库种类繁多,就目前来看, 大体可以分为四个大类: 1.基因组数据库; 2.核酸和蛋白质一级结构序列数据库; 3.生物大分子(主要是蛋白质)三维空间结构数据库; 4.根据以上三类数据库和文献资料为基础构建的二次数据库。也称专门数据库、专业数据库或专用数据库。 一次数据库核酸序列数据库-三大核酸序列数据库 GenBank EMBL(的核酸数据库)DDBJGenBank是具有目录和生物学注释的核酸序列综合数据库,由美国国家医学图书馆(NLM)的国家生物技术信息中心(NCBI)构建、维护和管理。该中心位于美国马里兰国家健康研究所(N

2、IH)。GenBank数据库 GenBank数据库NCBI的GenBank: /genbankNCBI: National Center for Biotechnology InformationNLM: National Library of MedicineNIH: National Institute of HealthGenBank数据库页面GenBank数据库 GenBank(/genbank/)该核酸数据库中包含了已经公开的30万余种不同物种生物的核酸序列,这些数据主要来源于全世界不同实验室和大规模测序计划项目。 GenBank数据库每天与欧洲分子生物学实验室的核酸序列数据库(Eu

3、ropean Molecular Biology Laboratory Nucleotide Sequence Database,EMBL)和日本的DNA数据库(DNA Data Bank of Japan DDBJ)进行数据交换,以保证数据库内容在全世界范围的同步性。 GenBank数据库 GenBank数据库记录格式 Nucleotide通常用FASTA和GenBank两种格式显示。FASTA格式仅包括该序列的简要特征,并以G、A、T、C四种碱基列出核苷酸序列,简单明了(各个数据库通用的格式,属于最简洁明了的格式)。而GenBank格式可显示较完整的基因序列记录,反映核苷酸序列的详细信息(

4、 GenBank 所独有的格式)。 FASTA格式序列gi|221078348|gb|EU755370.2| Solanum lycopersicum isolate WRKY1000.3 WRKY mRNA, complete cds ATTTTAAGCTTTTTGGATTTGTTGGAATTTTATTAAGAAGAAATTAAAGCAATGGAATTCACAAGTTTGGTTGATACTTCCTTGGATTTGAGTTTTAGACCTCTTCCAGTTCTTGATAAAGTGCTGAAACAAGAAGTTCAGAGTAATTTCACTGGATTGAGCAGAGACAATATGCTGGTGA

5、AAGATGAGGCAGGTGATTTGTTGGAGGAACTGAACAGAGTGAGCAGTGAAAACAAGAAACTAACAGAGATGCTCACAGTGGTGTGTGAAAATTACAATGCATTAAGAAACCAACTAATGGAGTATATGAACAACCAGAATAATGGTGTAGTAGATGATAGTGCTGGATCAAGGAAAAGAAAAGCTGAAAATATCTCCAATCCCAACAACAACAACAACAACAAAAACAACAACTTGGATATTGTTTGTGGACGTTTATCAGAAAGCAGTTCAAGTGATGAAGAGTCTTGTTGCAAGAAAC

6、CTAGAGAAGAGCACATAAAAACTAAGGTTTCTGTCGTTTCTATGAGGACAGAAGCATCTGATACCTCTCTTATTGTAAA /nuccore/221078348?report=fastaGenbank格式Genbank格式Genbank格式Genbank格式电子提交序列到Genbank两种主要的电子提交途径1、互联网交互方式的提交2、软件提交,Sequin ftp:/sequin/EMBL数据库EMBL建立于1980年,EMBL核苷序列数据库(http:/ www.ebi.ac.uk/embl/)是欧洲主要的核苷序列收集单位,欧洲生物信息中心EBI(即EMB

7、L在德国海德堡的站点)维护这个数据库EMBL: European Molecular Biology LaboratoryEBI: European Bioinformatics Institute核苷数据来自基因组测序中心、世界各地的科学家、欧洲专利局、以及与合作伙伴DDBJ (Japan)和GenBank (USA)交换的数据。 EMBL数据库DDBJ数据库 日本DNA数据库(DDBJ: www.ddbj.nig.ac.jp )是在亚洲唯一的核酸序列数据库,是搜集研究者公认的测定核酸序列的数据库,并且发放给数据提交者国际认证的核酸序列编号。由于DDBJ每天将搜集的数据与EMBL-Bank/

8、EBI和GenBank/NCBI进行交换,使得三个核酸数据库几乎在任何时候都享有相同数据。DDBJ主要收集来自日本研究者获得的序列数据,但也收集数据和发放编号给任何其他国家的研究者。 DDBJ数据库INSDC1998年,GenBank、EMBL和DDBJ共同成立了国际核酸序列数据库协会 (International Nucleotide Sequence Database Collaboration,INSDC)三大核酸数据库之间每天将新测定或更新的数据进行交换共享,保证数据信息的完整与同步,每两个月更新一次版本。http:/INSDC-三大数据库之间的联系NCBI站点的其它数据库和工具1.

9、Entrez系统 http:/sites/gquery 2. BLAST 序列相似性搜索 http:/Blast.cgi 3. 用FTP获取GenBank http:/genbankEntrez 检索-NCBI检索首页检索窗口的数据库选项下拉菜单 GenBank数据库-Entrez检索系统子数据库 通过Entrez从NCBI获取序列信息Entrez主要是用于NCBI数据库综合的、基于文本的检索系统。Entrez综合了科学文献、DNA和蛋白序列数据、3D蛋白质结构和蛋白质域数据、种群研究数据集、表达数据、完整基因组组装和分类学信息,形成一个紧密链接的系统。它用于搜索NCBI链接数据库的检索系统。

10、 检索栏(for)输入“IL-2 human” Entrez Gene检索结果摘要格式显示页面 Entrez Gene全文报告页面 (前部分)Entrez Gene全文报告页面 (后部分)1.7核酸序列数据库-特殊类型核酸序列数据库:非编码RNA数据库(ncRNA) 非编码RNA(non-coding RNA ncRNA)数据库旨在提供非编码RNA的序列和功能信息。表达序列标签数据库 dbEST /est dbEST是GenBank中的一个子数据库,包含来源于不同物种的表达序列数据和表达序列标签序列的其他信息。 miRBase miRBase序列数据库主要存放已发表的微小RNA(microRN

11、A miRNA)序列和注释的数据库。非编码RNA数据库(ncRNA)表达序列标签数据库 dbEST1.8核酸序列数据库-基因表达数据库:基因表达数据库(GEO) GEO:Gene Expression Omnibus /geo/基因表达数据库(GEO)miRBase核酸序列数据库-基因组相关数据库:人类基因组数据库(HGD) /genome/guide/human/拟南芥基因数据库(TAIR) 茄科植物基因组数据库(SGN) 人类基因组数据库(HGD)拟南芥基因数据库(TAIR)茄科植物基因组数据库(SGN)蛋白质序列数据库随着分子生物学的发展,人们获得了越来越多关于蛋白质序列、结构和功能的信息。世界各国的生物学家和计算机科学家合作利用这些信息构建了蛋白质序列数据库、蛋白质三维结构数据库、蛋白质组数据库(二维凝胶电泳数据库)、信号传导及蛋白质-蛋白质相互作用相关数据库、DNA和蛋白质相互作用数据库等蛋白质相关数据库。 蛋白质数据库综合的蛋白质序列数据库 Swiss-Prot蛋白质功能、结构域和蛋白质家族有关的数据库 PROSITE、InterPro、Pfam信号传导数据库 KEGG三维结构数据库 PDB

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论