生物信息学资源检索_第1页
生物信息学资源检索_第2页
生物信息学资源检索_第3页
生物信息学资源检索_第4页
生物信息学资源检索_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章生物信息学资源搜索、1,2、生物信息学数据库概述、2,3,1、生物信息学数据库类型、3,4,2、生物特征数据收集和存储、(1)生物特征数据收集、生物特征数据收集和数据库与排序中心合作、数据库和期刊合作、和期刊合作通过生物信息学中心资源导航查询几个著名的生物信息学中心,不仅可以自行构建和维护很多生物信息数据库,而且通常还可以在互联网上提供资源导航。7,8,核酸序列数据库,GenBank:美国国家生物技术信息中心(NCBI)已知的所有核酸序列和蛋白质序列,包括相关文献和生物注释在内的大而全面的公共核酸序列数据库管理和维护。网站:http:/www . NCBI . NLM . NIH . g

2、ov/GenBank/index . html,8,9,国际核酸序列数据库合作者,9,gen bank搜索,enn,10,例如H1N1流感病毒、12、(2)单击“转到”可获得每个数据库的搜索结果。13,(3)单击“nucle otide : core subset of nucle otide sequence records(nucle otide sequence记录的编号3360核心子集合)”,以获取GenBank核酸序列数据库中的4801个唱片摘要格式(摘要)。14,(4)单击唱片标题以获取有关该记录的详细信息。15,16,蛋白质数据库,16,17,1,蛋白质序列数据库,1988年美国

3、接脚1的序列已验证,注解最详细。PIR2包含尚未确定的重复序列。PIR3的序列尚未测试,并且没有注释。PIR4包含从其他通道获取的序列,没有验证和注释。网站:/,18,pir首页,19,(2) SWISS-PROT,1986年瑞士生物信息学研究所,1994年网站:/sprot/,20,(3) TrEMBL,1996年成立,意思是“Translation of EMBL”,电脑翻译和注释蛋白序列数据库记录是SWISS-TrEMBL分为两部分:SP-TrEMBL和REM-TrEMBL。SP-TrEMBL的条目经过专门分

4、类,授予了SWISS-PROT访问号码,但没有经过手动审查,最终在SWISS-PROT上获得了收入。REM-TrEMBL主要包括免疫球蛋白、T细胞受体、8个以下氨基酸碱基的多肽、合成序列、专利序列等。http:/www.ebi.ac.uk/trembl/,21,(4) GenPept,GenBank的cDNA序列中翻译的蛋白质序列数据库。网站:FTP :/NCBI . NLM . NIH . gov/gen bank/gen pept/),22,(5) UniProt,PIR,Swiss (2)根据当前序列相似性,有三个子库:UniRef100、UniRef90和UniRef50牙齿形成。(3

5、)UniParc(UniProt Archive)是包含所有蛋白质序列的UniProt存档。用户可以使用文本查询数据库、BLAST程序通过数据库搜索或FTP直接下载数据。网站:/,23,(6) OWL,1994年英国利智(Leeds)大学,在Warrington的Daresbury国家实验室合作下创建和维护的复合数据库。数据是SWISS-PROT、PIR、GenPept、SWISS-PROT、PDB、NRL3D等数据库(例如SWISS-PROT、PIR、GENPEPT、swith)TrEMBL和GenPept是数据杨怡中最大的,并随核酸序列数据库更新而

6、更新,但TrEMBL和GenPept都是由核酸序列计算机程序翻译生成的,因此两个数据库中的序列错误率较高,重复序列也较多。OWL的序列具有代表性,但是使用某些标准餐饮序列会导致某些数据不完整。联黎部队的序列相对代表性,数据相对完整。25,26,2,蛋白质结构数据库,(3) DSSP,(4) HSSP,2009年的十二月统计显示,PDB数据库(PDB)包含61808个蛋白质、核酸、蛋白质/核酸复合物和其他使用X射线衍射、NMR、电子显微镜实验数据或理论计算出来的结构数据,数据增长率相当快。以、27、PDB数据库文本文件格式保存数据。每个记录都是一个单独的文件,包含基本注释信息,如物种来源、化合物

7、名称、原子坐标、结构提交者和相关文献。还包括与结构相关的数据,如分辨率、结构元素、温度系数、主链数、配体分子公式、金属离子、二次结构信息、二硫键位置等。网站:http:/www . rcsb . org/pdb/BOND/home . do,28,pdb主页,29,30,31,3,蛋白质功能数据库,主要是蛋白质,DNA,BOND集成了多个关键数据库,例如生物分子交互网络数据库(BIND)、小分子交互数据库(SMID)、Genbank、基因本体(GO)、OMIM和保守功能域网站:32,邦德首页,33,(2) DIP,DIP专门存储实验中确定的蛋白质间相互作用的数据,包括由经典实验手段确定的蛋白质

8、相互作用和痛苦量实验手段确定的蛋白质相互作用数据。数据使用手动审核和计算方法自动验证,需要数据库订阅。数据自动验证有三个茄子指标:EPR Index、PVM Score和DPV Score。目前蛋白质相互作用数据黄金标准不足的情况下,DIP利用计算方法,为自动验证高吞吐量技术生成的蛋白质相互作用数据,做了开拓性的工作。DIP还利用XML技术开发了用于存储和交换蛋白质交互数据的Xin格式。网站:/,34,(3) STRING,STRING不仅存储了实验确定的蛋白质相互作用数据,还存储了预测的蛋白质相互作用数据,提供了各种预测方法的准确性,数据源

9、有四种。一是痛苦量实验技术生成的蛋白质相互作用数据,二是从保守的公开现数据中导出的蛋白质功能联系,第三是从文献检索中获取的蛋白质相互作用数据,第四是利用预测蛋白质相互作用的方法,根据基因组的基因上下文关系(genomic context)预测的蛋白质相互作用数据。目前STRING数据库已包含179种中的736429种蛋白质,复盖率相当高。网站:http:/string.embl.de/,35,(4) KEGG,京都基因和基因组百科全书(KEGG)系统分析基因功能,基因组信息和功能信息的连接知识库。基因组信息存储在GENES数据库中(包括完整和部分排序的基因组序列)。功能信息存储在PATHWAY

10、数据库中(例如,包括代谢、膜传输、信号传输、细胞周期、同一系统保守的子路径等图解细胞生化过程)。KEGG的另一个数据库LIGAND包含有关化学物质、酶分子、酶促反应等的信息。KEGG提供了Java的图形工具,用于访问基因组地图、比较基因组地图和操作表达图、免费其他序列比较、图形比较和路径计算。网站:http:/www.genome.jp/kegg/,36,kegg首页,37,38,39,基因组数据库,39,1,entrez go nomes目前59333提供完整的染色体、序列地图、遗传图谱、物理地图、连续子地图等多种基因组图谱。您可以透过Entrez执行关键字搜寻,或透过Map Viewer浏

11、览、搜寻和编辑。网站:http:/www . NCBI . NLM . NIH . gov/sites/genome,40,entrez go nomes主页,41,(a)地图查看器,使用户不仅可以浏览和搜索有机体的全部基因组信息,还可以浏览和搜索单染色体地图或对于每个基因组,Map Viewer在四个茄子级别显示其信息:“生物首页”(Home Page)“浏览基因组”(Genome View)“浏览地图”(Map View)“浏览序列”(Sequence View),42除了简述各种疾病的林爽特征、诊断、鉴别诊断、治疗、预防等文本资料外,还提供了与疾病相关基因的连锁关系、染色体位置、构成结构和功能、动物模型、相关照片、研究历史、参考文献。在Entrez中搜索,47,48,OMIM的医学遗传学应用价值,1,2,3,4,OMIM statistics,以了解有关最新遗传病、性质和基因的信息。利用OMIM数据库,可以获得遗传病诊断、咨询和治疗的资料。利用O

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论