实验一生物信息学数据库和软件的搜索_第1页
实验一生物信息学数据库和软件的搜索_第2页
实验一生物信息学数据库和软件的搜索_第3页
实验一生物信息学数据库和软件的搜索_第4页
实验一生物信息学数据库和软件的搜索_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验一生物信息学数据库和软件的搜索【实验目的】熟练掌握上网搜索生物信息学数据库和软件的方法及技能。【实验内容】1、搜索生物信息学数据库或者软件数据库是生物信息学的主要内容,各种数据库几乎覆盖了生命科学的各个领域。核酸序列数据库有GenBank, EMBL, DDBJ等,蛋白质序列数据库有SWISS-PROT, PIR, OWL, NRL3D, TrEMBL等,蛋白质片段数据库有PROSITE, BLOCKS, PRINTS等,三维结构数据库有PDB, NDB, BioMagResBank, CCSD等,与蛋白质结构有关的数据库还有SCOP, CATH, FSSP, 3D-ALI, DSSP等,

2、与基因组有关的数据库还有ESTdb, OMIM, GDB, GSDB等,文献数据库有Medline, Uncover等。另外一些公司还开发了商业数据库,如MDL等。生物信息学数据库覆盖面广,分布分散且格式不统一, 因此一些生物计算中心将多个数据库整合在一起提供综合服务,如EBI的SRS(Sequence Retrieval System包含了核酸序列库、蛋白质序列库,三维结构库等30多个数据库及CLUSTALW、PROSITESEARCH等强有力的搜索工具,用户可以进行多个数据库的多种查询。 2、搜索生物信息学软件生物信息学软件的主要功能有:分析和处理实验数据和公共数据,加快研究进度

3、,缩短科研时间;提示、指导、替代实验操作,利用对实验数据的分析所得的结论设计下一阶段的实验;寻找、预测新基因及预测其结构、功能;蛋白高级结构预测。如:核酸序列分析软件BioEdit、DNAClub等;序列相似性搜索BLAST;多重系列比对软件Clustalx;系统进化树的构建软件Phylip、MEGA等;PCR 引物设计软件Primer premier6.0、oligo6.0等;蛋白质二级、三级结构预测及三维分子浏览工具等等。【实验步骤】1、GenBank /genbankGenBank是美国国家生物技术信息中心(National Cente

4、r for Biotechnology Information ,NCBI建立的DNA序列数据库,从公共资源中获取序列数据,主要是科研人员直接提供或来源于大规模基因组测序计划( Benson等, 1998。为保证数据尽可能的完全,GenBank与EMBL、DDBJ建立了相互交换数据的合作关系。完整的GenBank数据库包括序列文件,索引文件以及其它有关文件。索引文件是根据数据库中作者、参考文献等子段建立的,用于数据库查询。序列文件的基本单位是序列条目,包括核甘酸碱基排列顺序和注释两部分。2、EMBL /欧洲分子生物学实验室EMBL(The European

5、Molecular Biology Laboratory),EMBL已发展成欧洲最重要和最核心的分子生物学基础研究和教育培训机构。在研究中建立了先进的核苷酸序列数据库。EMBL-DNA数据库于1982年由EMBL建立,与美国的GenBank及日本的DDBJ共同组成全球性的国际DNA数据库,近年来发展很快,在1995年数据量成倍递增。EBI是EMBL在英国Hinxton的分部,主要负责建立EMBL-DNA数据库,可进行核苷酸序列检索及序列相似性查询。EMBL数据库的基本单位也是序列条目,包括核甘酸碱基排列顺序和注释两部分。3、DDBJ http:/www.ddbj.nig.ac.jp/本DNA数

6、据库DDBJ(DNA Data Bank of Japan,于1984年建立,是世界三大DNA 数据库之一,与NCBI的GenBank,EBI的EMBL数据库共同组成国际DNA数据库,每日都 交换更新数据和信息,并主持两个国际年会国际DNA数据库咨询会议和国际DNA数据 库协作会议,互相交换信息,因此三个库的数据实际上是相同的。DDBJ主要向研究者收集DNA序列信息并赋予其数据存取号,信息来源主要是日本的研究机构,亦接受其他国家呈递的序列,数据库通过WWW环球网,匿名FTP,e-mail或Gopher方式为广大研究人员服务。4、PIR /PIR是

7、一个集成了关于蛋白质功能预测数据的公共资源的数据库,其目的是支持基因组/蛋白质组研究。PIR与其他组织合作,共同构成了PIR-国际蛋白质序列数据库(PSD)一个主要的已预测的蛋白质数据库,包括250,000个蛋白。5、PROSITE /PROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能mot

8、if,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。6、PDB蛋白质数据库Protein Data Bank(PDB是一个蛋白质、核酸等生物大分子的结构数据的数据库,由Worldwide Protein Data Bank监管。PDB可以经由网络免费访问,是结构生物学研究中的重要资源。为了确保PDB资料的完备与权威,各个主

9、要的科学杂志、基金组织会要求科学家将自己的研究成果提交给PDB。在PDB的基础上,还发展出来若干依据不同原则对PDB结构数据进行分类的数据库,例如GO将PDB中的数据按基因进行了分类。 7、GSDBGSDB是基因组序列数据库(Genome Sequence Data Base),由美国新墨西哥州Santa Fe的国家基因组资源中心创建。GSDB收集、管理并且发布完整的DNA序列及其相关信息,以满足基因组测序中心需要。该数据库采用服务器-客户机关系数据库模式,大规模测序机构可以通过计算机网络向服务器提交数据,并在发送之前对数据进行检查,以确保数据的质量。GSDB数据库中条目的格式与GenBank中的基本一致,主要区别是GSDB数据库中增加了GSDBID识别符。GSDB数据库可以通过万维网查询,也可以使用服务器-客户机关系数据库方式查询。8、OM

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论