蛋白质数据库应用swissport和PPD_第1页
蛋白质数据库应用swissport和PPD_第2页
蛋白质数据库应用swissport和PPD_第3页
蛋白质数据库应用swissport和PPD_第4页
蛋白质数据库应用swissport和PPD_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、摘 要 本文对SWISS-PROT和PDB两个数据库进行了简要介绍以及如何进行序列的单个下载和批量下载进行了说明。关键词:SWISS-PROT PDB 下载ABSTRACT In this paper,I make a brief introduction about SWISS-PROT and PDB and how to make a single download and batch download about sequence.Key words:SWISS-PROT PDB download摘 要1ABSTRACT2一 Swiss-Port的使用方法41.1网站简介41.2数据下

2、载:5二 PDB的使用方法52.1网站简介52.2数据下载9一 Swiss-Port的使用方法SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其

3、它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。Swiss-Port的网址为。1.1网站简介 打开网站后可以找到如下所示部分:在处可以查询序列。点击后会有如下界面:在输入区输入序列:MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG,点击按钮可以进行查找(查找时还可以在其下方进行一系列的筛选条件控制)。查询后会看到如下界面,在这里可以看到你进行查询的时间,查询所用时间,查找到的相关序列的数目以及相似度和其他相关信息。1.2数据下载: 没有

4、找到数据下载的信息。二 PDB的使用方法PDB是蛋白质结构数据库的英文简称。PDB是目前最主要的收集生物大分子(蛋白质、核酸和糖)三维结构的数据库,是通过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质、多糖、核酸、病毒等生物大分子的三维结构数据库。随着晶体衍射技术的不断改进,结构测定的速度和精度也逐步提高。90年代以来,随着多维核磁共振溶液构象测定方法的成熟,使那些难以结晶的蛋白质分子的结构测定成为可能。蛋白质分子结构数据库的数据量迅速上升。据2000年5月统计,PDB数据库中已经存放了1万2千多套原子坐标,其中大部分为蛋白质,包括多肽和病毒。此外,还有核酸、蛋白和核酸复合物以及少量

5、多糖分子。近年来,核酸三维结构测定进展迅速。PDB数据库中已经收集了800多套核酸结构数据。 PDB数据库允许用户用各种方式以及布尔逻辑组合(AND、OR和NOT)进行检索,可检索的字段包括功能类别、PDB代码、名称、作者、空间群、分辨率、来源、入库时间、分子式、参考文献、生物来源等项。用户不仅可以得到生物大分子的各种注释、坐标、三维图形、VAML等,并能从一系列指针连接到与PDB有关的数据库,包括SCOP、CATH、Medline、ENZYME、SWISS-3DIMAGE等。可通过FTP下载PDB数据。所有的PDB文件均有压缩和非压缩版以适应用户传输需要。PDB的电子公告版BBS和电子邮件兴

6、趣小组(Mailing List)为用户提供了交流经验和发布新闻的空间。在PDB的服务器上还提供与结构生物学相关的多种免费软件如Rasmol、Mage、PDBBrowser、3DB Brower等。其网址为。2.1网站简介打开主页后可以找到下图所示部位:单击进入下图界面:在“Sequence”出输入如下序列:MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG单击可以再不查看结果得情况下知道有多少个相似序列。单击进行搜索,查看结果。找到结果中的一个序列如图,打开。此时我们会看到下图的结果:标题栏

7、的内容依次为:摘要、序列、注释、序列相似性、3D相似性、文献、生物及化学报告、方法、几何结构、链接。(1)Summary包含有Primary Citation(主引)、Molecular Description(分子描述)、Source(来源)、External Domain Annotations (外部与注解,该部分只要在可以找到的情况下才会显示)几部分。在右侧会看到下图,这是该序列的立体结构,点击图片可以查看详细信息。在其上方会看到下面的下载项目,在此处可以进行下载。(2)Sequence包含有注解、偏好性、参考文献。在注解上方可以一看到这样的部分:点击FASTA可以下载该序列,点击Sequence&DSSP可以查看二级结构与氨基酸序列的对应关系,点击Image可以查看二级结构图片。(3)Annotation包含有其他数据库的相关数据。(4)Seq.Similaarity序列的相似度。(5)3D Similarity3D结构相似性。(6)Literature相关的文献信息在这里可以找到。(7)Biol.&

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论