蛋白结构数据库_第1页
蛋白结构数据库_第2页
蛋白结构数据库_第3页
蛋白结构数据库_第4页
蛋白结构数据库_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、PDB数据库数据库1.简介简介 美国Brookhaven实验室1971年建立的大分子结构数据库PDB 蛋白质晶体结构资蛋白质晶体结构资料数据库料数据库 (Protein Data Bank)。 PDB数据库的维护由结构生物信息学研究合作组织(Research Collaboration for Structural Bioinformatics, RCSB)负责。2.数据来源数据来源 通过实验(X射线晶体衍射,核磁共振,电子显微镜方法等)测定的生物大分子的三维结构。 主要是蛋白质的三维结构,还包括核酸、糖类、蛋白质与核酸复合物的三维结构。 3.数据统计数据统计 截止2008年4月,PDB数据库

2、已含有50277 个结构数据,其中约93%是蛋白质的结构。 Other 包括包括 proteins nucleicacids complexes X-ray NMR Microscopy 4.数据查询数据查询 PDB中的记录有唯一的PDB-ID,包括4个字符串,可由大写字母AZ和数字09组合而成。 PDB和它的镜像站点提供每个PDB记录的查询,可按一些专门的查询项目(如提交数据、作者姓名、结构表达)进行检索。 例例1:查询:查询“PDB ID = 2ITY ”的结构数据的结构数据(1)登陆PDB网站 /pdb/ (2)在上方的搜索栏选中“PDB ID or

3、keyword ” ,在文本框中输入“2ITY ”,单击Site Search按钮,出现结果。数据查看:数据查看:(3)分别单击标签Biology & Chemistry生物学和化学,Materials & Methods材料和方法,Sequence Details细分序列,Geometry几何形态,观察数据信息。也可以单击Help查看帮助文件。(4)回到Structure Summary组织摘要,标签,在右侧的Images and Visualization区域可以观察蛋白的三维结构,可以单击KiNG,Jmol,WebMol等查看三维结构。(5)单击左侧目录中的Downloa

4、d Files下载不同格式和内容的文件;或下载FASTA序列文件;也可单击1adz 右侧的Download PDB file 图标下载PDB文件(1adz.pdb)。例例2:查询:查询“人人calmodulin (钙调素蛋白:一种钙结钙调素蛋白:一种钙结合蛋白合蛋白)” (1)登陆PDB网站 (2)单击Advanced search将Structure Title 限制为human和calmodulin 单击Evaluate Query (3)得到多个结构数据,其中“PDB ID = 1GGZ”的搜索结果最符合要求,是人上皮细胞中的钙调素样蛋白,单击此ID,进入1GGZ的具体界面。 5.数据结

5、构数据结构 PDB中对于每一个结构记录,包含名称、参考文献、序列、一级结构、二级结构和原子坐标等信息。 每条记录有两种序列信息,一种是显式序列信息(explicit sequence),一种是隐式序列信息(implicit sequence)。 在PDB文件中,以关键字SEQRES作为显式序列标记,以该关键字打头的每一行都是关于序列的信息;PDB的隐式序列即为立体化学数据,包括每个原子的名称和原子的三维坐标。 PDBPDB数据库的详细字段说明如下:数据库的详细字段说明如下:HEADER分子类,公布日期,ID号OBSLTE注明该ID号已改为新号TITLE说明试验方法类型CAVEAT可能的错误提示

6、COMPND化合物分子组成SOURCE化合物来源KEYWDS关键词EXPDTA测定结构所用的试验方法AUTHOR结构测定者REVDAT修订日期及相关内容SPRSDE已撤销或更改的相关记录JRNL发表坐标集的文献REMARK 1有关文献REMARK 2最大分辨率REMARK 3用到的程序和统计方法REMARK 4其他注解DBREF其他序列库的有关记录SEQADVPDB与其它记录的出入SEQRES残基序列MODRES对标准残基的修饰HET非标准残基HETNAM非标准残基的化学名称HETSYN非标准残基的同义字FORMUL非标准残基化学式HELIX螺旋SHEET折叠TURN转角SSBOND有二硫键存

7、在LINK残基间化学键HYDBND氢键SLTBRG盐桥CISPEP顺势残基SITE特性位点CRYST1晶胞参数ORIGXn直角PDB坐标SCALEn直角部分结晶学坐标MTRIXn非晶相对称TVECT转换因子MODEL多亚基时显示亚基号ATOM标准基团的原子坐标SIGATM标准差ANISOU温度因子SIGUIJ各种温度因素导致的标准差TER链末端HETATM非标准基团原子坐标ENDMDL亚基结束CONECT原子间的连通性有关记录MASTER版权拥有者END文件结束6.结构模型显示软件结构模型显示软件 RasMol RasMol是一个进行分子三维立体结构显示的软件,可以非常方便地观察蛋白质、核酸以

8、及一些小分子的三维结构,并在自己的个人电脑上,以各种模式、各种角度,甚至按照自己的意愿旋转,观察此分子的微观三维立体结构,进而了解化合物分子结构和各种微观性质与宏观性质之间的定量关系。例如:在例如:在RasMol软件下观察软件下观察1GGZ.pdb结构结构(1)下载并安装RasMol (/software/rasmol/ )(2)单击开始程序RaswinRaswin,运行RasMol。(3)当运行RasMol时,程序首先打开具有黑色背景的主窗口(显示窗口),同时也会打开另一个窗口,其背景色是白色的,被称作“命令行窗口”。初始运行时,命令行窗

9、口通常为最小化状态,用ALT+TAB键切换,即可打开该窗口,在主显示窗口的菜单中的任何选择和操作,均可在此窗口中输入命令行实现。(4)单击RasMol主菜单上的“File/Open”载入“人上皮细胞calmodulin样蛋白”的结构数据(即1GGZ.pdb)。(5)蛋白质分子的外观立体结构观察:利用RasMol主菜单上的“Display”命令中的不同显示模式来变换分子的三维立体结构的外观。 (6)蛋白质分子的外观立体结构的颜色显示模式:利用主菜单上的“Colours”命令来选择不同的颜色显示模式,以进一步更直观、清晰地展示所要观察的分子的立体结构。 (7)蛋白质分子三维结构的选择性显示:Ras

10、Mol主菜单中的“Display”和“Colours”命令主要用于分子的正常显示,在主菜单上还有一个“Options”选项命令,可以进行一些非正常的显示。 (8)蛋白质分子三维结构的旋转显示: 鼠标点击窗口右方与下方的滚卷条,将以X轴或Y轴旋转。 将鼠标移至主屏幕区,按住鼠标左键,移动鼠标,就可以任意旋转此分子。按住Shift键,同时按住鼠标的右键,移动鼠标,即可实现以Z轴旋转。 通过命令行方式。(9)蛋白质三维立体结构图像的输出4.3.2 MMDB数据库数据库1.简介简介 分子模型数据库MMDB (Molecular Modeling Database)是一个关于三维生物分子结构的数据库,是

11、美国生物技术信息中心(NCBI)所开发的生物信息数据库集成系统Entrez的一个部分。 MMDB是来源于PDB三维结构的一部分,MMDB重新组织和验证了这些信息,从而保证在化学和大分子三维结构之间的交叉参考。2.查询查询(1)登陆网站/Structure/MMDB/mmdb.shtml (2)在文本框中输入“1ggz”(或者右下角的PDB/MMDB Code文本框中 ),单击Go按钮,显示查询结果。家族构成3D大分子结构保守区域数据库3.三维结构显示程序三维结构显示程序 Cn3D Cn3D是MMDB一个配套的三维结构显示程序,它具有可靠的显示

12、三维数据库结构的能力。图像以动画形式显示,用户可以旋转或缩放结构,也可以用条带图、空间结构图、热能分布图等方式来显示,掌握分子结构的不同功能 (1)在刚才的查询结果页,单击左侧结构图下方的View options,展开选项。(2)Tasks选择Save File,Program选择Cn3D,Drawing选择Backbone。(3)在结构图上单击,下载文件3 。(4)下载并安装Cn3D软件。(5)开始程序NCBICn3DCn3D4.1注:MMDB采用ASN.1的记录格式,而非PDB格式。4.3.3 SCOP数据库数据库1.简介简介 蛋白质结构分类数据库SCOP (Structural Clas

13、sification of Proteins)的目标是提供关于已知结构蛋白质之间的结构和进化关系的信息,所涉及的蛋白质包括结构数据库PDB中的所有条目。 SCOP数据库除了提供蛋白质结构和进化关系信息外,对于每一个蛋白质还包括下述信息:到PDB的链接,序列,参考文献,结构的图像等。 SCOP的结构分类主要是通过人工来完成的,通过图形显示器观察和比较蛋白质结构,并借助于一些软件工具进行分析。2.分类的层次结构分类的层次结构(1)家族:具有明显进化关系的蛋白质聚集到一个家族中,意味着两个蛋白质之间的等同氨基酸残基数超过30%。然而,在某些情况下,虽然两个蛋白质序列不相似,但它们具有相似的结构和相似

14、的功能,表明属于同一个家族。 (2)超家族:超家族中的成员具有远源进化关系,具有共同的进化源。(3)折叠:无论有无共同的进化起源,只要具有相同无论有无共同的进化起源,只要具有相同排列和拓扑结构的主要二级结构,即将蛋排列和拓扑结构的主要二级结构,即将蛋白质分类为具有相同的折叠白质分类为具有相同的折叠。 3. SCOP查询查询 (1)网址:网址:http:/scop.mrc-lmb.cam.ac.uk/scop/ (2)单击单击 top of the hierarchy SCOP首先从总体上将蛋白质进行分类,例如全型,全型,以平行折叠为主的/型,以反平行折叠为主的+型 等。例如:SCOP1.73版本有46456个全型蛋白质,该结构类型下有258个折叠类。在这258个折叠类中的第一个超家族是类球蛋白;类球蛋白又包含4个家族,其中第一个家族包含6个结构域;每个结构域下面有很多蛋白质成员。也可以直接利用查找工具,查找特定的蛋白质也可以直接利用查找工具,查找特定的蛋白质1GGZ1GGZ。 4.3.4 DSSP数据库数据库1.1.简介简介 蛋白质二级结构数据库DSSP (Database of Secondary Structure of Protein)是一个二级结构推导数据库。对生物大分子数据库PDB中的任何一个蛋白质,根据其三维结构推

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论