




已阅读5页,还剩53页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实验四 蛋白质序列 结构的获取和显示 杜娟dujuannx 基因与蛋白质组学数据分析 2 实验项目四 蛋白质序列 结构的获取和显示一 实验目的和要求 掌握蛋白质序列数据库Uniprot的查询方法及格式特点掌握蛋白质结构数据库PDB的及格式特点掌握蛋白质结构显示软件Pymol的使用 3 UniProt UniversalProteinResource收录蛋白质序列目录最广泛 功能注释最全面的数据库 包含三个子库 UniProtKB UniProtKnowledgebase UniRef UniProtReferenceClusters UniParc UniprotArchive 一UniProt数据库 1 简介 4 2 数据来源 EuropeanBioinformaticsInstitute EMBL EBI SIBSwissInstituteofBioinformatics ProteinInformationResource PIR Swiss ProtandTrEMBL ProteinSequenceDatabase PIR PSD 5 UniProt的网址 http www uniprot org 3 数据查询Uniprot检索号 包括6个字符串 可由大写字母A Z和数字0 9组合而成 也可以用关键词检索 检索演示 例1 查询草履虫细胞周期蛋白依赖的蛋白激酶 CDK2 的结构数据 1 登陆Uniprot网站http www uniprot org 2 在搜索栏选中 Proteinknowledgebase UniProtKB 在文本框中输入 ParameciumtetraureliaCDK2 单击SiteSearch按钮 出现结果 8 9 10 11 12 13 与其他数据库的链接 14 15 4 UniProt数据格式 IDQ9XYV1 PARTEUnreviewed 301AA ACQ9XYV1 DT01 NOV 1999 integratedintoUniProtKB TrEMBL DT01 NOV 1999 sequenceversion1 DT21 MAR 2012 entryversion71 DESubName Full Cyclin dependentproteinkinaseCdk2 GNName CDK2 OSParameciumtetraurelia OCEukaryota Alveolata Ciliophora Intramacronucleata OCOligohymenophorea Peniculida Parameciidae Paramecium OXNCBI TaxID 5888 头部区 16 引文区 RN 1 RPNUCLEOTIDESEQUENCE RCSTRAIN 51S RXMEDLINE 99448661 PubMed 10519216 RXDOI 10 1111 j 1550 7408 1999 tb06065 x RAZhangH BergerJ D RT Anovelmemberofthecyclin dependentkinasefamilyinParameciumRTtetraurelia RLJ Eukaryot Microbiol 46 482 491 1999 评论区CC CCCopyrightedbytheUniProtConsortium seehttp www uniprot org termsCCDistributedundertheCreativeCommonsAttribution NoDerivsLicenseCC 相关文献编号或递交序列的注册信息 序列注释信息 17 交叉引用数据库区 DREMBL AF126147 AAD34354 1 Genomic DNA DRHSSP P24941 1OIQ DRProteinModelPortal Q9XYV1 DRGO GO 0005524 F ATPbinding IEA UniProtKB KW DRGO GO 0004674 F proteinserine threoninekinaseactivity IEA InterPro DRInterPro IPR011009 Kinase like dom DRInterPro IPR000719 Prot kinase cat dom DRInterPro IPR017441 Protein kinase ATP BS DRInterPro IPR002290 Ser Thr dual sp kinase dom DRInterPro IPR008271 Ser Thr kinase AS DRPfam PF00069 Pkinase 1 DRSMART SM00220 S TKc 1 DRSUPFAM SSF56112 Kinase like 1 DRPROSITE PS00107 PROTEIN KINASE ATP 1 DRPROSITE PS50011 PROTEIN KINASE DOM 1 DRPROSITE PS00108 PROTEIN KINASE ST 1 18 序列区 KWATP binding Cyclin Kinase Nucleotide binding Transferase SQSEQUENCE301AA 34675MW E839F1A5EA0D5CB5CRC64 MDLAQSEERYQKLEKIGEGTYGLVYKARDNQTGDIVALKKIRMDHEDEGVPSTAIREISLLKEVQHPNIVPLKDVVYDESRLYLIFDFVDLDLKKYMESVPQLDRMQVKKFINQMIQALNYCHQNRVIHRDLKPQNILVDIKQQNTQIADFGLARAFGLPLKTYTHEVITLWYRAPEILLGQRQYSTPVDIWSLGCIFAEMAQKRPLFCGDSEIDQLFKIFKIMGTPKESTWPGVSTLPDFKSTFPRWPTPTNPAATLGKDITNLCPLGLDLLSKMITYDPYARITAEEALKHAYFDELNN 氨基酸统计数 19 DNA代码 氨基酸代码 20 FASTA文件格式 21 在Uniprot中查询拟南芥的光敏色素phyE编码蛋白的详细信息 阅读序列格式的解释 列出共包含哪几个部分 标出头部区主要字段的含义 在Uniprot中查询 1 拟南芥油菜素内酯受体gibberellinreceptorGID1C 2 水稻独角金内酯水解酶strigolactonehydrolaseD14的蛋白质序列 这两个蛋白包含多少个氨基酸 写出它们所对应的mRNA检索号 类似于这样的格式N GeneID号 作业 二蛋白质结构数据库 PDBProteinDataBank 美国Brookhaven国家实验室管理生物大分子三维空间结构原子坐标数据库http www rcsb org pdb NCBISTRUCTURE MMDB MolecularModellingDataBase 包含了从PDB获取的实验确定的生物高聚物结构分子模型数据库 PDB数据库 proteindatabank 1 简介美国Brookhaven实验室1971年建立的大分子结构数据库PDB蛋白质晶体结构资料数据库 ProteinDataBank PDB数据库的维护由结构生物信息学研究合作组织 ResearchCollaborationforStructuralBioinformatics RCSB 负责 2 数据来源通过实验 X射线晶体衍射 核磁共振 电子显微镜方法等 测定的生物大分子的三维结构 主要是蛋白质的三维结构 还包括核酸 糖类 蛋白质与核酸复合物的三维结构 3 数据统计截止2013年11月 PDB数据库已含有95644个结构数据 其中约92 5 是蛋白质的结构 4 数据查询PDB中的记录有唯一的PDB ID 包括4个字符串 可由大写字母A Z和数字0 9组合而成 PDB和它的镜像站点提供每个PDB记录的查询 可按一些专门的查询项目 如提交数据 作者姓名 结构表达 进行检索 检索演示 例1 查询人类泪液载脂蛋白的结构数据 1 登陆PDB网站http www rcsb org pdb 2 在上方的搜索栏选中 Everything 在文本框中输入 HUMANTEARLIPOCALIN 单击SiteSearch按钮 出现结果 第一步 输入关键字 HUMANTEARLIPOCALIN 也可输入ID号 第二步 选择人类泪液载脂蛋白1XKI 数据查看 3 分别单击标签3Dview Sequence Annotations Seq Similarity 3DSimilarity Literature Biol Chem Methods Geometry观察数据信息 4 回到Summary标签 在右侧的BiologicalAssembly区域可以观察蛋白的三维结构 5 单击右侧目录中的DownloadFiles下载不同格式和内容的文件 或下载FASTA序列文件 也可下载PDB文件 1XKI pdb 第三步 观察数据信息1XKI 第四步 1XKI结构展示图 下载PDB结构文件 5 数据结构 PDB中对于每一个结构记录 包含名称 参考文献 序列 一级结构 二级结构和原子坐标等信息 每条记录有两种序列信息 一种是显式序列信息 explicitsequence 一种是隐式序列信息 implicitsequence 在PDB文件中 以关键字SEQRES作为显式序列标记 以该关键字打头的每一行都是关于序列的信息 PDB的隐式序列即为立体化学数据 包括每个原子的名称和原子的三维坐标 PDB文本文件 用写字板打开 标题部分 分子类别 转运蛋白 该文件的公布日期 该化合物的pdb代码 该化合物的来源 结构测定者名字 REMARK是此pdb文件的参考书目 最大分辨率 注解等 一级结构 杂因子 二级结构 连接注释 晶胞特征及坐标变换 连通性部分 坐标部分 1 6 ATOM或HETATM 7 11原子序列号 13 16原子名称 18 20残基名 22链标识符 23 26残基序列号 31 38X坐标 39 46Y坐标 47 54Z坐标 55 60位置 61 66温度因子 79 80原子带的电荷 77 78元素符号 三结构显示软件 PyMOL简介 http www pymol org All指所有的对象 3ODU指刚才打开的文件 sele 是选择的对象按钮A 代表对这个对象的各种action S 显示这个对象的某种样式 H 隐藏某种样式 L 显示某种label C 显示的颜色 点击all中的H 选择everything 隐藏所有点击3ODU中的S 选择cartoon 以cartoon形式显示蛋白质点击3ODU中的C 选择byss 以二级结构分配颜色 选择点击右下角的S 窗口上面出现蛋白质氨基酸序列 找到1164位ITD 是配体 点击选择ITD 此时sele中就包含ITD这个残基 点击 sele 行的A 选择renameselection 窗口中出现 更改sele为IDT 点击 IDT 行的S选择sticks 点击C 选择byelement 选择 调整窗口使此分子清楚显示 IDT行点击A选择find 选择polarcontacts 再根据需要选择 这里选择tootheratomsinobject 分子显示窗口中出现几个黄色的虚线 这就是氢键的对象 点击这一行的C 选择red 把氢键显示为红色 接着再显示跟IDT形成氢键的残基 点击3ODU行的S 选择lines 显示出所有残基的侧链 使用鼠标转动蛋白质寻找与IDT以红色虚线相连的残基 分别点击选择这些残基 注意此时selecting要是residures 55 在PDB结构数据库中查询 1 拟南芥茉莉酸受体 2 拟南芥油菜素内酯受体 3 水稻独角金内酯水解酶的结构 每
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 加快培育新质生产力的核心
- 民族特色扎染课件
- 2025年眼科常见眼病诊断治疗模拟考试卷答案及解析
- 2025年心理咨询与治疗技巧竞赛试卷答案及解析
- 2025年老年心血管疾病的综合干预模拟考试答案及解析
- 2025年过敏反应护理处理规范性操作考核卷答案及解析
- 2025年运动医学科运动损伤防护技术模拟试卷答案及解析
- 2025年心血管内科心电图诊断技能考核试卷答案及解析
- 2025年精神科抑郁症评估量表应用测验答案及解析
- 新质生产力:科技是第一动力
- 2025年心内科重症病房CCU临床带教资选拔理论试题(附答案)
- 秦兵马俑的课件教学
- 甬温线特大铁路事故
- 边境电子围栏2025年行业应用前景报告中小企业安全市场拓展
- 【英语】江苏省苏锡常镇2025届高三下学期二模试题(解析版)
- 2024年德州禹城市事业单位引进青年人才真题
- DBJT15-110-2015 广东省建筑防火及消防设施检测技术规程
- 2024年河北机场管理集团有限公司招聘考试真题
- 低血糖知识培训课件
- 银行公司服务礼仪管理规章
- 2025年秋季开学全体教师大会校长讲话:践行“六个学会”做学生生命中的那束光
评论
0/150
提交评论