




已阅读5页,还剩52页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实验四:蛋白质序列、结构的获取和显示,杜娟dujuannx,基因与蛋白质组学数据分析,实验项目四:蛋白质序列、结构的获取和显示一、实验目的和要求:掌握蛋白质序列数据库Uniprot的查询方法及格式特点掌握蛋白质结构数据库PDB的及格式特点掌握蛋白质结构显示软件Pymol的使用,2,UniProt:UniversalProteinResource收录蛋白质序列目录最广泛、功能注释最全面的数据库;包含三个子库:UniProtKB(UniProtKnowledgebase)UniRef(UniProtReferenceClusters)UniParc(UniprotArchive),一UniProt数据库,3,1.简介,2.数据来源,4,EuropeanBioinformaticsInstitute(EMBL-EBI),SIBSwissInstituteofBioinformatics,ProteinInformationResource(PIR),Swiss-ProtandTrEMBL,ProteinSequenceDatabase(PIR-PSD),5,UniProt的网址:/,3.数据查询Uniprot检索号,包括6个字符串,可由大写字母AZ和数字09组合而成。也可以用关键词检索,检索演示,例1:查询草履虫细胞周期蛋白依赖的蛋白激酶(CDK2)的结构数据(1)登陆Uniprot网站/(2)在搜索栏选中“Proteinknowledgebase(UniProtKB)”,在文本框中输入“ParameciumtetraureliaCDK2”,单击SiteSearch按钮,出现结果。,8,9,10,11,12,13,与其他数据库的链接,14,4.UniProt数据格式,IDQ9XYV1_PARTEUnreviewed;301AA.ACQ9XYV1;DT01-NOV-1999,integratedintoUniProtKB/TrEMBL.DT01-NOV-1999,sequenceversion1.DT21-MAR-2012,entryversion71.DESubName:Full=Cyclin-dependentproteinkinaseCdk2;GNName=CDK2;OSParameciumtetraurelia.OCEukaryota;Alveolata;Ciliophora;Intramacronucleata;OCOligohymenophorea;Peniculida;Parameciidae;Paramecium.OXNCBI_TaxID=5888;,头部区,15,引文区,RN1RPNUCLEOTIDESEQUENCE.RCSTRAIN=51S;RXMEDLINE=99448661;PubMed=10519216;RXDOI=10.1111/j.1550-7408.1999.tb06065.x;RAZhangH.,BergerJ.D.;RTAnovelmemberofthecyclin-dependentkinasefamilyinParameciumRTtetraurelia.;RLJ.Eukaryot.Microbiol.46:482-491(1999).评论区CC-CCCopyrightedbytheUniProtConsortium,see/termsCCDistributedundertheCreativeCommonsAttribution-NoDerivsLicenseCC-,16,相关文献编号或递交序列的注册信息,序列注释信息,交叉引用数据库区,DREMBL;AF126147;AAD34354.1;-;Genomic_DNA.DRHSSP;P24941;1OIQ.DRProteinModelPortal;Q9XYV1;-.DRGO;GO:0005524;F:ATPbinding;IEA:UniProtKB-KW.DRGO;GO:0004674;F:proteinserine/threoninekinaseactivity;IEA:InterPro.DRInterPro;IPR011009;Kinase-like_dom.DRInterPro;IPR000719;Prot_kinase_cat_dom.DRInterPro;IPR017441;Protein_kinase_ATP_BS.DRInterPro;IPR002290;Ser/Thr_dual-sp_kinase_dom.DRInterPro;IPR008271;Ser/Thr_kinase_AS.DRPfam;PF00069;Pkinase;1.DRSMART;SM00220;S_TKc;1.DRSUPFAM;SSF56112;Kinase_like;1.DRPROSITE;PS00107;PROTEIN_KINASE_ATP;1.DRPROSITE;PS50011;PROTEIN_KINASE_DOM;1.DRPROSITE;PS00108;PROTEIN_KINASE_ST;1.,17,序列区,KWATP-binding;Cyclin;Kinase;Nucleotide-binding;Transferase.SQSEQUENCE301AA;34675MW;E839F1A5EA0D5CB5CRC64;MDLAQSEERYQKLEKIGEGTYGLVYKARDNQTGDIVALKKIRMDHEDEGVPSTAIREISLLKEVQHPNIVPLKDVVYDESRLYLIFDFVDLDLKKYMESVPQLDRMQVKKFINQMIQALNYCHQNRVIHRDLKPQNILVDIKQQNTQIADFGLARAFGLPLKTYTHEVITLWYRAPEILLGQRQYSTPVDIWSLGCIFAEMAQKRPLFCGDSEIDQLFKIFKIMGTPKESTWPGVSTLPDFKSTFPRWPTPTNPAATLGKDITNLCPLGLDLLSKMITYDPYARITAEEALKHAYFDELNN/,18,与序列相关的关键词,氨基酸统计数,DNA代码,氨基酸代码,19,20,FASTA文件格式,21,在Uniprot中查询拟南芥的光敏色素phyE编码蛋白的详细信息,阅读序列格式的解释,列出共包含哪几个部分?标出头部区主要字段的含义。在Uniprot中查询(1)拟南芥油菜素内酯受体gibberellinreceptorGID1C、(2)水稻独角金内酯水解酶strigolactonehydrolaseD14的蛋白质序列,这两个蛋白包含多少个氨基酸?写出它们所对应的mRNA检索号(类似于这样的格式N*_*)、GeneID号。,作业,二蛋白质结构数据库,PDBProteinDataBank,美国Brookhaven国家实验室管理生物大分子三维空间结构原子坐标数据库/pdb/NCBISTRUCTURE:MMDB(MolecularModellingDataBase),包含了从PDB获取的实验确定的生物高聚物结构分子模型数据库。,PDB数据库(proteindatabank),1.简介美国Brookhaven实验室1971年建立的大分子结构数据库PDB蛋白质晶体结构资料数据库(ProteinDataBank)。PDB数据库的维护由结构生物信息学研究合作组织(ResearchCollaborationforStructuralBioinformatics,RCSB)负责。,2.数据来源通过实验(X射线晶体衍射,核磁共振,电子显微镜方法等)测定的生物大分子的三维结构。主要是蛋白质的三维结构,还包括核酸、糖类、蛋白质与核酸复合物的三维结构。,3.数据统计截止2013年11月,PDB数据库已含有95644个结构数据,其中约92.5%是蛋白质的结构。,4.数据查询PDB中的记录有唯一的PDB-ID,包括4个字符串,可由大写字母AZ和数字09组合而成。PDB和它的镜像站点提供每个PDB记录的查询,可按一些专门的查询项目(如提交数据、作者姓名、结构表达)进行检索。,检索演示,例1:查询人类泪液载脂蛋白的结构数据(1)登陆PDB网站/pdb/(2)在上方的搜索栏选中“Everything”,在文本框中输入“HUMANTEARLIPOCALIN”,单击SiteSearch按钮,出现结果。,第一步:输入关键字“HUMANTEARLIPOCALIN”也可输入ID号,第二步:选择人类泪液载脂蛋白1XKI,数据查看:,(3)分别单击标签3Dview,Sequence,Annotations,Seq.Similarity,3DSimilarity,Literature,Biol.&Chem.,Methods,Geometry观察数据信息。(4)回到Summary标签,在右侧的BiologicalAssembly区域可以观察蛋白的三维结构。(5)单击右侧目录中的DownloadFiles下载不同格式和内容的文件;或下载FASTA序列文件;也可下载PDB文件(1XKI.pdb)。,第三步:观察数据信息1XKI,第四步:1XKI结构展示图,下载PDB结构文件,5.数据结构,PDB中对于每一个结构记录,包含名称、参考文献、序列、一级结构、二级结构和原子坐标等信息。每条记录有两种序列信息,一种是显式序列信息(explicitsequence),一种是隐式序列信息(implicitsequence)。,在PDB文件中,以关键字SEQRES作为显式序列标记,以该关键字打头的每一行都是关于序列的信息;PDB的隐式序列即为立体化学数据,包括每个原子的名称和原子的三维坐标。,PDB文本文件,用写字板打开,标题部分,分子类别转运蛋白,该文件的公布日期,该化合物的pdb代码,该化合物的来源,结构测定者名字,REMARK是此pdb文件的参考书目、最大分辨率、注解等,一级结构,杂因子,二级结构,连接注释,晶胞特征及坐标变换,连通性部分,坐标部分,1-6“ATOM或HETATM”,7-11原子序列号,13-16原子名称,18-20残基名,22链标识符,23-26残基序列号,31-38X坐标,39-46Y坐标,47-54Z坐标,55-60位置,61-66温度因子,79-80原子带的电荷,77-78元素符号,三结构显示软件-PyMOL简介,/,All指所有的对象,3ODU指刚才打开的文件,(sele)是选择的对象按钮A:代表对这个对象的各种action,S:显示这个对象的某种样式,H:隐藏某种样式,L:显示某种label,C:显示的颜色,点击all中的H,选择everything,隐藏所有点击3ODU中的S,选择cartoon,以cartoon形式显示蛋白质点击3ODU中的C,选择byss,以二级结构分配颜色,选择点击右下角的S,窗口上面出现蛋白质氨基酸序列,找到1164位ITD,是配体,点击选择ITD,此时sele中就包含ITD这个残基,点击(sele)行的A,选择renameselection,窗口中出现,更改sele为IDT,点击(IDT)行的S选择sticks,点击C,选择byelement,选择,调整窗口使此分子清楚显示。,IDT行点击A选择find,选择polarcontacts,再根据需要选择,这里选择tootheratomsinobject,分子显示窗口中出现几个黄色的虚线,这就是氢键的对象,点击这一行的C,选择red,把氢键显示为红色。,接着再显示跟IDT形成氢键的残基,点击3ODU行的S,选择lines,显示出所有残基的侧链,使用鼠标转动蛋白质寻找与IDT以红色虚线相连的残基,分别点击选择这些残基。注意此时selecting要是residures,55,在PDB结构数据库中查询(1)拟南
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 天津城市建设管理职业技术学院《环境工程安全生产》2023-2024学年第二学期期末试卷
- 河北司法警官职业学院《创新创业理论与实务》2023-2024学年第二学期期末试卷
- 江西师范大学科学技术学院《材料科学基础应用研究》2023-2024学年第二学期期末试卷
- 伊犁师范大学《工程制图II》2023-2024学年第二学期期末试卷
- 衡阳师范学院南岳学院《环境与化学》2023-2024学年第二学期期末试卷
- 西安医学高等专科学校《会展概论》2023-2024学年第二学期期末试卷
- 中国传媒大学《大众传播调查方法与写作实训》2023-2024学年第二学期期末试卷
- 2024年CO2气体保护药芯焊丝资金申请报告代可行性研究报告
- 劳动技术教育实施途径
- 2024年玉米酒精糟回收蛋白饲料成套设备(DDGS)项目资金筹措计划书代可行性研究报告
- 少儿篮球培训体系
- 大型活动人群安全管理预案
- 急诊突发事件处理流程图解
- 学校创建商业街计划书
- 传染病的早期识别与筛查
- 小学生英语话剧剧本 小红帽 Little Red hat
- 医院保安服务规范
- 2024(商务星球版)地理八年级上册总复习 课件
- 供餐合同范本完整版doc正规范本(通用版)
- 《沁园春·雪》PPT课件下载【优秀课件PPT】
- 新概念英语第二册习题答案全部
评论
0/150
提交评论