




免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实验八、蛋白质的结构(3学时)目的:了解分子三维结构的重要性,了解如何进行蛋白质的二级结构预测以及发现与自己的蛋白序列最适合的三维模型,学会运用结构浏览软件对生物大分子的结构进行观察。内容:预测一个蛋白质序列的二级结构,从PDB站点检索并显示相应分子的三维结构,对蛋白质序列的三维结构进行猜测,观察蛋白质的三维结构及其序列特性。一、 蛋白质序列的二级结构预测蛋白质的二级结构预测已取得了巨大的成就。如今,利用Hidden Markov Models and neural networks方法,一些相当好的网上服务器可以对你感兴趣的任意一个蛋白质序列的二级结构进行准确的预测(注意:如果你的蛋白质与现有数据库中的记录有足够的同源性,就可以认为其二级结构的预测有近80%的准确性。但是,记住这只是个预测,与其它的预测一样,它们的准确性与估计值是有出入的)。我们以PSIPRED为例(预测最准确的服务器之一)来进行蛋白质二级结构的预测。1、 将你感兴趣的蛋白质序列以FASTA格式存储于一个.txt文件中。(比如NP_360043)2、 进入由 Bioinformatics Unit of University College in London (UK)维护的蛋白质结构预测服务器 http:/bioinf.cs.ucl.ac.uk/psipred/ . 点击页面下方的Click Here to Access the Server链接。3、 将你的E-mail address 填在新出现的输入表格页面的上部相应字段里(服务器将结果以E-mail的形式返回给用户)。4、 将你的蛋白质序列粘贴到Paste PROTEIN Sequence Here窗口中(注意:此处不需要FASTA 格式的头部注释行)。5、 你可以在序列窗口下方的字段中为此次预测(你的序列)起个短名。6、 点击Predict。如果事情顺利,则会跳出一个新页面通知你的预测工作已被提交,结果会发送到你所提供的E-mail帐号中。同时还会给你报出一个工作完成的大致时间。缺省条件下,服务器执行二级结构预测方法,即PSIPRED。当然,如果你有时间,可以选择其它的三种预测方法:一种预测跨膜片段的方法以及两种识别折叠的方法。7、 查看由psipred$.ucl.ac.uk发回的预测结果(你的e-mail,如果收不到,请参看实验数据-实验八中的message from PSIPRED.doc文件中查看)。这是一个简单的文本文件,除你的序列外还有两行额外的信息,它们与序列的每一列一一对齐。Conf(The confidence)行:由0到9的数字组成,表明了每个位置预测构造的可靠性(9为高0为低)。Pred(The predicton)行:由H、E和C三种特性组成,显示了每一个残基预测的构造。H=Helical, E=Extended, C= Random coil。Note: There are three types of local segments:Helices: Where residue seem to be following the shape of a spring. The most common are the so-called alpha helices.Extended or Beta-strands: Where residues are in line and successive residues turn their back to each otherRandom coils: When the amino-acid chain is neither helical nor extended.除此之外,PSIPRED还创建了一个便于发表使用的图形显示的结果。你可以在你的PSIPRED E-mail的末端发现这样的内容:Calculate PostScript, PDF and JPEG graphical output for this result using http:/bioinf.cs.ucl.ac.uk/cgi-bin/psipred/graphics/nphview.cgi?id=.点击此处的链接,你就可以进入PSIPRED结果页面,它提供了三种不同格式的图形文件供你下载:PostScript File, PDF File and JPEG page. 由于我们的机子已经安装了Acrobat Reader,因此可以直接点击相应的链接(注意,预测的图形文件在原服务器上的保存时间只有一天左右,如果不能找到相应页面,则可以使用实验数据-实验八中的NP360043 second structure predict.PDF文件查看)。图形结果中的conf行以柱状谱的形式表示,同时增加了一行用清晰的符号表达的pred行。二、 利用更复杂的网上服务器预测其它的序列特性如果只需要快速得到诸如“我的蛋白质的二级结构是什么样子的?”这类基本问题的答案,PSIPRED无疑是个理想的工具。然而如果想知道更多的你的蛋白质中的其它特性,则要转去其它的网站。The PredictProtein server也许是进行蛋白质结构分析中最复杂的站点了,然而由Columbia University维护的原始网站非常繁忙,对你提交的预测工作的响应时间可能超过一两天。好在PredictProtein server在世界各地有很多镜像站点,包括欧洲、美国、亚洲以及澳大利亚。下面是一些PredictProtein server的网址:Europe: www.embl-heidelberg.de/predicprotein/ www.cmbi.kun.nl/bioinf/predictprotein/ USA: /predictprotein/ /predictprotein/ .你可以用一条序列试一下哪一个服务器比较适用。一般说来,PredicProtein的缺省分析包括了如下的内容:* A secondary structure prediction on the three conformational states (H=Helical, E=extended, and C=Random coil)* A prediction of the solvent accessibility of the various residues* A prediction of transmembrane helices and their topology* A prediction of globular regions in your protein* A prediction of the coiled/coil regions of your protein* A description of the PROSITE motifs matching your sequence (for more on PROSITE mitifs)* A description of the putative domain structure for your sequence (Prodom domain)* A prediction of bound cysteines (disulphide bonds) in your sequence* A description of the composition-biased regions in your sequence注意:上述各种特性是否能在返回给你的结果中显示依赖于你的查询序列中是否含有它们。三、 在PDB站点上进行蛋白质3D结构的检索与显示Protein Data Bank (PDB) 是所有结构生物学家都认可的3D结构公共数据库。就象所有的分子生物学家都要将他们的序列数据存储于GenBank/EMBL/DDBJ那样,所有的3D结构数据也都存储于PDB中。然而,PDB提供的界面并不是为非结构专家设计的。你可以通过PDB的站点对一个蛋白质的3D结构进行检索。但检索前必须了解你要查找的结构的一些准确信息。比如准确的蛋白质名称,如果知道它的PDB ID(identifier)就更好了。你可以通过具有友好的用户界面的ExPASy/SWISS-PROT服务器或利用各种NCBI查寻工具得到结构的ID。这里我们要查找的是E.coli的TolB蛋白的结构,它的PDB ID 是1CRZ(想一想,给定了蛋白质的名称TolB及物种,我们如何得知它是否具有3D 结构数据?如何得知其在3D结构中的ID?)。1、 进入PDB的主页(/pdb/ )。2、 在Search the Archive下侧文本框内输入1CRZ (PDB ID of this protein),点击Search。在输出的结构中,上部给出了一些著录信息,描述了这一记录的内容。随后更多的是描述我们难以理解的晦涩的结晶参数的技术数据。这里,我们只想知道这一蛋白分子在3D水平上是个什么样子。3、 点击右上角的3D图形图标,则出现了一个浏览页面,可以使用多种交互式的3D结构格式(VRML,RamMol等)显示你的分子(我们会在本实验指导的后面介绍这种交互式方式)。现在,我们仅使用最简单的方式:显示静止的结构。4、 在静止图像的下方,点击Ribbons (500X500)链接。你的结构图像会以带状形式显示。你也可以利用cylinders选项以柱形形式显示你的蛋白质中的螺旋结构区域。5、 保存图像,在图像上右键点击鼠标,选择保存文件的格式、文件名称及保存目录。(注意:PDB文件不易被非结构专家所阅读。它们的内容相当冗长,包含了大量的数据,比如结构中每一个原子的三维坐标以及它们之间的联系信息。如果你确定你要下载一个PDB文件,就可以的页面左侧栏中找到相应的操作链接(Download/Display File)在页面左侧,有一项显示序列信息的链接(Sequence Details),点击它,你可以看到这一序列中实际的二级结构。你可以将它与前面我们预测的NP_360043的二级结构进行比较(想一想,为什么我们可以对这两个蛋白的二级结构进行比较?如何知道这两个序列的相似性以及两个序列上相似性区域的位置?)。四、 猜测你的蛋白质可能的3D结构尽管我们能够检索并显示一个PDB结构,但我们还是不能了解我们的序列在三维形式中会是个什么样子。我们假定已经确定了蛋白质的序列及其二级结构,目前我们的问题是:它是如何进行折叠的?回答这个问题可以使用一个简单的方法,即在已知3D结构的PDB数据库中查找你的同源蛋白质。假设我们已经测定了细菌Rickettsia conorii中TolB基因的序列,我们很想知道它的结构。就可以:1、 从NCBI上得到其蛋白质序列。(其AC号为NP_360043)2、 进入NCBI的Blast服务器主页,选择Standard Protein-Protein BLAST blastp链接。3、 在Choose database下拉菜单中确定PDB(作为目标数据库)。4、 将TolB序列或其AC号输入blastp查询窗口。5、 取消Do CD-Search框前的选定。6、 点击BLAST!7、 点击Format!在结果中有两个E值远小于1的匹配信息。分别是PDB的记录1C5K和1CRZ。点击匹配记录中的链接,则可以得知它们都是E.coli的TolB蛋白,其结构是由两个不同实验室确定的。这个结果非常有意思,因为:A、PDB记录中的同源序列与我们的查询序列的残基同一性达到了29%;B、同源区域覆盖了整条序列。经验告诉我们,拥有29%的同一性残基,我们的查询序列(the Rickettsia TolB)的3D结构可能与它的E.coli同源物的3D结构相类似。因此我们就可以用这个3D模型指导我们的工作。五、 以3D方式浏览蛋白质的序列特性一个蛋白质序列本身就表明了一段重要的信息,而当你将这个蛋白质序列与其他各种不同物种的蛋白质序列进行比较时,这种信息就变得更有启示更有价值了。前面我们讲过,多序列比对的作用是鉴定序列中最具有意义的区域,保守的残基(或那些高度可变的残基)经常成为预测及了解一个蛋白质功能的关键。进一步来说,通过这些保守残基在空间上精确定位,能够为揭示它们的生物学作用提供额外的线索:比如它们可能描述了存在于蛋白质表面的酶的活性位点凹穴,能够与其它分子相互作用。序列相似性及结构相似性。事实上同源蛋白质的3D结构是相当固定的,这种结构上的保守性要比相应的氨基酸序列的保守性还要大。当蛋白质序列在跨越其序列大多数残基的最优比对中表现出少于50%的同一性残基时仍然能够表现出3D结构的同一性。当你拥有在一个完整的结构域(domain)上具有25-50%同一性的序列时,它依然可能利用了已知的3D结构,只是在蛋白质表面的环状结构中会有显著的变化。因此,下降到大约20%的残基同一性时,确定蛋白家族中一个成员的3D结构会为家族中的其它成员提供一个良好的模型。然而,当低于20%同一性这一界线时,双序列比对的结果就不太可靠了,而其3D结构则可能有也可能没有保持高相似性。因此我们称之为朦胧区(twilight zone)。尽管还未能真正理解其原理,但是大家都接受的一个概念是蛋白质折叠(protein folding)的稳定性与其序列的变化相关。一个经常使用的解释是进化会对蛋白质序列进行自然选择,因此序列的突变会尽量不造成结构的改变。另一个解释是比较给定长度的各种不同的序列组合(对一个含100个残基的蛋白质来说有20100种组合情况),序列肽链的内部特性会强烈地限制不同折叠模式的数量。因此相似的序列只能以相似的结构进行折叠。我们利用TolB蛋白家族(of relatively unknown function)的例子来说明多序列比对与结构分析中的相互影响。(一)、家族蛋白质间的多序列比对。1、 首先,我们从不同的细菌种中拿到几条TolB同源序列。a. Open a window in your browser nd go to .b. Choose Protein from the drop-down Search menu.c. In the query window, type in the following identifiers: NP_360043(R.conorii), P19935(E.coli), NP_404737(Y.pestis), NP_249663 ( P.aeruginosa ), NP_438543(H.influenzae); click Go. (NOTE: create a right syntax to get these sequences once)d. When the answer is returned, change the Display format to FASTA and click send this page to Text .Five TolB protein sequences are now ready for use. Now we can build a multiple alignment of these sequences.(NOTE. USE the first ID NP_360043 as a query sequence, do blastp search in nr databases. Find the other ID numbers in the results, check the HSP regions among these proteins and every protein sequence length).2、 Open a new browser window and go to rs-mrs.fr/Tcoffee .3、 Hover the mouse over Make a multiple alignment and click Regular.4、 Copy the five TolB sequences from the other browser window and paste them into the Tcoffee input widow (Be sure to include their FASTA headers.).5、 Click Run Tcoffe (at the bottom of the form).6、 After The results of Tcoffee form appears, choose HTML from the Multiple alignment output choices.This displays the multiple alignment in color with the most reliable regions in red. It clearly reveals a segment of strictly conserved (invariant) residues (FSPDG) shared by all these TolB proteins. Our challenge is to figure out WHERE in the TolB structure these residues are located.(二)、利用交互式方法显示一个PDB结构。为了解释在我们的TolB蛋白内部的一个保守片段的意义,我们必须能够显示它的3D结构,并利用交互式界面使其任意的旋转以便于我们能够从各个角度进行观察。我们必须能够突出显示我们所发现的有意义的残基。1、 First of all, you should check your computer if the 3D structure viewer software such as Cn3D have been installed. If not, 更新你的课程相关内容.rar,利用实验数据-实验八中的Cn3D安装文件(Cn3D-4.1.msi or )进行软件安装。2、 Point your browser to /Structure .3、 In the Search bar at the top of the page, leave Structure in the first drop-down menu and enter the PDB code of your relevant model in the accompanying text field. For our example, well use 1CRZ.If you have the choice of several structures, a simple rule is to choose the one with the best resolution; for our example, the best resolution is 1CRZ(1.95 Angstrom). (NOTE, you can get this ID in some other ways, do you know how to get it? Protein known protein sequence cross-reference and Blast with PDB sequence)4、 click Go. Wait for the new page to appear.5、 Click the 1CRZ link. 6、 Click the view 3D Structure botton.在MMDB页面的上面,显示了与1CRZ PDB 记录相应的3D结构。你可以通过鼠标的移动来使你的蛋白质产生不同位置的旋转。7、 利用窗口上部菜单条的下拉菜单将图像进行放大或缩小,并可改变蛋白质结构的显示外观(带状、管状、球棍状等)。8、 Save a picture by choosing Export PNG from the File drop-down menu in the Cn3D window.将你的蛋白质以图像文件的形式进行保存以便于在报告中进行引用。这一软件是本
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年手术室护理实践指南试题
- 卫生公共基础试题及答案
- 王者荣耀试题及答案
- 土木专业竞聘试题及答案
- 2025年双方含未成年子女离婚赡养费协议书
- 2025年成都市教育设施扩建征地补偿策划协议书
- 2025年废物处理合作协议
- 2025年水产购买协议书模板
- 2025年官方授权支付协议模板策划大纲
- 2025年品牌权益并购协议
- 2022年7月国家开放大学汉语言文学本科《中国当代文学专题》期末纸质考试试题及答案
- 2025年国务院国资委冶金机关服务中心(局)招聘1人历年自考难、易点模拟试卷(共500题附带答案详解)
- 高中文言文实词120个
- 中考数学-规律探究型问题(2种命题预测+17种题型合集+专题训练)(含答案)
- 建筑与环境设计专题知到智慧树章节测试课后答案2024年秋宁夏大学
- 2025年中国国际货运航空股份有限公司招聘笔试参考题库含答案解析
- 2025湖南省建筑安全员考试题库附答案
- DBT29-306-2022 天津市公路公安检查站设计标准
- 《水泥制品养护固碳技术规范》编制说明
- 2025年全球及中国电池包用防爆阀行业头部企业市场占有率及排名调研报告
- 辽宁省沈阳126中学2025届中考生物考前最后一卷含解析
评论
0/150
提交评论