ANTHEPROT5.0简单使用说明._第1页
ANTHEPROT5.0简单使用说明._第2页
ANTHEPROT5.0简单使用说明._第3页
ANTHEPROT5.0简单使用说明._第4页
ANTHEPROT5.0简单使用说明._第5页
免费预览已结束,剩余8页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、ANTHEPROT 5.0简单使用说明生物技术2002 房磊 021402144生物的化学,就是蛋白质与核酸的化学。对蛋白质的研究是生物化学领域一 个非常重要的部分。但是众多蛋白质的复杂序列数据,其分析工作是一个非常困 难的工作。用人工的方法是很难完成如此大量的分析工作的。运用计算机,利用一定的运算规则,对众多的蛋白质序列数据,进行蛋白序列分析就是最好的解决 方法。蛋白序列分析软件包ANTHEPROT 5.0正是这样的一个程序包。蛋白序列分析软件包ANTHEPROT 5.0是法国的蛋白质生物与化学研究院(In stitute of Biology and Chemistry of P rote

2、 ins)开发的蛋白质研究软件包。软件 包包括了蛋白质研究领域所包括的大多数内容,功能非常强大。应用此软件包, 使用个人电脑,便能进行各种蛋白序列分析与特性预测。包括:进行蛋白序列二级结构预测;在蛋白序列中查找符合 PROSITES数据库的特征序列;绘制出蛋 白序列的所有理化特性曲线;在In ternet或本地蛋白序列数据库中查找类似序 列;计算蛋白序列分子量,比重与各蛋白残基百分组成;计算蛋白序列滴定曲线 与等电点;选定一个片段后,绘制 Helical Wheel图;进行点阵图(Dot Plot) 分析;计算信号肽潜在的断裂位点等功能。更重要的是此软件包为免费软件。软件分为三个版本,分别用于

3、Unix系统,DOS系统与WINDOWS95或98 系统,以用于WINDOWS系统的版本为例,介绍一下这个软件的基本用法。软件包为一个自解压执行文件,文件名Anthe_5_0.exe,大小为2,013,184字节。执行此文件,输入解压后存放的目录名,便可将所有文件解压在此目录下。其文件如下图处。11111 11 CLUSTAL HUE画BATk (MSMDIOLnEECTHER. E3EUTTHE JOAHTHHVIN .ATFMEFl .BAIBOCH EJEEKSTABASTA EXECLUSTU.CIJOALttnJOHOL. EXIHOST. ESnCUETALW.CfflKKLOG

4、.CEll. FDSDATA. 3DDATA DAYDhTh. DPn詞Data. SigMA. EXEEAWQFF.lAEDEFAULT. BASdie ant.出PASTAnFAST丸 EXEFsaotke-t.TENfPPILE .软件运行后的主程序中按钮回HTEJCr.ULTAUXFEflT.SEQ到FEflTEISf¥_ .KECHEETHEEID VEX但是在软件目录中的自解压压缩文件區Vi«3d.vbc是极其简单的相关介绍,基本无任何用、exedoc ant.exe 文件,可以解压在另一个目录,是HTML格式的介绍文件,对软件进行了一些较详细说明介 绍。如图a

5、cCEssib,.aide i cm .ilhali._icQ. JPGQi 时en.ad.j西enJi pmen.allien.All网EHQigrUTIEIl.aligjul 弧QI i CQEl.d.1 meth All nAntlepro.Anil gem.anti genii.antigeai.Back s J.sblast, bmjBlast, gifcljTage. JPGCLueIcomliined.conieiLsu. . . Couv_aiLii.eiEIlocLiiieiita.linn_aidl4pra!:也1 _lot_i co. JPGdot matr.-K

6、3;iFl_neth., DFIIIjpara.DFMjrof.edi tar gifeKit ICO” .Fast 直.htiJi,DPI(fasta JPGFIU11运行 Documentation_antheprot.html即可。AHTHEtflH. EXEANTHEPROT 5.0主程序名为Anthewin,双击便打开了ANTHE PROT 5.0主窗口。也可以在桌面上建立它的快捷方式,双击快捷方式运行 主程序。通过主程序,我们可以载入蛋白序列,对序列进行编辑、打印、拷贝、改 变设定等操作,可以在此调用各种所需的分析工具,对蛋白序列进行分析。 一.序列编辑功能ANTHEPROT 5.

7、0的主窗口便是其序列编辑窗口,如图:1Jji±n-t Ed. L-t <ir =1Eil- Kdit尸yjpa回可以使用按键或菜单中的File/0pen(或快捷键Ctrl+0)命令打开各种序列文件(其他按钮在后面说明),程序识别的文件类型包括:单序列文件格式:*SEQ,(ANTHEPROT 3.3支持以下格式的单序列文件: DNA/Strider 格式、EMBL 格式、NBRF 格式、Pearson/Fasta格式、PIR 格式与 IG/Stanford 格式);含有多个蛋白序列的蛋白数据库文件:*.BAS,(以Pearson/Fasta格式添加序 列,上限为30条序列或32K

8、文件大小);ClustalV或ClustalW 文件:*.ALN 含有ClustalW格式的多队列;含有多队列的Multalin 4.1格式文件:*.MUL ;在Prosite蛋白数据库中查寻出Site结果的文件:*.SIT,蛋白质原子空间结构的PDB格式文件:*.PDB ;使用IBCP (http:/wwww.ibcp.fr/predict.html)服务器预测蛋白二级结构所获 得的结果文件格式:*.CNS ;序列可以从ANTHEPROT编辑窗口以键盘输入,或者以*.SEQ等文件格式 载入,也可以从其它文件复制粘贴到编辑窗口。最简单的序列格式为 Pearso n/Fasta格式,为文本格式文

9、件,带有 > 开始的为序列蛋白的名称,其后便 是蛋白序列。下面为一个此格式的例子:>MBNVLSEGEWQLVLHVWAKVEADV AGHGQDILIRLFKS HP ETLEKFDRFKHLKTEAEMKASEDL KKHGVTVLTALGAILKKKGHHEAELK PLAQSHATKHK IP IKYLEFISEAIIHVLHSR HPGDFGADAQGAMNKALELFRKDIAAKYKELGYQG程序支持的一些编辑功能如下:取消,恢复(Un do): Ctrl+Z。查找 Ctrl+T。支持复制与粘贴。可以自定义字符颜色,背景色与打印字体。可打印序列文件。输入或载入序列后

10、,便同时打开了一个图像窗口,以彩图的形式显示出蛋 白序列。不同的蛋白残基以不同的颜色表示。下面便是打开一个序列后的主程序 窗口的例子:副 ,!祕妣心屬厠曲jjEile EmitHelhods lalatasfs > iHelpSB 囚 團 画IB EE iBirsjQi 圉 a a a> UN KNOWMRIKRTSNR SN AAR RVR T T AVLAGLAAVAAL AVP T AN AE T PR T F SAW QLT AAS D AVLGADIAGT Alt) HI DPQSKRLWT SrVSKAEINOI KKSAGATJADALRIERTPGKFTKLrSGG

11、DAIYSSTGRCSLGFNVRSGSTYYFLTAGHCrDGAT TWHAW RrTVLGrTSGSSFIFNHDYGIVRYTNTTIPKDGTVGGODrTSAAMATVGMAVrRRGSTTGrHSGSVTALNATVHYGGG YGHTRINVCAE PGDSGGPLYSCTRAIGLISGCSGHCSSGGTTFFQPVTEALSAYGVSVY3 C:TMFFflOr. SBQ10203040HRIKKT3HRSN1ARPVRTTAVLA0L kkVAAL AVPTANAETPETF3AHQLTJLASDAVLGAMl二.工具栏与基本功能当序列格式识别后,Methods菜单便被

12、激活,相应的快捷按键也出现在工具 栏中。如果序列格式未能识别则不会出现下图中新的工具按钮。 園Ml EB四S匹回匡圄这些按键依次为:打开文件按键当;存储文件按键回打印按键創;更改字体与格式按键更改设定颜色按键进行蛋白序列二级结构预测Aj ;在蛋白序列中查找符合P ROSITES数据库的特征序列绘制出蛋白序列的所有理化特性曲线HE;计算蛋白序列分子量,比重与各蛋白残基百分组成UbI ;在In ternet或本地蛋白序列数据库中查找类似序列计算蛋白序列滴定曲线与等电点H;选定一个片段后,绘制Helical Wheel图 C进行点阵图(Dot Plot)分析计算信号肽潜在的断裂位点打开一个简单的帮助

13、文件退出程序.基本分析工具介绍除了通过单击快捷按键的方式进行各种蛋白序列分析,通过菜单进行各种 操作也非常方便。下面让我将一些主要分析工具的功能介绍一下:1.点阵图(Dot Plot )Dot Plot分析方法对以下分析工作非常有用:在一条序列内查找重复序列;在2条序列中不同位置查找类似片段; 在不同序列中查找同源性。,运行Dot Plot程序,可再选择要进行比较的第二条序列。只有当程序载入一条序列时,才可以激活Dot Plot程序,选择菜单命令DotPlot或单击按键然后,再确定参数与限制条件,包括:窗口尺寸:移动片段的长度矩阵:选择替代矩阵下图为含有两个蛋白酶序列的点阵图,两个酶具有同源性

14、,因为由点阵图 可以看到,基本上有非常好的斜线。但由于此斜线的位置开始于位置115,很容易知道,水平轴的蛋白序列含有前体(由 1到第114个残基组成),也清楚地看 到,它们具有一个小的内部重复片段(图上非常短的红线)。Hindav; 23X: 152 PK0TETNY YFLTaGHCTDGaiTHWBNSMtTT2. 类似性查找(Similarity Search此程序用来在一个蛋白数据库(可以是本地数据库,也可是网上的数据库) 中,找出所有与给定序列具有同源性的序列。选择菜 单命令 Methods/Similarity Search/WWW or Local Fasta,或者 Method

15、s/Similarity Search/WWW-Blast at PBIL NPS server 便实现在蛋白数据 库中对类似性蛋白序列的查找。需注意,如果在本地蛋白数据库中查找,需要先 下载SwissProt蛋白质数据库。Prosite蛋白数据库1.4兆与Swiss-Prot蛋白数 据库41版,85.7兆左右,压缩格式下载后,将其放置在 ANTHEPROT 5.0同 一个目录,便可在本地使用程序的检索功能。按键或选取菜单命令 Methods / Site detecti on (P rosite),便进行位点与特征序列的查找。程序查找给定序列是否存在 PROSITE数据库中已定义的特征序列,

16、缺省设置为100%匹配,也可设定为Mismatch 1 or 2( 到两个不匹配)或者Similarity level (类似水平)。当前PROSITE 数据库是95年2月发布的,共1054个不同位点与特征序列,含有两个文件, PROSITE.DAT与PROSITE.DOC。此两个文件必需均放在 ANTHEPROT程序的 目录下,程序才能进行。下图为查找结束后程序输出的结果: 绿色的文字可连接到3. 查找 Site/signaturePROSITE文件中相应的位置。ox JUSiteSite :SiteJ £L-UJ J /424to423465to47C502to507在 ANTH

17、EPROT 主窗口单击9用丄 HI.ZUSU-VUU. 盃.OU U3G<3KVTEObserved frequency: 1.14E-aD5GSFEAA Observed frequency: 3.9 2E-00 5GILDSFObserved frequency; 1.02E-005iTPzGTP=bindtng site aotif b. (P-1 cop) PS00 0174G-it(4)-G-E-STJTheoretical frequency:1.09E-004Site -169 to 176 GDRQTGET Observed frequency- 2.42E-005ATP

18、 synthase alpha and beta subunits signature PS00152P-SAP-(3)-S-K-STheoretical frequency:5.70E-007Site :366 to 37E PAVNPGISV5 Observed frequency: 5.20E-003Elaspel searching time, e . 12e&24SB409424 Sec.需要知道的是,蛋白序列中找到的特征序列并不一定具有生物学意义,只 能说,查找的结果对寻找潜在的有意义片段具有很大帮助。4. 在序列数据库中查找一个自定义的特征序列:Pattern searc

19、h选择菜单命令Databases/Patternsearch,便开始在网上的蛋白数据库或本地 蛋白数据库中查找含有自定义特征序列的蛋白。所定义的特征序列必需符合 PROSITE规定的语法。语法规则如下:-位置分隔符;-允许此位置为括号内的任何一个残基;- 允许此位置为除了括号内所包括的任何一个残基;-x代表任何残基;-x(3)代表任何3个氨基酸残基,根据以上语法,如果要查找的特征序列为 N- PT-GM-x (2)-ILVM,贝U序 列 N-P-K-G-H-V, N-T-L-K-G-M 将能够找到,而序列 N-L-K-G-H-V , N-T-G-K-H-V 将不能找到。查找结束后,所有找到的序

20、列将以 Pearson格式,以SEQ_x.BAS 为文件名存储在硬盘中。5. 预测物理化学特性曲线An the prot可以以图示的方法,显示出预测的蛋白质的物理化学特性曲线,下图为一个亲水性特性曲线的例子。在图中,一个可移动的光标,显示了目前在序列中的位置为115,此位置的氨基酸残基(L)显示为红色,同时显示前 5个 与后五个残基(为AIIHVLHSRHP ),特性值(-7)与参数(5)也显示在图中。N* 115 AA : AlfHVLHSRHPHTrophili点忡-7Windo理吕14b光标可以如下方式移动:鼠标左键在选定位置单击;方向键左或右为每次移动一个位置; Shift+方向键左或

21、右为每次移动十个位置; 方向键上或下为放大缩小。可显示的物理化学特性曲线包括:亲水曲线(Hydrophobicity profile )疏水曲线(Hydrophilicity profile )易溶性曲线(Solve nt accessibility p rofile)抗原性曲线(Antigenicity profile )跨膜区域曲线(transmembranous regions profile 结合抗原性曲线( Combined antigenicity profile)6. 二级结构预测An the prot提供了几种方法进行蛋白质二级结构预测,包括:GOR I 方法:在菜单中选择 M

22、ethod/Secondary structure prediction/Garnier et alGibrat 方法:在菜单中选择 Method/Secondary structure prediction/Gibrat et alDouble Prediction Method -DPM 方法:在菜单中选择 Method/Secondarystructure p redictio n/DPMHomologue 方法: 在菜单 中选择 Method/Secondary structure p redictio n/Levi nPredator 方法:在菜单中选择 Method/Seconda

23、ry structure prediction/ P redator 或全部使用以上几种方法:单击 几按键或在菜单中选择Method/Secondary structure prediction/AII,其快捷键为 Ctrl+L。五种方法的输出形式分别举例如下:GOR I 方法 400too-zoo-400Sheet -312 Turn -113 CollIVDGibrat方法3AA LnOflC TVITA State HHHKH HHHIDISheet12 Coil-12240012000 £卜 ° X H- - - -iAr V-*- 小-200Aya a j/ 7沖

24、 Aa; X * '"K/n-4-00-V1 1110VDouble Prediction Method -DPM 方法AA LKTEA MKASE State HHHKH HHKHKShfi«t -141 Turn -21 Coil -114D0XPO000mooHomologue 方法U = DLlOai VT¥1TState : nODIC CKKHHSheet阴曲lurnfl4,iiveun _ - _-_-一10i»oa_r.-.4- -H_ _ - d_ > - 一 一、"f_-n需04-Z -c-=-=-z.-_s_

25、UH100P redator 方法AJL 匚匚站M SSWT State BSEBI CCCCCpvobbility (kIOOO) M3全部使用以上几种方法的输出形式为上图中加入了自定义的由 X射线衍射法确定的二级结构图,可以显示在一GOR I method >DPM methodN* 扫 AA : tSHPE LEKFD State,CCCCC-HHHHHIIGibrt methodHomologue methodCCCCC HHHHCXRav method100个窗口,与其它预测的二级结构相比较。自定义的二级结构由以 *XRA为扩展 名的文件输入。其格式为Pearson/Fasta

26、fc件格式,下面是一个*.xra文件的例子,>Myoglob in CCCHHHHHHHHHHHHHHTTSHHHHHHHHHHHHHHHCHHHHHTCHHHHTCCSHHHHHHCHHHHHHHHHHHHHHHHHHTTTTCCHHHHHHHHHHHHHTTCCCHHHHHHHHHHHHHHHHHHCTTTTSHHHHHHHHHHHHHHHHHHHHHHHHHTCCCH代表螺旋,图中表示为蓝色;E代表折叠,图中表示为橙色;T代表转角,图中表示为绿色;C代表其它松散结构,图中表示为黑色。7. 计算蛋白序列分子量,比容与各蛋白残基百分组成 程序可以非常方便地对蛋白序列进行分子量,比容与各

27、蛋白残基百分组成的计算。单击 |弟一按键或选取 Methods/AA Composition, specific volume, M.Weight便进行计算。快捷键为Ctrl+M。 输出形式如下:站.匚3eLection Ln procetntrWKHOlONAl 1to kA 300HRrKFT3WP3I0AXPFVPTrJlVLX(JLAAUAALXV 卩 TANACTPHTfS AWQL 丁AA号DJJ7LG直D rAGTAUHIDPQSERLNVTVDSTVSKAE rHQIKESlGAEJABkLI?lEETPCKrTKLlSGGDkIYSSTCRC£LCFHVRS(STY

28、YfLTA(HCTDGATTOAN3ARTrVL(jTT3G33FIPNTJDTGIVPYTTIPKDGTVMQDIT3 kJdJATVCHAVTRUGETrCTHS GEVrALNATVWYCGGDWYGH IRTWVCAEPCD3&GPLT3(jTBAI&LT3GG5eNC33GOTT?rQFVTEAL5AT5V3VYJtuninD acidMiuntierAlaA)30Asx (E)D0CVSC斗Asp (D)124Ulu £)5PhcfD7£33Gig37L2.33His H2eellE(I)141.66LYSK5LeiiL)IS5Nec Tl)31A3hN)17565Pro (P)g3Gln(Q)5166Arg(E)106S宜匚S30ICIhr T)013.33Vai VJ237.66丁 rpVJ31Unfc(Z)00丁Tt TID3.33GIx Z)008. 计算蛋白序列滴定曲线与等电点ANTHEPRO5.0还可根据一定算法,对输入的蛋白序列计算其滴定曲线与等电点。 单击!按键或选取Methods/Titration curve便可进行计算,快捷键为 Ctrl+U。 输出图形如上图a。9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论