蛋白质组学数据分析和操作流程_第1页
蛋白质组学数据分析和操作流程_第2页
蛋白质组学数据分析和操作流程_第3页
蛋白质组学数据分析和操作流程_第4页
蛋白质组学数据分析和操作流程_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、蛋白质组学数据分析和操作流程1.蛋白质组学质谱分析背景介绍2.蛋白质组学数据库检索软件GPM(X!tandem)3.蛋白质组学数据统计分析软件TPP课程内容:蛋白质组学质谱分析背景介绍Tandem MS蛋白质组学质谱分析背景介绍m/z:质量电荷比蛋白质组学质谱分析背景介绍粘贴蛋白序列:PGYRNNVVNTMRLWSAKAPNDFNLKDFNVG 选择“Only the following selection of enzymes and chemicals”,并选择胰酶Trypsin酶切点击Perform蛋白质组学质谱分析背景介绍APNDFNLKv1-lettercodeAveragemass

2、AlanineA71.08ArginineR156.19AsparagineN114.10Aspartic acidD115.09Asn or AspBCysteineC103.14Glutamic acidE129.12GlutamineQ128.13Glu or GlnZGlycineG57.05HistidineH137.14IsoleucineI113.16LeucineL113.16LysineK128.17MethionineM131.19PhenylalanineF147.18ProlineP97.12SerineS87.08ThreonineT101.10Selenocyste

3、ineU150.03TryptophanW186.21TyrosineY163.18ValineV99.13蛋白质组学质谱分析背景介绍具体数值,对应后页中离子质量蛋白质组学质谱分析背景介绍蛋白质组学质谱分析背景介绍蛋白质组学质谱分析背景介绍?面对如此多的质谱谱图和理论图谱我们将如何进行比对目前人类已知蛋白大约有6万8千种平均每种蛋白长度为500个氨基酸平均每种蛋白可以胰切成50个肽段平均每个肽段有10种可能打碎情况每一种可能情况产生一张理论图谱平均一次质谱实验有3000次扫描每一次扫描产生一张质谱谱图蛋白质组学数据库检索软件GPM(X!tandem) GPM(X!tandem) SEQUEST

4、 Mascot类型 免费开源软件 商业软件 商业软件数据输入 DTA,PKL,MGF RAW,DTA MGF,DTA mzXML,mzDATA速度 快 较慢 较慢并行运算 支持(PVM,MPI) 支持(PVM) 支持(MPI) 蛋白质组学数据库检索软件X!Tandem优点:运算速度快免费,并行集群计算成本低开源可自行修改代码缺点:应用范围尚不广泛后期统计软件接口尚未成熟蛋白质组学数据库检索软件硬件要求:当前主流电脑配置即可胜任小规模数据检索Slave nodesMaster nodeNetwork switchingDownload GPM:蛋白质组学数据库检索软件蛋白质组学数据库检索软件数据

5、库、结果程序等核心内容运行程序质谱原始数据解压缩: C:/ZCNI_tranning/X!tandem/数据库目录蛋白质组学数据库检索软件输出结果目录数据库参数工作流程:将 *.raw 文件转变为 *.mzXML 文件 (练习文件为肝癌蛋白质组学数据) 2. 编辑参数3. 运行 GPM中的X!Tandom4. 查看结果5. 使用自己的数据库蛋白质组学数据库检索软件1. 将 *.raw 文件转变为 *.mzXML 文件开始运行输入“cmd” 开启命令行窗口Download:2. 编辑参数双击打开One spectrum:搜索一个质谱数据One directory:搜索多个质谱数据,放于一个文件夹

6、中,然后压缩成一个rar文件谱Simple:仅简单的设置一级肽指纹图谱相关参数Advanced:设置搜索二级图谱所有参数Upload:查看以前的搜索!点击advanced 选择搜索二级谱选择程序X!Tandem选择需要搜索的质谱数据DTA, PKL, MGF, mzData, mzXML or Tandem BIOML 选择数据库数据检索输出阀值搜索的离子为b离子与y离子二级谱中片段离子理论与实际差异最大允许值一级谱中片段离子理论与实际差异最大允许值(|0|/M0)X10(ppm)为离子质量的实测值;为离子质量的理论值;氨基酸残基的修饰完全修饰潜在的修饰氧化,磷酸化等等57.03404 15.

7、99492 快速搜索可能的修饰蛋白酶解时所使用的酶(胰酶)非特异性酶切漏切3.运行程序点击运行运行界面4. 查看结果结果可靠性的统计指标以及强度蛋白的覆盖率蛋白检索号对应肽断总数蛋白分子质量唯一对应肽断数5.替换数据库下载蛋白数据库存放到本文件夹(所使用fasta数据库为所研究种属的蛋白数据库,可从下载得到)用记事本打开参考文献:蛋白质组学数据统计分析软件Trans-Proteomics Pipeline (TPP) Trans-Proteomic Pipeline (TPP)是用于LC/MS/MS蛋白质组学数据分析的软件. TPP包含一系列蛋白质鉴定和定量分析的模块, 能够对经Sequest

8、数据库搜索引擎得到的结果进行筛选过滤,从而达到蛋白质鉴定和测序的目的. 蛋白质组学数据统计分析软件Trans-Proteomic Pipeline (sashimi)蛋白质组学数据统计分析软件蛋白质组学数据统计分析软件sp|P02754|LACB_BOVIN BETA-LACTOGLOBULIN PRECURSOR (BETA-LG) (ALLERGEN BOS D 5) - Bos taurus (Bovine).MKCLLLALALTCGAQALIVTQTMKGLDIQKVAGTWYSLAMAASDISLLDAQSAPLRVYVEELKPTPEGDLEILLQKWENGECAQKKIIAE

9、KTKIPAVFKIDALNENKLVLDTDYKKYLLFCMENSAEPEQSLACQCLVRTPEVDDEALEKFDKALKALPMHIRLSFNPTQLEEQCHITPEVDDEALEK : PTPEGDLEILLQK : LSFNPTQLEEQCHI : p = 0.65 6蛋白质组学数据统计分析软件TPP的安装与配置从 :上下载并安装windows版本TPP软件。安装过程中选择附带安装Apache(安装要求系统已安装ActivePerl-5.8.8.*以上版本,可从网站上下载)。安装完成后,将会生成TPP的图标 安装完后,桌面上生成了TPP和Cygwin的图标使用TPP 点击桌面

10、上的 TPP Web Tools ,将会出现TPP的登陆界面.TPP的登陆界面UserName: guestPassword: guest TPP Web Interface的欢迎界面样本数据分析 准备工作: 确保C盘至少1G的空闲的硬盘空间. 将数据文件ZCNI_No1(含.dta和.out文件)至ZCNI_No6和质谱RAW文件至ZCNI_No6.RAW,以及Sequest参数文件放到目录: C:InetpubISBdataZCNI_training下3. 将数据库文件放到目录: C: database中操作流程将质谱RAW文件转换成mzXML文件 ;以Sequest结果文件和mzXML文

11、件转换成xml文件;运行PeptideProphet,得到pepXML文件;以上步得到的pepXML文件运行ProteinProphet,得到最终结果;1.将RAW转换成mzXML文件 点击Analysis Pipeline,选择mzXML,在Specify RAW Input File(s) to convert to mzXML中点击Add Files,添加要转成mzXML的RAW文件选择目录ZCNI_training选择所有的RAW文件选择目录ZCNI_training选择所有的RAW文件RAW转成mzXML文件2.由.out文件整合成pepXML文件点击“Analysis Pipeli

12、ne”, 然后点击pepXML,出现如图所示的界面.pepXML界面在File(s) to convert to pepXML点击add files选择ZCNI_training选择sequest的参数文件其他参数选择默认,点击下面的Convert!下的Convert to PepXML,即可以将文件夹中的所有.out文件整合成pepXML文件3.运行PeptideProphet点击Analysis Pipeline,选择Analyze PeptidesPeptideProphet界面选择所有需要运行PeptideProphet的pepXML文件选择RUN PeptideProphet,其他参

13、数为默认.点击RUN Xinteract,即可作PeptideProphet分析.PeptideProphet分析运行PeptideProphet的结果可通过IE打开.PeptideProphet处理结束经PeptideProphet处理后的结果可用浏览器打开.在IE里面输入:可以看到结果为:4.运行ProteinProphet点击Analysis Pipeline,选择Analyze PeptidesProteinProphet界面点击Add Files选择经PeptideProphet后生成的文件其他为默认,点击Run ProteinProphet!其它参数为默认,点击RunProteinProphet,即可运行ProteinProphet程序运行ProteinProphet运行ProteinProphet完成后生成的文件可由IE打开.经ProteinProphet分析得到的结果可由IE打

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论