第十讲质谱数据分析_第1页
第十讲质谱数据分析_第2页
第十讲质谱数据分析_第3页
第十讲质谱数据分析_第4页
第十讲质谱数据分析_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

从质谱数据判定多肽/蛋白质邵晨1/86KeyadvantageofproteomicsResearchersworkonthelevelofgeneproductsanddealwithgenesthatarereallyexpressedtogiveadetectablePRODUCTandarenotjust"expressed“whichonlysaystheyproduceadetectablemRNAbutitisnotclearwhetherthereisageneproductornot.KeylimitationofproteomicsUsually,onlyafractionoftheproteinssynthesizedcanbedetectedinaproteomicsexperiment,whereastheexpressionofALLgenescanbemonitoredinawhole-genomearrayexperiment.KeyprerequisiteofproteomicsAgenomesequencefortheinvestigatedorganismoratleastacollectionofmanycDNAsequencesisrequired.FromYogitaMantri&ArvindGopu’spresentationin2023

2/863/86把单个蛋白/多肽从复杂样品中分离出来非常困难,在“组学”试验中一般达不到这个效果4/865/86IonizationmethodsElectrospraymassspectrometry(ESI-MS)Liquidcontaininganalyteisforcedthroughasteelcapillaryathighvoltagetoelectrostaticallydisperseanalyte.Chargeimpartedfromrapidlyevaporatingliquid.Matrix-assistedlaserdesorptionionization(MALDI)Analyte(protein)ismixedwithlargeexcessofmatrix(smallorganicmolecule)Irradiatedwithshortpulseoflaserlight.Wavelengthoflaseristhesameasabsorbancemaxofmatrix.6/867/86MALDIm/zspectrumofapeptidemixture8/86The

QuadrupoleThequadrupoleconsistsoffourparallelmetalrods.

Ionstraveldownthequadropoleinbetweentherods.

Onlyionsofacertainm/qwillreachthedetectorforagivenratioofvoltages:otherionshaveunstabletrajectoriesandwillcollidewiththerods.Thisallowsselectionofaparticularion,orscanningbyvaryingthevoltages.

sourcedetectorVoltageFiltersoutallm/zvaluesexcepttheonesitissettopassObtainsamassspectrumbysweepingacrosstheentiremassrange9/8610/86CollectsandstoreionsinordertoperformMS-MSanalysesonthem.IonTrapMassAnalyzerTrappedionsIonsinIonsoutThetrapconsistsofatopandabottomelectrodeandaringelectrodearoundthemiddle.Ionsareejectedonthebasisoftheirm/zvalues.Tomonitortheionscomingfromthesource,thetrapcontinuoulsyrepeatsacylcleoffillingthetrapwithionsandscanningtheionsaccordingtotheirm/zvalues.Separatesthemassanalysisandionisolationeventsintime(usingasinglemassanalyzer)Ionizationiontransfer/trappingparentionisolation/fragmentationdaughteriondetection11/86Amassanalyzerfordeterminingthemass-to-chargeratio(m/z)

ofionsbasedonthecyclotronfrequencyoftheionsinafixedmagneticfield.AllionsaredetectedallionsaredetectedsimultaneouslyoversomegivenperiodoftimeIonsareinjectedintoamagneticfield,thatcausesthemtotravelincircularpaths.ExcitationwithoscillatingelectricalfieldincreasestheradiusandenablesafrequencymeasurementFourierTransformMS

Fouriertransformioncyclotronresonancemassspectrometry,FTICMSICRcanbeusedwithdifferentionizationmethods,ESI,MALDIAshortsweepoffrequenciesisusedtoexciteallions.Thecomplexspectrumofintensity/timeisanalyzedwithFourierTransformtoextractthem/zcomponetsHighresolutionHighaccuracyVerysensitive(theminimalquantityfordetectionisinorderofseveralhunderedionsNondestructive–theionsdon’thitthedetectionplatesotheycanbeselectedforfurtherfragmentation12/86Orbitrap静电轨道阱质谱傅里叶变换原理MassSpectrometryReviews,Volume27,Issue613/86MolCellProteomics.2023Nov;10(11):R111.009522.14/86讲座大纲本讲座中,将讲述三种判定蛋白质办法。1。质量纹判定法(PeptideMassFingerprinting)2。二级质谱手工判定法(DenovoSequencing)。3。二级质谱数据库搜索判定法(MS/MSDatabaseSearching)。15/86判定多肽流程多肽混合物分离质谱仪一级质谱质量纹选择高峰判定多肽质谱仪二级质谱手工判定数据库搜索判定多肽16/86多肽质量纹判定多肽质量纹(PeptideMassFingerprinting,PMF)是从一级质谱(MS)中判定多肽主要方法。多肽质量纹一般都用于分析2DE-MS成果,不宜分析多个蛋白质混合物。其原理就是利用了蛋白序列数据库中多肽质量信息。17/86一级质谱图蛋白质通过酶解后,送入质谱仪,得到一级质谱。从一级质谱判定蛋白质算法(质量纹)主要用在MALDI-TOF产生质谱图上。目前来说,由MALDI-TOF质谱仪产生质谱图精度较高。另一种问题是,ESI产生质谱图中离子一般带有很多电荷,而MALDI质谱图中离子一般只带一种电荷,比较容易计算。18/8619/86蛋白序列数据库在网上能够查询到最新蛋白序列数据库,如IPI,swissprot等等下载FASTA格式20/86Proteinsequencedatabase21/86Uniprot(包括Swissprot和Tremble)22/86Integr823/86FASTA格式数据库FASTA格式包括蛋白名称和氨基酸序列。24/86虚拟酶解有了蛋白序列信息,我们就能够进行判定。对应于送进质谱仪样品,首先找到数据库里序列酶切位点。25/86质量排列这样能够产生一系列多肽,我们能够计算每个多肽分子量。最后一种R质量多加了18,这是由于我们写在下面是残基分子量。26/86质量排列把所有多肽分子量排序。27/86质量纹如此,质谱图上质量就能够与多肽上质量相匹配。28/86质量纹这就是多肽质量纹(PMF)最基础思绪。不过,真正将之作为一种判定蛋白质办法,尚有很多需要考虑问题。29/86PMF中问题第一种问题:质量相近多肽怎么处理?在现实蛋白数据库中,多肽数量是很庞大。这里面难保不会有质量非常相近多肽。这样,就造成了质谱图上一种峰也许匹配不止一种多肽,于是我们就难以知晓这张质谱图究竟代表哪个蛋白。30/86质量相近多肽多肽[M+H+]DGAPLESSSR1019.0490REGESTPSR1019.0520DFPIANGER1019.0940DPLASSSWR1019.0940YVPLKDQR1019.1800HLQLPAPSR1019.1830VLFLNGIDK1019.2200Peakm/z:1019.0831/86处理方案第一种处理措施是限制用来搜索数据库。例如,你假如做试验用是小鼠组织,那么你能够只在小鼠数据库中搜索,这样就能够减低出现这种情况也许性。第二个处理措施是要求必须有多种多肽和数据库相匹配,才做出最后蛋白质判定。32/86多匹配DFPIANGER 1019.09EPISVSSQQMLK 1347.56VLDALDSIK 974.13CarbonicanhydraseII

SHHWGYGKHBGPZHWHKDFPIANGERQSPVNIDTKAVVQDPALKPLALVYGEATSRRMVNNGHSFNVEYDDSQDKAVLKDGPLTGTYRLVQFHFHWGSSBBQGSEHTVDRKKYAAELHLVHWNTKYGDFGTAAQQPDGLAVVGVFLKVGDANPALQKVLDALDSIKTKGKSTDFPNFDPGSLLPNVLDYWTYPGSLTTPPLLESVTWIVLKEPISVSSQQMLKFRTLNFNAEGEPELLMLANWRPAQPLKNRQVRGFPK多匹配能够大大减少随机匹配概率,从而增加成果可信度33/86长蛋白和短蛋白第二个问题:长蛋白也许会更容易被匹配。由于长蛋白里多肽数目较多,以概率来算,匹配上几率也会比较大。质量纹算法必须考虑这个问题,给短蛋白一定赔偿。34/86多种蛋白情况第三个问题就是在一张质谱图中也许有多种蛋白存在。一般,MALDI-TOF是与双向电泳连接使用。双向电泳一种电泳点上也许有2-3个蛋白,这样就增加了判定难度。由于无法预知一种电泳点上有多少蛋白质,PMF效果也许会受到很大影响。35/86多肽质量纹:小结质量纹算法是用一级质谱判定蛋白质典型办法。质量纹算法效果受到很多方面限制,首先是仪器精度限制,其次是样品中也许有多种蛋白限制。这使得质量纹算法不是抱负分析复杂混合物中蛋白成份办法。讲座大纲36/86利用二级质谱图我们刚才谈到了,多肽质量纹有其先天不足。其中,最糟糕是它不能处理多种蛋白混合物。假如我们能够处理混合物,就能够减少很多用于纯化上时间和精力。那么,怎么才能从混合物中判定蛋白呢?这就要用到二级质谱。37/86FromNesvizhskii’slectureatISB38/86利用二级质谱图在一级质谱图中,选择其中一种峰(母离子),再把这个离子打坏(CID,ECD…),检测碎片离子m/z,就得到一张二级质谱图。这里假设是一级质谱中一种峰就对应了一种多肽。39/86FromJimmyEng’slectureatISB

40/86利用二级质谱图对于一张一级质谱图,能够选择多种峰进行二级质谱操作。这样就能够适应样品里有多种蛋白情况。41/86判定多肽流程多肽混合物酶解分离质谱仪一级质谱质量纹选择高峰判定多肽质谱仪二级质谱手工判定数据库搜索判定多肽42/86典型二级质谱图43/86CIDCID,即Collision-inducedDissociation,是通过撞击使得多肽肽键断裂过程。在做二级质谱试验时,质谱仪选择一级质谱中一种峰,也就是对应质荷比这些离子,让这些离子高速撞击质谱仪中惰性气体,使其肽键断裂,这就是CID。44/86FromJimmyEng’slectureatISB

a,b,y系列离子最常见幻灯片4345/86b1b2b3y1y2y3LFGKRelativeIntensitym/zFLGK++FLGK++FLGK++CIDFLGK++FLGK++FLGK++b1b2b3y3y2y1FLGK++FLGK+TheoreticalCIDofaTrypticPeptideKGLFMS/MSSpectrumParentions(464.29)DaughterionsNon-dissociatedParentions46/86某些常见特殊情况Neutralloss:某些酸性氨基酸也许会在CID中丢失一种水分子(H2O),而碱性氨基酸会在CID中丢失一种氨分子(NH3)。Immoniumions:氨基酸在CID过程中也许产生形如H2N=CHR+Immoniumions(亚胺离子)。根据immoniumions能够判断哪些氨基酸在多肽中存在。47/86某些常见特殊情况翻译后修饰:有时,二级质谱中需要考虑某些氨基酸也许被修饰(磷酸化、糖基化等),这些修饰也许变化残基分子量。48/86NeutralLoss和ImmoniumIons表AminoAcidNeutralLossImmoniumIonsA

44G

30S1860P

70V

72T1874C3476L/I

86N1787D1888Q17101K17101E18102M48104H

110F

120R17129Y

136W

159AminoAcidNeutralLossImmoniumIons49/8650/86通过二级质谱图手工判定多肽序列51/86九步判定法1。寻找immoniumions。2。寻找b2ion。3。寻找y1ion。4。寻找yn-1ion。5。顺着yn-1,yn-2,…次序继续寻找y系列离子。6。顺着b2,b3,…次序继续寻找b系列离子。52/86九步判定法7。计算多肽分子量。8。检查判定成果。9。试着解释更多峰。53/86氨基酸质量速查表

注意我们给出是残基分子量CodeResidueMassG57A71S87P97V99T101C103L/I113N114D115K/Q128E129M131H137F147R156Y163W186CodeResidueMass54/86b2离子m/z表

GASPVTCL/INDQ/KEMHFRYWG115

A129143

S145159175

P155169185195

V157171187197199

T159173189199201203

C161175191201203205207

L/I171185201211213215217227

N172186202212214216218228229

D173187203213215217219229230231

QK186200216226228230232242243244257

E187201217227229231233243244245258259

M189203219229231233235245246247260261263

H195209225235237239241251252253266267269275

F205219235245247249251260262263276277279285295

R214228244254256258260270271272285286288294304313

Y221235251261263265267277278279292293295301311320324

W24425827428428628829030030130231531631832433434334737355/86例子M+2H=1295.0Da56/86判定1。寻找Immoniumions:没有找到。2。寻找b2ion:261.8。由于有234.0a2ion和1033.3yn-2ion,故肯定b2ion为261.8。3。寻找y1ion:由于已知多肽是由胰酶(Trypsin)酶解,故而C末端只能是K或R,因此虽然找不到y1ion,不过能够在1148.8处找到对应于Kbn-1ion。CID57/86判定4。寻找yn-1ion:已经找到了。5。继续寻找y系列离子:从1033开始,能够分别找到934,748,633,532和461作为y系列离子,把它们写出来:58/86判定6。继续寻找b系列离子:从834.9开始,似乎只有1019.7一种离子没有判定了,它与1148.8之间形成一种氨基酸E,但与834.9之间相差185Da。能够通过b2离子m/z表查到对应氨基酸序列:有AN,NA,QG,GQ四种序列都满足185Da条件(这样用时候注意要减1)。59/86判定7。计算多肽分子量:经计算,多肽分子量约为1294.6Da,接近测得分子量1295.0Da。8。检查判定成果:由于没有观测到immoniumions,我们临时没有辅助信息来帮助我们检查这一判定成果。9。试着解释更多峰:发觉817位置峰是834位置峰neutralloss。60/86De-novoSequencing这种仅通过残基来判定多肽措施又称为De-novoSequencing。能够用计算机程序使得判定问题自动化,计算机程序判定流程与上面九步判定法略有区分。当我们拥有近乎完美二级质谱图时,我们能够采取这种De-novoSequencing措施。不过,实际情况中,我们并没有完美二级质谱图。我们已经从例子中看到,单从质谱图不一定能得到全序列。返回61/86DatabaseSearching实际情况中,单从质谱图不一定能得到全序列。

不过,幸运是,我们尚有蛋白序列数据库。因此我们能够从数据库里搜索最佳匹配质谱图多肽,这样就有了二级质谱数据库搜索算法。62/86判定多肽流程多肽混合物酶解分离质谱仪一级质谱质量纹选择高峰判定多肽质谱仪二级质谱手工判定数据库搜索判定多肽63/86数据库搜索基础数据库搜索基础很简单,就是理论质谱图和试验质谱图之间一种比对。我们刚才讨论了CID过程,因此我们懂得了残基产生规律,那么,利用这些规律,我们能够对每个多肽产生一张理论质谱图,用来和试验质谱图进行比对,对它们“相同”程度做一种评分,分数最高多肽,我们就以为它是试验质谱图代表多肽。64/86数据库搜索流程在一种蛋白序列数据库中,能够找出来,落在质谱仪检测范围以内多肽,多达数百至数千万,假如每个多肽都拿来和试验质谱图做比正确话,需要花费时间是难以接收。提升搜索速度关键就是减少搜索对象数。65/86数据库搜索流程因此,基本上,所有数据库搜索算法都包括两个步骤。第一种步骤是筛选数据库里多肽,找出所有有也许与质谱图匹配多肽。第二个步骤就是拿这些选出来多肽去和质谱图进行比对,并输出最高分值多肽作为一种PSM(Peptide-SpectralMatch)。66/8667/86FromJimmyEng’slectureatISB

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论