肿瘤基因检测的解读作业流程_第1页
肿瘤基因检测的解读作业流程_第2页
肿瘤基因检测的解读作业流程_第3页
肿瘤基因检测的解读作业流程_第4页
肿瘤基因检测的解读作业流程_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

从临床进入基因检测步骤是入口,检测结果结合临床信息进行合了解读是出口,这一入一出之间需经历检测前临床咨询部分、试验室部分、信息分析部分、临床解读部分共四个步骤。其中第四部分临床解读部分即是依据检测结果、患者信息、医生共识综合判定,临床和遗传咨询有效衔接、充足沟通,最终出具临床解读汇报。在做成临床解读汇报之前,首先需要将解读各个步骤进行明确,包含解读步骤步骤,解读技术细节。这么才有可能真正做到解读规范化,使解读过程有据可依,有章可循,才能出具一份好临床解读汇报,基因检测才能愈加好服务患者和临床医生。从大框架讲,基因检测数据解读可分为三个步骤:原始数据→分析数据、基于数据库解读→和患者个体表征/临床病例结合解读。1、读懂原始数据将测序原始序列数据(FASTQ)去除接头及低质量序列,经BWA软件比对至GRCh37/38(NCBI版本)或hg19/hg38(UCSC版本)人类基因组参考序列上,Picard去除反复序列,使用GATK检测SNV和Indel变异,使用ANNOVAR进行变异注释。最终取得一份.vcf文件(图1)。图1从测序原始序列数据到vcf文件步骤一份vcf文件包含以下基础信息。Chr:变异所在染色体Start:变异在染色体上起始位置End:变异在染色体上结束位置Ref:参考基因组序列Alt:检测样本基因组序列Func.refGene:变异所处参考基因功效区(exonic,intronic,UTR3,UTR5,splicing,upstream,downstream,intergenic)(此处exonic特指外显子编码氨基酸区,不包含外显子UTR区)Gene.refGene:变异所处参考基因名称(假如是基因间,则是两侧基因)GeneDetail.refGene:非外显子区处于特定转录本中具体位置(假如是基因间,则是距离两侧基因距离)ExonicFunc.refGene:外显子区变异类型(frameshiftinsertion,frameshiftdeletion,stopgain,stoploss,nonframeshiftinsertion,nonframeshiftdeletion,synonymousSNV,nonsynonymousSNV),假如这一栏是一个“.”话,就说明该变异不在外显子区AAChange.refGene:氨基酸水平改变(同一个基因可能含有多个转录本,氨基酸改变位置在不一样转录本中有可能不一样)经注释后vcf文件还会包含以下信息:CLINSIG:该变异在ClinVar数据库中临床意义(Benign,Likelybenign,Uncertainsignificance,Likelypathogenic,Pathogenic,Drug-response)CLINDBN:该变异所引发疾病名称CLINACC:该变异登记号和版本号(VariantAccessionandVersions)CLINSDB:该变异所引发疾病所在数据库名称CLINSDB:该变异所引发疾病所在数据库中IDPopFreqMax:该变异人群中最大等位基因频率1000_All:该变异在千人基因组计划数据库中人群等位基因频率1000_AFR:该变异在千人基因组计划数据库中非洲人群等位基因频率1000_AMR:该变异在千人基因组计划数据库中美国人群等位基因频率1000_EAS:该变异在千人基因组计划数据库中东亚人群等位基因频率1000_EUR:该变异在千人基因组计划数据库中欧洲人群等位基因频率1000_SAS:该变异在千人基因组计划数据库中南亚人群等位基因频率Snp138:该变异在dbSNP数据库中IDCosmic70:该变异在癌症体细胞突变数据库COSMIC中IDESP6500siv2_ALL:该变异在美国国家心肺血液研究所ESP6500数据库中人群等位基因频率ESP6500siv2_AA:该变异在美国国家心肺血液研究所ESP6500数据库中非洲裔人群等位基因频率ESP6500siv2_EA:该变异在美国国家心肺血液研究所ESP6500数据库中欧洲裔人群等位基因频率ExAC_All:该变异在ExAC数据库中人群等位基因频率ExAC_AFR:该变异在ExAC数据库中非洲人群等位基因频率ExAC_AMR:该变异在ExAC数据库中美国人群等位基因频率ExAC_EAS:该变异在ExAC数据库中东亚人群等位基因频率ExAC_FIN:该变异在ExAC数据库中芬兰人群等位基因频率ExAC_NFE:该变异在ExAC数据库中非芬兰欧洲人群等位基因频率ExAC_OTH:该变异在ExAC数据库中除已指定人群之外人群等位基因频率ExAC_SAS:该变异在ExAC数据库中南亚人群等位基因频率CG46:该变异在CG46数据库中人群等位基因频率。CG46是由CompleteGenomics(BGI)企业对46个样本全基因组测序而建立数据库,截止,她们已经对超出0个样本进行了全基因组测序和分析。ICGC_Id:国际癌症基因协作组中各研究IDICGC_Occurrence:该变异在ICGC数据库中发生情况。该栏数据结构如COCA-CN|1|187|0.00535,指中国结直肠癌研究(),在187例患者中有1例发生突变,突变百分比为0.00535Nci60:该变异在nci60数据库中等位基因频率。Nci60是被广泛用于药品筛选人类60种肿瘤细胞系组合,已经进行了全外测序。伴随研究进步,美国癌症研究所NCI在宣告NCI-60细胞系“退休”,PDX新模型“上任”。Interpro_domain:InterPro算法估计突变所处保守结构域()dbscSNV_ADA_SCORE:基于adaptiveboosting估计变异对剪接位点改变可能性dbscSNV_RF_SCORE:基于RandomForest估计变异对剪接位点改变可能性。得分代表剪接影响可能性大小,假如dbscSNV_ADA_SCORE和dbscSNV_RF_SCORE得分均小于0.6,则对剪接位点没有影响(PMID:28132688)。Omim_phenotype:在OMIM数据库中该基因(不是该变异)对应表型QUAL:测序质量分数,计算方法为Q=-10log10(e),可衡量碱基未正确检出概率。FILTER:对变异位点做深入过滤。不管你用什么方法对变异位点进行过滤,过滤完了以后,在FILTER一栏全部会留下过滤统计,假如是经过了过滤标准,那么这些经过标准好变异位点FILTER一栏就会注释一个PASS,假如没有经过过滤,就会在FILTER这一栏提醒除了PASS其它信息(otherFILTERflag)。假如这一栏是一个“.”话,就说明没有进行过任何过滤INFO&FORMAT:该栏数据结构GT:AD:AF:ALT_F1R2:ALT_F2R1:FOXOG:QSS:REF_F1R2:REF_F2R1。GT:基因型,对于一个二倍体生物,0表示跟REF一样,1表示表示跟Alt一样;2表示第二个Alt;AD:对应两个以逗号隔开值,这两个值分别表示覆盖到REF和Alt碱基reads数,相当于支持REF和支持Alt测序深度;AF:支持Alt测序深度占总测序深度百分比,即等位基因丰度NORMAL:和肿瘤组织对应正常组织中信息,通常经过外周血测序取得TUMOR:肿瘤组织中信息另外还可能包含多种算法对非同义突变保守性估计值,这些算法包含SIFTprediction(T:tolerated;D:deleterious),PolyPhenHumanDivprediction(D:Probablydamaging,P:possiblydamaging;B:benign)、LTR、MutTaster、MutationAssessor、FATHMM、CADD、GERP++等等。2、分析挖掘数据对全外显子检测(或属于较大pannel范围情况也能够),能够进行肿瘤突变负荷(Tumormutationburden)计算。临床研究表明,使用PD1/PD-L1抑制剂等免疫诊疗药品时,含有较高突变负荷患者含有很好客观缓解率(ORR)、较长无进展生存期(PFS),同时连续临床疗效(DCB)也更佳。然而,因为现在没有统一肿瘤突变负荷计算方法,在做纵向比较时需谨慎。该分析使用计算方法为,肿瘤组织中突变丰度大于等于5%,正常组织中突变丰度小于等于1%,ExonicFunc.refGene一栏去除“.”、synonymousSNV、unknown标签数据,PopFreqMax一栏去除人群等位基因频率大于0.1%数据(注意保留“.”)。另外,免疫诊疗相关部分基因突变(如EGFR、干扰素信号通路JAK、B2M等)值得关注。对全外显子检测,能够发觉大量体细胞突变。有突变是致病性称为为驱动突变或司机突变(和之对应称为乘客突变或继发性突变),这些突变或造成DNA修复缺点,或造成细胞不受调控增殖生长,或造成细胞不能正常凋亡,或造成细胞侵袭性增强,或造成免疫逃逸。所以从大量体细胞突变中判定肿瘤驱动基因突变既是基因检测关键目标之一,同时也是一项艰苦工作。通常来说一个肿瘤发生其驱动基因突变数目为0-8个,且她们不会分布于同一个关键肿瘤相关信号通路中(比如BRAF和KRAS,比如APC和CTNNB1)或并行两个关键信号通路中(比如PIK3CA和KRAS)。通常来说原癌含有较为显著突变热点聚集倾向(比如KRAS和PIK3CA),而抑癌基因突变位点较为分散(比如RB1和VHL)。对全外显子检测现在已经在肿瘤中得到较为广泛应用,怎样高效寻求驱动基因突变急需指导和规范化文件,但因为肿瘤细胞突变多为体细胞突变,遗传性突变领域规范化文件(后面会具体讲)难以照搬使用。因为体细胞突变意义和遗传性突变意义比如致病性突变这么描述有所不一样,比如我们能够采取响应药品突变(responsive)、耐药突变(resistant)、驱动性突变(driver)、继发性突变(passenger)来描述突变意义。值得庆幸是,伊始,分子病理协会(AssociationforMolecularPathology,AMP)、美国临床肿瘤协会(AmericanSocietyofClinicalOncology)和美国病理学家联盟(CollegeofAmericanPathologists)对高通量测序在肿瘤诊疗领域应用从突变记载(HGVS)、注释解读、汇报进行了指导和规范(PMID:27993330)。该指导规范中对参考序列数据库(如NCBI)、人群基因频率数据库(如1000G、ExAC)、肿瘤数据库(如COSMIC、ICGC)、疾病数据库(如HGMD、ClinVar)、估计软件(如PolyPhen2、HumanSplicingFinder)使用和注意事项给出了意见。该规范还推荐对肿瘤细胞体细胞变异划分为四个等级:含有确定性临床意义突变(variantswithstrongclinicalsignificance,LevelA和LevelB)、可能含有临床意义突变(variantswithpotentialclinicalsignificance,LevelC和LevelD)、临床意义不明突变(variantsofunknownclinicalsignificance)、良性或可能良性突变(variantsdeemedbenignorlikelybenign),并具体叙述怎样将检测到突变结合数据库以归类到这四个等级中。其中含有确定性临床意义/可能含有临床意义突变包含四个等级证据:LevelA:可作为估计药品反应或耐药性FDA同意针对特定类型肿瘤(适应症)诊疗突变;或已经被包含在专业指南中(如肿瘤NCCN)作为特定类型肿瘤诊疗、诊疗或预后突变;LevelB,可作为估计药品反应或耐药性基于充足研究和教授共识诊疗突变,或是基于充足研究和教授共识含有特定疾病诊疗、预后意义突变;LevelC,可作为估计药品反应或耐药性FDA或专业协会同意跨适应症诊疗突变,或是已经作为临床试验入组参考标准,或是基于多项研究含有特定疾病诊疗、预后意义突变;LevelD,基于临床前研究、案例报道可能含有临床意义突变;或有研究表明该突变有利于疾病诊疗和预后判定。现在,寻求肿瘤驱动基因突变具体策略能够说是多个多样(图2)。经过寻求热点基因热点突变(recurrentmutation)是一个较为确定策略,相关研究证据较为充足。比如EGFR突变关键发生在胞内酪氨酸激酶(TK)区域前四个外显子上(18~21),现在发觉TK区域突变有30多个。缺失突变关键发生在外显子19上,最常见是delE746-A750,替换突变最常见是发生在外显子21上L858R,复制或插入突变发生在外显子20上。发生在外显子20上替换突变T790M为耐药突变,研究还发觉L858Q、D761Y、T854A等耐药突变。HER2基因在乳腺癌、膀胱癌、结直肠癌、胃癌中关键突变方法是扩增或表示上调,鲜有突变,在20~30%乳腺癌中存在HER2基因显著扩增或过表示,不过在肺癌中,其激活机制为扩增、过表示及点突变,点突变在肺癌中发生概率约占2-4%,多发生在其激酶结构域中,常见激活性点突变包含p.S310,p.L755,p.G776L,p.V777L,p.S855I,p.N857S等。BRAFV600E突变临床意义在Pubmed中有上百遍报道。BRAF突变存在于1%–3%非小细胞肺癌中。V600E是最常见肿瘤驱动突变,在肺癌中也有多个其它类型BRAF突变被报道,包含G466V、G469A和D594G。尽管性药品比如vemurafenib在包含BRAFV600E突变黑色素瘤中高度有效,但这些药品对BRAF其它位点突变,或V600E突变肺癌中肿瘤驱动活性还需评定。图2

判定驱动基因突变策略(PMID:24479672)热点基因热点突变在很多数据库中有不完全收录,这些数据库有Civic数据库,OncoKB数据库,Personalizedcancertherapy数据库,ClinicalKnowledgebase数据库等等。估计变异对蛋白质功效影响,能够作为寻求肿瘤驱动突变一个有益补充方法。比较常见估计工具如SIFT、PolyPhen2、MutationAssessor等等,这些算法原理通常是基于氨基酸进化保守性,有考虑到蛋白质结构域功效(比如TP53蛋白有害突变多在DNA结合结构域),还有会考虑蛋白空间结构。对于检测到变异各算法估计值在上述vcf文件中可查阅。对于SIFT,值越小变异有害性可能性越大,推荐阈值0.05;对于PolyPhen2,值越大变异有害性可能性越大,推荐阈值0.3;对于MutationAssessor,值越大变异有害性可能性越大,推荐阈值8,需要注意是,不一样参考文件阈值可能不一样(PMID:23819521)。将基因放在信号通路中分析,这对于不是十分常见小众肿瘤驱动基因寻求有很大帮助。在美国,每十二个月有大约18,000名患者被确诊为脑膜瘤。它们约占原发性脑肿瘤三分之一,女性患病比率高一倍。不过一直以来对于脑膜瘤遗传突变了解甚少。在一项研究中(PMID:23334667),科学家们对17个脑膜瘤样本进行了全基因组或是外显子组测序。在这些肿瘤中发觉改变基因后,研究人员随即又对另外两组肿瘤进行了测序。研究人员发觉,相比大多数类型肿瘤,脑膜瘤含有较少数量遗传改变或损伤。在部分肿瘤中,她们发觉两个在已知致癌信号通路中发挥作用基因存在突变。在3个肿瘤中发觉SMO,是Hedgehog信号组员。在5个肿瘤中发觉了AKT1,该基因参与了和乳腺癌、结直肠癌和肺癌相关PI3K-AKT-mTOR信号。第6个肿瘤含有一个以前已知,和mTOR信号通路相关突变。总来说,这些突变基因信号通路组成了所研究15%脑膜瘤关键驱动子。对于遗传性肿瘤,能够借助遗传病致病基因判定方案,步骤即1、了解临床资料2、关键表型转化为汉字人类表型标准用语(CHPO)3、基因检测及其质控4、生信分析5、遗传学分析,包含关联候选基因、遗传变异位点分析解读和家系验证6、表型相同度分析。ACGM推荐和遗传性肿瘤/遗传病相关基因包含BRCA1、BRCA2、TP53、STK11、MLH1、MSH2、MSH6、PMS2、APC、MUTYH、VHL、MEN1、RET、PTEN、RB1、SDHC、SDHD、TSC1、TSC2、WT1、NF2等(PMID:23788249)。查找正常对照组织突变丰度(N_Freq)≥40%,比对遗传性肿瘤相关突变基因,是否有遗传性肿瘤相关胚系突变,查看并根据下述步骤进行确定。根据基因名+c.__或基因名+p.__进行谷歌搜索或进入NCBI、HGMD、OMIM等网站查阅是否有相关致病性报道,根据ACMG指南进行位点致病性判定或可借助InterVar在线辅助判定(仅适适用于exon范围内突变)。发觉遗传性肿瘤相关基因突变,还应推荐家族其它直系血亲进行基因检测做深入确实定。美国医学遗传学和基因组学学会(AmericanCollegeofMedicalGeneticsandGenomics,ACMG)和分子病理协会(AssociationforMolecularPathology,AMP)在对临床试验室基因检测进行了指导和规范(PMID:25741868)。该指导规范关键就是适适用于孟德尔遗传病相关基因变异或是生殖系变异。指导规范推荐记载突变遵照统一规范——人类基因组变异协会(HumanGenomeVariationSociety,HGVS),并将变异依据人群基因频率(populationdata)、软件估计(computationaldata)和功效试验(functionaldata)等参数分为五个等级:致病性突变(pathogenic)、可能致病性突变(likelypathogenic)、意义不明突变(uncertainsignificance)、可能良性突变(likelybenign)和良性多态性突变(benign)。这五个等级怎样认定?该规范列出了致病性/可能致病多种情况支持证据,证据强度依次包含超强证据(PVS1)、强证据(PS1-4,注意这里数字不代表证据强度区分,仅表示同一证据强度不一样证据情

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论