可变剪切对非小细胞肺癌患者的临床预后分析及验证_第1页
可变剪切对非小细胞肺癌患者的临床预后分析及验证_第2页
可变剪切对非小细胞肺癌患者的临床预后分析及验证_第3页
可变剪切对非小细胞肺癌患者的临床预后分析及验证_第4页
可变剪切对非小细胞肺癌患者的临床预后分析及验证_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、可变剪切对非小细胞肺癌患者的临床预后分析及验证摘要研究目的:在全球范围内,肺癌成为各类肿瘤中病发率以及死亡率首位的恶性肿瘤,其中85的患者可以划分为非小细胞肺癌(NSCLC)这一亚型。在过去的十几年来,种类繁多的靶向药相继上市,但是为何在针对同一靶点用药时,病人的获益情况却大有不同?这个问题一直是肿瘤研究的焦点。近来,研究者发现在肿瘤中普遍存在可变剪切的现象,可变剪切(Alternative splicing)是基因转录所产生的前体mRNA通过去除内含子区域,选择性地保留或排除特定外显子,从而生成编码不同蛋白质的各种转录本。通过这种方式,同一基因能够编码并翻译成多种不同或是具有微小差异的蛋白,

2、从而表达不同的功能。这一观点为解释肿瘤的异质性开辟了新的思路。目前,可变剪切在非小细胞肺癌中的研究较少,因此,为了探索其对非小细胞肺癌患者预后的影响以及作用机制,我们开展了本次研究。研究方法:首先,收集The Cancer Genome Atlas数据库中522例腺癌(LUAD)以及573例鳞癌(LUSC)病例的测序数据,基因表达数据和临床数据。其次,收集青岛大学附属医院胸外科术后病理诊断明确的40例腺癌和20例鳞癌患者的新鲜组织。(1) 通过设置严格的标准筛选TCGA的病例,并按照性别将LUAD与LUSC内部再次分成两个亚组,通过TCGA SpliceSeq软件处理测序数据从而得到病人每种可

3、变剪切事件(AS)的PSI数据,随后与临床数据以及表达数据相匹配。(2) 选取每组中的配对样本计算肿瘤组织和正常组织中显著差异表达的AS事件,随后通过统计学方法计算哪些事件为独立预后因素并建立多因素风险比例回归模型。(3) 上游调控因子探索:选取每组中的配对样本计算肿瘤组织和正常组织中显著差异表达的可变剪切因子(Splicing factor),随后将差异SF与预后AS做相关性分析;下游功能机制探索:用预后相关的剪切事件所对应的亲本基因进行功能富集分析(4) 临床应用:对每组的临床数据进行单因素Cox回归分析,将p.value 0.05的临床指标与多因素风险比例回归模型一同建立可视化Nomog

4、ram模型。(5) 实验验证:提取收集的新鲜组织样本的总RNA,并反转为cDNA。设计特异性的两段引物,通过qPCR来获取每个组织的PSI数据,随后进行配对样本的差异分析,验证剪切事件的发生。结果:通过分析,LUAD中男性与女性亚组中各确定8种剪切事件为独立预后因素;LUSC中男性与女性亚组中各确定7种剪切事件为独立预后因素,所建立的多因素风险比例回归模型的ROC值也均在0.75以上。我们建立了一个SF与AS调控的相关性网络,也根据风险因素预测了其下游可能存在的调控机制。此外,所建立的Nomograms模型的C指数均在0.7以上,矫正曲线也显示模型稳定。最终,挑选的四种剪切事件也的确在肿瘤和正

5、常组织中存在显著的表达差异。结论及意义:我们以可变剪切为出发点,通过系统的分析发现在非小细胞肺癌中不同性别的患者其剪切特征却有不同。据此我们探索了包括上游调控因子以及下游信号通路在内的完整作用机制,并在组织样本中进行了初步验证。此外,为了拓展可变剪切在临床上的应用,我们将可变剪切的风险比例回归模型与临床指标结合起来,可以用于预测病人早期复发和肿瘤预后。综上所述,我们的研究对探索转录本的多样性对非小细胞肺癌的产生和发展的影响具有重要意义,我们所发现的各个独立预后因素均可作为后续研究的方向,临床模型也将指导临床医生判断患者肿瘤的预后和复发情况。硕士研究生: 指导教师: 关键词:可变剪切;非小细胞肺

6、癌;预后;Analysis of the relationship between the alternative splicing and the prognosis of patients in non-small cell lung cancerAbstractObjective: Globally, lung cancer is identified as the most frequently occurring malignant tumor with the highest mortality. Among them, 85% of these patients can be c

7、lassified as non-small cell lung cancer (NSCLC). In the past ten years, a large variety of targeted drugs have been marketed one after another, but why do patients benefits differ greatly when they are targeted at the same target? Recently, researchers have found that alternative splicing is common

8、in tumors. Alternative splicing is fundamental to transcriptome and proteome richness, and data from recently studies suggested a critical association between alternative splicing and oncogenic processes. At present, there are little related researches on alternative splicing in NSCLC. Therefore, in

9、 order to find its impact on tumor prognosis and the mechanism of action, we conducted this study.Methods: RNA transcriptome profiling, sequence data and clinic data of LUAD and LUSC group were retrieved from The Cancer Genome Atlasl (/). Besides, real-time quantitative P

10、CR was conducted to validate the selected OS-associated DEAS events.Firstly, we screen TCGA cases by setting strict criteria and divide LUAD and LUSC into two subgroups according to gender. Process sequencing data through TCGA SpliceSeq software to obtain the patients PSI. Then, the data was matched

11、 with clinical and expression data. Secondly, the paired samples of each group were screened out for further calculation. Statistical analyses are used to calculate which events are independent prognostic factors and establish a multivariate risk ratio regression model. Thirdly, the difference analy

12、sis of splicing factor was conducted in four groups (with adj. p 0.05). Then the correlation between differential SF and prognostic AS was calculated; Next, we selected the corresponding parent genes of OS-associated DEAS events as candidates for GO and KEGG pathway enrichment analysis. Fourth, the

13、prognostic models along with clinicopathological variables described above were sent for univariate Cox analysis, and the significant results were further sent to develop a nomogram to estimate individual survival probability of patients. Fifth, Real-time Quantitative PCR was conducted to validate t

14、he selected OS-associated DEAS events.Results: Finally, eight AS events were identified as independent prognostic factors in the male and female subgroups in LUAD; seven types of AS events were determined as independent prognostic factors in the male and female subgroups in LUSC. The final composite

15、 models exhibited strong predictive power, and the AUCs of each group were all over 0.75 from 1 to 5 years. Besides, correlation network between SF and AS regulation was established, and the downstream pathway was enriched; In addition, the C indices of the Nomograms model are all above 0.7, and the

16、 correction curve also shows that the model is stable. Finally, four AS events were demonstrated to be differentially expressed in tumor tissue and normal tissue.Conclusion: In summary, this study performed a systematic analysis on prognostic splice events in NSCLC from gender and subtype perspectiv

17、es. Then, we explored the upstream regulatory factors and downstream regulatory mechanisms of OS-related AS events that found in our study. More importantly, we constructed a well-executed nomogram that combines clinicopathological variables with four composite models. The final AS events obtained t

18、hrough layer screening may play an important role in tumorigenesis and deserve further study as molecular diagnostic biomarkers and therapeutic targets. Key words: Alternative splicing; NSCLC; Prognosis; 目录引言.1研究对象与方法.21 数据收集.22 统计学分析.23 实验试剂及设备.34 标本收集与处理.35 实时荧光定量PCR方法检测.5结果.61 可变剪切在非小细胞肺癌组织中分布.62

19、 可变剪切在非小细胞肺癌组织中差异表达.73 非小细胞肺癌患者预后相关可变剪切与作用机制探索.84 可变剪切预后模型建立.95 可变剪切上游调控因子探索.136 临床Nomogram模型的建立.157 可变剪切表达验证.14讨论.17结论.19参考文献.20综述.23综述参考文献.32攻读学位期间的研究成果.36缩略词表(附录).37致谢.38学位论文独创性声明、学位论文知识产权权属声明.393引言引 言在全世界范围内,肺癌位于所有恶性肿瘤病发率和死亡率的首位,据估计,2018年份约有210万患者新发肺癌以及180万患者最终死亡1。而在我国,肺癌发病率也日渐上升,特别是女性患者比例正在不断提高

20、,男女肺癌发病比率逐渐缩小。在所有肺肿瘤中,非小细胞肺癌(NSCLC)类型大约占85,而肺腺癌(LUAD)和肺鳞状细胞癌(LUSC)是其中最普遍的亚型2。不同肿瘤类型以及不同性别在非小细胞肺癌发生发展中是否扮演重要角色?目前,与之相关的系统性分析较少,因而具有十分重要的研究价值。在过去的十几年来,精准治疗领域飞速发展,发病机制以及新型靶点的研究取得重要突破,靶向药物也层出不穷,但是为何不同患者在针对同一突变靶点治疗时,获益大不相同?此前的研究大多关注于基因层面的变化,如基因突变,拷贝数变化,甲基化等,很少提及基因转录后修饰的影响3 4。近来,可变剪切(Alternative splicing)

21、导致转录本多样性这一观点的提出引起了众多研究者的关注。人类基因组中只有20,000个基因,而细胞的功能和分化需要远不止于此的蛋白质,而可变剪切便是产生这些蛋白质的一种重要机制5-7。可变剪切通过去除内含子区域,选择性地保留或排除多外显子基因中的特定外显子来生成微小差异或完全不同的蛋白质8。这一观点解释了为什么许多研究中,明明是同一个基因,其致癌能力不同,甚至完全相反,因为同一基因转录本占比不同,其综合体现出的功能也就不同。近几年来,研究者发现可变剪接在肿瘤产生与发展中起着关键作用(包括无限复制,组织侵袭和转移,持续性血管生成和避免免疫破坏)9-13,因而可变剪切可能在肿瘤治疗中具有巨大的潜力,

22、也成为研究热点之一14-16。随着新一代测序技术的发展,检测所需费用不断降低,大规模的临床转录组测序项目得以开展,诸多以往无法得到的数据逐渐积累。近来,多个大型数据库建立并公开,种类繁多的珍贵数据为所有科研者搭建了一个高水平的平台,充分利用这些数据,通过综合系统的分析可以充分挖掘肿瘤的进展机制及分子基础,从而得出非常有价值的,能够指导实验研究以及临床治疗的重要信息17。迄今为止,关于可变剪切在肺癌中的系统性分析较少,也并未有研究探索不同肿瘤类型以及不同性别的患者间是否在可变剪切方面存在着差异。因此,我们从The Cancer Genome Atlas (TCGA)数据库中下载了相关数据,期望经

23、过一系列的分析,能够筛选出在非小细胞肺癌预后发挥作用的相关可变剪切事件,对比出不同类型肿瘤及不同性别间可变剪切事件有何区别,探索出完整的可变剪切在非小细胞肺癌中可能的上下游调控机制,为探索非小细胞肺癌患者可能的生物靶点提供重要的理论依据。此外,现今肿瘤的筛查与确诊还主要依靠影像学手段,如何找到无创且有效的生物标志物辅助临床治疗是当下研究的重中之重,目前主流的方法大多是联合多个风险因素共同构建一个模型来预测患者预后或者复发。列线图(Nomogram)因其便于操作,可视化等优点成为目前研究者普遍认可得新型预后模型。当下还没有使用可变剪切构建非小细胞31材料和方法肺癌预后模型的研究18,因此,我们选

24、择各组中独立预后因素分别建立了多因素Cox风险比例回归模型,并将该模型与更多临床指标联合起来,共同构建可视化的Nomogram模型,通过矫正检验,该临床模型稳定且有效,可以在临床实践中进一步验证。材料和方法1数据收集首先,从TCGA数据库(/)检索LUAD和LUSC两组队列的相关数据,包括Sequencing reads、Transcriptome profiling和Clinical data。随后,应用软件SpliceSeq 2.1处理高通量mRNA测序的数据,来得到mRNA不同剪接模式,此软件识别的剪切模式为3端可变剪接(AA)、5

25、端可变剪接(AD)、启动子改变(AP)、终止子改变(AT)、外显子跳跃(ES)、内含子保留(RI)和外显子互斥(ME),并用剪接百分比(PSI)用以表示不同剪切事件的出现概率19。随后,将PSI数据,转录本表达数据和病人临床数据相互匹配,得到此次研究所需的完整数据集。此外,为了得到严谨可信的数据,我们设置了严格的筛选标准:(1)每种剪切事件至少在75%的样本中出现;(2)患者具有明确的非小细胞肺癌组织学诊断;(3)具有完整的临床指标的数据:包括年龄,病理分期,TNM分期;(4)患者初步病理诊断后的总生存期(OS)超过30天;此外,为了能够对剪切事件进行横向比较,每种剪切事件都被辅以一个独一无二

26、的标签,由剪切类型,基因名称和编号构成,格式为“ES_PLEKHN1_ID_000001”。2统计学分析本次研究若无特殊说明,均使用R语言作为分析软件,t-test和方差分析用于比较连续变量,Spearman秩相关分析用于非正态分布数据,Pearson相关分析用于满足正态分布的连续变量,使用Kaplan-Meier方法进行生存分析,adjust.p 0.05被认为具有显著统计学意义。2.1可变剪切事件差异表达分析首先,将LUAD和LUSC队列内部按性别再次分为两个亚组,提取出每个亚组中的配对样本使用包(版本3.42.1)进行差异性分析20,得到差异剪切事件(DEAS),在这里我们并没有将表达差

27、异两倍以上作为筛选条件,因为PSI本身作为一个比值类型变量,设定该条件可能会遗漏很多有意义的剪切事件。之后,针对具有显著意义的结果,我们使用Venn图来展示四组间剪切方式的异同,使用Upset图展示每组剪切方式的分布特征21。2.2预后相关剪切事件分析及下游机制探索为使统计分析稳定可靠,我们将每个亚组中所有剪切事件按PSI值的中位数分为高表达与低表达后,使用Survival包(3.1-8版)进行单因素Cox回归以探讨何种剪切事件为影响预后的风险因素。随后,我们还期望能够找到这些差异剪切事件是通过何种方式在肿瘤产生与进展中发挥作用,为后续的功能通路研究作出方向上的指导,因此我们进行了功能与通路富

28、集分析。Metascape(/)是一个在线通路富集分析网站,它整合了40多个独立数据库,为研究者简化了操作并作出详细的解释。我们选择与预后相关的DEAS事件的相应亲本基因作为候选基因,通过该网站进行了通路的富集。2.3临床预后模型的建立我们先通过lasso回归分析筛选单因素Cox有意义的事件以确保模型稳定22,后将筛选到的变量通过逐步向前方法做多因素Cox回归分析从而建立模型。使用Kaplan-Meier分析检验模型生存情况,做ROC曲线观察模型预测的稳定性。随后将模型联合单因素Cox有意义的临床指标,共同建立Nomogram模型。这些分析分别使用了R语言

29、中survminer包(0.4.3版),survivorROC包(1.0.3版)和timeROC包(0.3版)。2.4建立剪切因子与剪切事件相关性网络我们首先从SpliceAid2数据库中检索到人类剪接因子(Splicing factors)共67个23。随后从TCGA数据库下载了这些剪接因子的转录本表达数据,并通过DESeq2软件包(1.22.2版)进行了标准化)24。 同样,分别对四个亚组的剪切因子进行差异分析。 随后,使用Hmisc(版本4.30)计算差异剪切因子的mRNA表达值与预后相关的差异剪切事件的PSI值之间的相关性。最后,通过Cytoscape(版本3.7.1)生成了剪切因子与

30、剪切事件相关性网络。3实验试剂及设备实验仪器和试剂生产公司RNAWAIT(非冻型组织RNA保存液)北京索莱宝UNLQ-10柱式TRIZOL总RNA抽提试剂盒生工生物柱式MICRORNA抽提试剂盒生工生物琼脂糖BBBI4S RED PLUS 核酸染色剂(10,000 X 水溶液)BBIGENERULER DNA LADDER MIXThermo ScientificMAXIMA REVERSE TRANSCRIPTASEThermo ScientificSYBR PREMIX EX TAQTMTaKaRa, Otsu, Japan洁净工作台江苏苏洁净化设备厂高速冷冻离心机安徽中科中佳仪器有限公司

31、电泳仪北京六一电泳槽上海精益有机玻璃制品仪器厂凝胶成像系统上海复日科技有限公司微量分光光度计Merinton Instrument, Inc移液器(范围100-1000UL,20-200UL,0.5-10UL)加拿大 BBI公司APPLIED BIOSYSTEMS VERITIThermo Fisher ScientificFTC-3000P REAL- TIME PCR SYSTEMFunglyn Biotech, Shanghai, China4标本收集与处理为验证生物信息学分析的准确性,我们收集青岛大学附属医院崂山院区胸外科手术切除的配对新鲜组织,并立即转至RNA保存液中放于负80摄氏度

32、保存,经组织病理学诊断为非小细胞肺癌的入选队列之中,最终将样本按照组织学亚型及患者性别分成四组:腺癌男性,腺癌女性,鳞癌男性和鳞癌女性。4.1RNA提取(UNLQ-10柱式TRIZOL总RNA抽提试剂盒)1) 样品准备,取肿瘤组织,每10-20 mg 组织加入0.5ml Trizol,使用匀浆器充分研磨,室温下放置5-10 min,目的是使核蛋白和核酸全部分开。此外,如果样品中包含较多的脂肪、多糖、蛋白质或细胞外基质,可通过室温下转速12,000 rpm 快速离心10 分钟,移去上层油脂后,取上清。2) 在上述样品中,加入0.2ml 氯仿,剧烈震荡30秒,室温下放置3分钟, 4C下12,000

33、rpm离心10分钟。(注:如不能机器旋涡震荡,可用手上下颠倒混匀 2 分钟。样品会分成三层:上层水相,中间层和下层有机相。RNA 在上层水相中。)3) 吸取上层水相,宁少勿多,枪头不要碰触中间层,否则会出现染色体 DNA 污染,转移至干净的EP管中,随后加入1/2倍体积无水乙醇并混匀,此时可能会产生半透明纤维状悬浮物,不影响提取和应用。4) 组装吸附柱与收集管,将步骤3中得到的液体全部悬空滴加至吸附柱正中,室温下静置2分钟,随后室温下转速12,000 rpm 离心3分钟。5) 倒掉收集管中废液,将吸附柱放回收集管中,随后加入500 l RPE Solution,室温静置2分钟,随后转速10,0

34、00 rpm 离心30秒。6) 重复步骤5一次。7) 倒掉收集管中废液,将吸附柱重新放回收集管中,室温下转速10,000rpm 离心2分钟。8) 将吸附柱放于干净的1.5 ml EP管中,在吸附膜正中悬空滴入30 l DEPC处理的双蒸水,室温静置5 min,随后转速12,000 rpm 离心2分钟,将最终得到的RNA溶液测量OD值,260/280在1.8-2.0之间的样品于-70C留存用于后续实验。4.2反转录(cDNA第一链合成,RNA按照 800 ng反转)1)在冰盒上放置无核酸酶的 PCR管,并加入以下试剂:组分体积(l)total RNAXRandom Primer(100 pmol

35、)(microRNA用特异性引物)1dNTP Mix(0.5 mM final concentration)1Rnase-free ddH2O定容至14.52) 充分混匀后离心3-5秒,在65C温浴5分钟后,冰浴2秒,然后立即离心3-5秒;3) 将试管放回冰盒,再加入下列试剂:组分体积(l)5X RT Buffer4Thermo Scientific RiboLock RNase Inhibitor (20 U)0.5Maxima Reverse Transcriptase (200 U)14) 充分混匀后离心3-5秒;5) 在PCR仪器上按照下列条件进行反转录反应:温度(C)时间(min)2

36、51050308556) 将上述溶液-20C留存用于后续实验。5实时荧光定量PCR1) 首先在冰上配制 PCR 反应液,考虑在吸取时存在误差,制备预混液的体积要多于所用总体积的10%。试剂使用量终浓度TB Green Premix Ex Taq II(Tli RNaseH Plus)(2X) 10 l 1XPCR Forward Primer(10 M) 0.8 l 0.4 MPCR Reverse Primer(10 M) 0.8 l 0.4 MDNA 模板(100 ng)2 l灭菌水6.4 lTotal20 l2) 反应程序为,预变性(95C 30秒),随后PCR反应(95C 5秒,60C

37、 30秒)共40个循环。仪器为FTC-3000p PCR system,通过2-CT方法计算基因表达。为计算每种剪切事件的PSI值,我们需要针对每种剪切事件设计两对引物,其中一对引物位于基因发生剪切的序列上,另一对引物位于该基因所有转录本的CDS序列上。通过qPCR获得每个基因剪接区域及其CDS区的表达量,两者只比便是该基因的PSI值(注意,剪切类型为外显子跳跃(ES)时,PSI的值为一减该比值)。得到每个亚组中肿瘤与正常组织的PSI值结果之后,使用limma包进行配对样本的差异分析,将分析的结果使用箱形图展示。结果图1 流程图1可变剪切在非小细胞肺癌组织中分布最终, 经过筛选后共491位LU

38、AD患者和473位LUSC患者被纳入本次研究的数据集中。图2A为各类型剪切事件的模式图,红色柱体为发生可变剪切的区域,绿色线条为剪切前的连接方式,红色线条为剪切后的连接方式。在LUAD组中,共检测到10366个基因发生43948个剪切事件,其中发生ES类型包含6618个基因的16793个剪切事件,AP类型包含3605个基因的8992个剪切事件,AT类型包含3734个基因的8546个剪切事件,AA类型包含2522个基因的3559个剪切事件,AD类型包含2173个基因的3057个剪切事件,RI类型包含1866个基因的2783个剪切事件和ME类型包含214个基因中的220个剪切事件; 在LUSC组中

39、,共检测到10557个基因发生46020个剪切事件,其中发生ES类型包含6810个基因的18029个剪切事件,AP类型包含3737个基因的9301个剪切事件,AT类型包含3748个基因的8578个剪切事件,AA类型包含2636个基因的3752个剪切事件,AD类型包含2278个基因的3263个剪切事件,RI类型包含1908个基因的2862个剪切事件和ME类型包含227个基因中的235个剪切事件。剪切事件具体分布如图2B/C所示,其中ES类型是可变剪切的主要剪切方式,而ME是最不常见的剪切方式。图2 剪切模式图与剪切事件分布2可变剪切在非小细胞肺癌组织中差异表达通过比较肿瘤与正常组织之间剪接事件的

40、差异,我们发现了参与肿瘤发展和预后的关键事件。如图3A所示,LUAD与LUSC组各有9358与14153个剪切事件在肿瘤与正常组织中具有显著差异,其中6492个剪切事件相同,但是LUSC组中差异事件明显增加,说明其剪切事件发生更加频繁。当将数据集细分为四个亚组时,我们可以发现相比于总体来说,每组都有自己独特的剪切方式(图3 B/C),证明不同性别发生可变剪切的种类有所差异,在LUAD中女性组的剪切事件发生频率比男性组更高,而在LUSC正好相反。Upset图中显示了每个亚组中剪切事件的具体分布,其中LUSC的男性群体表现出更复杂的剪接方式,同一基因可以产生4到5种剪切事件,据此可以推测该基因可能

41、通过多种转录本的共表达发挥复合作用,共同影响肿瘤发生(图3D/E/F/G)。图3 差异剪切事件分布与比较3非小细胞肺癌患者预后相关可变剪切与作用机制探索通过单因素Cox回归分析,我们在LUAD中男性组发现286个预后相关的差异剪切事件,其中包括138个风险因素和148个保护因素;在LUAD中女性组发现582个预后相关的差异剪切事件,其中包括279个风险因素和303个保护因素;在LUSC中男性组发现912个预后相关的差异剪切事件,其中包括463个风险因素和449个保护因素;在LUSC中女性组发现113个预后相关的差异剪切事件,其中包括57个风险因素和56个保护因素。通过以上数据我们发现,每个亚组

42、中风险因素与保护因素数量基本相当,它们通过一种复杂的网络共同影响肿瘤的发生与发展。为了探索这些预后相关的差异可变剪切产生作用的分子机制,我们随后进行了比较全面的GO和KEGG功能通路的富集,如图4所示。通过对比我们发现四个队列中共同富集到的功能通路是“Hallmark epithelial-mesenchymal transition”, “cell adhesion molecule binding”和“regulation of cell cycle process”,这些通路均与细胞的趋化、粘附和增殖有关,说明可变剪切可能在肿瘤的增殖和转移过程中发挥重要作用。此外,每个亚组都各自富集了不

43、同类型的经典的功能通路,这代表着了各亚组的剪切事件可能在不同的方面影响着肿瘤的发生与发展。例如,在LUAD男性组中,我们发现整合素A9B1相关通路显著富集,有研究表明A9B1是一种多功能受体,对细胞生存和增殖具有重要的调节作用;在LUAD女性组中,我们发现了发现了MYC抑制相关通路被显著富集,有研究表明该途径在细胞增殖,分化,凋亡中起着重要作用; 在LUSC男性组中我们检测到“ VEGFR1/2通路”和“ FAK通路”显著富集;在LUSC女性组中我们发现“ p53通路”被显著富集。具体情况可在图中得到更多的信息,在这里就不一一列举了,以上功能通路的富集为后续探索NSCLC中可变剪切影响肿瘤进展

44、的分子机制机制提供了重要线索,我们已经计划开展专门的实验,来进一步证明这些通路的发生,比之若干年前只能通过猜测功能通路的发生具有重要进步。此外,不同功能同路的的发现也表明四个亚组的肿瘤发生起因和后续治疗可能有所不同,因此在后续治疗中我们可能需要针对不同亚族的特点进行个体化的评估与治疗。图4 差异剪切事件功能富集分析4可变剪切预后模型建立为了探索可变剪切对肿瘤预后的影响,我们建立多因素Cox风险比例模型。首先,为了减小变量的过度拟合,我们使用lasso回归分析筛选变量,最终,LUAD男性组与女性组分别剩63个和17个差异剪切事件作为候选;LUSC男性组与女性组分别剩15个和19个差异剪切事件作为

45、候选,筛选过程如图5所示。图5 lasso回归分析之后我们对候选变量进行多因素风险分析,最终构建了四个多因素Cox风险比例模型(表1-4)。随后便对模型进行进一步的检验,首先,按照风险模型的比例评分将每个亚组的患者为高风险组与低风险组,用Kaplan-Meier分析检验模型检测患者的生存状况。其次,绘制每个模型一、三、五年的ROC曲线并计算曲线下面积(AUCs),每个模型均表现出稳定的预测能力(图6)。IDMedianBSE瓦尔德自由度显著性Exp(B)下限上限AP_PDE4D_ID_0721350.29261.8300.48114.47010.0006.2352.42816.008ES_FA

46、M21A_ID_0115610.99161.5880.41814.42310.0004.8922.15611.100AT_HNRNPLL_ID_0532590.19181.3570.41710.58810.0013.8841.7158.794ES_LMO7_ID_0260670.55341.1330.4107.63210.0063.1051.3906.936AP_UBE2E1_ID_0637140.655850.8300.3824.71510.0302.2941.0844.854AP_SSFA2_ID_0564380.2224-0.9640.4754.11610.0420.3820.1500.

47、968ES_CA5B_ID_0983130.4595-0.9980.4076.00410.0140.3690.1660.819AP_KIAA1217_ID_0109950.07025-1.6420.45013.29610.0000.1940.0800.468表1 LUAD男性组多因素Cox风险比例模型表2 LUAD女性组多因素Cox风险比例模型IDMedianBSE瓦尔德自由度显著性Exp(B)下限上限AA_PGBD2_ID_0105730.9131.2530.26322.76710.0003.5002.0925.854AT_RPGRIP1L_ID_0364210.28620.9180.268

48、11.77210.0012.5041.4824.230AD_DAG1_ID_06488800.9140.26312.04710.0012.4941.4894.179AA_ZDHHC8_ID_0611440.989750.7250.2627.63910.0062.0651.2353.453ES_NDRG2_ID_0265120.77940.7100.2597.54610.0062.0351.2263.377AT_NUPL2_ID_0789610.938150.6420.2735.50910.0191.8991.1123.246ES_HPCAL1_ID_0526590.31660.6160.2685.28610.0211.8521.0953.131AT_EIF4E2_ID_0580000.729350.6100.2565.69810.0171.8411.1153.038表3 LUSC男性组多因素Cox风险比例模型IDMedianBSE瓦尔德自由度显著性Exp(B)下限上限AT_PSPC1_ID_0254030.18930.6830.2427.94410.005

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论