CT影像组学在预测肺腺癌ALK融合基因表达中的价值初探_第1页
CT影像组学在预测肺腺癌ALK融合基因表达中的价值初探_第2页
CT影像组学在预测肺腺癌ALK融合基因表达中的价值初探_第3页
CT影像组学在预测肺腺癌ALK融合基因表达中的价值初探_第4页
CT影像组学在预测肺腺癌ALK融合基因表达中的价值初探_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要

目的探讨CT影像组学定量特征在预测肺腺癌间变性淋巴瘤激酶(ALK)融合基因表达中的价值。方法回顾性分析2015年11月至2018年5月北京协和医院有ALK基因检测结果且术前接受本院胸部CT检查的195例肺腺癌患者(其中ALK突变患者60例)。使用肺结节自动检测分割算法在CT图像上标注病变的三维容积感兴趣区(VOI)。利用PyRadiomics工具对所有VOI区域进行重采样、图像预处理(包括基于小波和拉普拉斯滤波器的预处理方法)和特征提取。在Dr.Wise科研平台上对已提取的特征进行标准化处理,并分别基于不同图像预处理方式及不同特征类型筛选关键特征,用多因素logistic回归建模和10次5折交叉验证法进行验证。采用ROC评价模型对ALK基因突变的预测能力,并使用DeLong比较不同模型的效能。

结果每个病灶共提取1232个影像组学特征。在特征筛选后共纳入15个组学特征建模,在训练集和验证集中模型预测ALK基因突变的AUC分别是0.88和0.78。分别基于原始CT图像、小波处理后图像和拉普拉斯高斯滤波器处理后图像的组学特征建模时,在验证集中模型的AUC分别为0.76、0.75和0.76。这3组模型与全部特征联合建模模型的效能相比差异均无统计学意义(P>0.05)。以不同类型的组学特征建模,一阶特征和灰度共生矩阵(GLCM)纹理特征预测ALK基因突变能力较好,其中GLCM特征模型最优,在验证集中的AUC为0.83,准确率、敏感度和特异度分别为0.74、0.85和0.69;一阶特征模型在验证集中的AUC为0.80。结论CT影像组学定量特征在预测肺腺癌ALK融合基因表达中有较大的应用价值。近年来肺癌的分子病理学和分子靶向治疗研究进展迅速,不同基因突变被认为是各型肺癌发病和演变的基础[1],许多研究证实间变性淋巴瘤激酶(anaplasticlymphomakinase,ALK)融合基因是仅次于表皮生长因子受体(epidermalgrowthfactorreceptor,EGFR)基因的又一参与非小细胞肺癌发病的主要基因[2],且多发生于肺腺癌患者。对ALK阳性肿瘤靶向治疗的效果优于传统治疗,因此精准识别ALK突变患者对选择合适的治疗至关重要。有学者研究了肺腺癌的CT征象与ALK基因突变间的相关性[3,4],认为ALK基因突变阳性者易呈实性密度、分叶状边缘,这些CT征象可能有助于预测基因突变。近年来影像组学技术迅速发展,研究显示影像组学特征可预测不同的基因表达模式,但既往多集中在对EGFR基因的研究[1,5,6],采用影像组学预测肺癌ALK基因突变的文献报道较少,且特征提取及特征选择算法简单[7]。因此,本研究尝试基于薄层CT提取定量影像组学特征,结合不同特征选择算法构建组学模型,探讨不同种类组学特征在预测肺腺癌ALK融合基因表达中的价值。资料与方法一、临床资料回顾性分析2015年11月至2018年5月北京协和医院符合下列标准的患者。纳入标准:(1)手术或活检病理确诊为肺腺癌;(2)具有ALK基因检测结果;(3)术前接受本院胸部CT检查,且CT检查与手术或活检间隔<1个月;(4)有薄层(层厚≤2mm)肺窗图像。排除标准:(1)术前CT图像伪影较大,影响分析;(2)术前接受过新辅助放化疗或抗炎治疗者。根据纳入和排除标准,共195例肺腺癌(ALK阳性60例,ALK阴性135例)患者纳入研究,男89例,女106例,年龄58±10(26~81)岁;肿瘤病变均为单发。ALK免疫组织化学染色按照Ventana免疫组织化学法进行,兔单克隆阴性质控抗体及ALK阳性与阴性的肺癌病例用于系统水平质控,以确保该检测合乎要求。

二、CT检查方法采用多层螺旋CT(德国SiemensSomatomForce,SomatomFlash双源CT或美国GEDiscoveryCT750HD)行术前常规胸部CT检查。扫描参数:管电压120kV,自动管电流,螺距0.984~1.200,矩阵512×512,FOV350mm×350mm,原始数据采集后所有患者均行0.5~2.0mm无间隔薄层重建,采用高分辨肺算法,肺窗窗宽1200HU,窗位-500HU。

三、影像组学分析1.病变标注:将匿名化后的薄层肺窗DICOM图像导入Dr.Wise科研平台,使用平台上肺结节检测和分割模型进行病变自动检测和分割。平台内置的深度学习模型采用基于图像和特征金字塔网络(featurepyramidnetworks,FPN)结合的两级网络,并已在公开数据集和内部数据集上训练完成。深度学习模型的分割结果,在不给出病理结果和其他信息的情况下,由2名分别具有3年和14年肺癌影像诊断经验的放射科医师共同逐层确认并做必要的修改;三维容积感兴趣区(volumeofinterest,VOI)按照瘤肺界面进行勾画,勾画过程中尽量排除血管、支气管、肺不张等区域,为了较准确真实地勾画病变,如区分中心型肺癌与肺门血管或远端肺不张组织等,有时需结合增强CT纵隔窗图像。

2.特征提取:使用PyRadiomics工具包计算VOI内肿瘤组织的影像组学特征。首先对图像进行重采样,使图像在3个解剖方向上像素间距为1.0mm,排除CT机型不同造成的空间分辨率不一致引起的干扰。

对于原始CT图像,应用高通或低通小波滤波器和具有不同λ参数的拉普拉斯高斯滤波器进行预处理,得到8个小波预处理后图像和5个拉普拉斯滤波器预处理后图像。提取原始CT图像和预处理后图像的影像组学特征,包括基于CT值或预处理后图像像素值的一阶特征、描述肿瘤形态的形态特征及描述肿瘤内部和表面纹理的灰度共生矩阵(GLCM)、灰度游程矩阵(GLRLM)、灰度区域大小矩阵(GLSZM)和灰度共生矩阵(GLDM)纹理特征。每个病变共提取1232个影像组学特征,并进行Z-score标准化。

3.机器学习模型建立和评估:首先,使用全部组学特征进行建模;然后,使用原始图像上提取的组学特征、预处理图像提取的组学特征分别建模;最后,按特征提取类别对组学特征进行分组,包括一阶特征、形态特征及纹理特征(GLCM、GLRLM、GLSZM和GLDM),并使用每组特征分别建模。比较不同组学特征预测ALK基因突变的差异。

采用多因素logistic回归方法建模,模型超参数使用网格化搜索,根据验证集中受试者工作曲线(ROC)下面积(AUC)逆向选择最佳超参数。对每个模型,均采用10次5折交叉验证进行训练。分别记录每次迭代时模型预测训练及验证集数据为ALK+的概率,计算每个数据作为训练集或验证集时每次迭代记录的概率的均值,作为模型的训练集或验证集的结果。据此计算模型在训练集和验证集的各项指标,包括模型的AUC、准确率、敏感度、特异度等。对最大AUC值行后向淘汰筛选,获得关键影像组学特征。上述特征选择、模型构建和评估均通过Dr.Wise科研平台进行。

四、统计学方法统计分析用SPSS20.0软件。年龄、病变最大径和平均CT值为连续变量,以±s或M(P25,P75)表示,ALK阳性组与阴性组间年龄比较采用独立样本t检验,病变最大径及平均CT值的比较采用Mann-Whitney

U检验;性别为分类变量,采用卡方检验。在Dr.Wise科研平台基于Scikit-learn软件包(Version0.20.3)构建logistic回归模型。使用Matplotlib(Version3.1.0)绘制ROC曲线图。使用MedCalc软件(Version19.0.2)对模型的ROC曲线进行DeLong检验,比较各模型间效能差异是否有统计学意义。P<0.05为差异有统计学意义。结果一、一般临床资料及定量参数195例肺腺癌患者两组间一般临床资料及定量参数的比较见表1,性别及病变最大径差异无统计学意义,年龄和平均CT值在两组间差异具有统计学意义。

二、影像组学特征分析结果1232个影像组学特征全部联合建模,特征选择后模型共纳入15个组学特征(表2),在训练集和验证集的AUC分别是0.88(95%CI,0.83~0.92)和0.78(95%CI,0.71~0.83)(图1),在验证集中的准确率为0.78。

图1

验证集中不同模型效能ROC。所有特征联合建模、一阶特征及灰度共生矩阵(GLCM)特征模型的ROC下面积分别为0.78、0.80和0.83根据图像处理方式建模,基于原始CT图像提取114个一阶、形态及纹理特征,基于小波处理后图像提取688个一阶、形态及纹理特征,基于拉普拉斯高斯处理后图像提取430个一阶、形态及纹理特征,特征选择后分别纳入11个、7个和12个特征建模,在验证集中的AUC分别为0.76(95%CI,0.70~0.82)、0.75(95%CI,0.69~0.81)和0.76(95%CI,0.69~0.82),略低于全部特征联合模型的预测性能。基于三种不同图像处理方式的特征模型分别与全部特征联合模型的AUC相比均无统计学差异(DeLong检验,P>0.05)。根据一阶特征、形态特征和纹理特征(包括GLCM、GLSZM、GLRLM和GLDM)3种特征类型分别建模,结果显示一阶特征和GLCM纹理特征模型预测ALK融合基因突变的能力最好,在验证集的AUC分别为0.80(95%CI,0.74~0.85)和0.83(95%CI,0.77~0.88)(图1),形态特征的AUC仅为0.6(95%CI,0.53~0.67);其他纹理特征的AUC均在0.75左右。GLCM特征模型的结果见表3。讨论本研究ALK阳性组患者年龄明显较ALK-组年轻(P=0.001),两组间性别、病变大小差异无统计学意义,年龄、病变大小方面与既往研究相符,但Choi等[4]的研究认为ALK阳性肺癌好发于男性患者,而本研究ALK阳性组女性相对更多见,但与ALK阴性组相比差异无统计学意义,关于性别好发情况有待后续进一步大样本报道。本研究ALK阳性组平均CT值明显高于ALK阴性组,这与既往研究显示ALK阳性肿瘤易呈实性密度的结论相符。既往研究旨在从临床和影像角度筛选出对ALK治疗敏感的突变人群,但大多数影像学方面的研究是基于病变的常规定量或定性信息在实际操作中费时费力且易受医师主观判断及临床经验的影响,导致上述研究方法的应用受到了限制。本研究聚焦于探索CT组学特征预测肺腺癌患者ALK基因突变的效能。我们基于不同图像处理方式的3组特征模型在验证集中的AUC(0.76、0.75、0.76)分别与全部特征模型的AUC(0.78)相比差异均无统计学意义,说明本研究的预测模型具有一定的鲁棒性。本研究不同特征类型分别建模时,显示形态特征模型在验证集中的AUC仅为0.6,提示肿瘤形态特征预测ALK基因突变的能力较差。其发现ALK基因突变仅与胸腔积液和年龄因素相关,两者联合预测ALK突变的AUC为0.65。一阶特征在原始图像中主要反映的是CT值信息,本研究中一阶特征模型在验证集中AUC达0.80,提示病变密度有助于鉴别ALK突变状态。既往亦研究了CT影像组学预测ALK基因突变的价值,模型预测ALK融合基因阳性的敏感度、特异度、阳性和阴性预测值分别为0.73、0.70、0.71和0.69。本研究探索了不同组学特征模型的表现,经比较发现GLCM特征模型在预测肺腺癌ALK基因突变时效能最优,AUC高于研究,敏感度高于研究,特异性相近。与研究相比,本研究GLCM特征模型在验证集中的AUC(0.83vs0.79)和敏感度(0.85vs0.74)更高,特异性稍低(0.69vs0.81)。本研究结果表明影像组学特征可有效预测肺腺癌的ALK基因表达。与研究相比,本研究采用了基于深度学习的病变自动检测分割算法,该算法已由来自公共和内部数据集的50000多份CT图像进行训练,可大大节省医师勾画病变VOI的时间,且结果的可重复性高;在提取组学特征前行图像重采样且使用小波或拉

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论