基于肺癌CT建立淋巴结转移的诺莫图预测模型研究引言肺癌具有极高发病率和转移率[1-2],全球每年肺癌新发病例数约173万[3],其致死人数占全球癌症死亡人数的19%[4]。淋巴结转移是影响肺癌患者生存预后的一个重要因素[5],发生淋巴结转移的患者中,仅有26%~53%的患者生存期能超过五年[6-7]。临床上诊断肺癌淋巴结转移的金标准是病理活检,如胸腔镜手术和支气管超声等侵入性方法,但可能引起严重的并发症[8]。目前缺乏一种通过术前影像对肺癌淋巴结转移进行预测的技术方法。 计算机断层扫描因其具有较高的空间分辨率而在肺癌的常规诊断、分析、疗效评估中发挥着重要的作用[9-10]。CT图像中蕴含的结节的形状、大小、方位等临床信息对疾病的诊断预测具有重要意义[11]。 近年来,影像组学技术发展迅速,通过高通量提取医学图像中隐藏的深层次特征信息[12-13],能够准确反应肿瘤的生物学特性,可实现无创地对患者肿瘤进行分型及鉴别[14]。诺莫图模型通过结合患者的影像组学特征和临床指标,可充分揭示特征与疾病病理之间潜在的联系[15],具有良好的临床适用性。本研究利用肺癌患者CT影像与患者的临床指标建立诺莫图模型分析其对淋巴结转移进行预测的效果,以期为临床决策提供参考。 1 材料与方法1.1 患者信息回顾性分析2014—2017年于中国医科大学附属辽宁省肿瘤医院确诊的肺癌患者,共纳入211例肺癌患者(男性120例,女性91例;患者年龄在29~80岁之间,平均年龄59.1岁);有72人已发生淋巴结转移,139人未发生淋巴结转移。入组标准:① 术前进行CT扫描;② 有病理结果并作为金标准;③ 年龄在18岁以上。排除标准:① 同时患有其它肿瘤疾病;② 进行过化疗或放疗;③ CT数据不完整或病灶小于三层(扫描层厚5 mm,螺距1.0)。 1.2 临床CT扫描扫描设备选用64排螺旋CT机(SOMATOM De finition单源CT机,德国西门子公司)。扫描参数:电压120 kV,电流200~350 mAs,扫描层厚5 mm,矩阵512×512。扫描范围:肺尖至肋膈角。 1.3 图像预处理患者的CT扫描图像保存为DICOM格式文件,并储存在医院PACS系统中。为了获取每位患者的病灶区域(Region of Interest,ROI),由两位10年以上工作经验的影像科医生通过ITK-SNAP(3.6.0版本)软件进行手动勾画并保存为NII格式文件。 1.4 影像特征提取和筛选通过Python 3.6编程从CT图像中提取影像组学特征,包括图像的一阶统计、形状、灰度共生矩阵(Gray-Level Co-occurrence Matrix,GLCM)、灰度区域大小矩阵(Gray-Level Size Zone Matrix,GLSZM)和灰度行程纹理矩阵(Gray-Level Run Length Matrix,GLRLM)[16-17]。利用LASSO算法对提取的影像组学特征进行筛选。 1.5 临床指标分析根据患者性别、家族史、吸烟史、癌胚抗原(Carcinoembryonic Antigen,CEA)、神经元特异性烯醇化酶(Neuron Specific Enolase,NSE)和细胞角蛋白(Cytokeratin,CYFRA)临床指标,采用χ2检验、K-S检验及U检验,评价特征与治疗反应的相关性。P<0.05表明具有统计学意义。统计分析使用SPSS软件(24.0版本)。 1.6 构建诺模图模型使用 LASSO(Least Absolute Shrinkage and Selection Operator)算法[18]构造影像组学标签,结合临床指标(年龄、性别、吸烟史、CEA、NSE、CYFRA),用R语言的rms软件包(v.3.5.1)建立诺莫图模型。决策曲线(Decision Curve,DCA)通过计算不同阈值概率下的净效益来评估诺莫图的临床应用价值。 1.7 验证方法以受试者工作特征(Receiver Operating Characteristic,ROC)曲线下面积(Area Under Curve,AUC)、准确度、特异度和灵敏度作为比较指标,计算公式:① 准确度=(真阳性患者人数+真阴性患者人数)/(真阴性人数+假阴性人数+真阳性人数+假阳性人数);② 灵敏度=真阳性人数/(真阳性人数+假阴性人数);③ 特异度=真阴性人数/(真阴性人数+假阳性人数)。本研究全部算法运行的硬件平台为3.7GHz Intel i7-8700K CPU和64GB 3000 MHz DDR4 RAM。 2 结果2.1 临床指标分析本研究中患者的临床指标结果如表1所示。将所有患者以7:3的比例划分为训练集和测试集,年龄的测试集采用U检验,训练集采用t检验,其余临床指标训练集和测试集均采用χ2检验。训练组和测试组患者的性别、年龄、吸烟史、家族史、NSE和CYFRA均无统计学意义;训练组中患者的CEA具有显著统计学意义,P<0.001。 表1 测试集和训练集中患者的临床指标概况 临床指标训练集(n=147) 测试集(n=64)转移(n=90)未转移(n=57)P转移(n=49)未转移(n=15) P 0.062吸烟史 0.857 0.738有 44 27 27 9无 46 30 22 6家族史 0.635 >0.999有 22 12 12 4无 68 45 37 11 CEA <0.001 0.991阳性 9 24 12 3阴性 74 29 30 10 NSE 0.275 0.955阳性 47 35 25 8阴性 35 15 16 5 CYFRA 0.851 >0.999阳性 17 10 8 2阴性 52 26 23 11性别 0.222 0.261男 46 22 28 11女 44 35 21 4年龄58.73±8.56 59.79±9.36 0.673 60.22±1.02 56.00±2.25 2.2 构建诺莫图模型从患者的CT图像中共提取855个影像组学特征,利用LASSO回归模型进行特征降维获得9个相关性较高的特征并构建了影像组学标签,即Ct score。 Ct score=(-5.50212843e01)×original_glcm_Imc2+(1.27936076e01)×original_glcm_InverseVariance+(-1.52741916e-01)×original_glcm_SumAverage+(3.21012323e-03)×original_glszm_LargeAreaLowGrayLevelEmphasis+(1.5 2245783e-05)×wavelet-HHH_ngtdm_Busyness+(1.52885379 e+00)×wavelet-HHL_glcm_Idn+(-8.46251468e-01)×wavelet-HLH_glcm_ClusterTendency+(-5.27286929e-03)×wavelet-HLH_glrlm_RunEntropy+(3.00252669e-01)×wavelet-HLH_glrlm_RunLengthNonUniformityNormalized 多因素逻辑回归构建的包含临床指标CEA和影像组学标签的诺莫图模型如图1所示,影像组学标签和CEA得分求和得出总分数(范围:0~100),将总分数定位在总分数轴上,自上而下画一条垂线与最底部的量表的交点即为恶性肺结节的淋巴结转移风险(范围:0.1~0.9)。 图1 多因素逻辑回归结合CEA和影像组学标签构建的诺莫图模型 经诺莫图模型绘制出ROC曲线,见图2。模型训练集的AUC为0.859(灵感度为0.810,特异度为0.773),测试集AUC为0.864(灵感度为0.820,特异度为0.753),结果表明诺莫图模型在预测肺癌淋巴结转移方面展现出了良好的预测性能。图3所示为诺莫图模型的决策曲线,分析曲线可知当患者发生淋巴结转移的阈概率大于0.06%时,使用诺莫图模型对患者进行淋巴结转移的预测相较另外两种治疗方案(假设所有患者均发生淋巴结转移和假设所有患者均未发生淋巴结转移)而言,能得到更大的净获益。这一结论凸显了诺莫图模型在淋巴结转移预测方面的临床应用价值。 图2 诺莫图模型训练集和测试集的ROC曲线 注:a.训练集ROC曲线;b.测试集ROC曲线。 图3 诺莫图模型中的决策曲线 3 讨论肺癌的淋巴结转移状态是患者的外科手术治疗的选择以及是否使用如淋巴结清扫术等辅助治疗的关键因素,术前无创预测淋巴结转移具有重要的临床意义。 本文通过ROC曲线来直观展示诺莫图模型的预测性能。ROC曲线下面积即AUC值作为模型准确评估患者患病的概率,可用于评价模型预测性能的优劣;特异性、敏感性用于辅助评价模型的性能。ROC曲线是一种判断模型优劣的最直观、最常用的方法。本研究诺莫图模型测试集AUC 为0.864,特异度为0.753,灵敏度为0.820,具有优秀的预测淋巴结转移能力。 诺莫图模型常用于影像组学的研究,能通过患者的个体特征评估临床事件发生的概率,是一种很好的预测分类模型[19-21]。相比于其他预测性统计学模型,其可视化的图标式结果,能更直观的反映患者的患病概率,并提供个体化的预后风险评估。CEA是一种血清肿瘤标志物,常被用于早期肺癌的检测。本研究对与肺癌相关的临床指标进行统计学分析,结果显示CEA与恶性肺结节的淋巴结转移相关性较高(P<0.001),是作为构建预测肺癌患者淋巴结转移的诺莫图模型的独立预后因子(表1),与既往研究一致[22-23]。本研究将临床指标CEA和通过LASSO算法构建的影像组学标签(LASSO算法对处理的数据要求低,是一种应用广泛的数据筛选方法)一同作为预测因子参与构建诺莫图。由模型绘制出的ROC曲线测试集AUC为0.864,灵敏度为0.820,特异度为0.753;Yang等[20]人通过肺癌LNM分级和影像组学特征标签建立诺莫图预测肺癌的淋巴结转移,测试集AUC为0.856、特异度为0.821、灵敏度为0.917,表明经CEA和肺癌组学特征建立的诺莫图模型具有优秀的预测淋巴结转移能力。DCA是一种评估模型在支持临床决策方面是否具有效用的统计学方法[24]。相较于ROC从准确性方面评价模型的优劣,DCA更偏向于从临床效益方面评价模型,即在假阳性和假阴性均无法避免的情况下,寻求一种使患者净受益最大的办法。本研究绘制了诺莫图决策曲线,图形表明当患者发生淋巴结转移的阈概率大于0.06%时,由诺莫图模型对患者淋巴结转移进行预测比“不治疗”或“全部治疗”策略更有效,显示出良好的临床应用潜能。 本研究有几个局限性。首先,所有的数据都来自同一家医院,不具有普遍性,在今后的研究中会引入多中心数据。其次,肺癌的淋巴结转移还与基因、蛋白质表达有关[25-26],而本研究并未纳入该类因素;最后,本研究中的影像组学特征依赖于医生手工勾画ROI,两位医生对肺结节病灶区域勾画的相关系数值为0.954,具有很高的一致性,但较为耗时。在未来的研究中,扩大样本容量、纳入不同地域的患者、融合更多的临床信息,采用更高效、更准确的病灶分割算法将更有可能改善模型的性能和普适性。 综上所述,本研究利用CT图像建立了包含临床指标CEA和影像组学标签的诺莫图模型。ROC和DCA结果析显示:诺莫图模型在预测肺癌淋巴结转移方面展现出了良好的预测效果和临床应用价值。 [1]Han Y,Jia C,Cong X,et al.Increased expression of TGFβR2 is associated with the clinical outcome of non-small cell lung cancer patients treated with chemotherapy[J].PLoS One,2015,10(8):e0134682. [2]Torre LA,Bray F,Siegel RL,et al.Global cancer statistics[J].CA,2012,2015,65(2):87-108. [3]Siegel RL,Miller KD,Jemal A.Cancer statistics[J].CA,2018,68(1):7-30. [4]Siegel RL,Miller KD,Jemal A.Cancer statistics[J].CA,2019,69(1):7-34. [5]Goldberg SB,Contessa JN,Omay SB,et al.Lung cancer brain metastases[J].Cancer J,2015,21(5):398-403. [6]Eberhardt WE,Mitchell A,Crowley J,et al.The IASLC lung cancer staging project: proposals for the revision of the M descriptors in the forthcoming eighth edition of the TNM classification of lung cancer[J].J Thorac Oncol,2015,10(11):1515-1522. [7]Adam MA,Pura J,Goffredo P,et al.Presence and number of lymph node metastases are associated withcompromised survival for patients younger than age 45 years with papillary thyroidcancer[J].J Thorac Oncol,2015,33(21):2370-2375. [8]Yasufuku K,Pierre A,Darling G,et al.A prospective controlled trial of endobronchial ultrasound-guided transbronchial needle aspiration compared with mediastinoscopy for mediastinal lymph node staging of lung cancer[J].J Thorac Cardiovasc Surg,2011,142(6):1393-1400. [9]Elia S,Loprete S,De Stefano A,et al.Does aggressive management of solitary pulmonary nodules pay off?[J].Breathe,2019,15(1):15-23. [10]Mery CM,Pappas AN,Bueno R,et al.Relationship between a history of antecedent cancer and the probability of malignancy for a solitary pulmonary nodule[J].Chest,2004,125(6):2175-2181. [11]MacMahon H,Naidich DP,Goo JM,et al.Guidelines for management of incidental pulmonary nodules detected on CT images: from the Fleischner Society 2017[J].Radiology,2017,284:228-243. [12]Kumar V,Gu YH,Basu S,et al.Radiomics: the process and the challenges[J].Magn Reson Imag,2012,30(9):1234-1248. [13]Hatt M,Tixier F,Visvikis D,et al.Radiomics in PET/CT: more than meets the eye?[J].J Nucl Med,2017,58(3):365. [14]Gillies RJ,Kinahan PE,Hricak H.Radiomics: images are more than pictures,they are data[J].Radiology,2016,278(2):563-577. [15]Parmar C,Grossmann P,Aerts HJ,et al.Machine learning methods for quantitative radiomic biomarker[J].Sci Rep,2015,5:13087. [16]Aerts HJ,Velazquez ER,Leijenaar RT,et al.Decoding tumour phenotype by noninvasive imaging using a quantitative radiomics approach[J].Nat Commun,2014,5:4006. [17]Zhou H,Dong D,Chen B,et al.Diagnosis of distant metastasis of lung cancer: based on clinical and radiomic features[J].Transl Oncol,2018,11(1):31-36. [18]Sauerbrei W,Royston P,Binder H.Selection of important variable sand determination of functional form for continuous predictors in multivariable model building[J].Stat Med,2007,26:5512-5528. [19]Wang Y,Li J,Xia Y,et al.Prognostic nomogram for intrahepatic cholangiocarcinoma after partial hepatectomy[J].J Clin Oncol,2013,31(9):1188-1195. [20]Yang X,Pan X,Liu H,et al.A new approach to predict lymph node metastasis in solid lung adenocarcinoma: a radiomics nomogram[J].J Thorac Dis,2018,10(7):S807-S819. [21]O’Brien BA,Cohen RJ,Wheeler TM,et al.A post-radicalprostatectomy nomogram incorporating new pathological variables and interaction terms for improved prognosis[J].BJU Int,2011,107(3):389-395. [22]Doseeva V,Colpitts T,Gao G,et al.Performance of a multiplexed dual analyte immunoassay for the early detection of non-small cell lung cancer[J].J Transl Med,2015,13(1):1-15. [23]Wang P,Piao Y,Zhang X,et al.The concentration of CYFRA 21-1,NSE and CEA in cerebro-spinal fluid can be useful indicators for diagnosis of meningeal carcinomatosis of lung cancer[J].Cancer Biomark,2013,13(2):123-130. [24]Van CB,Wynants L,Wynants JFM,et al.Reporting and interpreting decision curve analysis: a guide for investigators[J].Eur Urol,2018,74(6):796-804. [25]Lee CK,Brown C,Gralla RJ,et al.Impact of EGFR inhibitor in nonsmall cell lung cancer on progression-free and overall survival:a meta-analysis[J].J Natl Cancer Inst,2013,105(9):595-605. [26]Zhang C,Wu N,Gao F,et al.MTERFD1 functions as an oncogene[J].Oncotarget,2016,7(8):11140. Study on Nomogram Prediction Model of Lymph Node Metastasis Based on Lung Cancer CT |