基于影像组学的肝脏脂肪变性研究

基于影像组学的肝脏脂肪变性研究

张弛1,张政1,张蕾2,朱磊2,汪丰1

1. 东南大学 生物科学与医学工程学院,江苏 南京 210096;2. 上海市第一人民医院 放射科,上海 201620

[摘 要] 目的 利用影像组学与集成学习进行肝脏脂肪变性分级研究。方法 回顾性分析2018年6月至8月于上海市第一人民医院进行MR上腹部mDixon成像序列扫描的成人患者资料,将患者的MRI数据利用影像组学特征提取方法和机器学习进行建模,研究采用3项指标对三种集成学习分类算法(AdaBoost、GBDT与XGBoost)的性能进行评估,包括准确率、精确率、召回率。结果 XGBoost算法性能最佳,分类准确率达到81.9%;五项特征重要性之和大于19%,即在总体肝脏脂肪变形程度轻中度分类模型之中所占权重接近1/5。结论 影像组学与集成学习方法为脂肪变性分级提供了一种较为可靠的辅助诊断手段,对轻中度脂肪变性的研究也能够为患者脂质代谢相关疾病的临床干预或治疗时机提供一定的参考价值。

[关键词] 影像组学;集成学习;脂肪变性分级;MRI

引言

随着生活水平的提高,人们的饮食习惯逐渐发生改变,长期摄入高糖高脂食物,导致人体内脂质物质积累过多,脂肪沉积在某些特定的器官、组织内部,造成异位脂肪沉积及脂肪变性[1]。而肝部不同程度脂肪变性会导致脂肪肝、肝纤维化、肝硬化甚至肝癌等[2]。脂肪变性导致疾病的发生为不可逆过程,因此对于轻中度脂肪变性的研究具有较大临床意义。

组织学检查是诊断肝脏脂肪变性程度的金标准[3],但由于穿刺组织活检为有创操作,且存在取样、判读误差和可重复性差等缺点[4],目前临床上主要采用超声影像进行检查,但超声影像分析在脂肪含量低于20%的时候,敏感度最高55%;CT检查在诊断轻度肝脂肪变性时准确性较差,MRI可利用脂肪与水分子中氢质子在不同磁场强度下进动频率的差异,对包括轻度肝脏脂肪变性在内的病变也能得出更加可靠的影像学诊断结果[5-7]

根据全国调查结果显示,中国成人血脂异常总体患病率高达40.40%,较2002年呈大幅度上升[8]。代谢疾病愈加威胁人类的身体健康。这些疾病会导致血管、眼、神经系统的慢性损害和功能障碍,给患者带来极大的痛苦,而肝脏脂肪变性程度与代谢异常疾病具有高相关性,研究肝脏脂肪变性程度对于代谢相关疾病的诊断具有临床意义[9-10]

近几十年随着影像领域新的硬件、标准化协议的不断出现和发展及与医疗大数据的结合,影像组学开始兴起并快速发展,通过从影像图像中高通量提取大量特征,给出更完善的分析结果[11-12]

本研究拟使用影像组学方法,获取患者腹部MRI影像中肝脏的感兴趣区域,提取影像组学特征,包括强度特征、纹理特征等等,并对特征进行筛选,再利用多种机器学习方法进行建模并进行模型评估,最终对肝脏脂肪变性轻中度进行分类研究。

1 材料与方法

1.1 临床资料

回顾性分析2018年6月至8月于上海市第一人民医院进行MR上腹部mDixon成像序列扫描的成人患者。排除标准:具有肝脏其他疾病以及因恶性肿瘤正在接受化学、放射治疗的患者。本次研究共入组50位患者,其中38位轻度肝部脂肪变性患者,12位中度肝部脂肪变性患者。患者肝部脂肪变性等级均由专业医师依据患者的超声影像与MR影像资料联合判断所给出的等级评判结果。

1.2 仪器与方法

使 用 3.0T MR机(Ingenia,Philips) 进行上腹部MR影像采集,序列采集参数如下:回波数为6;TE=n×1.15 ms,n=1,…,6; 翻转角 5°;TR=10.3 ms;FOV=400×350×210 mm3,矩阵 320×256×70,扫描时间为16 s,屏气扫描,接收线圈为腹部32通道表面线圈。

1.3 影像组学与集成学习

本研究采用影像组学与集成学习方式,流程主要包括:① 患者影像数据预处理;② 提取影像组学特征;③ 特征处理;④ 集成学习建模分类。流程图如图1所示。

图1 本文影像组学与集成学习流程图

1.4 MR数据预处理

数据预处理主要包括肝部影像数据提取和数据扩增。

(1)肝部影像数据提取。对患者的影像数据使用3D slicer软件勾画感兴趣区(Region of Interest,ROI)。ROI选取患者mDixon序列中肝部实质区域,避开大血管、局灶性病变和显著的伪影。每位患者共选取肝部区域的6个ROI,其中4个位于右叶实质(肝Ⅴ,Ⅵ,Ⅶ,Ⅷ段),2个位于左叶实质(肝Ⅱ,Ⅲ段)。每个ROI的大小均为16×16像素。

(2)数据扩增。由于患者数目较少,因此通过数据扩增的方式增加样本数量。具体的方法包括在提取ROI的上下两层数据中分别再次进行勾画,将数据进行扩增;添加随机高斯噪声等。扩增后的数据量为初始数据量的4倍。

1.5 特征提取

利用Python编码并进行特征提取,对每位患者的6个ROI分别提取影像组学特征,包括强度特征及纹理特征。强度特征主要描述ROI区域内体素强度的一阶统计特征值,包括平均值、最大值和最小值等。纹理特征包括灰度共生矩阵、灰度游程矩阵、灰度区域大小矩阵、领域灰度差矩阵、灰度相关矩阵。使用Python共提取出126项特征,其中强度特征18项,纹理特征共108项。

1.6 特征处理

由于提取出的特征在维度和取值范围上具有较为明显的差异,为了使机器学习分类模型达到更好的分类结果,需要提前对所有特征进行处理,主要包括特征筛选[13]和归一化处理。

特征筛选的目的为通过对过于冗余的特征进行剔除,减少模型建立过程中无用的计算量。特征筛选不存在对特征值的修改,而更加侧重于寻找那些对模型的性能提升较大的少量特征。由于本研究中研究的是二维图像数据,因此影像组学特征中一些描述三维的特征向量可以进行剔除,如平坦度等。经过特征筛选,剔除27项特征,剩余93项特征。

归一化处理主要针对不同特征最大值和最小值范围差距过大进行处理,如果两种特征取值范围差距过大,会导致分类模型的训练过程中产生不必要的针对特征量纲的计算,一定程度上影响分类结果。将特征处完成后整理为数据集,以供机器学习分类模型进行训练和测试。

1.7 机器学习分类

特征处理完毕后,需要建立机器学习模型对特征进行分类。本研究采用集成学习方法进行机器学习分类。相较于传统机器学习分类方法,集成学习通过特定的规则生成多个学习器,再利用一定的组合策略将这些学习器进行组合从而获取最终的结果。集成学习中的多个学习器一般为同质的“弱学习器”。基于该弱学习器,通过样本集扰动、输入特征扰动、输出表示扰动、算法参数扰动等方式生成多个学习器,进行集成后获得一个精度较好的“强学习器”,即最终集成学习模型。

本研究所采用的集成学习方法包括三种:自适应提升法(Adaptive Boosting,AdaBoost)[14]、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)[15]、极端梯度提升法(Extreme Gradient Boosting,XGBoost)[16],这三种方法都是基于Boosting(提升方法)的集成学习方法,训练多轮弱分类器,每一轮根据上一轮的分类结果动态调整每个样本在分类器中的权重,从而得到K个弱分类器,这些弱分类器都有各自的权重,通过加权组合的方式得到最终的分类结果(综合所有的基模型预测结果)。AdaBoost通过每次迭代训练中改变数据分布,根据判断每次训练集中的每个样本的正确性以及上次的总体分类的准确率来确定每个样本的权值,再将修改权值的新数据送给下层分类器进行训练,然后将每次训练得到的分类器线性组合起来作为最终的决策分类器。GBDT算法的核心则是在迭代过程中利用下一个弱分类器去拟合误差函数对预测值的残差(这个残差就是预测值与真实值之间的误差),通过不断减小残差来达到最终的分类。XGBoost与GBDT核心思想类似,区别在于XGBoost在代价函数中加入了正则项,可以控制模型的复杂度,且在每次迭代之后,XGBoost为叶子结点分配学习速率,降低每棵分类决策树的权重,为之后的训练提供更好的空间,而从权衡方差偏差来看,XGBoost降低了模型的方差,使训练模型更加精简,并能够有效防止过拟合,泛化性能优于GBDT。

1.8 分类效果性能指标

本研究采用3项指标对三种集成学习分类算法的性能进行评估,包括准确率(Accuracy,ACC),精确率(Precision),召回率(Recall),F1 score。各项指标值定义如公式(1)~(4):

其中,TP(True Positive)表示被模型预测为正的正样本数,FP(False Positive)表示被模型预测为正的负样本数,FN(False Negative)表示被模型预测为负的正样本数,TN(True Negative)表示被模型预测为负的负样本数。

2 结果

2.1 分类效果评估

本研究利用AdaBoost、GBDT与XGBoost三种集成学习算法分别将处理过后的患者肝部MRI影像组学特征进行分类,获得分类结果。训练过程中训练集与测试集划分比例为4:1。训练集数据进行交叉验证得到稳定的模型,并利用测试集评估三种分类模型的效果(表1)。XGBoost算法性能最佳,分类准确率达到81.9%。

表1 三种算法分类性能表(%)

项目 准确率 精确率 召回率 F1值自适应提升法 78.60 78.70 78.60 78.65梯度提升决策树 75.50 74.30 76.80 75.53极端梯度提升法 81.90 81.20 81.90 81.05

2.2 特征重要性

通过模型效果对比,XGBoost算法在肝脏脂肪变性轻中度分类效果最佳,因此将XGBoost模型中影像组学特征的重要性进行排序,排序结果如图2所示。特征的重要性代表了该项特征在总体模型中权重的大小,重要性越高则表明该项特征对肝脏脂肪变性程度轻中度分类发挥更大的作用。其中重要性最高的五项分别为强度特征中的90Percentile(用于描述ROI区域内总体的体素的强度分布)、灰度区域大小矩阵中的Small Area High Gray Level Emphasis(用于衡量ROI中具有较高灰度值的较小尺寸区域的联合分布比例)、灰度游程矩阵中的Run Percentage(用于衡量ROI区域纹理的粗糙度)、强度特征中的Energy(用于衡量ROI区域平均体素强度)、灰度共生矩阵中的Cluster Tendency(衡量ROI区域内具有相似灰度值的聚类趋势)。这五项特征重要性之和大于19%,即在总体肝脏脂肪变形程度轻中度分类模型之中所占权重接近1/5。

图2 特征重要性由高至低排序结果

3 讨论

三种不同的集成学习方法中最高分类准确率为XGBoost方法,准确率达到81.9%。XGBoost相较于AdaBoost与GBDT加入了二阶导数,对于影像组学特征的分类起到了更好的效果。影像组学与集成学习相结合的方法对于肝部脂肪变性轻中度分类起到了较好的结果。

通过对这三种模型性能指标的对比,选出更适合本研究患者数据的算法,并对XGBoost分类模型中影像组学特征重要性进行排序,筛选出了权重更大的一些影像组学特征。根据特征重要性排序,在重要性最高的五项特征中,90Percentile与Energy这两项特征均为描述总体的体素分布情况或平均强度的特征,而除此之外的三项特征分别衡量高灰度值的较小尺寸区域的分布、纹理粗糙度及相似灰度值的聚类趋势,这说明仅仅依靠体素的强度大小对肝脏脂肪变性进行研究具有一定的局限性,而MRI数据中还有着更多的有效特征可以进行提取并用来对脂肪变性进行更准确的分析研究。除此之外,包括灰度共生矩阵、灰度游程矩阵及灰度区域大小矩阵包含的特征也占据不小的比重。与此同时,这也表明肝脏脂肪变性的影像学表现还有着许多值得进一步研究的信息,例如纹理粗糙度和相似灰度值聚类趋势等特征,这些深层特征在分类模型的特征重要性分数中排名靠前,对于肝脏脂肪变性轻中度分类占据较高重要性,一定程度上也可能表征出肝组织的结构的变化,或是脂肪等物质在肝部的堆积情况等等,包括其他影像组学特征也可能为肝脏脂肪变性及相关疾病的诊断提供有效建议。

目前对于肝部脂肪变性研究的影像学手段一般多为超声检查及CT检查,但超声影像与CT对于轻中度脂肪变性的敏感度较低,而本研究中通过基于MRI的影像组学方法对于轻中度脂肪变性的分类准确率最高达到81.9%,可以有效解决这一问题。相较于传统依靠医学影像中体素值强度的分析,影像组学更深入挖掘了影像中的一些深层次特征[17-18],通过分析这些特征所代表的影像学意义,有助于更全面的针对肝部脂肪变性的影像学研究。

肝脏脂肪变性程度轻中度分类对于患者是否发生代谢异常的早期筛查具有一定的意义,而影像组学能有效提取患者的影像数据中的多维度特征[19-20],从而更好地进行影像分析,借助集成学习的高效分类更能进一步提取到有价值的信息,对轻中度脂肪变性的患者提供一些饮食习惯的建议或其他临床干预手段,减少患者由轻中度脂肪变性发展为更严重的肝纤维化、肝硬化甚至肝癌等的概率。

目前研究结果还存在一些不足之处,由于研究前期入组的患者数量较少,无法完全发挥集成学习的优势,后续研究将会继续收集不同程度肝脏脂肪变性患者的腹部MRI数据,增加样本数量,进一步提高分类精度,并深入分析影像组学特征的意义,挖掘肝脏脂肪变性影像资料中更多可靠、有效的信息,为影像学检查提供参考。

4 结论

本文通过结合影像组学与集成学习的方法对肝脏脂肪轻中度变性的患者进行分类,并对模型中重要性较高的影像组学特征进行分析。影像组学与集成学习方法为脂肪变性分级提供了一种较为可靠的辅助诊断手段,随着后续研究入组患者数量增多,集成学习方法将会发挥更大的优势,使分类结果更加准确可靠。通过挖掘患者影像数据中更多深层次信息,也为临床诊断提供更多有效帮助,除此之外,对轻中度脂肪变性的研究也能够为患者脂质代谢相关疾病的临床干预或治疗时机提供指导。

[参考文献]

[1] Jean-Pierre D.Abdominal obesity and cardiovascular disease:is inflammation the missing link?[J].Can J Cardiol,2012,28(6):642-652.

[2] Angrish MM,Kaiser JP,McQueen CA,et al.Tipping the balance: hepatotoxicity and the 4 apical key events of hepatic steatosis[J].Toxicol Sci,2016,150(2):261-268.

[3] Bonekamp S,Tang A,Mashhood A,et al.Spatial distribution of MRI-determined hepatic proton density fat fraction in adults with nonalcoholic fatty liver disease[J].J Magn Reson Imaging,2014,39(6):1525-1532.

[4] Merriman RB,Ferrell LD,Patti MG,et al.Correlation of paired liver biopsies in morbidly obese patients with suspected nonalcoholic fatty liver disease[J].Hepatology,2006,44(4):874-880.

[5] Castera L,Vilgrain V,Angulo P.Noninvasive evaluation of NAFLD[J].Nat Rev Gastroenterol Hepatol,2013,10(11):666.

[6] Karampinos DC,Baum T,Nardo L,et al.Characterization of the regional distribution of skeletal muscle adipose tissue in type 2 diabetes using chemical shift-based water/fat separation[J].J Magn Reson Imaging,2012,35(4):899-907.

[7] Alberti KG,Zimmet PZ.Definition,diagnosis and classification of diabetes mellitus and its complications. Part 1: diagnosis and classification of diabetes mellitus. Provisional report of a WHO consultation[J].Diabet Med,1998,15(7):539-553.

[8] Chatterjee S,Khunti K,Davies MJ.Type 2 diabetes[J].Lancet,2017,389(10085):2239-2251.

[9] 国家卫生和计划生育委员会疾病预防控制局.中国居民营养与慢性病状况报告(2015)[M].北京:人民卫生出版社,2015.

[10] Moran A,Gu D,Zhao D,et al.Future cardiovascular disease in China: markov model and risk factor scenario projections from the coronary heart disease policy model-China[J].Circ Cardiovasc Qual Outcomes,2010,3(3):243-252.

[11] Lambin P,Rios-Velazquez E,Leijenaar R,et al.Radiomics:extracting more information from medical images using advanced feature analysis[J].Eur J Cancer,2012,48(4):441-446.

[12] van Griethuysen JM,Fedorov A,Parmar C,et al.Computational radiomics system to decode the radiographic phenotype[J].Cancer Res,2017,77(21):104-107.

[13] Tuv E,Borisov A,Runger G,et al.Feature selection with ensembles, artificial variables, and redundancy elimination[J].J Mach Learn Res,2009,10(3):1341-1366.

[14] Cao Y,Miao QG,Liu JC,et al.Advance and prospects of AdaBoost algorithm[J].Acta Automatica Sinica,2013,39(6):745-758.

[15] Friedman J.Greedy Function approximation: a gradient boosting machine[J].Ann Stat,2001,29(5):1189-1232.

[16] Chen T,Guestrin C.XGBoost: a scalable tree boosting system[A].Acm Sigkdd International Conference on Knowledge Discovery and Data Mining[C].New York:ACM,2016:785-794.

[17] Gillies J,Kinahan E,Hricak H.Radiomics: images are more than pictures, they are data[J].Radiology,2015,278(2):151169.

[18] Wang G,Hao J,Ma J,et al.A comparative assessment of ensemble learning for credit scoring[J].Expert Syst Appl,2011,38(1):223-230.

[19] Li H,Zhu Y,Burnside ES,et al.MR imaging radiomics signatures for predicting the risk of breast cancer recurrence as given by research versions of mammaprint, oncotype DX, and PAM50 gene assays[J].Radiology,2016,281(2):382-391.

[20] Lambin P,Leijenaar RT,Deist TM,et al.Radiomics:the bridge between medical imaging and personalized medicine[J].Nat Rev Clin Oncol,2017,14(12):749-762.

Analysis and Classification Hepatic Steatosis Using Radiomics Analysis of MRI

ZHANG Chi1, ZHANG Zheng1, ZHANG Lei2, ZHU Lei2, WANG Feng1
1. School of Biological Sciences and Medical Engineering, Southeast University, Nanjing Jiangsu 210096, China;2. Department of Radiology, Shanghai General Hospital, Shanghai 201620, China

Abstract: Objective To study the classification of hepatic steatosis using radiomics and ensemble learning. Methods A retrospective study was conducted on the datum of adult patients who underwent abdomen MRI with mDixon sequence scanning from June 2018 to August 2018 in Shanghai General Hospital. The MRI data of patients were modeled by using the method of radiomics feature extraction and machine learning. Three indexes were used to evaluate the performance of three ensemble learning classification algorithms (AdaBoost, GBDT and XGBoost), including the rate of accuracy and recall. Results The XGBoost algorithm had the best performance, the classification accuracy was 81.9%, and the sum of the importance of the five features was greater than 19%,which meant that the weight of the total liver fat deformation degree classification model was close to 1/5. Conclusion The method of combining radiomics and ensemble learning provides a more reliable auxiliary diagnostic means for the classification of steatosis.The study of mild to moderate steatosis can also provide a certain reference value for clinical intervention or treatment opportunity of lipid metabolism related diseases.

Key words: radiomics; ensemble learning; classification of steatosis; MRI

收稿日期:2020-05-27

基金项目:江苏省重点研发计划(产业前瞻与共性关键技术)资助项目(BE2017007-3)。

通信作者:汪丰,副教授,主要研究方向为移动健康、可穿戴设备医学信号处理。

通信作者邮箱:wangfeng@i-bmd.org

[中图分类号] R318

[文献标识码] A

doi: 10.3969/j.issn.1674-1633.2021.03.020

[文章编号] 1674-1633(2021)03-0095-04

责任编辑 皮志超