专论——智能精准影像学初步研究(四)

编者按:医学影像种类很多,都同样面临人工智能的发展机遇。人工智能技术的发展促进了大影像学科(覆盖全部医学影像)的整合。本期“智能精准影像学初步研究”系列专题介绍血液细胞显微图像人工智能辅助诊断分类、白细胞图像分割的新方法、多模态成像精准诊断研究以及乳腺癌磁共振成像的发展等内容。期望在同道们的共同努力下,促进大影像学科在智能化、精准化方面同步发展。

栏目主编:刘景鑫

刘景鑫,教授,博士生导师,“十三五”国家重点研发计划“放射诊断设备低剂量控制评价与使用规范研究”重点专项项目负责人(首席科学家),吉林大学高层次科技创新团队“基于智能影像与生命组学的精准医学”PI。吉林省医学影像工程中心主任,吉林大学中日联谊医院放射线科副主任。国家自然科学基金、科技部、教育部、国家卫健委等评审专家,中华医学会医学工程学分会常委,中国医师协会临床工程师分会常委,中国医学装备协会CT工程技术专委会常委,中国计量测试学会医学计量分会常委,吉林省医学会医学工程学分会主任委员,吉林省医学会影像技术分会副主任委员,吉林省卫生信息学会副理事长,吉林省计算机学会常务理事,《中国医疗设备》《生物医学工程与临床》《中国医学工程》《国际生物医学工程杂志》及《中国医学装备》等杂志编委。在医学影像质量控制、创新成像技术及智能精准影像学方面有专长。

基于VGG16的急性淋巴细胞白血病血液细胞显微图像人工智能辅助诊断分类研究

张海涛1,刘景鑫2,赵晓晴1,胡笑含3,李慧盈1

1. 吉林大学 计算机科学与技术学院,吉林 长春 130012;2. 吉林大学中日联谊医院 放射线科,吉林 长春 130033;3. 吉林大学第一医院 放射线科,吉林 长春 130021

[摘 要] 针对临床医学中急性淋巴细胞白血病(Acute Lymphoblastic Leukemia,ALL)血液细胞显微图像分类易错、费时等问题,本文提出了一种基于深度学习VGG16卷积神经网络模型的方法去获取医学图像中高纬度的病理信息。该方法首先将样本数据进行预处理,清洗出符合要求的训练集和验证集,其中还用到了超像素的方法用于训练样本的目标区域提取,然后再将预处理好的数据,输入到VGG16卷积神经网络模型中,对其进行训练,最后输入验证集进入模型中进行验证,实验结果表明,该分类方法能有效地完成ALL血液细胞显微图像是否患病的分类。

[关键词] 急性淋巴细胞白血病;血液细胞显微图像;VGG16卷积神经网络;深度学习

引言

临床上,医生会通过血常规中正常的白细胞与非正常的白细胞所占总细胞数量比例进行判断是否患病[1-2]。传统诊断中,临床上通过血常规检查结果对患者是否患有白血病进行人工判断,通过血常规检查可以了解到患者的血细胞数量是否处于正常数量[3-4]。纯人工的方式,费时又费力,故而当前医院中更为普遍的分类计数方式是通过借助自动血球计数仪集合血液图片人工镜下检查进行操作[5-6]。这种自动化血球计数仪的临床应用减轻了临床检验人员的劳动量,促进了血液学实验室诊断和治疗检测水平的提高,但仍存在分类精度不够高的问题,容易将形态差异较小的正常与非正常白细胞给区分错[7-9]

针对这种不足,医学影像分类逐渐走向智能化处理,如传统方法中使用FCM聚类算法[10],Mean-Shift聚类[11],决策树算法[12],朴素贝叶斯分类器[13]、随机森林算法[14]等方法对医疗影像进行分类。传统方法在对医学影像进行分类处理时一般具有鲁棒性高、处理效率快、容易实现等特点。但是对于医疗影像中所表现出来全部的特征,传统方法所获取的并不多,故而对于医疗影像的处理逐渐走向利用神经网络去获取图像中高纬度的病理特征[15-16]。基于人工智能的方法能更好地学习医疗图像中所蕴含的信息,其中有使用PCA(主成分分析)和LVQ(学习矢量量化)神经网络相结合的方法[16],前馈反向传播神经网络的方法[17],使用ResNet V1 50,ResNet V1 152和ResNet 101[18]进行分类的方法,以及以AlexNet和LeNet为网络原型构建CNN训练平台,对LeNet网络进行删减优化,获得一轻量高效的新结构——CCNet的方法[19]。这些基于人工智能的方法更有利于学习图像的特征,并且能大幅度地提高分类准确率,在计算机图像分类领域中已经得到了广泛的应用。

因此,本文引入此思想对白细胞进行分类,利用VGG16卷积神经网络针对急性淋巴细胞白血病(Acute Lymphoblastic Leukemia,ALL)患者的血液细胞显微图像进行辅助分析,分类出白细胞是否为患病细胞。本文中从基于像素的角度分类识别出不同显微图像中的纹理特征,不仅能在一定程度上极大的节省人力的投入,而且能为医护人员提供更高准确率的分类结果[20-21]。通过实验发现,相对于其他的方法,基于VGG16的网络模型能更好地学习小样本量的数据,并在一定时间内较快地收敛,大大减少了实验的资源开支。

1 基于VGG16的ALL血液细胞显微图像分类方法

由于受到医疗成像设备的影响,故而对于所采集到的数据会和实际试验中所需要的样本有所不一致,故而针对这种情况,本研究中将整个实验给分为了两部分,分别是:数据预处理阶段和VGG16卷积神经网络分类识别阶段。

1.1 数据预处理

在数据预处理阶段,我们一共完成了两项工作,分别是将RGB,即红(Red)绿(Green)蓝(Blue)颜色空间映射到HSV颜色空间和目标区域的提取。其中颜色空间的映射转换目的是为了提高处理时的敏感程度,而目标区域的提取则是为了尽可能地排除白细胞以外的各种非目标区域的影响从而保证分类识别的高效性。

1.1.1 图像色彩空间转换

一般情况下,图像的颜色空间都是RGB模型,一般以一种三维坐标的模型形式表示,图1显示出了RGB模型。HSV既色调(H:hue),饱和度(S:saturation),亮度(V:value),由A.R. Smith在1978年创建的一种颜色空间,也称六角锥体模型(Hexcone Model)。其中 H:用角度度量,取值范围为 0°~360°,从红色开始按逆时针方向计算,红色为0°,绿色为120°,蓝色为240°。它们的补色是:黄色为60°,青色为180°,品红为300°;S:取值范围为0.0~1.0,值越大,颜色越饱和;V:取值范围为0(黑色)~255(白色),如图2所示。

图1 RGB颜色模型

图2 HSV颜色模型

由于RGB是加法原色模型,以原色组合的方式定义颜色,而HSV以人类更熟悉的方式封装关于颜色的信息,例如:什么颜色?颜色深浅度多少?明暗程度如何等,故而在计算机图形应用处理中更多地采用HSV模型,从而需要将一般的RGB图像给映射到HSV空间上。其映射计算公式如(1)~(3)所示:

其中max等价于rgb中的最大者,而min等于这些值中的最小者。

1.1.2 目标区域提取

由于原始细胞图像中所含有的背景等无关信息较多,为了更好地提取白细胞的特征,而避免无关因素的干扰,从而在此部分完成白细胞目标区域提取的功能。采用超像素的思想标记出ALL血液细胞的轮廓图,再根据所标记的轮廓将原始图像进行分割从而得到目标影像图,操作示意过程,如图3所示。

图3 ALL血液细胞目标区域提取

在完成目标区域的提取后,在对神经网络进行输入前还需要对数据进行归一化处理,是预处理模块中的一项基本且必不可少的工作。由于原始数据集中的不同特征往往具有不同的量纲单位,或是数据的值域区别较大。在这样的情况下,数据值将会对数据分析的结果产生较大影响。而对数据进行归一化处理,能在一定程度上消除特征之间量纲和取值范围的影响,从而解决数据特征之间的可比性。归一化公式如下:

1.2 VGG16卷积神经网络分类识别

牛津大学在2014年提出来了VGG卷积神经网络的模型。当这个模型被提出时,由于它的简洁性和实用性,马上成为当时最流行的卷积神经网络模型。该网络模型在图像分类和目标检测任务中都表现出非常好的结果。而在其变形中VGG16的表现又尤为突出,故而本文采用VGG16卷积神经网络模型。

1.2.1 VGG16卷积神经网络模型

VGG网络是卷积神经网络的一种,探索了卷积神经网络的深度与其性能之间的关系,通过反复堆叠3×3的小型卷积核和2×2的最大池化层,VGG Net成功地构筑了16/19层深的卷积神经网络,本系统中采用的是VGG16网络模型,其中16表示除pooling layer(池化层)外使用conv layer(卷积层)的层数(图4)。其主要拥有的特点有:① 将卷积层提升到卷积块的概念:卷积块有2~3个卷积层构成,使网络有更大感受野的同时能降低网络参数,同时多次使用ReLu激活函数有更多的线性变换,学习能力更强;② 在训练时和预测时使用Multi-Scale做数据增强:训练时将同一张图片缩放到不同的尺寸,在随机剪裁到224×224的大小,能够增加数据量。预测时将同一张图片缩放到不同尺寸做预测,最后取平均值。

图4 VGG16卷积神经网络宏架构图

1.2.2 模型优化算法

卷积神经网络中有许多优化算法,其中比较常用的就是梯度下降优化算法。本文采用的则是随机梯度下降算法(Stochastic Gradient Descent,SGD),其具有的优点有:每次更新时对每个样本进行梯度更新,速度快,可以随时增加新的样本相对于非随机算法,SGD能更有效地利用信息,特别是信息比较冗余的时候,计算公式为:

在深度学习模型训练完成后,需要对其正确率以及损失值进行评估。本系统中损失函数的计算采用log对数损失函数(逻辑回归),其计算过程如下,

2 实验结果与分析

本文所使用的数据是由意大利米兰大学提供的公开血液样本显微图像数据集——ALL_IDB2[22]。该数据集由2005年9月收集的108幅图像组成,约包含39000个血液元素,重点针对ALL,用于评估和比较图像分割和分类算法。

对于数据集中的每个图像,都是使用光学实验室显微镜和佳能PowerShot G5相机,在300至500的不同放大倍率下拍摄的,所有图像均为TIF格式,分辨率2592×1944。数据集中部分样本图,见图5。

图5 ALL_IDB2中部分白细胞显微图像

从原始数据图中我们不难发现,图片里不仅含有我们所需要的白细胞区域,同时还带有大量我们所不需要的背景信息,故而在2.1.2的目标区域提取部分我们引入了超像素的思想对目标区域进行了提取(图3)。

使用“ALL_IDB2”数据集进行训练和验证(其中训练集和验证集的比例为8:2),从准确率和损失函数值两个方面给出测试结果,表2显示了100轮迭代后的最终准确率和损失值,图6和图7分别展示了100轮迭代训练集和验证集准确率和损失值的变化图。

表2 100轮迭代的准确率和损失值

?

图6 100轮迭代准确率变化对比图

通过图6和图7可以看到本文所采用的VGG16卷积神经网络模型在100轮较小的迭代次数中很好地“学习”到了ALL血液细胞显微白细胞图像的特征,在训练集和验证集上分别达到了98.79%和98.05%的高准确率,以及0.1767和0.5020的低损失值,这很好地说明了VGG16卷积神经网络模型能分类出ALL患者的血液细胞是否为患病细胞。

图7 100轮迭代损失值变化对比图

3 讨论与结论

本文将人工智能的思想应用到了医学辅助诊断当中,提出了一种基于VGG16卷积神经网络的ALL血液细胞显微图像分类的方法。针对所获取的较小样本量(一共260张原样本图像)的数据集,我们将传统方法中超像素的思想应用到了数据预处理当中,为后面卷积神经网络的训练输入打下了更好的基础,相对于Othman等[23]在2017年利用前馈反向传播神经网络对五类白细胞进行分类,在试验中他们首先将原始的白细胞显微图像进行分割得到含有16个主要特征点的100张细胞图像,再将其作为输入对神经网络进行训练,最后的平均准确率达到了96%,我们所提出的基于VGG16的深度学习模型具有更高的分类准确率。而在相比于Habibzadeh等[18]通过计算机辅助诊断(CAD)系统和血液学规则来评估白细胞差异计数,使用了ResNet V1 50,ResNet V1 152和ResNet 101分别对四类主要的白细胞(中性粒细胞,嗜酸性粒细胞,淋巴细胞和单核细胞)进行分类,以及中国科学技术大学和解放军福州总医院全军检验医学研究所则提出了“基于卷积神经网络的外周血白细胞分类”的方法[19],虽然我们平均准确率相比较他们的实验结果分别差了1.65%和1.37%的精度,但是在时间消耗上我们却在更短的时间内实现了收敛。我们下一步的工作则是对于不同深度学习网络的比较,同时进一步做出对于深度学习模型的改进研究,旨在将白细胞的分类研究在保证低消耗的同时又能保证高的分类准确率。

医学图像高速准确的分类对于医疗临床诊断与精准治疗有着重要的影响,有必要将先进的计算机计算技术与具体的临床医疗和学术研究相结合起来,高效的人工智能图像分类技术能极大程度的帮助医生实现病灶区域的判断,进一步节省了大量的人力工作。未来的医学影像分类应当朝着一种更加智能化,高效化的方向发展,在充分利用计算机性能的同时也应更好的结合医学领域中的先验知识,发展出更新的技术,更好地为医疗影像分类所服务。

[参考文献]

[1] 孙璀.白血病临床诊断中血常规指标综合分析的应用价值评析[J].中国现代药物应用,2016,10(6):94-95.

[2] 赵玲玲,陈响亮,徐骁盟,等.白细胞分类计数对急性脑梗死患者的临床预测价值[J].医学研究生学报,2015,28(11):1148-1151.

[3] 靳锐玉.急性白血病血常规指标及白细胞分类分析[J].基层医学论坛,2018,22(17):2385-2386.

[4] 刘广花,周明.血细胞参数在白血病诊断及预后中的价值研究[J].中国社区医师,2018,34(32):112-113.

[5] 战伟.白细胞分类人工镜检与全自动血细胞分析仪检查结果的比较[J].大连大学学报,2018,39(3):62-66.

[6] 尹娟.Sysmex XT-1800i五分类血球计数仪白细胞分类报警提示的结果分析[J].吉林医学,2013,34(13):2526.

[7] 张会娟.血球计数仪所测的WBC误差分析[J].锦州医学院学报,1999,(3):77.

[8] 宋宏伟,季伙燕,王建新,等.白细胞分类计数的不确定度评定[J].检验医学与临床,2017,14(1):27-28.

[9] 索荣华,宋毅.MEK血球计数仪检测误差分析[J].医疗设备信息,2005,(4):74-75.

[10] 庞春颖,刘记奎,韩立喜.改进FCM和LFP相结合的白细胞图像分类[J].中国图象图形学报,2013,18(5):545-551.

[11] 李小舜,曹益平,王亚品.基于mean-shift聚类的高鲁棒性白细胞五分类识别算法[J].生物医学工程学杂志,2018,35(5):761-766.

[12] 李少坤.SMO算法与决策树算法在医疗科技应用中的对比研究[J].中国高新科技,2019,(1):127-128.

[13] 柳秋云.改进的朴素贝叶斯分类器在医疗诊断中的应用[J].科技创新导报,2008,(31):192.

[14] 怀听听,赵建伟,曹飞龙,等.基于综合特征和随机森林的白细胞分类算法[J].中国计量学院学报,2015,26(4):474-479.

[15] Litjens G,Kooi T,Bejnordi BE,et al.A survey on deep learning in medical image analysis[J].Med Image Anal,2017,42(9):60-88.

[16] Tabrizi PR,Rezatofighi SH,Yazdanpanah MJ.Using PCA and LVQ neural network for automatic recognition of five types of white blood cells[J].Conf Proc IEEE Eng Med Biol Soc,2010,2010(10):5593-5596.

[17] Manik S,Saini LM,Vadera N.Counting and classification of white blood cell using Artificial Neural Network (ANN)[A].IEEE International Conference on Power Electronics[C].2017.

[18] Habibzadeh M,Jannesari M,Rezaei Z,et al.Automatic white blood cell classi fication using pre-trained deep learning models:ResNet and Inception[A].Tenth International Conference on Machine Vision (ICMV 2017)[C].2018:1069612.

[19] 陈畅,程少杰,李卫滨,等.基于卷积神经网络的外周血白细胞分类[J].中国生物医学工程学报,2018,37(1):17-24.

[20] 魏存超.基于卷积神经网络的医学图像分类的研究[D].哈尔滨:哈尔滨工业大学,2017.

[21] 韩冬,李其花,蔡巍,等.人工智能在医学影像中的研究与应用[J].大数据,2019,5(1):39-67.

[22] Labati RD,Piuri V,Scotti F.All-IDB: The acute lymphoblastic leukemia image database for image processing[A].2011 18th IEEE International Conference on Image Processing[C].New York:IEEE,2011:2045-2048.

[23] Othman MZ,Mohammed TS,Ali AB.Neural network classi fication of white blood cell using microscopic images[J].IJACSA,2017,8(5):99-104.

An Arti ficial Intelligence-Assisted Diagnostic Classi fication Research on Blood Cell Microscopic Image of Acute Lymphoblastic Leukemia Based on VGG16 Model

ZHANG Haitao1, LIU Jingxin2, ZHAO Xiaoqing1, HU Xiaohan3, LI Huiying1
1. School of Computer Science and Technology, Jilin University, Changchun Jilin 130012, China;2. Department of Radiology, China-Japan Union Hospital, Jilin University, Changchun Jilin 130033, China;3. Department of Radiology, The First Hospital, Jilin University, Changchun Jilin 130021, China

Abstract: Aiming at the problem of accurate classi fication and time consuming in clinical medicine microscopic images of acute lymphoblastic leukemia (ALL), this paper proposed a method based on deep learning VGG16 convolutional neural network model to obtain pathological information at high latitudes in medical images. In the paper, we firstly preprocessed the sample, cleaned out the training set and veri fication set that met the requirements, and also used the super-pixel method to extract the target area of the training sample. Then we trained VGG16 network by inputting the preprocessed data, and finally the validation set was entered into the model for veri fication. The experimental result showed that the classi fication method could effectively complete the classi fication of ALL blood cell microscopic images.

Key words: acute lymphocytic leukemia; blood cell microscopic image; VGG16 network; deep learning

[中图分类号] TN915.02

[文献标识码]A

doi:10.3969/j.issn.1674-1633.2019.07.001

[文章编号]1674-1633(2019)07-0001-04

收稿日期:2019-03-08

修回日期:2019-04-10

基金项目:国家重点研发计划(2018YFC0116901);吉林大学高层次科技创新团队建设项目(2017TD-27);吉林省省校共建项目(SXGJXX2017-5);吉林省科技发展计划(20180101048JC;20190302027GX);吉林省教育厅“十三五”规划(JJKH20190166KJ;JJKH20180147KJ)。

通讯作者:刘景鑫,教授,博士生导师,主要研究方向为医学影像质量控制、创新成像技术及智能精准影像学。

通讯作者邮箱:liujingxin@126.com