基于自组织特征映射和梯度熵聚类的MR脑部图像分割新算法

丁力,周啸虎,陈宇辰,高伟

南京医科大学附属南京医院(南京市第一医院)放射科,江苏 南京 210006

[摘 要]目的提出一种新颖的基于自组织特征映射和遗传算法的无监督MR脑部图像分割算法.方法本研究算法分为5步:图像预处理去除背景噪声和颅骨部分、提取图像中两类统计特征和几何不变矩、遗传算法降低特征空间维度、训练自组织特征映射完成向量分类和使用梯度熵聚类算法得到分割图像.结果选用国际MR脑图像库和临床实例MR图像进行仿真实验.定性分析表明基于本文算法的分割图像中白质、灰质和脑脊液边界完整清晰;定量评估结果显示本文提出的遗传特征优化算法优于常用的主分量分析法,梯度熵算法所得分割图像优于K-means聚类算法,且本文提出的算法在白质和脑脊液分割方面优于现存最佳的CGMM算法.结论本文提出的分割流程没有涉及任何关于体素分类的先验知识,是一种完全无监督的MR脑部组织自动分割方法,具有很强的稳定性、优越性,且获得高精确性的分割图像.

[关键词]脑疾病;MR脑部图像;图像分割;自组织特征映射;遗传算法;梯度熵聚类

引言

由于良好的空间分辨率、较高的组织对比度和非侵入性等特性,MRI成像已被广泛应用于图像引导介入、外科手术引导、放疗计划等方面[1].MR脑部图像分割作为计算机辅助诊断的重要组成部分,是评估痴呆、多发性硬化症、精神分裂症、阿兹海默等神经疾病一个基本定量工具.图像分割主要基于先验知识,常用分割算法的训练阶段仅能识别最基本的灰质、白质和脑脊液形态,不能被识别和怀疑的组织被认为是病理性的,这与人工阅片的方法是一致的.

MR图像分割算法主要分为手工分割、半自动分割技术和全自动分割技术[2].临床上最常用的是手工分割方法,需要医师手工对组织进行分类,往往伴随着主观差异大、耗时多等缺点;半自动分割技术借助于图像处理程序,传统的方法包括图像直方图法、统计分类、支持向量机分类、神经网络分类和遗传算法等,近阶段的算法包括最大期望、最大似然估计、马尔科夫随机场和有限高斯混合模型等,以上方法都面临模式分类与识别的问题,都需要借助参考图像作为分类标准.全自动分割技术不必借助脑图谱等分割参考图像,往往需要进行训练,Logeswari教授等[3]提出一种自组织映射(Self-Organizing Map,SOM)的自动分割框架,主要包含颅骨剔除、灰度不均校正和脑组织分类3步;Erhardt等[4]使用两相算法,第一相使用二值掩摸去除背景噪声,第二相使用模糊C均值聚类算法进行无监督图像分割.

本研究提出一种基于SOM和梯度熵聚类(Entropy-Gradient Clustering,EG)的MR脑部图像自动分割算法.使用基于遗传算法的SOM最优化方法的目的是学习最大差异性的特征和通过聚类使图像体素分组到不同SOM类别中.SOM算法的训练阶段主要借助于无需先验知识的竞争学习过程,然后使用训练后的SOM进行数据分类,即通过计算输入数据和原型之间的距离来分配体素.本文采用的算法不仅考虑到数据样本的空间关系,而且兼顾聚类过程中输入和输出空间信息.

1 方法

本文提出的自动分割算法分为5步:图像采集与预处理、特征提取、特征优化、图像体素分类和SOM算法标记.整个分割流程,见图1.

图1 MR脑部图像分割流程

1.1 图像采集和预处理

图像预处理的主要目的是清除由射频振幅和相位差异性引起的噪声和提高分类效果.本研究建立一个二值掩摸图像来检测大目标对象,由公式(1)给出.由掩摸图像与源图像的乘积可得背景图像,可由公式(2)计算[5].

其中,Bm是二值掩摸图像;I是MR图像;Bth是图像二值化阈值,由Otsu阈值法求得;IB是黑色背景图像.

为了避免由窗口程序引起图像边角体素的遗漏,本文在每个边角加上w/2的背景体素.接下来,一个大小wXw的重叠窗口从图像IB的右上到左下将源图像分为Ne个子图像,由公式(3)给出,每个提取的子图像可由其中心体素[round(w/2),round(w/2)]识别,子图像的大小对应于提取窗口,这便于后续的特征提取.

1.2 特征提取

本阶段主要提取MR图像的第一类特征、第二类特征和不变矩特征.主要是在每个层面上进行体素重叠和滑动窗口来实现,窗口大小决定特征提取的效果,综合复杂性和分辨率,本文选取的窗口大小为7X7.

第一类特征包括图像强度、平均值和方差,强度反映窗口中心体素的灰度水平,平均值和方差反映窗口体素的灰度水平分布;第二类特征主要时一些纹理特征,Haralick等[6]提出了能量、熵、对比度、相关性等14种图像分类特征,不变矩主要表征图像区域的几何特征.将每个窗口的中心像素坐标保存到一个矩阵中,用来关联特征向量和对应的图像体素.

1.3 基于遗传算法的特征选取

特征提取之后,源图像被转换成一个24维的特征向量空间,数量与窗口数量相等.由于特征向量之间存在冗余,且严重影响基于高维特征向量的SOM分类速度和可行性,一般使用主分量分析法(Principal Component Analysis,PCA)降低特征向量空间维度,本文采用的是遗传算法(Genetic Algorithm,GA).

GA算法通过迭代求得最小适应值,完成特征的分类选择.适应值函数(F)由量子误(qe)和拓扑误(te)构成,如公式(4)所示,前者决定各向量与最佳匹配神经元的平均距离,后者度量所有数据向量的构成,如公式(5)和(6)所示[7].

式中,N是数据向量数目,当第一个和第二个最佳匹配神经元不相邻时,取1,否则取是输入空间的第i个特征向量,是关于向量的最佳匹配神经元的权重.

基于GA算法的特征向量优化包含3步[8]:第一步,设置初始向量;第二步,进行SOM训练量子误(qe)和拓扑误(te);第三步,迭代计算适应值(F),达到两次误差lt;0.001时停止,否则继续转到第二步.执行完特征向量优化算法,初始的24个特征向量降低到9个横断面、10个冠状面和7个矢状面向量.

1.4 基于SOM算法的向量分类

一旦特征向量空间维度降低即可进行SOM训练,SOM质量主要取决于拓扑映射和神经元数量,六角网络可以兼顾神经元数量和计算量,很好的调整原型到特征向量空间中.通过计算每一个输入对象对应的最佳匹配神经元,即可使用训练后的SOM进行向量分类,最佳匹配神经元由输入向量和原型向量之间的欧几里得距离计算所得,如公式(7)所示[9].其中x(t)代表输入向量,wi(t)代表与神经元i相关的原型向量.

然后,使用公式(8)和(9)更新最佳匹配神经元邻域内的原型向量[10],获得相似特征向量的原型组合.其中a(t)为学习因子,hi(t)为与第i个神经元相关的邻域函数,由公式(9)定义.式中表示获胜神经元与第i个输出空间上神经元的距离.

1.5 基于梯度熵的聚类算法

特征向量分类后,相似原型在图像上位置很接近,很容易造成不同组织间的重叠,因此需要划定不同神经元组合之间的边界.基于梯度熵算法的图像聚类过程,见公式(10):

第一步:计算每个SOM神经元相关子图像的对比度,并进行递增排序.

第二步:计算子图像熵和各神经元累积熵.每个最佳匹配神经元的特征向量被分类,每次增加一个新的子图像到相应类别中,然后此类别的熵也跟着被更新[11],见公式(11)、(12).

第三步:决定最小熵变化方向,以此进行迭代运算,小于设置的阈值时,将子图像加入到相应类别组织中,然后更新累积熵,直到神经元全部归类.公式(13)给出熵变化最大的方向,聚类方向是反方向.

2 结果与分析

选用两组不同分辨率的T1加权图像进行仿真实验.① 选自IBSR脑图像库,图像尺寸大小为256X256X63个体素;② 选自临床实例图像,图像尺寸为512X512X512个体素.所有的仿真实验均在MATLAB平台上实现.

2.1 不同优化方法分割效果比较

选用敏感度(Se)、特异度(Sp)、阳性似然值(PL)和阴性似然值(NL)评估不同优化算法的优越性,前3个指标越大表示聚类效果越好,组织分割越精确,最后一个指标越小分割效果越佳,由公式(14)和(15)给出[12].其中TN、TP、FN和FP分别代表组织真阳性、真阴性、假阳性和假阴性数量.

不同优化算法所得的分割图像,见图2.PCA算法在横断面和冠状面均不能分割出脑脊液组织,特征向量全集在冠状面同样存在此问题,然而本文提出的GA-SOM优化算法成功的分割出白质、灰质和脑脊液区域.不同特征向量优化算法所得的Se、Sq、PL和NL,见表1.在白质、灰质和脑脊液层面,基于GA-SOM的Se、Sq、PL均大于其他两种优化算法,NL均处于最小.

图2 不同优化算法所得的分割图像

注:a~c是横断面图像,d~f是冠状面图像.a和d.基于24个特征向量全集;b和e.基于PCA-10主成分方法;c和f.基于GA-SOM方法.

表1 不同特征向量优化算法所得的Se、Sq、PL和NL

2.2 不同聚类算法的分割效果比较

聚类过程采用DBI和DUNN指数对K-means和EG算法进行评估,其中DBI指数越小、DUNN指数越大聚类效果越佳,评价指标如公式(16)和(17)所示[13].

基于K-means和EG聚类算法的DBI指数分别为0.73和0.52,显然后者更小,对应更佳的聚类效果;基于EG算法的DUNN指数更大,证实了本文算法的优越性(表2).两种算法所得DBI和DUNN之间的统计学显著性检验,见表3.结果显示两个评价指标的P值均lt;10-7,表明两个指标之间具有统计学差异,再次验证EG算法聚类效果优于K-means 算法.

表2 不同聚类算法所得DBI和DUNN指数

表3 DBI和DUNN指数的t检验

2.3 不同分割算法结果比较

本文采用Tanimoto系数评估不同分割算法结果,测定不同分割算法分割结果与真实结果的相似性,本文的真实结果即专家手工分割所得.Tanimoto系数由公式(18)给出[14],Tanimoto系数越大,表明图像分割越精确.

本文算法所得Tanimoto 系数的均值与标准差在3个组织类别中均表现优越(图3).结合文献[15-17]报导和图3结果,CGMM算法由于现存的其他分割算法.因此,本文分割算法与不同算法的比较转化为与CGMM算法之间的比较,见图4、表4.

基于本文算法所得的Tanimoto系数的平均值在3个组织类别上均高于CGMM算法(图4),且在脑脊液层面优势明显,但均未从统计学方面进行验证.Tanimoto系数t检验的统计学分析,见表4.在白质的分割上,P值为2.2X10-5;在脑脊液分割上,P值lt;10-7,均在0.05的水平显示出统计学差异.但是在灰质的分割上,P为0.33,在0.05的水平上不能拒绝原假设,即不能说明两者算法所得tanimoto系数平均值具有差异性.

图3 不同分割算法所得的Tanimoto系数

注:MPM-MAP方法分割的脑脊液无标准差.

图4 本文算法和CGMM算法所得Tanimoto系数盒子图

注:a.白质;b.灰质;c.脑脊液.

表4 Tanimoto系数的t检验

综上可得,在白质和脑脊液分割中,本文算法优于CGMM算法,在灰质分割中,本文算法与CGMM算法无显著性差异.

2.4 临床实例图像分割

临床实例图像中不仅包含白质、灰质和脑脊液3种组织,还包含头皮和颅骨,在一定程度上增加了脑部图像分割的难度,基于本文算法的脑部图像分割效果,见图5.可以看出,本文算法先分割出头皮和颅骨,与系统自带的脑部提取工具分割效果相同,然后精确地分割出3种组织.

图5 临床实例图像的分割效果

注:a.原图;b.系统工具分割;c.本文算法分割;d.白质;e.脑脊液;f.灰质.

3 结论

本文提出了一种基于 SOM的无监督自动分割算法,并用于脑部MR图像分割,此过程主要借助SOM算法的竞争学习机制完成,使得在无先验知识的情况下对图像体素进行无监督分类.其中GA-SOM算法使特征向量得到优化而不冗余,EG聚类算法建立了SOM层面上神经元位置信息和累积熵的关系,联合使用SOM层面的拓扑信息和输入层的纹理信息进行聚类运算.

脑图像库和临床实例图像分割结果显示,本文提出的GA-SOM优化算法优于常用的PCA方法和特征向量全集法,基于EG聚类算法所得的DBI和DUNN系数均优于K-Means方法,从统计学方面再次得到验证.本文提出的无监督分割算法在白质和脑脊液的描述上显著优于现存最优的CGMM算法,在灰质分割上无明显差异.综上,本文提出的基于SOM和EG聚类的分割算法稳定性强、准确性高,在仿真图像和临床实例中均表现出优越性,是一种可行的MR脑部分割算法.

[参考文献]

[1] Menze B,Reyes M,Van LK.The multimodal brain tumor image segmentation benchmark (BRATS)[J].IEEE Trans Med Imaging,2015,34(10):1993-2024.

[2] Zhang N,Su R,Lebonvallet S,et al.Kernel feature selection to fuse multi-spectral MRI images for brain tumor segmentation[J].comput Vis Image Underst,2011,115(2):256-269.

[3] Logeswari T,Karnan M.Hybrid self organizing map for improved implementation of brain MRI segmentation[A].International Conference on Signal Acquisition and Processing[C].IEEE Computer Society,2010:248-252.

[4] Erhardt EB,Rachakonda S,Bedrick EJ,et al.Comparison of multi-subject ICA methods for analysis of fMRI data[J].Hum Brain Mapp,2011,32(12):2075–2095.

[5] 孙权森,纪则轩.基于模糊聚类的脑磁共振图像分割算法综述[J].数据采集与处理,2016,31(1):28-42.

[6] Haralick RM,Shanmugam K,Dinstein I.Textural features for image classification[J].IEEE Trans Syst Man cybern Syst,1973,3(6):610-621.

[7] Tian G,Xia Y,Zhang Y,et al.Hybrid genetic and variational expectation-maximization algorithm for gaussian-mixturemodel-based brain MR image segmentation[J].IEEE Trans Inf Technol in Biomed,2011,15(3):373-380.

[8] 齐兴斌,赵丽,李雪梅,等.基于直方图梯度计算的 T2加权脑部MR图像自动分割[J].计算机应用研究,2015,(5):1576-1579.

[9] Ortiz A,Gorriz JM,Ramirez J,et al.Improving MR brain image segmentation using self-organising maps and entropy-gradient clustering[J].Inform Sciences,2014,262(3):117-136.

[10] 张雷, 张明慧,卢振泰,等.基于多权重概率图谱的脑部图像分割[J].南方医科大学学报, 2015,35(8):1143-1148.

[11] 田换,覃晓,元昌安,等.基于脑部MRI分割方法新进展[J].广西师范学院学报(自然科学版),2016,33(1):96-101.

[12] Wang L,Shi F,Gao Y,et al.Integration of sparse multi-modality representation and anatomical constraint for isointense infant brain MR image segmentation[J].Neuroimage,2014,89(1):152-164.

[13] Dong F,Peng J.Brain MR image segmentation based on local Gaussian mixture model and nonlocal spatial regularization[J].J Vis commun amp; Image R,2014,25(5):827-839.

[14] Ji Z,Xia Y,Sun Q,et al.Adaptive scale fuzzy local Gaussian mixture model for brain MR image segmentation[J].Neurocomputing,2014,134(3):60-69.

[15] 李志勇,张丽辉,孙建洪.一种引入遗传算法的最大类间距离法在脑部图像分割中的运用[J].红河学院学报,2014,(2):30-32.

[16] 吴骏,孙明明,肖志涛,等.联合蚁群算法和PCNN的脑部MRI图像分割方法[J].光电子.激光,2014,(3):614-619.

[17] 何小海,梁子飞,唐晓颖,等.图谱法脑部MRI图像自动分割技术发展及应用[J].数据采集与处理,2015,30(5):956-964.

本文编辑 王静

Improving MR Brain Image Segmentation Using Self-Organizing Maps and Entropy-Gradient Clustering

DING Li, ZHOU Xiaohu, CHEN Yuchen, GAO Wei
Department of Radiology, Nanjing First Hospital, Nanjing Medical University, Nanjing Jiangsu 210006, China

Abstract:ObjectiveThis study aimed to present a novel unsupervised method for MR brain image segmentation based on selforganizing maps (SOMs) and genetic algorithms (GAs).MethodsIn particular, the proposed method was based on five stages consisting of image preprocess, extracting first and second order statistical features, feature selection using evolutionary computation,voxel classification using SOM, and entropy-gradient (EG) clustering.ResultsBoth simulated and clinical datasets were evaluated by different methods. Qualitative analysis showed that the components of the white matter, gray matter and cerebrospinal fluid were well preserved, and globally all the regions were correctly classified. Quantitative evaluation results showed that the genetic algorithms can achieve optimized feature set than principal component analysis (PCA). EG had a statistical significance difference with K-means (Plt;0.01). Our algorithm outperformed the CGMM method in WM and CSF delineation, and was found to be the most effective among other techniques.ConclusionThe complete procedure does not use any a priori knowledge regarding voxel class assignment, but reveals a fully unsupervised, automated method for MRI segmentation to directly identify different tissue classes,which can provide better robustness, superiority, and pervasiveness in clinical applications.

Key words:cerebral disease; MR brain image; image segmentation; self-organizing maps; genetic algorithms; entropy-gradient clustering

[中图分类号]TN911.73

[文献标识码]A

doi:10.3969/j.issn.1674-1633.2017.10.006

[文章编号]1674-1633(2017)10-0021-06

收稿日期:2016-10-31

修回日期:2016-11-24

基金项目:国家自然科学青年基金(81601477).

通讯作者:高伟,副主任技师,主要从事医学影像图像采集与PACS网络及图像存储方面的研究管理工作.

通讯作者邮箱:gao1974@yeah.net