基于SVM算法的红外测量皮下脂肪厚度模型研究

王玉1,郝冬梅2,安峥1

1.中日友好医院 医学工程处,北京100026;2.北京工业大学 生命科学与生物工程学院,北京 100124

[摘 要]本文建立了一种基于SVM算法的红外测量皮下脂肪厚度的模型,设计并完成了40例人体实验,测量了每名被试者身体20个部位的皮下脂肪厚度,并采用非线性方法建立了6个回归模型(全数据、分段数据、去肩胛骨数据、上肢数据、下肢数据、腹部数据),将模型的预测值与B超测量值进行相关性分析。结果发现,分部位模型比全数据模型预测更准确,其中上肢模型最为理想,与B超测量值的相关系数大约为0.9。在该便携式脂肪厚度测量仪中采用分部位线性模型可以较准确、快捷地预测皮下脂肪厚度。

[关键词]SVM算法;皮下脂肪厚度;红外测量

世界卫生组织(WHO)在2014年公布的最新报告书中指出,世界上每100人就有7人患有肥胖症。其中,女性肥胖最为严重。在中国,年龄大于20岁的成年人中,男性肥胖比例为4.6%,女性比例为6.5%,成年人中,肥胖者约有9000万人[1],肥胖在世界范围内已成为一种普遍的现象。

一系列的研究数据表明,肥胖能逐渐导致人体的糖及脂质代谢发生紊乱,诱发糖尿病、心脑血管病变、高血压、冠心病。肝脏脂肪化会导致脂肪肝,还能诱发膝关节骨质增生、胆石症等多种疾病,严重影响人的健康状况,降低生活质量,缩短人的寿命。

因此,对内脏脂肪厚度和皮下脂肪厚度实时监控有着非常重要的意义。而测量皮下脂肪厚度不仅能满足现代人保持健康体型的需求,还能提供无创便捷的脂肪检测手段以减小肥胖相关疾病的发生概率。针对世界范围内迅速增加的肥胖患者这一现象,本文开发了一种可以方便、快捷地检测人体皮下脂肪厚度的测量仪器,介绍如下。

1 皮下脂肪厚度测量的原理

1.1 红外测量方法

人体表皮对红外光有很好的透过特性[2],照射到人体的近红外光线,相当多的部分都能穿过皮肤进入脂肪组织,只有少量被皮肤单向反射损耗。有关文献[3]表明:肌肉组织虽然同样存在散射,但其散射各向异性因子较大,更趋向于前向散射,同时肌肉组织的有效衰减系数也比脂肪组织大得多[3]。因此,当光线进入脂肪后会产生后向散射,与光源同侧的探测器所探测到的信号主要来源于脂肪层,作为脂肪层下层的肌肉将不会产生大量的背向散射。

近红外光(Near Infrared,NIR)是介于可见光(Visible Light,VIS)和中红外光(Mid-infrared Light,MIR)之间的电磁波,按美国材料实验协会(American Socieyt of Testing Materials,ASTM)定义,是指波长在780~2526 nm范围内的电磁波,习惯上又将近红外区划分为近红外短波(780~1100 nm)和近红外长波(1100~2526 nm)两个区域。

光在生物组织中存在着两种效应:吸收和散射[4]。光被生物组织吸收是由于肌红蛋白、血红蛋白中的胆红素及原红血素中黑色素和呼吸色素所引起的[5]。在近红外光谱波段600~1300 nm中,绝大部分软组织对光的吸收较小,这种低吸收与组织对光的高度前向散射作用相结合,使得光在组织中有相当大的探测深度[6]。对于波长<600 nm的可见光,组织对光的吸收会由于黑色素、血红蛋白以及其他各种色素的影响而升高;在紫外波段,组织对光的吸收会由于蛋白质、核酸的强吸收而升高;在红外段,组织中的水吸收又很高[7-8]

光进入脂肪组织后主要发生背向散射,大部分的光发生背向散射后穿过皮肤返回体外,而进入肌肉组织的光主要被吸收。因此,检测器所接收到的信号包含的主要是皮下脂肪的信息。

红外检测探头的布局,见图1。红外检测探头包含7个近红外发光二极管和一个光电二极管,按照与光电二极管的距离进行分组,共有4组发光二极管。这4组光源数量不一,离光接收器近的位置光源数量少,离光电二极管远的位置光源数量多,这样可以增大远距离光源的入射光强。这4组光源与光电二极管的距离分别为15、20、25、30 mm,其中与光电二极管距离为15 mm和20 mm的位置各有一个发光二极管,距离光电二极管25 mm的位置有2个发光二极管,距离光电二极管30 mm的位置等间距分布着3个发光二极管。

图1 红外检测探头布局

1.2 支持向量机算法

支持向量机(Support Vector Machine,SVM)是以统计学理论为基础发展起来的机器学习方法,核心内容是结构风险最小化原理,并且通过控制经验风险和置信范围值这两个因素来提高学习机器整体的泛化能力。支持向量机的训练过程本质上是使用大规模的数据集来训练SVM模型,等价于求解一个大规模的凸二次规划问题,所以支持向量机的解具有唯一性,也是全局最优的[9-10],它有严格的理论基础,能很好地解决小样本、高维数、非线性和局部极小点等问题。

支持向量机做回归预测的思想是寻找一个从输入到输出的非线性映射,通过这个映射把样本集的数据映射到高维空间F,在高维特征空间中进行线性回归以构造线性判别函数。支持向量机常用的核函数有如下3种:

线性核函数(linear):

径向基核函数(RBF):

其中P1, 为核函数的宽度。

多项式核函数(poly):

其中,P1为多项式的阶数且偏置系数为1。

2 实验设计

本实验招募了40位大学生作为被试者,其中男20名,女20名。平均年龄(23.7±1.1)岁。身体质量指数(Body Mass Index,BMI)=体重公斤数/身高米数平方,是衡量人体胖瘦程度的指标。在本次实验中,18.5 kg/m2≤BMI≤23.99 kg/m2的正常体重者有26人,24 kg/m2≤BMI≤28 kg/m2的偏胖被测者有7人,BMI≥28 kg/m2的肥胖被测者有7人。

在每一位被试者的身上取20个部位进行测量,分别为左、右小腿背部,左、右大腿正前方中部,左、右大腿后前方中部,左、右髂脊上方4 cm,左、右腰,左、右肩胛骨下突,左、右肱二头肌中部,左、右肱三头肌中部,左、右小臂,肚脐左侧5 cm,肚脐右侧5 cm。

使用的测量仪器包括:① 彩色多普勒超声诊断仪,用于获得皮下组织图像;② 本课题的实验样机两台,用于获得近红外光信号。

在实验中每测量一个人体部位时,首先用标记笔进行标记,保证更换仪器时,测量位置不发生变化,依次使用上述仪器进行数据采集,每台仪器在同一个位置测量3次,记录数据,最后对测量结果求均值。

3 结果

由于实验样机直接测量的是入射光穿过皮肤经过皮下组织漫反射得到的反射光,然后转变为相应的电压值,要在各个通道电压值和脂肪厚度之间建立数学模型,仪器才可用于测量并显示脂肪厚度。

本实验中,实验样机测量得到的是4个通道的光电信号值,因而需要建立数学模型,即通过脂肪预测模型计算出脂肪厚度值。在皮下脂肪厚度预测模型中,以4个通道的光电信号值作为自变量,彩色多普勒超声诊断仪测量得到的结果作为因变量,通过测量样本对预测模型进行训练,确定模型系数。下面分别对非线性预测模型做分析介绍。

数据总量为800,因为在初始数据中,剔除了28组异常数据,所以最后的可用数据总量为772组,组成了建模的原始全数据。然后按不同类型分为6种样本集,各样本集及样本数目,见表1。样本集1(全数据)是由全部数据组成,样本集2(分段数据)是由B超测量厚度为1~15 mm的数据组成,样本集3(去肩胛骨数据)是由全部数据中除去肩胛骨数据的剩余数据组成,样本集4(上肢数据)是全部数据中的上肢数据,样本集5(下肢数据)是全部数据中的下肢数据,样本集6(腹部数据)是全部数据中的腹部数据。

表1 6个样本集及其样本数目

由于建模因素约束,不能很好地反映脂肪厚度变化对光漫反射的影响,所以根据朗伯比尔公式,我们将4个通道(xi)、肤色(x5)、各个通道之差(xi-xj)、各通道之比(xi/ xj)、各通道自然对数(Logxi)、各通道自然对数之差(Logxi-Logxj)、各通道自然对数之比(Logxi/Logxj)作为单因素加入到模型建立中,其中i,j =1,2,3,4,i≠j。通过组合最后可用自变量为38个。

在建立SVM预测模型时,选用径向基核函数,其效果在几个核函数中最好,然后根据模型假设选定的因变量和自变量,进行数据预处理,例如归一法、主成分分析法等,然后进行交叉验证选择回归的最佳参数c和g,利用选好的最佳参数进行SVM的训练,建立模型。

上述6个SVM模型的预测值与实际值的配对样本相关分析和配对样本t检验结果,见表2和表3,其中实际值是超声仪器的测量结果。

表2 各模型预测值与实际值配对样本相关系数

表3中6个模型从测量准确度和相关系数做比较,其中所得的非线性模型测量准确度最大的是模型4,其值为90%,说明该模型对上肢皮下脂肪厚度的回归分析能力比较强,能够较好地测量皮下脂肪厚度。模型5是针对下肢脂肪建立的预测模型,其测量准确度也比较高,说明上下肢模型的测量准确度和相关系数较全数据模型高,但是模型6针对腹部脂肪建立的预测模型,其结果不理想。

表3 各模型预测值与实际值配对样本t检验

4 分析与讨论

6个样本集的非线性模型及其与B超测值的比较,见图2。图中,横轴表示B超测量的实际值,纵轴表示SVM模型的预测值。由图2可知:

(1)分部位建模的测量准确度明显高于不分部位的全数据建模结果。

(2)分部位的上肢模型和下肢模型都有较高的测量准确率,上肢模型相关系数达90%。

(3)腹部脂肪的测量结果准确度较低。

(4) 在整个散点图中,我们发现对于脂肪厚度大的部位,预测值误差较大,散点离散分布,说明对于红外测量方法,有一定的测量阈值,大约12 mm附近。

图2 样本集1~6皮下脂肪厚度测量结果比较

注:a.样本集1的全数据样本测量结果,SVM预测结果与B超测量结果相关系数为0.75809;b.样本集2的分段样本测量结果,SVM预测结果与B超测量结果相关系数为0.75663;c.样本集2的去肩胛骨测量结果,SVM预测结果与B超测量结果相关系数为0.78674;d.样本集2的上肢样本测量结果,SVM预测结果与B超测量结果相关系数为0.90664;e.样本集2的下肢样本测量结果,SVM预测结果与B超测量结果相关系数为0.8484 ;f.样本集2的腹部样本测量结果,SVM预测结果与B超测量结果相关系数为0.57743。

分析造成上述结果可能的原因是:

(1)在40名被试者的772组可用数据中,B超测得的脂肪厚度在1~15 mm范围内的有741组,其他数据段的数据量较少,样本量不足导致模型泛化能力低,所以单独做了1~15 mm的分段模型。

(2)由于同一个人不同部位的皮下脂肪密度不同,所以分部位建立皮下脂肪厚度预测模型要优于全身使用同一个预测模型,其中上肢模型的预测结果最好,可能是因为上肢脂肪厚度较为容易辨认,皮下结构较为简单,干扰因素较少。

(3)腹部模型的预测结果不是很理想,其原因可能是红外测量装置功率不是很强,无法穿透更深层次脂肪,过程中造成衰减误差,其次作为评价标准的彩色多普勒超声仪在脂肪层数增加时,图像中脂肪与肌肉的识别误差会增加。

(4)其他能影响测量结果的因素,例如压力、血流等。

5 总结

本文采用红外检测装置对人体皮下脂肪厚度进行测量,共完成40例实验。在每个被试者身上选取20个部位进行测量,得到数据后建立了6个非线性回归模型。非线性模型中测量精度最大的是上肢数据,相关系数为0.9。而从这6个模型结果来看,分部位建立模型比建立整体模型具有更好的相关性,准确性也更高。近红外方法有一定局限性,接下来可以考虑进一步提高近红外的发射接受功能,其次,数据量尽可能扩充,实验样本尽可能广泛。本研究可为患者提供测试脂肪的便捷方法,该方法可以快速测量患者身体脂肪含量,尤其是局部脂肪含量,为临床医生提供参考依据。

[参考文献]

[1] World Health Organization.World Health Statistics[R]. Geneva:WHO,2011:104-105.

[2] 卢延辉.红外法人体皮下脂肪厚度测量的研究[D].天津:天津大学,2004.

[3] 刘普和,刘国刚.激光生物学作用机制[M].北京:科学出版社, 1989.

[4] Сheong WF,Scott AP,Ashley J,et al.A review of the optical properties of biological tissues[J].IEEE JOE,1990,26(12):2166.

[5] 赵友全,范世福,曹文新.生物组织光学特性参数及其描述[J].国外医学生物医学工程分册,2000,23(2):76-79.

[6] 张文军.组织光学参数定量控制的初步研究[D].天津:天津大学,2008.

[7] 谢树森.生物组织光学性质的测量原理与技术[J].中国生物医学工程学报,1997,16(4):327-332.

[8] LI H,LU Z.Measurement and accuracy analysis of refractive index using spectra reflectivity closes to the total internal refection[J].Proc.SPIE,1998,(8):119-124.

[9] 周显国.基于梯度方向直方图特征和支持向量机的医学影像分类方法[J].中国医疗设备,2014,29(2):132-133,140.

[10] 刘苏苏,孙立民.支持向量机与RBF神经网络回归性能比较研究[J].计算机工程与设计,2011,32(12):4202-4205.

Study of the Model for Infrared Measurement of Subcutaneous Fat Thickness Based on SVM Algorithm

WANG Yu1, HAO Dong-mei2, AN Zheng1
1. Department of Medical Engineering, Сhina-Japan Friendship Hospital, Beijing 100026, Сhina; 2. Сollege of Biological Science and Biological Engineering, Beijing University of Technology, Beijing 100124, Сhina

Abstract:This paper established a model for infrared measurement of subcutaneous fat thickness based on Support Vector Machine (SVM) algorithm. 40 cases of human experiment were designed and completed. The subcutaneous thickness of 20 body parts of each subject was measured. 6 regression models were established with nonlinear methods (including whole data, segment data, date excepted for shoulder blade, upper limb data, lower limb data, and abdomen data). The prediction value of each model was analyzed in comparison with the ultrasound measurement value. The results indicated that the segment model predicted more accurately than the whole data model. The upper limb model was most ideal, whose correlation coeffcient with B ultrasound was 0.9. The results showed the SVM model, was more suitable for accurate and rapid measurement of subcutaneous adipose tissue thickness.

Key words:support vector machine algorithm; subcutaneous fat thickness; infrared measurement.

[中图分类号]R197.39

[文献标志码]A

doi:10.3969/j.issn.1674-1633.2016.05.010

[文章编号]1674-1633(2016)05-0043-04

收稿日期:2016-01-27

修回日期:2016-04-26