基于太赫兹时域光谱仪的中药材鉴定技术研究

田珺宏1,周俊1,郑潇潇2,蒋桂华2,马逾英2

1.电子科技大学 电子科学与工程学院,四川 成都 610054;2.成都中医药大学 药学院,四川 成都 611137

[摘 要]太赫兹波是频率在0.1~10 THz范围内的电磁波。这一频率范围内的电磁波具有独特的性质,丰富的科学内容。大量分子振动信息位于该频段,所以太赫兹波谱的专属性强,包含的信息丰富,在中药材鉴定领域具有很广阔的应用前景。太赫兹时域光谱仪是一种产生和探测太赫兹波的装置,本文基于太赫兹时域光谱仪,以川产道地药材白芷和川芎的真伪鉴别为例,介绍我们近期的研究工作,所采用的研究方法可为太赫兹药物鉴定和食品检测提供参考。

[关键词]太赫兹;光谱仪;电磁波;频率;中药材;分类鉴定

引言

中药材的质量控制包括原材料的识别、鉴定、有效成分确认等多个方面,其中原材料识别一直备受医家重视。原材料质量低劣或者掺假会影响药品生产和临床疗效,既造成经济损失,又耽误治病救人。原材料的真伪、加工方式等因素也显著影响中药材的质量。

在前人的长期实践之上,现有中药材鉴别的方法多种多样。经典的方法包括传统的经验鉴别、显微鉴别、一般理化鉴别[1],这类方法虽然实用但主观性和经验依赖性较强,尤其是在指标性成分鉴别方面具有局限性。现代方法包括色谱类鉴别、光谱类鉴别、电化学、生物类鉴别方法等[1-3]。色谱类鉴别方法有薄层色谱法、气相色谱法、高效液相色谱法等。其中薄层色谱法快速灵敏、易于普及但分离机制复杂、易受环境干扰,气相色谱法适用于分析气体以及一些具有挥发性的液体和固体,高效液相色谱法具有高效快速的优势,但成本较高。光谱类方法包括紫外光谱法、红外光谱法、近红外光谱法、质谱联用、X射线法等。这类方法依赖于中药材在不同频段的电磁特性,目前已经相对成熟,且应用范围广泛。其他的方法还有电泳法、免疫分析法、分析生物法等。这些方法中基于光谱的方法通常具有检测时间短、成本低的优势,而且是无损检测。

太赫兹波是频率介于0.1~10 THz的电磁波,具有低能量、宽频谱、强穿透和强吸收的特征[4]。太赫兹波的单光子能量只有4.1 meV不及X射线的百万分之一,与物质作用不会导致光损伤。宽频谱的特点使得许多生物大分子的震动和转动能级都落在太赫兹波段。太赫兹波对大部分非极性材料没有明显的的吸收,呈强穿透特性,但是对大多数极性分子,例如水,有非常强的吸收作用。这些特点,使得太赫兹适合生物类样品检测[5]。基于太赫兹光谱的鉴别具有识别率高、耗时短、操作简单的优势,是一种无损检测方式。

本文首先简要介绍太赫兹中药鉴定技术,接着以典型川产道地药材为例,介绍我们近期的研究工作,最后给出总结与展望。

1 太赫兹中药鉴定技术介绍

中药成分非常复杂,通常有机分子内化学键的振动吸收频率主要在红外波段,但有机分子之间较弱的相互作用(如氢键)及大分子的骨架振动(构型弯曲)、偶极子的旋转和振动跃迁以及晶体中晶格的低频振动吸收频率对应于太赫兹波段范围[6],这些振动所反映的分子结构及相关环境信息都与太赫兹波段的频谱相对应,使得太赫兹光谱技术鉴别中药中化合物结构、构型与状态成为可能。

国外对中药材的太赫兹鉴定工作较少。但是相关的太赫兹在药品或混合物体系的物质鉴别方法方面做了大量工作。如,美国新泽西理工学院(New Jersey Institute of Technology)的Huang等[7]采用FTIR光谱法探测了爆炸物黑索金(RDX)在特征吸收谱,并借助SPARTAN软件采用密度泛函理论(Density Functional Theory,DFT)对RDX的THz光谱进行了模拟计算,讨论了RDX吸收峰的形成原因。Slingerland等[8]对硝基甲烷(Nitromethane)在2~6 m光程变化范围的THz吸收系数谱进行了分析研究。Kurabayashi等[9]利用Lambert-Beer定律定量研究了混合物纤维的太赫兹吸收谱。这些研究,从计算模拟和成分分析的角度,为太赫兹中药材鉴别和分析提供了借鉴。

国内利用太赫兹光谱技术对中药进行检测,开展了大量工作。如,首都师范大学研究者们测量了当归、茯苓、枳实、板蓝根,表明太赫兹光谱和色散特性反映了不同药材间的差异[10-12]。首都师范大学也对青蒿素及其衍生物进行了测量,表明太赫兹光谱可以探测到药材在分子结构上的差异[10];陈艳江等[13]在对中药炙甘草和生甘草、南柴胡和北柴胡、山豆根和北豆根的太赫兹光谱测量中,采用支持向量机分类器实现了药材间光谱数据的分类;郭昌盛[14]对生长于海水和淡水环境的珍珠粉的测定,表明太赫兹时域光谱技术能够识别某种生长环境对药材的影响;汪景荣等[15]结合偏最小二乘法对正品和非正品大黄的中草药鉴别模型进行了研究,能够快速、准确的对大黄的真伪进行鉴别;马品等[16]将太赫兹时域光谱技术运用于测定天麻中水分的含量,表明太赫兹波适合测定中药饮片的水分含量。这些研究中,研究者从不同种类的中药材识别、中药材产地鉴别、中药材成分分析和成分定量测定、中药材的光谱数据处理等角度,运用太赫兹时域光谱技术,解决了部分问题。经过多年实践,已经进行太赫兹光谱检测的中药材有:当归、茯苓、枳实、板蓝根、银杏叶提取物、青蒿素及其衍生物(双氢青蒿素、蒿甲醚、青蒿琥酯)、玫瑰花、月季花、南柴胡、北柴胡、银柴胡、山豆根、北豆根、地骨皮、五加皮、香加皮、阿胶、鹿角胶、龟甲胶、生大黄、熟大黄、酒大黄、红参、高丽参、炙甘草、生甘草、珍珠粉等等。这些研究大都进行了光谱测定,或是对关注的某一指标如产地、种类、特定成分等进行了分类或测定,为继续深入研究并形成太赫兹光谱数据库积累了丰富的成果。

本文以几种典型川产道地药材的真伪鉴别为例,介绍我们近期的工作。分别从中药材加工的角度鉴别川白芷是否熏硫,以解决市场上为保存白芷而熏硫往往超出药典规定的质量问题;从中药材原材料真伪的角度区分川芎和抚芎,以解决市场上常见的以抚芎冒充川芎的问题。

1.1 实验材料

1.1.1 样品来源

白 芷(Angelicae Dahuricae Radix)、 川 芎(Ligusticum chuanxiong hort)、抚芎(Ligusticum sinense Oliv.cv.Chaxiong)。样品均由成都中医药大学药学院提供,样本来源,见表1~2。

表1 川产白芷产地来源 (个)

表2 川产川芎、扶芎产地来源

白芷样品的采集和熏硫加工均由成都中医药大学药学院课题组完成,较好地确保了样品来源的可靠性。川芎样品和抚芎样品也均由成都中医药大学采集完成,其样品均在同一时节采收和在相同环境下保存,每个产地均取样12次。

1.1.2 样品制备

光谱仪用实验样品制备方法分为研磨、过筛和压片。由于样品内部含有挥发油,部分成分遇高温变质,故采用低温研磨,保持研磨时温度不超过60℃。研磨后过200目筛,保持粒度相近并干燥保存。综合考虑了样品吸收信号的强度且样品材料不至于易碎而影响测试,本实验选取每个样片时都取过筛后的粉末200 mg,压片机压力设置在4 t,压片时长均为5 min,最终制得厚度在1.13 mm左右,直径12 mm的圆柱体白芷样品片120枚,川芎样片108枚,扶芎样片108枚,所有用于测试的样品片两表面平行。

1.2 太赫兹时域光谱系统

太赫兹时域光谱系统(Terahertz Time-Domain Spectroscopy,TDS)是一种成熟的太赫兹产生和探测系统[17],利用TDS可以获得太赫兹时域光谱信号。常见的透射式时域光谱系统,见图1。其组成单元包括飞秒激光器、分束镜、光学延迟线、太赫兹脉冲发生装置和太赫兹探测装置等。测试时,将样品放在离轴抛面镜之间的光路上,获得样品的时域光谱信号。

图1 太赫兹时域光谱系统组成

本实验仪器为英国Teraview公司的TPS3000光谱仪。将制备好的样品放在透射样品池中直接测量,以不加样品的信号为背景参考并加以扣除。其他测试条件有,温度24℃ ~25℃,湿度 1.4%~2.0% RH。

1.3 太赫兹时域光谱系统的光学参数提取

依据Dorney等[18]和Dragoman等[19]提出的光学参数提取方法,有透过率、折射率、吸收系数,这些参数描述了固体样品在具有一定厚度且两表面平行且在透射测试条件下对太赫兹波的吸收特性。

将样品和参考的时域信号分别作傅里叶变换得到对应频域信号,记为Esample(ω)和Ereference(ω),其比值为透过率H(ω)且:

其中n为折射率,ω为频率,A为振幅,Φ为相位差。若又知样品厚度d,则可导出折射率n(ω)及吸收系数α (ω):

本实验将吸收系数或透过率作为后续光谱分析的参数。

1.4 光谱数据处理

预处理[20]:本实验的预处理过程微分、标准化、归一化。

主成分分析[20](Principal Component Analysis,PCA):是一种数学降维的方法,通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。即找出少数几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关。

支持向量机[20](Support Vector Machine,SVM):20世纪90年代,vapnik提出了支持向量机方法。该方法基于结构风险最小化准则,在解决小样本、非线性和高维模式识别问题中具有优势。对于如式(4)的分类面:

其中w,是重构空间的权值,b是偏差。是控制反映样本是否被错分的松弛变量,具有如式(5)的目标函数:

其中C是惩罚因子,起控制对错分样本惩罚程度,实现在错分样本与算法复杂度之间的折中。在核函数空间,采用Lagrange乘子法求w,b等价于求一个凸二次规划问题的对偶问题的最大值,如式(6):

满足约束条件和αi≥0;其中K(xi,xj)表示核函数映射。

如果采用高斯核函数的SVM分类,有两个参数需要优化,即惩罚因子C和核参数g,两个参数影响着分类器的分类效果。

K折交叉验证法:即将数据分成K组,得k个子集,将各子集的数据分别充当一次验证集。剩余的K-1组子集数据作训练集,可得到K个模型,再用这K个模型所得的验证集的分类准确的平均数作本验证方法下评价分类器的性能指标。根据原始数据集合的大小,通常每个子集的数目不小于2,否则等价于留一验证法。该验证法能有效的避免过学习和欠学习状态的发生,适合检验模型的泛化能力。

2 典型川产道地药材的鉴定研究

2.1 太赫兹时域光谱技术鉴别川产道地药材白芷是否熏硫

白芷样品均测量3次取平均,实验所得原始的熏硫和未熏硫的样品选取0.2~2 THz的信号用于建立光谱模型,图2显示了其中两条光谱示。从图2可以看出熏硫和未熏硫的样品在时域的差别不大,通过傅里叶变换将时域信号转化到频域并提取吸收系数,见图3~4。

图2 川产白芷样品的太赫兹时域信号谱图

图3 川白芷样品的吸收系数信号谱图

注:a.熏硫白芷;b.未熏硫白芷。

由图3可以看出,熏硫和未熏硫的白芷样品数据的吸收系数在0.2~1.7 THz左右没有直观的峰,但重复性较好。从基线趋势和出现的峰的个数的角度上看,1.7~2 THz的测试结果也具有重复性。主成分分析结果,见图4。

图4 熏硫和未熏硫川白芷样品在第三到第五个主成分视图

太赫兹波谱中,样品的波谱不仅仅包括熏硫与未熏硫白芷的有效成分,还包括中药白芷的其他成分,如纤维素等,而这些部分质量占比最大。对于本次实验,从实验方法上看是对不同产地的样品直接压片,所以无法保证药材中质量占比较大的非有效成分之间的变化是规律的,加之样本量有限,所以在结果上我们于前两个主成分中没有找到很好的聚类效果,却在第三到第五个主成分中发现了这种规律性(图4)。从图4的结果中可以看出,熏硫和白芷和未熏硫的白芷尽管来自5个不同的产地,但是其两类样本在第三到第五个主成分所表示的三维空间中明显分成了两部分,这说明熏硫和不熏硫的川产白芷之间具有较显著的差异。

支持向量机分类结果:用前20个主成分作为训练特征(累计可信度95.53%),随机选取80个样品为训练集其余为预测集。支持向量机采用高斯核函数,依据5折交叉验证的结果计算正确率,使用网格搜索法确定支持向量机的参数C和g。寻得C=0.37,g=0.96。最后利用这些参数来对预测集进行分类,分类正确率达到了100%。

2.2 川芎扶芎的分类鉴别

在样品质量一定的情况下,也可选择透过率谱作为分类依据。川芎、抚芎透过率谱图,见图5,测试中每个样本重复测量9次,每个样片转动3次,每转动一个位置测量3次,以便减小位置带来的误差,选取0.1~0.8 THz波段用于建模。

图5 太赫兹波段下的川芎与扶芎的透过率谱

如同白芷一样,我们于第1个主成分上没有观察到两类样品呈现出最好的聚类,却在第2到第4个主成分中发现了较好的聚类结果,见图6。由图5~6可以看出,透过率的数据具有重复性。透过率信号在基线上具有差异,在实验上可解释为太赫兹波并非完全垂直地通过了被测样品,但是却也携带了除了基线以外的有效信息,这个信息包含了川芎与扶芎的本质差异。

图6 川芎、抚芎样品在第二到第四个主成分视图

从图5看,在统计角度上川芎和扶芎样品数据的透过率在0.1~0.8 THz左右尽管没有直观的特征峰,其波形波动的形状也受到了环境因数因素的影响,但是图6的结果却表明了差异的规律性。使用透过率作为建模参数,将主成分分析后的前12个主成分作为特征(累计可信度96.96%)。支持向量机采用高斯核函数,依据5折交叉验证的正确率,使用网格搜索法确定支持向量机的惩罚因子C和g,寻得C=0.37,g=0.96,最后利用这些参数来对预测集进行分类,在模型建立后计算5折交叉验证的正确率。如果采用其他分类方法并计算正确率,见表3,其中采用高斯核函数优化后的分类正确可达99.9%。

表3 川产川芎、扶芎分类正确率(%)

3 结论

本研究以川产道地药材白芷和川产道地药材川芎扶芎为例,介绍和分析了太赫兹时域光谱技术在中药才鉴别中的应用。在对太赫兹时域谱提取的吸收系数求一阶导数,减小谱线基线漂移的影响。对一阶导数作标准化和归一化,凸显谱线之间的差异。采用主成分分析提取特征。再用支持向量机对提取的特征进行分类。结果为对熏硫和未熏硫白芷的鉴别正确率达到了100%。依据透过率建模,采用相似方法对川芎和抚芎鉴别的分类正确率为99.9%。这表明虽然太赫兹波段存在谱峰重叠、基线重合等缺点,但经过合理的预处理,太赫兹时域光谱可很好的从加工和原材料种类的角度区分中药材真伪,本研究具有维护食品药品安全和规范市场的实际意义,也为其他中药材的太赫兹鉴别提供了借鉴。

[参考文献]

[1] 周雨菁,相秉仁.中药鉴别方法研究进展[J].海峡药学,2009,22(4):20-23.

[2] 陈科力,黄林芳,刘义梅.中药鉴定方法学发展历程[J].中国中药杂志,2014,39(7):1203-1208.

[3] 张瑜,秦振娴,刘爽,等.中药鉴定方法研究进展[A].中国中药商品学术大会暨中药鉴定学科教学改革与教材建设研讨会[C].2015.

[4] 刘盛纲,钟任斌.太赫兹科学技术及其应用的新发展[J].电子科技大学学报,2009,38(5):481-486.

[5] 李晗,余晨.太赫兹波对肾癌组织的光谱检测[J].红外与激光工程,2016,45(5):160-165.

[6] 李允植.太赫兹科学与技术原理[M].北京:国防工业出版社,2012.

[7] Huang F,Schulkin B,Altan H,et al.Terahertz study of 1,3,5-trinitro-s-triazine by time-domain and Fourier transform infrared spectroscopy[J].Appl Phys Lett,2004,85(23):5535-5537.

[8] Slingerland EJ,Jahngen EGE,Goyette TM,et al.Terahertz absorption spectra of nitromethane[J].J Quant Spectrosc Ra,2011,112(14):2323-2329.

[9] Kurabayashi T,Shuhama H,Yodokawa S,et al.Identification of cellulosic fibers and determination of their blend ratio using terahertz spectroscopy[J].Infrared Phys Techn,2017,80:153-157.

[10] 张蕾.中草药太赫兹(THz)谱[D].北京:首都师范大学,2004.

[11] 周斌权.青蒿素等中药的THz光谱和中红外光谱研究[D].北京:首都师范大学,2007.

[12] 张平.中草药的太赫兹光谱鉴别[D].北京:首都师范大学,2008.

[13] 陈艳江.基于支持向量机的中药太赫兹光谱鉴别[D].北京:首都师范大学,2009.

[14] 郭昌盛.珍珠粉的太赫兹波谱定量检测研究[D].中国计量学院,2012.

[15] 汪景荣,张卓勇,张振伟,等.偏最小二乘法和THz-TDS在正品大黄鉴别中的应用[J].光谱学与光谱分析,2016,36(2):316-321.

[16] 马品,杨玉平.运用太赫兹光谱技术检测天麻中的水分含量[J].太赫兹科学与电子信息学报,2017,15(1):26-28.

[17] 张兴宁,陈稷,周泽魁.太赫兹时域光谱技术[J].激光与光电子学进展,2005,42(7):35-38.

[18] Dorney TD,Baraniuk RG,Mittleman DM.Material parameter estimation with terahertz time-domain spectroscopy[J].J Opt Soc Am,2001,18(7):1562-1571.

[19] Dragoman D,Dragoman M.Time-frequency signal processing of terahertz pulses[J].Appl Optics,2004,43(19):3848.

[20] 褚小立.化学计量学方法与分子光谱分析技术[M].北京:化学工业出版社,2011.

 

Study on the Identification Technology of Chinese Herbal Medicines Based on Terahertz Time-Domain Spectrometer

TIAN Junhong1, ZHOU Jun1, ZHENG Xiaoxiao2, JIANG Guihua2, MA Yuying2
1.School of Electronic Science and Engineering, University of Electronic Science and Technology of China, Chengdu Sichuan 610054,China; 2.School of Chinese Pharmacy, Chengdu University of Traditional Chinese Medicine, Chengdu Sichuan 611137, China

Abstract:The terahertz (THz) waves are the electromagnetic waves in the range from 0.1 to 10 THz. THz waves has very unique natures, rich scientific contents as well as broad application prospects. As many skeleton vibrations of macro-molecules fall in the THz band, it is suitable for the use of THz waves to detect those information. THz time-domain spectrometer (TDS) is capable of obtaining information of the THz pulses. In this paper, based on THz TDS, we gave an example of authenticity identification of Angelicae dahuricae Radix and Ligusticum chuanxiong hort to show our recent work, which providing a method for pattern recognition of other medicines and foods.

Key words:terahertz; spectrograph; electromagnetic wave; frequency; traditional chinese medicinal materials; classification and identification

[中图分类号]O433.4

[文献标识码]A

doi:10.3969/j.issn.1674-1633.2018.07.002

[文章编号]1674-1633(2018)07-0009-05

收稿日期:2018-02-11

修回日期:2018-02-22

基金项目:国家自然科学基金(61505022);四川省科技计划项目(2016JY0197,2016JY0076)。

通讯作者:周俊,副教授,主研究方向为太赫兹波谱与成像技术及应用。

通讯作者邮箱:zhoujun123@uestc.edu.cn

 

本文编辑 王静