基于疾病模式的临床决策支持系统构建

姬娜,李桂祥,陈鹏岗

西安交通大学第二附属医院 信息网络部,陕西 西安 710004

[摘 要]目的 针对国内外临床决策支持系统无法解决医学自然语言处理问题和存在知识表达不充分的问题,通过对疾病模式框架的分析与研究,构建基于疾病模式的临床决策支持系统。方法 整合医院现有信息系统中的患者临床数据资源,利用数据挖掘、机器学习、模式识别等大数据处理技术构建医疗决策平台。结果 构建的临床决策支持系统具有有效性,能够为临床医生提供辅助诊断。结论 基于疾病模式的临床决策支持系统的构建将传统以医生经验为主导的决策向知识库决策转变,为临床决策提供辅助支撑服务。

[关键词]决策支持系统;疾病模式;数据挖掘;机器学习;大数据处理

 

引言

近年来,临床决策支持系统成为各大医疗机构关注与发展的热点,随着医院规模的不断扩张和医疗数据的爆发式增长,如何利用大数据处理技术从海量业务数据中发掘有针对性的信息,构建疾病模式知识库,辅助医生进行临床决策,成为未来医院医疗信息化建设发展的趋势[1-2]

目前,临床医生在疾病诊断的过程中大都综合临床症状、体征和辅助检查来做出判断,所以对诊断质量和标准把握不高,无法利用电子病历信息系统所积累的数据来做临床决策支持。精准医疗是一种基于病人定制的医疗模式,通过医学数据和专业知识分析患者病症,提供个性化疾病治疗方案,基于这种迫切的需求,临床决策支持系统(Clinical Decision Support System,CDSS)的开发与应用将被进一步有效推动[3-4]

基于疾病模式的临床决策支持系统构建将当前医疗行为过程中记录的散落诊疗数据整合成标准的患者疾病模式。然后对不同疾病的不同核心信息进行转换和识别之后确定“这是一个什么样的患者”“哪些是相似的患者”“这是一种什么疾病”“如何评价一个诊疗过程质量”。因此,构建的系统有助于为患者个体的疾病诊断和治疗提供精准的决策,从而提高医生的诊疗水平及医疗质量,最终受益于患者。

1 临床决策支持系统现状与存在问题

美国典型的临床决策支持系统包括QMR、DXplain、MYCIN、Isabel、VisualDX等在发展过程中的问题及经验值得我们借鉴[5-6]。2007年,IBM开发的“沃森(Watson)”人工智能系统不断与各医院、诊所、疾病研究中心合作,将“沃森”应用到医疗的各个方面,但“沃森”在中国的工作仍面临着本土化问题[7-8]。国内临床决策支持系统主要以单病种或单学科的诊断为主,多处于探索阶段。真正具有基于不同患者的个性化分析及辅助决策功能的临床决策支持系统还未实现[9-10]

临床决策支持系统的推理方法——基于规则、基于案例和基于模型等[11-13]。基于规则效率高、知识库构造简单,但表述规则难度大和存在知识瓶颈。基于模型相比基于规则的方法,降低了知识表示与抽取的难度。基于案例主要指利用已有经验。陈全福等[11]使用案例推理(Case-Based Reasoning,CBR),通过对案例的学习来拓展临床思维,然后采用智能神经算法进行自我学习,但由于病情多样性、案例多属性、属性值的复杂性和不确定性,案例表示具有局限性,对噪音数据敏感,案例修正规则获取困难。徐云伟[12]将文本形式的临床指南基于适当的建模形成计算机可读的形式,通过执行指南,在诊疗过程中提供针对性建议。但大多数临床指南是基于静态文本的自然语言,因此计算机无法对未经结构化的、基于自由文本的指南进行分析。刘永斌等[13]提出基于知识库的临床决策支持系统技术框架,但权威知识库建设困难、医学知识更新迅速、临床诊断中不确定因素较多、推理机制复杂。

2 疾病模式建立

2.1 疾病模式识别

疾病识别通常采用专家医师根据自身的经验进行分析,得出结果。疾病模式识别是以识别疾病特征的方法研究疾病科学问题,疾病特征识别就是从数据集的数据中识别出某类事物最具代表性特征子集的过程。通过度量不同特征与类别的相关程度,实现在高维特征中选取与类别相关度高的特征子集[14-15]。根据病患在真实临床条件下所生成的数据出发,对这些在医院内积累的大量数据进行深度治理、分析和挖掘,寻找体征、诊断、用药、治疗方式等的相关性,结合医学知识图谱,最终形成患者画像,疾病模式生成如图1所示:

图1 疾病模式生成示意图

2.2 特征向量提取

建立每个疾病的专属疾病模式,除疾病中基本信息、一诉五史、体格检查、专科检查、诊断等之外,每个疾病都有自己专属的疾病信息,各类专科系统疾病信息,包括疾病名、缩写、别名、ICD疾病代码、临床表现、并发症、实验室检查、其它辅助检查、诊断、鉴别诊断、手术、治疗、预后、随访等。

疾病模式的建立有赖于临床信息化进程中产生的大量真实医疗数据,这些数据的产生以医生与患者的诊疗活动为核心,并以结构化与非结构化数据的形式存在于HIS、LIS、PACS、脑卒中信息系统以及远程会诊系统等中。首先,结构化数据包括:患者人口学信息、检验结果、医嘱信息、诊断信息等,将这些数据进行标准化、归一化直接与现有知识库关联。其次,非结构化数据包括:入院记录、病程记录、出院小结、手术记录、影像学报告、病例学报告等。这些数据进入自然语言处理模块进行处理,关联临床医学术语标准(SNOMED CT)、国际疾病分类(ICD 10)、面向药物的命名系统RxNorm、针对观测指标的编码系统LOINC、基因本体(gene ontology)、DRUGBANK等国际标准术语集[16],提取隐含事实信息,包括医学义元颗粒度分词、医学命名实体识别、语义依存分析、语法结构解析等模块,从非结构化文本中提取标准有效的信息,使其得到有效治理,形成结构化的数据仓库。

在已经完成清洗、标准化(归一)、结构化的数据之上,通过机器学习,进一步丰富患者画像(特征向量),通过概率统计、因果推断、主成分分析(Principal Component Analysis,PCA)、高斯混合模型(Gaussian Mixture Model,GMM)等方法去推荐可能的疾病诊断,最终产生服务于临床诊疗、诊断、治疗、预后的疾病模式。糖尿病和白血病两种疾病模式建立,见图2。

图2 两种疾病模式建立示意图

2.3 患者画像

患者画像是对当前病人疾病状况的刻画。通过收集和处理大量数据,接入疾病模式,构建以患者为中心的疾病画像。患者疾病维度的画像,是指以患者的各个活动记录为元数据,每次就诊的病历为组织,以病历主诊断聚合出来的“疾病轴”为对象,将患者疾病的各个属性(疾病症状、各种不同的治疗方案、病情的检验、检查体现等)抽象成特征向量,然后建模,通过权重的调节和条件的设置,建立相似患者和合并疾病、并发疾病等模式。

3 基于疾病模式的临床决策支持系统构建

3.1 系统架构

数据处理平台基于主流的云计算和大数据技术,采用多节点服务器堆叠技术(Hadoop2.0)框架及Spark并行计算框架,采取应用与计算能力的架构设计和Docker封装技术。基于内存、SSD高效存储介质的搜索引擎通过数据分片技术,构建在整个私有云分布式计算框架之上,实现院内数据的“百度”,支持在症状、用药、患者特征等诊疗维度的统计分析。

对疾病数据源进行预处理后,整理成能进行分析的格式或结构,形成以疾病为中心、元数据为基础的知识库数据,分析出疾病参数与疾病发生之间的一些规则,得到需要的临床知识,给出治疗和药品用量、用法、用次等方面的建议,供医生和患者协调选择,对超过范围的医疗指标进行报警,指出不合理的医嘱等意见,保证诊断结果的客观性、科学性。系统架构,见图3。

图3 系统架构图

3.2 诊疗数据获取

数据处理平台需要解决数据获取、数据清洗等方面的工作,通过将医院当前HIS和两个历史HIS、LIS、PACS、手麻、心电、病理等系统的数据通过ETL进行抽取、汇集、结构化、映射到兼容国际国内医疗数据规范标准的全局Schema中,对字段信息清洗和语义归一,为上层应用服务提供准确的基础数据支撑和业务模型训练。

3.3 数据标准化与结构化

标准化保证后续应用的准确性和统计口径的一致性,参照ICD10、ICD9、LOINC、药品基本数据库、医疗服务价格项目、医用耗材基本数据库、医学一体化语言系统(Uni fi ed Medical Language System,UMLS)、医学主题词表(Medical Subject Headings,MeSH)、临床医疗术语集(Systematized Momenclature of Medicine-Clinical Terms,SMOMEDCT)、中文医疗健康知识图谱等国内外通用标准,对现有数据的诊断、手术、药品、检验、检查以及科室等信息进行标准化、规范化,形成以患者为中心的数据,也可自定义数据采集表,通过医生或患者进行录入或批量导入,还可结合平台自身客观数据,包括公共卫生数据、基因检测数据、第三方开放数据等。

结构化保证数据隐含的高价值信息被完整的提取和应用。通过自然语义处理模块,结合医疗专业术语的语义结构,将医疗语义信息从原始的自然语言表达,扩展分析为结构化的Key-Value模式,主要从若干个独立维度来进行,对症状、体征、过敏史、诊断、鉴别诊断、病理诊断等字段进行划分,临床数据结构化处理软件框架,见图4。

图4 临床数据结构化处理软件框架

3.4 临床决策支持系统构建

CDSS的功能在于能够模拟医疗专家诊断疾病的思维过程,Hadoop开源云计算平台存储和处理数据平台所整合的大数据,通过大数据技术来获取和处理多元异构的各类数据,将统计分析方法与机器学习相结合,在经过标准化和结构化数据之后,利用SPSS统计工具,以糖尿病为例,将各阶段患者的多次生理指标作为研究对象,进行Logistic回归分析,采用分类、聚类、关联规则对糖尿病原始数据,包含诊断、生化、糖化、检验等多个临床指标及用药数据进行多维度分析和计算,并由此构建糖尿病数据仓库,提取葡萄糖、甘油三酯、血清尿酸、载脂蛋白、总胆红素、血清白蛋白等14个属性作为特征变量,通过决策树机器学习方法实现对糖尿病的分类,糖化血红蛋白测定值在4%~6%(或己糖激酶GLU-HK在3.9~6.1 mmol/L)为正常参考范围;糖化血红蛋白>6.5%均视为糖尿病,分类为“糖尿病”“妊娠期糖尿病”“糖尿病合并冠心病”等共计8类,选取与8类相关的处理后的结构化病历数据作为样本数据,供机器学习,形成知识库。

3.5 系统实现

系统构建在虚拟化平台上,采用VMware虚拟化软件。虚拟化软件运行在3台高档服务器和2台高档存储上,服务器配置4颗Intel Xeon E7-4820 v4缓存,内存256 GB DDR4 2400 MHz,硬盘5×600 GB;存储配置2个SAN+NAS统一存储节点,支持SAN和NAS存储模式;存储网络交换机2台,各含12个16 GB短波SFP,交换能力≥768 GB/s。虚拟主机安装Windows Server 2003 R2操作系统,使用多台虚拟主机分别运行应用服务软件、数据集成平台、数据库服务软件。

系统通过集成平台Health Connet与医院其他信息系统的数据进行集成,抽取当前HIS和两个历史HIS库中病历数据488916份到数据中心,通过疾病名筛选、样本病例库数据的标准化、专家修订和机器自学建立糖尿病、白血病两种疾病模式,将临床决策支持系统模块嵌入我院门诊医生工作站,辅助医生临床诊疗决策。

4 结语

基于疾病模式的临床决策支持系统构建是在对医院产生的医疗真实数据,采用人工智能等大数据处理方法建立起疾病模式的基础上,依据信息系统获取的病人的当前信息,实现对医生诊疗过程的个性化建议。将CDSS整合到门诊医生站后,帮助门诊医生进行临床诊断辅助决策支持。统计入院方式为门诊入院的确诊糖尿病病人,以今年3月份277例出院糖尿病门诊诊断符合率为98.2%和去年3月份252例出院糖尿病门诊诊断符合率为95.2%比较,门诊诊断质量有所提高。下一步针对肺结核、肺癌等疾病,构建相应疾病模式,开展进一步探讨,提升临床诊疗质量和安全管理能力,更好的服务于患者。

[参考文献]

[1] 邵伟,王颖,闫国涛,等.临床决策支持系统建设研究[J].中国医疗设备,2016,31(8):87-88.

[2] 司家瑞,穆得虎,孙俐,等.基于大数据技术的糖尿病临床决策支持系统分析与展望[J].国际生物医学工程杂志,2017,40(3):216-220.

[3] 梁罗希,吴江.决策支持系统发展综述及展望[J].计算机科学,2016,43(10):27-32.

[4] 董军,王欣,李军,等.临床决策支持系统的构建与应用[J].中国卫生质量管理,2016,23(3):16-19.

[5] 盛赟,张越.美国临床决策支持系统发展与启示[J].中国卫生信息管理杂志,2016,13(3):257-261.

[6] 井玲,甘亢,任景怡.临床决策支持系统在医疗质量管理中的应用[J].中日友好医院学报,2017,31(5):301-303.

[7] 杨春华,王天津,黄思敏,等.支持精准医疗的国外临床决策支持系统[J].中华医学图书情报杂志,2016,25(2):14-19.

[8] 李怡雪,韩薇,王庆阳,等.医院信息化:临床决策支持系统构建[J].医学信息学杂志,2015,36(11):6-10.

[9] 赵妍,王颖,闫国涛,等.基于数据仓库的临床决策支持系统在我院的应用[J].中国医疗设备,2016,31(7):95-97.

[10] 张怡,李柯.临床决策支持系统在医院的应用[J].医学信息学杂志,2015,36(6):27-30.

[11] 陈全福,叶焕文,杨荣源,等.基于案例库构建中医临床决策支持系统[J].广州中医药大学学报,2016,33(4):585-587.

[12] 徐云伟.基于临床指南的急性胰腺炎诊断决策支持系统的构建[D].沈阳:中国医科大学,2016.

[13] 刘永斌,魏明月,于广军,等.基于临床决策支持的智能化电子病历集成平台建设与实践[J].中国医院,2017,21(8):8-11.

[14] 刘玉文,张钰.基于LDA模型的疾病特征识别方法[J].新余学院学报,2017,22(3):23-26.

[15] 王英男.基于激光荧光光谱数据的疾病模式识别[J].激光杂志,2017,38(11):117-120.

[16] 李艳,吴梦佳,张士靖,等.语义互操作标准在临床决策支持系统中的应用[J].医学信息学杂志,2017,38(10):57-61.

 

Construction of Clinical Decision Support System Based on the Disease Pattern

JI Na, LI Guixiang, CHEN Penggang
Department of Information Network, The Second Affiliated Hospital of Xi’an Jiaotong University, Xi’an Shaanxi 710004, China

Abstract:Objective To solve the problem of natural language processing and inadequate knowledge expression in medical science,a clinical decision support system based on disease model was constructed by analyzing and researching the framework of disease model. Methods The medical decision platform which integrated the clinical data resources of patients in the existing information system of the hospital was established by using big data technologies such as data mining, machine learning and pattern recognition.Results The clinical decision support system constructed in this paper was effective and could provide auxiliary diagnosis for clinicians. Conclusion The construction of clinical decision support system based on disease pattern changes the traditional decision based on doctor’s experience into the knowledge base decision and provides supporting services for clinical decision.

Keywords:decision support system; disease pattern; data mining; machine learning; big data processing

[文章编号]1674-1633(2018)10-0071-03

doi:10.3969/j.issn.1674-1633.2018.10.018

[文献标识码]A

[中图分类号]TP399;TP181

作者邮箱:jina308@126.com

修回日期:2018-05-09

收稿日期:2018-04-12

本文编辑 李美松