利用GATE的XML配置文件实现病历短语抽取的机器学习方法
倪晓华
南京医科大学第二附属医院 信息科,
江苏 南京 210011
Machine Learning Method to Realize Medical Record Phrase
Extraction via Using the XML Configuration File of the GATE
NI Xiao-hua
Department of Information, the Second
Affiliated Hospital of Nanjing Medical
University, Nanjing Jiangsu 210011,
China
摘要 本文利用文本工程通用框架软件的XML配置文件,来指定所学文档使用的特征参数、学
习算法,实现文本病历医学短语抽取的机器学习。结果计算机能很方便的在大段病程资料中快
速自动获取医生所需的医学短语信息。本学习算法具有较好的实用性,达到了预期要求。
关键词 :
电子病历 ,
机器学习 ,
通用框架软件 ,
支持向量机
Abstract :Based on XML configuration files of general architecture for text engineering, we specified
characteristics and learning algorithm of the documents, and realized machine learning of text records
phrase extraction. The result was that computer could automatically obtain the phrases that doctor
required from the long course information quickly. This learning algorithm has good practicability and
meets the expected demand.
Key words :
electronic medical record
machine learning
general architecture for text engineering
support vector machine
收稿日期: 2016-10-25
作者简介 :
extraction from documents[J].J Res Dev,2012,56(4):501-510.
[2]
Uzuner O,Solti I,Cadag E.Extracting medication info-rmation
[1]
Fan J,Kalyanpur A,Gondek DC,et al.Automatic knowledge
[2]
Uzuner O,Solti I,Cadag E.Extracting medication info-rmation
[3]
原欢.基于GATE的货物动态邮件信息抽取方法与应用研究[D].
[3]
原欢.基于GATE的货物动态邮件信息抽取方法与应用研究[D].
南京:南京航天航空大学,2013.
[1]
Fan J,Kalyanpur A,Gondek DC,et al.Automatic knowledge
[2]
Uzuner O,Solti I,Cadag E.Extracting medication info-rmation
from clinical Text[J].J Am Med Inform Assoc,2010,17(5):514-518.
[3]
原欢.基于GATE的货物动态邮件信息抽取方法与应用研究[D].
南京:南京航天航空大学,2013.
[1]
Fan J,Kalyanpur A,Gondek DC,et al.Automatic knowledge
extraction from documents[J].J Res Dev,2012,56(4):501-510.
from clinical Text[J].J Am Med Inform Assoc,2010,17(5):514-518.
南京:南京航天航空大学,2013.
extraction from documents[J].J Res Dev,2012,56(4):501-510.
from clinical Text[J].J Am Med Inform Assoc,2010,17(5):514-518.
[1]
彭红波,韩晟,王婷婷. 基于Solr的电子病历全文检索系统的设计与实现 [J]. 中国医疗设备, 2019, 34(3): 102-105.
[2]
袁骏毅,汤钦华,马群圣. 胸腺瘤结构化专病数据库构建研究 [J]. 中国医疗设备, 2019, 34(2): 113-115.
[3]
杨越1 ,汪丰1 ,孙丰2a ,郑慧芬2b . 基于运动传感器的帕金森自动分级研究 [J]. 中国医疗设备, 2018, 33(9): 37-41.
[4]
刘晓东a ,宋俊b . 结构化电子病历质量控制新模式实践与探讨 [J]. 中国医疗设备, 2018, 33(9): 168-171.
[5]
杜红阳1 ,吴世福2 ,黄琳2 ,杜卫红1 ,王淑玉3 . 基于机器学习和数据挖掘技术进行MDR风险预警的研究初探 [J]. 中国医疗设备, 2018, 33(7): 138-141.
[6]
李盼盼1 ,谭庆平1 ,曾平1 ,王重2 ,张浩宇1 ,谢勤政1 ,颜颖1 . 机器学习技术在疗养数据挖掘中的应用初探 [J]. 中国医疗设备, 2018, 33(4): 104-107.
[7]
陈平1 ,帅仁俊2 ,桂彬2 ,苏逸飞1 . 南京市电子病历文件管理系统设计与研究 [J]. 中国医疗设备, 2018, 33(3): 147-150.
[8]
邹雨馨1 ,谢朝1 ,刘湘乡1 ,张薇莎1 ,邹炼1,2 . 放射治疗流程网络管理平台设计及应用 [J]. 中国医疗设备, 2018, 33(10): 137-139.
[9]
姬娜,李桂祥,陈鹏岗. 基于疾病模式的临床决策支持系统构建 [J]. 中国医疗设备, 2018, 33(10): 71-73.
[10]
姚青岭a ,丁忠a ,张玉b ,曹赋韬b ,鲁晓杰c . 我院急诊预检分诊系统的应用 [J]. 中国医疗设备, 2018, 33(1): 157-159.
[11]
赵延红1a ,樊林1a ,卫荣1a ,梁宗强1a ,梁一木1b ,马亚楠2 . 我院心电生理信息系统的建设与应用 [J]. 中国医疗设备, 2017, 32(8): 125-127.
[12]
丁忠,姚青岭,陈宇昂,毛盛,
黄培,鲁晓杰. 门诊电子病历系统的开发与应用 [J]. 中国医疗设备, 2017, 32(7): 163-168.
[13]
许欢,张平. 基于生物电阻抗技术的睡眠姿势识别方法的探讨 [J]. 中国医疗设备, 2017, 32(6): 39-44.
[14]
李桃a ,郑西川a ,李晖b . 门诊结构化电子病历的研究与设计 [J]. 中国医疗设备, 2017, 32(6): 127-130.
[15]
马利亚,曹磊,马国鹏. 肿瘤门诊电子病历系统的设计与应用 [J]. 中国医疗设备, 2017, 32(6): 124-126.