基于NIH项目的美国医学人工智能发展态势分析

严舒,陈娟,欧阳昭连

中国医学科学院/北京协和医学院 医学信息研究所/图书馆,医疗器械与药物战略情报研究室,北京 100020

[摘 要] 近年来人工智能在医学研究中的应用不断加深,美国在该领域已走在世界前列。本研究对美国国立卫生研究院资助医学人工智能项目的数量、金额、被资助机构、资助机制、支出分类标签词等信息进行统计和聚类分析。结果显示美国医学人工智能资助项目数量和金额呈现周期性增长,近5年来增长迅速,项目以研究型项目为主,兼顾应用与产品化。生物工程、临床研究、网络信息技术、神经科学、遗传学、癌症、衰老等研究领域和疾病研究中人工智能技术应用较多。本研究揭示了美国人工智能技术在医学研究中的发展趋势和应用领域,为我国构建医学人工智能资助体系,支持人工智能在医学研究中的应用提供参考。

[关键词] 人工智能;医学人工智能;聚类分析;共现聚类网络

引言

人工智能(Artificial Intelligence,AI)是在计算机科学、控制论、信息论、神经心理学、哲学、语言学等多种学科基础之上发展起来的一门综合性交叉学科,医学人工智能是人工智能的一个分支,在疾病诊疗等方面具有较多应用场景[1]。近年来人工智能应用于医学研究和诊疗已经成为现代科技的热点之一,美国五大顶尖医疗服务机构如梅奥医学中心、克里夫兰医学中心等都已开始与人工智能公司进行合作,希望成为医学人工智能应用领域的中心,利用人工智能技术更好地对疾病进行预测、诊断、治疗和管理[2]

美国国立卫生研究院(The National Institutes of Health,NIH)成立于1887年,它隶属于美国卫生与公共服务部(United States Department of Health and Human Services,HHS),负责管理90%以上由美国政府主导的医学科研经费[3]。NIH每年会制定项目规划和经费预案,获得白宫和国会通过以后,经费将由NIH综合办公室及下设的预算办公室依据项目规划协调分配给27个按专业领域和职能划分的下属研究机构/中心,由各IC直接负责项目的资助与管理[4]。NIH用于资助科研项目的经费分为院内、院外两部分,其中院外项目资金占比超过80%,主要采取竞争性项目及少量委托性项目的方式分配给全美及全球的高校、科研机构、医疗服务机构和医药企业开展医学相关研究工作[5]。NIH项目资助体系较为完整,覆盖基础研究、应用研究、产业化及人才培养等多个方面,定位清晰且有明确的分类和编号,是美国医学科技发展的风向标[6-7]

本研究主要运用描述统计与科学计量方法,通过分析NIH资助的医学人工智能项目,整体把握美国医学人工智能的发展态势和研究方向,以期为我国相关领域发展提供参考。

1 数据收集与分析方法

1.1 资料来源

在NIH项 目 数 据 库(Research Portfolio Online Reporting Tools,RePORT)检索由NIH及其下设IC资助的应用人工智能技术的医学研究项目。检索词及检索策略:“Text Search: “artificial intelligence” or “machine learning”or “deep learning” or “artificial neural network” (Advanced),Search in: Projects Limit to: Project Abstracts, Project Title,Funding IC: All NIH Institutes and Centers , Fiscal Year: All Fiscal Years”,检索日期2019年6月28日,共获4581条项目记录,包括新项目、竞争性延续项目、延伸项目等。

1.2 分析方法

本研究运用Excel、Bibexcel、Pajek和Vosviewer等软件对项目数据中的项目获批年份、资助金额、资助来源、被资助机构、资助机制、支出分类标签词等字段进行统计分析、高频词分析、共现聚类分析及可视化,以揭示美国NIH资助医学人工智能项目特征、内部关联和整体发展态势。

2 数据分析

2.1 资助项目年度分布

NIH共资助医学人工智能项目4581项,项目数量和金额变化可分为4个阶段,呈现周期性增长趋势(图1)。NIH首次资助医学人工智能项目是在1985年,此后的16年间项目数量和资助金额没有明显变化,平均每年资助项目23项,资助金额约700万美元。2002年至2009年间,资助力度出现大幅增长,项目数量和资助金额的年平均增长率分别达到24.1%和29.7%。此后的4年资助力度变化不大,平均每年资助项目185项,资助金额8400万美元。而最近五年间,NIH对医学人工智能资助项目无论在数量还是资助金额上都再次呈现大幅度增长趋势,仅2018年一年,项目数量就已达到847项,资助金额4.4亿美元,增长率分别达到37.9%和41.3%。

图1 NIH资助医学人工智能项目年度分布

注:2019年项目数量和金额尚不能完全统计,故不纳入趋势计算。

2.2 资助机制分析

从项目资助机制来看,NIH资助的主要是研究型项目,占到了项目资助总额的60%,其中又以基础性研究项目(R01)为主,支持科研工作者以自身研究方向和兴趣出发,开展独立、具体的探索性研究,资助对象为高校、科研机构、医院或企业的研究人员(表1)。人才培养、会议、培训等项目虽然资助总额不高,但数量较多,体现出NIH对推广医学人工智知识教育、医学人工智能人才培养及学科队伍建设采取重视态度。此外,NIH还资助了引导、培育小企业开展以应用为导向的小企业研究转化项目334项,支持下设IC开展自主研究的院内研究项目237项,针对大型、多学科领域设立的包括工具开发、基础研究转化等一系列研究内容的研究中心项目133项,以及为满足研究中服务和工具开发需求或资助小企业潜在产品转化的研发合同项目39项。

表1 NIH医学人工智能项目资助机制

项目类型项目定位 项目数量 (项)资助金额 (万美元)研究型项目Non-SBIR/STTR RPGs支持研究人员进行独立、具体、定向研究 2785 129945其他研究项目OTHER RESEARCH-RELATED支持研究人员事业发展、会议 543 17603小企业研究与转化项目SBIR-STTR RPGs资助小企业与研究机构之间开展研发与产品化的R&D合作 334 12299院内研究项目INTRAMURAL RESEARCH 237 19931培训、研修基金项目TRAINING院内研究机构开展研究培训、资助有经验研究人员,培养良好的学术背景和研究技能 232 2983研究中心项目RESEARCH CENTERS资助大规模、多学科、合作型医学研究、资源开发、应用及转化,包含核心工具开发、服务及子项目等 133 22096研发合同项目R&D CONTRACTS资助科学研究所需的新产品或技术的研发以及小企业产品转化 39 994其他/未知OTHERS/UNAVAILABLE其他资助机制或数据缺失278 10067

2.3 资助机构分析

NIH的4344个院外资助项目授予了460家机构,其中获得资助项目大于10项的机构有79家,共获得项目资助3338项,占项目总量的76.8%。这79家机构中高校63家、医院9家、研究机构6家、企业1家,可以看出NIH资助开展医学人工智能研究的主要对象是高校。

高校方面,加州大学(系统)获得该领域项目数量最多,占到院外项目总数的8.8%,其他获得项目较多的高校还包括匹兹堡大学、斯坦福大学、哥伦比亚大学、宾夕法尼亚大学等。值得注意的是获得项目数量前10名的高校多为在医学科学或计算机科学方面具有较强实力的高校,进入美国科研类医学排名和计算机科学排名前10的高校各有4家[8]。NIH医学人工智能项目资助高校(Top 10),见表2。

表2 NIH医学人工智能项目资助高校(Top 10)

注:表中标*高校为进入美国科研类医学排名前10的高校,标**高校为进入美国计算机科学排名前10的高校。

资助金额(万美元)1 加州大学**University Of California 381 16201 2 匹兹堡大学University Of Pittsburgh 203 9925 3 斯坦福大学**Stanford University 162 9939 4 哥伦比亚大学*Columbia University 108 6488 5 宾夕法尼亚大学*University of Pennsylvania 108 4787 6 华盛顿大学**University of Washington 95 3244 7 威斯康辛大学University of Wisconsin 92 3856 8 麻省理工学院**Massachusetts Institute of Technology 78 3268 9 密歇根大学University of Michigan 77 2652 10 北卡罗来纳大学University of North Carolina 73 5473排名 机构名称 项目数量(项)

医院和研究机构获得项目数量少于高校,其中麻省总医院获项目数量最多,但也仅占到院外项目总数的1.2%。从表3中进入前10位的医院来看,麻省总医院、梅奥医学中心、克利夫兰医学中心、西达斯西奈医院这4家医院在全美医院排名中位列前10[9]。从研究机构方面来看,NIH资助研究机构开展的医学人工智能项目主要围绕癌症、精神病学等领域开展研究。

此外,NIH还资助了少量企业开展医学人工智能研发,其 中 LAUREATE公 司(Laureate Learning Systems,Inc.)获得项目数量最多,共获得11项资助,资助金额为382万美元。从公司类型和业务范围上看,获资助公司多为研发型小企业,业务范围主要包括生物医学、生物信息学、软件研发和制药研发等。

表3 NIH医学人工智能项目资助医院和研究机构(Top 10)

名资助金额(万美元)1 麻省总医院Massachusetts General Hospital 52 4337 2 布列根与妇女医院Brigham and Women’s Hospital 48 3486 3 德克萨斯大学MD安德森癌症中心University of TX MD Anderson Cancer Center排机构名称 项目数量(项)35 2126 15 832 4 波士顿儿童医院Boston Children’s Hospital 26 892 5 梅奥医学中心Mayo Clinic 24 1293 6 弗莱德哈钦森癌症研究中心Fred Hutchinson Cancer Research Center 19 692 7 克利夫兰医学中心Cleveland Clinic Lerner 17 643 8 西达斯西奈医院Cedars-Sinai Medical Center 15 839 9 斯隆-凯特琳癌症中心Sloan-Kettering Institute for Cancer Research 10纽约州立精神病学中心New York State Psychiatric Institute 14 547

2.4 项目研究方向分析

在NIH资助项目中,人工智能技术被应用于多个研究领域和多种疾病的诊疗研究,通过分析项目资助IC,并对项目支出分类标签进行词频统计和共现聚类分析可以从宏观上了解NIH资助医学人工智能项目的研究方向。

从表4可以看出,国立癌症研究所、国立综合医学研究所、国立医学图书馆、国立精神卫生研究所、国立神经病学与中风研究所等IC资助医学人工智能项目较多,说明人工智能技术较多应用于癌症相关疾病、医学数据处理与信息化、精神疾病和行为科学以及神经性疾病与脑病等领域的研究中。

为了更好地管理和统计资助项目支出,NIH使用文本数据挖掘方式将所资助项目按照研究领域、症状和疾病进行类别划分,邀请行业专家对类别进行定义并确定适合的名称即项目标签词,每个项目可能会被标记多个标签词[10]。通过对项目标签词词频的统计和共现聚类分析,可以揭示NIH资助医学人工智能项目的研究领域、所针对的疾病、症状及其内在联系。从表5可以看出,人工智能技术主要应用于生物工程学、临床研究、网络与信息技术研发、神经科学、遗传学、行为与社会科学等领域,针对的疾病和症状则包括癌症、衰老、神经退行性疾病、罕见病等。

医学人工智能项目标签词的共现聚类网络中节点圆圈大小则表示标签词出现频次,两个节点间的连线表示2个标签词的共现关系,从连线粗细可以看出共现频率的多少,连线越粗表示两词共现次数越多,反之越少。从图2可以

看出,NIH资助项目中人工智能技术的主要应用方向被分成4个聚类,每个聚类里包含多个相关研究领域和一系列疾病和症状,分别是:① 以生物工程、网络和信息技术、基因组学为研究领域,用于癌症、消化疾病、血液病的诊疗以及孤儿药等方面的研究;② 以神经科学、放射诊断为研究领域的针对老年病、神经退行性疾病、阿尔兹海默症、获得性认知障碍等方面的研究;③ 以行为和社会医学、临床实验为研究领域的针对精神性疾病的研究,如抑郁症、药物滥用等;④ 以预防为中心的儿科、患者安全、女性健康、少数民族健康、HIV/AIDS等公共卫生研究。

表4 NIH下设IC资助医学人工智能项目数量

序序号号 资助IC项目数量(项)资助IC 项目数量(项)1 国立癌症研究所 (NCI) 595 15 国立眼科研究所 (NEI) 106 2 国立综合医学研究所 (NIGMS) 552 16 国立糖尿病消化与肾病研究所 (NIDDK) 101 3 国立医学图书馆 (NLM) 496 17 国立酒精滥用与中毒研究所 (NIAAA) 67 4 国立精神卫生研究所 (NIMH) 406 18 国立研究资源中心 (NCRR) 66 5 国立神经病学与中风研究所 (NINDS) 348 19 国立环境卫生研究所 (NIEHS) 66 6 国立心、肺、血液病研究所 (NHLBI) 294 20 国立转化医学中心 (NCATS) 45 7 国立老化研究所 (NIA) 250 21 国立口腔与颅面研究所 (NIDCR) 38 8 国立人类基因组研究所 (NHGRI) 207 22 国立关节肌肉骨骼及皮肤病研究所(NIAMS)34 9 院长办公室 (OD) 203 23 国立护理医学研究所 (NINR) 32 10 国立生物医学影像学与生物工程学研究所 (NIBIB) 180 24 信息技术中心 (CIT) 25 11 国立药物滥用研究所 (NIDA) 178 25 国立补充与替代医学研究中心 (NCCIH) 17 12 国立儿童健康与人类发育研究所 (NICHD) 170 26 国立少数民族健康与健康水平差别研究中心(NIMHD)14 13 国立变态反应与感染性疾病研究所 (NIAID) 139 27 国际中心 (FIC) 4 14 国立耳聋与其他交流障碍性疾病研究所 (NIDCD) 119

表5 NIH资助医学人工智能项目高频标签词(频次>50)

序号 标签名称 频次 (次) 序号 标签名称 频次 (次)1 Bioengineering 1454 31 Women’s Health 128 2 Clinical Research 1420 32 Digestive Diseases 123 3 Networking and Information Technology R&D 1048 33 Alzheimer 117 4 Neurosciences 887 34 Lung 117 5 Genetics 836 35 Drug Abuse 110 6 Behavioral and Social Science 690 36 Breast Cancer 99 7 Brain Disorders 660 37 Mental Illness 96 8 Prevention 643 38 Dementia 95 9 Cancer 559 39 Assistive Technology 95 10 Human Genome 545 40 Emerging Infectious Diseases 89 11 Biotechnology 538 41 Eye Disease and Disorders of Vision 82 12 Mental Health 410 42 Cancer Genomics 80 13 Aging 316 43 Nutrition 77 14 Pediatric 314 44 Serious Mental Illness 77 15 Neurodegenerative 253 45 Acquired Cognitive Impairment 76 16 Diagnostic Radiology 239 46 Depression 75 17 Rare Diseases 228 47 Orphan Drug 69 18 Biomedical Imaging 222 48 Urologic Diseases 68 19 Infectious Diseases 199 49 Stem Cell Research 67 20 Cardiovascular 184 50 Mind and Body 63 21 Substance Abuse 178 51 Hematology 60 22 Patient Safety 177 52 Brain Cancer 60 23 Minority Health 174 53 Chronic Pain 59 24 Health Disparities 171 54 Autoimmune Disease 58 25 Heart Disease 171 55 Pain Research 57 26 Precision Medicine 165 56 Tobacco 54 27 Health Services 160 57 HIV/AIDS 52 28 Injury 142 58 Obesity 51 29 Rehabilitation 134 59 Dental/Oral and Craniofacial Disease 51 30 Clinical Trials 130

图2 NIH资助人工智能项目支出分类标签词的共现聚类网络图

3 总结与讨论

美国人工智能在医学上的研究与应用相对开展较早,且在近5年中项目资助力度明显增加。此外,美国在该领域研究范围较为宽泛,既有癌症、神经类疾病、老年病等领域的基础研究,也有相关领域基础设施建设和工具、服务的开发等,逐渐形成较为完整的研究资助体系。美国食品药品监督管理局对推动人工智能产品的上市持积极态度,一系列针对人工智能医疗器械软件的审评审批政策陆续出台[11]。截至2018年底,已有多项产品通过上市前审批、上市前通知和从头开始通道获得审批上市,市场空间巨大[12-13]

中国医学人工智能研究起步较晚,即使是发展较为成熟且获得市场资金投入最多的人工智能辅助医学影像诊断,例如用于糖尿病视网膜病变识别、筛查与分期软件、肺结节筛查软件等大多也仍处于医院试用阶段,尚没有相关产品上市[14-15]。但近几年来,医学人工智技术不仅受到资本热捧,也得到国家相关科技管理部门的重视,研发投入力度增加。在2019年国家自然科学基金项目指南中,生命科学部中增加了生物仿生与人工智能的申请方向(申请代码:C1005),国家重点研发计划“数字诊疗装备研发”试点专项2019年项目申报指南中也提出要支持新型医用人工智能前沿技术创新,并具体提出新型人工智能算法及其介入外科手术规划应用研究、新型人工智能算法及其神经退行性疾病应用研究、新型人工智能算法及其专科影像系统应用研究以及新型人工智能算法及其病理诊断应用研究4个研究方向[16-17]。我国医学人工智能领域在学科发展、人才培养、制度建设与管理等方面仍有待完善,需要行政管理、科研、临床和企业多方面配合,以提高相关领域研究理论方法水平以及临床转化与产品化效率,用好我国大数据资源,真正使疾病诊疗更加高效。

[参考文献]

[1] 苗芳芳,刘骏峰.论人工智能的发展及其在医学领域的应用前景[J].卫生软科学,2009,23(2):222-224.

[2] 严律南.人工智能在医学领域应用的现状与展望[J].中国普外基础与临床杂志,2018,25(5):7-8.

[3] 严舒,汪楠,贾晓峰.美国国家医学科研项目管理特点分析[J].科技管理研究,2016,36(5):172-175.

[4] NIH.Institutes, Centers, and Offices[EB/OL].(2018-8-19)[2019-7-1].https://www.nih.gov/institutes-nih/list-nih-institutescenters-offices.

[5] NIH.Budget[EB/OL].(2019-1-24)[2019-7-1].https://www.nih.gov/about-nih/what-we-do/budget.

[6] Boyack KW,Chen MC,Chacko G.Characterization of the peer review network at the center for scientific review, national institutes of health. bornmannl[J].PLos One,2014,9(8):e104244.

[7] NIH.Annual Snapshot-FY 2018 By the Numbers[EB/OL].(2019-3-13)[2019-7-2].https://nexus.od.nih.gov/all/2019/03/13/nih-annual-snapshot-fy-2018-by-the-numbers.

[8] U.S.News.Best Medical Schools: Research[EB/OL].[2019-7-16].https://www.usnews.com/best-graduate-schools/topmedical-schools/research-rankings.

[9] U.S.News.2018-19 best hospitals honor roll and medical specialties rankings[EB/OL].(2018-8-14)[2019-7-16].https://health.usnews.com/health-care/best-hospitals/articles/besthospitals-honor-roll-and-overview.

[10] NIH.Categorization Process[EB/OL].[2019-7-2].https://report.nih.gov/rcdc/process.aspx.

[11] FDA.Artificial intelligence and machine learning in software as a medical[EB/OL].(2019-4-2)[2019-7-23].https://www.fda.gov/medical-devices/software-medical-device-samd/artificialintelligence-and-machine-learning-software-medical-device.

[12] Allen B.The role of the FDA in ensuring the safety and efficacy of artificial intelligence software and devices[J].J Am Coll Radiol,2019,16(2):208-210.

[13] Harrington SG,Johnson MK.The FDA and artificial intelligence in radiology: Defining new boundaries[J].J Am Coll Radiol,2018.

[14] 李娅雯,刘国红.医学智能影像的应用前景与发展困境综述[J].中国医疗设备,2019,34(3):164-167.

[15] 孟祥峰,王浩,王权,等.影像类人工智能医疗器械评价方法研究[J].中国医疗设备,2018,33(12):14-17.

[16] 国家自然科学基金委员会.2019项目指南[EB/OL].(2018-12-29)[2019-7-2].http://www.nsfc.gov.cn/nsfc/cen/xmzn/2019xmzn/15/index.html.

[17] 科技部.“数字诊疗装备研发”试点专项2019年度项目申报指南[EB/OL].(2019-5-16)[2019-7-2].http://www.most.gov.cn/mostinfo/xinxifenlei/fgzc/gfxwj/gfxwj2019/201905/W020190524598370622345.pdf.

Analysis on the Development Situation and Trend of American Medical Artificial Intelligence Based on NIH Project

YAN Shu, CHEN Juan, OUYANG Zhaolian
Institute of Medical Information & Library, Chinese Academy of Medical Sciences and Peking Union Medical College,Department of Strategic Intelligence Research on Medical Device and Drug, Beijing 100020, China

Abstract: In recent years, the application of artificial intelligence in medical research has deepened, the United States has been at the forefront of the world in this area. This study conducted statistical and cluster analysis of the number, amount, funded institutions, funding mechanisms, and expenditure classification labels of the National Institutes of Health funded medical artificial intelligence projects. Results showed that the number and amount of medical artificial intelligence projects in the United States had been growth periodically and increased rapidly in the past five years. The projects were mainly research-based projects, along with some application projects and projects focus on productization. Among these projects, bioengineering, clinical research, network information technology, neuroscience, genetics, cancer, ageing were the common research topics using artificial intelligence technology. This paper revealed the development situation, trend and main application field of medical researches applying artificial intelligence technology in the United States in order to provide reference for the construction of medical artificial intelligence funding system and support medical researches applying artificial intelligence in China.

Key words: artificial intelligence; medical artificial intelligence; cluster analysis; co-occurrence cluster network

[中图分类号] R319

[文献标识码] A

doi:10.3969/j.issn.1674-1633.2019.12.025

[文章编号] 1674-1633(2019)12-0101-05

收稿日期:2019-09-09

基金项目:国家重点研发计划项目(2016YFC0104805)。

通信作者:欧阳昭连,副研究员,主要研究方向为医疗器械情报研究。

通信作者邮箱:zoeouyang@163.com