医院信息化运维整体解决方案探讨引言医院信息化的发展经历了从最早HIS、收费、电子医嘱、非结构化电子医护文书的基础应用阶段,到中期各财经管理系统、各医护技系统、结构化电子病历的广泛使用阶段,到近期物联网、集成平台和数据挖掘分析的深度运用阶段[1],其中,医疗信息系统的深度应用为医院的发展提供了良好的基础。 数字化医院发展将重心放在了系统的建设上,忽视了医院系统的剧增给运维管理带来的压力。像这种“重建设,轻运维”的现象普遍发生在各个医院。信息化部门将重心放在系统建设上,势必忽视运维团队管理和运维方案的研究。 在信息系统生命周期中的论证、建设、运维和消亡四个阶段中,运维占信息系统整个生命周期80%以上。因此,医院信息部门最主要的工作之一就是信息化运维,一套行之有效的运维整体解决方案也成为各个医院信息部门的共同研究对象。所以,研究一套科学的运维整体解决方案可以促进信息化团队的运维能力和运维效率,使医院信息化系统的稳定、安全、高效运行得以保障。 1 方法1.1 运维管理介绍一般三级医院信息系统的数量大都多达百种以上,根据信息系统的服务人群划分,主要可划分为面向医护工作类、面向患者服务类、面向医院管理类。 其中,面向医疗工作类的信息系统主要有HIS及各子系统、检验、PACS、移动医护、心电、手术麻醉、病理、EMR、CDR、急诊和院前急救等系统,面向患者服务类的信息系统主要有院区自助服务系统、互联网端和手机端等各种查询系统,面向医院管理类的信息系统主要有成本核算、经济管理、医疗废物管理、合理用药监测、毒麻药品监控、医院感染监控、决策支持、弱电智能管理等系统。这些系统以医院内部医疗业务局域网和服务器为平台,辅以一定的安全设备构成软硬一体的医院信息化服务综合平台,为临床、医药技、管理部门和病人提供信息化应用和服务。 信息化运维就是对整个平台内的所有信息化组成要素(计算机终端、外设、服务器端、基础网络及各应用系统)施以管理和技术手段,使整个平台得以稳定、安全、高效运行。 1.1.1 运维管理的技术难点 平台上的这些系统通常来源于多个不同的软件厂商,以HIS为核心,系统与系统之间有的存在孤岛[2]关系,有的存在纵向关系,有的存在横向关系,有的甚至存在网状关系(一个系统与多个系统之间有业务逻辑关系),拓扑关系错综复杂。 医院信息系统的多样性、多源性导致了医院信息化运维的复杂性,加之缺乏统筹规划和行之有效的整体运维解决方案,迫使运维人员疲于应对已经发生和正在发生的错误。多数医院的信息化运维都处于常态化的 “四处救火”被动状态[3]。 比如,运维工程师碰到某个问题后,只根据发生的具体问题给予解决,并没有对同类型的问题找出根源并给予消除隐患。在存在网状关系型的系统中,因为问题的处置不当,解决某个问题后,引起了另外一个系统其他问题的发生。于是,运维工程师们陷入了无休止的排错性维护中。 现实中,虽然有的医院采用各系统运维服务外包[4]模式来减轻运维工作量和风险,但是服务供应商为了保证运维服务外包的延续性,经常对问题的原因或诱因加以隐瞒并对其解决方法采取技术封锁。这种现象不仅增加了医院信息化运维的成本,而且可能出现各系统外包运维人员互相推诿责任,甚至可能因外包服务器人员直接操作核心服务器而导致医院医疗数据外泄的情况发生。 1.1.2 运维的主要对象和内容 大部分人对医院信息化运维的理解仍停留在计算机终端的维修上,对网络运维、业务系统运维、服务器运维、数据库运维的认知都处于空白或缺失状态。其实任何信息系统在任何阶段都离不开基础网络、数据中心(服务器)、应用服务和终端四大传统组件。因此也确定了信息化运维的主要对象:网络方面主要有基础物理网络和路由交换配置,数据中心方面主要有数据中心机房和备份容灾设备,应用服务方面主要有操作系统、数据库、应用服务、安全防护配置和各业务应用系统,终端方面主要有计算机终端、外设、打印机、服务器、交换机、UPS、存储等。 信息化运维的主要内容是对医院信息系统的组成对象进行排错性维护、耦合性[5]维护、完善性维护和预防性维护。通俗地讲,就是对硬件进行养护和维修维护,对网络、应用系统、业务服务、数据库进行状态实时监控,对应用系统的兼容性和可用性进行修改、完善和预防。从维护的能动性上,排错性维护和耦合性维护属于被动维护,完善性维护和预防性维护属于主动维护。 1.1.3 目标 信息化运维的主要目标是在合理的组织结构下,依计划有序地按照既定的规范和标准流程对正在建设和建设完成的信息系统进行维护,使各个系统从排错性维护和耦合性维护顺利过渡到完善性维护和预防性维护直至系统的消亡。 一般情况下,运维人员在系统建设后转运维初期,基本以排错性维护和耦合性维护为主,在运维过程中,应该对排错性和耦合性维护进行总结分析,提高排错性和耦合性维护的效率。中后期主要以完善性维护和预防性维护为主,将主要精力花费在完善性和预防性维护上。对于运维团队来说,越早进入完善性和预防性维护阶段,将被动运维转为主动运维,越能体现运维团队的运维效率。运维的最终目标就是通过运维的良性循环,在全局上实现医院整个信息化平台各系统的稳定、安全、高效运行。 1.2 解决方案医院信息系统是否能稳定、安全、高效地运行,除建设期各系统的选型外,信息运维团队的有序、高效、精准、预防运维起着至关重要的作用。信息运维部门只有搭建一套科学、规范、高效的运维整体保障体系,才能实现医院信息系统稳定、安全、高效地运行。当然,选择一套与团队运维思想契合度较高的运维软件[6-8],可以协助运维团队从组织机构、制度、台账、流程、统计分析方面进行高效运维。 1.2.1 合理的组织机构 医院信息化运维团队应由信息科科长直接领导,或者团队负责人由信息科科长直接担任。运维团队建议根据业务种类编制四个运维专业小组,分别是终端及外设运维小组、网络运维小组和业务系统运维小组、数据中心运维小组,每个小组编制3~4人较为合理[9]。部分医院因为工程师人力资源不足,可以取消或缩小终端及外设运维小组的编制人数,将终端及外设的运维服务实行服务外包。 如图1所示,信息化运维团队应设定运维值班坐席(窗口),承接医院所有信息化需求和问题。每日值班坐席人员从四个运维专业小组成员中抽调轮流担任,由值班坐席进行当日事务的统一接收、运维统筹、事件分类、任务指派、事件跟踪、用户反馈和事件小结。 图1 组织结构图 运维团队以“值班坐席”为核心,忙时接收并处理“值班坐席”派发的排错性维护和耦合性维护任务,闲时主要进行完善性维护和预防性维护的阶段性攻关工作。 1.2.2 健全的制度和科学的模式 应建立健全的运维管理制度以实现对整个运维团队、各运维小组和各运维人员的考核和奖惩机制[10]。 运维相关的核心制度主要包括:值班坐席管理制度、值班交接班制度、运维目标管理制度、责任和奖惩制度、运维管理制度、安全管理制度、数据备份与恢复管理制度、数据中心机房运行管理制度、网络安全(及其他各方面)巡检管理制度和应急预案演练管理制度等。 其中,值班坐席管理制度对事件主要有两种管理模式,一是首问负责制[11],二是值班总负责制。 首问负责制指的是:谁值班,谁受理的问题,谁追踪到底。这种模式能提高单事件的处理效率,但如果上一工作日值班事件没有处理完毕,上一工作日值班员在交接班后进入常规工作岗位后还得持续跟踪未完成事件,影响工程师常规工作的工作效率。 值班总负责制指的是:谁值班,谁负责跟踪该事件直至事件完结,上一工作日值班人员将未完成事件交给下一工作日值班人员后,不再对事件进行持续跟踪。这种模式能提高值班员的当班处理效率,减少其他小组成员运维压力,但对事件交接的完整度要求较高。 如图2所示,两种模式各有利有弊,应根据各医院的实际情况选用,建议运维团队在初级阶段或者信息化工程师人员较少的情况下执行首问负责制,在团队的稳定期执行值班总负责制。 图2 值班模式及流程图 1.3 值班运维综合管理系统1.3.1 建立资产台账 建立资产台账并对资产台账进行有效管理是提高运维效率的基础。运维团队应实现台账信息档案的电子化和集中化管理并交付给运维人员使用[12]。 台账信息包含各种软硬件和系统的资产信息,主要包括通用IT设备(电脑、打印机、其他外设)资产台账、软件资产台账、网络拓扑资产台账、供应商目录、零配件目录、业务逻辑拓扑、系统与系统的关系拓扑等(见图3)。运维团队应在运维过程中,建立各种台账目录供值班坐席和团队成员共享使用(见图4),以实现运维的精准高效。 运维团队应该在日常运维中,应对资产台账进行索引化、一致性管理。特别注意的是,台账信息在运维过程中会发生信息变更,运维人员应及时实行对变更信息进行同步,且变更信息应经过双人以上的确认(如图4所示),并于团队交班时公布更变内容。一般情况下,建议实施一套运维服务系统以支撑运维的信息共享。 图3 资产管理流程 图4 医院IT设备台账管理(变更、盘点) 1.3.2 合理的事件分类 根据运维的对象和业务类型对运维事件进行分类,可以协助值班坐席更好地对事件进行精准任务指派。在实际的运维中,可根据事件发生的频率对事件分类进行逐渐细化或整合,将高频的事件进行类型细分,将低频的事件进行类型整合。以便为将来运维的统计分析提供合理的、细粒度的运维生产数据。 1.3.3 运维知识库应用 运维知识库就是运维事件处置记录的集合,应该对每一个事件进行详细的记录和有效的总结[13]。当然,高频次事件可以调用既往的事件总结陈词,低频次事件应尽量对单次事件进行个性化总结,并在团队交接班中给予宣讲[14]。 知识库是一个运维团队最宝贵的财富,知识库的数量和质量可以从侧面体现一个运维团队的运维效率、运维质量和运维实力。 1.3.4 事件标准化处理流程和事件闭环 信息化运维过程中总会出现高频次和低频次事件。当运维团队发现某种事件的发生频次较高并且达到一定的阀值后,就应当对该事件进行完善性维护或事务标准化处理。经过分析,如果这一类事件可以通过完善性维护消除,就应当组织力量消除该事件的发生;如果无法通过完善性维护进行消除,则应该制定标准化处置流程以保证同类事件的处置质量(见图5)。 图5 事件描述模板 运维事件的闭环指的是对每件事件都进行事件反馈、总结和分析。通过运维事件的闭环管理[15-16],提升终端用户对运维事件满意度,从整体上提升信息化运维的质量。 2 结果通过对信息化运维整体解决方法的运用,运维团队的素质也得到了整体的提升,间接促使医院在信息化运维效率和运维质量上得到了“质”的提升,最终使医院的运维进入良性循环的运行状态。 运维事件的主要要素有事件主题、发生时间、处理对象、故障节点位置、各种处置时间节点、处理人员、处理方法、处置结果、处置结论等。值班坐席人员在日常的值班过程中应对上述要素进行真实、详细、完整的记录[17]。 运维数据的统计分析[18]运维产生的数据投入到生产运维(主动运维)中。详细完整的生产记录可以为将来阶段性的分析提供宝贵的原始数据。运维团队可以利用统计学对生产数据进行事件完成率分析、周分析(见图6~8)、月度分析、季度和年度分析总结。当运维记录达到一定时长和数量后,还可以对运维数据进行同比和环比分析比较[19]。 图6 30 d事件完成率饼状图 图7 1周事件汇总 图8 分类事件数量曲线图(20 d) 通过分析通常可以得到以下的决策或依据: (1)将大概率事件进行类型细分,将小概率事件进行类型整合。 (2)预判某些小概率事件的发生,以提前做好技术和资源储备,实际案例见图9。 (3)对某些无法通过完善性运维的消除大概率事件,制定标准化的处置流程。 (4)制定下一阶段运维团队预防性维护的方向[20]。 (5)提供运维小组和个人考核和奖惩依据。 (6)总结近阶段运维效果,提出下阶段运维目标。 (7)为医院的信息化建设提供决策建议。 图9 我院信息科2018年第二季度值班总结报告(摘选) 通过合理分析既往事件记录,可以协助运维团队从排错性维护和耦合性维护向完善性维护和预防性维护进阶;通过不断进阶的分析研究,可以促使运维团队从纯粹的事务处理型向科学研究型转型;通过由浅入深的分析和不断的决策产出,可以促使信息化运维团队整体实力和医院信息化整体水平提升一个新的高度。 3 讨论通过对运维对象的分类、内容的梳理、方法的改进,总结出一套适合医院信息化运维的整体解决方案,可以把原本杂乱的运维事务、粗犷的运维方法、混乱的运维状态,分别变得有序、精细、平稳,使运维方法论得到信息从业者的重视。 运维团队从一开始就应该扭转等待“排错性维护”和“耦合性维护”的观念,把完善性维护和预防性维护这两种主动运维作为运维重心,因此信息化运维融入项目管理的思维[21]和方法就显得尤为重要。在日常运维中,应把范围、进度、质量、成本、风险等项目管理要素与运维工作互相结合[22]。特别是在运维质量管控上,运用PDCA[23]循环思想,利用循序渐进的自我分析、自我纠察、自我纠正等方法,不断对运维事件的处理流程进行PDCA[即计划(Plan)、执行(Do)、检查(Check)、处理(Act)]优化。 现在大部分医院已经完成第二阶段(中期的财务管理、成本核算、绩效考核、各医护技系统、结构化电子病历的广泛使用阶段)信息化建设,随着物联网技术的普及,医院信息化建设马上进入第三阶段(物联网、集成平台和数据挖掘分析的深度运用阶段)的迭代建设。对运维团队来讲,现阶段除了保障医院信息系统的运行外,还可以通过对历史运维数据的统计分析,为第三阶段的建设调研和系统选型提供重要的参考依据,使运维的重要性达到质的飞跃,使运维意义得到升华。 4 结论医院信息化运维工作是一项集网络技术、计算机应用、多媒体、软件工程、统计学、信息系统项目管理等多学科融合的综合性工作。医院信息化的运维工作虽然非常复杂,但是经过建立一套科学、规范、高效的运维保障体系,可以保障医院信息系统稳定、安全、高效运行,辅以实现医院的高效运作。 [1] 王立波,王季,田甜,等.浅谈我国医院信息化现状和发展趋势[J].吉林医学,2013,34(1):195-198. [2] 陈广晶.打破信息孤岛才能释放医疗大数据红利[J].首都食品与医药,2017,(5):38-39. [3] 李晶晶,李新建.医院信息化建设存在问题及建议[J].科技风,2012,(16):246. [4] 鲍瀛,陈平,殷伟东,等.医院IT服务外包的探讨[J].中国数字医学,2015,10(12):92-94. [5] 顾爱华,周晓峰,李宗花,等.关于面向对象的软件耦合性度量方法设计[J].计算机仿真,2017,34(11):296-299. [6] 马健,闫丽.医院IT运维管理系统的设计与实现[J].中国数字医学,2019,14(1):111-113. [7] 王少伟,杨红玉,刘同波.医院信息中心值班管理系统的设计与实现[J].中国数字医学,2017,12(3):58-59. [8] 潘大钊,张鑫,徐晓霞.医院信息科运维系统设计与实现[J].中国数字医学,2016,11(5):67-69. [9] 董伊晖,琚文胜,单既桢,等.医疗机构卫生信息技术(HIT)人力资源配置研究[J].中国卫生信息管理杂志,2009(2):47-51. [10] 方来英,桑国卫.关于现代医院管理制度的几个观点[J].中华医院管理杂志,2017,33(11):801-804. [11] 李玉珍,张斌.医疗纠纷投诉处理中“首问负责制”效果分析[J].现代医院,2017,17(1):21-23. [12] 熊光星,郭中凯,贾红岩,等.基层医院机动卫勤分队医疗装备全寿命管理的初步探讨[J].医疗卫生装备,2016,37(4):149-151. [13] 陈文迪,程学林,黄智勇.基于微信企业号的医院IT运维管理服务系统的分析与设计[J].中国数字医学,2016,11(11):83-85. [14] 张秀梅,徐建武,程焺华,等.基于知识库的临床决策支持系统的构建[J].中华医院管理杂志,2014,30(6):472-476. [15] 修燕,杨圆圆.基于信息系统的临床用药闭环管理[J].中国卫生质量管理,2018,25(2):74-76. [16] 王忠庆,邵尉,田新平,等.检验标本闭环管理系统的设计与实现[J].中国医疗设备,2015,30(7):134-136. [17] 李萍.医疗数据质量问题探索和解决模式[J].计算机应用与软件,2013,30(8):217-219. [18] 安杰.医院卫生数据信息统计及分析利用[J].内蒙古中医药,2012,31(3):168-169. [19] 杨明,李文方,赵小辉,等.医院信息统计与数据挖掘技术的应用[J].医疗装备,2016,29(21):203-204. [20] 白兴科,刘建,钟文等.浅谈信息化预防性运维的重要性[J].网络安全技术与应用,2017,(3):9-11. [21] 王新.项目管理在医院信息化建设中的必要性浅析[J].中国医疗设备,2008,23(9):72-73. [22] 魏晓艳,吾尔叶提·卡德尔,玛力娅·阿布力孜,等.项目管理在我院信息中心的应用[J].中国医疗设备,2016,31(1):171-174. [23] 张永,陈宏文,崔飞易,等.应用PDCA方法提升医疗设备维修质量水平[J].中国医疗设备,2016,31(8):131-133. Discussion on Overall Solution of Hospital Informatization Operation and Maintenance |