基于数据仓库的医院决策支持系统的构建
【关键词】 基于数据仓库的决策
随着商品的,医院间的竞争也日益加剧,越来越多的医院认识到正确及时的决策是医院生存和发展的关键所在。因此,充分利用信息科技技术,自动快速获取有用的决策信息,为医院提供快速、准确的决策支持,已成为大多数成功医院的共识。在医疗信息技术悄速发展的今天,大部分医院已广泛使用医院信息管理系统。由于该系统大部分都是事务处理型的,数据的组织和存储均是围绕事务处理进行的,这样的数据组织方式不利于大量的数据分析和处理,难以提供有效的决策支持信息。随着数据库技术的发展,出现了以支持决策为目的的数据仓库技术。
1数据仓库的特点
1.1数据仓库的概念数据仓库(Data warehouse)是从多个数据源收集数据,存储于一个统一的数据模式下的数据体。数据仓库技术从本质上讲,是一种信息集成技术。数据仓库从多个信息源中获取原始数据,经整理加工后,存储在数据仓库的内部数据库中,通过向用户提供访问工具,向数据仓库的用户提供统一、协调和集成的信息环境,支持医疗机构全局的决策过程和对医疗机构经营管理的深入综合分析。
1.2数据仓库的层次数据仓库的总体层次结构由基本功能层、管理层和环境支持层三部分组成。基本功能层包括从数据源抽取数据,对所抽取的数据进行筛选、清理,将清理后的数据加载到数据仓库中,根据用户的需求完成数据仓库的复杂查询、决策分析和知识的挖掘等功能;管理层包含数据管理与元数据管理两部分,主要负责对数据仓库中数据的抽取、清理、加载、更新和刷新等操作进行管理,只要使这些操作正常完成,才能源源不断地为数据仓库提供新的数据源,为使用者正确利用数据仓库进行决策分析和知识挖掘;环境支持层主要包含数据传输和数据仓库基础两大部分,包括协议、网络操作系统、数据存贮系统等。
1.3数据仓库的结构整个数据仓库系统的体系结构可以划分为数据源、后端工具、数据集市、前端工具等4个层次,见图1。数据源是数据仓库系统的基础,数据集市是整个数据仓库系统的核心,是数据仓库的关键。前端工具主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。
图1 数据仓库系统的体系结构(略)
2医院数据仓库的设计与建立
2.1建立数据源一般医院都有自己的关系型数据、应用程序包、外部数 据、逗留数据等各种资料信息,数据源较丰富。经过筛选,所需数据可以在医院信息系统的数据库以下表中得到:病人住院主记录、病人主索引、诊断记录、科室字典、病人身份字典、病人性别字典、费用类别字典、入院方式字典、入院病情字典、出院方式字典、结果字典等等。我们在Warehouse Build-er中将上面的表导入,作为数据仓库的数据源。
2.2设计数据仓库常用的数据库建模方式有两种:关系数据库和多维数据库。在信息系统中我们采用关系数据库进行建模,而数据仓库则采用多维数据库模型中的星型模型进行建模。根据主题中涉及到的决策需求,对数据进行初步整理,设计了住院病人费用事实表和相关的10个维表。住院病人费用事实表收集有关病人费用的各种信息,包含15个度量值:西药费、中药费、中草药费、麻醉费、床位费、输血费、膳食费、检查费、化验费、材料费、护理费、手术费、费、其他费用以及总费等。 度量值是用于进行分析的数值型信息,主要用于求和、平均值、百分比等函数。维表分别是病人身份、入院方式、入院病情、出院方式、治疗结果、费用类别、病人性别、住院科室、时间(包括入院时间和出院时间)等,它们可以从医院信息系统的数据库中抽取有效数据。每个维又可设多个级别:本模型中时间维有四个级别即年、季、月、日,住院科室维有两个级别即科室和病房。每个级别又可设多个属性,如科室级别有科室名、科室临床属性、科室门诊住院标志、内外科标志等属性,月级别有月名、年中第几月、季度中第几月、月最后一天日期等属性。根据需要设置每个属性的类型及长度。图2 数据仓库的构建
2.3设计映射与转换模型映射是按业务需求从数据源(医院信息系统)中抽取数据仓库所需要的数据,然后把抽取出来的数据转换为数据仓库要求的统一格式,最后将数据按数据结构类型装载到医院数据仓库中。
2.4部署及运行映射部署包括两个步骤:部署系统和生成代码。当代码都生成并存进数据库后,就可以运行它们。医院数据仓库的维表和事实表已经包含了所有待分析处理的数据,此时以住院病人医疗费用为主题的医院数据仓库已构建好。
3医院数据仓库的主要功能
3.1病人构成分析分析医院门诊、住院病人的各种构成,如病人的来源分布、职业分布、身份分布、年龄分布等,以便能够有针对性地采取一些措施来提高服务质量。
3.2病人就诊时间分析分析门诊病人从挂号到离院各就医环节的时间分布,分析出病人的就诊瓶颈,以便针对这些瓶颈采取措施,减少病人 的排队时间,提高病人的就诊质量。
3.3病人费用构成分析病人费用由药品、检查、治疗、化验、手术等组成,该功能分析医院、科室乃至每个医生的病人费用构成,如发现药品比例过高,可以层层分析到哪个科室、哪位医生甚至哪个药品导致药品比例过高,从而能有针对性地控制药品比例。
3.4同期费用对比分析对医院或科室同期的各种费用进行对比分析,找出医院收入增加或减少的原因,也可以把费用与门诊量或收容量进行对比分析,发现医院收入增加或减少的原因。对单病种进行分析,包括对单病种的费用、住院天数、治疗方案等进行分析,以便及时经验,找出最佳的治疗方法,减轻病人负担的同时医院也增加了效益。
3.5成本效益分析把各个不同系统,如信息系统、财务系统等的数据汇总到数据仓库,然后对医院的成本效益进行全面分析,以便真正把握医院的经营状况。数据仓库是以数据库技术作为存储数据和管理资源的基本手段,以统计分析技术作为分析数据和提取信息的有效方法,以人工智能技术作为挖掘知识和发现的途径。因此,它是诸多学科相互结合、综合应用的技术。本研究针对医院信息化建设中存在的主要问题,提出了医院管理信息的数据仓库实施方案。在实际应用中,该数据仓库能很好地解决多数据源问题、数据的不一致等问题,充分利用各类数据,为医院领导作出正确的决策提供全方位的信息服务。随着医院的,数据仓库决策支持系统必将在医院的管理和决策中起到越来越重要的作用。
【】
1 冯嵩,杨路明.数据仓库在医院信息决策系统中的应用.电脑知识与技术,2006,3~10.
2 刘佳,兰顺勇,张晓祥,等.数据仓库与数据挖掘在医院管理中的应用.医学与社会,2006,19(10):53~56.
3 张宏生,沈可.基于数据仓库的科研信息系统研究初探.数理医药学杂志,2005,3(18):283.