1、2022年8月2日星期二医院数据仓库案例医院数据仓库案例内容大纲内容大纲实例介绍实例介绍1体系结构体系结构2模型构建模型构建3 3数据仓库实现数据仓库实现4 4联机分析处理联机分析处理3 5医院数据仓库应用医院数据仓库应用4 6实例介绍实例介绍v医院信息系统医院信息系统(Hospital Information System)HIS是迄今为止最为复杂的企业级信息系统之一。HIS将医院病人就诊的所有科室和医院的职能科室等各个环节有机的连为一个整体,处理医疗事务和管理业务,完成医疗、业务数据的整理和分析。HIS用于医院各类资源信息的系统整合,以提高医院的事务处理水平。实例介绍实例介绍潜在信息提取优
2、化大量数据HIS在操作型数据库上积累了大量的业务数据,数据项繁杂。收集的海量数据往往被沉淀,变成了难以利用的数据档案。如何快速、准确地从这些数据中提取信息,以便降低成本、优化就诊流程和提高医院工作效率,已成为数字化医院建设的内在原动力。激增的数据资源背后隐藏着许多重要的、有价值的信息。实例介绍实例介绍解决HIS中存在的“数据丰富,但信息贫乏”的实际情况。提高利用水平,满足医院管理需要。反映出大量数据之间的关系与差异。对HIS中产生的海量数据进行科学的分析处理。实例介绍实例介绍vHIS功能结构功能结构 按照HIS功能的特点,HIS可划为以财务为核心的医院管理信 息系统和以病人为中心的临床信息系统
3、。医院信息系统(HIS)门诊管理急诊管理住院管理药品管理病案管理门诊诊疗急诊诊疗住院诊疗财务管理医务管理行政管理查询统计远程医疗医学影像存档与通信系统(PACS)实验室信息系统(LIS)放射信息系统(RIS)HIS功能结构图功能结构图内容大纲内容大纲实例介绍实例介绍1体系结构体系结构2模型构建模型构建3 3数据仓库实现数据仓库实现4 4联机分析处理联机分析处理3 5医院数据仓库应用医院数据仓库应用4 6体系结构体系结构v基于基于HIS的医院数据仓库体系结构的医院数据仓库体系结构 医院数据仓库建设中存在一个关键的争论就是如何规划数据仓库的结构。一种观点认为应该采用“自顶向下”的整体方法,一次性地
4、创建整个数据仓库。这种方法不适应中国的医疗界现状。大多数医院并没有配置完整的IT系统,无法一次性完成整体创建。此外,这种方式也无法适应未来的业务调整。另一种是“自底向上”的观点,认为可将各种无关的、迥异的数据集市装配成企业级数据仓库。这种方法比较适合医院目前的现状。体系结构体系结构v基于基于HIS的医院数据仓库体系结构的医院数据仓库体系结构 医院数据仓库涉及到HIS中业务数据的抽取、转换、装载、数据存取、元数据管理、查询、报表、分析工具和相应的开发方法。体系结构体系结构v基于基于HIS的医院数据仓库体系结构的医院数据仓库体系结构医院数据仓库体系结构医院数据仓库体系结构门诊管理系统药房管理系统住
5、院管理系统数据抽取、净化、载入元数据客户端数据展现客户端分析报表和报告客户端信息发布ETL过程数据质量检查调度控制日志出错处理回溯数据文件交换PDM数据仓库监控运行管理备份与恢复元数据管理内容大纲内容大纲实例介绍实例介绍1体系结构体系结构2模型构建模型构建3 3数据仓库实现数据仓库实现4 4联机分析处理联机分析处理3 5医院数据仓库应用医院数据仓库应用4 6模型构建模型构建v多维数据模型多维数据模型 多维数据模型(又称数据立方体)是数据的集合,并将这些数据组织、汇总到一个由一组维度和度量值所定义的多维结构中,使得用户可以从不同的角度(维度)、通过不同的度量值来观察分析所关心的事实数据,逐步摆脱
6、了对固定报表的依赖。例如,在分析医院门诊量情况时,决策者感兴趣的对象有时间、科室、职业和门诊量,可以把时间、科室和职业作为维,门诊量作为度量。这样,决策者可以了解某科室某时间段某职业病人的门诊人次。模型构建模型构建v主题域分析主题域分析 医院数据仓库可面向多种主题,进行多方面开发。确定HIS中哪些数据对决策有帮助的关键是进行主题域分析。根据主题域确定业务主题和维度。模型构建模型构建病人构成病人构成分布分布时间维时间维地区维地区维职业维职业维年龄维年龄维性别维性别维v主题域分析(病人构成分布主题)主题域分析(病人构成分布主题)疾病维疾病维模型构建模型构建v主题域分析主题域分析主题域主题域业务主题
7、业务主题维度维度病人治疗方案时间、科室、医生、医嘱、处方、治疗效果等病人分布 时间、科室、地区、职业、年龄、性别等账单门诊账单时间、科室、病人身份、费用类别、病人来源等住院账单时间、科室、病人身份、费用类别、病人来源等处方药品采购 时间、药房、药品、供应商、采购员等药品销售 时间、药房、药品、病人、处方、医生等医院数据仓库部门主题分析医院数据仓库部门主题分析模型构建模型构建v 维度建模技术维度建模技术 维度建模是数据仓库建模的特殊规范,它是经常应用于数据仓库的一种逻辑设计技术。与之对应的是数据库建模中的实体-关系(E-R)模型。该技术试图采用某种直观的标准框架结构来表现数据,并且允许进行高性能
8、存取。在医院进行多维数据分析发现,医院的各类人员正是从医生、病人、药品维度等理解业务的,这种模型充分反映了用户眼里所认可的业务。模型构建模型构建v设计事实表和维表设计事实表和维表 根据不同的分析主题,确定描述各个主题中可用于分析与决策支持的相应指标,即多维数据模型的事实表。根据各个指标的约束因素,确定多维数据模型的各个维。事实表是多维数据模型的核心,它存放决策者关心的实际业务数据以及多个维度表的键值,这些键的组合构成事实表的主键。维度表存放了维的键值及描述键值的其它非健属性。模型构建模型构建v 构造多维数据模型(星型模式,病人分布主题为例)构造多维数据模型(星型模式,病人分布主题为例)病人构成
9、事实表病人构成事实表时间代码地区代码性别代码职业代码年龄代码疾病代码病人数量时间维时间维*时间代码时间(年、季度、月、周、日)性别维性别维*性别代码性别疾病维疾病维*疾病代码疾病名称疾病类别地区维地区维*地区代码地区名称职业维职业维*职业代码职业类别年龄维年龄维*年龄代码年龄年龄范围年龄描述模型构建模型构建v 构造多维数据模型(雪花模式,医疗业务主题为例)构造多维数据模型(雪花模式,医疗业务主题为例)医疗业务事实表医疗业务事实表病人代码医疗业务代码账单代码处方代码床位代码诊疗时间时间维时间维当前日期日序号月序号年序号处方维处方维处方代码药品名称账单维账单维账单代码病人代码床位维床位维床位代码床
10、位位置床位占用事实表床位占用事实表床位代码病人代码病人维病人维病人代码病人姓名医疗业务维医疗业务维医疗业务代码医疗业务名称资金流动事实表资金流动事实表账单代码病人代码病人流动事实表病人流动事实表病人代码挂号时间取药时间内容大纲内容大纲实例介绍实例介绍1体系结构体系结构2模型构建模型构建3 3数据仓库实现数据仓库实现4 4联机分析处理联机分析处理3 5医院数据仓库应用医院数据仓库应用4 6数据仓库实现数据仓库实现v技术方案技术方案数据透视表服务数据仓库数据仓库框架框架数据转换数据转换服务服务DTSDTS在线分析服在线分析服务务(Analysis(Analysis Services Service
11、sSQL Server数据数据仓库组件仓库组件采用SQL Server 2000实现HIS数据仓库知识库知识库数据仓库实现数据仓库实现v开发数据仓库环境的四个相互分离的独特构开发数据仓库环境的四个相互分离的独特构件件 操作型源系统操作型源系统即HIS、PACS等系统。数据聚集环节数据聚集环节主要是清理建立一致维度,如病人维度、医生维度、时间维度等。数据展示环节数据展示环节主要是确定面向主题的数据集市,如挂号业务和处方业务等,通过一致的维度集成各个数据集市。数据存取工具数据存取工具主要是各种分析报表和数据挖掘,如数据透视服务、Web查询等。数据仓库实现数据仓库实现1创建数据准备区。数据准备区的创
12、建可以采用SQL Server2000中的数据库与表创建工具实现。3从业务系统提取数据。在SQL Server2000中可以使用Transact-SQL,DTS、分布式查询、命令行应用程序、BCP实用工具及BULK Insert语句和ActiveX脚本实现数据的提取。2创建数据仓库。数据仓库的创建同样可以采用SQL Server2000中的数据库与表创建工具实现。4清理和转换数据,完成数据加载。在SQL Server2000中可以使用Transact-SQL,DTS、命令行应用程序及ActiveX脚本实现数据的清理和转换。可以使用Transact-SQL,DTS和BCP实现数据的加载。v数据仓
13、库物理实现数据仓库物理实现数据仓库实现数据仓库实现应用实施应用实施ETL过程过程确定物理模型确定物理模型确定逻辑模型确定逻辑模型分析应用需求,提供数据服务分析应用需求,提供数据服务利用DTS工具,子系统数据通过抽取转换加载到仓库中 面向医院某个业务主题建立物理数据库业务主题分析,构建事实表和维表。业务主题分析,构建事实表和维表。v数据仓库实现流程分析数据仓库实现流程分析内容大纲内容大纲实例介绍实例介绍1体系结构体系结构2模型构建模型构建3 3数据仓库实现数据仓库实现4 4联机分析处理联机分析处理3 5医院数据仓库应用医院数据仓库应用4 6联机分析处理联机分析处理v多维数据集的联机分析处理多维数
14、据集的联机分析处理 基于多维数据集的OLAP是将数据想象成多维的立方体,通过对多维数据集进行切片、切块、聚合、钻取、旋转等一系列操作,进行数据剖析,使用户从多种维度、多个侧面或多种数据综合度查看数据,掌握数据背后蕴含的规律。联机分析处理联机分析处理v数据切片数据切片 在科室维中选择“消化内科”,则可形成在科室维上的数据切片,显示消化内科各年的病人分布情况。如果科室维取值为“消化内科”,时间维取值为2003年第二季(Q2),则得到一个数据切块查询语句如下:SELECT measures.病人数量 on columns,职业类别.members on rows FROM病人构成分布WHERE(时间
15、.2003.Q2,科室.消化内科)联机分析处理联机分析处理v数据切块数据切块 查询结果显示2003年第二季度消化内科的各职业病人分布情况。若对更多的维进行切块,则在WHERE后面的条件中增加维设置,从而完成更复杂的查询需求。联机分析处理联机分析处理v数据钻取和数据聚合数据钻取和数据聚合 维度是具有层次性的,如时间维度层次结构的顶层可以是年,下一层是季度,然后是月、周,最后位于层次结构底层的是日。维度的层次实际上反映了数据的综合程度。数据钻取就是从较高的维度层次下降到较低的维度层次上来观察多维数据。联机分析处理联机分析处理v数据钻取和数据聚合数据钻取和数据聚合科室科室第第1季度季度第第2季度季度
16、第第3季度季度第第4季度季度消化内科1264138715121226呼吸内科105513269171265表1 2008年各季度各科室病人分布情况表2 2008年各季度各月各科室病人科室科室第第1季度季度第第2季度季度第第3季度季度第第4季度季度1月2月3月4月5月6月4月5月6月4月5月6月消化内科367403494517483387467530515462397367呼吸内科303415427465487375353286278390412473联机分析处理联机分析处理v数据钻取和数据聚合数据钻取和数据聚合 表1显示了每年每季度各科室的病人分布情况,层次是季度,如果选择时间维向下钻取,得到
17、表2,显示每年每季度每月各科室的病人数量。数据聚合是数据钻取的逆操作,是对数据进行高层次综合的操作。如由表2选择时间维向上聚合,可得到表1。联机分析处理联机分析处理v数据旋转数据旋转 数据旋转。数据旋转改变维度的位置关系,使决策者可以从多角度来观察。如将横向的时间维和科室维进行交换,从而形成横向为科室、纵向为时间的报表。内容大纲内容大纲实例介绍实例介绍1体系结构体系结构2模型构建模型构建3 3数据仓库实现数据仓库实现4 4联机分析处理联机分析处理3 5医院数据仓库应用医院数据仓库应用4 6医院数据仓库应用医院数据仓库应用v病人结构分析病人结构分析 可以按照性别、年龄、文化程度等对病人进行分类,
18、根据每项分类,系统将对病人的经济状况、需求特征和购买行为进行分析,从而得到不同性别、不同年龄、不同文化程度病人的经济水平、需求状况及主要医疗服务类型等信息。根据这些信息,医院管理者可以分析病人差异对医院收益的影响,帮助医院进行市场定位、确定营销策略,从而使医院的经营活动更具主动性和目的性。医院数据仓库应用医院数据仓库应用v资金流动分析资金流动分析 针对医院的资金流动状况,按不同的时间维度(包括按年综合、按旬综合、按月综合、按日综合)对医院的各种资金流动情况进行分析,进行资金的同期对比动态分析,门诊和住院收入因素分析,并以各种专业报表、查询结果的形式反映给决策者。医院数据仓库应用医院数据仓库应用
19、v病人流动状况分析病人流动状况分析 根据门诊病人从挂号到取药在医院逗留的时间进行时间数列动态分析,掌握影响病人诊疗效率的因素,帮助医院管理者进行业务流程的更新和改造,以提高医院的经营效率。同时帮助医院“以病人为中心”整合医院所有对外服务,以促进医院的医疗和管理水平。医院数据仓库应用医院数据仓库应用v床位占用分析床位占用分析 医院住院系统中最重要的对象是床位,它的占用情况将直接影响医院住院部分的经济效益状况。因此根据住院系统的病区床位信息、病区病人床位信息进行床位占有率的统计分析,帮助医院管理者掌握经营状况,确定影响医院经济效益的因素。医院数据仓库应用医院数据仓库应用v医疗业务分析医疗业务分析 医疗业务是医疗活动中的重要组成部分,它直接与病人打交道,医疗水平的高低和服务质量的好坏将直接影响医院的形象。因此根据病人诊断及治疗方面的历史数据,按不同的时间维度(包括按年综合、按月综合、按日综合),以已开展的医疗业务为类别,统计出各个医疗业务的开展数量,从而对医院重点开展哪些医疗服务类型进行辅助决策。总结总结指导思想