1、医疗大数据技术和应用趋势汇汇 报报 议议 程程医疗大数据的特性中国政策下的医疗大数据医疗大数据的构建医疗大数据核心技术医疗大数据应用深度汇汇 报报 议议 程程医疗大数据的特性中国政策下的医疗大数据医疗大数据的构建医疗大数据核心技术医疗大数据应用深度医疗大数据特性医疗大数据特性医疗大数据的医疗大数据的“大数据性大数据性+医疗性医疗性”规模巨大的诊疗数据、患者行为感官数据、研发数据和支付医保数据等汇聚形成的医疗大数据,不仅呈现出其作为大数据的医疗大数据,不仅呈现出其作为大数据的“4V”的特性,也表现出医疗领域特有性质:的特性,也表现出医疗领域特有性质:大数据对传统数据处理、管理、分析等提出更高要求
2、大数据对传统数据处理、管理、分析等提出更高要求特征特征大数据(大数据(Data Discovery)传统数据(传统数据(BI)数据容量 不断增长中(TB、PB、ZB)处理时效处理时效 非常迅速(以秒为单位)非常迅速(以秒为单位)数据结构数据结构 半结构或非结构化半结构或非结构化数据来源 完全分布式、云存储数据整合 比较困难MB、GB较慢(以小时或天为单位)较慢(以小时或天为单位)结构化结构化中心式相对容易存储架构存储架构 Hadoop分布式文件系统(HDFS),非关系数据库非关系数据库(NoSQL)关系数据库管理系统(关系数据库管理系统(RDBMS)接入方式 批处理或接近实时分析对象分析对象
3、全体数据全体数据交互式样本数据样本数据分析方法 描述分析为主分析结果 关联度、模式分析工具分析工具 自服务式分析自服务式分析描述与推断相结合可信区间、P值相关专业人士分析相关专业人士分析IT 技术进步使医疗大数据应用成为可能技术进步使医疗大数据应用成为可能数据挖掘数据挖掘数据融合数据融合细颗粒度细颗粒度的数据深挖将360多个医疗子行核心技术核心技术业全部数据整合分析产生更加精确、连续、有价值的信息自然语言自然语言处理处理机器学习机器学习数据的自动后后结构化处理数据数据可视化可视化准确率无限趋向于100%亿条数据、秒级亿条数据、秒级呈现、实时分析呈现、实时分析汇汇 报报 议议 程程医疗大数据的特
4、性中国政策下的医疗大数据医疗大数据的构建医疗大数据核心技术医疗大数据应用深度医疗大数据行业需求医疗大数据行业需求医疗数据加速积累,对存储、管理等提出更高要求医疗数据加速积累,对存储、管理等提出更高要求医疗行业是数据密集型行业。医疗行业是数据密集型行业。IDCDigital预测截至2020年医疗数据量将达40万亿GB,是2010年的30倍。同时数据生成和共享的速度迅速增加,导致数据加速积累。同时数据生成和共享的速度迅速增加,导致数据加速积累。国家战略推进医疗机构、区域信息化及医疗大数国家战略推进医疗机构、区域信息化及医疗大数据应用建设,促使医疗大数据产业正在加速形成据应用建设,促使医疗大数据产业
5、正在加速形成 2009-2015年国家出台了大量关于医疗信息化建设总体要求类的政策,2011-2012年出台了大量促进医疗机构如医院、医药厂商等信息化的政策,2013年开始出台区域信息化建设的政策,目前我国区域信息化建设尚未成规模,并且2015年前缺少关于大数据应用的相关立法来保证共享和防止滥用,导致我国数据源开放和共享化程度处于较低水平。导致我国数据源开放和共享化程度处于较低水平。2015年促进大数据发展行动纲要明确了关于数据使用的总体要求。2016年6月底国务院出台关于促进和规范健康医疗大数据应用发展的指导意见,将医疗大数据正式纳入国家发展,其对医疗大数据融合及共享开放建设,在医疗、医药、
6、公共卫生、医保等方面的应用,以及使用安全保障等方面进行全面规范。数据应用政策的释放和数据应用政策的释放和推进将促使医疗大数据产业加速形成,从数据收集、融合、清洗处理推进将促使医疗大数据产业加速形成,从数据收集、融合、清洗处理到应用环节,短期内数据融合相关公司将高速发展,随后数据应用相到应用环节,短期内数据融合相关公司将高速发展,随后数据应用相关公司将迎来爆发式增长。关公司将迎来爆发式增长。时间时间部门部门政策政策关于深化医药卫生体制改革的意见3521工程政策分类政策分类2009 国务院2010 卫生部整体指导2013 国家住房和城乡建设部 关于开展国家智慧城市试点工作的通知2013 卫计委20
7、15 国务院2011 卫生部2011 卫生部2012 卫生部2014 卫计委2012 国务院2012 国务院2013 中央委员会2014 卫计委关于加快推进人口健康信息化建设的指导意见全国医疗卫生服务体系规划纲要(20152020年)基于电子病历的医院信息平台建设技术解决方案(1.0 版)电子病历系统功能应用水平分级评价方法及标准(试行)健康中国2020 战略研究报告医院信息化电子病历基本数据集基于电子病历的医院信息平台技术规范卫生事业发展“十二五”规划医药信息化区域信息化服务业发展“十二五”规划中共中央关于全面深化改革若干重大问题的决定居民健康档案医学检验项目常用代码基于居民健康档案的区域卫
8、生信息平台技术规范2015 国务院2015 国务院国务院2016 国务院国务院关于城市公立医院综合改革试点的指导意见促进大数据发展行动纲要促进大数据发展行动纲要数据融合、使用及安全数据融合、使用及安全关于促进和规范健康医疗大数据应用发展的指导意见关于促进和规范健康医疗大数据应用发展的指导意见汇汇 报报 议议 程程医疗大数据的特性中国政策下的医疗大数据医疗大数据的构建医疗大数据核心技术医疗大数据应用深度医疗大数据顶层架构医疗大数据顶层架构-智能检索引擎智能检索引擎+数据可视化数据可视化Connectors数据获取数据获取工作流程工作流程数据可视化数据可视化 医疗服务和临床决策医疗服务和临床决策
9、公共卫生管理公共卫生管理 查询扩展查询扩展 用户权限管理用户权限管理 患者隐私保护患者隐私保护 数据加密数据加密 移动医疗,医疗教育移动医疗,医疗教育 健康新兴产业健康新兴产业ing 网络和系统安全网络和系统安全and数据库、表自数据库、表自动关联技术动关联技术文本分析文本分析非关系型非关系型数据库数据库语义分析语义分析自然语言处理自然语言处理Ontology零结果处理零结果处理数据触发数据触发机器学习机器学习亿条数据,秒级亿条数据,秒级呈现,实时分析呈现,实时分析医医 疗疗 大大 数数 据据 分分 析析 管管 理理 平平 台台汇汇 报报 议议 程程医疗大数据的特性中国政策下的医疗大数据医疗大
10、数据的构建医疗大数据核心技术医疗大数据应用深度医疗大数据的核心要求医疗大数据的核心要求亿条数据秒级呈现快软件本身+人工介入+机器学习全准360所有异构化数据准确率无限趋向于100%核心要求需求变化时的实现时间月-周-天-小时-分钟多变多维度实时分析全全核心核心技术技术组学细胞分析病理学通用适配器连接所有异构数据通用适配器连接所有异构数据蛋白质分析临床信息Relational DBs(Oracle,SQLServer)NoSQLFilesharesDocumentStoresSocial Media(FaceBook,Twitter)(Documentum,OpenText)快快年收入20亿的某
11、三甲医院,运营数据中的药占比最细颗粒度分析,分析的数据量约127000000条,分析+呈现约?秒级秒级。核心核心技术技术多多多维度的数据广泛关联分析多维度的数据广泛关联分析OntologyData DiscoveryAutomation准准机器学习机器学习人工介入人工介入医学字典库医学字典库准确率准确率60%NLP趋向于趋向于100%语义分析语义分析变变数据的增加数据的增加维度的增加维度的增加需求的增加需求的增加情景假设情景假设大数据架构大数据架构配置可视化配置可视化数据增加到一定量以后是否会影响效率?架构瓶颈?维度增加的时候之前建的Cube是否推倒重来?陕西省公立医院医疗服务价格改革方案细则
12、的应对?增加或减少费用类别如何沙盘演练运营基准?成 熟 专 业 的 医 疗 大 数 据 平 台如何确保我们应用的是真正的大数据平台?如何确保我们应用的是真正的大数据平台?ProofOfConcept汇汇 报报 议议 程程医疗大数据的特性中国政策下的医疗大数据医疗大数据的构建医疗大数据核心技术医疗大数据应用深度医医 疗疗 大大 数数 据据 分分 析析 管管 理理 平平 台台No!Yes底层架构底层架构关系型数据库关系型数据库非关系型数据库非关系型数据库医院运行数据展示医院运行数据展示-1用数据分析主诉或现病史有痰或咳嗽的就诊患者和空气质量是否有关联性医院运行数据展示医院运行数据展示-2分析主诉或现病史有痰或咳嗽的就诊患者年龄,性别,地域构成单维度单维度“诊断栏诊断栏”综合检索实例综合检索实例-肝硬化肝硬化 脑梗塞脑梗塞 房颤房颤多维度检索实例多维度检索实例-I型糖尿病型糖尿病语义分析实例语义分析实例-肯定胸痛肯定胸痛 or 否定胸痛否定胸痛单病种科研分析单病种科研分析-房颤并发脑梗死患者抗凝治疗率房颤并发脑梗死患者抗凝治疗率综合检索综合检索条件及查条件及查询结果询结果