1、大数据在医疗行业的大数据在医疗行业的应用应用 PART 1 大数据在 医疗领域 的应用2大数据在医疗行业的应用outline一、医疗与大数据的趋势二、什么是医疗大数据三、大数据面临的挑战四、如何管理和利用大数据五、案例分析六、总结与展望3大数据在医疗行业的应用一、医疗与大数据的趋势二、什么是医疗大数据三、大数据面临的挑战四、如何管理和利用大数据五、案例分析六、总结与展望4大数据在医疗行业的应用医疗费用在不断上升GDP的占比非常高10-19%0-9%趋势分析:我们正处在医疗行业的一个重要转折点%of population over age 6030+%25-29%20-24%2050WW Ave
2、rage Age 60+:21%Source:United Nations “Population Aging 2002”全球老龄化平均年龄60 +:目前的10%,到2050年将达到20%Source:McKinsey Global Institute AnalysisESG Research Report 2011 North American Health Care Provider Market Size and Forecast以美国为例:医疗大数据的价值3千亿美元/年,相当于每年生成总值增长0.7%5大数据在医疗行业的应用0150001000050002010 2011 2012 2
3、013 2014 2015趋势分析:我们正处在医疗行业的一个重要转折点存储的增长医疗服务产生的数据总量(PB)AdminImagingEMREmailFileNon Clin ImgResearch医疗影像归档一个医疗系统案例的数据到2020年,医疗数据将急剧增长到35 Zetabytes,相当于2009年数据量的44倍增长Source:McKinsey Global Institute AnalysisESG Research Report 2011 North American Health Care Provider Market Size and Forecast6大数据在医疗行业的应
4、用一、医疗与大数据的趋势二、什么是医疗大数据三、大数据面临的挑战四、如何管理和利用大数据五、案例分析六、总结与展望7大数据在医疗行业的应用大数据对于“大数据”(Big data)研究机构Gartner给出了这样的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。4V:Volume(大量)Velocity(高速)Variety(多样)veracity(真实性)/Value(价值性)8大数据在医疗行业的应用1.制药企业/生命科学3.费用报销,利用率 和 欺诈监管2.临床决策支持&其他临床应用 (包括诊断相关的影像信息)4.患者行为/社
5、交网络医疗大数据简介数据来源包括哪些?我们如何利用大数据创造价值?(示例)2.临床决策支持4.由生活方式和行为引发的疾病分析1.个体化医疗3.欺诈监测得以加强McKinsey Global Institute Analysis9大数据在医疗行业的应用医疗大数据相关解决方案健康信息服务新兴的医疗服务应用数据分析及视觉化处理数据处理/管理分布式平台老龄社会肿瘤基因组学医疗影像分析医疗影像影像数据处理加速基础医疗服务临床决策支持类SQL的检索医疗记录存储优化个人健康管理个体化医疗机器学习基因数据安全和隐私10大数据在医疗行业的应用一、医疗与大数据的趋势二、什么是医疗大数据三、大数据面临的挑战四、如何
6、管理和利用大数据五、案例分析六、总结与展望11大数据在医疗行业的应用大数据的挑战不仅来自于数据量的增长.需要新技术的支持检验结果,费用数据,影像,设备产生的感应数据,基因数据等数据量结构化数据,遵循标准的数据标准(如,HL7)非结构化数据,如口述、手写、照片、影像等类型实时有效的商业价值基于现有数据库中的数据进行分析,来支持不同种类的业务:如费用及报销、患者病史、归档影像分析、实时临床决策支持(数据分析)实时数据分析,而非传统的批量处理分析 数据以流的方式进入系统,进行抽取和分析 对于实时运行中的每个时间节点产生影响,而不是事后处理在传统的解决方案之上,引入新的数据及分析模型和技术,价值速度1
7、2大数据在医疗行业的应用一、医疗与大数据的趋势二、什么是医疗大数据三、大数据面临的挑战四、如何管理和利用大数据五、案例分析六、总结与展望13大数据在医疗行业的应用传统解决方案环境ERP,CRM,Batch,OLTP-DBData Center ProvisioningDiscreteVirtualCloud As A ServiceHPC关注数据的价值大数据存储的考虑传统存储方式大规模分析 Hadoop*海量数据库 Hive*大规模备份 Lustre*数据源文本-语音-视频-传感器Requesting Or M2M通讯批量 商业应用丰富的视觉化效果 安全的数据分析和缓存边缘服务器(Edge)分
8、析同步端到端Machine-to-MachineSource-to-Source可行的解决方案体系(示例)Applications&ServicesVisualization File Structure&AnalyticalToolsData Delivery,Operational&GraphicalAnalyticsData Management&ComputationalAnalyticsCompute Storage&InfrastructurePlatforms14大数据在医疗行业的应用高效的大数据访问途径 (客户端)“Know Me”“Free Me”“Express Me”智能
9、手机移动医疗助理平板电脑笔记本,Ultrabook其他设备台式机数字标牌自助终端MobilityVital sign,I&O entryMedicationadministrationTemplatedata entryFree-format textdata entryLarge diagnosticimagesData inquiryManageability“Link Me”15大数据在医疗行业的应用大数据在中国医疗行业中的应用模式1.制药企业/生命科学3.费用报销,利用率 和 欺诈监管2.临床决策支持&其他临床应用 (包括诊断相关的影像信息)4.患者行为/社交网络药品研发对药品实际 作
10、用进行分析;实施药品市场预测基因测序分布式计算加快基因测序计算效率公共卫生实时统计分析发现公共卫生疫情及公民健康状况新农合基金数据分析及时了解基金状况,预测风险辅助制定农合基金的起付线,赔付病种等基本药物临床应用分析分析基本药物在处方中的比例临床数据比对匹配同类型的病人,用药临床决策支持利用规则和数据实时分析给出智能提示远程监控采集并分析病人随身携带仪器数据,给出智能建议人口统计学分析对不同群体人群的就医,健康数据实施人口统计分析了解病人就诊行为发现病人的特定就诊行为,分配医疗资源16大数据在医疗行业的应用一、医疗与大数据的趋势二、什么是医疗大数据三、大数据面临的挑战四、如何管理和利用大数据五
11、、案例分析六、总结与展望17大数据在医疗行业的应用案例分享:Regional Health Info Network ChinaReal-time Clinical Decision Support 实时的医疗数据处理(电子健康档案,医疗影像数据),支持医疗协同、临床决策支持和公共卫生管理 采用 Hadoop*(HBase*/Hive*)来实现医疗数据分析和处理 未来将扩展到不同领域、不同区域/地区(包括数据交换、处理和分析)与本地的软件厂商及OEM厂商进行了广泛合作 技术挑战 Hadoop(HBase/Hive)与传统关系型数据库如何有效结合大数据在区域卫生信息平台中的切实可行应用场景Pub
12、licHealthHospitalPrimary care(Grassroots)HealthInformationDWEHRData&ServicesRegistriesData&ServicesLongitudinal Record ServicesHealth Information Access LayerCare CoordinationClinical decision supportData AnalyticR&DRHINAncillaryData&Services18大数据在医疗行业的应用分布式数据服务系统展现层(报告,视图)区域医疗及基层医疗信息系统大数据解决方案(Hadoo
13、p*)集成的用户应用界面(居民、医生、卫生行政管理人员)数据挖掘(Mahout)分布式批量处理框架(Map/Reduce)区域卫生信息访问层区域卫生信息访问层(HIAL)医院信息系统医院信息系统语言和编译(Hive)实时数据库(Hbase)基层医疗信息系统医疗服务药品管理新农合医疗保险服务器虚拟化基础设施虚拟化基础设施虚拟化网络虚拟化 存储虚拟化基于云的区域基层医疗服务系统多租户应用多租户应用分布式文件系统 协作 服务(HDFS)(Zookeeper)结构化数据采集器 日志数据采集器(Sqoop)(Flume)健康档案数据存储公共卫生运营管理19大数据在医疗行业的应用Sequencing3 B
14、illionBase PairsDataProcessingCloud StorageVisualizationMillions ofVariantsInterpretation&AnalyticsMillions of VariantsMillions of PatientsCommercializingTargetedTherapeuticsCompanionDiagnosticsActionable Biomarkers案例分享:NEXTBIO基因数据分析Cost to sequence a genome has fallen by800 x in the last 4 yearsEac
15、h genome has 4 million variantsGrowth in the genomics data in the publicand private domainData available in variety of sourcesStructured,semi-structured,unstructuredNew aggregated data growingexponentially20大数据在医疗行业的应用案例分享:NEXTBIO病人相关性数据Novel DiscoveriesBiomarkersDisease MechanismDrug IndicationsCli
16、nical Trial ParametersPatient Care OptionsLarge content repository of public and private genomic datacombined with proprietary and patented correlation engine21大数据在医疗行业的应用案例分享:Kaiser Permanente 大数据应用23大数据在医疗行业的应用数据的发展趋势结构化数据80%非结构化数据全世界 80%的数据是非结构化的 (大量的移动终端设备,机器产生的数据)在未来十年,数据将迎来 44 倍的增长 (35zettabyt
17、es by 2020)主要的数据 增长 来自于 非结构化数据 (在线的归档数据,医疗影像,在线视频和存储,照片等)全球数据的构成Kaiser的数据中,90%是非结构化的 (80%的EHR和影像数据)在未来十年,数据将会有 25 倍的增长 (Oneexabyte by 2020)主要的数据 增长 来自于 非结构化数据 (医疗影像,视频,文本,音频等)信息 给 实时个性化医疗服务带来了可能性(Requires Contextual device,environment,spatial,Demographics,Social and Behavioral profiles inaddition to
18、 medical information)Kaiser 正在评估大数据相关技术Kaiser的数据构成结构化数据90%UNSTRUCTURED 构化数据DATA非结信息 给各行业发展带来了新一轮的机遇 (零售,金融,保险,制造,医疗,)各行业已经开始采用 大数据技术 用于信息提取Source:Kaiser24大数据在医疗行业的应用Master Integrate built/bought Real-time PredictiveAnalytical Solutions or Processing logicDiscontinuous ChangeSAN/NASSMP(5$)SAN/NASIn-M
19、emory(50$)Share-NothingDistributed Storage andCompute($)Fault-tolerant MasterSlave Architecturecapable of withstanding partial system failuresData is distributed across processing slavenodesResources containing data are not sharedMaster manages the data distribution,jobscheduling across slave nodes
20、and aggregatingresult setsSlave(s)DASSAN/NASMPP(10$)SAN/NASSMP(Disk Caching,High Speed Network)(10$)数据平台计算的趋势 分布式计算Kaiser is looking to exploitthis capability Structured,RelationalTabular Data Interactive Query Support Real-time Analytics SQL Transaction Data Unstructured,Non-tabularData Rich Ad Hoc
21、 Integration Real-time Analytics UQL ALL Data25大数据在医疗行业的应用大数据平台需求分析处理的特性 Intuition(Simulation,Optimization,Stochastic Optimization)Information(Standard&Ad Hocreporting,Query,Alerts,Forecasting,Access)Interrogation(Clustering,Statistical,Quality,Semantics)Integration(Alignment,Semantics,Completeness,
22、Quality)Ingestion(Data Model,MetadataReference Data,Store)Information drives process optimizations withstrategic impact.Modeling business intuitionfrom data deluge.Ability to model information and transition frommultiple access methods to generating,sharing,collaborating and acting on insights anyti
23、me,anywhere on any device.Support current BI tools focused on structuredinformation.Build/buy packaged unstructureddata processing and analytics tools.A portfolio of tools to manage(profile,cleanse,classify,synchronize,aggregate,integrate,share)ALL types of data.A unified information storage methodo
24、logyenabling users to manage data from ALL sources.数据的特性数据量(Sensors,EMR,Claims,Pharmacy,Images)速度(SLAs,Real-timeDecision Support&ContextualIntelligence)类型(Structured,Text,Unstructured,Documents,Images)26大数据在医疗行业的应用大数据 界定的标准DATA SIZEDATA TYPEDATA CLASSDATA CATALOGDATA VELOCITYDATA ACCESSDATABASE TYPE
25、Gigabytes,Terabytes,PetabytesStructured,Semi-Structured,UnstructuredHuman Generated,Machine GeneratedText,Image,Audio,VideoBatch,StreamingAnalytics,Search,Transaction(ACID,BASE)Relational,File Based,Columnar,NoSQL,Document,Graph,RDFFRAMEWORKSANALYTICSFinancial,Computer Vision Engine,Geospatial,Machi
26、ne Learning,Mathematical,Natural Language Processing,Neural Networks,Statistical Modeling,Time-Series Analysis,Voice EngineStandard Reporting,Ad hoc Reporting,Query/Drill downs,AlertsForecasting,Simulations,Optimization,Stochastic OptimizationsSERVERARCHITECTUREDISTRIBUTEDPROCESSINGSTORAGEARCHITECTU
27、RESMP,MMP,Appliance,NAS,SAN,Distributed ProcessingCommodity Cluster(CC)1K nodesDirect Access Storage,Spinning Disks,Flash,SSD27大数据在医疗行业的应用一、医疗与大数据的趋势二、什么是医疗大数据三、大数据面临的挑战四、如何管理和利用大数据五、案例分析六、总结与展望28大数据在医疗行业的应用36总结 我们正处在医疗行业大数据和分析的一个重要转折点 我们需要让大数据更为高效,可以便捷的访问 专注在创新,依赖产业链来提供企业核心能力之外的服务 采用标准和最佳实践,参考全球已有的
28、成熟模型29大数据在医疗行业的应用展望展望让我们一起让医疗大数据成为现实让我们一起让医疗大数据成为现实:提供具有差异化的技术解决方案,探索开放标准和最提供具有差异化的技术解决方案,探索开放标准和最佳实践佳实践寻找可能的客户和产业链合作伙伴,共同探索医疗行寻找可能的客户和产业链合作伙伴,共同探索医疗行业的核心应用模式业的核心应用模式与产业合作进行验证,加速大数据的采用与产业合作进行验证,加速大数据的采用30大数据在医疗行业的应用 PART 2 大数据在 工程建设 中的应用31大数据在医疗行业的应用存在的问题工程建设行业在建造过程中会产生大量的数据大型项目从设计到落成大约有100G的信息量大型施工
29、企业每年都会有上千的项目建筑业由于其项目的特点,每年都会产生巨大的数据量这些庞大的数据大多随着项目的完成而终结其使命很少有系统能够对其进行分析,从而导致数据的流失或浪费32大数据在医疗行业的应用 应用大数据在建筑领域的应用:从勘察设计、招投标、建设、运营等阶段,都可以运用到大数据33大数据在医疗行业的应用 应用No.1 用大数据构建工程质量监管大平台p 利用“普适计算”技术,保证质量数据收集和应用的实时性 普适计算是信息空间与物理空间的融合,在这个融合的空 间中人们可以随时随地、透明地获得数字化的服务。p 实现各大平台的数据共享34大数据在医疗行业的应用 应用No.2 大数据在工程造价中的应用我国工程造价只有居住和商业类比较成熟,而其他的方面都没有成熟的分类指标。35大数据在医疗行业的应用 应用No.3 帮助施工企业财务分析及处理36大数据在医疗行业的应用 应用Thanks小组成员:马宇寰 宋佳琪 向琪 徐启雄 周聪 邢洪达37大数据在医疗行业的应用