1、生物医学大数据分析生物医学大数据分析与挖掘与挖掘蒋太交中国科学院生物物理研究所 研究员湖南大学国家超级计算中心 教授(兼)北京健数通 首席科学顾问 湘雅大数据讲座湘雅大数据讲座 2014.5.10于长沙于长沙报告内容报告内容一、生物医学大数据分析挖掘的几个方向一、生物医学大数据分析挖掘的几个方向二、基于流感大数据发展流感预测预警新方法二、基于流感大数据发展流感预测预警新方法大数据时代大数据时代生物医学大数据金融大数据气象大数据交通大数据商业大数据智慧医疗和智慧医疗和个性化医疗个性化医疗智能交通天气预报股票?医院信息化产生海量临床数据医院信息化产生海量临床数据临床大数据2011年,美国卫生信息技
2、术协调官办公室发布全国卫生信息化发展计划,计年,美国卫生信息技术协调官办公室发布全国卫生信息化发展计划,计划时限划时限2011-2015美国美国系统逐步成型、理念推广、政策制定、科系统逐步成型、理念推广、政策制定、科学研究学研究中国中国系统建设和部署系统建设和部署临床大数据的特点与现状临床大数据的特点与现状临床大数据的采集与标准化临床大数据的采集与标准化临床大数据临床大数据临床大数据- - 沉睡的金矿沉睡的金矿临床大数据分析与挖掘临床大数据分析与挖掘临床大数据分析与挖掘临床大数据分析与挖掘- -病因识别病因识别大数据驱动的病因分析相关性分析https:/www.bgc-jena.mpg.de/
3、bgi/index.php/People/MaartenBraakhekke临床大数据分析与挖掘临床大数据分析与挖掘- -样本筛选样本筛选Source: http:/ 相对于传统选择样本的方式,其优势在于:选择面广,便于控制干扰因素,结果更明显;节约人工和经济成本;加快研究/实验进程Treatment ATreatment BTreatment CTreatment DTreatment E临床大数据分析与挖掘临床大数据分析与挖掘- -临床决策支持临床决策支持临床大数据分析与挖掘临床大数据分析与挖掘- -健康评估健康评估统计学建模综合健康评估临床大数据分析与挖掘临床大数据分析与挖掘- -疾病预
4、测预警疾病预测预警.疾病分子标志物识别:ER/PR, bcl-2,p53, AFP,CEA等等健康指标异常检测疾病风险预测F(x)Risk = w1*SNP1+ w2*SNP2+ wi*SNPihttps:/ -个性化诊疗个性化诊疗http:/home.ccr.cancer.gov/connections/2010/Vol4_No1/features_pg2.asphttp:/ U.S. Food and Drug Administration defined personalized medicine as “the best medical outcomes by choosing tre
5、atments that work well with a persons genomic profile or with certain characteristics in the persons blood proteins or cell surface proteins”Inefficacy of the one-dose-fits-all approach. The average response rate of a cancer drug is the lowest at 25%.http:/www.ox.ac.uk/media/news_stories/2014/140313
6、_2.htmlJ Breast Cancer 2012 September; 15(3): 265-272Personalized medicine drugs for breast cancer as of July 2012The first human trial of a pioneering personalised cancer treatment developed at Oxford University will begin this week, with the potential to tackle a wide range of late-stage cancers.临
7、床大数据分析与挖掘临床大数据分析与挖掘- -个性化诊疗个性化诊疗P4 Medicine:personalized: it takes into account a persons genetic or protein profile.preventive: it anticipates health problems and focuses on wellness, not disease.predictive: it directs appropriate treatment and avoids drug reactions.participatory: it empowers patie
8、nts to take more responsibility for their health and care.报告内容报告内容一、生物医学大数据分析挖掘的几个方向一、生物医学大数据分析挖掘的几个方向二、基于流感大数据发展流感预测预警新方法二、基于流感大数据发展流感预测预警新方法临床大数据分析与挖掘临床大数据分析与挖掘- -流感危害性预测流感危害性预测y = 31.31 x - 8.85R2=0.83Wu et al., 2010, Plos Computational Biology;通过分析流感监测产生的大数据,社会经济大数据以及大量基因序列,以及大量的相关性分析,发现了快速预测流感病
9、毒危害性的新方法早期预测流感危害程度的计算模型在流感防控策略上具早期预测流感危害程度的计算模型在流感防控策略上具有十分重要的应用价值,该工作在国内外引起重要关注有十分重要的应用价值,该工作在国内外引起重要关注24接种疫苗是控制流感传染最有效的手段接种疫苗是控制流感传染最有效的手段Vaccination Every season, WHO will recommend trivalent vaccine composition: A/H1N1, A/H3N2, and BGrown in eggsInactivated virus or live attenuated virusInjectio
10、n (Flu shot) 流感重要的科学问题世界卫生组织(WHO)在全球建立了一个流感监控网络。26目前流感疫苗推荐不是非常有效目前流感疫苗推荐不是非常有效Based on 7 seasons during 2002-2009.世界卫生组织WHO推荐疫苗的准确度不高:对中国地区 :2/7 其他北半球地区:4/7Du et al. Nature Communications 2012.临床大数据分析与挖掘临床大数据分析与挖掘- -流感疫苗推荐流感疫苗推荐流感病毒关联网络疫苗推荐Du, et al., 2012, Nature Communications.该工作发表在Nature Communi
11、cations上,被选为亮点文章,并且同期Nature杂志也对该工作进行了报道大规模病毒采样与基因测序新方法优于目前新方法优于目前WHO使用的方法使用的方法Based on 7 seasons during 2002-2009.世界卫生组织WHO:对中国地区 2/7;其他北半球地区4/7我们预测的准确度: 对中国地区 6/7;其他北半球地区6/7。XXXXXXXXXX1,目前该方法已经申请了专利。2,在使用我们的方法向WHO推荐疫苗参考株。3,Nature Communcations, 2012.XXXXXXXXXX新华社发布的新闻:我国科学家发明流感新华社发布的新闻:我国科学家发明流感疫苗株
12、快速选择新技术疫苗株快速选择新技术我国我国20132013年华东地区年华东地区H7N9H7N9溯源溯源大规模病毒采样与基因测序进化分析Wu et al. 2013. Cell Host & Microbe通过多源数据整合,我们发现通过多源数据整合,我们发现H7N9是两次重是两次重配的结果配的结果Cell Host & Microbe. Oct 2013.该工作对流感防控具有重要的指导意义 临床大数据的价值临床大数据的价值 更深入的理解人类疾病 个性化诊疗 智能临床决策 医学研究方式的转变:假设驱动转变为数据驱动临床大数据国家卫生信息化“十二五”规划“35212工程”重点建设国家级、省级和地市级
13、三级卫生信息平台重点建设国家级、省级和地市级三级卫生信息平台加强信息化在公共卫生、医疗服务、新农合、基本药物制度、综加强信息化在公共卫生、医疗服务、新农合、基本药物制度、综合管理五项业务中的深入应用合管理五项业务中的深入应用建设电子健康档案和电子病历二个基础数据库建设电子健康档案和电子病历二个基础数据库建设一个医疗卫生信息专用网络建设一个医疗卫生信息专用网络逐步建设信息安全体系和信息标准体系逐步建设信息安全体系和信息标准体系Google Flu Trendshttp:/www.google.org/flutrends/糖尿病病例识别算法对照病例识别算法Joint study by Northw
14、estern University , Mayo Clinic ,Marshfield Clinic Research Foundation, Vanderbilt University, Group Health Cooperative临床大数据分析与挖掘临床大数据分析与挖掘- -临床决策支持临床决策支持提高患者安全降低药物差错和不良反应改善用药与检验的顺序提高医护质量减少临床医生处理日常事务的时间增加临床路径和临床指南的使用提高医护信息传输的有效性提高医嘱过程,降低成本改变了现有处方的模式临床决策支持系统(CDSS)是用来帮助医生和其他医护人员做临床决策支持的交互式计算机软件。现在常用的一些 CDSS包括Archimedes IndiGO, Auminence, DiagnosisOne, Dxplain等等。CDSS的发展趋势是与HER融合,成为后者的重要组成部分。临床大数据将极大地改善此类系统的准确率。http:/