1、医疗知识图谱的构建及应用集团PPP模式医疗生态圈平安医疗生态圈政府:卫健委服务政府:医保/社保服务患者Patient服务提供 Provider支付 Payment智慧医疗云线上健康管理入口平安好医生分级诊疗医院诊所医保平台平安医保流量入口支付方医生药店线下健康管理入口商保体检中心其他医疗机构平安健康险平安寿险平安养老险平安万家医疗专科转诊技术支持技术支持技术支持集团医疗科技平台集团医疗科技平台预防诊前诊中诊后/管理质控A46大智能服务智能影像筛查/辅助诊断智能疾病辅助诊疗智能疾病预测智能预诊/分诊智能随访追踪智能质量控制A3医疗知识图谱医疗知识图谱(覆盖60万医学概念,530万医学关系,100
2、0万医学证据)A25大信息库疾病库治疗库药品库个人健康库医疗机构和医生库A1院前院中院后院内信息系统第三影像健康体检在线问诊健康档案院外随访医保核赔商保核赔患者问题N个数据源队列研究&临床试验个监测流病电病历基因测序药品购买35大医疗信息库A2疾病库治疗库药品库 疾病及疾病相关属性和关系 常见疾病知识库 多个城市地病种库 不同版本ICD编码 疾病语义概念 治疗模式 精准群 药品信息 各省市药品目录 药品中标价格 药物不良反应 药物疗效 检查检验信息 术信息 临床路径 经典病例 疾病同义词库 症状同义词库 临床试验个人健康库医疗机构&医生库 医疗机构&医名称 医疗机构级别 主要科室 专家数 住院
3、床位 疾病风险因 患者常见问答 疾病知识问答库 科普文章 医简介 医资质 生活方式 医特长4平安医疗知识图谱:涵盖50类医学概念,191类医学关系A3知识图谱:以结构化的形式描述客观世界中的概念及其关系 50类医学概念 191种医学关系 100种医学属性 60万医学术语 530万医学关系 1000万医学证据5知识图谱:高血压知识图谱示例A3平安医疗知识图谱-整体架构融合医学核心概念以及医学临床证据智能服务医疗知识图谱查询导览及可视化基于自然语言的知识图谱交互基于知识图谱的医患教育基于知识图谱的结构化和标准化基于知识图谱的决策支持图数据库自然语言处理平台机器学习平台数据平台爬虫MongoDBCa
4、ssandraHBaseBerkeleyDBElasticSearchSchema管理 数据结构化,槽填充数据驱动多图谱融合实体对齐图谱质量评价图谱规则集规则校验工模板定义和管理基于数据挖掘的相关性图谱冲突解决工具实体识别属性识别知识图谱schema管理工具具图谱构建对齐审核工具实体链接关系抽取图谱一致性校验推理规则医学核心概念医学临床证据临床指南+医学知识 证据图谱经典病例医学科普开放医疗与健康联盟RWE模型疾病知识库检查检验知识库症状知识库数据层药品知识库身体部位知识库手术知识库实体识别&关系抽取p 基于深度学习的端到端的命名实体识别以及关系抽取,利用多任务方式同时提高命名实体识别以及关系
5、抽取的精度p 神经网络+知识图谱+人工知识p 神经网络:Bi-LSTM+CRF, Tree-LSTMp 知识图谱:基于n-gram的匹配诱因p 人工知识:中文字形,患者特征关系抽取标签嵌入实体抽取CRFB-疾病OB-症状I-症状E-症状导致感染糖尿病左下隐藏层tanhtanh肢Bi-LSTM词嵌入依存嵌入糖尿病导致左下肢感染nsubj8“ACS”实体连接“ACS”ACS患者的出院后需要进行一年的双抗治疗别名别名急性冠状动脉综合症腹腔间隔室综合症处方双抗治疗包含药品包含药品阿司匹林氯吡咯雷医学术语语法分析语义分析备选实体查询索引多维度评分器排序最终结果Wordvec相似度同义词林相似度字符串边界
6、距离拼音边界距离。弱监督的信息抽取Schema候选实体对未标注的数据集标签矩阵目标函数优化公开数据集以及少量标注数据每个源对数据的标记矩阵标记矩阵相关性KG123标注函数用于、禁用、引起、不适用描述特征&字典生成模型本品适用于B的治疗P(Y)启发语句Bilstm + Attention弱监督下的多源数据集图谱融合医疗领域存在多种形式的同义词p 别名p 小檗碱p 黄连素片p 不同翻译名称p 阿司匹林p 阿士匹灵p 阿斯匹林p 拼写错误p 天竺癀p 天竹黄阿托伐他汀相关药物医联体/医院在诊前、诊中、诊後存在诸多痛点关键环节诊前诊中诊后未察觉身体不适自行解决基层医院基层医院家庭医生跟踪管理早期患者&
7、轻微疾病其他(慢病等)常规病患居民发现身体不适/ 意外科室医院跟踪随访手术/重疾病患中/晚期患者&重度疾病筛查初诊转诊/到高级别医院高危病患日常体检ICU治疗, 误漏诊高:2分钟200-300 ,病人, 误漏诊高(40 放射、病理医生负担大每个患者读片时间不到日均接待 基层诊疗水平低 缺乏有效诊后管理/随访手段: 无有效数据统计、工作量繁重缺乏主动管理辖区病患环节):370万基层卫生人员中,本科以上学历仅占9% ,中级以20-50%以上时间於文字报告入 临床医生时间未有效利用:医主 院上职称仅占12%; 小病、常见病、慢性病患者诊疗量占大头录, 设备 基层缺乏专科与病理医生/ICU病患量大 管
8、理难:平均每重症患者 个医生,工作压力巨大,难以有效管理病患,1/6 重症要痛点(如CT设备利用率利用率低90%时间; 医生医生问诊时间短1 2015年首都医科大学附属北京朝阳医院急诊科主任郭树彬统计; 前几大误挂包括皮肤科误挂外科(31%), 外科误挂内科(30%), 口腔科误挂外科(12%), 外科误挂妇产科(11%), 中医误挂外科(10%)智慧医院CDSS解决案全景图诊前诊中诊后2F临床科研平台:电子病历结构化/标准化自行解决其他(慢病等)未察觉身体不适高层医院基层医院中/晚期&重度疾病患者科室随访与管理智能问诊/分诊服务常规病患2A2E智能影像筛查2B至高层医院诊断治疗远程会/手术/
9、重疾病患居民2B 智能影像辅助诊断智能疾病辅助诊疗下沉至基层追踪远程会峎支持发现身体不适/ 意外智能健康风险提示智能疾病辅助诊断2C2C2C2C高危病患转智能ICU管理家庭医生随访与教育2D诊 早期&轻微疾病患者2E精准用药推荐日常体检2C 智能用药推荐2B 多模态智能影像 2C 智能疾病辅助诊疗 2D2F智能临床科研平台2E 智能患者教育/随访2A智能ICU管理智能分诊 /导诊辅助诊疗与治疗推荐 死亡时间预测和诊疗资源预测、管理等智能模块 全病种(候诊大厅与药剂科)诊前数据收集&机器问答智能分诊 提供35种基于影像的辅助诊疗 包含智能诊报告&远程放射会诊等模块,提升诊疗效率,降低误诊率 30
10、种常见疾病智风险提示、能辅助诊疗与用药建议,规范临床诊疗和用药标准全病种基于自然语言理解的智能随访和诊后患教 利用深度学习技术,自动抽取电子病历中的关键信息 有效提高医生诊疗品质与效率 带来高效且精准的智能就医体验 协助基层医院提升诊后管理与随访效率 基于医疗知识图谱的医学概念标准化 精细管理医疗资源,提升诊疗准确性13带有概率及权重的知识图谱节点粗细:节点的重要性/频度;边粗细:相关性概率诊前诊中辅助决策2A 2C(诊前 分诊)(诊中 诊断辅助)(诊中 治疗辅助)基于症状相关性以及重要度的推荐,完善主诉 基于患者主诉,选择相关疾病,并按照节点权重及相关性进行排序。同时进一步给出排序的推荐检查
11、检查检验结果的解释。根据医生诊断,提示可能得并发症及预后。提示可能得用药宝宝体温39度,咳嗽,有点喘节点权重*边相关性疾病:急性支气管炎上呼吸道感染肺炎检查:听诊血常规急性支气管炎体温并发症:肺炎 5% (风险因素:糖尿病,慢阻肺),呼吸衰竭 0.2%相关药物:阿莫西林,。气促?蛋白质过敏?37流鼻涕听诊发烧糖尿病胸部X光慢阻肺血常规阿莫西林咳嗽喘息吸衰竭白细胞升高小儿哮喘湿疹肺炎腹泻气促蛋白质过敏急性支气管炎上呼吸道感染呕吐个性化精准诊疗-辅助诊断2C数据准备数据建模法模型应用- 辅助诊断美国20年救护车使用调查公共数据集,包含210万次就诊记录构建深度学习模型通过医学知识图谱及中的疾病和症
12、状关系构建基础网络利用公共数据进行增量学习, 学习优化目标考虑先验知识 在损失函数中加入知识对应的罚项,提高模型精度。7百万篇医学文献摘要中提取出的症状,诊断以及共现关系全球最大的医学文献数据库120万病人跨度19年的2000万次就诊记录中抽取的疾病(症状和诊断),药物,设备和手术信息构建贝叶斯网络斯坦福大学临床数据仓库应 用 PubMed和 Stanford 数据构建概率模型,支持更多种类的疾病研究价值和进展价值:利用患者症状、体征等信息为医生推荐疑似诊断,减少误诊、漏诊医学知识通过模型融合技术生成最后的诊断列表医学知识图谱和疾病的临床指南。包括1.2万个症状概念,14万个疾病概念,以及相互
13、关系进展:概率模型覆盖500+种疾病,全科常见30+种疾病的诊断模型的准确率为95%*合作:北京大学第一医院全科155个性化精准诊疗-辅助治疗2C数据准备建模法模型应用- 药物推荐临床指南基于知识的治疗模型根据患者的信息给出处方推荐收集整理了20+国家临床指南和专家共识包括特定疾病的诊断、治疗和预防的方法和路径。知识表示:将临床指南表示为决策树,进而翻译成可执行的规则。知识推理:采用推理引擎将规则应用到患者数据,生成治疗方案。提供推荐依据:知识图谱药品: 17万种RETE推理网络药品和疾病关系:35万条药物相互作用:21万条基于数据的治疗模型通过关联规则分析的发现常见治疗模式。临床数据通过精准
14、分群技术,找出在临床上相似患者的人群。在相似人群中的进行治疗模式的个性化推荐。采用模型融合技术把推荐结果和知识模型结果整合重庆卫键委电子病历数据:包括35种常见疾病的就诊115万次。理赔数据:包括35种常见病就诊1700万次。研究价值和进展价值:规范医生治疗,提升患者满意度进展:完成3种疾病(高血压,糖尿病,房颤)的依据知识的治疗模型,正在开发基于数据的30+种疾病的治疗推荐模型合作:上海中山医院全科、赛诺菲 , = 每次就诊包括患者基本信息,诊断,检验检查信息,疾病史,用药史和处方信息。166疾病健康问答场景2E3亿高血压患者, 1亿糖尿病患者,5000万慢阻肺缺少合格的社区医生和药师迅速增
15、长的慢病患者数量每1万人的社区医 每1万人的药师数 药师的教育水In生数量量平慢性病占据了死因的前列28.2%本科以上社区医生和药师也缺乏专业的技能33.3%技校34.2%专科患者在慢病管理当中会有各种疑问卫计委要求家庭医生要定期对慢性病随访随访内容包括上亿注册用户症状:头痛,头晕,胸闷等百万级日问诊量体征:血压,体重,BMI,心率等生活方式:吸烟,饮酒,运动等用药:种类,用法用量大量健康教育相关问题,可以从医疗知识库当中找到答案糖尿病患者应该如何饮食?立普妥和络活喜可以一起吃吗?空腹血糖8.6,有问题吗?疾病健康问答-问题相似度匹配2E数据驱动的FAQ问题集准备患者问题库(4000万+)是否
16、FAQFAQ挑选问题向量表示训练集生成问题聚类语义匹配检索模型300w+问题对2000+FAQ覆盖糖尿病,高血压,房颤FAQ库18疾病健康问答-问题相似度匹配2E基于深度注意力网络的文本匹配集成学习技术SoftmaxAverage&Maxd1a1d2a2d3a3d4a4d1a1d2a2d3a3 h1x1h2x2h3x3h4x4h1x1h2x2h3x3病种问题库170,000110,00010,00060,00020,000FAQ问题组700训练集340万对110万对10万对35万对14万对精度糖尿病高血压房颤90,00080,0005,00020,00010,00093%95%92%92%91
17、%707200卒中350慢阻肺43719药品助手-基于知识图谱的问答2E模板阿托伐他丁一天应该吃几次?一天应该吃几次?备选关系:适应症,用法用量,禁忌,。命名实体识别biLSTM + CRF词向量矩阵阿托伐他丁一天应该吃几次?实体链接模板编码阿托伐他汀钙片 阿托伐他汀钙分散片 阿托伐他汀钙胶囊阿托伐他汀胶囊关系向量多轮对话的实体消岐关系-模板匹配片剂胶囊阿乐立普妥匹配组合立普妥(10mg)立普妥(20mg)立普妥(40mg)Max Avg立普妥(10mg)常用的起始剂量为10 mg每日一次MLP20用法用量基于知识图谱的电子病历理解和智能编码2F每年70亿人次就诊患者,产生100亿+数据电子病
18、历数据;通过电子病历结构化以及自动编码服务,整合电子病历真实世界数据分析大数据分析支持精准DRG高质量病案首页分组医院监管者药商高质量统计信息2017年,全球自动编码市场估计在2.76B美金并且按照预期的11.5%的CAGR,到2022年将达到4.75B80%的医疗数据时非结构化数据,需要结构化后才能进一步分析临床大数据云平台病案首页云平台电子病历结构化病历信息美金1病案首页患者诉发冷,出现寒战,头晕,恶心未吐。血常规:白细胞数17.83*109/L,。查体:左肾区叩击痛阳性,未触及肿块。考虑患者泌尿系感染合并SIRS。制定治疗方案:1停止静点头孢替唑,给予头孢哌酮舒巴坦钠2.03/日静点症状
19、有无寒战,头晕,恶心呕吐ICD-10疾病编码17.83*109/L左肾区叩击痛阳性肿块检验 白细胞自然语言理解理解自动编码体征有无ICD-9-CM手术编码诊断治疗泌尿系感染合并SIRS头孢替唑无有头孢哌酮舒巴坦钠1https:/ LSTM+CRF 模型B-疾病OB-症状I-症状E-症状实体抽取CRF隐藏层tanhtanhBi-LSTM词嵌入糖尿病导致左下肢感染p 模型只能解决部分问题p 无恶心,呕吐,无发烧,发冷p 尿尿尿不出尿来3天p 全身浅表淋巴结未触及肿大,头颅无,五官端正p 今查房,症状同前,体查同前,治疗同前p 巴林斯基征,巴氏征,巴宾斯基征,巴宾斯基,babinski征,巴彬斯基征
20、,babinskisign。电子病历结构化和标准化产品2F自动抽取电子病历文本中的信息(例如疾病,症状,症状属性等),并利用知识图谱将信息标准化。生成标准化的结构化数据数据看板,快速浏览结构化电子病历的统计信息支持对于结构化电子病历的语义查询基于机器学习的自动编码2Fp 通过机器学习来自动的推荐编码,包括主要诊断,次要诊断以及手术编码p 通过医学知识图谱来进一步提高性能p 考虑整体的电子病历来提取特征p 就诊过程p 出院医嘱p 患者基本信息p 患者主诉p 病理报告p 出院诊断六位码性能主要诊断四位码性能主要诊断AUChit5AUChit50.990.890.990.92模型比较2F训练数据:2
21、2万+电子病历,包含临床诊断描述,科室,患者信息等和icd编码LabelHit1Hit5coveragecoverage模型()hit1=0.95hit1=0.90模型1(一层六位码模型)(六位码)0.620.852%5%模型2(层级模型)(六位码)0.660.730.850.8917%20%28%32%模型3(层级多任务模型)(六位码)hit1 = 模型只给出一个备选编码的时候就是正确编码的百分比hit5 = 模型给出5个备选编码的时候包含正确编码的百分比coverage (hit1=0.95) 在hit1可以达到0.95的时候,模型可以覆盖的病历百分比coverage (hit1=0.90
22、) 在hit1可以达到0.90的时候,模型可以覆盖的病历百分比减少20%的人工审核时间置信度t智能编码模块给出一个ICD编码准确度高于95%,无需人工审核病历和搜索查找比较,将编码推荐范围从30降低到5,减少3040%的人工置信度=t给出五个ICD编码给出5个备选编码,供人工挑选基于知识图谱的医学文献查询2F命名实体识别研究疾病人群P实体链接关系抽取干预方式医学文献IC治疗结局比较方式属性抽取主题提取有效无效中立O方法实验方法情感分类基于知识图谱的医学文献查询2F利格列汀联合二甲双胍及磺脲类药物在2型糖尿病患者治疗中有效性、安全性分析2型糖尿病患者,已经在服用二甲双胍,血糖控制不满意,加入哪种口服降糖药合适?摘要:目的: 研究利格列汀联合二甲双胍及磺脲类降糖药物治疗(二甲双胍及磺脲类药物血糖控制不佳的)的2型糖尿病患者有效性及安全性的相关数据。方法:48例2型糖尿病患者按2:1比例随机分为利格列汀组与安慰剂组,两组均用药24周。结果:利格列汀与二甲双胍及磺脲类降糖药物联合应用24周可以显著降低糖化血红蛋白(HbA1c)的水平(与安慰剂组比较,HbA1c较基线时下降0.62%,P0.0001)。结论:利格列汀与二甲双胍及磺脲类降糖药物联合应用安全有效。文献1研究干预方式口服降糖药比较方式二型糖尿病治疗1治疗2DPP-4磺脲类实验方法随机实验利格列汀格列美脲二甲双胍安慰剂Thanks
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。