当知识图谱遇到医疗行业:挑战、关键技术与应用课件.pptx

上传人(卖家):晟晟文业 文档编号:5156595 上传时间:2023-02-15 格式:PPTX 页数:50 大小:6.94MB
下载 相关 举报
当知识图谱遇到医疗行业:挑战、关键技术与应用课件.pptx_第1页
第1页 / 共50页
当知识图谱遇到医疗行业:挑战、关键技术与应用课件.pptx_第2页
第2页 / 共50页
当知识图谱遇到医疗行业:挑战、关键技术与应用课件.pptx_第3页
第3页 / 共50页
当知识图谱遇到医疗行业:挑战、关键技术与应用课件.pptx_第4页
第4页 / 共50页
当知识图谱遇到医疗行业:挑战、关键技术与应用课件.pptx_第5页
第5页 / 共50页
点击查看更多>>
资源描述

1、医疗行业的现状与机医疗行业的现状与机遇遇行业知识图谱的关键技术医疗知识图谱应用当知识图谱当知识图谱遇遇 到医疗行到医疗行业业 挑挑战、关键战、关键技技 术术与应与应用用大数据时代医疗行业的现大数据时代医疗行业的现状状以病历为典型的文本型数以病历为典型的文本型数据据没有统一标准缺乏统一描述数据杂乱,种类繁数据杂乱,种类繁多多药品数据库 医疗文献 医疗专家 疾病数据库 病患信息医疗服务体系不完医疗服务体系不完善善患者看病难,体验差,效率低新药物研发成本新药物研发成本高高 时间周期时间周期长长行业目标行业目标数据治理的效与数据治理的效与用用效效 知识统一建模知识统一建模 多源异构数据整合多源异构数据

2、整合 数据更新友好数据更新友好 知识协同编辑管理知识协同编辑管理用用人机交互式人机交互式BI 可视化分析可视化分析 决策支持决策支持 智能问答智能问答知知识识 图图谱谱什么是知识图谱什么是知识图谱?知识图谱旨在描述真实世界中存在的知识图谱旨在描述真实世界中存在的各种各种实体或概念实体或概念,以及它,以及它们们 之间的关联关系之间的关联关系。其中:每个实体或概念用一个全局唯一确定的ID来标识,称为标识符;每个属性值对用来刻画实体的内在特性,而关系用来连接两个实体,刻画它们之间的关联。现实世界中有多种类型的事现实世界中有多种类型的事物物事物之间有多种类型的链事物之间有多种类型的链接接知识图谱知识图

3、谱(Knowledge Graph)于于2012年年5月首先由月首先由Google提提出出通用知识图通用知识图谱谱 VS 行业知识图行业知识图谱谱 面向某一特定领域面向某一特定领域 基于行业数据构建基于行业数据构建“基于语义技术的行业知识库基于语义技术的行业知识库”强调知识的深度强调知识的深度 潜在使用者是行业人员潜在使用者是行业人员通用知识图谱通用知识图谱 面向通用领域面向通用领域 以常识性知识为主以常识性知识为主“结构化的百科知识结构化的百科知识”强调知识的广度强调知识的广度 使用者是普通用户使用者是普通用户行业知识图谱助力人工智能应行业知识图谱助力人工智能应用用语义搜语义搜索索私人助理私

4、人助理聊天机器人聊天机器人智能硬件智能硬件 Google Bing 百百度度 Siri Google Now 微软小微软小娜娜 百度度百度度秘秘 微软小微软小冰冰 公子小公子小白白 Apple Watch Ticwatch计算知识计算知识引引擎擎决策支持决策支持智能硬件智能硬件 IBM Watson Health 智能家智能家居居 智能厨智能厨房房百度知识图百度知识图谱谱语义搜索语义搜索医疗行业的现状与机遇行业知识图谱的关键技行业知识图谱的关键技术术医疗知识图谱应用当知识图谱当知识图谱遇遇 到医疗行到医疗行业业 挑挑战、关键战、关键技技 术术与应与应用用行业知识图谱生命周行业知识图谱生命周期期

5、常用方法常用方法 自顶向下的方法:专家手工编辑形成数据模式 自底向上的方法:基于行业现有的标准进行转换 从现有的高质量行业数据源(如业务系统数据库表)中进行映射需要考虑需要考虑 行业全数据分析,制定统一的知识分类体系 能够支撑事件、时序等复杂知识表达 多人在线协同编辑,并且实时更新 能够导入集成使用现有的(结构化)知识 支持大数据量可以与自动算法进行结合,避免全人工操作01知识建知识建模模知识建模:本体知识库结构设知识建模:本体知识库结构设计计SNOMED CT(Systematized Nomenclature of Medicine-Clinical Terms)医学系统命名法临床术语,是

6、当前国际上广为使用的一种临床医 学术语标准。提供了一套全面统一的 医学术语系统,涵盖大多数方面的临 床信息,如疾病、症状、指标、操作、微生物、药物等结构化数据半结构化数据纯文本数据链接数据数据库表格列表D2R转转换换图映图映射射信息抽信息抽取取多元组事件包装包装器器知识图知识图谱谱RDF三元组Infobox时序信息从不同来源、不同结构的数据中进行知识提取,形成知识存入到知识图谱。02知识获知识获取取知识抽取的方法:多策略学习方知识抽取的方法:多策略学习方法法封装器子图提取基于统计自监督学习基于规则 多数据源:结构化数据多数据源:结构化数据、半结构数据、文本数半结构数据、文本数据据多策略学多策略

7、学习习 利用不同数据源之间的冗余信息,使用较利用不同数据源之间的冗余信息,使用较易易 抽取的信息(结构化数据库)来辅助抽抽取的信息(结构化数据库)来辅助抽取取那那 些不易抽取的信息些不易抽取的信息。属性类型来源药材名称数值型处理后的药品 库.xlsx药材编号数值型药品库.xlsx规格数值型药品说明书知识抽取:病历结构知识抽取:病历结构化化 数据模式层融合数据模式层融合概念合并概念上下位关系合并概念的属性定义合并 数据层融合数据层融合实体合并实体属性融合冲突检测与解决行业知识图谱的数据模式通常采用自顶向下和自底向上结合的方式,因此基本都经过人工 的校验,保证了可靠性;因此,知识融合的关键任务在数

8、据层的融合。03知识融知识融合合知识融合需要考虑什么知识融合需要考虑什么实现不同来源、不同形态数据的融合海量数据的高效融合新增知识的实时融合多语言的融合知识融合知识融合疾病库知识的融疾病库知识的融合合知识离线融合知识离线融合-识别识别sameAs关系关系标标 签签摘摘 要要信信 息息 框框 主主 题题知识融合知识融合疾病库知识的融疾病库知识的融合合知识在线融合知识在线融合-知识卡片知识卡片知识图谱数据存储需要完成的基本数据存储知识图谱数据存储需要完成的基本数据存储:三元组知识的存储 事件信息的存储 时态信息的存储 使用知识图谱组织的数据的存储知识图谱上层应用需要支持知识图谱上层应用需要支持:知

9、识推理 知识快速查询 图实时计算04知识存知识存储储事件及时序知识存储方事件及时序知识存储方案案S.P.O.C.张三拥有就医记录 2017.05.082017.05.08就医记录-2018.01.20诊断结 果胁痛2018.01.20通过第四元来进行时间的存储通常,我们采用 匿名节点匿名节点 的方式来对事件进行存储S.P.O.张三拥有就医记录 2018.01.20就医记录-2018.01.20诊断结果胁痛就医记录-2018.01.20时间胁痛张张三三大规模知识图谱存储解决方大规模知识图谱存储解决方案案数据思维数据思维依据数据特点进行数据存储结构 选择与设计No Size Fits All没有一

10、种通用的存储方案能够解 决所有问题 基础存储支撑灵活 基础存储可扩展、高可用 按需要进行数据分割 适时使用缓存和索引 善于利用现有成熟存储 保持图形部分数据的精简 不在图中作统计分析计算指导思指导思想想整体原整体原则则知识图谱是基于图的数据结构,其存储方式主要有两种方式知识图谱是基于图的数据结构,其存储方式主要有两种方式:RDF存储存储&图数据库图数据库(Graph Database)05知识计知识计算算图挖掘计图挖掘计算算基于本体的推基于本体的推理理基于规则的推基于规则的推理理基于图论的相关算法,实 现对图谱的探索和挖掘。使用本体推理进行新知识 发现或冲突检测。使用规则引擎,编写相应 的业务

11、规则,通过推理辅 助业务决策。基于知识图谱的用药安全检基于知识图谱的用药安全检测测既往病史:高血压诊断结果:类风湿性关节炎布洛 芬片适用 症骨关节 炎痛风性 关节炎禁忌肝功 能不 全慎 用肾功 能不 全慎 用高血 压慎 用类风湿 性关节 炎李四 就医记录就医记录开药:布洛芬片语义搜语义搜索索智能问智能问答答可视化决策支可视化决策支持持 基于知识图谱中的知识,解决 传统搜索中遇到的关键字语义 多样性及语义消歧的难题;通 过实体链接实现知识与文档的 混合检索。针对用户输入的自然语言 进行理解,从知识图谱中 或目标数据中给出用户问 题的答案。通过提供统一的图形接口,结合可视化、推理、检 索等,为用户

12、提供信息获 取的入口。06知识应知识应用用青霉素青霉素G的副作的副作用用 孕妇能吃阿司匹林吗?孕妇能吃阿司匹林吗?用于结核病的药用于结核病的药物物副作用是什副作用是什么么不行。阿司匹林类药物禁忌:孕妇不行。阿司匹林类药物禁忌:孕妇医疗行业的现状与机遇行业知识图谱的关键技术医疗知识图谱应医疗知识图谱应用用当知识图谱当知识图谱遇遇 到医疗行到医疗行业业 挑挑战、关键战、关键技技 术术与应与应用用国外医疗知识图谱案例国外医疗知识图谱案例:IBM Waston 通过对医学文献进行打分评级,迅速整 理病患医疗记录,以提高肿瘤学家的工 作效率;通过分析海量医学文献,确定个性化诊 疗方案,助力肿瘤学家为患者

13、提供高质 量、循证型癌症治疗方案;通过美国纪念斯隆-凯特琳癌症中心获得 世界顶级肿瘤学专业国际水准肿瘤治疗 专业知识。ERK2抽抽磷酸磷酸化化抽抽p53抽抽在在抽抽Thr55抽抽取实取实体体ERK2=蛋白质,p53=蛋白质,Thr55=氨基酸取关取关系系映射到翻译后修饰域识别对象关系取实取实体体ERK2=蛋白质,p53=蛋白质,Thr55=氨基酸取介取介词词识别介词的位置在Thr55取实取实体体ERK2=蛋白质,p53=蛋白质,Thr55=氨基酸阿霉素导致细胞外信号调节激酶(ERK)2的激活,反过来磷酸化p53在以 前未知的站点,Thr55.Waston进行实体抽进行实体抽取取 抽抽取取 学习

14、 测试 经验胃肠道疼痛阿司匹林安定片抑郁 抽取药品=实体阿司匹林的抗血栓作用能够减少心机梗 学学习习副作用=实体关联事死的风险件已知副作用包括:胃肠道疼痛、肠胃不 测试事件=相关动词适、胃溃疡、消化道出血 经验规则=一个药品对应一个副作用安定和安定是苯二氮卓类衍生物,用于治疗焦虑,肌肉痉挛安定片,又名地西泮片,是苯二氮卓类精神药物,常用于医治焦虑、肌肉痉挛安定可引起抑郁、自杀意念、多动、激动、攻击、发怒Waston构建医疗知识图构建医疗知识图谱谱标记规则标记规则在文本中进行标注在文本中进行标注构建知识图谱构建知识图谱药物不只有一 种副作用胃肠道疼痛 肠胃不适 胃溃疡消化道出血多动 激动 攻击

15、发怒基于专家知识进行图谱扩基于专家知识进行图谱扩展展 抽取 学学习习 测试 经验胃肠道疼痛阿司匹林安定片抑郁建知识图建知识图谱谱知识图知识图谱谱胃肠道疼痛阿司匹林安定片抑郁构构建建W知知ats识识o n图图构构谱谱专专专专家家家家介介介介入入入入W基基a于于tso标标n应应注注用用进进注注行行释释扩扩&展展提提炼炼问问题题搜搜索索文本文本抽抽 取取分值分值&权权重重什么样的基 因会促使结 肠癌的形成?药物的副作用实验室记录基因发表刊物数量相关性关系领域事实/业务 规则Waston评估知识的置信评估知识的置信度度 抽取 学习 测测试试 经验共现关系共现关系表表选择两个或多个感兴趣的基因查看关系网

16、展示关系的强度、性质、距离有色向量表示相互作用的性质悬停在关系上查看证据基因网基因网络络 抽取 学习 测试 经经验验从两个不同的概念中选择实体(即,疾病/基因)可视化共现关系利用统计数据确定交叉点深入查看数据表现:表现:Waston通过短通过短时间分析海量语料时间分析海量语料,给出精准答给出精准答案案“医疗医疗”+知识图谱应知识图谱应用用问答问答资源标引资源标引推理推理可视化分析可视化分析融融合合实体对齐实体对齐Schema融合融合获获取取D2R图计算图计算语义计算语义计算决策支持决策支持知识建知识建模模文本抽取文本抽取冲突管理冲突管理解析解析专家专业知识专家专业知识数据接数据接入入知识更新知

17、识更新赋赋能能助力升助力升级级业务知识输业务知识输入入语义搜索语义搜索清洗清洗数据整合数据整合行业积累行业积累搜索范式搜索范式 迁移迁移病病证证症症病病历历文文献献方方药物发现药物发现辅助诊断辅助诊断轻问诊轻问诊医疗行情分析医疗行情分析图谱构建图谱构建层层数据处理数据处理层层应用应用层层能力能力层层药药智能问答智能问答知识服务知识服务让医疗相关从业人员更高效精准的获取信息医疗知识图谱应用:搜索范式迁移(医疗知识图谱应用:搜索范式迁移(1)语义搜索语义搜索实体检索实体检索全文匹配全文匹配医疗知识图谱应用:搜索范式迁移(医疗知识图谱应用:搜索范式迁移(2)大型药物数据集DrugBank目前收集了6

18、707药物实 体,其中包括FDA批准的1436种小 分子药物及其5086种实验性药物。医疗知识图谱应用:搜索范式迁移(医疗知识图谱应用:搜索范式迁移(3)适应适应症症副作副作用用症症状状药物类药物类别别药药品品阿司匹林的副作用是什么?阿司匹林 的 副作用 是什么?医疗知识图谱应用:轻问诊(医疗知识图谱应用:轻问诊(1)挂号、导医挂号、导医基础医疗在线问答基础医疗在线问答与传统就医模式不同,轻问 诊是将智能问答的应用与互 联网相结合,面向患者提供 的一种新型在线式的基础医 疗问答服务,该应用依托于 基于知识图谱的智能问答。医疗知识图谱应用:轻问诊(医疗知识图谱应用:轻问诊(2)告诉我你的症状是什

19、么?我觉得疲劳疲劳,而且头疼头疼、关节疼关节疼,还伴随有呕吐呕吐。据我所知,你很可能患了登革热登革热!虚拟医生虚拟医生患者患者智能问答智能问答医疗知识图谱应用:轻问诊(医疗知识图谱应用:轻问诊(3)虚拟医生使用虚拟医生使用Wiki数据知识数据知识虚拟医生虚拟医生智能问答智能问答医疗知识图谱应用:轻问诊(医疗知识图谱应用:轻问诊(4)虚拟医生使用虚拟医生使用Wiki数据知识数据知识虚拟医生虚拟医生智能问答智能问答医疗知识图谱应用:知识服务平医疗知识图谱应用:知识服务平台台 针对中医药知识体系系统梳理、建模和展示 以图形可视化方式展示核心概 念之间的关系 辅助中医专家厘清学术发展脉 络,浏览中医知

20、识,发现知识 点之间的联系。与阅读文献等手段相比,可大 幅度节约知识检索获取时间。http:/医疗知识图谱应用:药物发现(医疗知识图谱应用:药物发现(1)欧盟重大联合攻关项欧盟重大联合攻关项目目面向药物研发的开放数据访问平台开发,其核心技术就是采用语义技术为有关 研究人员提供高效的数据访问技术环境的支持。Open PHACTS 新药物发新药物发现现医疗知识图谱应用:药物发现(医疗知识图谱应用:药物发现(2)医疗知识图谱应用:药物发现(医疗知识图谱应用:药物发现(3)医疗知识图谱应用:辅助诊断(医疗知识图谱应用:辅助诊断(1)医疗大数据诊疗,其中包括基于认知 计算,以IBM Watson for

21、 Oncology 为代表的的辅助诊疗解决方案 针对诊断与治疗环节的医疗机器人医疗知识图谱应用:辅助诊断(医疗知识图谱应用:辅助诊断(2)知识知识库库智 能 语 义 处 理 系 统病症实体链接病症识别疾病特征描述对齐电子病电子病历历疾病特疾病特征征胸闷体温高于正常温度(发热)咳嗽 病情理解病情理解 备选诊断生成备选诊断生成特征选择语义检索潜在可能疾病获取图谱推理备选诊断结果备选诊断结果疾病特征知识库知识库疾 病A0 1C2 4T2 3A0 1.001C2 4.001C2 4.002C2 4.106A0 1肝持脾伤续肿寒高大烧白 细 胞 地 下疾病概念疾病概念胆 总 管 恶 性 肿 瘤胰 腺 壶

22、 腹 部 腺 癌手 烧 伤疾病本体疾病本体医疗知识图谱应用:辅助诊断(医疗知识图谱应用:辅助诊断(3)医疗行情数据覆盖摘医疗行情数据覆盖摘要要医疗知识图谱应用:医疗行情分析(医疗知识图谱应用:医疗行情分析(1)30万万药企资质信药企资质信息息4000万万法律信法律信息息100多多种种重点物料医药知重点物料医药知识识约约700万万历史天气数历史天气数据据1000+综合综合+行业新闻行业新闻源源医医 疗疗 行行 情情 数数 据据10000+供应商信供应商信息息1000万万条条物料价格数物料价格数据据16万万国产药品目国产药品目录录2000多多采购物采购物料料医疗知识图谱应用:医疗行情分析(医疗知识

23、图谱应用:医疗行情分析(2)原材料供应链可视化分析原材料供应链可视化分析 支持某医药企业全部一百多种重点物料的全景图展示 政策变更、异常天气等预警信息在图中直观显示,且实时更新 可根据需求只查看特定类型的节点或高亮某一影响链 路,影响关系/组成关系一目了然制药商合作关系图谱可视化公司与物料的关系可视化原材料价格的影响路径引自海知智能 药物采购量预药物采购量预测测医疗知识图谱应用:医疗行情分析(医疗知识图谱应用:医疗行情分析(3)实时监控辅助决策“秦岭大雪,连翘山茱萸受灾?”大雪大雪主产地信息查看原始新闻结合线下信息少量采购实 体 识 别秦岭秦岭物料减产物料减产物料价格 上升趋势预警信号预警信号连翘连翘&山茱萸山茱萸重点物料清单推 送 预 警 消 息医医生生医药公医药公司司 科研机科研机构构病病患患医医疗疗知识图知识图谱谱促进业务转型提升服务效率助力学术科研总总结结THANKS

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(当知识图谱遇到医疗行业:挑战、关键技术与应用课件.pptx)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|