1、第四章 循证医学证据的评价(The evaluation of evidence-based medicine evidences)循证医学循证医学 作者单位作者单位 温州医科大学温州医科大学 作者姓名作者姓名 杨新军杨新军教学要求教学要求掌握掌握:1.1.临床研究证据的分类临床研究证据的分类 2.2.临床研究证据的分级标准临床研究证据的分级标准 3.3.证据评价的基本要素证据评价的基本要素熟悉熟悉:1.1.临床研究证据的来源、证据评价的基本内临床研究证据的来源、证据评价的基本内 容容 2.2.常用的证据评价工具常用的证据评价工具了解了解:影响证据质量的因素影响证据质量的因素主要内容主要内容一
2、、概述一、概述 二、证据的来源二、证据的来源 三、证据的分类三、证据的分类四、证据的分级四、证据的分级五、证据的评价五、证据的评价六、影响证据质量的因素六、影响证据质量的因素七、证据评价举例七、证据评价举例一、概述一、概述 证据是循证医学的证据是循证医学的基础与核心基础与核心 证据质量决定循证医学决策的正确性和科学性证据质量决定循证医学决策的正确性和科学性 证据应具有证据应具有真实性、临床重要性、适用性真实性、临床重要性、适用性二、证据来源二、证据来源1.1.来自目前已有的证据资源库来自目前已有的证据资源库 现有证据资源库包括各种电子数据库、出版的书籍、现有证据资源库包括各种电子数据库、出版的
3、书籍、公开发表的期刊、网站、会议文献等,可以通过计算机或公开发表的期刊、网站、会议文献等,可以通过计算机或手工检索的方法,获取所需证据。手工检索的方法,获取所需证据。2.2.生产和创造证据生产和创造证据 医学决策者可以根据临床实践工作中发现的问题,开展医学决策者可以根据临床实践工作中发现的问题,开展原始研究或二次研究来生产和创造证据。原始研究或二次研究来生产和创造证据。三、证据的分类三、证据的分类(一)按照产生证据的研究方法分类(一)按照产生证据的研究方法分类 原始研究证据(原始研究证据(primary research evidenceprimary research evidence)是指
4、以是指以临床病人或社区居民为研究对象,开展的临床诊断、治临床病人或社区居民为研究对象,开展的临床诊断、治疗、预防和干预等的随机对照试验、队列研究或病例对疗、预防和干预等的随机对照试验、队列研究或病例对照研究等,获取原始资料,并进行分析、总结后,获得照研究等,获取原始资料,并进行分析、总结后,获得的研究证据。的研究证据。这类证据数量庞大,更新速度快。这类证据数量庞大,更新速度快。三、证据的分类三、证据的分类(三)按照临床研究问题的类型分类(三)按照临床研究问题的类型分类1.1.病因研究病因研究2.2.诊断研究诊断研究3.3.治疗研究治疗研究4.4.预后研究预后研究5.5.预防研究预防研究6.6.
5、临床经济学研究临床经济学研究四、证据的分级四、证据的分级证据质量分级的标准和方法:不断发展与完善证据质量分级的标准和方法:不断发展与完善 牛津大学循证医学中心的证据分级标准牛津大学循证医学中心的证据分级标准 GRADEGRADE标准标准表表4-1 20014-1 2001年牛津证据分级(以病因、治疗、预防部分为例)年牛津证据分级(以病因、治疗、预防部分为例)表表4-2 20044-2 2004年年GRADEGRADE证据分级及推荐强度证据分级及推荐强度五、证据的评价五、证据的评价(一)评价的目的(一)评价的目的 证据评价的目的证据评价的目的是明确证据的真实性、重要性和适用性,是明确证据的真实性
6、、重要性和适用性,更好地指导临床实践。更好地指导临床实践。(二)证据评价的基本要素(二)证据评价的基本要素1真实性真实性2临床重要性临床重要性(价值)(价值)3适用性适用性四、证据的评价四、证据的评价 研究设计的因素:研究设计的因素:设计的科学性、可行性,研究方法是否合理等;设计的科学性、可行性,研究方法是否合理等;研究对象的因素:研究对象的因素:纳入及排除标准、样本量大小、有无混杂因素;纳入及排除标准、样本量大小、有无混杂因素;研究方法的因素:研究方法的因素:测量指标选择、指标的敏感性和特异性,有无测量偏倚;测量指标选择、指标的敏感性和特异性,有无测量偏倚;研究结果的因素:研究结果的因素:基
7、线状况与可比性,统计分析方法是否正确,结果解释是基线状况与可比性,统计分析方法是否正确,结果解释是否合理等否合理等1.1.影响证据真实性的因素影响证据真实性的因素 效应指标的数值大小:如相对危险度、特异危险度等效应指标的数值大小:如相对危险度、特异危险度等 可信区间范围:可信区间范围:95%95%可信区间可信区间 检验效能:检验检验效能:检验powerpower 不同研究类型具体效应指标不同,如诊断性研究的灵敏度不同研究类型具体效应指标不同,如诊断性研究的灵敏度、特异度、预测值的大小,病因学研究证据的、特异度、预测值的大小,病因学研究证据的OROR或或RRRR值及值及可信区间范围的大小等可信区
8、间范围的大小等 2.2.影响证据临床重要性的因素影响证据临床重要性的因素 研究人群的人口学特征研究人群的人口学特征 研究对象类型研究对象类型 社会环境社会环境 经济条件经济条件3.3.影响证据适用性的因素影响证据适用性的因素四、证据的评价四、证据的评价(三)证据评价的基本内容(三)证据评价的基本内容 包括从包括从研究目的研究目的-研究方法研究方法-研究结果研究结果 -结论结论全过程的评价全过程的评价研究目的研究目的研究方法研究方法 研究对象研究对象 研究实施研究实施 质量控制质量控制 研究结果研究结果 结果分析结果分析 结果表达结果表达 研究设计研究设计 研究结论研究结论 经济学分析经济学分析
9、 四、证据的评价四、证据的评价表表4-3 4-3 研究类型与设计方案研究类型与设计方案(四)证据评价的工具(四)证据评价的工具 1.1.原始研究证据的评价工具原始研究证据的评价工具 四、证据的评价四、证据的评价(1 1)随机对照试验的评价工具)随机对照试验的评价工具 Jadad Jadad量表量表 CochraneCochrane偏倚风险评估工具偏倚风险评估工具 表表4-4 Jadad4-4 Jadad量表的质量标准(量表的质量标准(Jadad 1996Jadad 1996)表表4-5 Cochrane 4-5 Cochrane 偏倚风险评估工具偏倚风险评估工具 (2 2)非随机对照试验的评价
10、工具)非随机对照试验的评价工具 MINORSMINORS条目(条目(methodological index for non-randomized methodological index for non-randomized studiesstudies,MINORSMINORS)评价指标共评价指标共1212条条,每一条分为,每一条分为0 02 2分。分。前前8 8条针对无对照组的研究,最高分为条针对无对照组的研究,最高分为1616分;后分;后4 4条与前条与前8 8条一起针对有对照组的研究,最高分共条一起针对有对照组的研究,最高分共2424分。分。计分方法:计分方法:0 0分表示未报道;分
11、表示未报道;1 1分表示报道了但信息不充分;分表示报道了但信息不充分;2 2分表示报道了且提供了充分的信息分表示报道了且提供了充分的信息 表表4-6 MINORS4-6 MINORS评价条目评价条目 (3 3)观察性研究常用的评价工具)观察性研究常用的评价工具 NOSNOS量表(量表(The Newcastle-Ottawa ScaleThe Newcastle-Ottawa Scale,NOSNOS):NOSNOS量量表通过研究人群选择、可比性、暴露评价或结果评价三方面表通过研究人群选择、可比性、暴露评价或结果评价三方面共共8 8个条目的方法,评价病例对照研究和队列研究。个条目的方法,评价病
12、例对照研究和队列研究。AHRQAHRQ横断面研究评价标准横断面研究评价标准:美国卫生保健质量和研究机构:美国卫生保健质量和研究机构(Agency for Healthcare Research and QualityAgency for Healthcare Research and Quality,AHRQAHRQ)推荐评价横断面研究(推荐评价横断面研究(cross-sectional studycross-sectional study)的标准包)的标准包括括1111个条目。个条目。表表4-7 4-7 病例对照研究的病例对照研究的NOSNOS评价标准评价标准 表表4-8 4-8 队列研究的
13、队列研究的NOSNOS评价标准评价标准 1 1)是否明确了资料的来源(调查,文献回顾)是否明确了资料的来源(调查,文献回顾)?2 2)是否列出了暴露组和非暴露组(病例和对照)的纳入及排除标准或参考)是否列出了暴露组和非暴露组(病例和对照)的纳入及排除标准或参考 以往的出版物?以往的出版物?3 3)是否给出了鉴别患者的时间阶段?)是否给出了鉴别患者的时间阶段?4 4)如果不是人群来源的话,研究对象是否连续?)如果不是人群来源的话,研究对象是否连续?5 5)评价者的主观因素是否掩盖了研究对象其他方面情况?)评价者的主观因素是否掩盖了研究对象其他方面情况?6 6)描述了任何为保证质量而进行的评估(如
14、对主要结局指标的检测)描述了任何为保证质量而进行的评估(如对主要结局指标的检测/再检再检测);测);7 7)解释了排除分析的任何患者的理由;)解释了排除分析的任何患者的理由;8 8)描述了如何评价和(或)控制混杂因素的措施;)描述了如何评价和(或)控制混杂因素的措施;9 9)如果可能,解释了分析中是如何处理丢失数据的;)如果可能,解释了分析中是如何处理丢失数据的;1010)总结了患者的应答率及数据收集的完整性;)总结了患者的应答率及数据收集的完整性;1111)如果有随访,查明预期的患者不完整数据所占的百分比或随访结果。)如果有随访,查明预期的患者不完整数据所占的百分比或随访结果。AHRQAHR
15、Q横断面研究评价标准横断面研究评价标准 2.2.二次研究证据的评价工具二次研究证据的评价工具 (1 1)系统评价)系统评价/Meta/Meta分析的评价工具分析的评价工具 AMSTARAMSTAR量表量表 AMSTARAMSTAR量表包括如下量表包括如下1111个条目,每个条目均采用个条目,每个条目均采用“是是”、“否否”、“不知道不知道”和和“不适用不适用”进行判定。进行判定。1.1.是否提供了前期方案?是否提供了前期方案?2.2.纳入研究的选择和资料提取是否具有可重复性?纳入研究的选择和资料提取是否具有可重复性?3.3.是否进行了全面的文献检索?是否进行了全面的文献检索?4.4.发表状态是
16、否已考虑在纳入标准中,如灰色文献?发表状态是否已考虑在纳入标准中,如灰色文献?5.5.是否提供了纳入和排除的研究清单?是否提供了纳入和排除的研究清单?6.6.是否描述纳入研究的基本特征?是否描述纳入研究的基本特征?7.7.是否评价和报道了纳入研究的科学性?是否评价和报道了纳入研究的科学性?8.8.是否恰当地运用纳入研究的科学性推导结论?是否恰当地运用纳入研究的科学性推导结论?9.9.合成纳入研究结果的方法是否恰当合成纳入研究结果的方法是否恰当?10.10.是否评估了发表偏倚的可能性?是否评估了发表偏倚的可能性?11.11.是否报告了利益冲突?是否报告了利益冲突?AMSTARAMSTAR量表评价
17、条目量表评价条目 (2 2)临床实践指南的评价工具)临床实践指南的评价工具最常用的工具是最常用的工具是 临床指南研究与评价系统临床指南研究与评价系统(Appraisal of Guidelines for Research and(Appraisal of Guidelines for Research and Evaluation,AGREE)Evaluation,AGREE),即,即AGREEAGREE工具工具评价内容和方法:评价内容和方法:具体评价的具体评价的6 6个领域(个领域(2323个条目)个条目),每个条目的评分每个条目的评分为为1 17 7 分,分,1 1分表示指南完全不符合该
18、条目,分表示指南完全不符合该条目,7 7 分代表分代表指南完全符合该条目,指南完全符合该条目,2 26 6分代表指南不完全符合该条分代表指南不完全符合该条目,得分越高说明该条目符合程度越高目,得分越高说明该条目符合程度越高表表4-9 AGREE4-9 AGREE工具的评价内容工具的评价内容 六、影响证据质量的因素六、影响证据质量的因素 证据质量受研究设计、研究对象、样本量、统计方法以证据质量受研究设计、研究对象、样本量、统计方法以及偏倚及混杂的控制等多项因素影响。及偏倚及混杂的控制等多项因素影响。(一)可能增加证据质量的因素(一)可能增加证据质量的因素 效应值很大效应值很大 有剂量有剂量-效应
19、关系效应关系 可能的混杂因素会降低疗效可能的混杂因素会降低疗效 (二)可能降低证据质量的因素(二)可能降低证据质量的因素 研究的局限性研究的局限性 研究结果异质性研究结果异质性 间接证据间接证据 精确度不够精确度不够 发表偏倚发表偏倚 七、证据评价举例七、证据评价举例 例:某医生欲了解目前关于激素类药物治疗绝经期综合征例:某医生欲了解目前关于激素类药物治疗绝经期综合征的效果如何?是否有合适的药物可以治疗、治疗效果是否的效果如何?是否有合适的药物可以治疗、治疗效果是否肯定?肯定?于是医生进行了证据检索,以期回答上述问题于是医生进行了证据检索,以期回答上述问题 实施步骤:实施步骤:检索现有证检索现
20、有证据资源库据资源库 证据分类、证据分类、分级分级 证据评价、证据评价、应用应用 检索结果:检索结果:1.1.单用孕激素:单用孕激素:有有5 5项项RCTRCT研究研究发现,单用孕激素和安慰剂相比,可减轻血发现,单用孕激素和安慰剂相比,可减轻血管收缩症状;管收缩症状;有有1 1项项RCTRCT研究研究发现,单用孕激素和安慰剂相比,在血管收发现,单用孕激素和安慰剂相比,在血管收缩症状方面无统计学差异;缩症状方面无统计学差异;有有1 1项项RCTRCT研究研究发现,单用孕激素和安慰剂相比,在精神症发现,单用孕激素和安慰剂相比,在精神症状或在生活质量上无统计学差异;状或在生活质量上无统计学差异;2.
21、2.单用雌激素单用雌激素:系统综述和系统综述和RCTRCT研究发现研究发现,雌激素短时期应用(,雌激素短时期应用(3-63-6个月)个月)与安慰剂相比,可改善血管收缩症状、泌尿生殖器症状、精与安慰剂相比,可改善血管收缩症状、泌尿生殖器症状、精神症状及生活质量。但是雌激素有重要不良反应,包括增加神症状及生活质量。但是雌激素有重要不良反应,包括增加乳腺癌、子宫内膜癌、卒中及静脉血栓形成的风险。乳腺癌、子宫内膜癌、卒中及静脉血栓形成的风险。3.3.睾酮:睾酮:小样本的小样本的RCTRCT研究研究发现,睾酮加雌激素或安慰剂在血管收发现,睾酮加雌激素或安慰剂在血管收缩症状或性功能方面证据不一致。缩症状或
22、性功能方面证据不一致。未发现评估精神症状或生活质量的未发现评估精神症状或生活质量的RCTRCT研究研究4.4.植物雌激素:植物雌激素:有有9 9项项RCTRCT研究,研究,未能提供关于关于植物雌激素与安慰剂相未能提供关于关于植物雌激素与安慰剂相比,减轻血管收缩或其他绝经期综合征的一致证据。比,减轻血管收缩或其他绝经期综合征的一致证据。未发现评估生活质量的未发现评估生活质量的RCTRCT研究;研究;有有1 1项项RCTRCT发现,异黄酮与安慰剂相比,在发现,异黄酮与安慰剂相比,在5 5年内增加了单年内增加了单纯子宫内膜增生的妇女的比例。纯子宫内膜增生的妇女的比例。证据分类、分级:证据分类、分级:
23、根据检索到的证据类型看,只有一个属于二次研究证据根据检索到的证据类型看,只有一个属于二次研究证据(单用雌激素的一项系统综述,其他均为随机对照试验,是(单用雌激素的一项系统综述,其他均为随机对照试验,是原始研究证据。原始研究证据。根据牛津证据分级标准,随机对照试验是属于证据等级根据牛津证据分级标准,随机对照试验是属于证据等级1b1b级,质量较高;级,质量较高;根据根据GRADEGRADE证据分级标准,单用孕激素在改善血管收缩症证据分级标准,单用孕激素在改善血管收缩症状方面,是高质量的。状方面,是高质量的。证据评价、应用:证据评价、应用:根据根据JadadJadad量表和量表和CochraneCo
24、chrane偏倚风险评估工具,对偏倚风险评估工具,对RCTRCT研研究证据进行评价,也可将评价后的单个究证据进行评价,也可将评价后的单个RCTRCT合并,进行合并,进行MetaMeta分析,再评价。分析,再评价。通过证据真实性、临床重要性、适用性评价,再决定应通过证据真实性、临床重要性、适用性评价,再决定应用哪类药物进行治疗。用哪类药物进行治疗。结束语结束语 循证医学证据是开展循证医学实践的基础与核心,证据循证医学证据是开展循证医学实践的基础与核心,证据质量的高低直接影响循证决策的科学性和正确性。质量的高低直接影响循证决策的科学性和正确性。证据质量的评价包括证据的真实性、临床重要性和适用证据质量的评价包括证据的真实性、临床重要性和适用性三个基本要素,可根据证据类型不同选择不同的工具进行性三个基本要素,可根据证据类型不同选择不同的工具进行评价。评价。1.证据分类、分级的意义是什么证据分类、分级的意义是什么?2.证据分类依据有哪些证据分类依据有哪些?3.根据根据GRADE系统,研究证据可分为哪些等级和推荐强度?系统,研究证据可分为哪些等级和推荐强度?4.证据评价的三个基本要素是什么?证据评价的三个基本要素是什么?5.影响证据质量升高和降低的因素有哪些?影响证据质量升高和降低的因素有哪些?思考题思考题