1、第五章 循证医学实践中常用的统计学方法 第一节 临床证据的数据资料类型:P33 第二节 证据资料的方法学质量评价:在系统评价中介绍 第三节 统计学方法的正确选择:第四节 证据的临床意义与统计学意义:第六章第六章系统评价定义定义 针对某一具体临床问题;系统全面地收集临床研究文献;用统一的科学评价标准、筛选出符合质量标准的文献;用统计方法进行定量或定性合成;及时更新;用以提供最新知识和决策依据,改进临床实践。全新的文献综合方法!全新的文献综合方法!系统评价(系统评价(systematic review)目前目前被公认为客观地评价和综合针被公认为客观地评价和综合针对某一特定问题的研究证据的对某一特定
2、问题的研究证据的最佳手段最佳手段。Cochrane 系统评价系统评价 Cochrane 系统评价:系统评价:指Cochrane 协作网成员成员在Cochrane 协作网统一工作手册指导指导下下,在相应Cochrane评价组编辑部指导和指导和帮助帮助下所完成的系统评价。Meta分析分析 广义:广义:当系统评价用定量合成定量合成方法对资料进行统计学处理时所作的系统评价也可称为Meta分析分析;狭义:狭义:只是一种定量合成的统计处理方法。Meta分析原理:分析原理:将多个同类研究同类研究结果进行合并与合并与汇总汇总,能从统计学角度达到增大样本含量增大样本含量,提高提高检验效能检验效能的目的。尤其是当
3、多个研究结果不一致不一致或都没有统计学意义时,采用Meta分析可得到更加接近真实情况的综合分析结果。文献评价的类型文献评价的类型 传统/叙述性文献综述 系统评价/系统综述传统/叙述性文献综述 综合性描述描述,反映过去、现况、发展方向 选题:作者需要或感兴趣的领域;近年有较大进展的某一专题;存在较多争议的某一专题,需要加以归纳整理,并提出一些作者自己的观点。传统/叙述性的文献综述:格式格式 前言:前言:撰写综述的理由、目的、意义、背景;正文正文 对论述的问题分析归纳,按时间顺序纵向描述或按国际、国内横向论述或纵横结合;总结总结 得出结论,指出有待解决的问题。系统评价与传统综述的比较 共同点:共同
4、点:目的:目的:提供新知识和信息,让读者在短时间内了解某专题的研究概况和发展方向;获得解决某一临床问题的方法。回顾性、观察性:回顾性、观察性:均可能存在系统偏倚和随机误差。不同点:不同点:减少偏倚程度减少偏倚程度的不同(最根本的)传统文献综述的传统文献综述的主要缺陷:主要缺陷:主观综合主观综合,作者的观点有一定作者的观点有一定倾向性倾向性;缺乏共同遵守的缺乏共同遵守的原则和步骤原则和步骤,缺乏统一的缺乏统一的检索检索方法方法;注重统计学是否注重统计学是否“有意义有意义”;对原始文献对原始文献质量质量考虑较少考虑较少,筛选文献没有严格筛选文献没有严格统一的标准统一的标准,等价等价对待每篇文献,无
5、权重;对待每篇文献,无权重;定性而非定量;定性而非定量;结论可能不完整结论可能不完整,重复性重复性一般较差。一般较差。系统评价的系统评价的优势优势:针对针对具体具体临床问题;临床问题;收集收集所有所有的文献;的文献;根据根据科学标准评估科学标准评估,删除无科学性文献,删除无科学性文献,并在讨论中说明;并在讨论中说明;将符合条件文章的结果加以将符合条件文章的结果加以定量定量综合;综合;格式与格式与论著论著相同相同,作为论著发表。作为论著发表。系统评价的格式:格式:题目:题目:摘要:摘要:结构式(目的、方法、结果、结论)结构式(目的、方法、结果、结论)前言:前言:方法:方法:文献检索、研究的选择、
6、质量评估文献检索、研究的选择、质量评估 数据摘录、研究特征、数据定量综合方法数据摘录、研究特征、数据定量综合方法 结果:结果:描述研究特征、数据定量综合描述研究特征、数据定量综合 讨论:讨论:针对结果进行讨论针对结果进行讨论 结论:结论:系统评价实例:系统评价实例:综述综述Meta-分析分析系统评价系统评价几个概念的范围包含关系几个概念的范围包含关系系统评价的重要性:应对信息时代的挑战:应对信息时代的挑战:海量信息需要整合、避免海量信息需要整合、避免“只见树木不见森林只见树木不见森林”。专业人员定期对相关临床研究进行严格总结,临床医师能更快、更准确、更方便地了解最新医疗措施,指导临床实践,提高
7、医疗质量;促进成果转化:促进成果转化:结论更真实、可靠:结论更真实、可靠:被推荐为疗效评价的金标准疗效评价的金标准,为临床治疗实践提供可靠依据 节约研究成本,提高统计效能:节约研究成本,提高统计效能:为临床科研提供立题依据:为临床科研提供立题依据:避免重复研究重复研究 克服传统文献综述的缺陷:克服传统文献综述的缺陷:连接新旧知识的桥梁:连接新旧知识的桥梁:系统评价的种类系统评价的种类 1.1.按临床问题分:按临床问题分:病因、诊断性试验、治疗、预后、卫生经济学等;2.2.按研究设计方案分:按研究设计方案分:试验性:RCT、CCT等 观察性:队列研究、病例对照研究等;3.3.按综合方法分:按综合
8、方法分:定量综合、定性综合 4.4.按纳入原始研究类型分:按纳入原始研究类型分:回顾性、前瞻性、累积性、单个病例资料等。提出问题、确定题目;提出问题、确定题目;确定系统评价目的,拟定确定系统评价目的,拟定研究计划研究计划/方案;方案;检索文献;检索文献;根据入选标准选择合格的文献;根据入选标准选择合格的文献;对纳入研究进行质量评价;对纳入研究进行质量评价;提取信息,建立数据库;提取信息,建立数据库;统计学分析处理,形成结果;统计学分析处理,形成结果;敏感性分析;敏感性分析;结果解释,形成总结报告;结果解释,形成总结报告;改进与更新。改进与更新。系统评价制作的步骤与方法系统评价制作的步骤与方法一
9、、提出问题并形成系统评价题目 问题的要求:问题的要求:科学性、临床意义;可能得到回答。问题/题目构成要素:简明、准确、具体简明、准确、具体 研究对象研究对象 干预与对比类型干预与对比类型 评价的结局评价的结局 研究设计方案研究设计方案提出问题提出问题:每日口服低剂量的茶碱,能否增加中年男性大学讲师的FEV1(一秒钟用力呼气容积)?(RCT)定义了干预定义了对象定义了结果因素定义研究类型二、系统评价研究方案(1)1.研究背景:研究背景:临床问题的重要性、意义;需要解决的问题;以往的系统评价情况、是否存有争议等。2.目的:目的:解决有矛盾的证据;回答一些尚无确切答案或有多种不同解释问题;最终目的最
10、终目的是概括并帮助人们正确地理解证据。系统评价研究方案(2)3.制定检索策略;制定检索策略;4.选择合格文献的标准(纳入标准);选择合格文献的标准(纳入标准);5.评价文献质量的方法;评价文献质量的方法;6.提取和分析数据的方法;提取和分析数据的方法;7.结果的分析和报告。结果的分析和报告。系统评价研究方案(3)Cochrane协作组将对研究方案进行评审、评审、修改并提出反馈意见修改并提出反馈意见;研究方案将在Cochrane系统评价数据库中发表发表并接受来自用户的评论或批评。原则:原则:多途径、多渠道、最大限度多途径、多渠道、最大限度 途径:途径:利用多途径广泛收集资料利用多途径广泛收集资料
11、 多种电子资源数据库多种电子资源数据库 参考文献的追溯参考文献的追溯 注意注意未正式发表未正式发表“灰色文献灰色文献”(grey literature)的收集:这些文献中可能包含的收集:这些文献中可能包含阴性阴性研究结果:研究结果:会议专题论文会议专题论文 未发表的学位论文未发表的学位论文 其他原因未发表的文献其他原因未发表的文献 专著内的章节专著内的章节 制药工业的报告制药工业的报告 临床试验注册登记系统临床试验注册登记系统 手工检索手工检索三、检索文献三、检索文献 检索大量的文献;检索大量的文献;根据入选和排除标准进行仔细的筛选;根据入选和排除标准进行仔细的筛选;挑出合格的研究进行系统评价
12、和挑出合格的研究进行系统评价和Meta分析。分析。四、根据入选标准选择合格的研究四、根据入选标准选择合格的研究选择研究 按照纳入标准:按照纳入标准:研究设计类型;样本量。要求两人独立进行评估:要求两人独立进行评估:不一致时由第三者或双方讨论协商解决:不一致时由第三者或双方讨论协商解决:研究质量评价的内容:研究质量评价的内容:内部真实性内部真实性:该研究结果是否真实可靠?该研究结果是否真实可靠?外部真实性:外部真实性:是否有推广价值,能否应用于临是否有推广价值,能否应用于临床病人?床病人?临床重要性:临床重要性:是否能是否能改变改变我的临床实践?应怎样做?我的临床实践?应怎样做?方法学质量:方法
13、学质量:研究设计和实施过程中研究设计和实施过程中避免或减避免或减小偏倚小偏倚的程度!的程度!五、对纳入研究进行质量评价五、对纳入研究进行质量评价-系统评价特有!系统评价特有!内部真实性内部真实性 研究的科学性:设计设计 结果的可靠性:临床试验中的误差:随机误差(CI宽度)、系统误差 系统误差即是偏倚:选择偏倚:测量偏倚:实施偏倚:失访偏倚:混杂偏倚:外部真实性外部真实性 实用价值:研究结果在多大程度上可应用于其他环境?取决于纳入试验病例的特征、研究背景、试验的特征、研究背景、试验的治疗方案以及评估的结局治疗方案以及评估的结局 注意:注意:如果内部真实性有问题,评价外部真实性就如果内部真实性有问
14、题,评价外部真实性就毫无意义!毫无意义!方法学质量:设计类型及实施设计类型及实施(证据的强度等级)系统评价和 Meta-分析;有明确结论的RCT;如:可信区间范围不包含临床意义的临界值 未得到明确结论的RCT;如:点估计值提示有临床意义,但可信区间范围包含了临界值 队列研究;病例对照研究;横断面研究;病例报告不同的临床问题需要不同的研究设计不同的临床问题需要不同的研究设计临床问题临床问题最佳最佳的研究设计的研究设计疗效评价疗效评价RCT治疗的不良反应治疗的不良反应RCT诊断或筛查试验诊断或筛查试验与金标准进行盲法比较与金标准进行盲法比较预后评价或病因研究预后评价或病因研究队列研究队列研究无法进
15、行无法进行RCT或有伦或有伦理问题的疗效评价理问题的疗效评价队列研究队列研究暴露不良环境的危害暴露不良环境的危害病例对照研究病例对照研究随机对照临床试验实施实施评价 四大要素:四大要素:设立对照组:随机分组:方法:简单随机化、区组随机、分层随机 盲法(Blinding):-外观一致的对照药或安慰剂 随访情况:随访 退出和失访:原因:原因:已纳入的病例发现不符合纳入标准的情况;出现药物副作用的病例;对分配分组的治疗不依从的病例。治疗意愿分析治疗意愿分析(intention-to-treat analysis)“最差情况最差情况”分析分析(worst-casescenario)运用有关质量评价量表
16、进行评估,如运用有关质量评价量表进行评估,如Jadad量表量表随机分组序列的产生方法2分:通过计算机产生的随机序列或随机数字表产生的序列;1分:试验提到随机分配,但产生随机序列的方法未予以交待;0分:半随机或准随机试验,指采用交替分配病例的方法,如按入院顺序、出生日期单双数。双盲法2分:描述了实施双盲的具体方法并且被认为是恰当的,如采用完全一致的安慰剂等;1分:试验仅提及采用双盲法;0分:试验提及采用双盲,但方法不恰当如比较片剂与注射剂而未提到使用双假的方法。退出与失访1分:对退出与失访的病例数和退出的理由进行了详细地描述;0分:没有提到退出或失访。对研究质量的处理 排除质量低的研究,但有排除
17、产生真实性结果研究的危险;纳入低质量的试验,同时探讨质量高低对效应估计值的影响。用敏感性分析探讨排除低质量研究对系统评价结果证据强度的影响;使用Meta回归模型;累积性Meta分析。六、提取信息,建立数据库六、提取信息,建立数据库 按事先制定的按事先制定的资料摘录表内容资料摘录表内容提取相应变量并提取相应变量并填表;填表;用用meta分析软件(分析软件(RevMan)中的)中的MetaView或或SPSS、SAS、EXCEL等建立数据库;等建立数据库;注意注意对计量资料必须注明单位;对计量资料必须注明单位;双重录入。双重录入。提取的内容:提取的内容:收集者的姓名:收集者的姓名:研究出处、研究者
18、:研究出处、研究者:研究的质量和结果数据:研究的质量和结果数据:研究设计类型、方法、过程的质量控制 研究对象:来源、诊断标准、入选和排除标准 干预措施:干预及方法、时间、随访期 结局的测量:指标、测定方法、质控七、统计学处理,形成结果七、统计学处理,形成结果 一、效应量的统计描述 二、异质性检验 三、合并效应量估计与统计推断 模型选择:固定效应模型 随机效应模型 四、敏感性分析 五、结果解释统计描述指标 连续变量:均数、平均差值、连续变量:均数、平均差值、率差率差 二分类变量:比值比二分类变量:比值比(OR)、相对危相对危险度险度(RR)计算各指标的计算各指标的CI:重要性:重要性:Meta分
19、析重要的环节分析重要的环节 目的目的:检查各个独立研究的结果是否具有可合并性检查各个独立研究的结果是否具有可合并性 产生异质性的原因产生异质性的原因 研究设计不同研究设计不同 试验条件不同试验条件不同 试验所定义的暴露、结局及其测量方法不同试验所定义的暴露、结局及其测量方法不同 协变量的存在协变量的存在 注注 意意 资料的资料的“可合并性可合并性”异质性检验异质性检验 (heterogeneity test)异质性异质性的处理的处理忽略异质性检验异质性合并解释固定效应模型有异质性不合并随机效应模型亚组分析Meta回归Meta分析中异质性资料处理的方法分析中异质性资料处理的方法 检查一定假设条件
20、下结果稳定性的方法检查一定假设条件下结果稳定性的方法 目的:目的:发现影响发现影响meta分析研究结果的主要因素;分析研究结果的主要因素;解决不同研究结果的矛盾性;解决不同研究结果的矛盾性;发现产生不同结论的原因。发现产生不同结论的原因。分层分析:分层分析:按不同研究特征,将各独立研究分为不同组按不同研究特征,将各独立研究分为不同组按按Mental-Haenszel法进行合并分析法进行合并分析比较各组及其与合并效应间有无显著性差异比较各组及其与合并效应间有无显著性差异八、敏感性分析八、敏感性分析 可以用直观的图示方法表示可以用直观的图示方法表示 九、总结报告九、总结报告研究结果研究结果(线宽线
21、宽表示其表示其95%CI)研究结果点估计值研究结果点估计值,其大小代表该研究在其大小代表该研究在Meta分析中的权重分析中的权重无效应线无效应线各个研究合并各个研究合并后的效应估计后的效应估计)循证医学标志图循证医学标志图(糖皮质激素治疗早产孕妇的系统评价结果图糖皮质激素治疗早产孕妇的系统评价结果图)偏倚的种类偏倚的种类 偏倚的检查偏倚的检查系统评价的偏倚及其检查系统评价的偏倚及其检查 发表偏倚(发表偏倚(publication bias)定位偏倚(定位偏倚(location biases)引用偏倚(引用偏倚(citation bias)多次发表偏(多次发表偏(multiplepublicat
22、ion bias)有偏倚的入选标准(有偏倚的入选标准(biased inclusion criteria)一、偏倚的种类一、偏倚的种类 定义:定义:具有统计学显著性意义的研究结果较无显著性具有统计学显著性意义的研究结果较无显著性意义和无效的结果被报告和发表的可能性更大。意义和无效的结果被报告和发表的可能性更大。产生原因:产生原因:医学文献中发表偏倚的问题相当严重医学文献中发表偏倚的问题相当严重 如果如果meta分析只是基于已经发表的研究结果,分析只是基于已经发表的研究结果,可能会夸大疗效,甚至得到一个虚假的疗效!可能会夸大疗效,甚至得到一个虚假的疗效!(一)发表偏倚(一)发表偏倚 解决办法解决
23、办法 好的好的meta分析应包括所有与课题有关的可获得的资料,尤分析应包括所有与课题有关的可获得的资料,尤其应其应尽最大可能收集未发表尽最大可能收集未发表的研究;的研究;先行将所有的先行将所有的RCT进行进行登记登记,通过这一系统随访并获得所,通过这一系统随访并获得所有研究的结果是解决发表偏倚的根本途径;有研究的结果是解决发表偏倚的根本途径;应用统计学方法,计算应用统计学方法,计算拒绝拒绝结论所需的未发表研究结论所需的未发表研究数量数量的的大小,评估发表偏倚对研究结果的影响。大小,评估发表偏倚对研究结果的影响。Meta分析检查上述偏倚的最佳途径分析检查上述偏倚的最佳途径 :先根据一个基本的入选
24、标准收集全部的研究先根据一个基本的入选标准收集全部的研究再考虑不同的入选标准进行彻底的再考虑不同的入选标准进行彻底的敏感性分析敏感性分析 检查偏倚的检查偏倚的程度程度:漏斗图分析(漏斗图分析(funnel plots)计算失效安全数(计算失效安全数(fail-safe number,Nfs)二、偏倚的检查二、偏倚的检查 漏斗图:漏斗图:相对于样本量的效应值,是以研究的效应估计值相对于样本量的效应值,是以研究的效应估计值作为横坐标,样本量作为纵坐标画出的散点图。作为横坐标,样本量作为纵坐标画出的散点图。漏斗图分析漏斗图分析 1.1.根据图形的不对称程度判断根据图形的不对称程度判断Meta分析中偏
25、倚有无;分析中偏倚有无;2.2.基于治疗效应的基于治疗效应的精确度精确度随样本量增大而增加这一事实。随样本量增大而增加这一事实。(一)漏斗图分析(一)漏斗图分析针灸治疗中风的针灸治疗中风的4949个试验的漏斗图分析个试验的漏斗图分析 (Tang TL,1999,1999)如果如果MetaMeta分析分析中没有偏倚,中没有偏倚,图形构成一个图形构成一个对称的倒置对称的倒置“漏斗漏斗”;如;如果图形呈现明果图形呈现明显的不对称,显的不对称,表明偏倚可能表明偏倚可能存在存在(见右图见右图)样本量小的样本量小的研究结果通研究结果通常分散在图常分散在图形底部很宽形底部很宽的范围内的范围内样本量大的样本量
26、大的研究结果集研究结果集中在图形上中在图形上部一个较窄部一个较窄的范围内的范围内目前发表的系统综述和目前发表的系统综述和Meta分析分析存在的问题:存在的问题:文献查全率不高;文献查全率不高;没有列出被排除的试验;没有列出被排除的试验;病人的特征范围、诊断标准和治疗范围不明确;病人的特征范围、诊断标准和治疗范围不明确;对资料的可合并性的检验较差;对资料的可合并性的检验较差;对潜在偏倚的控制和检测不足;对潜在偏倚的控制和检测不足;统计分析不规范;统计分析不规范;缺少对原始研究的质量评价,未改变方法进行敏感缺少对原始研究的质量评价,未改变方法进行敏感度分析;度分析;缺少对发表偏倚的检测;缺少对发表
27、偏倚的检测;缺少对结果应用价值的评估。缺少对结果应用价值的评估。第七章 循证医学实践的个体化原则与方法第一节 最佳证据具备的特性 一、真实性:主要分析内部真实性 二、重要性:主要分析临床应用价值 三、实用性:是否适合我的病人?四、物美价廉:第二节 循证证据应用的个体化原则 一、生物学依据 二、病理生理学依据 三、社会-心理及经济学依据 四、利弊原则 效果预测:循证医学学科的客观分析循证医学学科的客观分析实施循证医学的困难困难及出路 一、EBM在国外的发展n 在国外的发展1992年Journal of American Medical Association 发表了EBM工作组对EBM的全面阐述
28、。1995年以后,国际上其它著名医学期刊著名医学期刊,如 British Medical JournalThe New Eng1and Journal of MedicineThe LancetAnnals of Internal Medicine等纷纷发表有关EBM的述评及评论,并在全世界范围内兴起了一股EBM的热潮。20世纪世纪90年代中期年代中期,EBM在发达国家得到了前所未有的高度重视和日益普遍的应用。1992年在英国伦敦成立了以已故临床流行病学家Cochrane的名字命名的 “Cochrane中心”,旨在收集世界范围的RCT,并对其进行Meta分析,即将各专业的RCT集中起来进行Me
29、ta分析,向世界临床医生提供临床决策的最佳证据。1993年10月,正式建立了世界范围的Cochrane协作网,迅速在全世界引起热烈响应。目前全世界已成立了15个Cochrane中心。British Medical Journal编辑部在2000年初出版了Best Clinical Evidence(最佳临床证据最佳临床证据)。这本书主要介绍当前根据临床试验或系统评价所取得的最新的最新的临床证据临床证据,每半年更新一次。美国医学会和British Medical Journal联合创办了Evidencebased Medicine杂志,这是EBM发展的又一里程碑。目前,国外越来越多的临床决策开始
30、从基从基于专家意见,于专家意见,转向转向基于临床证据基于临床证据。在英国、澳大利亚、美国等发达国家,EBM普遍应用到临床实践。EBM与医学各领域领域相结合,产生了循证医疗(Evidence-based health care)、循证诊断(Evidence-based diagnosis)、循证决策(Evidence-based decision-making)、循证医疗卫生服务购买 (Evidence-based purchashing)等分支领域。EBM与临床各专业专业结合,产生了循证外科(Evidence-based surgery)、循证内科(Evidence-based interna
31、l)、循证妇产科(Evidence-based Gynecoogy&obstetrtcs)、循证儿科(Evidence-based pediatrics)、循证护理(Evidence-based nursing)等分支学科。二、中国发展循证医学的特殊性二、中国发展循证医学的特殊性近几年来,开始大力宣扬EBM思想,有关EBM的论文开始出现在中文医学期刊;1998年-2001年4月澳大利亚Cochrane中心受世界Cochrane协作网的委托在中国举办四期培训班。中国Cochrane中心于1998年在成都华西医科大学成立。中国Cochrane中心的成立,标志着我国临床医学正在走近EBM;广东省卫生
32、科技发展“十五”计划及“2015年发展规划”中将EBM列为广东省未来15年重点发展的六项关键技术之一,并予以重点扶持,广东省循证医学中心已于2000年7月依托中山医科大学成立。目前,国内临床医学模式仍停留在传统传统的经验医学模式的经验医学模式,多数医疗单位的临床研究仍停留在叙述性临床病例叙述性临床病例总结的水平,临床研究方法十分混乱临床研究方法十分混乱,许多先进的方法不会用,不了解,只能总结临床只能总结临床经验经验。临床研究因为方法学方法学的落后,研究水平很难跟基础研究相比。EBM在我国临床诊治实践、撰写论文、开展临床科研等方面的应用还非常薄弱。2000年初以来,国内众多医学杂志,包括中华医学
33、系列杂志中华医学系列杂志,开始大力宣传EBM思想,并结合临床各科的临床实践,纷纷以述评的方式在杂志上发表专家论文,引导临床医生接受EBM思想。但就目前国内的总体现状来看,EBM还是一个新领域,特别是在如何提供证据、产生证据方面,所开展的临床科研工作远不能满足EBM方法学的要求。三、循证医学发展的困难和局限性 1、收集、总结、传播和正确利用收集、总结、传播和正确利用 研究证据的困难;研究证据的困难;海量信息 研究结果的评价 研究结果的总结 临床医生和管理者时间有限,需要更快、更可靠的证据检索与利用的方法。2、虽然循证医学将会、虽然循证医学将会大大提高大大提高医疗卫生医疗卫生服务的质量和效率,但服务的质量和效率,但并不能解决所有并不能解决所有与人类健康有关的问题;与人类健康有关的问题;3、建立循证医学体系,需要花费、建立循证医学体系,需要花费一定的一定的资源;资源;4、医疗卫生决策还受、医疗卫生决策还受经济、社会、价值经济、社会、价值取向、伦理取向、伦理等影响,正确防治措施或最等影响,正确防治措施或最佳研究证据的推行有时佳研究证据的推行有时受到限制受到限制,甚至,甚至必须必须作出让步作出让步。