1、循证医学中的常用统计指标循证医学中的常用统计指标主要内容主要内容概述概述分类资料的指标分类资料的指标数值资料的指标数值资料的指标本ppt 主要以四川大学华西医院刘关键教授的课件为参考。数据资料可分为数值资料(计量)和分类资料数据资料可分为数值资料(计量)和分类资料(计数和等级)两大类。统计指标因而也分为数(计数和等级)两大类。统计指标因而也分为数值资料指标与分类资料指标两类。值资料指标与分类资料指标两类。统计指标可用于描述性的统计分析,也是反映数统计指标可用于描述性的统计分析,也是反映数据基本特征的统计分析方法。并可使人们准确、据基本特征的统计分析方法。并可使人们准确、全面地了解数据资料所包涵
2、的信息,以便于在此全面地了解数据资料所包涵的信息,以便于在此基础上完成资料的进一步统计分析。基础上完成资料的进一步统计分析。概述可信区间概述可信区间可信区间(可信区间(confidence interval,CI)是循证医)是循证医学中常用的统计指标之一。学中常用的统计指标之一。可信区间主要用于估计总体参数,从获取的样本可信区间主要用于估计总体参数,从获取的样本数据资料估计某个指标的总体值(参数)。如:数据资料估计某个指标的总体值(参数)。如:率的可信区间估计总体率,均数的可信区间估计率的可信区间估计总体率,均数的可信区间估计总体均数。总体均数。概述可信区间此外,可信区间还可用于假设检验,尤其
3、是试验组此外,可信区间还可用于假设检验,尤其是试验组与对照组某指标差值或比值的可信区间,在循证医与对照组某指标差值或比值的可信区间,在循证医学中更为常用。学中更为常用。通常,试验组与对照组某指标差值或比值的通常,试验组与对照组某指标差值或比值的95%可可信区间与信区间与为为0.05的假设检验等价,的假设检验等价,99%的的CI与与为为0.01的假设检验等价。的假设检验等价。概述可信区间常用的可信区间有:率的可信区间、两率差值的常用的可信区间有:率的可信区间、两率差值的可信区间、均数的可信区间、两均数差值的可信可信区间、均数的可信区间、两均数差值的可信区间、相对危险度可信区间等。区间、相对危险度
4、可信区间等。循证医学中常用的是率的可信区间、循证医学中常用的是率的可信区间、RR或或OR的的可信区间、均数的可信区间、两均数差值的可信可信区间、均数的可信区间、两均数差值的可信区间等。区间等。分类资料的指标在循证医学的研究与实践中,除了有效率、死亡在循证医学的研究与实践中,除了有效率、死亡率、患病率、发病率等常用率的指标外,相对危率、患病率、发病率等常用率的指标外,相对危险度(险度(RR)、比值比()、比值比(OR)及由此导出的其他)及由此导出的其他指标也是循证医学中富有特色的指标。指标也是循证医学中富有特色的指标。目前,在循证医学中分类资料常用的描述指标主目前,在循证医学中分类资料常用的描述
5、指标主要有要有EER、CER、OR、RR、RRR、ARR、NNT等。等。1、ERR与CER循证医学中预防和治疗性试验中,率可细分为循证医学中预防和治疗性试验中,率可细分为EER和和CER两类。两类。EER即试验组中某事件的发生率即试验组中某事件的发生率(experimental event rate,EER),如对某病采用某些防治措施后该疾病的发,如对某病采用某些防治措施后该疾病的发生率。生率。CER即对照组中某事件的发生率即对照组中某事件的发生率(control event rate,CER),如对某病不采取防治措施的发生率。,如对某病不采取防治措施的发生率。两个发生率的差即为率差,也称危险
6、差(两个发生率的差即为率差,也称危险差(rate difference,risk difference,RD),如,试验),如,试验组发生率(组发生率(EER)与对照组发生率()与对照组发生率(CER)的差,)的差,其大小可反映试验效应的大小。其大小可反映试验效应的大小。两率差的可信区间由下式计算:两率差的可信区间由下式计算:|p1-p2|u SE(p1-p2)=(RDu SE(p1-p2),RD+u SE(p1-p2)2 RD(率差)及可信区间 两率差为两率差为0时,两组的某事件发生率没有差别。因而两率差的可时,两组的某事件发生率没有差别。因而两率差的可信区间不包含信区间不包含0(上下限均大
7、于(上下限均大于0或上下限均小于或上下限均小于0),则两个率),则两个率有差别;反之,两率差的可信区间包含有差别;反之,两率差的可信区间包含0,则无统计学意义。,则无统计学意义。两两率率差差的的标标准准误误:S S E E(p p1 1-p p2 2)=p p1 1(1 1-p p1 1)n n1 1 +p p2 2(1 1-p p2 2)n n2 2 2 RD(率差)及可信区间 阿斯匹林治疗心肌梗死的效果2 RD(率差)及可信区间 死亡死亡未死亡未死亡例数例数阿斯匹林治疗组阿斯匹林治疗组15(a)110(b)125()()对照组对照组30(c)90(d)120()()合计合计45200245
8、()()阿斯匹林治疗心肌梗死的效果阿斯匹林治疗心肌梗死的效果EER=15/125=12%,CER=30/120=25%,两率差的标准误:,两率差的标准误:阿阿斯斯匹匹林林治治疗疗心心肌肌梗梗死死的的效效果果E E E E R R=1 1 2 2%,C C E E R R=2 2 5 5%两两率率差差的的标标准准误误:S S E E(p p1 1-p p2 2)=p p1 1(1 1-p p1 1)n n1 1 +p p2 2(1 1-p p2 2)n n2 2 =0 0.1 1 2 2(1 1-0 0.1 1 2 2)1 1 2 2 5 5 +0 0.2 2 5 5(1 1-0 0.2 2 5
9、 5)1 1 2 2 0 0 =0 0.0 0 4 4 9 9 2 RD(率差)及可信区间 该试验两率差(该试验两率差(RD)的可信区间为:)的可信区间为:RDu SE(p1-p2)=(0.12-0.25)1.960.049=(-0.23,-0.03)该例两率差的可信区间为该例两率差的可信区间为(-0.23,-0.03),上下,上下限均小于限均小于0(不包含(不包含0),两率有差别。可认为),两率有差别。可认为阿斯匹林可降低心肌梗死的病死率。阿斯匹林可降低心肌梗死的病死率。2 RD(率差)及可信区间 相对危险度相对危险度RR(relative risk,RR)是前瞻性研究中较)是前瞻性研究中较
10、常用的指标,它是试验组某事件发生率常用的指标,它是试验组某事件发生率p1与对照组与对照组(或低暴露)的发生率(或低暴露)的发生率p0之比,用于说明前者是后者之比,用于说明前者是后者的多少倍,常用来表示试验因素与疾病联系的强度及其的多少倍,常用来表示试验因素与疾病联系的强度及其在病因学上的意义大小。在病因学上的意义大小。其计算方法为:其计算方法为:RR=P1/P0=EER/CER3RR及可信区间 当当RR1时,可认为试验因素与疾病无关;时,可认为试验因素与疾病无关;当当RR1时,可认为试验组发生率大于对照组;时,可认为试验组发生率大于对照组;当当RR1时,可认为试验组发生率小于对照组。时,可认为
11、试验组发生率小于对照组。3RR及可信区间 3RR及可信区间 RR的可信区间,应采用自然对数进行计算,即应求的可信区间,应采用自然对数进行计算,即应求RR的自然对数值的自然对数值ln(RR)和和ln(RR)的标准误的标准误SE(lnRR),其,其计算公式如下:计算公式如下:SE(lnRR)=1 a +1 c 1a+b 1c+d ln(RR)的的1可信区间为:可信区间为:ln(RR)u SE(lnRR)RR的可信区间为:的可信区间为:exp ln(RR)u SE(lnRR)由于由于RR=1时为试验因素与疾病无关,故其可信区间不时为试验因素与疾病无关,故其可信区间不包含包含1时为有统计学意义;反之,
12、其可信区间包含时为有统计学意义;反之,其可信区间包含1时时为无统计学意义。为无统计学意义。3RR及可信区间 3RR及可信区间 阿斯匹林治疗组的病死率阿斯匹林治疗组的病死率p1=15/125;对照组的病死率;对照组的病死率p0=30/120,其,其RR和可信区间为:和可信区间为:R R =p1 p0=15/125 30/120=0.48 ln(R R)=ln(0.48)=-0.734 S E(ln R R)=1 r1+1 r2 1 n1 1 n2 =1 15 +1 30 1125 1120=0.289 3RR及可信区间 RR的的95%可信区间为:可信区间为:exp ln(RR)1.96 SE(l
13、nRR)=exp(-0.734 1.960.289)=(0.272,0.846)该例该例RR的的95%可信区间为可信区间为0.2720.846,使用阿斯匹,使用阿斯匹林治疗的病人,其病死率小于对照组,可认为阿斯匹林治疗的病人,其病死率小于对照组,可认为阿斯匹林可降低心肌梗死有效。林可降低心肌梗死有效。odds1是病例组暴露率是病例组暴露率p1和非暴露率和非暴露率1-p1的比值,即的比值,即odds1=p1/(1-p1),odds0是对照组暴露率是对照组暴露率p0和非暴露率和非暴露率1-p0的比值,即的比值,即odds0=p0/(1-p0),以上两个比值之比即为比值比以上两个比值之比即为比值比(
14、odds ratio,OR),又称,又称机会比、优势比等。公式为:机会比、优势比等。公式为:OR=ad/bc 4OR及可信区间 当所研究疾病的发病率较低时,即当所研究疾病的发病率较低时,即a和和c均较小时,均较小时,OR近似于近似于RR,故在回顾性研究中可用,故在回顾性研究中可用OR估计估计RR;由于前瞻性研究中,由于前瞻性研究中,RR的可信区间与的可信区间与OR的可信区间很的可信区间很相近,因此,常用相近,因此,常用OR可信区间的计算来代替可信区间的计算来代替RR的可信的可信区间的计算。区间的计算。OR值的解释与值的解释与RR相同。相同。4OR及可信区间 4OR及可信区间 OR的可信区间同样
15、需要采用自然对数计算,其的可信区间同样需要采用自然对数计算,其ln(OR)的标准误的标准误SE(lnOR)按下式计算:按下式计算:SE(l nOR)=1a+1b+1c+1d ln(OR)的可信区间为:的可信区间为:ln(OR)u SE(lnOR)OR的可信区间为:的可信区间为:exp ln(OR)u SE(lnOR)4OR及可信区间 4OR及可信区间 例例 如如:前前 述述 阿阿 斯斯 匹匹 林林 治治 疗疗 心心 肌肌 梗梗 死死 的的 效效 果果 试试 估估 计计 其其O R的的9 5%可可 信信 区区 间间。O R=1 5 9 0 3 0 1 1 0=0.4 0 9 ln(O R)=ln
16、(0.4 0 9)=-0.8 9 4 S E(ln O R)=(1/3 0+1/9 0+1/1 5+1/1 1 0)=0.3 4 7 4OR及可信区间 OR的的95%可信区间为:可信区间为:exp ln(OR)1.96SE(lnOR)=exp(-0.8941.960.347)=(0.207,0.807)该例该例OR的的95%可信区间为可信区间为(0.207,0.807),可以认,可以认为阿斯匹林治疗心肌梗死有效。为阿斯匹林治疗心肌梗死有效。5RRR及可信区间 RRR为相对危险度减少率为相对危险度减少率(relative risk reduction),其计算公式为:其计算公式为:RRR=|CE
17、R-EER|/CER=1-RRRRR的可信区间可由的可信区间可由1-RR计算得到。计算得到。如前例如前例RR=0.48,其,其95%的可信区间为的可信区间为(0.272,0.846),其其RRR=1-0.48=0.52,RRR的的95%可信区间为可信区间为(0.154,0.728)。5RRR及可信区间 RRR反映了某试验因素使某结果的发生率增加或减少的相对量,反映了某试验因素使某结果的发生率增加或减少的相对量,但是,该指标无法衡量发生率增减的绝对量。但是,该指标无法衡量发生率增减的绝对量。如:试验人群中某病的发生率如:试验人群中某病的发生率EER=39%,而对照组人群的发,而对照组人群的发生率
18、生率CER=50%,RRR=(CER-EER)/CER =(50%-39%)/50%=22%。但是,若在另一研究中,试验组的疾病发生率为但是,若在另一研究中,试验组的疾病发生率为0.39/10万,对万,对照组的疾病发生率为照组的疾病发生率为0.50/10万,其万,其RRR仍为仍为22%。6RRIRRI,相对危险度增加率,相对危险度增加率(relative risk increase,RRI),试验组中某不利结果的发生率为,试验组中某不利结果的发生率为EERb,对,对照组某不利结果的发生率为照组某不利结果的发生率为CERb,RRI可按下式计可按下式计算:算:RRI=|EERbCERb|/CERb
19、 该指标可反映采用试验因素处理后,患者的不利结该指标可反映采用试验因素处理后,患者的不利结果增加的百分比。果增加的百分比。RBI,相对获益增加率,相对获益增加率(relative benefit increase,RBI),试验组中某有益结果的发生率为,试验组中某有益结果的发生率为EERg,对照组,对照组某有益结果的发生率为某有益结果的发生率为CERg,RBI可按下式计算:可按下式计算:RBI=|EERg-CERg|/CERg该指标可反映采用试验因素处理后,患者的有益结果该指标可反映采用试验因素处理后,患者的有益结果增加的百分比。增加的百分比。7RBI 8ARR及可信区间 绝对危险度减少率绝对
20、危险度减少率(absolute risk reduction,ARR),其计算公式为:其计算公式为:ARR=|CER-EER|ARR的可信区间为:的可信区间为:ARRuSE =(ARRuSE,ARR+uSE)ARR 的的 标标 准准 误误:SE=p1(1-p1)n1 +p2(1-p2)n2 ARR 的的 可可 信信 区区 间间:ARR u SE=(ARR u SE,ARR+u SE)例例 如如:试试 验验 组组 某某 病病 发发 生生 率率 为为 15/125=12%,而而 对对 照照 组组 人人 群群 的的 发发 生生 率率 为为 30/120=25%,其其 ARR=25%12%=13%,标
21、标 准准 误误 为为:SE=p1(1-p1)n1 +p2(1-p2)n2 =0.12(1-0.12)125 +0.25(1-0.25)120=0.049 8ARR及可信区间 其其95%的可信区间为:的可信区间为:ARRuSE=(ARRuSE,ARRuSE)=(0.131.960.049,0.131.960.049)=(3.4%,22.6%)该治愈率的该治愈率的95%的可信区间为的可信区间为(3.4%,22.6%)。8ARR及可信区间 9ARI 绝对危险度增加率绝对危险度增加率(absolute risk increase,ARI),即,即试验组中某不利结果发生率试验组中某不利结果发生率EERb
22、与对照组某不利结果发与对照组某不利结果发生率生率CERb的差值,不利结果(的差值,不利结果(bad outcomes)如:死)如:死亡、复发、无效等,其计算公式为亡、复发、无效等,其计算公式为:ARI=|EERbCERb|该指标可反映采用试验因素处理后,患者的不利结果增该指标可反映采用试验因素处理后,患者的不利结果增加的绝对值。加的绝对值。绝对受益增加率绝对受益增加率(absolute benefit increase,ABI),即,即试验组中某有益结果发生率试验组中某有益结果发生率EERg与对照组某有益结果发与对照组某有益结果发生率生率CERg的差值,有益结果(的差值,有益结果(good o
23、utcomes)如:)如:治愈、显效、有效等,其计算公式为:治愈、显效、有效等,其计算公式为:ABI=|EERg-CERg|该指标可反映采用试验因素处理后,患者的有益结果增该指标可反映采用试验因素处理后,患者的有益结果增加的绝对值。加的绝对值。10 ABI 11NNT、NNH及可信区间 NNT(the number needed to treat)的临床含义为:对病的临床含义为:对病人采用某种防治措施处理,得到一例有利结果需要防治人采用某种防治措施处理,得到一例有利结果需要防治的病例数(的病例数(the number of patients who need to be treated to
24、achieve one additional favorable outcome,NNT)。其计算公式为:)。其计算公式为:NNT=1/|CER-EER|=1/ARR从公式可见,从公式可见,NNT的值越小,该防治效果就越好,其临的值越小,该防治效果就越好,其临床意义也就越大。床意义也就越大。NNT的的95%的可信区间,由于无法计算的可信区间,由于无法计算NNT的标准误,的标准误,但但NNT=1/ARR,故,故NNT的的95%的可信区间的计算可利的可信区间的计算可利用用ARR的的95%的可信区间来计算。的可信区间来计算。NNT95%可信区间的下限:可信区间的下限:1/ARR的上限值的上限值 NN
25、T95%可信区间的上限:可信区间的上限:1/ARR的下限值的下限值 例如某试验的例如某试验的ARR的的95%CI为为3.4%22.6%,其,其NNT的的95%CI下限为:下限为:1/22.6%=4.4;上限为:;上限为:1/3.4%=29.4,即,即4.429.4。11NNT、NNH及可信区间 12NNHNNH的临床含义为:对病人采用某种防治措施处理,出的临床含义为:对病人采用某种防治措施处理,出现一例副作用需要处理的病例数现一例副作用需要处理的病例数(the number needed to harm one more patients from the therapy,NNH)。其计算式为
26、:其计算式为:NNH=1/ARI从公式可见,从公式可见,NNH的值越小,某治疗措施引起的副反应的值越小,某治疗措施引起的副反应就越大。就越大。13LHHL H H,防 治 性 措 施 受 益 与 危 害 的 似 然 比,防 治 性 措 施 受 益 与 危 害 的 似 然 比(likelihood of being helped vs.harmed,LHH),其计算公式为:),其计算公式为:LHH=NNH/NNT该指标反映了防治措施给受试者带来的受益与危该指标反映了防治措施给受试者带来的受益与危害的比例,害的比例,LHH1,利大于敝,反之,利大于敝,反之,LHH1时,敝大于利。时,敝大于利。WM
27、D(加权均数差加权均数差)SMD(标准化均数差标准化均数差)数值资料的指标1.WMD加权均数差加权均数差(WMD,Weighted Mean Difference)某个研究的两均数差某个研究的两均数差d 可按下式计算可按下式计算:加加 权权 均均 数数 差差 (W e ig h t e d M e a n D if f e r e n c e,W M D)(1)计计 算算 每每 个个 研研 究究 的的 两两 均均 数数 差差 某某 个个 研研 究究 的的 两两 均均 数数 差差d 按按 下下 式式 计计 算算:d=X1X2 1.WMD两均数差两均数差d-的方差的方差Var(d),可按下式计算:
28、,可按下式计算:Var(d)=S12(n1-1)+S22(n2-1)(n1+n2-2)n1+n2 n1 n2 1.WMD从公式可见,加权均数差从公式可见,加权均数差(Weighted Mean Difference,WMD)即为两均数的差值。即为两均数的差值。该指标以试验原有的测量单位,真实地反映该指标以试验原有的测量单位,真实地反映了试验效应,消除了绝对值大小对结果的影了试验效应,消除了绝对值大小对结果的影响,在实际应用时,该指标容易被理解和解响,在实际应用时,该指标容易被理解和解释。释。2.SMD标准化均数差标准化均数差(Standardised Mean Difference,SMD)某
29、个研究的标准化均数差某个研究的标准化均数差d,可按下式计算:,可按下式计算:d=X1-X2 SC (1-34 N-9)SC=S12(n1-1)+S22(n2-1)(n1+n2-2)2.SMD标准化均数差标准化均数差d的方差的方差Var(d),可按下式计算:,可按下式计算:Var(d)=N n1 n2+d2 2(N-3.94)2.SMDSMD可简单地理解为两均数的差值再除以合并标可简单地理解为两均数的差值再除以合并标准差的商,它不仅消除了某研究的绝对值大小的准差的商,它不仅消除了某研究的绝对值大小的影响,还消除了测量单位对结果的影响。因此,影响,还消除了测量单位对结果的影响。因此,该指标尤其适用于单位不同或均数相差较大的数该指标尤其适用于单位不同或均数相差较大的数值资料分析。值资料分析。但是,标准化均数差但是,标准化均数差(SMD)是一个没有单位的值,是一个没有单位的值,因而,对因而,对SMD分析的结果解释要慎重。分析的结果解释要慎重。结束语成功之路在脚下延伸成功之路在脚下延伸科学需要铺垫与积累科学需要铺垫与积累谢谢观赏!2020/11/549