1、循证医学中常用的统计指标循证医学中常用的统计指标一、概述一、概述数据资料可分为数值资料(计量)和分类资料(计数和等级)两大类。统计指标因而也分为数值资料与分类资料指标两类。数据资料可分为数值资料(计量)和分类资料(计数和等级)两大类统计指标可用于描述性的统计分析,也是反映数据基本特征的统计分析方法。并可使人们准确、全面地了解数据资料所包涵的信息,以便于在此基础上完成资料的进一步统计分析。统计指标可用于描述性的统计分析,也是反映数据基本特征的统计分可信区间(Confidence interval,CI)是循证医学中常用的统计指标之一。可信区间(C o n f i d e n c e i n t
2、e r v a l,C I)是可信区间主要用于估计总体参数,从获取的样本数据资料估计某个指标的总体值(参数)。如,率的可信区间估计总体率,均数的可信区间估计总体均数。可信区间主要用于估计总体参数,从获取的样本数据资料估计某个指此外,可信区间还可用于假设检验,尤其是试验组与对照组某指标差值或比值的可信区间,在循证医学中更为常用。此外,可信区间还可用于假设检验,尤其是试验组与对照组某指标差通常,试验组与对照组某指标差值或比值的95可信区间与为0.05的假设检验等价,99的CI与为0.01的假设检验等价。通常,试验组与对照组某指标差值或比值的9 5 可信区间与为0.常用的可信区间有:率的可信区间、两
3、率差值的可信区间、均数的可信区间、两均数差值的可信区间、相对危险度可信区间等。常用的可信区间有:率的可信区间、两率差值的可信区间、均数的可循证医学中常用的是率的可信区间、RR或OR的可信区间、均数的可信区间、两均数差值的可信区间等。循证医学中常用的是率的可信区间、R R 或O R 的可信区间、均数的二、分类资料的指标二、分类资料的指标在循证医学的研究与实践中,除了有效率、死亡率、患病率、发病率等常用的指标外,相对危险度(RR)、比值比(OR)及由此导出的其他指标也是循证医学中富有特色的指标。在循证医学的研究与实践中,除了有效率、死亡率、患病率、发病率目前,在循证医学中分类资料常用的描述性指标主
4、要有EER、CER、OR、RR、RRR、ARR、NNT等。目前,在循证医学中分类资料常用的描述性指标主要有E E R、C E1.EER与CER循证医学中预防和治疗性试验中,率可细分为EER和CER两类。1.E E R 与C E R 循证医学中预防和治疗性试验中,率可细分为EER即试验组中某事件的发生率(experimental event rate,EER),如对某病采用某些防治措施后该疾病的发生率。CER即对照组中某事件的发生率(control event rate,CER),如对某病不采取防治措施的发生率。E E R 即试验组中某事件的发生率(e x p e r i me n t a l
5、e2.RD(率差)及可信区间两个发生率的差即为率差,也称危险差(rate difference,risk difference,RD),如试验组发生率(EER)与对照组发生率(CER)的差,其大小可反映试验效应的大小。2.R D(率差)及可信区间两个发生率的差即为率差,也称危险两率差的可信区间由下式计算:p?p?u SE(p?p)12?12?RD?u SE(p?p),?12RD?u SE(p?p)?12两率差的可信区间由下式计算:p?p?u S E(p?p)1 2?1两率差的标准误:p(1?p)p(1?p)1122SE(p?p)?12nn12两率差的标准误:p(1?p)p(1?p)1 1 2
6、2 S E(p?p两率差为0时,两组的某事件发生率没有差别。因而两率差的可信区间不包含0(上下限均大于0或上下限均小于0),则两个率有差别;反之,两率差的可信区间包含0,则无统计学意义。两率差为0 时,两组的某事件发生率没有差别。因而两率差的可信区阿司匹林治疗心肌梗死的效果死亡阿司匹林治疗组对照组15(a)30(c)未死亡110(b)90(d)例数125(n1)120(n2)合计45200245阿司匹林治疗心肌梗死的效果死亡阿司匹林治疗组对照组1 5(a)阿斯匹林治疗心肌梗死的效果EER15/12512,CER=30/120=25%,两率差的标准误:p(1?p)p(1?p)1122SE(p?p
7、)?12nn120.12(1?0.12)0.25(1?0.25)?0.049125120阿斯匹林治疗心肌梗死的效果E E R 1 5/1 2 5 1 2,C E该试验两率差(RD)的可信区间为:RD?u SE(p?p)?12?(0.12?0.25)?1.96?0.049?0.23?0.03该试验两率差(R D)的可信区间为:R D?u S E(p?p)?1该例两率差的可信区间为-0.23-0.03,上下限均小于0(不包含0),两率有差别。可认为阿斯匹林可降低心肌梗死的病死率。该例两率差的可信区间为-0.2 3-0.0 3,上下限均小于03.RR及可信区间相对危险度RR(relative ris
8、k,RR)是前瞻性研究中较常见的指标,它是试验组某事件发生率与对照组(或低暴露)的发生率之比,用于说明前者是后者的多少倍,常用来表示试验因素与疾病联系的强度及其在病因学上的意义大小。3.R R 及可信区间相对危险度R R(r e l a t i v e r i s其计算方法为:RR?P/P?EER/CE10当RR1时,可认为试验因素与疾病无关;当RR1时,可认为试验因素与疾病有关;当RR1时,可认为试验组发生率大于对照组;当RR1时,可认为试验组发生率小于对照组。其计算方法为:R R?P/P?E E R/C E 1 0 当R R 1 时,可RR的可信区间,应采用自然对数进行计算,即应求RR的自
9、然对数值In(RR)和In(RR)标准误SE(InRR),其计算公式如下:1111SE(InRR)?aca?bc?dR R 的可信区间,应采用自然对数进行计算,即应求R R 的自然对数In(RR)的可信区间为:I(n RR)?u SE(I nRR)?RR的可信区间为:?exp In(RR)?u SE(InRR)?由于RR=1时为试验因素与疾病无关,故其可信区间不包含1时为有统计学意义;反之,其可信区间包含1时为无统计学意义。I n(R R)的可信区间为:I(n R R)?u S E(I n R R)?RR计算的四格表组别试验组对照组发病a(r1)c(r2)未发病bd例数n1n2R R 计算的四
10、格表组别试验组对照组发病a (r 1)c (r 2阿斯匹林治疗组的病死率对照组的病死率其RR和可信区间为:p15/1251RR?0.48p30/1200In(RR)=In(0.48)=-0.7341111SE(InRR)?rrnn12121111?0.2891530125120阿斯匹林治疗组的病死率对照组的病死率其R R 和可信区间为:p 1RR的95可信区间为:?exp In(RR)?1.96SE(InRR)=exp(-0.7341.960.289)=(0.272,0.846)该例RR的95可信区间为0.2720.846,使用阿斯匹林治疗的病人,其病死率小于对照组,可认为阿斯匹林可降低心肌梗
11、死有效。R R 的9 5 可信区间为:?e x p I n(R R)?1.9 6 S E4.OR及可信区间组别病例组非病例组暴露ac非暴露bd例数n1n24.O R 及可信区间组别病例组非病例组暴露a c 非暴露b d 例数nodds1是病例组暴露率p1和非暴露率1-p1的比值,即a/(a?b)odds1=p1/(1-p1)=b/(a?d)odds0是对照组暴露率p0和非暴露率1-p0的比值,即c/(c?d)odds0=p0/(1-p0)=d/(c?d)o d d s 1 是病例组暴露率p 1 和非暴露率1-p 1 的比值,即a/以上两个比值之比即为比值比(odds ratio,OR),又称机
12、会比、优势比等,公式为:a/(a?b)p 1?pb/(a?b)OR=1(1)?ad/bcc?d)p0(1?p0)c/(d/(c?d)以上两个比值之比即为比值比(o d d s r a t i o,O R),当所研究疾病的发病率较低时,即a和c均较小时,OR近似于RR,故在回顾性研究中可用OR估计RR;由于前瞻性研究中,OR的可信区间与RR的可信区间很相近,且OR的计算更为简便,因此,常用OR可信区间的计算来代替RR的可信区间的计算。OR值的解释与RR相同。当所研究疾病的发病率较低时,即a 和c 均较小时,O R 近似于R ROR的可信区间同样需要采用自然对数计算,其In(OR)的标准误SE(I
13、nOR)按下式计算:1111SE(InOR)?abcdO R 的可信区间同样需要采用自然对数计算,其I n (O R)的标In(OR)的可信区间为:I(n OR)?u SE(I nOR)?OR的可信区间为:?exp In(OR)?u SE(InOR)?I n(O R)的可信区间为:I(n O R)?u S E(I n O R)?例如:前述阿斯匹林治疗心肌梗死的效果估计其OR的95可信区间。15?90OR?0.40930?110In(OR)=In(0.409)=-0.894例如:前述阿斯匹林治疗心肌梗死的效果估计其O R 的9 5 可信区OR的95可信区间为:?exp In(OR)?1.96SE
14、(InOR)=exp(-0.8941.960.347)=(0.207,0.807)该例OR的95可信区间为0.2070.807,可认为阿斯匹林治疗心肌梗死有效。O R 的9 5 可信区间为:?e x p I n(O R)?1.9 6 S E5.RRR及可信区间RRR为相对危险度减少率(relative risk reduction),其计算公式为:RRR=CER-EER/CER=1-RRRRR的可信区间可由1-RR计算得到。如前例RR=0.48,其95的可信区间为0.2720.846,其RRR1-0.480.52,RRR的95可信区间为0.1540.728。5.R R R 及可信区间R R R
15、 为相对危险度减少率(r e l a t i vRRR反映了某试验因素使某结果的发生率增加或减少的相对量,但是,该指标无法衡量发生率增减的绝对量。如:试验人群中某病的发生率EER=39%,而对照组人群的发生率CER=50%,RRR=(CER-EER)/CER=(50%-39%)/50%=22%但是,若在另一研究中,试验组的疾病发生率为0.39/10万,对照组的疾病发生率为0.50/10万,其RRR仍为22。R R R 反映了某试验因素使某结果的发生率增加或减少的相对量,但6.RRIRRI,相对危险度增加率(relative risk increase,RRI),试验组中某不利结果的发生率为EE
16、Rb,对照组某不利结果的发生率为CERb,RRI可按下式计算:RRI?EER?CER/CERbbb该指标可反映采用试验因素处理后,患者的不利结果增加的百分比。6.R R I R R I,相对危险度增加率(r e l a t i v e r i s7.RBIRBI,相对获益增加率(relative benefit increase,RBI),试验组中某有益结果的发生率为EERg,对照组某有益结果的发生率为CERg,RBI可按下式计算:RBI?EER?CER/CERggg该指标可反映采用试验因素处理后,患者的有益结果增加的百分比。7.R B I R B I,相对获益增加率(r e l a t i
17、v e b e n e8.ARR及可信区间绝对危险度减少率(absolute risk reduction,ARR),其计算公式为:ARR=CER-EERARR的可信区间为:ARR?u SE?(ARR?u SE,ARR?u SE)?8 .A R R 及可信区间绝对危险度减少率(a b s o l u t e rARR的标准误:p(1?p)p(1?p)1122SE?nn12ARR的可信区间:ARR?u SE?(ARR?u SE,ARR?u SE)?A R R 的标准误:p(1?p)p(1?p)1 1 2 2 S E?n n例如:试验组某病发生率为15/12512,而对照组人群发生率为30/120
18、=25%,其ARR=25%-12%=13%,标准误为:p(1?p)p(1?p)1122SE?nn120.12(1?0.12)0.25(1?0.25)?0.049125120例如:试验组某病发生率为1 5/1 2 5 1 2,而对照组人群发其95可信区间为:ARR?u SE?(ARR?u SE,ARR?u SE)?=(0.13-1.960.049,0.13+1.960.049)=(3.4%,22.6%)该治愈率的95可信区间为3.4%22.6其9 5 可信区间为:A R R?u S E?(A R R?u S E,A R R9.ARI绝对危险度增加率(absolute risk increase,
19、ARI),即试验组中某不利结果发生率EERb与对照组某不利结果发生率CERb的差值,不利结果(bad outcomes)如:死亡、复发、无效等,其计算公式为:A RI?EER?CERbb该指标可反映采用试验因素处理后,患者的不利结果增加的绝对值。9.A R I 绝对危险度增加率(a b s o l u t e r i s k i10.ABI绝对受益增加率(absolute benefit increase,ABI),即试验组中某有益结果发生率EERg与对照组某有益结果发生率CERg的差值,有益结果(good outcomes)如:治愈、显效、有效等,其计算公式为:ABI?EER?CERgg该指
20、标可反映采用试验因素处理后,患者的有益结果增加的绝对值。1 0 .A B I 绝对受益增加率(a b s o l u t e b e n e f i11.NNT、NNH及可信区间NNT(The number needed to treat)的临床含义为:对病人采用某种防治措施处理,得到一例有利结果需要防治的病例数(the number of patients who needed to be treated to achieve one additional favorable outcome,NNT)。其计算公式为:NNT=1/CER-EER=1/ARR从公式可见,NNT的值越小,该防治效果
21、就越好,其临床意义也就越大。1 1.N N T、N N H 及可信区间N N T (T h e n u mb eNNT的95可信区间,由于无法计算NNT的标准误,但NNT=1/ARR,故NNT的95可信区间的计算可利用ARR的95的可信区间来计算。NNT95可信区间的下限:1/ARR的上限值NNT95可信区间的上限:1/ARR的下限值例如某试验的ARR的95CI为3.422.6,其NNT的95CI下限为:1/22.6%=4.4;上限为:1/3.4%=29.4,即4.429.4。N N T 的9 5 可信区间,由于无法计算N N T 的标准误,但N N T12.NNHNNH的临床含义为:对病人采
22、用某种防治措施处理,出现一例副作用需要处理的病例数(the number needed to harm one more patients from the therapy,NNH)。其计算公式为:NNH=1/ARI从公式可见,NNH的值越小,某治疗措施引起的副作用就越大。1 2.N N H N N H 的临床含义为:对病人采用某种防治措施处理13.LHHLHH,防治性措施受益与危害的似然比(likehood of being helped vs.harmed,LHH),其计算公式为:LHH=NNH/NNT该指标反映了防治措施给受试者带来的受益与危害的比例,LHH1,利大于弊,反之,LHH1时
23、,弊大于利。1 3 .L H H L H H,防治性措施受益与危害的似然比(l i k e三、数值资料的指标三、数值资料的指标1.WMD加权均数差(WMD,Weighted Mean Difference)某个研究的两均数差d可按下式计算:d?X?X121.WMD 加权均数差(WMD,We i g h t e d Me a n 2两均数差d的方差Var(d)(也可用S 表示),可按下式计算:S(n?1)?S(n?1)n?n12Var(d)?(n?n?2)nn12122112222 两均数差d 的方差V a r(d)(也可用S 表示),可按下式计算从公式可见,加权均数差(WMD,Weighted
24、 Mean Difference)即为两均数的差值。该指标反映一试验原有的测量单位,真实地反映了试验效应,消除了绝对值大小对结果的影响,在实际应用时,该指标容易被理解和解释。从公式可见,加权均数差(WMD,We i g h t e d Me a n2.SMD标准化均数差(Standardized Mean Difference,SMD)某个研究的标准化均数差d,可按下式计算:X?X312d?(1?)S4N?9cS(n1)?S(n1)1?2?Sc?(nn2)1?2?21222.S MD 标准化均数差(S t a n d a r d i z e d Me a n 2标准化均数差d的方差Var(d)
25、(也可用S表示),可按下式计算:NdVar(d)?nn2(N?3.94)1222 标准化均数差d 的方差V a r (d)(也可用S 表示),可按下SMD可简单地理解为两均数的差值再除以合并标准差的商,它不仅消除了某研究的绝对值大小的影响,还消除了测量单位对结果的影响。因此,该指标尤其适用于单位不同或均数相差较大的数值资料分析。但是,标准化均数差(SMD)是一个没有单位的值,因而,对SMD分析的结果解释要慎重。S MD 可简单地理解为两均数的差值再除以合并标准差的商,它不仅四、主要参考文献四、主要参考文献1.David L.Sackett,W.Scott Richardson,William
26、Rosenberg,et al.2000.Evidenced-based MedicineHow to practice and teach EBM.2nd ed.Churchill Livingstone Publish House:Toronto.105-1382.Marthias Egger,George Davey Smith,Douglas G Altman.2019.Systematic Reviews in Health Care Meta-analysis in Context.Second edition.London.BMJ Publishing Group.285-335 1.D a v i d L.S a c k e t t,W.S c o t t R3.李幼平主编.医学,第五章.高等教育出版社,20194.王家良主编.循证医学.人民卫生出版社,20193.李幼平主编.医学,第五章.高等教育出版社,2 0 1 9 4.王