1、样本量估算(sun)的统计学方法骆第一页,共46页。一、临床研究为什么需要(xyo)估计样本含量第二页,共46页。复习1:统计学三大(sn d)任务与三大(sn d)规则任务:描述样本特征、估计总体参数、任务:描述样本特征、估计总体参数、检验总体差别检验总体差别规则:(必须考虑规则:(必须考虑(kol))数据类数据类型、分布类型、对比类型型、分布类型、对比类型第三页,共46页。1.统计(tngj)描述任务例:某样本个体分布的集中趋势与离散趋势怎样例:某样本个体分布的集中趋势与离散趋势怎样?(1V1V点,点,2V2V线,线,3 3面面.影子影子(yng zi)_(yng zi)_线)线)数据:计
2、数(数据:计数(%),定量(平均数),等级(平均),定量(平均数),等级(平均RiditRidit值)值)分布:正态分布:正态(Mean(Mean,SDSD,95%CR)95%CR),对数正态,对数正态(G)(G),偏态偏态(M,Q/R(M,Q/R,P2.5P97.5)P2.5P97.5)(双(双/多变量多变量-相关回相关回归)归)对比:变量对比:变量=两组观察值(各组均数与标准差),两组观察值(各组均数与标准差),变量变量=差值(差值的均数与标准差)差值(差值的均数与标准差)第四页,共46页。2.置信区间任务(rn wu)例:某总体指标在哪一区间例:某总体指标在哪一区间?(借鉴反推)?(借鉴
3、反推)数据:计数(直接法数据:计数(直接法/正态近似),计量(正态正态近似),计量(正态法),等级(正态近似)法),等级(正态近似)分布:正态(正态法),对数正态分布:正态(正态法),对数正态(lg(lg值置信区间值置信区间),偏态(百分位数法)偏态(百分位数法)对比:变量对比:变量(binling)(binling)参数置信区间,差值参数置参数置信区间,差值参数置信区间(临床试验)信区间(临床试验)第五页,共46页。3.假设检验任务(rn wu)例:某例:某2 2个总体指标相同个总体指标相同?(直接应用概率分(直接应用概率分布)布)数据:计数(正态近似法数据:计数(正态近似法u,u,卡方),
4、计量(均卡方),计量(均数检验),等级(秩和检验)数检验),等级(秩和检验)分布:正态(分布:正态(u,tu,t),对数正态(),对数正态(lg lg值值t t检验),检验),偏态(秩和检验)偏态(秩和检验)对比对比(dub)(dub):组间比较(:组间比较(u,t,Hu,t,H),与总体比),与总体比较(较(u,t,Hu,t,H)第六页,共46页。两大类方法(fngf)有单侧与双侧之分,单侧的u小于双侧u值,所以按单侧计算的样本含量小于双侧。可重复性,是指任何科学研究必须遵守的原则,其目的是要排除偶然因素的影响,得出科学的、真实(zhnsh)的、规律性的结论。第四十五页,共46页。第二十三页
5、,共46页。置信区间任务(rn wu)越小所需样本含量越大,反之越小,一般取 0.规则:(必须考虑(kol))数据类型、分布类型、对比类型若某研究有多个效应指标,其样本含量估计应对每个效应指标进行样本量的估计,然后取样本数量最大者为其研究的样本量。两个率比较(bjio)的估算90),该研究(ynji)所需的样本含量为多少?第四十一页,共46页。在临床研究中,样本含量越小,其抽样误差越大。第二十七页,共46页。第三十七页,共46页。统计(tngj)推断中的误差估计最基本公式最基本公式(gngsh)(gngsh):误差误差=个体变异程度个体变异程度/n/n的平方根的平方根均数误差均数误差=标准差标
6、准差/sqrt(n)/sqrt(n)率的误差率的误差=sqrt=sqrtp(1-p)/np(1-p)/n第七页,共46页。n大小(dxio)举例1 1、n=3n=3,三个克隆,三个克隆2 2、女大学生、女大学生33%33%自动退学?自动退学?n=n=?3 3、n1=20n1=20,n2=100n2=100,n=n=?4 4、19871987年某产科医师为研究胎次与儿童智力年某产科医师为研究胎次与儿童智力的关系,收集病案资料的关系,收集病案资料(zlio)(zlio)(考上大学人(考上大学人数):第一胎数):第一胎1919人、第二胎人、第二胎1818人、第三胎人、第三胎1010人、第四胎人、第四
7、胎7 7人、第五胎人、第五胎4 4人。由此得出结论:人。由此得出结论:智力与胎次有关,胎次愈多智力愈差,第一智力与胎次有关,胎次愈多智力愈差,第一胎智力最好。胎智力最好。n=n=?第八页,共46页。可重复(chngf)原则样本含量(样本含量(SampleSample)的估计是临床研)的估计是临床研究科学设计的重要内容。究科学设计的重要内容。可重复性,是指任何科学研究必须遵可重复性,是指任何科学研究必须遵守的原则,其目的是要排除偶然因素守的原则,其目的是要排除偶然因素的影响,得出科学的、真实的影响,得出科学的、真实(zhnsh)(zhnsh)的、的、规律性的结论。规律性的结论。第九页,共46页。
8、样本含量(hnling)的大小在临床研究中,样本含量越小,其抽在临床研究中,样本含量越小,其抽样误差越大。样误差越大。若样本含量不足,可重复性差,检验若样本含量不足,可重复性差,检验效能低,不能排除偶然因素的影响,效能低,不能排除偶然因素的影响,其结论缺乏科学性、真实性。其结论缺乏科学性、真实性。若样本含量过大,试验条件难以严格若样本含量过大,试验条件难以严格控制,容易造成人力控制,容易造成人力(rnl)、物力和、物力和时间上的浪费。时间上的浪费。第十页,共46页。估计样本(yngbn)含量的目的在保证某个临床试验在保证某个临床试验/临床研究的结论临床研究的结论具有具有(jyu)(jyu)一定
9、科学性、真实性和可一定科学性、真实性和可靠性前提下,确定某研究所需的最小靠性前提下,确定某研究所需的最小观察例数。观察例数。第十一页,共46页。二、估计样本(yngbn)含量的方法第十二页,共46页。两大类方法(fngf)1 1、公式法,可满足、公式法,可满足(mnz)(mnz)多种设计的多种设计的要求,目前应用广泛。要求,目前应用广泛。2 2、查表法,简单、方便,但受条件限、查表法,简单、方便,但受条件限制,有时不一定完全适应。制,有时不一定完全适应。第十三页,共46页。三、估计(gj)样本含量的步骤第十四页,共46页。1、确定设计(shj)方法任何临床试验,其设计任何临床试验,其设计(sh
10、j)方案方案是首先需要确定的,而样本含量的估是首先需要确定的,而样本含量的估计也是在设计计也是在设计(shj)方案基础上的。方案基础上的。不同的临床科研设计不同的临床科研设计(shj)方法,方法,其样本含量的估计方法不相同其样本含量的估计方法不相同第十五页,共46页。2、确定(qudng)资料类型当临床试验的设计方案确定后,需要当临床试验的设计方案确定后,需要确定临床试验所得数据的类型,例如,确定临床试验所得数据的类型,例如,计量(数值)、计数(无序分类)、计量(数值)、计数(无序分类)、等级(有序分类),因为样本等级(有序分类),因为样本(yngbn)含量估计方法与数据类含量估计方法与数据类
11、型有关型有关第十六页,共46页。3、考虑统计(tngj)方法样本含量的估计还要与以后将要使用样本含量的估计还要与以后将要使用的统计方法的统计方法(fngf)的条件相结合。的条件相结合。如单因素分析、相关与回归、多因素如单因素分析、相关与回归、多因素分析等。目前样本含量估计的公式计分析等。目前样本含量估计的公式计算主要针对单因素分析,而多因素分算主要针对单因素分析,而多因素分析的例数估计请参考有关书籍析的例数估计请参考有关书籍第十七页,共46页。4、确定(qudng)基本参数 在各种临床科研设计方法的样本含量估计在各种临床科研设计方法的样本含量估计(gj)中,需要研究者事先确定的条件有:中,需要
12、研究者事先确定的条件有:第一类错误的概率第一类错误的概率,第二类错误概率,第二类错误概率,容许误,容许误差差。若终点指标为数值变量时,还需要研究者确定总体若终点指标为数值变量时,还需要研究者确定总体标准差标准差。若终点指标为分类变量时,有时需要研究者确定总若终点指标为分类变量时,有时需要研究者确定总体率体率。第十八页,共46页。(1)确定(qudng)第一类误差的概率所有样本含量估计所有样本含量估计(gj)公式中,都需公式中,都需要要u的值,研究者确定检验水准(的值,研究者确定检验水准()的大小后,查表得的大小后,查表得u值。值。有单侧与双侧之分,单侧有单侧与双侧之分,单侧的的u小于小于双侧双
13、侧u值,所以按单侧计算的样本含量值,所以按单侧计算的样本含量小于双侧。小于双侧。越小所需样本含量越大,反之越小,一越小所需样本含量越大,反之越小,一般取般取 0.05第十九页,共46页。样本样本(yngbn)含量计算中,需要含量计算中,需要u的值,的值,即研究者确定即研究者确定大小后,查表的大小后,查表的u值。值。确定确定大小,主要是要确定检验效能大小,主要是要确定检验效能(Power),用),用1-表示其概率的大小,检验表示其概率的大小,检验效能是指总体间确有差别时,假设检验能发现效能是指总体间确有差别时,假设检验能发现这种差别的能力大小。这种差别的能力大小。为第二类误差的概率,为第二类误差
14、的概率,值越小,检验效率越值越小,检验效率越高,所需样本高,所需样本(yngbn)量也就越大,通常量也就越大,通常=0.1或或=0.2。一般认为检验效率不能小。一般认为检验效率不能小于于0.7。(2)确定第二类误差(wch)的概率第二十页,共46页。(3)确定容许(rngx)限或插座 即有临床意义或研究意义的最小差值。即有临床意义或研究意义的最小差值。若为数值变量时,若为数值变量时,可为有临床意义的均数差值、可为有临床意义的均数差值、实验前后实验前后(qinhu)之差等。之差等。若为分类资料,若为分类资料,可为有临床意义的有效率、患可为有临床意义的有效率、患病率等率之差。病率等率之差。第二十一
15、页,共46页。(4)确定(qudng)总体标准差总体率若研究的终点指标为数值变量时,总体标若研究的终点指标为数值变量时,总体标准差准差为估计为估计(gj)样本含量所必须的条样本含量所必须的条件。件。若研究的终点指标为分类变量时,有时,若研究的终点指标为分类变量时,有时,总体率总体率为估计为估计(gj)样本含量条件。样本含量条件。若总体标准差若总体标准差和总体率和总体率,常常通过文献,常常通过文献检索、预试验或对研究作出合理的假设来检索、预试验或对研究作出合理的假设来获得。获得。第二十二页,共46页。5、计算样本(yngbn)含量用按设计方案、资料类型及可能涉及用按设计方案、资料类型及可能涉及的
16、统计分析方法来选择样本含量的计的统计分析方法来选择样本含量的计算方法(查书),也可以利用统计软算方法(查书),也可以利用统计软件帮助件帮助(bngzh)完成样本含量的完成样本含量的计算。计算。第二十三页,共46页。6、校正(jiozhng)样本含量由于估算的样本含量是最少需要量,由于估算的样本含量是最少需要量,考虑到受试者可能有不合作者、中途考虑到受试者可能有不合作者、中途失访、意外死亡等情况出现,而减少失访、意外死亡等情况出现,而减少有效有效(yuxio)观察对象的例数(失观察对象的例数(失访),因此,应该在估算的样本含量访),因此,应该在估算的样本含量增加若干样本例数。增加若干样本例数。通
17、常,失访人数不得大于通常,失访人数不得大于20%。第二十四页,共46页。第二十五页,共46页。1.组间例数相等(xingdng)成组设计的例数,应尽可能采用例数相等的设成组设计的例数,应尽可能采用例数相等的设计,尤其是多组设计时,一般要求计,尤其是多组设计时,一般要求(yoqi)(yoqi)各组各组间的样本含量相等,只有在某些特殊情况下才间的样本含量相等,只有在某些特殊情况下才考虑各组的样本含量不相等。考虑各组的样本含量不相等。第二十六页,共46页。例:某样本个体分布的集中趋势与离散趋势怎样?(1V点,2V线,3面.第二十一页,共46页。置信区间任务(rn wu)在保证某个临床试验/临床研究的
18、结论具有(jyu)一定科学性、真实性和可靠性前提下,确定某研究所需的最小观察例数。若为数值变量时,可为有临床意义的均数差值、实验前后(qinhu)之差等。估计(gj)的适用条件实例(shl)分析(例数相等)第二十七页,共46页。两个率比较(bjio)的估算第三十四页,共46页。(4)确定(qudng)总体标准差总体率2、确定(qudng)资料类型2、查表法,简单、方便,但受条件限制,有时不一定完全适应。六、分类变量(binling)的样本含量估计简介规则:(必须考虑(kol))数据类型、分布类型、对比类型率的误差=sqrtp(1-p)/n10(power=0.2.多指标(zhbio)估算若某研
19、究有多个效应指标,其样本含量估计应若某研究有多个效应指标,其样本含量估计应对每个效应指标进行样本量的估计,然后取样对每个效应指标进行样本量的估计,然后取样本数量最大者为其研究的样本量。本数量最大者为其研究的样本量。若某研究能区分主要若某研究能区分主要(zhyo)(zhyo)指标和次要指标指标和次要指标时,也可以只对主要时,也可以只对主要(zhyo)(zhyo)指标进行样本含指标进行样本含量估计,然后取量大者为其研究的样本含量。量估计,然后取量大者为其研究的样本含量。第二十七页,共46页。3.多种估计(gj)条件尽可能将多样本含量估计方法联合使用,并且尽可能将多样本含量估计方法联合使用,并且在使
20、用计算法估算时,可多做几种估算方案,在使用计算法估算时,可多做几种估算方案,以便选择。以便选择。如:不同的如:不同的、等条件等条件(tiojin)(tiojin)组合组合下,估计其样本含量。下,估计其样本含量。第二十八页,共46页。4.与研究(ynji)目的结合根据研究目的,严格选择估算样本含量的方法根据研究目的,严格选择估算样本含量的方法(fngf)(fngf),如单、双侧不同,估计参数与假设检,如单、双侧不同,估计参数与假设检验不同,一般假设检验与等价检验不同,样本验不同,一般假设检验与等价检验不同,样本率超过与位于率超过与位于0.3-0.70.3-0.7(0.2-0.80.2-0.8)范
21、围不同,)范围不同,t t检检验与验与u u检验不同等。检验不同等。第二十九页,共46页。5.估计(gj)的适用条件目前,国内有关书籍提供的样本含量计算目前,国内有关书籍提供的样本含量计算公式,主要适用于临床试验,而并非适用公式,主要适用于临床试验,而并非适用于其他医学实验,如动物实验。于其他医学实验,如动物实验。动物实验的样本含量可以参考临床试验的动物实验的样本含量可以参考临床试验的样本含量,并在此基础上适当减少样本含量,并在此基础上适当减少(jinsho)(jinsho)其数量。其数量。第三十页,共46页。五、数值变量的样本含量(hnling)估计简介第三十一页,共46页。两均数比较(bj
22、io)的估算 第三十二页,共46页。实例(shl)分析(例数相等)欲研究欲研究(ynji)(ynji)某新药降低高血脂患者的胆固醇某新药降低高血脂患者的胆固醇疗效,研究疗效,研究(ynji)(ynji)者认为试验组与安慰剂组比者认为试验组与安慰剂组比较,其血清胆固醇值平均下降较,其血清胆固醇值平均下降0.5mmol/L0.5mmol/L才有才有临床意义,查阅文献得血清胆固醇值的标准差临床意义,查阅文献得血清胆固醇值的标准差为为0.8mmol/L,0.8mmol/L,且规定两组例数相等,且且规定两组例数相等,且=0.05=0.05,=0.10=0.10(power=0.90power=0.90)
23、,该研究),该研究(ynji)(ynji)所需的所需的样本含量为多少?样本含量为多少?第三十三页,共46页。计算结果 第三十四页,共46页。例数不相等(xingdng)第三十五页,共46页。实例(shl)分析(例数不等)某医院研究某医院研究(ynji)(ynji)吲螨酰胺治疗原发性高血压的疗效,吲螨酰胺治疗原发性高血压的疗效,经预试验得治疗前后舒张压差值(经预试验得治疗前后舒张压差值(kPakPa)资料如下,)资料如下,若若=0.05=0.05,=0.10=0.10时需治疗多少例?时需治疗多少例?均数均数标准差标准差吲螨酰胺吲螨酰胺2.281.09安慰剂安慰剂1.320.40第三十六页,共46
24、页。计算结果 第三十七页,共46页。六、分类变量(binling)的样本含量估计简介第三十八页,共46页。两个率比较(bjio)的估算 第三十九页,共46页。实例(shl)分析(例数相等)用旧的治疗方案治疗慢性肾炎的控制率为用旧的治疗方案治疗慢性肾炎的控制率为30%30%,现用新的治疗方案治疗慢性肾炎,其控制率应现用新的治疗方案治疗慢性肾炎,其控制率应大于大于50%50%才有临床意义,若取两组例数相等才有临床意义,若取两组例数相等(xingdng)(xingdng),且,且=0.05=0.05、=0.10=0.10(power=0.9power=0.9),),问每组需多少例数?问每组需多少例数
25、?第四十页,共46页。10377102204014028161644912122222ppn第四十一页,共46页。计算结果 第四十二页,共46页。例数不等 第四十三页,共46页。实例(shl)分析(例数不等)某医师研究某药对产后宫缩痛、外阴创伤某医师研究某药对产后宫缩痛、外阴创伤痛效果,预试验旧药镇痛率为痛效果,预试验旧药镇痛率为55%55%,新药镇,新药镇痛率为痛率为75%75%,当,当=0.05=0.05,=0.10=0.10时需观察多时需观察多少少(dusho)(dusho)例能说明新药镇痛效果优于旧药?例能说明新药镇痛效果优于旧药?第四十四页,共46页。41152066760166760281616449170111112222ppkn第四十五页,共46页。计算结果 第四十六页,共46页。