1、第五讲 科学估算样本量概述概述 基于数值变量资料的样本量估计基于数值变量资料的样本量估计 基于无序分类资料的样本量估计基于无序分类资料的样本量估计其他常见类型的样本量估计其他常见类型的样本量估计 41232样样本量本量(SampleSample)的估计是临床研究科学设)的估计是临床研究科学设计的重要内容。计的重要内容。可重复可重复性原则,性原则,是指任何科学研究必须遵守是指任何科学研究必须遵守的原则,其目的是要排除偶然因素的影响,的原则,其目的是要排除偶然因素的影响,得出科学的、真实的、规律性的结论。得出科学的、真实的、规律性的结论。第一节第一节 概述概述3为什么要估算样本量?为什么要估算样本
2、量?理论上,验证某一干预措施与对照之间的差理论上,验证某一干预措施与对照之间的差异,样本量越大,试验结果越接近于真实值,异,样本量越大,试验结果越接近于真实值,即结果越可靠。即结果越可靠。大样本试验还有助于探讨亚组疗效,发现罕大样本试验还有助于探讨亚组疗效,发现罕见结局。见结局。临床试验报告中有无预先的样本量估计是评临床试验报告中有无预先的样本量估计是评价试验质量的重要依据之一。价试验质量的重要依据之一。4试验样本量过小,无论试验结果是否存在差试验样本量过小,无论试验结果是否存在差异,均不能排除因机遇(随机误差)造成的异,均不能排除因机遇(随机误差)造成的假阳性或假阴性错误。假阳性或假阴性错误
3、。样本量过少:结果不稳定,检验效能过低,样本量过少:结果不稳定,检验效能过低,结论缺乏充分依据。结论缺乏充分依据。样本量过大:增加临床研究难度,造成人力、样本量过大:增加临床研究难度,造成人力、无力、时间和经济上的浪费,伦理问题,一无力、时间和经济上的浪费,伦理问题,一些临床意义不大的微弱疗效最终也可能会出些临床意义不大的微弱疗效最终也可能会出现统计学上的显著差异。现统计学上的显著差异。5估计样本含量的目的:估计样本含量的目的:在在保证某个临床试验保证某个临床试验/临床研究的结论临床研究的结论具有一定科学性、真实性和可靠性前具有一定科学性、真实性和可靠性前提下,确定某研究所需的提下,确定某研究
4、所需的最小观最小观察样察样本量本量。6 在各种临床科研设计方法的样本含量估计中,需在各种临床科研设计方法的样本含量估计中,需要事要事先确定先确定的参数有的参数有:1、。即假设检验出假阳性结果的发生概率。即假设检验出假阳性结果的发生概率2 2、。即假设检验出假阴性结果的发生概率。即假设检验出假阴性结果的发生概率3 3、量量(容(容许许误差或差值)误差或差值),一般通,一般通过文献复习或预试验,在设计之初由研究者根据研究过文献复习或预试验,在设计之初由研究者根据研究目的和专业知识加以确定。目的和专业知识加以确定。4 4、。一般通过文献复习或预试。一般通过文献复习或预试验,亦可作合理的假设得到。验,
5、亦可作合理的假设得到。若若终点指标为数值变量时终点指标为数值变量时,需,需要研究者确定总体标准差要研究者确定总体标准差。若若终点指标为分类变量时,有时需要研究者确定总体率终点指标为分类变量时,有时需要研究者确定总体率。7(1)确定)确定I型错误率型错误率所所有样本含量估计公式中,都需要有样本含量估计公式中,都需要u u的值,研究者的值,研究者确定检验水准(确定检验水准()的大小后,查表得)的大小后,查表得u u值。值。有有单侧单侧与与双侧双侧之分,单侧之分,单侧的的u u小于双侧小于双侧u u值,值,所以按单侧计算的样所以按单侧计算的样本量本量小于双侧。小于双侧。越小所需样越小所需样本量本量越
6、大,反之越小,一般取越大,反之越小,一般取 0.050.058(2)确定)确定II型错误率型错误率样样本含量计算中,需要本含量计算中,需要u u的值,即研究者确定的值,即研究者确定大大小后,查表的小后,查表的u u值。值。确定确定大小,主要是要确定检验效能(大小,主要是要确定检验效能(PowerPower),用),用1-表示其概率的大小,检验效能是指总体间确有表示其概率的大小,检验效能是指总体间确有差别时,假设检验能发现这种差别的能力大小。差别时,假设检验能发现这种差别的能力大小。为第二类误差的概率,为第二类误差的概率,值越小,检验效率越高,值越小,检验效率越高,所需样本量也就越大,通常所需样
7、本量也就越大,通常=0.1=0.1或或=0.2=0.2。一般认。一般认为检验效率不能小于为检验效率不能小于0.70.7。9(3)确定容许误差或差值)确定容许误差或差值 即即有临床意义或研究意义的有临床意义或研究意义的最小差值最小差值。若为数值变量时,若为数值变量时,可为有临床意义的均数差值、可为有临床意义的均数差值、实验前后之差等。实验前后之差等。若为分类资料,若为分类资料,可为有临床意义的有效率、患病可为有临床意义的有效率、患病率等率之差。率等率之差。10(4)确定总体标准差)确定总体标准差或或总体率总体率若若研究的终点指标为数值变量时,总体标准差研究的终点指标为数值变量时,总体标准差为估计
8、样本含量所必须的条件。为估计样本含量所必须的条件。若研究的终点指标为分类变量时,有时,总体率若研究的终点指标为分类变量时,有时,总体率为估计样本含量条件。为估计样本含量条件。若总体标准差若总体标准差和总体率和总体率,常常通过文献检索、,常常通过文献检索、预试验或对研究作出合理的假设来获得。预试验或对研究作出合理的假设来获得。11除了基本量估算的基本条件(基本要素)。除了基本量估算的基本条件(基本要素)。进一步结合研究目的、指标性质、假设检验类型及进一步结合研究目的、指标性质、假设检验类型及单双侧检验等加以灵活运用。单双侧检验等加以灵活运用。假设检验类型不同,样本量也有所变化。如临床试假设检验类
9、型不同,样本量也有所变化。如临床试验中两组率或均数进行比较,检验目的可分为显著验中两组率或均数进行比较,检验目的可分为显著性检验、优效检验、非劣效检验和等价性检验。性检验、优效检验、非劣效检验和等价性检验。121 1、根据研究目的,严格选择估算样本含量的根据研究目的,严格选择估算样本含量的方法,如单、双侧不同,估计参数与假设检方法,如单、双侧不同,估计参数与假设检验不同,一般假设检验与等价检验不同,样验不同,一般假设检验与等价检验不同,样本率超过与位于本率超过与位于0.3-0.70.3-0.7(0.2-0.80.2-0.8)范围不同,)范围不同,t t检验与检验与u u检验不同等。检验不同等。
10、132 2、考虑统计方法、考虑统计方法样本量样本量的估计还要与以后将要使用的统计的估计还要与以后将要使用的统计方法的条件相结合。如方法的条件相结合。如单因素分析单因素分析、相关相关与回归与回归、多因素分析多因素分析等。等。目目前样本含量估计的公式计算主要针对单前样本含量估计的公式计算主要针对单因素分析,而多因素分析的例数估计请参因素分析,而多因素分析的例数估计请参考有关书籍考有关书籍143 3.样本来源的可行性和可及性样本来源的可行性和可及性 特别是考虑有无人力、时间和经费等方特别是考虑有无人力、时间和经费等方面的限制。面的限制。154 4.容许容许误差值误差值的约定的约定 在计算样本含量之前
11、,一定要明确欲检在计算样本含量之前,一定要明确欲检测有临床意义的值测有临床意义的值/差值及其表达方式。差值及其表达方式。容许误差值容许误差值既可为置信区间的既可为置信区间的1/21/2宽度,宽度,也可以是能检出的有临床意义的差值。也可以是能检出的有临床意义的差值。不能确定不能确定时,需要敏感性分析,即绘制时,需要敏感性分析,即绘制检验效能(检验效能(PowerPower)与样本量间的变换曲线。)与样本量间的变换曲线。165 5.适当扩大样本量适当扩大样本量 由于估算的样本含量是能检测出差别的由于估算的样本含量是能检测出差别的最小样本量,考虑到受试者可能有不合作者、最小样本量,考虑到受试者可能有
12、不合作者、中途失访、意外死亡等情况出现,而减少有中途失访、意外死亡等情况出现,而减少有效观察对象的例数(效观察对象的例数(失访失访),因此,应按照),因此,应按照一定失访率适当扩大样本量。一定失访率适当扩大样本量。一般要求在样本量估计值的基础上增加一般要求在样本量估计值的基础上增加10%20%。176 6、多指标估算、多指标估算若若某研究有多个效应指标,其样本含量估计应某研究有多个效应指标,其样本含量估计应对每个效应指标进行样本量的估计,然后取样对每个效应指标进行样本量的估计,然后取样本数量最大者为其研究的样本量。本数量最大者为其研究的样本量。若某研究能区分主要指标和次要指标时,也可若某研究能
13、区分主要指标和次要指标时,也可以只对主要指标进行样本含量估计,然后取量以只对主要指标进行样本含量估计,然后取量大者为其研究的样本含量。大者为其研究的样本含量。187 7.组间例数相等组间例数相等 成组设计的例数,应尽可能采用例数相成组设计的例数,应尽可能采用例数相等的设计,尤其是多组设计时,一般要求等的设计,尤其是多组设计时,一般要求各组间的样本含量相等,只有在某些特殊各组间的样本含量相等,只有在某些特殊情况下才考虑各组的样本含量不相等。情况下才考虑各组的样本含量不相等。198、校正样本含量、校正样本含量分层整群抽样时分层整群抽样时 由有些临床研究的抽样单元不是个体研由有些临床研究的抽样单元不
14、是个体研究对象,而是以一组个体为研究单位(如家究对象,而是以一组个体为研究单位(如家庭、班级、村、工作单位等),整体抽样的庭、班级、村、工作单位等),整体抽样的优势在于易于管理优势在于易于管理,能减少沾染和提高依,能减少沾染和提高依从性,但同时增大了抽样误差,需要较大样从性,但同时增大了抽样误差,需要较大样本量。本量。209、临床试验样本量按规定执行、临床试验样本量按规定执行 对于临床试验,特别是新药临床试验样本量对于临床试验,特别是新药临床试验样本量估计必须执行有关规定。例如:估计必须执行有关规定。例如:一期一期 人体药理学研究,受试者为健康志愿者,需要人体药理学研究,受试者为健康志愿者,需
15、要20至至30例例二期二期 探索治疗作用,受试者为患者,试验组和对照组均探索治疗作用,受试者为患者,试验组和对照组均100例例三期三期 疗效证实试验,受试者为患者,试验组不少于疗效证实试验,受试者为患者,试验组不少于300例例四期四期 新药上市后监测,受试者为患者,开放试验应在新药上市后监测,受试者为患者,开放试验应在2000例以上例以上211.3.样本量与检验效能两者关系密切,样本量估算的同时,要考虑检验效能两者关系密切,样本量估算的同时,要考虑检验效能大小,一般对估算公式进行适当的恒等变换后,可计大小,一般对估算公式进行适当的恒等变换后,可计算算u u,进而计算检验效能(,进而计算检验效能
16、(1-1-)。)。检验效能(检验效能(powerpower)或把握度:是指两总体参数确有)或把握度:是指两总体参数确有差别,假设检验能发现他们有差别的能力。用差别,假设检验能发现他们有差别的能力。用1-1-表表示其概率大小。示其概率大小。检验效能只能去单侧,一般认为检验效能至少去检验效能只能去单侧,一般认为检验效能至少去0.800.80。22样本量估计两大类方法1 1、公式法,可满足多种设计的要求,公式法,可满足多种设计的要求,目前应用广泛。目前应用广泛。2 2、查表法,简单、方便,但受条件限查表法,简单、方便,但受条件限制,有时不一定完全适应。制,有时不一定完全适应。232.1、单个总体均数
17、研究的样本量估计、单个总体均数研究的样本量估计第二节第二节 基于数值变量资料的基于数值变量资料的样本量估计样本量估计24单侧单侧0.400.300.200.100.050.0250.010.005双侧双侧/20.800.600.400.200.100.050.020.010.400.300.200.100.050.0250.010.0051-0.600.700.800.900.950.9750.990.995u值0.25320.52430.84171.28161.64491.9602.32632.5758 详解:详解:为总体标准差,一般为总体标准差,一般 用样本标准差表示;用样本标准差表示;为
18、容许误差,即样本为容许误差,即样本 均数与总体均数间的容许差值;均数与总体均数间的容许差值;取双侧,取双侧,u u值可以查表。值可以查表。222un 25例例1 1:某医院拟用抽样调查评价本地区健康成人白细胞数的某医院拟用抽样调查评价本地区健康成人白细胞数的水平,要求水平,要求误差误差不超过不超过0.20.2*10109 9/L/L。根据文献报告,健康成。根据文献报告,健康成人的白细胞数的人的白细胞数的标准差标准差约约1.51.5*10109 9/L/L。问需要调查多少人。问需要调查多少人(双侧双侧=0.05=0.05)222un 单侧0.400.300.200.100.050.0250.01
19、0.005双侧双侧/20.800.600.400.200.100.050.020.010.400.300.200.100.050.0250.010.0051-0.600.700.800.900.950.9750.990.995u值值0.25320.52430.84171.28161.64491.9602.32632.5758解:解:n=(1.96)n=(1.96)2 2(1.5)(1.5)2 2/(0.2)/(0.2)2 2=216.1=216.1 21721726例例2 2:某院普查市区:某院普查市区2-62-6岁幼儿体格发育情况,其中体重未达标的幼岁幼儿体格发育情况,其中体重未达标的幼儿,
20、血红蛋白儿,血红蛋白平均平均为为100g/L100g/L,标准差标准差25g/L25g/L。现欲使用抗贫血药物,。现欲使用抗贫血药物,如果治疗前后血红蛋白上升如果治疗前后血红蛋白上升10g/L10g/L为有效。设单侧为有效。设单侧=0.05=0.05,=0.1=0.1时,试问应治疗多少人,可以认为该药是有效的?时,试问应治疗多少人,可以认为该药是有效的?222uun解:解:n=(1.6449+1.2816)n=(1.6449+1.2816)2 2(25)(25)2 2/(10)/(10)2 2=53.5=53.5 54样本量在此基础上增加样本量在此基础上增加2例,即:例,即:54+2=56例例
21、单侧单侧0.400.300.200.100.050.0250.010.005双侧双侧/20.800.600.400.200.100.050.020.010.400.300.200.100.050.0250.010.0051-0.600.700.800.900.950.9750.990.995u值0.25320.52430.84171.28161.64491.9602.32632.575827222duun例例3:某医师拟用新药治疗矽肺患者,预实验尿矽排出:某医师拟用新药治疗矽肺患者,预实验尿矽排出量平均比治疗前量平均比治疗前增加增加15mg/L,标准差为,标准差为25mg/L,问需,问需要观察
22、多少患者可以认为该药有效要观察多少患者可以认为该药有效(单侧(单侧=0.05,=0.10)解:解:n n=(1.6449+1.2816)=(1.6449+1.2816)2 2(25)(25)2 2/(15)/(15)2 2=23.8=23.8 24 n+2=26.即:观察例数不得少于即:观察例数不得少于26例。例。28222/11knuu解析:式中整体方差解析:式中整体方差 2 2 可用样本方差可用样本方差 S S2 2 估计,估计,差值差值 试验组样本量为试验组样本量为n n,对照组样本含量为,对照组样本含量为knkn,当当k=1k=1时两组样本含量相等。时两组样本含量相等。)/11/()(
23、222kkssscexxce29例例4 4:某一项研究吲达帕胺治疗原发性高血压的治疗,:某一项研究吲达帕胺治疗原发性高血压的治疗,经预试验得治疗前后舒张压差值(经预试验得治疗前后舒张压差值(mmHgmmHg)资料如下)资料如下(与安慰剂比较,两药治疗前后差异均有显著性差(与安慰剂比较,两药治疗前后差异均有显著性差异),当异),当=0.05=0.05,=0.10=0.10时需要治疗多少例可以认时需要治疗多少例可以认为吲达帕胺有效?(为吲达帕胺有效?(设设k=0.7)均数标准差吲达帕胺吲达帕胺17.1()8.175()安慰剂安慰剂9.9()3()xexcsesc222/11knuu)/11/()(
24、222kkssce30解:解:n n=(1.6449+1.2816)=(1.6449+1.2816)2 2(1+1/0.7)5.736(1+1/0.7)5.7362 2/5/52 2=27.4=27.428 n+2=28+2=30。Kn=0.730=21 故:试验组至少需治疗故:试验组至少需治疗30例,对照组至少需要治疗例,对照组至少需要治疗21例。例。3.1、单个总体率的样本量估计、单个总体率的样本量估计第三节第三节 基于无序分类资料的基于无序分类资料的样本量估计样本量估计31当目标事件发生率为当目标事件发生率为0.2-0.80.2-0.8(0.3-0.70.3-0.7)时,用下)时,用下列
25、公式:列公式:p p为总体率,为总体率,为允许误差,即允许样本率和总体率的最大容许误差为多为允许误差,即允许样本率和总体率的最大容许误差为多少,需自行设置,一般取总体率少,需自行设置,一般取总体率1-1-置信区间的间距一半置信区间的间距一半。u 值查值查u 值表(表值表(表17-1),一般),一般取双侧取双侧221ppuN32 例例5 5:某口腔医院研究青少年龋齿发病情况,拟了:某口腔医院研究青少年龋齿发病情况,拟了解某市青少年龋齿患病情况,期望解某市青少年龋齿患病情况,期望误差误差在平均患龋在平均患龋齿率齿率30%30%的的1/61/6范围范围内,当内,当=0.05=0.05,问需要抽样调,
26、问需要抽样调查多少人?查多少人?U U0.050.05=1.96=1.96P=0.3P=0.3=0.3/6=0.05=0.3/6=0.05221ppuN解:n=(1.96)2(0.30)(1-0.30)/(0.05)2=322.7 32333当目标事件发生率为当目标事件发生率为0.2-0.80.2-0.8(0.3-0.70.3-0.7)时,用下列公式:)时,用下列公式:例例6 6:某医师研究药物对产后宫缩、外阴创伤的镇痛效果,:某医师研究药物对产后宫缩、外阴创伤的镇痛效果,若新药比公认稳定有效的老药物(镇痛率若新药比公认稳定有效的老药物(镇痛率55%55%)高于)高于20%20%,可说明新药优
27、于标准药物可说明新药优于标准药物,需治疗多少例数?(设需治疗多少例数?(设=0.05=0.05,=0.20=0.20)查表查表u u0.050.05=1.6449,u=1.6449,u0.020.02=0.8417=0.8417221)(PPuuN答案:答案:n=38.339,该研究至少需治疗,该研究至少需治疗39例例34 p1,p2分别为甲、乙两法阳性率,分别为甲、乙两法阳性率,p为甲、乙两法一致性阳性率,为甲、乙两法一致性阳性率,甲法乙法+-P1+PP1-P-P2-PP212/)2(21pppp2121/)(22ppPPpPpuPuN35 例例7 7:某医师观察甲药是否比乙药治疗过敏性鼻炎
28、更有效,:某医师观察甲药是否比乙药治疗过敏性鼻炎更有效,采用配对双盲设计,预试验甲药有效率为采用配对双盲设计,预试验甲药有效率为60%60%,乙药有效,乙药有效率为率为50%50%,两药一致性阳性率为,两药一致性阳性率为43%43%,试估算两药疗效差别,试估算两药疗效差别有统计学意义时样本含量。有统计学意义时样本含量。设设u u0.050.05=1.96=1.96,u u0.10.1=1.2816=1.28162121/)(22ppPPpPpuPuN2/)2(21pppp本设计至少需要观察本设计至少需要观察235例例36例例8 8:某医师研究某药对产后宫缩痛、外阴创伤痛效果,:某医师研究某药对
29、产后宫缩痛、外阴创伤痛效果,预试验旧药镇痛率为预试验旧药镇痛率为55%55%,新药镇痛率为,新药镇痛率为75%75%,当,当=0.05=0.05,=0.1=0.1时需要观察多少例能说明新药镇痛效果优于旧药?时需要观察多少例能说明新药镇痛效果优于旧药?22)1(/11ppppkuuNcekpkppce1解:解:n=111.4112(k=0.75)kn=0.75 112=84 故试验组观察故试验组观察112例,对照组观察例,对照组观察84组组37当目标事件发生率为当目标事件发生率为0.2-0.8(0.3-0.7)时,)时,用下列公式用下列公式 4.1、多因素分析的样本量估计(略)、多因素分析的样本
30、量估计(略)第四节第四节 其他常见类型的其他常见类型的样本量估计样本量估计381 1、多种样本量估计条件、多种样本量估计条件 尽尽可能将多样可能将多样本量本量估计方法联合使用,并且估计方法联合使用,并且在使用计算法估算时,可多做几种估算方案,在使用计算法估算时,可多做几种估算方案,以便选择。以便选择。如如:不同的:不同的、等条件组合下,估计其样等条件组合下,估计其样本本量量。2 2、样本量、样本量估计的适用条件估计的适用条件 目前,国内有关书籍提供的样本量计算公式,目前,国内有关书籍提供的样本量计算公式,主要适用于临床试验,而并非适用于其他医学主要适用于临床试验,而并非适用于其他医学实验,如动物实验。实验,如动物实验。动物实验的样本量可以参考临床试验的样本含动物实验的样本量可以参考临床试验的样本含量,并在此基础上适当减少其数量。量,并在此基础上适当减少其数量。谢谢聆听!