1、,2020/4/6,1,医学统计学 人民卫生出版社,第八章 总体率的区间估计和假设检验,2020/4/6,2,学习目标 掌握:率的标准误的计算方法,总体率的区间估计方法,样本率与总体率比较的z检验、两样本率比较的z检验、独立四格表资料的 检验、配对四格表资料的 检验,行列表资料的 检验。 熟悉:率的抽样误差的概念,样本率与总体率比较和两样本率比较的检验的适用条件,独立四格表与配对四格表资料的连续性校正条件。 了解: 检验的基本思想,行列表检验的注意事项。,2020/4/6,3,第一节 率的抽样误差与总体率的区间估计,2020/4/6,4,2020/4/6,5,2020/4/6,6,2020/4
2、/6,7,2020/4/6,8,2020/4/6,9,2020/4/6,10,2020/4/6,11,2020/4/6,12,第二节 率的z检验,2020/4/6,13,2020/4/6,14,2020/4/6,15,第二节 率的z检验,2020/4/6,16,2020/4/6,17,2020/4/6,18,2020/4/6,19,2020/4/6,20,第二节 率的z检验,2020/4/6,21,2020/4/6,22,2020/4/6,23,2020/4/6,24,2020/4/6,25,2020/4/6,26,2020/4/6,27,2020/4/6,28,2020/4/6,29,202
3、0/4/6,30,检验是用途很广的一种假设检验方法,可以用于两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验;分类资料的相关分析;频数分布的拟合优度检验等。这里我们主要学习它在分类变量资料统计推断中的应用,包括:独立四格表资料的卡方检验;配对四格表资料卡方检验;行列表资料卡方检验。,第三节 检验,2020/4/6,31,卡方检验是用途很广的一种假设检验方法,这里 我们主要学习它在分类资料统计推断中的应用, 包括:两个率或两个构成比比较的卡方检验;多 个率或多个构成比比较的卡方检验;分类资料 的相关分析;频数分布的拟合优度检验等。,2020/4/6,32,2分布是一种连续型随机
4、变量的概率分布。如果Z服从标准正态分布,那么,Z2服从自由度为1的2分布。 设有k个相互独立的标准正态分布随机变量Z1、Z2Z,Z12+Z22+Z2的分布称为自由度为的2分布,记为 2分布的形状依赖于自由度的大小,当自由度2时,随着的增加,曲线逐渐趋于对称,当自由度趋于时,2分布逼近正态分布。,2020/4/6,33,在分类资料统计分析中我们常会遇到这样的资料,如两组大白鼠在不同致癌剂作用下的发癌率如下表,问两组发癌率有无差别?,一、卡方检验基本思想,2020/4/6,34,上表资料又被称之为四格表资料。卡方检验的统计量是卡方值,它是每个格子实际频数(A)与理论频数(T)差值平方与理论频数之比
5、的累计和。每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为71*91/113=57.18,故卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。,2020/4/6,35,假设检验事物的“实际频数”与“理论频数”的相差是由于抽样误差所引起的,亦或是二者本质上的差别。 2检验的基本公式: A:表示实际频数 T:表示理论频数,2020/4/6,36,适用范围,1、单个频数分布的拟和优度检验; 2、完全随机设计下两组频数分布的2检验和多组频数分布的2检验; 3、配对设计下两组频数分布的2检验。,2020/4/
6、6,37,二 独立四格表资料2检验,1、 2检验的基本公式,2020/4/6,38,例8-3-1:某医院分别用化学疗法和化疗结合放疗治疗卵巢癌肿患者,结果如下,问两种疗法有无差别? 表1:两种疗法治疗卵巢癌肿的疗效比较 组别 有效 无效 合计 有效率(%) 化疗组 19 24 43 44.2 化疗+放疗组 34 10 44 77.3 合 计 53 34 87 60.9 表中的四个数据是整个表中的基本资料,其余数据均由此推算出来,这四格资料专称四格表(fourfold table)。两有效率的差别可能是抽样误差所致,亦可能是两种治疗方法有效率(总体率)确有不同。用2检验来确定其统计学意义。,20
7、20/4/6,39,A为实际频数:表中四个数据; T为理论频数:根据检验假设推断出来的。即假设这两种卵巢癌肿治疗方法的有效率相同,差别仅是由于抽样误差所致。这里可将两种疗法的合计有效率作为理论有效率,以此为依据便可推算出四格表中相应四格的理论频数T。 TRC表示第R行C列格子的理论频数 nR为与理论数同行的行合计数 nC为与理论数同列的列合计数 n为总例数,2020/4/6,40,(1)建立检验假设、确定检验水准 H0:1=2 H1:12 =0.05 (2)计算检验统计量2值 =10.01 (3)确定P值作出推断性结论 2检验的自由度=(行数-1)(列数-1) 本题=(2-1)(2-1)=1
8、查2界值表: 2 0.05,1 =3.84,2 2 0.05,1 ,P0.05 结论:按=0.05检验水准拒绝H0接受H1,差异有统计学意义。可以认为采用放疗加化疗治疗卵巢癌肿的疗效比单用化疗好。,2020/4/6,41,2、四格表的专用公式:,式中a、b、c、d各代表四格表中的四个实际数,标记如下:,表1 两种疗法治疗卵巢癌肿的疗效比较 组别 有效 无效 合计 化疗组 19(a) 24(b) 43 化疗+放疗组 34(c) 10(d) 44 合 计 53 34 87 (n),2020/4/6,42,=10.01,结论同前。,2020/4/6,43,3、独立四格表的连续性校正公式: 由于2界值
9、表是根据连续性的理论分布计算出来的。但原始资料属于分类变量资料,是不连续的。由此计算的2值也是不连续的,特别是自由度为1的四格表资料,在下列情况下需计算校正的2值,如不校正,所得的概率偏低。 校正的条件:1T5,且n40时,需计算校正的2值,2020/4/6,44,校正2值的计算公式:,基本公式的校正,专用公式的校正,2020/4/6,45,例8-3-2 某医师用甲、乙两种疗法治疗小儿单纯性消化不良,结果如下,试比较两种疗法有效率有无差异? 表2:两种疗法治疗小儿单纯性消化不良疗效比较 疗法 痊愈数 未愈数 合计 甲 26(28.82) 7(4.18) 33 乙 36(33.18) 2(4.8
10、2) 38 合计 62 9 71,2020/4/6,46,(1)建立检验假设、确定检验水准 H0:1=2 H1:12 =0.05 (2)计算2值,(3)确定P值,作出推断性结论。 2 0.05,1 =3.84 , 20.05 结论:按=0.05检验水准尚不能拒绝H0,差异无统计学意义,故尚不能认为两种疗法的有效率不同。,2020/4/6,47,三 配对四格表资料的2检验,配对分类变量资料和配对数值变量资料从配对设计来说是相同的。对配对分类变量资料的统计分析,需用配对四格表资料的2检验。,2020/4/6,48,例8-3-3 下表是28份咽喉涂抹标本,每份按同样条件分别接种甲、乙两种白喉杆菌培养
11、基上,观察白喉杆菌生长情况,试比较两种培养基的效果? 表3:两种白喉杆菌培养基培养结果比较 甲培养基 乙培养基 合计 + - + 11(a) 9(b) 20 - 1 ( c) 7(d) 8 合 计 12 16 28,2020/4/6,49,从表中资料可见有四种结果 a:甲+乙+ b:甲+ 乙- c:甲- 乙+ d:甲- 乙- 我们的目的是比较两种培养基的培养结果有无差异,则a、d 两种结果是一致的,对差异比较毫无意义。故我们只考虑结果不同的b与c。 若两种培养基的培养结果没有差别,则b应等于c,但是由于抽样误差的存在样本的b和c可能不等,如何做出判断可进行如下2检验 当b+c40时 当b+c4
12、0时,2020/4/6,50,(1)建立检验假设、确定检验水准 H0:1=2 H1:12 =0.05 (2)计算2值,(3)2 0.05,1 =3.84 22 0.05,1 P0.05 结论:按=0.05检验水准拒绝H0接受H1 ,差异有统计学意义。故可以认为甲培养基的白喉杆菌的生长效率较高。,2020/4/6,51,作业1 用甲乙两种方法检查已确诊的胰腺癌病人120例,结果如下表。问两种方法检出结果是否有差异? 甲乙两法对胰腺癌的检出结果,2020/4/6,52,作业2 现对53例经标准化诊断为原发性肝癌(HCC)病人和42例非原发性肝癌病人采用血清胎盘酸性同功铁蛋白(PAIF)进行鉴别诊断
13、,结果见下表。问PAIF判断结果与标准诊断结果是否一样? 对原发性肝癌的鉴别诊断,2020/4/6,53,四、行列资料2检验 分类变量资料具有多分类时,两个频数分布的数据可表示为一个R*C列联表。对这类资料进行2检验时统计量2按下式计算:,A为各格子实际频数 ni、mj为与各Aij值相对应的行合计、列合计。n有(i=1、2R)R个取值;m有(j=1、2C)C个取值。 上式的适用条件:不能有理论数T1,并且1T5的格子数不超过总格子数的1/5。 自由度=(行数-1)(列数-1),2020/4/6,54,条件不足时有三种处理方法: (1)增大样本例数使理论数变大; (2)删去理论数太小的行或列;
14、(3)将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论数增大。但如此处理有可能损失信息,也会损害样本的随机性。,2020/4/6,55,适用范围 1、两总体构成比比较; 2、多总体率比较; 3、多总体构成比比较;,2020/4/6,56,两总体构成比的比较,2020/4/6,57,2020/4/6,58,2020/4/6,59,例8-3-5 某省观察三个地区的花生污染黄曲霉毒素B1的情况,见下表。问三个地区花生的黄曲霉毒素B1污染率有无差别?,多个率的比较,2020/4/6,60,表4:某省三个地区花生的黄曲霉毒素B1污染率比较 地区 未污染 污染 合计 污染率(%) 甲 6
15、23 29 79.3 乙 30 14 44 31.8 丙 8 3 11 27.3 合计 44 40 84 47.6,(1)建立检验假设、确定检验水准 H0:三个地区花生污染黄曲霉毒素B1污染率相等 H1:三个地区花生污染黄曲霉毒素B1污染率不等或不全相等 =0.05 (2)计算2值,2020/4/6,61,=(3-1)(2-1)=2 (3)2 0.05,2 =5.99 22 0.05,2 P0.05 结论:按=0.05检验水准尚不能拒绝H0接受H1 ,故可认为三个地区花生污染黄曲霉毒素B1污染率不等或不全相等,有地区性差异。,2020/4/6,62,多总体构成比的比较,2020/4/6,63,2020/4/6,64,2020/4/6,65,对于比较多组独立样本的2检验,拒绝H0只能说明各组总体概率不全相同,即多组中至少有两组的有效概率是不同的,但并不是多组有效概率彼此之间均不相同。若要明确哪两组间不同,还需进一步作多组间的两两比较。(2分割),2020/4/6,66,2020/4/6,67,2020/4/6,68,Thank You !,