医学精品课件：08第八章总体率的区间估计与假设检验.ppt_163文库

资源描述

1、,2020/4/6,1,医学统计学人民卫生出版社,第八章总体率的区间估计和假设检验,2020/4/6,2,学习目标掌握：率的标准误的计算方法，总体率的区间估计方法，样本率与总体率比较的z检验、两样本率比较的z检验、独立四格表资料的检验、配对四格表资料的检验，行列表资料的检验。熟悉：率的抽样误差的概念，样本率与总体率比较和两样本率比较的检验的适用条件，独立四格表与配对四格表资料的连续性校正条件。了解：检验的基本思想，行列表检验的注意事项。,2020/4/6,3,第一节率的抽样误差与总体率的区间估计,2020/4/6,4,2020/4/6,5,2020/4/6,6,2020/4

2、/6,7,2020/4/6,8,2020/4/6,9,2020/4/6,10,2020/4/6,11,2020/4/6,12,第二节率的z检验,2020/4/6,13,2020/4/6,14,2020/4/6,15,第二节率的z检验,2020/4/6,16,2020/4/6,17,2020/4/6,18,2020/4/6,19,2020/4/6,20,第二节率的z检验,2020/4/6,21,2020/4/6,22,2020/4/6,23,2020/4/6,24,2020/4/6,25,2020/4/6,26,2020/4/6,27,2020/4/6,28,2020/4/6,29,202

3、0/4/6,30,检验是用途很广的一种假设检验方法，可以用于两个率或两个构成比比较的卡方检验；多个率或多个构成比比较的卡方检验；分类资料的相关分析；频数分布的拟合优度检验等。这里我们主要学习它在分类变量资料统计推断中的应用，包括：独立四格表资料的卡方检验；配对四格表资料卡方检验；行列表资料卡方检验。,第三节检验,2020/4/6,31,卡方检验是用途很广的一种假设检验方法，这里我们主要学习它在分类资料统计推断中的应用，包括：两个率或两个构成比比较的卡方检验；多个率或多个构成比比较的卡方检验；分类资料的相关分析；频数分布的拟合优度检验等。,2020/4/6,32,2分布是一种连续型随机

4、变量的概率分布。如果Z服从标准正态分布，那么，Z2服从自由度为1的2分布。设有k个相互独立的标准正态分布随机变量Z1、Z2Z，Z12+Z22+Z2的分布称为自由度为的2分布，记为 2分布的形状依赖于自由度的大小，当自由度2时，随着的增加，曲线逐渐趋于对称，当自由度趋于时，2分布逼近正态分布。,2020/4/6,33,在分类资料统计分析中我们常会遇到这样的资料，如两组大白鼠在不同致癌剂作用下的发癌率如下表，问两组发癌率有无差别？,一、卡方检验基本思想,2020/4/6,34,上表资料又被称之为四格表资料。卡方检验的统计量是卡方值，它是每个格子实际频数(A)与理论频数(T)差值平方与理论频数之比

5、的累计和。每个格子中的理论频数T是在假定两组的发癌率相等（均等于两组合计的发癌率）的情况下计算出来的，如第一行第一列的理论频数为71*91/113=57.18，故卡方值越大，说明实际频数与理论频数的差别越明显，两组发癌率不同的可能性越大。,2020/4/6,35,假设检验事物的“实际频数”与“理论频数”的相差是由于抽样误差所引起的，亦或是二者本质上的差别。 2检验的基本公式： A：表示实际频数 T：表示理论频数,2020/4/6,36,适用范围,1、单个频数分布的拟和优度检验； 2、完全随机设计下两组频数分布的2检验和多组频数分布的2检验； 3、配对设计下两组频数分布的2检验。,2020/4/

6、6,37,二独立四格表资料2检验,1、 2检验的基本公式,2020/4/6,38,例8-3-1：某医院分别用化学疗法和化疗结合放疗治疗卵巢癌肿患者，结果如下，问两种疗法有无差别？表1：两种疗法治疗卵巢癌肿的疗效比较组别有效无效合计有效率（%）化疗组 19 24 43 44.2 化疗+放疗组 34 10 44 77.3 合计 53 34 87 60.9 表中的四个数据是整个表中的基本资料，其余数据均由此推算出来，这四格资料专称四格表（fourfold table）。两有效率的差别可能是抽样误差所致，亦可能是两种治疗方法有效率（总体率）确有不同。用2检验来确定其统计学意义。,20

7、20/4/6,39,A为实际频数：表中四个数据； T为理论频数：根据检验假设推断出来的。即假设这两种卵巢癌肿治疗方法的有效率相同，差别仅是由于抽样误差所致。这里可将两种疗法的合计有效率作为理论有效率，以此为依据便可推算出四格表中相应四格的理论频数T。 TRC表示第R行C列格子的理论频数 nR为与理论数同行的行合计数 nC为与理论数同列的列合计数 n为总例数,2020/4/6,40,（1）建立检验假设、确定检验水准 H0：1=2 H1：12 =0.05 （2）计算检验统计量2值 =10.01 （3）确定P值作出推断性结论 2检验的自由度=（行数-1）（列数-1）本题=（2-1）（2-1）=1

8、查2界值表： 2 0.05，1 =3.84，2 2 0.05，1 ，P0.05 结论：按=0.05检验水准拒绝H0接受H1，差异有统计学意义。可以认为采用放疗加化疗治疗卵巢癌肿的疗效比单用化疗好。,2020/4/6,41,2、四格表的专用公式：,式中a、b、c、d各代表四格表中的四个实际数，标记如下：,表1 两种疗法治疗卵巢癌肿的疗效比较组别有效无效合计化疗组 19（a） 24（b） 43 化疗+放疗组 34（c） 10（d） 44 合计 53 34 87 （n）,2020/4/6,42,=10.01,结论同前。,2020/4/6,43,3、独立四格表的连续性校正公式：由于2界值

9、表是根据连续性的理论分布计算出来的。但原始资料属于分类变量资料，是不连续的。由此计算的2值也是不连续的，特别是自由度为1的四格表资料，在下列情况下需计算校正的2值，如不校正，所得的概率偏低。校正的条件：1T5,且n40时，需计算校正的2值,2020/4/6,44,校正2值的计算公式：,基本公式的校正,专用公式的校正,2020/4/6,45,例8-3-2 某医师用甲、乙两种疗法治疗小儿单纯性消化不良，结果如下，试比较两种疗法有效率有无差异？表2：两种疗法治疗小儿单纯性消化不良疗效比较疗法痊愈数未愈数合计甲 26（28.82） 7（4.18） 33 乙 36（33.18） 2（4.8

10、2） 38 合计 62 9 71,2020/4/6,46,（1）建立检验假设、确定检验水准 H0：1=2 H1：12 =0.05 （2）计算2值,（3）确定P值，作出推断性结论。 2 0.05，1 =3.84 ， 20.05 结论：按=0.05检验水准尚不能拒绝H0，差异无统计学意义，故尚不能认为两种疗法的有效率不同。,2020/4/6,47,三配对四格表资料的2检验,配对分类变量资料和配对数值变量资料从配对设计来说是相同的。对配对分类变量资料的统计分析，需用配对四格表资料的2检验。,2020/4/6,48,例8-3-3 下表是28份咽喉涂抹标本，每份按同样条件分别接种甲、乙两种白喉杆菌培养

11、基上，观察白喉杆菌生长情况，试比较两种培养基的效果？表3：两种白喉杆菌培养基培养结果比较甲培养基乙培养基合计 + - + 11（a） 9(b) 20 - 1 ( c) 7(d) 8 合计 12 16 28,2020/4/6,49,从表中资料可见有四种结果 a:甲+乙+ b：甲+ 乙- c：甲- 乙+ d：甲- 乙- 我们的目的是比较两种培养基的培养结果有无差异，则a、d 两种结果是一致的，对差异比较毫无意义。故我们只考虑结果不同的b与c。若两种培养基的培养结果没有差别，则b应等于c，但是由于抽样误差的存在样本的b和c可能不等，如何做出判断可进行如下2检验当b+c40时当b+c4

12、0时,2020/4/6,50,（1）建立检验假设、确定检验水准 H0：1=2 H1：12 =0.05 （2）计算2值,（3）2 0.05，1 =3.84 22 0.05，1 P0.05 结论：按=0.05检验水准拒绝H0接受H1 ，差异有统计学意义。故可以认为甲培养基的白喉杆菌的生长效率较高。,2020/4/6,51,作业1 用甲乙两种方法检查已确诊的胰腺癌病人120例，结果如下表。问两种方法检出结果是否有差异？甲乙两法对胰腺癌的检出结果,2020/4/6,52,作业2 现对53例经标准化诊断为原发性肝癌（HCC）病人和42例非原发性肝癌病人采用血清胎盘酸性同功铁蛋白（PAIF）进行鉴别诊断

13、，结果见下表。问PAIF判断结果与标准诊断结果是否一样？对原发性肝癌的鉴别诊断,2020/4/6,53,四、行列资料2检验分类变量资料具有多分类时，两个频数分布的数据可表示为一个R*C列联表。对这类资料进行2检验时统计量2按下式计算：,A为各格子实际频数 ni、mj为与各Aij值相对应的行合计、列合计。n有（i=1、2R）R个取值；m有(j=1、2C)C个取值。上式的适用条件：不能有理论数T1，并且1T5的格子数不超过总格子数的1/5。自由度=（行数-1）（列数-1）,2020/4/6,54,条件不足时有三种处理方法：（1）增大样本例数使理论数变大；（2）删去理论数太小的行或列；

14、（3）将理论数太小的行或列与性质相近的邻行或邻列合并，使重新计算的理论数增大。但如此处理有可能损失信息，也会损害样本的随机性。,2020/4/6,55,适用范围 1、两总体构成比比较； 2、多总体率比较； 3、多总体构成比比较；,2020/4/6,56,两总体构成比的比较,2020/4/6,57,2020/4/6,58,2020/4/6,59,例8-3-5 某省观察三个地区的花生污染黄曲霉毒素B1的情况，见下表。问三个地区花生的黄曲霉毒素B1污染率有无差别？,多个率的比较,2020/4/6,60,表4：某省三个地区花生的黄曲霉毒素B1污染率比较地区未污染污染合计污染率（%）甲 6

15、23 29 79.3 乙 30 14 44 31.8 丙 8 3 11 27.3 合计 44 40 84 47.6,（1）建立检验假设、确定检验水准 H0：三个地区花生污染黄曲霉毒素B1污染率相等 H1：三个地区花生污染黄曲霉毒素B1污染率不等或不全相等 =0.05 （2）计算2值,2020/4/6,61,=（3-1）（2-1）=2 （3）2 0.05，2 =5.99 22 0.05，2 P0.05 结论：按=0.05检验水准尚不能拒绝H0接受H1 ，故可认为三个地区花生污染黄曲霉毒素B1污染率不等或不全相等，有地区性差异。,2020/4/6,62,多总体构成比的比较,2020/4/6,63,2020/4/6,64,2020/4/6,65,对于比较多组独立样本的2检验，拒绝H0只能说明各组总体概率不全相同，即多组中至少有两组的有效概率是不同的，但并不是多组有效概率彼此之间均不相同。若要明确哪两组间不同，还需进一步作多组间的两两比较。（2分割）,2020/4/6,66,2020/4/6,67,2020/4/6,68,Thank You !,

展开阅读全文