1、第十章第十章 2检验检验(chi-square test)2 检验是一种用途广泛的假设检验方法,本章检验是一种用途广泛的假设检验方法,本章只介绍它在分类变量资料中的应用只介绍它在分类变量资料中的应用:推断两个或两个以上总体率或构成比之间有无差推断两个或两个以上总体率或构成比之间有无差别;别;两个分类变量间有无关系;两个分类变量间有无关系;检验频数分布的拟合优度(实际分布是否服从某检验频数分布的拟合优度(实际分布是否服从某理论分布)。理论分布)。例例10-1n 某医生用某医生用A、B两种药物治疗急性下呼吸道感染,两种药物治疗急性下呼吸道感染,A药治疗药治疗74例,有效例,有效68例,例,B药治疗
2、药治疗63例,有效例,有效52例,例,结果见表结果见表10-1。问两种药的有效率是否有差别?。问两种药的有效率是否有差别?表表10-1 两种药治疗急性下呼吸道感染有效率比较两种药治疗急性下呼吸道感染有效率比较处 理有效例数无效例数合 计有效率(%)A 药68(64.818)a6(9.182)b74 (a+b)91.89B 药52(55.182)c11(7.818)d63 (c+d)82.54合计120 (a+c)17 (b+d)137(n=a+b+c+d)87.59x x2 2检验基本思想 组别+合计Aa bn1Bc dn2合计m1m2n四格表资料可用上表表示,a、b、c、d这四个格子的数据是
3、基本数据,行之间、列之间的数据相互独立,互不包含。n1.假设两总体率相等,用两样本合并的阳性率 估计,即n2.计算理论频数:n3.实际频数与理论频数的差值服从分布 1mn112mnrcrcn nTn22ATxTn2值反映了实际频数与理论频数的吻合程度,如果H0成立,则实际频数与理论频数之差一般不会很大,若实际频数与理论频数差别很大,出现大的2值的概率P是很小的,P时我们就怀疑假设成立,因而拒绝假设,若P,则没有理由拒绝它。基本公式基本公式 A:表示实际频数,即实际观察到的例数。:表示实际频数,即实际观察到的例数。T:理论频数,即如果假设检验成立,应该观察到的:理论频数,即如果假设检验成立,应该
4、观察到的例数。例数。自由度自由度=(R-1)x(C-1)R行数,行数,C列数,列数,nR是是ARC所在行的合计,所在行的合计,nC是是ARC所在列的合计所在列的合计22()RCRCRCATTRCRCnnTnx2分布界值 n自由度一定时,自由度一定时,P值越小,值越小,x2值越大。值越大。n当当P 值一定时,自由度越大,值一定时,自由度越大,x2越大。越大。nv=1时,时,P=0.05,x2=3.84 P=0.01,x2=6.63nP=0.05时,时,v=1,x2=3.84 v=2,x2=5.99 四格表四格表2 2检验公式检验公式22()RCRCRCATT22adbcnacabcdbd当n40
5、,T5时1.建立假设建立假设 H0:两药疗效相同:两药疗效相同 H1:两药疗效不相同:两药疗效不相同 =0.052.计算检验统计计算检验统计3.P0.05 差异无统计学意义。差异无统计学意义。22268 11 6 521372.7474 63 120 17adbcnacabcdbd 四格表资料四格表资料2 2统计量的校正公式统计量的校正公式22(0.5)A TT222nadbcnacabcdbd当n40,1T5时n例10-2 两种药物治疗葡萄球菌败血症疗效的试验结果如下,问两种药物的疗效有无差异?药物疗效合计有效无效甲甲28(26.09)2(3.91)30乙乙12(13.91)4(2.09)1
6、6合计40 6461.建立假设建立假设 H0:两药疗效相同:两药疗效相同 H1:两药疗效不相同:两药疗效不相同 =0.052.计算检验统计计算检验统计2.3.P0.05 差异无统计学意义。差异无统计学意义。22224628 42 124621.6930 16 40 6nadbcnacabcdbd 交叉分类交叉分类22表的关联性分析表的关联性分析n例103 为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机调查了消化不良儿童82例,对每个个体分别观察腹泻与否和喂养方式两种属性,结果如下,分析两种属性的关联性。喂养方式喂养方式腹腹 泻泻合计合计有有无无人工人工30 1040母乳母乳17 2542合计
7、47 358222交叉分类表的一般形式及概率表达属性X属性Y合计Y1Y2X1A11(11)A12(12)n1(r1)X2A21(21)A22(22)n2(r2)合计m1(c1)m2(c2)n(1.0)基本思想 所谓两属性X和Y互相独立,是指属性X的概率和属性Y的概率分布无关,否则称这两种属性之间存在关联性。即 ()()cjriijricjnnnn ricjijijn nTnn1.建立假设建立假设 H0:两种属性之间相互独立:两种属性之间相互独立 H1:两种属性之间相互不独立:两种属性之间相互不独立=0.052.计算检验统计计算检验统计3.P0.05 差异有统计学意义。差异有统计学意义。2223
8、0 25 10 17829.9840 42 47 35adbcnacabcdbd列联系数列联系数(contingency coefficient)22rn0 r115.3470.1815.347484r 本例四格表确切概率法四格表确切概率法n该方法是由该方法是由R.A.Fisher提出的,其理论依据是提出的,其理论依据是超几何分布超几何分布n四格表资料,若有理论数小于四格表资料,若有理论数小于1或或n40,或作,或作2检验后所得概率检验后所得概率P接近检验水准接近检验水准,需要用确,需要用确切概率法直接计算概率以作判断。实际上,当切概率法直接计算概率以作判断。实际上,当有统计软件条件下,大样本
9、四格表的资料也可有统计软件条件下,大样本四格表的资料也可用确切概率检验用确切概率检验四格表确切概率法四格表确切概率法n确切概率计算方法的基本思想:确切概率计算方法的基本思想:在四格表边在四格表边缘合计固定不变的条件下,利用公式缘合计固定不变的条件下,利用公式 直接计算表内四个格子数据的各种组合的概直接计算表内四个格子数据的各种组合的概率,然后计算单侧或双侧累计概率,并与检率,然后计算单侧或双侧累计概率,并与检验水准比较,作出是否拒绝验水准比较,作出是否拒绝H0的结论的结论 !abcbacbdpa b c d行列表行列表2 2检验检验n公式:公式:自由度自由度=(R-1)x(C-1)R行数,行数
10、,C列数,列数,nR是是ARC所在行的合计,所在行的合计,nC是是ARC所在列的合计所在列的合计22()RCRCRCATT221RCAnn n例题10-6n某医院用某医院用3种穴位针刺治疗急性腰扭伤民,种穴位针刺治疗急性腰扭伤民,数据如下,试比较数据如下,试比较3 组总体治愈率有无差别。组总体治愈率有无差别。穴位治愈数未愈数合计治愈率后溪穴80189881.6人中穴20204050.0腰痛穴24386238.7合计1247620062.01.建立假设建立假设 H0:3组总体治愈率相等组总体治愈率相等 H1:3组总体治愈率不全相等组总体治愈率不全相等=0.052.计算检验统计计算检验统计3.P0
11、.005 差异有统计学意义。差异有统计学意义。222222221801820202438200198 12498 7640 12440 7662 12462 7632.75RCAnn n例题10-7n某研究者欲比较维吾尔族与回族的血型分布某研究者欲比较维吾尔族与回族的血型分布情况,数据如下,试比较两个民族血型构成情况,数据如下,试比较两个民族血型构成有无差别。有无差别。民民族族血型血型合合计计ABOAB维吾尔族维吾尔族4424834161721513回族回族3693844871151355合计合计81186790328728681.建立假设建立假设 H0:两个民族的血型构成比相等:两个民族的血
12、型构成比相等 H1:两个民族的血型构成比不相等:两个民族的血型构成比不相等 =0.052.计算检验统计计算检验统计3.P0.005 差异有统计学意义。差异有统计学意义。2222222224424834161722868(1513 8111513 8671513 9031513 2873693844871151)1355 8111355 8671355 9031355 28726.15例题10-8 某研究组为了解不同民族血型分布情况,得资料归纳某研究组为了解不同民族血型分布情况,得资料归纳如表如表10-7,据此是否可认为民族与血型分布有关?,据此是否可认为民族与血型分布有关?1.建立假设建立假设
13、 H0:民族与血型无关:民族与血型无关 H1:民族与血型有关:民族与血型有关2.=0.053.计算检验统计计算检验统计4.由于由于 则则P0.05,拒绝拒绝H0,认为认为民族与血型分布有关。民族与血型分布有关。2222260702220484(1)275 122275 12584 8684 15115.35220.05(6)行列表行列表2 2检验注意事项检验注意事项1.若若1/5以上格子的理论频数小于以上格子的理论频数小于5,或至少有,或至少有1格子格子的理论频数小于的理论频数小于1,要处理。,要处理。进一步增大样本含量进一步增大样本含量 将相临的两行或两列合并(注意合理性)将相临的两行或两列
14、合并(注意合理性)2.总的结论有统计学意义,即有差异,并不说明任意总的结论有统计学意义,即有差异,并不说明任意两组间都有差异,做行列表的分割才能检验任意两组间都有差异,做行列表的分割才能检验任意两组间是否有差异两组间是否有差异3.有些资料不适合做有些资料不适合做x2检验,如单向有序的检验,如单向有序的行列表行列表(等级资料)等级资料)为了研究果糖二磷酸钠治疗新生儿缺氧缺血性脑病的疗为了研究果糖二磷酸钠治疗新生儿缺氧缺血性脑病的疗效,随机分为观察组和对照组,观察组用果糖二磷酸钠,效,随机分为观察组和对照组,观察组用果糖二磷酸钠,对照组用胞二磷胆碱。治疗结果分为无效、有效和显效。对照组用胞二磷胆碱
15、。治疗结果分为无效、有效和显效。原作者进行了一般原作者进行了一般2检验,检验,2=4.74,P0.05,认为,认为两组疗效之间的差异有统计学意义。两组疗效之间的差异有统计学意义。组别显效有效无效观察组584418对照组564335合计1148753观察组和对照组疗效比较配对四格表配对四格表2 2检验检验n一般形式n注意:a、b、c、d代表的是对子数配对四格表差异性检验统计量公式配对四格表差异性检验统计量公式22,1bcvbc221,1bcvbc当b+c40时当b+c40时例10-4n用两种不同的方法对53名肺癌患者进行诊断,结果如下,问两种方法的检测结果有无差别?1.建立假设建立假设 H0:两
16、方法的检测结果无差别:两方法的检测结果无差别 H1:两方法的检测结果有差别:两方法的检测结果有差别=0.052.计算检验统计计算检验统计3.P0.05 差异有统计学意义。差异有统计学意义。22212 1114.922 11bcbc配对四格表资料的关联性检验配对四格表资料的关联性检验n公式与普通公式与普通四格表检验公式相同四格表检验公式相同1.建立假设建立假设 H0:两法的结果无相关:两法的结果无相关 H1:两法的结果相关:两法的结果相关 =0.052.计算检验统计计算检验统计2.3.P0.05,拒绝拒绝H0,两种方法的结果存在关,两种方法的结果存在关联性。联性。22225 152 115315
17、.3727 26 36 17adbcnacabcdbd 小结n熟悉2 2检验的基本思想。n掌握2 2检验在四表格资料、行列表资料中的应用。n了解行列表的分割法及四表格的确切概率法。习题n1对于总合计数n为400的4个样本率的资料做检验,其自由度为()A399 B395 C138n2当四格表的周边合计不变时,如果某格的实际频数有变化,则其理论频数()A增大 B减小 C不变 D不确定 E增大或减少n3从甲、乙两文中,查到同类研究的两个率的比较的四格表资料,其 检验,甲文 ,乙文 ,可认为()A两文结果有矛盾 B两文结果基本一致C甲文结果更可信 D甲文结果不可信E甲文说明总体的差别大 220.01(1)220.05(1)2n 4.用两种方法检查已确诊的乳腺癌患者120名。甲法的检出率为60%,乙法的检出率为50%,甲乙两法一致的检出率为35%,试问两者方法何者为优?感谢亲观看此幻灯片,此课件部分内容来源于网络,感谢亲观看此幻灯片,此课件部分内容来源于网络,如有侵权请及时联系我们删除,谢谢配合!如有侵权请及时联系我们删除,谢谢配合!