1、1第七章第七章 检验检验(chi-square test)2 分类数据组间比较的假设检验分类数据组间比较的假设检验计数资料计数资料组间的比较组间的比较2 第七章第七章 检验内容检验内容(计数资料组间的比较计数资料组间的比较)第一节第一节 四格表资料的四格表资料的2检验检验*第二节第二节 配对四格表资料的配对四格表资料的2 2检验检验*第三节第三节 FisherFisher确切概率检验确切概率检验第四节第四节 行行列表资料的列表资料的2检验检验*第五节第五节 多个样本率比较的多个样本率比较的2分割法分割法第六节第六节 有序分组资料的线性趋势检验有序分组资料的线性趋势检验第七节第七节 频数分布的拟
2、合优度检验频数分布的拟合优度检验*为重点掌握为重点掌握23概念回顾概念回顾 在总体率为在总体率为的二项分布总体中做的二项分布总体中做n1和和n2抽抽样样,样本率样本率p1和和p2与与的差别的差别,称为率抽样误称为率抽样误差。差。在总体率为在总体率为1和和2的不同总体中抽样,得的不同总体中抽样,得p1和和p2,在在n5,可通过率的,可通过率的u检验推断是否检验推断是否1=2。二项分布的两个样本率的检验同样可用二项分布的两个样本率的检验同样可用2检检验。验。1212ppppus4第一节、四格表资料的第一节、四格表资料的 检验检验 一、一、2检验的基本思想检验的基本思想 25 1.2 分布分布222
3、212vuuu 1875 1875年年 F.HelmetF.Helmet提出提出2 统计量统计量,设设X Xi i为为来自正态总体的连续性变量。来自正态总体的连续性变量。222()iiixu2分布是一个连续型变量的分布分布是一个连续型变量的分布,分布的参数分布的参数为自由度为自由度()。2/)12/(2222)2/(21)(ef62/)12/(2222)2/(21)(ef3.847.8112.59P P0.050.05的临界值的临界值2分布的概率密度函数曲线分布的概率密度函数曲线7不同不同2分布的界值分布的界值(附表附表 8 )823页页在在=1,2220.05,10.05/21.96u8K.
4、Pearson的的2统计量统计量 1900年年K.Pearson提出下述公式,在提出下述公式,在n40时时下式值与下式值与2分布近似,在理论数分布近似,在理论数5,近似程,近似程度较好。度较好。上述公式实际应用于上述公式实际应用于检验检验计数资料组间率、构计数资料组间率、构成比一致程度的公式成比一致程度的公式。22()A TT (实际数-理论数)理论数9Pearson 检验的用途检验的用途 1.用于检验计数资料的两组(多组)样本率用于检验计数资料的两组(多组)样本率差别有无统计意义。差别有无统计意义。如二项分布数据如二项分布数据 (binomial proportions)2.检验两个事物的分
5、类是否独立检验两个事物的分类是否独立 列连表数据列连表数据(Contingency Table)2102.2检验的基本思想检验的基本思想例例7-1:某院比较异梨醇(试验组)和氢氯塞嗪(对照某院比较异梨醇(试验组)和氢氯塞嗪(对照组)降低颅内压的疗效,将组)降低颅内压的疗效,将200名患者随机分为名患者随机分为两组,两组,试验组试验组104例中例中有效有效的的99例例,对照组对照组96例中例中有效有效的的78例例,问两种药物对降低颅内压疗效有无问两种药物对降低颅内压疗效有无差别?差别?数据整理为四格表形式数据整理为四格表形式(二维交叉表二维交叉表)11表表 100例高血压患者治疗后临床记录例高血
6、压患者治疗后临床记录编号编号 年龄年龄 性别性别 治疗组治疗组 舒张压舒张压 体温体温 疗效疗效 X1 X1 X2X2 X3 X3 X4 X5X4 X5 X6X6 1 37 男男 A 11.27 37.5 有效有效 2 45 女女 B 12.53 37.0 有效有效 3 43 男男 A 10.93 36.5 有效有效 4 59 女女 B 14.67 37.8 无效无效 100 54 男男 B 16.80 37.6 无效无效12计数资料数据检验的列连表计数资料数据检验的列连表两组或多组比较数据的交叉表两组或多组比较数据的交叉表 行(行(Row)列(列(Column)表)表行分类行分类 列分类列分
7、类(Y)合计数合计数(X)阳性数阳性数 阴性数阴性数 甲组甲组 A11 A12 n1 乙组乙组 A21 A22 n2 合计合计 A11+A21 A12+A22 nA:表示某组某分类的例数(频数):表示某组某分类的例数(频数)13表表7-1两组降低颅内压有效率比较两组降低颅内压有效率比较疗法疗法 有效人数有效人数 无效数无效数 合计合计 有效率有效率%试验组试验组 99(A11)5(A12)104 95.20 对照组对照组 75(A21)21(A22)96 78.13合计合计 174 26 200 87.00问:两组有效率差别是否是抽样误差或是不同药问:两组有效率差别是否是抽样误差或是不同药物的
8、作用物的作用?99 575 21四格表四格表的数字的数字组别组别 +甲甲乙乙14Pearson 检验的基本公式检验的基本公式2式中符号含义:式中符号含义:A:实际频数,表中实际:实际频数,表中实际发生的阳性或阴性频数发生的阳性或阴性频数T:理论频数,按某:理论频数,按某H0假假设计算理论上的阳性或阴设计算理论上的阳性或阴性频数性频数NnnTCRRCTTA22)((公式(公式7-1)(公式公式7-3)15表表7-1两组疗法降低颅内压有效率两组疗法降低颅内压有效率(%)疗法疗法 有效人数有效人数 无效人数无效人数 合计合计 有效率有效率试验组试验组 99(90.48)5(13.52)104 95.
9、2对照组对照组 75(83.52)21(12.48)96 78.1合计合计 174 26 200 87.0注注:括号内为理论数(:括号内为理论数(T)假设:假设:H0:1=2=c=87.00(两组总体(两组总体有效有效率相等)率相等)H1:1 2 (两组总体(两组总体有效有效率不等率不等)假定两组有效率均为假定两组有效率均为174/200=87%1622222(99 90.48)(5 13.52)(75 83.52)(21 12.48)12.8690.4813.5283.5212.4822()A TT RCRCn nTNClass n Hypothesized Observed Expecte
10、d=T试验组试验组 104 有效概率有效概率=0.87 99 90.48试验组试验组 无效概率无效概率1=0.13 5 13.52对照组对照组 96 有效概率有效概率=0.87 75 83.52对照组对照组 无效概率无效概率1=0.13 21 12.4811104 17490.48200T T=n 17假定两组总体率相等的理论数与实际数假定两组总体率相等的理论数与实际数组别组别 死亡人数死亡人数 生存数生存数 合计合计 死亡率死亡率%抗凝血组抗凝血组 20(20)80(80)100 20.0 对照组对照组 20(20)80(80)100 20.0合计合计 40 160 200 20.0 02T
11、TA22)(2检验是考察实际频数与假设理论频数是否一检验是考察实际频数与假设理论频数是否一 致致 的统计量。的统计量。18Pearson 检验计算与步骤检验计算与步骤1.建立假设:建立假设:H0:1=2=c(两组总体率相等)(两组总体率相等)H1:1 2 (两组总体率不等)(两组总体率不等)2.=0.053.计算计算 统计量统计量4.确定概率(确定概率(P)和自由度()和自由度()自由度自由度()=(行数(行数1)(列数(列数1)本例本例=(2-1)(2-1)=122TTA22)(19 与与 比较比较,得到得到p值值5.结论:在结论:在=0.05水准上,水准上,p0.01,拒绝,拒绝H0,两样
12、本率差别有统计意义,具本例可认为试验两样本率差别有统计意义,具本例可认为试验组对降低颅内压有效率高于对照组组对降低颅内压有效率高于对照组。2,05.02220.05,1220.01,112.863.84,0.0512.866.63,0.01PP本例本例20二、四格表资料二、四格表资料 检验检验(两组样本率间差别两组样本率间差别 检验检验)两组样本率比较的设计分类:两组样本率比较的设计分类:1.两组两组(独立独立)样本率的比较样本率的比较 组间数据是相互独立组间数据是相互独立,非配对设计。非配对设计。2.配对设计两组样本率的比较配对设计两组样本率的比较 组间数据是相关的。组间数据是相关的。222
13、1两组(不配对)样本率的比较两组(不配对)样本率的比较1)四格表形式)四格表形式组别组别 阳性数阳性数 阴性数阴性数 合计合计 率率%甲组甲组 a b a+b=n1 a/n1乙组乙组 c d c+d=n2 c/n2合计合计 a+c b+d N2)四格表不配对资料检验的专用公式)四格表不配对资料检验的专用公式)()()()(22dbdccabaNbcad(公式公式 7-4)TTA22)(二者结果等价二者结果等价各组样本例数是固定的各组样本例数是固定的22表表7-1两组降低颅内压有效率比较两组降低颅内压有效率比较疗法疗法 有效人数有效人数 无效数无效数 合计合计 试验组试验组 99(a)5(b)1
14、04(a+b)对照组对照组 75(c)21(d)96(c+d)合计合计 174(a+c)26(b+d)200 (N)86.122617496104200)7552199(2223三、三、四格表四格表2 检验的校正公式检验的校正公式(两组不配对资料两组不配对资料)(1)校正公式的条件:校正公式的条件:1T5,同时同时N40,用校正公式计算用校正公式计算(2)连续校正连续校正(continuity correction)公式:公式:)()()()2/(22dbdccabaNNbcad公式公式7-5公式公式7-622(0.5)ATT(3)当当T1,或或N40,用,用Fisher确切概率法确切概率法2
15、4表表7-2 两药物治疗脑血管病有效率比较两药物治疗脑血管病有效率比较组别组别 有效数有效数 无效数无效数 合计合计 有效率有效率%甲药甲药 46 6 52 88.46乙药乙药 18 8(4.67)26 69.23合计合计 64 14 78 82.05校正公式校正公式不校正不校正2=4.35 p0.0584.314.3)14()64()26()52(78)2/78618846(22P0.05.25表表7-2 数据用数据用SPSS统计软件计算结果统计软件计算结果Chi-Square Tests4.353b1.0373.1451.0764.1261.042.058.0414.2971.03878P
16、earson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestLinear-by-LinearAssociationN of Valid CasesValuedfAsymp.Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea.1 cells(25.0%)have expected count less than 5.The minimum expected countis 4.67.b.26第二节、配
17、对设计两个样本率的第二节、配对设计两个样本率的2检验检验 (McNemer检验检验)用途用途常用于比较常用于比较两种检验方法两种检验方法或或两种培养基两种培养基的的阳性率是否有差别。阳性率是否有差别。特点:特点:对同一观察对象分别用两种方法处理,对同一观察对象分别用两种方法处理,观察其阳性与阴性结果。观察其阳性与阴性结果。资料整理为配对四格表形式资料整理为配对四格表形式.27例例7-3:某实验室采用两种方法对:某实验室采用两种方法对58名可疑红斑名可疑红斑狼疮患者的血清抗体进行测定,问:两方法狼疮患者的血清抗体进行测定,问:两方法测定结果阳性检出率是否有差别?测定结果阳性检出率是否有差别?测定
18、结果为:阳性、阴性(共测定结果为:阳性、阴性(共116标本,标本,58对)对)方法方法(X)乳胶凝集法乳胶凝集法 免疫荧光法免疫荧光法 对子例数对子例数 11 33 2 1258对对结果结果28配对设计资料的四格表及公式配对设计资料的四格表及公式例例 表表7-3 两种方法的检测结果两种方法的检测结果 免疫免疫 乳胶凝集法乳胶凝集法荧光法荧光法 合计合计 11(a)12(b)23 (a+b)2(c)33(d)35(c+d)合计合计 13(a+c)45(b+d)58(N)1,)1(22cbcb公式公式7-8b+c40用用29例:配对计数资料的比较例:配对计数资料的比较1.建立检验的假设建立检验的假
19、设H0:b=c=(12+2)/2=7(两法总体两法总体阳性阳性率相等)率相等)H1:b c (两方法总体(两方法总体阳性阳性率不等)率不等)2.=0.053.计算计算 2 统计量统计量(McNemer检验检验)1,79.5212)1212()1(222cbcb304.确定自由度(确定自由度()和)和 2值值 的概率的概率P =(行数(行数1)(列数)(列数1)本例:本例:=1本例本例2=5.793.84,P0.055.结论:在结论:在=0.05水准,拒绝水准,拒绝H0,P0.05认为两方法的检测率不同,乳胶凝集法的阳性检认为两方法的检测率不同,乳胶凝集法的阳性检测率测率22.41%低于免疫检测
20、率低于免疫检测率39.66%。84.321,05.031第三节第三节.四格表的四格表的Fisher确切概率法确切概率法(条件条件:T1,或或n40用用)例:表例:表7-4 两组新生儿两组新生儿HBV感染率的比较感染率的比较组别组别 阳性阳性 阴性阴性 合计合计 感染率感染率%预防组预防组 4 18 22 18.18非预防组非预防组 5(3)6 11 45.45合计合计 9 24 33 27.27 了解方法,计算不要求。了解方法,计算不要求。32公式公式7-9是四格表边际合计数固定时是四格表边际合计数固定时,出现表出现表中频数为中频数为a,b,c,d的概率的概率本例为双侧检验本例为双侧检验:计算
21、计算p=p1+p2+p3+p4+p5+p10=0.1210=0.05结论结论:p 0.05,还不能认为预防注射和非预防注射组还不能认为预防注射和非预防注射组的的HBV感染率不同感染率不同.!)!()!()!()!(ndcbadbcadcbapi5(22)!(11)!(9)!(24)!0.087627284!18!5!6!33!p 公式公式7-933022921218322074319655174761638715298141104185691329(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)单侧检验 H1:12,计算累计p值=p(1)+p(2)+p(3)+p(4)+p(5)双
22、侧检验H1:12,计算累计p值=p(1)+p(2)+p(3)+p(4)+p(5)+p(10)Fisher确切概率法计算累计概率确切概率法计算累计概率(p)adbc=D*=66adbc=-99adbc=-132adbc=66adbc=99341)2)35组组 别别 *疗疗 效效 C Cr ro os ss st ta ab bu ul la at ti io on nCount56114182292433非预防组预防组组别Total阳性阴性疗效TotalC Ch hi i-S Sq qu ua ar re e T Te es st ts s2.7501.0971.5471.2142.6531.1
23、03.121.10833Pearson Chi-SquareContinuity CorrectionLikelihood RatioFishers Exact TestN of Valid CasesValuedfAsymp.Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)SPSS统计软件统计软件计算结果计算结果36第四节第四节 行行列表的列表的2检验检验 当比较组行或列分类数当比较组行或列分类数2,称为行,称为行列表。列表。研究者感兴趣的问题有研究者感兴趣的问题有:(也为也为2检验的目的)检验的目的)1.多组多组(独立样本独立样本)样本
24、率样本率差别有无统计意义差别有无统计意义?2.两组两组(独立样本独立样本)的的构成比构成比(分布分布)有无统计意义有无统计意义?3.两个分类变量分布是否独立两个分类变量分布是否独立(有关联有关联)?37行行列表的列表的2检验公式检验公式)1(22CRnnAN自由度自由度=(行数(行数-1)(列数(列数-1)公式公式7-10等价等价TTA22)(38表表7-8 三组疗法有效率的比较三组疗法有效率的比较疗法疗法 有效有效 无效无效 合计合计 有效率有效率%物理组物理组 199(186.2)7 206 96.6药物组药物组 164 18 182 90.1外用组外用组 118 26 144 81.9
25、合计合计 481 51 532 90.4一、多组样本率的比较一、多组样本率的比较H0:1=2=3=90.4(三组总体三组总体有效有效率相等)率相等)H1:三:三组总体率不等或不全等组总体率不等或不全等39表表7-8 三组疗法有效率的计算三组疗法有效率的计算2222199726532(.1)21.04206 481206 51144 51)1(22CRnnANA为表中的为表中的实际频数实际频数自由度自由度=(行数(行数-1)(列数)(列数-1)=(3-1)(2-1)=222220.05,20.01,221.045.99,21.049.2140表表7-8资料资料SPSS软件计算结果软件计算结果Ch
26、i-Square Tests21.038a2.00021.5592.00020.9031.000532Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid CasesValuedfAsymp.Sig.(2-sided)0 cells(.0%)have expected count less than 5.Theminimum expected count is 13.80.a.结论结论:在在=0.05水准,拒绝水准,拒绝H0,P0.01,认为三认为三组疗法有效率不等或不全等组疗法有效率不等或不全等.注意注
27、意:此结果不能得到各两两组比较的结论此结果不能得到各两两组比较的结论.41二、两组和多组构成比的比较二、两组和多组构成比的比较表表7-9 两组两组型糖尿病患者型糖尿病患者ACE基因分布比较基因分布比较 ACE基因类型基因类型糖尿病糖尿病 DD ID I I 合计合计有肾病有肾病 42(37.8)48(43.3)21(18.9)111无肾病无肾病 30(21.7)75(52.2)36(26.1)138合计合计 72(28.9)120(48.2)57(22.9)249括号内为行的构成比括号内为行的构成比问问:两组糖尿病人在两组糖尿病人在ACE基因类型分布上有无差别基因类型分布上有无差别?H0:两组
28、两组总体总体各基因构成各基因构成相等相等,均等于合计构成比均等于合计构成比H1:两两组总体组总体构成分布不构成分布不相等相等42表表7-9资料资料SPSS软件计算结果软件计算结果Chi-Square Tests7.913a2.0197.9032.0196.4471.011249Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid CasesValuedfAsymp.Sig.(2-sided)0 cells(.0%)have expected count less than 5.Theminimum exp
29、ected count is 25.41.a.结论结论:在在=0.05水准,拒绝水准,拒绝H0,P=0.019,认为两组糖尿认为两组糖尿病病人在病病人在ACE基因类型分布上有差别基因类型分布上有差别,有肾病糖尿病者有肾病糖尿病者DD基因比例多于无肾病基因比例多于无肾病.43三、两个分类变量的独立性检验三、两个分类变量的独立性检验 目的:检验两事物分类目的:检验两事物分类(行分类和列分类行分类和列分类)是是否独立否独立,从而说明两事物分类是否有关系。从而说明两事物分类是否有关系。检验公式:检验公式:)1(22CRnnAN两个事物之两个事物之间有无关系间有无关系22Cn关系的密关系的密切程度切程度
30、.Contingency coefficient列连系数列连系数44两事物定性资料的独立性两事物定性资料的独立性(相关相关)检验检验数据类型数据类型:1.双向无序分类数据双向无序分类数据(表表7-10)2.双向有序双向有序 分类数据分类数据(表表7-13)统计分析统计分析:1.回答两事物的分类是否独立回答两事物的分类是否独立(有关系有关系)用用 Pearson 2检验检验2.如有关如有关,关系密切程度如何关系密切程度如何,度量指标度量指标:1)列连系数列连系数(Contingency coefficient,无序分类用无序分类用)2)相关系数相关系数(spearman correlation,
31、双向有序分双向有序分类用类用)见讲义见讲义148页页,在在0-1,近于近于1,关系愈密切关系愈密切.45双向有序分类的双向有序分类的RC表表表表7-13年龄与冠状动脉硬化的关系年龄与冠状动脉硬化的关系年龄组*动脉硬化 Crosstabulation7022429871.4%22.4%4.1%2.0%100.0%2724936342.9%38.1%14.3%4.8%100.0%16231375927.1%39.0%22.0%11.9%100.0%92015145815.5%34.5%25.9%24.1%100.0%12289412627843.9%32.0%14.7%9.4%100.0%Coun
32、t%within 年龄组Count%within 年龄组Count%within 年龄组Count%within 年龄组Count%within 年龄组20-30-40-50年龄组Total-+动脉硬化Total问问:年龄与冠状动脉硬化有无相关关系年龄与冠状动脉硬化有无相关关系46两分类变量独立与有关两分类变量独立与有关高血压病高血压病 年龄年龄(A)年龄年龄(A)(B)60岁岁 60岁岁 60岁岁 60岁岁 有有 50(50)50(50)0(50)100(50)无无 50(50)50(50)100(50)0(50)合计合计 100 100 100 100()内为理论数内为理论数两事物独立假定
33、成立两事物独立假定成立:即行或列各分类的构成比相同即行或列各分类的构成比相同,或在或在 A事物不同事物不同水平下水平下,B事物不同分类的作用事物不同分类的作用(构成构成)相等相等.47双向无序分类关联性研究双向无序分类关联性研究 表表7-10 某地某地5810人按二种方式对血型的分类人按二种方式对血型的分类 ABO MN血型血型 血型血型 M N MN 合计合计 O 431(23.6)490(26.8)902(49.5)1823 A 388(24.3)410(25.7)800(50.0)1598 B 495(24.4)587(28.9)950(46.8)2032 AB 137(39.4)179
34、(51.4)32(9.2)348合计合计 1451(25.0)1666(28.7)2684(46.3)5801(括号内为行构成比括号内为行构成比)问二种血型分类系统有无关系问二种血型分类系统有无关系48检验步骤检验步骤1.建立检验的假设建立检验的假设H0:两种血型系统分类无关联:两种血型系统分类无关联(即(即行或列行或列构成比构成比相等)相等)H1:两种血型系统分类有关联:两种血型系统分类有关联(即(即行或列行或列构成比不构成比不等)等)2.=0.053.计算计算 2 统计量统计量2222431490325801(.)213.161823 14511823 1666348 268422213.
35、160.18835801213.6Cn结论结论:两种血型系统分类有关联两种血型系统分类有关联,列连系数为列连系数为0.1883。AB型的人出现型的人出现MN血型比例少于其他血型血型比例少于其他血型.系数波动系数波动0-149Chi-Square Tests213.162a6.000248.1436.00051.3361.0005801Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid CasesValuedfAsymp.Sig.(2-sided)0 cells(.0%)have expected cou
36、nt less than 5.Theminimum expected count is 87.04.a.Symmetric Measures.188.0005801Contingency CoefficientNominal by NominalN of Valid CasesValueApprox.Sig.Not assuming the null hypothesis.a.Using the asymptotic standard error assuming the null hypothesis.b.50双向有序分类的双向有序分类的RC表表表表7-13年龄与冠状动脉硬化的关系年龄与冠状
37、动脉硬化的关系年龄组*动脉硬化 Crosstabulation7022429871.4%22.4%4.1%2.0%100.0%2724936342.9%38.1%14.3%4.8%100.0%16231375927.1%39.0%22.0%11.9%100.0%92015145815.5%34.5%25.9%24.1%100.0%12289412627843.9%32.0%14.7%9.4%100.0%Count%within 年龄组Count%within 年龄组Count%within 年龄组Count%within 年龄组Count%within 年龄组20-30-40-50年龄组Tot
38、al-+动脉硬化Total问问:年龄与冠状动脉硬化有无相关关系年龄与冠状动脉硬化有无相关关系(线性趋势线性趋势)51adbc=-9952SPSS软件检验结果软件检验结果Chi-Square Tests71.432a9.00073.7399.00063.3891.000278Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid CasesValuedfAsymp.Sig.(2-sided)0 cells(.0%)have expected count less than 5.Theminimum expec
39、ted count is 5.42.a.Symmetric Measures.478.0489.050.000c.488.0489.300.000c278Pearsons RInterval by IntervalSpearman CorrelationOrdinal by OrdinalN of Valid CasesValueAsymp.Std.ErroraApprox.TbApprox.Sig.Not assuming the null hypothesis.a.Using the asymptotic standard error assuming the null hypothesi
40、s.b.Based on normal approximation.c.53四、四、RC表数据的注意事项表数据的注意事项1.多个样本率比较的多个样本率比较的2检验检验,当拒绝当拒绝H0时,不时,不能得出任何两组间都有差别。目前尚无公认能得出任何两组间都有差别。目前尚无公认的两两比较的方法的两两比较的方法,可考虑采用减小检验水准可考虑采用减小检验水准(),见讲义第五节见讲义第五节.2.RC表表有有1/5以上格子的理论数小于以上格子的理论数小于5时,不时,不宜直接计算宜直接计算2检验,可采用合并组的方法检验,可采用合并组的方法(或或增加例数增加例数),增大理论数。,增大理论数。54多组样本率的两两
41、比较的多组样本率的两两比较的2 分割分割当比较组当比较组k3时,时,2值有统计意义,可分解多值有统计意义,可分解多个四格表了解各样本率两两间的差别。个四格表了解各样本率两两间的差别。方法(见方法(见149-151页):页):1.检验水准(检验水准()的分割)的分割2.两两比较四格表的两两比较四格表的2值值 与与0125.012)13(305.0,12)1(本例kk(讲义第(讲义第 五节五节)2 0.0125K为比较的组数为比较的组数55表7-11 =1 时的2 界值表2 p 2 p 6.24 0.01250 7.48 0.006256.96 0.00833 7.88 0.00507.24 0.
42、00714 8.05 0.00455 =0.0125 ,表表7-12计算计算:当计算:当计算:H0 2=6.76 p0.0125 拒绝拒绝 2=21.32 p0.00313 拒绝拒绝 2=4.59 p0.0125 不拒绝不拒绝56小小 结结)1(22CRnnAN)()()()(22dbdccabaNbcadcbcb22)1(基本公式基本公式不配对四不配对四格表和校格表和校正公式正公式配对四格配对四格表公式表公式RC表资表资料的公式料的公式)()()()2/(22dbdccabaNNbcadTTA22)(一一.公式公式57二二.2常解决的问题常解决的问题p 目的目的:比较组间率和比较组间率和构成
43、比的差别构成比的差别 设计设计:抽自抽自2个或多个个或多个独立样本独立样本p目的目的:两个变量间两个变量间有无关系或关联有无关系或关联设计设计:2个变量来自同一个变量来自同一对象或同一总体对象或同一总体.相相关的设计关的设计.A组组a bn1B组组c dn2n BAabcdn58三三.应用时注意的问题应用时注意的问题1.四格表资料四格表资料2检验的适用条件检验的适用条件 (1)n40且且T5 用用Pearson2检验检验 (2)n40且且1T5连续性校正连续性校正2检验(检验(3)n40或或T1 用用Fisher确切概率法确切概率法2.单向有序数据单向有序数据2C表,结果(表,结果(y)数据为
44、)数据为等级时,采用等级时,采用秩和检验秩和检验效率高于效率高于2检验检验59单向有序数据,结果(单向有序数据,结果(y)数据为等级时,采)数据为等级时,采用秩和检验效率高于用秩和检验效率高于2检验检验表 某病两组疗效的比较某病两组疗效的比较比较组 无效无效 有效有效 显效显效 痊愈痊愈 合计合计 试验组试验组 18(31.6)18(31.6)15(26.3)6(10.5)57 对照组对照组 21(46.7)15(33.3)8(17.8)1(2.2)45 Total 39 33 23 7 102(括号内为构成比括号内为构成比)计算计算2=4.81,p=0.186,p0.05计算两组秩和检验,计算两组秩和检验,u=2.64,p0.01 60 本次内容结束本次内容结束 谢谢 谢谢
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。