1、第四章第四章 列联表分析列联表分析4.1 列联表原理列联表原理4.2 Crosstabs 过程过程 2021/3/1214.1 列联表原理列联表原理疗法疗法 疗效疗效合计合计治愈治愈未愈未愈不加牛黄不加牛黄324678加牛黄加牛黄7650126合计合计108962042021/3/122 2021/3/1231p2p012:Hpp0:H1.双向无序表独立性检验双向无序表独立性检验双向无序列联表:双向无序列联表:疗法疗法 疗效疗效合计合计治愈治愈未愈未愈不加牛黄不加牛黄324678加牛黄加牛黄7650126合计合计108962042021/3/1242,2,1()R Cijiji jijOEE
2、CRjijiijOOON,1,221(1)(1)dfRC22()df若0H拒绝H0:X与Y独立(即两组总体率相同)实际频数Oij与理论频数Eij的差异是随机误差,用Pearson卡方统计量 反映实际Oij与理论Eij吻合程度.ijijOOEN2021/3/1252R C 疗效疗效疗法疗法 中中 医医 西西 医医痊愈痊愈显效显效合计合计687372638835好转好转无效无效152511211552021/3/126注:注:2.若若RC列联表中理论频数出现小于列联表中理论频数出现小于1,或理论频数,或理论频数 出现小于出现小于5的格数超过总格数的格数超过总格数1/5时,必须增大样本例数时,必须增
3、大样本例数;或把理论频数太小的行或把理论频数太小的行,列与性质相近的邻行列与性质相近的邻行,列合并列合并;或删去理论频数太小的行或删去理论频数太小的行,列。列。最小理论频数最小理论频数=最小行合计频数最小行合计频数最小列合计频数最小列合计频数/总频数总频数1.双向无序列联表计算卡方统计量常用单侧检验。双向无序列联表计算卡方统计量常用单侧检验。3.多个总体率比较的卡方检验,若结论为拒绝原假设,多个总体率比较的卡方检验,若结论为拒绝原假设,只能认为总体率之间不全等,不能说明任意两个总体率只能认为总体率之间不全等,不能说明任意两个总体率 有无差别,需做多重比较。有无差别,需做多重比较。2021/3/
4、127例:例:判断患鼻咽癌与血型有无关系判断患鼻咽癌与血型有无关系 分类分类A A型血型血B B型血型血O O型血型血ABAB型血型血合计合计患癌者患癌者648613020300健康人健康人12513821026499合计合计189224340467992021/3/128第一行合计数第一行合计数,第四列合计数最小第四列合计数最小,最小理论频数最小理论频数 14300 4617.275799EH H0 0:“:“患癌患癌”与与“血型血型”独立独立,H H1 1:“:“患癌患癌”与与“血型血型”不独立不独立 dfdf(2(21)(41)(41)1)3 3,单侧概率,单侧概率P P0.050.05
5、,不能以不能以0.050.05水准的单侧检验拒绝水准的单侧检验拒绝H H0 0,总体率的差异无统计意义总体率的差异无统计意义,不能认为患不能认为患鼻咽鼻咽癌与血型不独立。癌与血型不独立。222,2,12220.056486(1)799300 189300 2242102611.921(3)7.815499 340499 46R Ciji jijONO O2021/3/1292.四格表独立性检验四格表独立性检验 疗法疗法 疗效疗效合计合计治愈治愈未愈未愈不加牛黄不加牛黄324678加牛黄加牛黄7650126合计合计108962042021/3/1210双向无序四格表(1)N N4040,理论频数
6、,理论频数5 522,22,1()ijiji jijOEE21212211222112)(OOOOOOOON(2)N N4040,理论频数小于,理论频数小于5(5(但但1)1),用校正卡方统计量,用校正卡方统计量(3)N40N4078 96min36.715204ijE统计结论:“疗法”与“疗效”不独立(即两组治愈率不同)专业结论:加人工牛黄组疗效高于不加人工牛黄组的疗效。2021/3/12124.2 Crosstabs 过程过程 例:例:调查调查339名名50岁以上的人的吸烟习惯与患慢性气管岁以上的人的吸烟习惯与患慢性气管炎病的数据而建立如下列联表,试探讨吸烟与患慢性气炎病的数据而建立如下列
7、联表,试探讨吸烟与患慢性气管炎之间的关系。管炎之间的关系。组别组别吸烟吸烟不吸烟不吸烟患病组患病组43431313健康组健康组162162121121目的:检验目的:检验0:H变量变量X与与Y是独立的是独立的输入数据输入数据个案加权个案加权列联表分析列联表分析(weight by cases过程)过程)结果分析结果分析(Crosstabs过程)过程)2021/3/1213 实现步骤:实现步骤:(1).将数据录入将数据录入SPSS并整理加工并整理加工定义变量定义变量 输入数据输入数据保存保存smoke:吸烟情况吸烟情况;result:结果结果;count:频数频数;保存为:保存为:“吸烟与慢性支
8、气管炎的关系吸烟与慢性支气管炎的关系.sav”2021/3/1214(2).个案加权个案加权在SPSS系统中,列联表的输入多采用频数表格的方式,如果要对此类数据进行卡方分析等,必须采用个案加权(weight by cases)进行数据处理后才能使用相关的统计方法。菜单“Data”|“Weight Cases”命令点击“Weight Cases by单选框”,选中“Freqency”:选入“频数count”。单击OK钮2021/3/1215菜单 “Analyze”|“Descriptive Statistics”|“Crosstabs”命令(3)列联表分析)列联表分析将将“结果结果result”
9、点入点入“Row(s)”框,将框,将“吸烟情吸烟情况况smoke”点点入入“Cloumn(s)”框。框。点击点击“Statistics”钮。钮。2021/3/1216【Statistics钮】用于定义所需计算的统计量。点击“Chi-square复选框”,计算 值;选择“Nominal”里的“ContingencyCoefficient”计算Pearson列联相关系数。点击“continue”钮回到上一对话框2点击”Cells”按钮2021/3/1217【Cells按钮】:用于定义列联表单元格中需要计算的指标。勾选“Counts复选框组”中的输出实际观察数“Observed”和理论数“Expec
10、ted”选择“Percentages”里的“column”计算列百分比。点击“Continue”按钮返回上一层对话框。点击”OK”按钮2021/3/1218 结果输出和讨论:结果输出和讨论:Case Processing SummaryCase Processing Summary339100.0%0.0%339100.0%结果*吸烟情况NPercentNPercentNPercentValidMissingTotalCases分析:处理记录缺失值情况报告,可见所有数据均是有效值。分析:处理记录缺失值情况报告,可见所有数据均是有效值。分析:给出了分析:给出了22列联表,其中表中给出了实际观测值
11、和理论值。列联表,其中表中给出了实际观测值和理论值。结果*吸烟情况 Crosstabulation结果*吸烟情况 Crosstabulation13435622.133.956.09.7%21.0%16.5%121162283111.9171.1283.090.3%79.0%83.5%134205339134.0205.0339.0100.0%100.0%100.0%CountExpected Count%within 吸烟情况CountExpected Count%within 吸烟情况CountExpected Count%within 吸烟情况患病健康结果Total否是吸烟情况Total
12、不吸烟者的患癌率不吸烟者的患癌率9.7%吸烟者的患癌率吸烟者的患癌率21.0%2021/3/1219Chi-Square TestsChi-Square Tests7.469b1.0066.6741.0107.9251.005.007.004339Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestN of Valid CasesValuedfAsymp.Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x
13、2 tablea.0 cells(.0%)have expected count less than 5.The minimum expected count is22.14.b.给出了给出了4 4种检验方法的结论。其中种检验方法的结论。其中,1)Pearson Chi-Square 即常用的卡方检验即常用的卡方检验 2)Continuity Correction 连续性校正的卡方值连续性校正的卡方值 3)Likelihood Ratio 似然比卡方检验似然比卡方检验4)Fishers Exact Test:Fishers确切概率法确切概率法(N40(N40,理论频数,理论频数5)5)(N40
14、(N40,理论频数小于,理论频数小于5(5(但但1)1)(N40,所以选用普通的卡方所以选用普通的卡方 检验。检验。27.469,0.0060.05P所以有理由拒绝吸烟与患病是独立的原假设,即认为所以有理由拒绝吸烟与患病是独立的原假设,即认为吸烟与患支气管炎是有关的。吸烟与患支气管炎是有关的。2021/3/1221Symmetric MeasuresSymmetric Measures.147.006339Contingency CoefficientNominal by NominalN of Valid CasesValueApprox.Sig.Not assuming the null
15、hypothesis.a.Using the asymptotic standard error assuming the nullhypothesis.b.计算计算Pearson列联相关系数列联相关系数 r=0.1472021/3/1222例:例:甲乙两种疗法治疗某病甲乙两种疗法治疗某病,问两法疗效有无差别问两法疗效有无差别 组别组别有效有效无效无效合计合计甲法甲法14115乙法乙法7310合计合计21425N N25402540,Fishers Exact Test:Fishers确切概率法确切概率法H H0 0:“:“方法方法”与与“疗效疗效”独立独立,H H1 1:“:“方法方法”与与
16、“疗效疗效”不独立不独立 Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestN of Valid CasesComputed only for a 2x2 tablea.0 cells(.0%)have expected count less than 5.The minimum expected count is22.14.b.2021/3/1223 双向有序表的检验双向有序表的检验 例例:用甲乙两种方法检查鼻咽癌患者用甲乙两种方法检查鼻咽癌患者9393例例,两法都是阳性的两法都是阳性的4545
17、例例,都是阴性的都是阴性的2020例例,甲法阳性但乙法阴甲法阳性但乙法阴性的性的2222例例,甲法阴性但乙法阳性的甲法阴性但乙法阳性的6 6例。例。组别组别乙乙乙乙合计合计甲甲452267甲甲62026合计合计5142931.双向有序且属性相同表(配对四格表)的检验双向有序且属性相同表(配对四格表)的检验 两个分类变量的标志完全一样且有序排列相同,是相关样本数据构成的列联表。两个分类变量的标志完全一样且有序排列相同,是相关样本数据构成的列联表。2021/3/1224O O1212O O21214040用吻合卡方统计量用吻合卡方统计量,df1 1 2212211221()OOOOO O1212O
18、 O21214040用校正卡方统计量用校正卡方统计量,df1 1 2212211221(|1)OOOO吻合性检验或吻合性检验或McNemar检验检验:2021/3/1225H H0 0:“:“方法方法”与与“阳率阳率”独立独立,H H1 1:“:“方法方法”与与“阳率阳率”不独立不独立 04.8622)1|622(|22 dfdf1 1,查统计用表,查统计用表,2 26.63496.63492 20.01(1)0.01(1),单侧概率,单侧概率P P0.010.01,以,以 0.010.01水准的单侧检验拒绝水准的单侧检验拒绝H H0 0,只能认为只能认为“方法方法”与与“阳性率阳性率”不独立
19、不独立 差异有统计意义差异有统计意义,认为甲法的阳性检出率高于乙法认为甲法的阳性检出率高于乙法 O O1212O O212122226 628402840,使用校正卡方检验,使用校正卡方检验 2021/3/1226一致性检验一致性检验(Kappa检验检验):1AeePPkP=/,APA NA观察一致率:观察一致率:两种分类结果一致的观察频数两种分类结果一致的观察频数e=/,PE NE理论一致率:理论一致率:两种分类结果一致的理论频数两种分类结果一致的理论频数2021/3/1227菜单 “Analyze”|“Descriptive Statistics”|“Crosstabs”命令2021/3/
20、12282021/3/1229例:例:用脑神经生成素方案治疗急性脑出血所致脑神经功能障碍,判断三种方案的疗效有无差异。用脑神经生成素方案治疗急性脑出血所致脑神经功能障碍,判断三种方案的疗效有无差异。2.双向有序且属性不同表的检验双向有序且属性不同表的检验 合计合计57108910741610312021/3/1230单向有序单向有序R RC C表,两个分类变量一个无序,另一个有序。表,两个分类变量一个无序,另一个有序。双向有序且属性不同的双向有序且属性不同的R RC C表,两个分类变量均有序但属性不同,不宜用卡方检验,应选用与有序性表,两个分类变量均有序但属性不同,不宜用卡方检验,应选用与有序
21、性有联系的对应分析或线性趋势检验(或后面学习的非参数检验)。有联系的对应分析或线性趋势检验(或后面学习的非参数检验)。分组变量有序(如年龄),指标变量无序(如传染分组变量有序(如年龄),指标变量无序(如传染病类型),病类型),用卡方检验分析不同年龄组用卡方检验分析不同年龄组传染病的构成传染病的构成。分组变量无序(如疗法),指标变量有序(如疗效)分组变量无序(如疗法),指标变量有序(如疗效)用用Ridit分析或非参数秩和检验分析或非参数秩和检验分析不同疗法的疗分析不同疗法的疗效。效。2021/3/1231处处 理理愈愈 合合未愈合未愈合合计合计呋喃硝胺呋喃硝胺54862甲氰咪胍甲氰咪胍442064合合 计计9828126作业:某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲作业:某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别?氰咪胍作对照组,问两种方法治疗效果有无差别?要求:定义变量要求:定义变量medicine(药物:呋喃、甲氰)、(药物:呋喃、甲氰)、result(效果:愈合、未愈合(效果:愈合、未愈合)count(频数)频数)给出列联表检验结果、给出列联表检验结果、Pearson列联相关系数。列联相关系数。2021/3/1232