1、第八章第八章 分类变量资料的比较分类变量资料的比较 -卡方检验卡方检验学习目标学习目标n1.能够阐述卡方检验的原理和应用范围。能够阐述卡方检验的原理和应用范围。n2.掌握四格表资料两独立样本率比较的方法。掌握四格表资料两独立样本率比较的方法。n3.掌握配对设计资料样本率比较及关联性检验的掌握配对设计资料样本率比较及关联性检验的方法。方法。n4.掌握不同应用条件下掌握不同应用条件下RC 表的卡方检验方法表的卡方检验方法。学习内容学习内容n第一节两独立样本率的卡方检验第一节两独立样本率的卡方检验n第二节两相关样本率的卡方检验第二节两相关样本率的卡方检验n第三节第三节Fisher确切概率检验确切概率
2、检验n第四节第四节RC表的卡方检验表的卡方检验n第五节案例讨论(自学)第五节案例讨论(自学)第一节两独立样本率的卡方检验第一节两独立样本率的卡方检验2 检验的基本思想检验的基本思想n2 检验的基本思想是检验的基本思想是:在在H0 成立的条件下成立的条件下,两两独立样本的总体率独立样本的总体率1、2 可以看作来自总体可以看作来自总体参数为参数为 的同一总体。在此条件下的同一总体。在此条件下,经从同一经从同一总体随机抽样所得的两个样本率在一般情况总体随机抽样所得的两个样本率在一般情况下应相差不大下应相差不大,两独立样本所对应的四格表实两独立样本所对应的四格表实际数和理论数际数和理论数(A-T)在一
3、般的情况下相差也不在一般的情况下相差也不大。大。2值反映了理论频数和实际频数的吻合值反映了理论频数和实际频数的吻合程度。程度。2 检验的基本思想检验的基本思想n为了更好地反映在不同抽样情况下为了更好地反映在不同抽样情况下A-T 差值的分布规律差值的分布规律,KarlPearson引入引入2 统计量统计量,以此来反映以此来反映A-T 差值的分布规差值的分布规律律,见式见式(8.2)。2 分布概率密度函数所分布概率密度函数所对应的图形具有以下特征对应的图形具有以下特征:与与u、t、F 分布一样分布一样,2 分布是一个连续型的分分布是一个连续型的分布布,只有一个参数只有一个参数v 决定它的形状决定它
4、的形状;2 检验的基本思想检验的基本思想nv 越大越大,曲线趋于对称曲线趋于对称,v,2 分布趋向正分布趋向正态分布态分布;n卡方图形的面积分布有规律性卡方图形的面积分布有规律性,记为记为n,表示自由度为表示自由度为v,2 分布曲线下右侧尾部面积分布曲线下右侧尾部面积为为 时时2的界值的界值;2,2分布的面积分布的面积S2分布的曲线在第一象限内,其形状与分布的曲线在第一象限内,其形状与的大小有关。的大小有关。S当当确定后,如果分布曲线下右侧尾部的面积为确定后,如果分布曲线下右侧尾部的面积为时,则横时,则横轴上相应的轴上相应的2值就记作值就记作 ,即,即2界值。界值。S其右侧部分的面积其右侧部分
5、的面积表示表示时,值大于界值的概率大小。时,值大于界值的概率大小。2值与值与P值的对应关系见附表值的对应关系见附表6,2值愈大,值愈大,P值愈小;反之值愈小;反之,2值愈小,值愈小,P值愈大。值愈大。2检验时,先计算检验统计量检验时,先计算检验统计量2值值,然后按,然后按查界值表查界值表(附表附表7),确定,确定P值。值。2,2分布的面积分布的面积n从图从图8.1可知可知,当当v 固定时固定时,尾部面积尾部面积n越小越小,2 值越大值越大,反之亦然。反之亦然。=3.84是是n指在指在H0 成立的条件下成立的条件下,当当v=1时时,得到的得到的n2 值等于值等于3.84及大于及大于3.84的概率
6、为的概率为0.05,n相对而言相对而言,在此条件下理论上在此条件下理论上95%的抽样样的抽样样n本其本其2 值都会落在值都会落在03.84这个区域这个区域2,2分布的面积分布的面积n据小概率的定义据小概率的定义,说明在说明在H0 成立的条件下成立的条件下,2 值落在大于值落在大于3.84及更极端的区域是不大可能及更极端的区域是不大可能发生的事件。如果实际样本所计算的发生的事件。如果实际样本所计算的2 值大值大于于3.84,按按=0.05水平拒绝水平拒绝H0 假设假设,接受接受H1。反之反之,如果如果2 值小于值小于3.84,不拒绝不拒绝H0 假设。假设。n从本例来看从本例来看,2=8.812,
7、该卡方值比较大该卡方值比较大,也从也从侧面反映了实际频数与理论频数的不吻合。侧面反映了实际频数与理论频数的不吻合。其真正原因很有可能是两样本率来自两个不其真正原因很有可能是两样本率来自两个不同的总体同的总体,即即H0 假设实际上是不成立的假设实际上是不成立的。2分布的图形分布的图形2分布的特点分布的特点分布的形状依赖于分布的形状依赖于的大小:当的大小:当22时,时,曲线呈曲线呈L L型;随着型;随着的增加,曲线逐渐趋于的增加,曲线逐渐趋于对称;当对称;当时,分布趋近于正态分布。时,分布趋近于正态分布。分布具有可加性:如果两个独立的随机变分布具有可加性:如果两个独立的随机变量量X X1 1和和X
8、 X2 2分别服从分别服从1 1和和2 2的分布,那么它的分布,那么它们的和们的和(X(X1 1X X2 2)也服从也服从(1 12 2)的分布。的分布。2检验的基本步骤检验的基本步骤2检验的基本步骤检验的基本步骤2检验的基本步骤检验的基本步骤2检验的基本步骤检验的基本步骤四格表资料的专用公式四格表资料的专用公式四格表资料校正四格表资料校正2四格表资料校正四格表资料校正2四格表资料校正四格表资料校正2SPSS软件实现软件实现SPSS软件实现软件实现SPSS软件实现软件实现SPSS软件实现软件实现SPSS软件实现软件实现第二节第二节 两相关样本率的卡方检验两相关样本率的卡方检验一、假设检验步骤一
9、、假设检验步骤一、假设检验步骤一、假设检验步骤SPSS软件实现软件实现n可以通过以下菜单方式操作实现可以通过以下菜单方式操作实现n1 描述统计描述统计 交叉表交叉表n2 非参数统计非参数统计 相关样本相关样本n 或非参数统计或非参数统计 旧对话框旧对话框 2个相关个相关样本样本 SPSS软件实现软件实现SPSS软件实现软件实现SPSS软件实现软件实现SPSS软件实现(非参数法)软件实现(非参数法)SPSS软件实现(非参数法)软件实现(非参数法)SPSS软件实现(非参数法)软件实现(非参数法)第三节第三节Fisher确切概率检验确切概率检验例例8.4假设检验步骤假设检验步骤假设检验步骤假设检验步
10、骤假设检验步骤假设检验步骤nP 值是观察到的情况以及更极端情况的值是观察到的情况以及更极端情况的概率。对于双侧检验概率。对于双侧检验,如将现有样本概率如将现有样本概率记为记为Pr,则所有概率小于等于则所有概率小于等于Pr 的四格表的四格表的概率和的概率和,即为确切概率法的结果。如果即为确切概率法的结果。如果是单侧检验是单侧检验,则将相应方向上所有概率小则将相应方向上所有概率小于等于于等于Pr 的四格表的概率相加即可。的四格表的概率相加即可。假设检验步骤假设检验步骤n如果如果12,将将Pr 上方上方所有概率小于等于所有概率小于等于Pr 的四格表的概率相加的四格表的概率相加。根。根 据研究目的据研
11、究目的,本研究应采用双侧检验本研究应采用双侧检验,n故故P=P1+P2+P7+P8+P9=0.08050.05。即。即n获得当前样本和比它更极端样本的概率是获得当前样本和比它更极端样本的概率是0.0805。按。按=0.05水准水准,不拒绝不拒绝H0,两组样本两组样本率的差异无统计学意义率的差异无统计学意义,尚不能认为某中药尚不能认为某中药制剂对制剂对HIV 垂直传播的预防能力高于对照组垂直传播的预防能力高于对照组。SPSS软件实现软件实现n同两独立样本率的卡方检验的同两独立样本率的卡方检验的SPSS实现实现n直接读取精确概率行的双侧直接读取精确概率行的双侧P值值第四节第四节RC表的卡方检验表的
12、卡方检验n一、多个样本率的比较一、多个样本率的比较n二、两组构成比的比较二、两组构成比的比较n(一一)双向无序两组构成比的比较双向无序两组构成比的比较n(二二)单向有序两组构成比的比较单向有序两组构成比的比较n三、多组构成比的比较三、多组构成比的比较n四、定性资料的关联性检验四、定性资料的关联性检验第四节第四节RC表的卡方检验表的卡方检验n四、定性资料的关联性检验四、定性资料的关联性检验n(一一)四格表资料的相关分析四格表资料的相关分析n(二二)R C 列联表资料的关联性分析列联表资料的关联性分析n1.双向无序列联表双向无序列联表n2.双向有序且属性不同的列联表双向有序且属性不同的列联表n3.
13、双向有序且属性相同的列联表双向有序且属性相同的列联表RC表的有关概念表的有关概念多个样本率的比较多个样本率的比较多个样本率的比较多个样本率的比较多个样本率的比较多个样本率的比较SPSS实现实现n同两独立样本率的卡方检验。同两独立样本率的卡方检验。n多个样本率之间的两两比较可采取卡方多个样本率之间的两两比较可采取卡方分割的方法进行检验。具体方法请参照分割的方法进行检验。具体方法请参照有关书籍。有关书籍。二、两组构成比的比较二、两组构成比的比较n(一一)双向无序两组构成比的比较双向无序两组构成比的比较(一一)双向无序两组构成比的比较双向无序两组构成比的比较双向无序两组构成比的比较双向无序两组构成比
14、的比较SPSS实现实现n同两独立样本率的卡方检验。同两独立样本率的卡方检验。n数据见数据见08-06.sav单向有序两组构成比的比较单向有序两组构成比的比较单向有序两组构成比的比较单向有序两组构成比的比较单向有序两组构成比的比较单向有序两组构成比的比较单向有序两组构成比的比较单向有序两组构成比的比较SPSS实现实现n不能进行卡方检验。不能进行卡方检验。n可以作可以作CMH(SAS软件可实现,软件可实现,SPSS无此功无此功能)。能)。n也可以作秩和检验(也可以作秩和检验(SPSS软件、软件、SAS软件)软件)。n也可以作也可以作Ridit分析(分析(SAS软件可实现或软件可实现或Excel)。
15、多组构成比的比较多组构成比的比较多组构成比的比较多组构成比的比较多组构成比的比较多组构成比的比较SPSS实现实现n同两独立样本率的卡方检验。同两独立样本率的卡方检验。n数据见数据见08-08.sav定性资料的关联性检验定性资料的关联性检验n四格表资料的相关分析四格表资料的相关分析四格表资料的相关分析四格表资料的相关分析四格表资料的相关分析四格表资料的相关分析四格表资料的相关分析四格表资料的相关分析SPSS实现实现nSPSS数据输入格式:生长、不生长、结数据输入格式:生长、不生长、结果(果(1代表生长,代表生长,2代表不生长)。代表不生长)。n同两独立样本率的卡方检验。同两独立样本率的卡方检验。
16、n列联系数(列联系数(Phi coefficient)可在)可在nStatistics相应的选项中进行选择。相应的选项中进行选择。四格表资料的相关分析四格表资料的相关分析SPSS实现实现四格表资料的相关分析四格表资料的相关分析SPSS实现实现R C 列联表资料的关联性分析列联表资料的关联性分析n双向无序列联表双向无序列联表双向无序列联表双向无序列联表双向无序列联表双向无序列联表SPSS实现实现n同两独立样本率的卡方检验。同两独立样本率的卡方检验。n数据见数据见08-10.savn列联系数(列联系数(Phi coefficient)可在)可在nStatistics相应的选项中进行选择。相应的选项
17、中进行选择。双向有序且属性不同的列联表双向有序且属性不同的列联表双向有序且属性不同的列联表双向有序且属性不同的列联表SPSS实现实现n可运用可运用Spearman秩相关(分析秩相关(分析 相关相关n 双变量双变量 Spearman)n可以作可以作CMH(SAS软件可实现,软件可实现,SPSS无无此功能)。此功能)。n数据见数据见08-11.sav。双向有序且属性相同的列联表双向有序且属性相同的列联表双向有序且属性相同的列联表双向有序且属性相同的列联表双向有序且属性相同的列联表双向有序且属性相同的列联表SPSS实现实现双向有序且属性相同的列联表双向有序且属性相同的列联表SPSS实现实现注意事项注
18、意事项n1.对于行对于行列表多个样本率列表多个样本率/构成比比较的构成比比较的2 检验不能有检验不能有1/5以上的格子理论数小于以上的格子理论数小于5,或者不能有一个格子的理论数小于或者不能有一个格子的理论数小于1,否则否则易出现偏性。如出现上述情况易出现偏性。如出现上述情况,可通过软件可通过软件计算确切概率。计算确切概率。n2.对于单向有序两组或多组构成比资料的对于单向有序两组或多组构成比资料的比较一般采用比较一般采用CMH 方法计算行平均分方法计算行平均分检验统计量进行分析检验统计量进行分析,也可以进行秩和检验也可以进行秩和检验、Ridit分析等。分析等。注意事项注意事项n3.分类变量资料的关联性检验比较特殊分类变量资料的关联性检验比较特殊,应根据不同的设计和资料特点选择相应应根据不同的设计和资料特点选择相应的统计量。的统计量。谢谢