1、本章结构本章结构第一节第一节 四格表四格表 2检验检验第二节第二节 四格表确切概率法四格表确切概率法第三节第三节 RC 表资料的表资料的 2检验检验第四节第四节 配对四格表资料的配对四格表资料的 McNemar检验检验第五节第五节 多个样本率的两两比较多个样本率的两两比较 第一节第一节 四格表四格表 2 2检验检验卡方检验的基本思想卡方检验的基本思想四格表专用公式四格表专用公式校正卡方检验校正卡方检验四格表卡方检验的应用条件四格表卡方检验的应用条件 2 检验检验(Chi-square test)是现代统计学的是现代统计学的创始人之一,英国人创始人之一,英国人K.Pearson(1857-193
2、6)于)于1900年提出的一种具有广泛用途的统计方年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。的关联度分析,拟合优度检验等等。本章仅限于介绍两个和多个率或构成比比较本章仅限于介绍两个和多个率或构成比比较的的 2检验。检验。2 检验检验Karl Pearson(18571936)英国统计学家英国统计学家1901年年10月与月与Weldon,Galton一起创办一起创办Biometvika疗法疗法有效有效无效无效 合计合计有效率有效率胃金丹胃金丹271(253.24)5(22.76)276 98.1
3、9%西药西药 74(91.76)26(8.24)100 74.00%合合 计计 34531 376 91.76%表表8-1 8-1 两药治疗胃脘痛的疗效四格表两药治疗胃脘痛的疗效四格表 例例8-1 某医院收治某医院收治376例胃脘痛患者,随机分例胃脘痛患者,随机分为两组,分别用新研制的中药胃金丹和西药治疗。为两组,分别用新研制的中药胃金丹和西药治疗。结果如表结果如表8-1,探讨两药疗效有无差别。,探讨两药疗效有无差别。把全部数据按两个分类变量(原因变量、结把全部数据按两个分类变量(原因变量、结果变量)进行完全分类列成的频数表格称为列联果变量)进行完全分类列成的频数表格称为列联表,表,R行行C列
4、的列联表简称列的列联表简称RC表,表,22列联表列联表也称为四格表,利用列联表进行分类资料的检验也称为四格表,利用列联表进行分类资料的检验称为列联表分析。称为列联表分析。列联表资料分析列联表资料分析21 s 例例8-1 对表对表8-1资料推断两药的疗效有无差别资料推断两药的疗效有无差别 H0:,即两药总体有效率相等,即两药总体有效率相等s 由于总体有效率未知,将两组数据合并,计算合并由于总体有效率未知,将两组数据合并,计算合并样本有效率(称为样本有效率(称为理论有效率)p=345/376=91.76%,s 据此推算两组的据此推算两组的理论有效数:T11=276345/376=253.24,T2
5、1=100345/376=91.76,s 理论无效数:T12=276-253.24=22.76,T22=100-91.76=8.24 一、卡方检验的基本思想一、卡方检验的基本思想27157426表示总合计。表示总合计。列的合计数;列的合计数;表示第表示第行的合计数;行的合计数;表示第表示第,ncnrnnnnTcrcrrc 253.24 22.7691.768.24 理论数公式理论数公式衡量理论数与实际数的差别衡量理论数与实际数的差别检验统计量检验统计量 2 2 值值:TTATTACRcrrcrcrc2,1,22)()(Pearson 2 值近似服从自由度为值近似服从自由度为 df(R1)(C1
6、)的的 2 分布分布 2 值的大小反映了实际频数值的大小反映了实际频数A与理论频数与理论频数T的吻合程度的吻合程度1)12)(12(77.5624.8)24.826(2 76.91)76.9174(276.22)76.225(224.253)24.253271(22 df 2分布分布(chi-square distribution)2/)12/(2222)2/(21)(ef3.847.8112.59P P0.050.05的临界值的临界值 2 2检验的基本公式检验的基本公式)1)(1()(22 CRdfTTA 上述上述基本公式基本公式由由Pearson提出,因此软件上提出,因此软件上常称这种检验
7、为常称这种检验为Peareson卡方检验,下面将要卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它来的。它不仅适用于四格表资料,也适用于其它的的“行行列表列表”资料资料。二、四格表专用公式二、四格表专用公式 为了不计算理论频数为了不计算理论频数T,可由可由基本公式基本公式推导出,推导出,直接由各格子的实际频数(直接由各格子的实际频数(a、b、c、d)计算卡方)计算卡方值的公式:值的公式:1)()()()()(222 dfdbcadcbanbcadTTA 基本公式:基本公式:-四格表专用公式四格表专用
8、公式,可以认为疗效不同。,可以认为疗效不同。,接受,接受拒绝拒绝水准,水准,按,按下结论:下结论:界值表,界值表,查查1021,05.0221,05.022205.005.0;84.384.31,77.5631345100276376)74526271(HHPdf 例例8-1 用专用公式用专用公式 计算计算 2 值:值:1.1.建立数据文件建立数据文件 在在SPSS数据编辑窗,建立数据文件数据编辑窗,建立数据文件Li8-1.sav。行变量:行变量:“组别组别”,Values为:为:1“胃金胃金丹丹”,2“西药西药”列变量:列变量:“疗效疗效”,Values为:为:1“有有效效”,2“无效无效”
9、;频数变量:频数变量:“频数频数”。2.spss操作过程操作过程(1)在)在spss中调出数据文件中调出数据文件Li8-1.sav(2)频数变量加权。)频数变量加权。从菜单选择从菜单选择 DataWeight Cases 弹出弹出Weight Cases对话框,选择对话框,选择Weight Cases by框,框内选入框,框内选入“频数频数”,即指定该,即指定该变量为频数变量变量为频数变量加权变量加权变量(3)2检验检验从菜单选择从菜单选择AnalyzeDescriptive StatisticsCrosstable(交叉表)(交叉表)指定指定 Row(s):组别:组别Columns(s):疗
10、效:疗效击击Statistics按钮选择按钮选择Chi-square。列联表分析列联表分析一致性检验危险度分析配对四格表卡方检验统计量统计量卡方卡方检验检验主要输出结果主要输出结果理论数小于理论数小于5的格子数为的格子数为0(占占0%),最小理论数为最小理论数为8.24校正只适用于四格表校正只适用于四格表结果分析结果分析 由总频数由总频数n37640,最小理论频数,最小理论频数8.245,使用使用Pearson卡方检验。卡方检验。结果分析:结果分析:Pearson 256.77,双侧,双侧P0.0000.05,以,以0.05水准拒绝水准拒绝H0,差异有统计学,差异有统计学意义,可认为两药疗效不
11、同。意义,可认为两药疗效不同。三、四格表三、四格表 2 2检验的应用条件检验的应用条件(1)当当n40,且所有,且所有T5时,用时,用Pearson 2 检验检验(2)当当n40,而有,而有1T5时,用校正时,用校正 2检验检验(3)当当n40或或T1时,用时,用Fisher精确检验精确检验(Fisher exact test)2分布是一连续型分布,而四格表资料属离散型分布是一连续型分布,而四格表资料属离散型分布,对其进行校正称为连续性校正分布,对其进行校正称为连续性校正(correction for continuity),又称又称Yates校正(校正(Yates correction)。)
12、。四、连续性校正公式四、连续性校正公式 校正公式校正公式:,TTA22)5.0()()()()2/(22dbcadcbannbcad 校正校正 2 2 检验检验疗法疗法有效有效无效无效 合计合计通塞脉通塞脉1号号267 33活血温经汤活血温经汤362 38合合 计计 629 71表表8-4 8-4 两组疗效比较两组疗效比较 例例8-2 某中医院将某中医院将71例血栓闭塞性脉管炎例血栓闭塞性脉管炎期期23级患者随机分为两组,分别用活血温经汤级患者随机分为两组,分别用活血温经汤和通塞脉和通塞脉1号治疗。结果如表号治疗。结果如表8-4,推断两药疗效,推断两药疗效有无差别。有无差别。21 例例8-2
13、对表对表8-4资料推断两组的疗效有无差别资料推断两组的疗效有无差别 (1)H0:,即两组疗效相同,即两组疗效相同 H1:,即两组疗效不同,即两组疗效不同,=0.05 (2)计算)计算 2值,最小理论数值,最小理论数因有理论数因有理论数1T40,故用校正,故用校正 2检验检验 21 18.47133912 T1 75.29623833)2/71367226(7122 df 205.022)1(05.084.3 ,若不用校正公式,则若不用校正公式,则 2=4.06,P0.05,按,按=0.05水准不拒绝水准不拒绝H0,不能认为两法疗效不同。,不能认为两法疗效不同。1.1.建立数据文件建立数据文件
14、在在SPSS数据编辑窗,建立数据文件数据编辑窗,建立数据文件Li8-1.sav。行变量:行变量:“组别组别”,Values为:为:1“通塞通塞脉脉1号号”,2“活血温经汤活血温经汤”列变量:列变量:“疗效疗效”,Values为:为:1“有有效效”,2“无效无效”;频数变量:频数变量:“频数频数”。2.spss操作过程操作过程(1)在)在spss中调出数据文件中调出数据文件Li8-2.sav(2)频数变量加权。)频数变量加权。从菜单选择从菜单选择 DataWeight Cases 弹出弹出Weight Cases对话框,选择对话框,选择Weight Cases by框,框内选入框,框内选入“频数
15、频数”,即指定该,即指定该变量为频数变量变量为频数变量(3)2检验检验从菜单选择从菜单选择AnalyzeDescriptive StatisticsCrosstable(交叉表)(交叉表)指定指定 Row(s):组别:组别Columns(s):疗效:疗效击击Statistics按钮选择按钮选择Chi-square。输出结果输出结果理论数小于理论数小于5的格子数为的格子数为2(占占50%),最小理论数为最小理论数为4.18卡方检验:有效观测数卡方检验:有效观测数 n=7140,有两个格子理论数,有两个格子理论数T5,故用,故用校正卡方检验校正卡方检验 2=2.746,P=0.098,不能认为两药
16、疗效不同。,不能认为两药疗效不同。第二节第二节 四格表四格表确切概率法确切概率法四格表确切概率法基本思想四格表确切概率法基本思想实例实例四格表资料:当总例数四格表资料:当总例数n40;用其他方法所得概率接近检验水准用其他方法所得概率接近检验水准;四格表中有实际频数四格表中有实际频数A=0;四格表中有理论频数四格表中有理论频数T1。应采用四格表确切概率法。四格表确切概率法应采用四格表确切概率法。四格表确切概率法系英国统计学家系英国统计学家Fisher于于1934年提出,又称年提出,又称Fisher精切概率法(精切概率法(Fiser s exact test)四格表确切概率法的基本思想四格表确切概
17、率法的基本思想 在四格表周边合计固定不变的条件下,改在四格表周边合计固定不变的条件下,改变某一格子的实际频数,列出变某一格子的实际频数,列出a、b、c、d各种各种组合的四格表,按公式组合的四格表,按公式8-9计算每个四格表的概计算每个四格表的概率,然后计算单侧或双侧累积概率,并与检验率,然后计算单侧或双侧累积概率,并与检验水准水准比较,作出是否拒绝比较,作出是否拒绝H0的结论。的结论。!)!()!()!()!ndcbadbcadcbaP (组别组别改善改善无效无效 合计合计红花散红花散155 20安慰剂安慰剂314 17合合 计计 1819 37 例例8-3 研究中药制剂红花散改善周围血管闭研
18、究中药制剂红花散改善周围血管闭塞性病变患者的皮肤微循环状况,以安慰剂作对塞性病变患者的皮肤微循环状况,以安慰剂作对照,将照,将37个病例随机分到两组,结果如表个病例随机分到两组,结果如表8-5,分析红花散的疗效。分析红花散的疗效。表表8-5 红花散改变缺血组织皮肤微循环资料红花散改变缺血组织皮肤微循环资料 H0:红花散无效:红花散无效,H1:红花散有效:红花散有效。=0.05 n=3740 采用四格表确切概率法。采用四格表确切概率法。Spss操作操作过程同例过程同例8-11.1.建立数据文件建立数据文件 在在SPSS数据编辑窗,建立数据文件数据编辑窗,建立数据文件Li8-3.sav。行变量:行
19、变量:“组别组别”,Values为:为:1“红花红花散散”,2“安慰剂安慰剂”列变量:列变量:“效果效果”,Values为:为:1“改改善善”,2“无效无效”;频数变量:频数变量:“频数频数”。2.spss操作过程操作过程(1)在)在spss中调出数据文件中调出数据文件Li8-3.sav(2)频数变量加权。)频数变量加权。从菜单选择从菜单选择 DataWeight Cases 弹出弹出Weight Cases对话框,选择对话框,选择Weight Cases by框,框内选入框,框内选入“频数频数”,即指定该,即指定该变量为频数变量变量为频数变量(3)2检验检验从菜单选择从菜单选择AnalyzeDescriptive StatisticsCrosstable(交叉表)(交叉表)指定指定 Row(s):组别:组别Columns(s):效果:效果击击Statistics按钮选择按钮选择Chi-square。输出结果输出结果