1、 第八章第八章 检验检验 可用于单个频数分布的拟合优度检验,两组定性资料(两率、两可用于单个频数分布的拟合优度检验,两组定性资料(两率、两构成比)的差异检验、关联性检验,多组定性资料(多个率、多个构成比)的差异检验、关联性检验,多组定性资料(多个率、多个构成比)的差异检验、配对设计定性资料的差异检验、列联表资料构成比)的差异检验、配对设计定性资料的差异检验、列联表资料的差异检验、关联性检验,多个方差的齐性检验等。的差异检验、关联性检验,多个方差的齐性检验等。 2 第一节第一节 独立样本四格表资料的独立样本四格表资料的 检验检验 22 检验不仅可以用于推断单个样本的频率分布是否等于某检验不仅可以
2、用于推断单个样本的频率分布是否等于某种给定的理论分布,种给定的理论分布, 还可以检验两个样本的总体分布是否相同还可以检验两个样本的总体分布是否相同。22 基本格子只有四个的列联表称为四格表基本格子只有四个的列联表称为四格表(four fould table),),或或 表。表。 表8-1两种药物治疗消化道溃疡4周后疗效处理 愈合 未愈合 合计 愈合率()奥美拉唑雷尼替丁64(57.84)51(57.16)21(27.16)33(26.84)8584 75.29 60.68合计 115 54 169 68.05例例8-1(P150)。)。 属 性ban1(固定值)组 别1Y2Y合 计甲乙)(11
3、Ta)(21Ta)(12Tb)(22Tb)(2固定值ban合计 cam1dbm2dcban表表8-2 独立样本资料的四格表独立样本资料的四格表 一、一、 列联表列联表 检验的基本思想检验的基本思想 22 2 为理论数,根据为理论数,根据 计算,即计算,即 T0H 为为 行行 列的理论数列的理论数 为为 行的合计数行的合计数 为为 列的合计数列的合计数 为总的合计数为总的合计数 ijTijinijmjn84.26169548422T13.484.26)84.2633(16.57)16.5751(16.27)16.2721()(22284.572)84.5764(2TTAx84.571691158
4、511T16.27169548512T16.571691158421T)1)(1(CR R表示行数表示行数 C表示列数表示列数R查查 界值表(附录三附表)得界值表(附录三附表)得 284.321 ,05.084.321 ,05.013.4205.0P故 按按 检验水准,拒绝检验水准,拒绝 ,接受,接受 ,两样本频率的差异优统计学意义。,两样本频率的差异优统计学意义。因为奥美拉唑的愈合率为因为奥美拉唑的愈合率为75,雷尼替丁的愈合率为,雷尼替丁的愈合率为60.71,可以认为奥,可以认为奥美拉唑的愈合率比雷尼替丁的愈合率高。美拉唑的愈合率比雷尼替丁的愈合率高。05.00H1H四格表专用公式:四格表
5、专用公式:适用条件:适用条件:1. 2 . 计算最小理论数即可确定。计算最小理论数即可确定。40n5T13.4)3321()5164()3351()2164(169)51213364(22x例例8-1按该式得:按该式得:当资料条件:当资料条件:1. 2. 或或 应选用应选用Fisher确切概率法。确切概率法。 40n1T当资料条件:当资料条件:1. 2. 需校正:需校正:40n15 T例例8-2(P153)。)。8-38.440161211T62.22416281240224014101422查查 界值表(附录三附表界值表(附录三附表8)得)得 271.22)1(10.02)1 (10.021
6、0.0P按按 检验水准,不拒绝检验水准,不拒绝 ,尚不能认为,尚不能认为两种治疗方案的总体缓解概率不同。两种治疗方案的总体缓解概率不同。05.00H第第二节二节 独立样本独立样本RC列联表资料的列联表资料的 检验检验2)(11RRTA(一)(一)RC列联表列联表 检验的基本思想和计算步骤检验的基本思想和计算步骤处 理1Y2Y合 计)(1111TA)(2121TA)(1212TA)(2222TA)(1固定值n合计 1m2mcm属 性表表8-4 独立样本独立样本RC列联表列联表12R)(22RRTA)(11CCTA)(22CCTA)(RCRCTACY)(2固定值n)(固定值Rnn2统计量公式:统计
7、量公式:无 效 5 10 25 40组 别 A药 B药 C药合 计有 效 35 20 7 62合 计 40 30 32102有效率() 87.50 66.67 21.88 60.78表表8-5三种不同治疗方法治疗慢性支气管炎的疗效三种不同治疗方法治疗慢性支气管炎的疗效(二)多个独立样本频率的比较(例(二)多个独立样本频率的比较(例8-3),3210:H查附录三附表查附录三附表8,60.1022,005.060.1022,005.074.322005.0P即三种治疗方法的疗效相同即三种治疗方法的疗效相同,3211,:H不同或不全相同不同或不全相同05.0a32.74按按 检验水准,拒绝检验水准,
8、拒绝 ,可以认为这三种药物的治疗效果不同或不全相同。,可以认为这三种药物的治疗效果不同或不全相同。005.00H(三)多个独立样本频率分布的比较(三)多个独立样本频率分布的比较 分 组 儿童 成人 合 计 A型 30 19 49合 计 112 77 189表表8-6 儿童急性白血病患者与成年人急性白血病患者的血型分布儿童急性白血病患者与成年人急性白血病患者的血型分布B型383068O型321951AB型12921例例8-4试分析儿童急性白血病患者与成年人急性白血病患者的血型分布(表试分析儿童急性白血病患者与成年人急性白血病患者的血型分布(表8-6)有无差别?)有无差别?:0H查附录三附表查附录
9、三附表8,21.123,75.075.0P:1H05.0a005.00H按按 检验水准,不拒绝检验水准,不拒绝 ,尚不能认为,尚不能认为儿童急性白血病患者与成年人急性白血病患者的血型分布不相同儿童急性白血病患者与成年人急性白血病患者的血型分布不相同儿童急性白血病患者与成年人急性白血病患者的血型分布相同儿童急性白血病患者与成年人急性白血病患者的血型分布相同儿童急性白血病患者与成年人急性白血病患者的血型分布不相同儿童急性白血病患者与成年人急性白血病患者的血型分布不相同3)14()12(v0.695两两两两比较按四格表的比较按四格表的 检检验处理,只是验处理,只是 水准需按以下水准需按以下 公式公式
10、进行调整。进行调整。 表示检验水准修正值表示检验水准修正值 表示两两比较需进行检验的次数表示两两比较需进行检验的次数2NN2)1()!2( !2!2kkkkkN 表示比较的组数表示比较的组数k例例8-3的两两比较需把表的两两比较需把表8-5分解成分解成3个四格表个四格表 3)!23( !2!3)!2( !2!kkN017.0305.0N被增大所以由于:95.0)05.01 (m第三节第三节 配对设计资料的配对设计资料的 检验检验可用于配对设计定性资料的差异检验、关联性检验。可用于配对设计定性资料的差异检验、关联性检验。一、配对一、配对 列联表资料的列联表资料的 检验检验222 28-8例例8-
11、5(P156)。)。表表8-7 两种检验方法检验结果比较两种检验方法检验结果比较甲 法 + -合 计 乙法+80( )31( )111 -10( )11( ) 21合计9042132abcdncbncanba的阳性率变量的阳性率变量21总上所述,要比较两种检验方法阳性率有无差别,只要对其中的频数总上所述,要比较两种检验方法阳性率有无差别,只要对其中的频数b b与与c c做做 检验即可。检验即可。2适用条件:适用条件: 适用条件适用条件:40 cb40 cb88.721 ,005.02界值表,查 x21 ,005.02005.0P 按按 检验水准,拒绝检验水准,拒绝 ,可以认为两种检验方法的阳性
12、结果有差别。,可以认为两种检验方法的阳性结果有差别。鉴于甲法阳性率为鉴于甲法阳性率为90/132=68.20%,90/132=68.20%,乙法阳性率为乙法阳性率为111/132111/13284.0984.09,可以认为乙,可以认为乙法阳性率高于甲法阳性率。法阳性率高于甲法阳性率。05.00H05.0,:210H211:H即两种检验方法的阳性率相同即两种检验方法的阳性率相同76.103110)3110()(22cbcbx1v即两种检验方法的阳性率不相同即两种检验方法的阳性率不相同二、配对二、配对 列联表资料的列联表资料的 检验检验可用于可用于 列联表资料的差异检验、关联性检验。列联表资料的差
13、异检验、关联性检验。RR CR 2x8-9 例例8-6(P159)。)。8-1005.0 为类别数为类别数 和和 分别为第行合计和第列合计分别为第行合计和第列合计kinim2131 k查查 界值表得界值表得 按按 检验水准,不拒绝检验水准,不拒绝 ,尚不能认为甲法测定,尚不能认为甲法测定结果的概率分布与乙法测定结果的概率分布不同。结果的概率分布与乙法测定结果的概率分布不同。299.522,05.022,05.0205.0P05.00H 第四节第四节 四格表的确切概率法四格表的确切概率法 基本思想:在四格表四个周边合计不变的条件下,计基本思想:在四格表四个周边合计不变的条件下,计算获得现有数值以
14、及更不利于算获得现有数值以及更不利于 的数值的概率,再的数值的概率,再根据根据 水准对水准对 作出推断。作出推断。0H0H 例例8-7(P160)。)。8-118-12214.0213749.0000001.0023797.0114224.0P按按 检验水准,不拒绝检验水准,不拒绝 ,尚不能认为甲药治疗,尚不能认为甲药治疗精神抑郁症的效果与乙药不同。精神抑郁症的效果与乙药不同。05.00H第五节第五节 检验用于拟合优度检验检验用于拟合优度检验1. 原理原理 判断样本观察频数(判断样本观察频数(Observed frequency)与理论)与理论(期望期望)频频数(数(Expected freq
15、uency )之差是否由抽样误差所引起。)之差是否由抽样误差所引起。 分布和拟合优度检验分布和拟合优度检验 一、一、 分布分布 分布是一种连续型随机变量的概率分布。分布是一种连续型随机变量的概率分布。2222/)12/(2222)2/(21)(ef3.847.8112.59P P0.050.05的临界值的临界值2分布分布(chi-square distribution) 分布随自由度不同而变化。记为分布随自由度不同而变化。记为 。 22),(84.32)1 ,05.0(81.72)3 ,05.0(查附表查附表8:20.005.00H二、拟合优度检验二、拟合优度检验 拟合优度检验的应用是根据一个
16、样本的频数分布检验其未知拟合优度检验的应用是根据一个样本的频数分布检验其未知总体分布是否等于某个给定的理论分布。总体分布是否等于某个给定的理论分布。 :总体分布等于给定的理论分布:总体分布等于给定的理论分布 :总体分布不等于给定的理论分布:总体分布不等于给定的理论分布 (通常用(通常用 )1HA为实际频数为实际频数T为理论频数为理论频数如果如果 成立,则成立,则 应该不大;应该不大;若若 太大,超出一定范围时,就有理由认为太大,超出一定范围时,就有理由认为 不成立,从而拒绝不成立,从而拒绝 ,接受接受 ,认为资料不服从所假定的分布。,认为资料不服从所假定的分布。0H220H0H1Hskv1 例
17、例8-8(P162)。)。 : 总体分布等于均数为总体分布等于均数为139.48, 的正态分布的正态分布 :总体分布不等于均数为:总体分布不等于均数为139.48, 的正态分布的正态分布 30.7s0H30.7s05.01H表8-13 120名男生身高(cm)的频数分布表及拟合优度检验统计量的计算 组段 观察频数 (1) (2) iA)(uli()(3)(uui(4)ip(5)=(4)-(3)理论频数iT(6)iiiTTA)((7)122.0126.0130.0134.0138.0142.0146.0150.0154.0 5 81022332011 6 50.008320.032400.097
18、040.226420.419670.635030.8114110.925220.976650.024080.064630.129390.193250.215360.179080.111110.051430.01776 2.8900 7.755715.526323.189825.843321.489813.3331 6.1717 2.13090.032400.097040.226420.419670.635030.814110.925220.976650.994411.540530.007691.966980.061041.981880.103280.408270.004773.86289合计120 9.9373364.1026,10.0937.9210.0P26 ,10.0 按按 ,不能拒绝,不能拒绝 ,尚不能认为该地,尚不能认为该地12岁男孩身高不服从均数为岁男孩身高不服从均数为139.48,标准差为,标准差为7.30的正态分的正态分布。布。05.00H62191937.9)(22skvTTA查附录三附表8,可知