1、第七章 2检验 用于:对多个率的比较,也适用于两个率的比较;对多组构成比的比较;对按照两个变量分组的资料,检验此两变量的关系;对频数分布做拟合优度检验。第一节 四格表资料的2检验一.普通2检验例 6.2 表6.2 两种药物治疗消化道溃疡效果 处理 愈合 未愈合 合计 愈合率(%)洛赛克雷尼替丁合计6451115213354858416975.2960.7168.05解 H0:1=2;H1:1 2;=0.05 A:实际频数T:理论频数2=(A-T)2T(通用公式)2 分布的性质 2 分布为连续型分布,2 自0至,永远大于0。2 分布同t分布、F分布一样,也是随自由度的不同而形成簇状分布。2 分布
2、的形态随自由度而变化,自由度越小,偏态越甚;自由度越大,其分布越趋近于正态分布。2 具有可加性。T11=85,T21=84,T12=85,T22=84,1151691151695416954169如何计算理论频数T?合计愈合率:115/169TRC=nRnCn(57.84)(27.16)(57.16)(26.84)处理 愈合 未愈合 合计 愈合率(%)洛赛克雷尼替丁合计6451115213354858416975.2960.7168.052=(64-T11)2T11+(21-T12)2T12(51-T21)2T21(33-T22)2T22=4.13 =(R-1)(C-1)=(2-1)(2-1)
3、=1 2 1,0.05=3.84,2 2 1,0.05,P0.05,拒绝H0。简化公式:2=(ad-bc)2n(a+b)(c+d)(a+c)(b+d)a bc d(四格表专用公式)普通2检验适用条件:n40且所有T 5。二.2检验的校正公式 2 =(n40但有1T5)简化公式:2=(|A-T|-0.5)2T(|ad-bc|-n/2)2n(a+b)(c+d)(a+c)(b+d)三.确切概率法:n 40或有T 1时。基本思想:在四格表周边合计不变的条件下,获得某个四格表的概率为 P=(a+b)!(c+d)!(a+c)!(b+d)!a!b!c!d!n!例 两型慢性布氏病的PHA皮试反应 病人分型 阳
4、性数 阴性数 合计 阳性率(%)活动型稳定型合计1(2.4)3(1.6)414(12.6)7(8.4)211510256.6730.0016.00解 H0:1=2;H1:1 2;=0.05表中活动型的阳性率 P1=0.067,稳定型的阳性率 P2=0.300,两者差别|P1-P2|=0.233,该表出现的概率为 P=0.1423将该表分解成若干种不同的情况,使得周边数不变:15!10!4!21!1!14!3!7!25!极端情况的概率:P=P(0)+P(1)+P(4)=0.0166+0.1423+0.1079=0.2668按=0.05水准不拒绝H0,尚不能认为两型布氏病患者PHA反应阳性率有差别
5、。确切概率法计算表(四格表周边合计数不变)序号(i)阳性 阴性 P1|P1-P2|P(i)P201234041322314015614713812911100.0000.4000.0670.3000.1330.2000.2000.1000.2670.0000.4000.2330.0670.1000.2670.01660.14230.1079 设两样本的差值|P1-P2|=D,双侧检验取|P1-P2|D的各种组合的累计概率为双侧P值;单侧检验取 P1-P2 D或 P1-P2-D的各种组合的累计概率为单侧P值。若两样本例数相等,则 P1-P2 D和 P1-P2-D的P值相等,可先计算一侧P值,再乘
6、以2得双侧检验的概率。补充题:用某种化学物质进行诱发肿瘤实验,实验组15只小白鼠中4只发生癌变,对照组10只无1只发生癌变,问两组发癌率有无差别?极端情况的概率:P=P(0)+P(4)=0.1079+0.0166=0.1245按=0.05水准不拒绝H0,尚不能认为两组发癌率有差别。确切概率法计算表(四格表周边合计数不变)序号(i)阳性 阴性 P1|P1-P2|P(i)P201234403122130411101291381471560.26700.20.10.1330.20.0670.300.40.2670.10.0670.2330.40.10790.0166第二节 行列表的2检验 行列表包括
7、2 2、R 2、2 C、R C表等。2 =n(-1)A2nr nc适用条件:不能有T 1,并且 1T 0.025,按=0.0167水准不能拒绝H0,不能认为两药的疗效不同。三.多个构成比的比较例 欲了解女性血栓形成患者的血型分布是否与正常妇女有所不同,资料见表,试分析血栓形成患者与正常妇女血型分布构成比有无差别?正常妇女与血栓形成者的血型分布表分组 A型 B型 AB型 O型 合计血栓形成组正常妇女组合计325183819271012229707959152211H0:血栓形成患者与正常妇女血型分布构成比相同;H1:血栓形成患者与正常妇女血型分布构成比不全相同;=0.05。2 =211322/(
8、59 83)+82/(59 27)+102/(59 22)+92/(59 79)+512/(152 83)+192/(152 27)+122/(152 22)+702/(152 79)-1 =18.77 =(2-1)(4-1)=3查表得P 0.005,按=0.05水准,拒绝H0,接受H1,可以认为血栓形成患者与正常妇女血型分布构成比不全相同。四.双向有序且属性不同的分类资料的关联性检验 P67例6.62 n+2P值在01之间,0表示完全无关,1表示完全相关。若需进一步说明相关的密切程度,可计算列联系数:Pearson列联系数(P)=五.条件不满足时的处理方法1.增大样本例数使理论频数变大;2.
9、删去理论频数太小的行或列;3.将理论频数过小的格子所在的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数增大。4.精确概率法。例 某地防疫站用碘剂局部治疗219例地方性甲状腺肿,结果列于下表,试分析年龄与疗效有无关联?年龄/岁 治愈 显效 好转 无效 总和11-2021-3031-4041-5050以上总和35(19.9)32(25.4)17(21.9)15(17.4)10(24.4)109 1(8.4)8(10.7)13(9.2)10(7.6)11(10.3)43 1(9.6)9(12.3)12(10.6)8(8.8)23(11.9)53 3(2.5)2(3.3)2(2.8)2(2.2
10、)5(3.1)144051443549219地方性甲状腺肿患者的年龄与疗效的关系 年龄/岁 治愈 显效 好转 无效 总和11-3031-5050以上总和67321010992311431020235354514917949219第三节 配对四格表资料的2检验 例6.8 两种血清学检验结果比较乙 法甲 法+-合 计 +-合 计80(a)31(c)11110(b)11(d)219042132解:H0:两法总体阳性检出率无差别,即B=C;H1:两法总体阳性检出率不同,即BC;=0.05 Tb=Tc=(b+c)/2,则 2=(b-c)2b+c,=1(b+c40)校正公式2=(|b-c|-1)2b+c,
11、=1(b+c40)本例 2=(10-31)210+31=10.76,=1查表得P 0.005,按=0.05水准,拒绝H0,接受H1,可以认为甲乙两法的血清学阳性检出率不同。第四节 不同类型RC表资料的统计分析方法1.双向无序 表1 某地6094人按两种血型系统划分的结果ABO血型 人 数MN血型:M N MN 合计OABAB合计4313884951371451490410587179166690280095032529771823159820326416094适用方法:2检验、Fisher精确检验2.单向有序 表2 3种药物疗效的观察结果疗效 人 数药物:A B C 合计治愈显效好转无效合计1
12、54931510049502285115452485207312651270适用方法;秩和检验或Ridit分析。3.双向有序且属性不同 表3 眼晶状体混浊度与年龄之关系晶状体混浊程度 眼 数年龄:20 30 40 合计+合计2156744326131101632951481281324084942962391029适用方法;等级相关分析、典型相关分析或线性趋势检验。4.双向有序且属性相同例 两名放射科医师对200名棉屑沉着病可疑患者的诊断结果见表4:表4 200名棉屑沉着病可疑患者的诊断结果第一人检查第二人检查 正常 I型 II型合计正常I 型II 型合计7860845561071013324
13、5837542200适用方法;一致性检验或称Kappa检验。练习1 用两种方法检验已确诊的癌症患者140名。甲法的检出率为65%,乙法的检出率为55%,甲乙两法一致的检出率为40%。试分析两法的优劣。乙 法 +-甲 法合 计+-合计56217735286391491402=(35-21)235+21=3.500按=0.05查表,得2 =3.841,2 20.05,10.05,1 ,故不能拒绝H0,不能认为两法的检出率有差异。解:甲法检出人数 140 0.65=91 乙法检出人数 140 0.55=77 甲、乙两法都检出人数 140 0.40=56 两法检出结果的比较第五节 频数分布拟合优度的2
14、检验一.二项分布拟合的2检验例 分别用同窝的4只小白鼠独立地进行辐射的致死试验,共做43窝试验,结果列于下表,试问每窝试验中的死鼠数是否遵从二项分布?辐射对43窝小白鼠的致死试验表01234合计每窝试验中 实际频数 概率 理论频数 的死鼠数 A P T(|A-T|-0.5)2T1320730430.31640.42190.21090.04680.00391.000013.6018.159.072.010.1743.001011.250.0070.1000.0502=0.157死鼠总数试验鼠总数=0 13+120+27+33+40443=0.25P(X)=()x(1-)4-x4=3-1-1=10
15、.05,10.05,1,故不能拒绝H0,解:H0:小白鼠死亡数分布服从二项分布;H1:小白鼠死亡数分布不服从二项分布;=0.05估计总体死亡率 =x2=0.007+0.100+0.050=0.157按=0.05查表,得2 =3.841,2 2认为小白鼠死亡数遵从二项分布。二.Poisson分布拟合的2检验例 300个单位容积内的细菌计数如下表所示,问此资料是否服从Poisson分布?单位容积内 观察频数 概率 理论频数 细菌数X A P(X)T (A-T)2T265184704215930.0829100.2064460.2570250.2133310.1327980.0661340.0274
16、450.01391124.961.977.164.039.819.88.24.20.051.920.620.560.121.160.012=4.4401234567合计1212.4解:H0:本资料服从Poisson分布;H1:本资料不服从Poisson分布;=0.102=4.44查表,得0.25P0.50,按=0.10水准,不拒绝H0,可认为本资料服从Poisson分布。=7-1-1=5=fX/n=747/300=2.490P(X)=XXe-X=0,1,2,三.正态分布的拟合优度检验P62,例6.1第六节 趋势检验 N(NtZ-TnZ)2 2=T(N-T)(NnZ2(nZ)2)例6-9 表6-
17、10 不同工龄的纺织女工的神经衰弱的患病率患病人数(t)不患病数(c)总人数(n)患病率(%)分数(Z)tZnZnZ21153541.85-4.5-4.5-2431093.5171131205.83-3.5-24.5-4201470.02252302559.80-2.0-50-5101020.043015418416.30000063213716918.932643386768122811013820.2951406903450合计123(T)920(N)125-1457709.5工龄(年)N(NtZ-TnZ)2 2=T(N-T)(NnZ2(nZ)2)920(920125-123 (-145)
18、2=123(920-123)(920 7709.5(-145)2)=23.42第七节 多个四格表的联合分析a b ec d fg h nORMH=(ad/n)i/(bc/n)i 2MH=(ad-bc)/n)i)2(efgh/(n-1)/n2)第i层列表形式 危险因素暴露 未暴露病例组 ai bi对照组 ci di表6-11 两个年龄组吸烟与肺癌的病例对照研究40岁40病例对照合计1包581001581包732803531包1113804911包504191合计131380511合计161421582ORMH=(ad/n)i/(bc/n)i=58280/511+50 380/58273100/5
19、11+11141/582=2.91 2MH=(ad-bc)/n)i)2(efgh/(n-1)/n2)=(58280-73100)/511+(50380-11141)/582)2(131380 353 158/(511-1)/5112+(161421 491 91(582-1)/5822=49.65第八节 2 检验的应用小结 类型 原假设 实际计算的 2 自由度曲线拟合的吻合度检验两个样本率或构成比的比较 2 2表多个样本率或构成比的比较 R C表独 立设计H0:F(x)=F0(x)H0:两个总体率或构成比相等H0:多个总体率或构成比相等2=(A-T)2T2校正=(|A-T|-0.5)2T2校正
20、=(|ad-bc|-n/2)2n(a+b)(c+d)(a+c)(b+d)2=(ad-bc)2n(a+b)(c+d)(a+c)(b+d)精确概率法:P=(a+b)!(c+d)!(a+c)!(b+d)!a!b!c!d!n!A2nr nc2=n(-1)m-1-r(2-1)(2-1)(r-1)(c-1)类型 原假设 实际计算的 2 自由度配对设计H0:两种处理的效应相同H0:两因子无相关关系2=(b-c)2b+c2校正=(|b-c|-1)2b+cA2(2-1)(2-1)(r-1)(c-1)两种处理的比较相关分析2=n(-1)nr ncPearson列联系数:(P)=2 n+2第九节 SAS程序data
21、 samp6_2;do i=1 to 2;do j=1 to 2;input f;output;end;end;cards;64 21 51 33;proc print;proc freq;tables i*j/chisq;weight f;run;四格表2检验:例6.2 OBS I J F 1 1 1 64 2 1 2 21 3 2 1 51 4 2 2 33 TABLE OF I BY J I J Frequency|Percent|Row Pct|Col Pct|1|2|Total -+-+-+1|64|21|85|37.87|12.43|50.30|75.29|24.71|55.65|
22、38.89|-+-+-+2|51|33|84|30.18|19.53|49.70|60.71|39.29|44.35|61.11|-+-+-+Total 115 54 169 68.05 31.95 100.00 STATISTICS FOR TABLE OF I BY J Statistic DF Value Prob -Chi-Square 1 4.130 0.042 Likelihood Ratio Chi-Square 1 4.156 0.041 Continuity Adj.Chi-Square 1 3.487 0.062 Mantel-Haenszel Chi-Square 1 4
23、.106 0.043 Fishers Exact Test(Left)0.986 (Right)0.031 (2-Tail)0.049 Phi Coefficient 0.156 Contingency Coefficient 0.154 Cramers V 0.156 Sample Size=169data samp6_4;do i=1 to 3;do j=1 to 2;input f;output;end;end;cards;57 30 24 20 130 20;proc print;proc freq;tables i*j/chisq;weight f;run;行列表的2检验:例6.4
24、OBS I J F 1 1 1 57 2 1 2 30 3 2 1 24 4 2 2 20 5 3 1 130 6 3 2 20 TABLE OF I BY J I J Frequency|Percent|Row Pct|Col Pct|1|2|Total -+-+-+1|57|30|87|20.28|10.68|30.96|65.52|34.48|27.01|42.86|-+-+-+2|24|20|44|8.54|7.12|15.66|54.55|45.45|11.37|28.57|-+-+-+3|130|20|150|46.26|7.12|53.38|86.67|13.33|61.61|2
25、8.57|-+-+-+Total 211 70 281 75.09 24.91 100.00 STATISTICS FOR TABLE OF I BY J Statistic DF Value Prob -Chi-Square 2 24.938 0.001 Likelihood Ratio Chi-Square 2 24.958 0.001 Mantel-Haenszel Chi-Square 1 15.779 0.001 Phi Coefficient 0.298 Contingency Coefficient 0.286 Cramers V 0.298 Sample Size=281dat
26、a samp6_9;input z b f;cards;0.5 1 1 0.5 2 531.5 1 7 1.5 2 1133 1 25 3 2 2305 1 30 5 2 1547 1 32 7 2 13710 1 28 10 2 110;proc freq;weight f;tables z*b/trend;run;趋势2检验:例6.9 STATISTICS FOR TABLE OF Z BY B Cochran-Armitage Trend Test -Statistic=4.839 Prob(Right-sided)=0.001 Prob(Two-sided)=0.001 Sample
27、Size=920data samp6_10;input a b c f;cards;1 1 1 581 1 2 731 2 1 1001 2 2 2802 1 1 502 1 2 1112 2 1 412 2 2 380;proc freq;weight f;tables a*b*c/all;run;多个四格表的联合分析:例6.10 TABLE 1 OF B BY C CONTROLLING FOR A=1 B C Frequency|Percent|Row Pct|Col Pct|1|2|Total -+-+-+1|58|73|131|11.35|14.29|25.64|44.27|55.7
28、3|36.71|20.68|-+-+-+2|100|280|380|19.57|54.79|74.36|26.32|73.68|63.29|79.32|-+-+-+Total 158 353 511 30.92 69.08 100.00 STATISTICS FOR TABLE 1 OF B BY C CONTROLLING FOR A=1 Statistic DF Value Prob -Chi-Square 1 14.710 0.001 Likelihood Ratio Chi-Square 1 14.166 0.001 Continuity Adj.Chi-Square 1 13.881
29、 0.001 Mantel-Haenszel Chi-Square 1 14.681 0.001 Fishers Exact Test(Left)1.000 (Right)1.25E-04 (2-Tail)1.83E-04 Phi Coefficient 0.170 Contingency Coefficient 0.167 Cramers V 0.170 Estimates of the Relative Risk(Row1/Row2)95%Type of Study Value Confidence Bounds -Case-Control 2.225 1.471 3.364 Cohort
30、(Col1 Risk)1.682 1.303 2.172 Cohort(Col2 Risk)0.756 0.642 0.891 Sample Size=511 TABLE 2 OF B BY C CONTROLLING FOR A=2 B C Frequency|Percent|Row Pct|Col Pct|1|2|Total -+-+-+1|50|111|161|8.59|19.07|27.66|31.06|68.94|54.95|22.61|-+-+-+2|41|380|421|7.04|65.29|72.34|9.74|90.26|45.05|77.39|-+-+-+Total 91
31、491 582 15.64 84.36 100.00 STATISTICS FOR TABLE 2 OF B BY C CONTROLLING FOR A=2 Statistic DF Value Prob -Chi-Square 1 40.121 0.001 Likelihood Ratio Chi-Square 1 36.339 0.001 Continuity Adj.Chi-Square 1 38.521 0.001 Mantel-Haenszel Chi-Square 1 40.052 0.001 Fishers Exact Test(Left)1.000 (Right)1.63E-
32、09 (2-Tail)2.77E-09 Phi Coefficient 0.263 Contingency Coefficient 0.254 Cramers V 0.263 Estimates of the Relative Risk(Row1/Row2)95%Type of Study Value Confidence Bounds -Case-Control 4.175 2.625 6.639 Cohort(Col1 Risk)3.189 2.201 4.621 Cohort(Col2 Risk)0.764 0.685 0.851 Sample Size=582 SUMMARY STAT
33、ISTICS FOR B BY C CONTROLLING FOR A Cochran-Mantel-Haenszel Statistics(Based on Table Scores)Statistic Alternative Hypothesis DF Value Prob -1 Nonzero Correlation 1 49.427 0.001 2 Row Mean Scores Differ 1 49.427 0.001 3 General Association 1 49.427 0.001 Estimates of the Common Relative Risk(Row1/Ro
34、w2)95%Type of Study Method Value Confidence Bounds -Case-Control Mantel-Haenszel 2.915 2.163 3.927 (Odds Ratio)Logit 2.940 2.159 4.003 Cohort Mantel-Haenszel 2.145 1.734 2.653 (Col1 Risk)Logit 2.067 1.675 2.550 Cohort Mantel-Haenszel 0.761 0.705 0.821 (Col2 Risk)Logit 0.762 0.696 0.834 The confidenc
35、e bounds for the M-H estimates are test-based.Breslow-Day Test for Homogeneity of the Odds Ratios Chi-Square=3.961 DF=1 Prob=0.047 Total Sample Size=1093练习1 某医院研究急慢性白血病与血型之间有无关系,资料见下表,问白血病的种类与患者血型的型别之间有无关联性?白血病的种类与血型之间关系的资料白血病 病例数 种类 血型:A B O AB 合计急性慢性合计584310149277659339218826184111295练习2 某地爆发流行性痢疾,为了分析这次爆发流行是否存在家庭内成员间的传播,共调查了四口之家288户,得到数据如下。试检验能否用二项分布模型来拟合这一组实际资料。每户发病人数 观察家庭数 二项分布概率 理论家庭数 A P T(A-T)2T01234合计16751501732880.43960.40110.13730.02090.00121.0001126.6115.539.56.0190.346288.012.8936.022.7980.9120 6.365 29.21
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。