1、非参数检验非参数检验一、一、2 检验检验二、秩和检验二、秩和检验 1.完全随机设计四格表资料的完全随机设计四格表资料的 2 检验检验(一般四格表资料2 检验,Pearson Chi-square)当n40,且T5时;TTA22)()()()()(22dbcadcbanbcad(基本公式)(专用公式)RCn nTn(1)(1)RC1一、一、2 检验检验 1.完全随机设计四格表资料的完全随机设计四格表资料的 2 检验检验(一般四格表资料2 检验,Pearson Chi-square)当n40,且1T5时;用连续性校正公式TTA22)5.0()()()()2/(22dbcadcbannbcad(基本
2、公式的校正公式)(专用公式的校正公式)1.完全随机设计四格表资料的完全随机设计四格表资料的 2 检验检验(一般四格表资料2 检验,Pearson Chi-square)当n40 或T40结论:结论:P0.1210.05,所以尚不能认为新剂型与旧剂型疗效有所,所以尚不能认为新剂型与旧剂型疗效有所不同。不同。Output(结果输出结果输出)Chi-Square Tests2.399b1.1211.9461.1632.3931.122.127.0822.3911.122282Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers
3、 Exact TestLinear-by-LinearAssociationN of Valid CasesValuedfAsymp.Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea.0 cells(.0%)have expected count less than 5.The minimum expected count is23.97.b.0格理论数小于格理论数小于5,最小理论数为,最小理论数为23.97 P值值Pearson卡方检验卡方检验 例题例题2:某矿石粉厂当生产一种矿
4、石粉时,在数天内即某矿石粉厂当生产一种矿石粉时,在数天内即有部分工有部分工 人患职业性皮炎,本生产季节开始,随机抽人患职业性皮炎,本生产季节开始,随机抽取取15名车间工人穿上新防护衣,其中有名车间工人穿上新防护衣,其中有1名患皮炎;其名患皮炎;其余余28名工人仍穿旧防护衣,其中有名工人仍穿旧防护衣,其中有10名患皮炎。生产一名患皮炎。生产一段时间后,检查两组工人段时间后,检查两组工人 的皮炎患病率(见的皮炎患病率(见Pearson Chi-square-2),问两组工人的皮炎患病率有无差别?),问两组工人的皮炎患病率有无差别?一般四格表资料一般四格表资料 2 检验检验 -Pearson Chi
5、-square SPSS操作步骤:变量说明:group:组别,1=新防护衣,2=旧防护衣;effect:患病情况,1=患病,0=未患病;freq:频数。(SPSS软件操作步骤同例软件操作步骤同例1)Case Processing Summary43100.0%0.0%43100.0%组别*患病情况NPercentNPercentNPercentValidMissingTotalCases组别*患病情况 Crosstabulation1411593.3%6.7%100.0%18102864.3%35.7%100.0%32114374.4%25.6%100.0%Count%within 组别Cou
6、nt%within 组别Count%within 组别新防护衣旧防护衣组别Total未患病患病患病情况TotalOutput(结果输出结果输出)患病率患病率n40Chi-Square Tests4.329b1.0372.9381.0875.0561.025.065.0384.2281.04043Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestLinear-by-LinearAssociationN of Valid CasesValuedfAsymp.Sig.(2-sided)Exact Sig
7、.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea.1 cells(25.0%)have expected count less than 5.The minimum expected countis 3.84.b.Output(结果输出结果输出)1格理论数小于格理论数小于5,最小理论数为,最小理论数为3.84连续性校正卡方检验连续性校正卡方检验 P值值结论:结论:P0.0870.05,所以尚不能两组工人的患病率有差别。,所以尚不能两组工人的患病率有差别。例题例题3:某医师用A药治疗9例病人,治愈7人,用B药治疗10例病 人,
8、治愈1人(见Pearson Chi-square-3),问两药的疗效是否有差别?一般四格表资料一般四格表资料 2 检验检验 -Pearson Chi-square SPSS操作步骤:变量说明:group:组别,1=A药,2=B药;effect:治愈情况,1=治愈,0=未愈;freq:频数。(SPSS软件操作软件操作步骤同例步骤同例1)Case Processing Summary19100.0%0.0%19100.0%组别*治愈情况NPercentNPercentNPercentValidMissingTotalCasesOutput(结果输出结果输出)组别*治愈情况 Crosstabulat
9、ion27922.2%77.8%100.0%911090.0%10.0%100.0%1181957.9%42.1%100.0%Count%within 组别Count%within 组别Count%within 组别A药B药组别Total未愈治愈治愈情况Total治愈率治愈率n40Output(结果输出结果输出)Chi-Square Tests8.927b1.0036.3631.0129.8281.002.005.0058.4571.00419Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestLi
10、near-by-LinearAssociationN of Valid CasesValuedfAsymp.Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea.2 cells(50.0%)have expected count less than 5.The minimum expected countis 3.79.b.Fisher 精确概率法精确概率法 2格理论数小于格理论数小于5,最小理论数为,最小理论数为3.79P值值结论:结论:P0.0050.05,所以可以认为两种药物的疗
11、效有差别。,所以可以认为两种药物的疗效有差别。习题:习题:2.配对配对 2 检验(检验(McNemar 检验)当当b+c 40时时,当当b+c40时时,cbcb22)(cbcb22)1((专用公式)(校正公式)11.1.当当b b+c c2525,校正公式校正公式2.2.当当b b+c c2525,精确概率法精确概率法SPSS软件软件中的观点:中的观点:实际工作中宜推荐采用实际工作中宜推荐采用一、一、2 检验检验配对设计的两样本率(或构成比)比较配对设计的两样本率(或构成比)比较假设检验的目的:假设检验的目的:推断两个总体率是否相等推断两个总体率是否相等 McNemar检验检验(SPSS操作操
12、作)Data Weight Cases Weight cases by:?Analyze Descriptive Statistics Crosstabs Row(s):?Column(s):?Statistics McNemar配对配对 2 检验检验-McNemar 检验 例题例题4:分别用反向血凝法和酶标法对200名献血员进行 HBsAg检测,结果如下(见McNemar Chi-square.sav),问两种检验方法检出率有无差别?SPSS操作步骤:变量说明:X:酶标法,1=阳性,2=阴性;Y:反向血凝法,1=阳性,2=阴性;freq:频数。(SPSS软件操作步骤同例软件操作步骤同例1)数
13、据文件数据文件加权加权加权加权对记录加权对记录加权加权变量加权变量交叉表交叉表方法一方法一 (SPSS菜单:菜单:Crosstabs)列变量列变量行变量行变量Statistics 对话框对话框McNemar检验检验酶标法*反向血凝法 CrosstabulationCount301848215015232168200阳性阴性酶标法Total阳性阴性反向血凝法TotalChi-Square Tests.000a200McNemar TestN of Valid CasesValueExact Sig.(2-sided)Binomial distribution used.a.Output(结果输出
14、结果输出)精确概率法精确概率法b+c 25方法二方法二(SPSS菜单:菜单:Nonparametric Tests)-推荐推荐非参数检验非参数检验2个相关样本个相关样本酶标法&反向血凝法30182150酶标法1212反向血凝法Test Statisticsb200.000aNExact Sig.(2-tailed)酶标法&反向血凝法Binomial distribution used.a.McNemar Testb.Output(结果输出结果输出)精确概率法精确概率法 3.完全随机设计行完全随机设计行列表资料的列表资料的 2 检验检验 注意:注意:如果有如果有1/5以上格子的以上格子的1T5,
15、或有,或有1 个格子的个格子的T 1,则,则应考虑合并、删除、增加样本量等问题。或应考虑合并、删除、增加样本量等问题。或不宜采用不宜采用 2检验,推检验,推荐精确概率法荐精确概率法(SPSS10.0SPSS10.0以上已经有行以上已经有行列表的精确概率法)。列表的精确概率法)。TTA22)(122CRnnAnRCn nTn(1)(1)RC(基本公式)(专用公式)一、一、2 检验检验 完全随机设计(成组设计)的多个样本率(或构完全随机设计(成组设计)的多个样本率(或构成比)比较成比)比较 假设检验的目的:假设检验的目的:推断多个总体率是否相等 结果解释结果解释 当P0.05,拒绝H0时,总的说来
16、各组有差别,但并不意味着任何两组都有差别:可能是任何两者间都有差别,也可能其中某两者间有差别,而其它组间无差别。目前尚无公认的进一步两两比较的方法(可考虑采用Logistic回归)。行行列表资料的列表资料的 2 检验检验 例题例题5:某省从3个水中氟含量不同的地区随机抽取1012 岁儿童,进行第一恒齿患病率的调查(见Pearson Chi-square-4.sav),问3个地区儿童第一恒齿患病率是否不同?SPSS操作步骤:变量说明:group:组别,1=高氟区,2=干预区,3=低氟区;effect:患龋情况,1=患龋,2=未患龋;freq:频数。(SPSS操作同一般四格表资料操作同一般四格表资
17、料 2 检验检验)组别*患龋情况 Crosstabulation45267163.4%36.6%100.0%31154667.4%32.6%100.0%4354889.6%10.4%100.0%1194616572.1%27.9%100.0%Count%within 组别Count%within 组别Count%within 组别Count%within 组别高氟区干预区低氟区组别Total患龋未患龋患龋情况TotalOutput(结果输出结果输出)患龋率患龋率Output(结果输出结果输出)Chi-Square Tests10.489a2.00511.8522.0039.0851.00316
18、5Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid CasesValuedfAsymp.Sig.(2-sided)0 cells(.0%)have expected count less than 5.Theminimum expected count is 12.82.a.Pearson 卡方值卡方值P值值0格理论数小于格理论数小于5,最小理论数为,最小理论数为12.82 结论:结论:P0.0050.05,所以认为,所以认为3个地区儿童第一恒齿患病率有差个地区儿童第一恒齿患病率有差别。别。秩和检验(
19、秩和检验(rank sum test)秩和检验主要适用于以下情况:秩和检验主要适用于以下情况:数值变量资料:严重偏离正态分布或者分布未知。数值变量资料:严重偏离正态分布或者分布未知。数值变量资料:完全随机设计中方差不齐。数值变量资料:完全随机设计中方差不齐。有序分类资料(等级资料)有序分类资料(等级资料)注:注:但数据满足参数检验的条件时,若采用秩和但数据满足参数检验的条件时,若采用秩和检检 验,会降低统计效能。验,会降低统计效能。二、秩和检验二、秩和检验 1.完全随机设计(成组设计)的两样本比较完全随机设计(成组设计)的两样本比较(Mann-Whitney U,2 Independent-S
20、amples)目的:目的:推断两样本分别代表的总体分布是否不同。(Analyze Nonparametric Tests 2 Independent-Samples (Mann-Whitney U)二、秩和检验二、秩和检验完全随机设计(成组设计)的两样本比较完全随机设计(成组设计)的两样本比较 -2 Independent-Samples 例题例题6:教材教材P118【例例8-3】SPSS操作步骤:变量说明:group:组别,1=患者组,2=正常组;x:骨矿含量(g/cm2)。非参数检验非参数检验两独立样本的检验两独立样本的检验需要检验的变量需要检验的变量分组变量分组变量Ranks1013.0
21、5130.50107.9579.5020组别患者组正常组Total骨矿含量(g/cm2)NMean RankSum of RanksTest Statisticsb24.50079.500-1.931.053.052aMann-Whitney UWilcoxon WZAsymp.Sig.(2-tailed)Exact Sig.2*(1-tailed Sig.)骨矿含量(g/cm2)Not corrected for ties.a.Grouping Variable:组别b.Output(结果输出结果输出)Z 值,近似的值,近似的P值值2.配对符号秩和检验配对符号秩和检验(Wilcoxon符号秩
22、和检验符号秩和检验 或或 2 Related samples)目的:目的:1)推断配对资料的差值是否来自中位数为零的总体。)推断配对资料的差值是否来自中位数为零的总体。2)推断与已知总体中位数的差值是否来自中位数为零)推断与已知总体中位数的差值是否来自中位数为零的总体。的总体。(Analyze Nonparametric Tests 2 Related samples Wilcoxon)二、秩和检验二、秩和检验配对设计的两样本比较配对设计的两样本比较 -2 Related Samples 例题例题7:对10名健康人分别用新旧两种方法测定其尿汞值(见2 Related Samples.sav),
23、问两法所得结果有无差别?方法方法尿汞值尿汞值旧法旧法04.40.51.82.71.32.32.25.41.0新法新法04.601.13.42.11.31.13.04.6SPSS操作步骤:变量说明:X1:旧法尿汞值;X2:新法尿汞值。两相关样本(配对设计)两相关样本(配对设计)非参数检验非参数检验需检验的配对变量需检验的配对变量Output(结果输出结果输出)Ranks5a5.3026.504b4.6318.501c10Negative RanksPositive RanksTiesTotal新法尿汞值-旧法尿汞值NMean RankSum of Ranks新法尿汞值 旧法尿汞值b.新法尿汞值=
24、旧法尿汞值c.Output(结果输出结果输出)Test Statisticsb-.474a.635ZAsymp.Sig.(2-tailed)新法尿汞值-旧法尿汞值Based on positive ranks.a.Wilcoxon Signed Ranks Testb.Z 值,近似的值,近似的P值值3.完全随机设计的多个样本比较完全随机设计的多个样本比较(Kruskal-Wallis H 检验检验 或或 K Independent-Samples)适用:适用:方差不齐或不服从正态分布的多组计量资料的比较。(Analyze Nonparametric Tests K Independent-Sa
25、mples (Kruskal-Wallis H)二、秩和检验二、秩和检验完全随机设计的多个样本比较完全随机设计的多个样本比较 -K Independent-Samples 例题例题8:教材教材P121【例例8-5】SPSS操作步骤:变量说明:group:分组,分组,1=肺动脉压正常组,肺动脉压正常组,2=隐性隐性肺动脉高压组,肺动脉高压组,3=肺动脉高压组;肺动脉高压组;X:动脉血氧分压。动脉血氧分压。非参数检验非参数检验K个独立个独立样本样本检验变量检验变量分组变量分组变量Ranks1532.201521.971412.6844分组肺动脉压正常组隐性肺动脉高压组肺动脉高压组Total动脉血氧
26、分压NMean RankTest Statisticsa,b1 6.7 7 72.0 0 0Chi-Sq uared fAsymp.Sig.动 脉 血氧 分 压Kruskal W allis Testa.Gro up ing Variab le:分 组b.Output(结果输出结果输出)平均秩和平均秩和卡方值卡方值 自由度自由度 P 值值4.随机区组设计的多个样本比较随机区组设计的多个样本比较(Friedman M检验检验 或或 K Related samples)目的:目的:推断各处理组样本分别代表的总体分布是否不同。(Analyze Nonparametric Tests K Relate
27、d samples Friedman)二、秩和检验二、秩和检验随机区组设计的多个样本比较 -K Related samples 例题例题9:有有5个标本,每个标本经甲、乙、丙三种不同个标本,每个标本经甲、乙、丙三种不同的预处理后,在同样条件下对其免疫球蛋白(的预处理后,在同样条件下对其免疫球蛋白(IgA)作)作火箭电泳,测得电泳高度(火箭电泳,测得电泳高度(mm)如下(见)。问甲、)如下(见)。问甲、乙、乙、丙三种不同的预处理是否对免疫球蛋白测量值有丙三种不同的预处理是否对免疫球蛋白测量值有影响?影响?SPSS操作步骤:变量说明:No:标本号;标本号;X1:甲处理;甲处理;X2:乙处理;乙处理
28、;X3:丙处理。丙处理。K个相关样本个相关样本检验变量检验变量Ranks2.101.502.40甲处理乙处理丙处理Mean RankTest Statisticsa52.2112.331NChi-SquaredfAsymp.Sig.Friedman Testa.Output(结果输出结果输出)卡方值卡方值 自由度自由度 P 值值平均秩次平均秩次直线相关与直线回归直线相关与直线回归直线相关(linear correlation)定义定义 描述具有直线关系的两个变量之间的相互关系。r:相关系数,(correlation coefficient)用来衡量有直线关系的两个变量之间相关的密切程度和方向。
29、(-1r1)r0,正相关;r=1为完全正相关 r Correlate Bivariate Variables:x/y Correlation Coefficients Pearson Spearman 3.直线回归分析直线回归分析 Analyze RegressionLinear Dependent:y Independent(s):x直线相关-例题例题1:教材教材P132【例例9-1】SPSS操作步骤(绘制散点图)(绘制散点图)变量说明:x:身高(身高(cm););y:体重(体重(kg)。)。散点图散点图散点图中散点图中Y轴变量轴变量散点图中散点图中X轴变量轴变量散点图中标题散点图中标题12
30、名11岁女生的身高和体重散点图身高(cm)170160150140130体重(kg)6050403020Output(结果输出结果输出)散点图显示:散点图显示:身高与体重之间身高与体重之间有线性相关有线性相关 趋趋势,因此可以势,因此可以 进一步做直线相进一步做直线相关与回归关与回归。SPSS操作步骤(相关分析)(相关分析)变量说明:x:身高(身高(cm););y:体重(体重(kg)。)。相关分析相关分析两变量线性相关分析两变量线性相关分析Spearman相关系数相关系数需要分析的变量需要分析的变量Pearson相关系数相关系数Correlations1.819*.0011212.819*1.
31、001.1212Pearson CorrelationSig.(2-tailed)NPearson CorrelationSig.(2-tailed)N身高(cm)体重(kg)身高(cm)体重(kg)Correlation is significant at the 0.01 level(2-tailed).*.Correlations1.000.767*.0041212.767*1.000.004.1212Correlation CoefficientSig.(2-tailed)NCorrelation CoefficientSig.(2-tailed)N身高(cm)体重(kg)Spearm
32、ans rho身高(cm)体重(kg)Correlation is significant at the 0.01 level(2-tailed).*.Output(结果输出结果输出)Pearson相关系数相关系数P值、样本例数值、样本例数身高和体重身高和体重相关系数、相关系数、P值值Spearman相关系数相关系数P值、样本例数值、样本例数身高和体身高和体重相关系重相关系数、数、P值值SPSS操作步骤:变量说明:x:身高(身高(cm););y:体重(体重(kg)。)。Regression,回归,回归Linear,线性,线性直线相关与直线回归分析直线相关与直线回归分析因变量因变量自变量自变量O
33、utput(结果输出结果输出)Variables Entered/Removedb身高(cm)a.EnterModel1VariablesEnteredVariablesRemovedMethodAll requested variables entered.a.Dependent Variable:体重(kg)b.Model Summary.819a.671.6385.1108Model1RR SquareAdjustedR SquareStd.Error ofthe EstimatePredictors:(Constant),身高(cm)a.相关系数相关系数r决定系数决定系数r2调整调整r2