1、 第七章第七章 秩和检验秩和检验参数统计和非参数统计的概念参数统计和非参数统计的概念 一、参数统计概念一、参数统计概念 参数统计是指在样本资料满足一定条件(正态参数统计是指在样本资料满足一定条件(正态分布,方差齐)的基础上,对样本所来自的总体分布,方差齐)的基础上,对样本所来自的总体的参数(总体均数或率)进行估计或是否相等进的参数(总体均数或率)进行估计或是否相等进行检验,称为参数统计。行检验,称为参数统计。参数统计均有一定的条件要求,若不满足条件参数统计均有一定的条件要求,若不满足条件则不能使用,可考虑进行变量变换或采用不要求则不能使用,可考虑进行变量变换或采用不要求条件的其它统计方法,如秩
2、和检验。条件的其它统计方法,如秩和检验。二、非参数统计概念、优点和缺点二、非参数统计概念、优点和缺点 1、概念、概念 非参数统计是指不考虑资料的分布形式及其非参数统计是指不考虑资料的分布形式及其总体参数,而对资料的分布是否相同进行检验,总体参数,而对资料的分布是否相同进行检验,这种统计方法称非参数检验。秩和检验、符号检这种统计方法称非参数检验。秩和检验、符号检验、游程检验、验、游程检验、Ridit分析、分析、X2检验等均属于非参检验等均属于非参数检验方法。数检验方法。2、优点、优点 (1)不受总体分布的限定,适用范围广;可用)不受总体分布的限定,适用范围广;可用于各种统计资料,主要用于偏态分布
3、资料、分布于各种统计资料,主要用于偏态分布资料、分布不明资料;不明资料;(2)对数据要求不严格;可用于不能准确定量)对数据要求不严格;可用于不能准确定量的资料,主要用于等级资料,开口资料;的资料,主要用于等级资料,开口资料;(3)有些方法在样本例数不多时,尚简便易)有些方法在样本例数不多时,尚简便易行。行。3、缺点、缺点 不能充分利用资料所提供的信息(仅考虑位次不能充分利用资料所提供的信息(仅考虑位次大小),故检验效率较参数检验低,犯第二类错大小),故检验效率较参数检验低,犯第二类错误的概率误的概率较参数检验大,同一资料要达到相同的较参数检验大,同一资料要达到相同的检验效能(检验效能(1-),
4、则非参数检验比参数检验所需),则非参数检验比参数检验所需的样本例数多。的样本例数多。因此,在进行统计分析时,应首先考虑是否满因此,在进行统计分析时,应首先考虑是否满足参数检验,不满足参数检验时才考虑使用非参足参数检验,不满足参数检验时才考虑使用非参数检验。数检验。配对设计差值符号的秩和检验配对设计差值符号的秩和检验 (Wilcoxon配对法)配对法)表表9.1 两种方法测定两种方法测定10名健康人尿汞值名健康人尿汞值(ug/L)编号编号 离子交换法离子交换法 蒸馏法蒸馏法 差值差值 秩次秩次 (1)(2)(3)(4)=(2)-(3)(5)1 0.5 0.0 0.5 2 2 2.2 1.1 1.
5、1 7 3 0.0 0.0 0.0 -4 2.3 1.3 1.0 6 5 6.2 3.4 2.8 8 6 1.0 4.6 -3.6 -9 7 1.8 1.1 0.7 3.5 8 4.4 4.6 -0.2 -1 9 2.7 3.4 -0.7 -3.5 10 1.3 2.1 -0.8 -5 无效假设为差值的总体中位数等于无效假设为差值的总体中位数等于0,备,备择假设为差值的总体中位数不等于择假设为差值的总体中位数不等于0。假。假设无效假设成立的话(两种方法的测定设无效假设成立的话(两种方法的测定结果结果无差别,两个总体分布的位置结果结果无差别,两个总体分布的位置相同),其配对数值之差应服从以相同)
6、,其配对数值之差应服从以0为中为中心的对称分布,理论上正秩和与负秩和心的对称分布,理论上正秩和与负秩和在理论上应该相等,即使有差别,也只在理论上应该相等,即使有差别,也只能是随机误差,其差别不会很大。如果能是随机误差,其差别不会很大。如果正负秩和差别很大的话,超过了允许的正负秩和差别很大的话,超过了允许的界值,我们就有理由拒绝无效假设。反界值,我们就有理由拒绝无效假设。反之,就不拒绝。之,就不拒绝。1、建立假设和确定检验水准、建立假设和确定检验水准 H0:差值总体中位数差值总体中位数Md=0 H1:差值总体中位数差值总体中位数Md0 0.05 2、求差值、求差值 3、编秩:、编秩:(1)依差值
7、绝对值从小到大编秩,再根据差值的正依差值绝对值从小到大编秩,再根据差值的正负给秩次冠以正负号;负给秩次冠以正负号;(2)差值为零时,舍去不计差值为零时,舍去不计(例数相应减例数相应减1);(3)差值相等,取其平均秩次;差值相等,取其平均秩次;4、求秩和并确定检验统计量、求秩和并确定检验统计量 (1)分别求正、负秩次之和分别求正、负秩次之和T+、T-本例:本例:T+=3.5;T-=41.5 (2)以绝对值较小的秩和为检验统计量,本例以绝对值较小的秩和为检验统计量,本例 T+3.5 注:总秩和注:总秩和=,本例本例T+T_=45,而而2)1(nn452)19(9 5、确定、确定P值值 (1)查表法
8、查表法 当当n50时,查附表时,查附表6(P268):界界值表(配对比较的符号秩和检验)值表(配对比较的符号秩和检验)以例数以例数n确定查哪一行,然后自左向右用确定查哪一行,然后自左向右用T与每与每一一 栏界值相比。栏界值相比。在界值范围之内,在界值范围之内,P值大于表上方相应概率值大于表上方相应概率 在界值范围之外,在界值范围之外,P值小于表上方相应概率值小于表上方相应概率 等于界值,等于界值,P值等于表上方相应概率值等于表上方相应概率 本例本例 n9,3.5,在双侧,在双侧P0.05的界值范的界值范围(围(837)之外,)之外,P0.02。(2)正态近似法正态近似法 当当n50时,可计算时
9、,可计算u值,确定值,确定P值值(属于非参数法)(属于非参数法)注:注:n50时,时,T近似呈正态分近似呈正态分布布 而当相同秩次较多而当相同秩次较多(超过超过25%)时时,需计算校正需计算校正u值。值。(注:为相同差值的(注:为相同差值的 24/)12)(1(5.0|4/)1(|nnnnnTu48)(24)12)(1(5.0|4/)1(|3 jjttnnnnnTu 6、推断结论、推断结论 0.02P25时,时,T分布较好地近似正态分布。分布较好地近似正态分布。T 24/)12)(1(nnnT 单一样本与总体中位数比较l例已知某地正常人尿氟含量的中位例已知某地正常人尿氟含量的中位数为数为2.1
10、5mmol/l。今在该地某厂随。今在该地某厂随机抽取机抽取12名工人尿氟含量如表。问名工人尿氟含量如表。问该厂工人尿氟是否高于当地正常人该厂工人尿氟是否高于当地正常人?尿氟含量差值秩次2.150.002.10-0.05-2.52.200.052.52.12-0.03-12.420.2743.871.72105.673.5211T+=62.5 T-=3.512名工人的尿氟含量测定结果 1、建立假设和确定检验水准、建立假设和确定检验水准 H0:该厂工人尿氟含量总体中位数该厂工人尿氟含量总体中位数Md=2.15 H1:该厂工人尿氟含量总体中位数该厂工人尿氟含量总体中位数Md02.15 0.05 2、
11、求差值、求差值 3、编秩:、编秩:(1)依差值绝对值从小到大编秩,再根据差值的正依差值绝对值从小到大编秩,再根据差值的正负给秩次冠以正负号;负给秩次冠以正负号;(2)差值为零时,舍去不计差值为零时,舍去不计(例数相应减例数相应减1);(3)差值相等,取平均秩次;差值相等,取平均秩次;4、求秩和并确定检验统计量、求秩和并确定检验统计量 (1)分别求正、负秩次之和分别求正、负秩次之和T+、T-本例:本例:T+=62.5;T-=3.5 (2)以绝对值较小的秩和为检验统计量,本例以绝对值较小的秩和为检验统计量,本例 T-3.5 5、确定、确定P值值 (1)查表法查表法 当当n50时,查附表时,查附表6
12、:界值表(配界值表(配对比较的符号秩和检验)对比较的符号秩和检验)以例数以例数n确定查哪一行,然后自左向右用确定查哪一行,然后自左向右用T与每与每一一 栏界值相比。栏界值相比。在界值范围之内,在界值范围之内,P值大于表上方相应概率值大于表上方相应概率 在界值范围之外,在界值范围之外,P值小于表上方相应概率值小于表上方相应概率 等于界值,等于界值,P值等于表上方相应概率值等于表上方相应概率 本例本例 n11,3.5,在单侧,在单侧P0.005的界值的界值范围(范围(837)之外,)之外,P0.005。6、下结论、下结论 成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验 (Wilcoxon
13、两样本比较法)两样本比较法)原始数据两样本比较的秩和检验原始数据两样本比较的秩和检验 表表9.3 两组小鼠发癌后生存日数两组小鼠发癌后生存日数 实验组实验组 对照组对照组 生存日数生存日数 秩次秩次 生存日数生存日数 秩次秩次 10 9.5 2 1 12 12.5 3 2 15 15 4 3 15 16 5 4 16 17 6 5 17 18 7 6 18 19 8 7 20 20 9 8 23 21 10 9.5 90以上以上 22 11 11 12 12.5 13 14 n1=10 T1=170 n2=12 T2=83 1、建立假设和确定检验水准、建立假设和确定检验水准 H0:喂高蛋白与喂
14、低蛋白的雌鼠增重的总体分喂高蛋白与喂低蛋白的雌鼠增重的总体分 布相同布相同 H1:喂高蛋白与喂低蛋白的雌鼠总体分布不同喂高蛋白与喂低蛋白的雌鼠总体分布不同 0.05 2、编秩:、编秩:(1)先将两组数据分别从小到大排序,再将两组先将两组数据分别从小到大排序,再将两组数据统一由小到大编秩;数据统一由小到大编秩;(2)遇相同数据,取平均秩次。遇相同数据,取平均秩次。3、求秩和并确定检验统计量、求秩和并确定检验统计量 (1)分别求各组的秩和分别求各组的秩和T1、T2;(2)以样本例数以样本例数n较小者的秩和较小者的秩和T为检验统计量(为检验统计量(若若n1=n2,任取一组秩和为任取一组秩和为T);本
15、例);本例T244.5 4、确定、确定P值值 (1)查表法:查表法:以以n1和和n2n1,查附表,查附表7,T界值表界值表(两样本比较的秩和检验用)(两样本比较的秩和检验用):在界值范围之内,在界值范围之内,P值大于表上方相应概率值大于表上方相应概率 在界值范围之外,在界值范围之外,P值小于表上方相应概率值小于表上方相应概率 恰好等于界值,恰好等于界值,P值等于表上方相应概率值等于表上方相应概率 本例本例 n17,n2n1=12-7=5;查附表;查附表7 T界值界值表表 得:得:T界值界值 P值值 49 91 0.1 46 94 0.05 42 98 0.02 40 100 0.0144.5,
16、在双侧,在双侧P0.05的界值范围(的界值范围(4694)之外,则)之外,则 P0.05。(2)正态近似法:正态近似法:当当n1或或/和和n2-n1超出附表超出附表7范围范围时,可计算时,可计算u值,确定值,确定P值值。而当相同秩次较多而当相同秩次较多(超过超过25%)时时,需计算校正需计算校正u值。值。12/)1(5.0|2/)1(|211 NnnNnTucuuc/)/()(133NNttCjj 6、推断结论、推断结论 本例本例P0.05,在在0.05水准上,拒绝水准上,拒绝H0,接受,接受H1,故可认为喂高蛋白与喂低蛋白的雌鼠增故可认为喂高蛋白与喂低蛋白的雌鼠增重 有 差 别,因 为 喂
17、高 蛋 白 组 平 均 秩 和重 有 差 别,因 为 喂 高 蛋 白 组 平 均 秩 和 145.5/12=12.125,喂低蛋白组平均秩和,喂低蛋白组平均秩和 44.5/7=6.36,故可认为喂高蛋白组雌鼠增重比喂,故可认为喂高蛋白组雌鼠增重比喂低蛋白的雌鼠增重较多。低蛋白的雌鼠增重较多。1T2T 等级资料(频数表资料)两样本比较的秩和检验等级资料(频数表资料)两样本比较的秩和检验 表表9.3 正常人和慢性气管炎病人痰液中嗜酸性粒细胞检查结果正常人和慢性气管炎病人痰液中嗜酸性粒细胞检查结果 人人 数数 秩秩 和和 结果结果 合计合计 秩次范围秩次范围 平均秩次平均秩次 正常人正常人 病人病人
18、 正常人正常人 病病人人 (1)(2)(3)(4)(5)(6)(7)=(2)(6)(8)=(3)(6)-11 5 16 1-16 8.5 93.5 42.5 +10 18 28 17-44 30.5 305 549.0+3 16 19 45-63 54.0 162 864.0+0 5 5 64-68 66.0 0 330.0合计合计 n1=24 n2=44 68 T1=560 T2=1785.51、建立假设和确定检验水准、建立假设和确定检验水准 H0:两类病人总体分布相同两类病人总体分布相同 H1:两类病人总体分布不相同两类病人总体分布不相同 单侧单侧0.05 2、编秩、编秩 (1)计算各等级
19、的合计数;计算各等级的合计数;(2)确定秩次范围;确定秩次范围;(3)求平均秩次;(下限求平均秩次;(下限+上限)上限)/2 3、求秩和并确定检验统计量、求秩和并确定检验统计量 (1)分别求各组的秩和分别求各组的秩和T1、T2(各个等级秩和:(各个等级秩和:例数例数 平均秩和)平均秩和)(2)以样本例数小者以样本例数小者n1的秩和为检验统计量,的秩和为检验统计量,本例本例T18780.5 4、计算、计算u值和校正值和校正u值,确定值,确定P值值 12/)1(5.0|2/)1(|211 NnnNnTu8443.012/)1208)(126)(82(5.0|2/)1208(825.8780|uc
20、u/C=1(t3jtj)(N3N)=1-(1073-107)+(243-24)(533-53)+(243-24)(2083-208)=0.8443 uc3.4265/=0.5413 uc0.54130.05 5、推断结论、推断结论 本例本例P0.05,在在0.05水准上,不拒绝水准上,不拒绝H0,故,故尚不能认为该药对两种支气管病人的疗效分布不尚不能认为该药对两种支气管病人的疗效分布不同。同。c8443.0TT 成组设计多个样本比较的秩和检验成组设计多个样本比较的秩和检验 (KruskalWallis法)法)原始数据多个样本比较的秩和检验原始数据多个样本比较的秩和检验 表表9.4 教室在不同时
21、间空气中教室在不同时间空气中CO含量(含量(mg/m)课课 前前 课课 中中 课课 后后 含量含量 秩次秩次 含量含量 秩次秩次 含量含量 秩次秩次 (1)(2)(3)(4)(5)(6)0.48 1 4.45 12.5 2.95 7 0.53 2 4.73 14 3.07 8 0.55 3 4.77 15 3.18 9 0.55 4 4.82 16 3.20 10 0.58 5 4.89 17 3.30 11 0.62 6 5.00 18 4.45 12.5 21 92.5 57.5 6 6 6iRin 1、建立假设和确定检验水准、建立假设和确定检验水准 H0:三个总体的分布位置相同三个总体的
22、分布位置相同 H1:三个总体的分布位置不同或不全相同三个总体的分布位置不同或不全相同 0.05 2、编秩:、编秩:(1)各组分别从小到大排列,再将各组数据由小各组分别从小到大排列,再将各组数据由小到大统一编秩;到大统一编秩;(2)有相同的数据,取平均秩次。有相同的数据,取平均秩次。3、求各组的秩和、求各组的秩和 iT 4、计算检验统计量、计算检验统计量H 而当相同秩次较多而当相同秩次较多(超过超过25%)时时,需计算校正需计算校正HC值值.HC =H/C C=1本例:本例:)1N(3nT)1N(N12H12i)()(33NNttjj )1N(3nT)1N(N12H12i245.9)115(3)
23、55.61405.18()115(1512222 5、确定、确定P值值 (1)若若k3,每组例数,每组例数5,查附表,查附表8,H界值表界值表;(2)若组数若组数k3,每组例数,每组例数5,以自由度,以自由度v=k-1,查附表查附表8,X2界值表界值表(此时(此时H服从服从X2分布)。分布)。本例本例 k3,每组例数,每组例数P0.01,P0.01。6、推断结论、推断结论 本例本例PX20.005,2,P0.005 6、推断结论、推断结论 本例本例 P0.05一与三一与三 5 5 8.6 6.89 8.54 0.05/1/112/)1(21,BAknnNNCxD AnBn2,05.0D2,01
24、.0D5、推断结论、推断结论 一一(9D)二(二(11C)、三)、三(DSC1)=3.7,=8,=12.31R2R3R 随机区组设计(配伍设计)资料的秩和检验随机区组设计(配伍设计)资料的秩和检验 一、一、M检验检验(Friedman法法)查表法查表法 5名受试者穿名受试者穿5种不同的防护服测得的脉搏数(次种不同的防护服测得的脉搏数(次/分)分)防护服防护服A 防护服防护服B 防护服防护服C 防护服防护服D 防护服防护服E编号编号 脉搏脉搏 秩次秩次 脉搏脉搏 秩次秩次 脉搏脉搏 秩次秩次 脉搏脉搏 秩次秩次 脉搏脉搏 秩秩次次 1 130 1 144 5 143 3.5 133 2 143
25、3.5 2 111 1.5 116 3 119 5 118 4 111 1.5 3 114 3 106 1 115 4 113 2 116 5 4 123 4 98 1 120 3 104 2 133 5 5 115 5 104 2 111 4 110 3 101 1 b 5 5 5 5 5 14.5 12 19.5 13 16 15 15 15 15 15 (-)0.5 3 4.5 2 1 (-)2 0.25 9 20.25 4 1 RiRRRiRiR M检验方法:检验方法:1、将每个配伍组编秩,有相同的观察值则取平、将每个配伍组编秩,有相同的观察值则取平均秩次;均秩次;2、求每个处理组的秩
26、和、求每个处理组的秩和 ;3、求平均秩和、求平均秩和 ;=4、求、求M;M=5、查附表、查附表9,M界值表,确定界值表,确定P值。值。iRRR)1(21 kb 2)(RRi H0:此药不同剂量时血清中此药不同剂量时血清中DT值的总体分布相同值的总体分布相同 H1:此药不同剂量时血清中此药不同剂量时血清中DT值的总体分布不同值的总体分布不同 =0.05 用用b=7,k=4,查附表查附表9,M界值表得:界值表得:M0.05=92,M=213 M0.05,P0.05 由于由于P0.05,拒绝,拒绝H0,接受,接受H1,差别有统计学意,差别有统计学意义,故可以认为此药不同剂量时血清中义,故可以认为此药
27、不同剂量时血清中DT值的影值的影响有差异。响有差异。5.17)14(721R213)RR(M2i二、X2分布近似法l当处理组或配伍组超过附表9时,可以采用近似X2分布法。lV=k-1)1k(b3R)1k(bk12x2i2l当各区组的相同秩次较多时,需要校正:c/XX22C)1k(bk/tt(1c2)j3j3.18)14(7*3)1222279()14(4*712x22222V=4-1=3查X2界值表,p F0.01(5,25),P0.01 由于由于P0.01,按按 =0.05,拒绝拒绝H0,接受,接受H1,狗,狗服药后不同时间血中药物浓度不同或不全相同。服药后不同时间血中药物浓度不同或不全相同
28、。随机区组设计资料两两比较的秩和检验随机区组设计资料两两比较的秩和检验 方法和步骤:方法和步骤:1、列出两两对比组;、列出两两对比组;2、求两两对比组秩和之差的绝对值、求两两对比组秩和之差的绝对值、|RA-RB|;3、计算检验界值、计算检验界值 ;v=(b-1)(k-1)C)1)(1()(2,kbBAbtCv 对例对例9.10做两两比较。做两两比较。398.3)16)(16()36.540546(6206.2)1)(1()(225,05.005.0 kbBAbtC598.4)16)(16()36.540546(62787.2)1)(1()(225,01.001.0 kbBAbtC 表表9.11
29、 各组间的两两比较各组间的两两比较对比组对比组|RA-RB|P 对比组对比组|RA-RB|P1与与3|15-34|=19 0.051与与4|15-32|=17 0.01 3与与5|34-15|=19 0.05 3与与6|34-6|=28 0.011与与6|15-6|=9 0.01 4与与5|32-15|=17 0.012与与3|24-34|=10 0.01 4与与6|32-6|=26 0.012与与4|24-32|=8 0.01 5与与6|15-6|=9 0.012与与5|24-15|=9 0.01 除服药后除服药后0.5小时与小时与24小时,小时,6和和8小时药物浓度无差小时药物浓度无差别外,其余时间药物浓度不同。别外,其余时间药物浓度不同。狗服用阿司匹林后不同时间血中药物浓度(狗服用阿司匹林后不同时间血中药物浓度(r/ml)0.5小时小时 1小时小时 6小时小时 8小时小时 24小时小时 48小小时时 15 24 34 32 15 6iR