1、普通高等教育普通高等教育“十一五十一五”国家级规划教材国家级规划教材 参数统计是指在样本资料满足一定条件参数统计是指在样本资料满足一定条件(正态分布,方差齐)的基础上,对样本所来(正态分布,方差齐)的基础上,对样本所来自的总体的参数(总体均数或率)进行估计或自的总体的参数(总体均数或率)进行估计或是否相等进行检验,称为参数统计。是否相等进行检验,称为参数统计。参数统计均有一定的条件要求,若不满足条参数统计均有一定的条件要求,若不满足条件则不能使用,可考虑进行变量变换或采用不件则不能使用,可考虑进行变量变换或采用不要求条件的其它统计方法,如秩和检验。要求条件的其它统计方法,如秩和检验。一、参数统
2、计概念一、参数统计概念 非参数统计是指不考虑资料的分布形式非参数统计是指不考虑资料的分布形式及其总体参数,而对资料的分布是否相同进及其总体参数,而对资料的分布是否相同进行检验,这种统计方法称非参数检验。秩和行检验,这种统计方法称非参数检验。秩和检验、符号检验、游程检验、检验、符号检验、游程检验、RiditRidit分析、分析、X X2 2检验等均属于非参数检验方法。检验等均属于非参数检验方法。二、非参数统计概念、优点和缺点二、非参数统计概念、优点和缺点1 1、概念、概念 (1 1)不受总体分布的限定,适用范围广;可)不受总体分布的限定,适用范围广;可用于各种统计资料,主要用于偏态分布资料、用于
3、各种统计资料,主要用于偏态分布资料、分布不明资料;分布不明资料;(2 2)对数据要求不严格;可用于不能准确)对数据要求不严格;可用于不能准确定量的资料,主要用于等级资料,开口资料;定量的资料,主要用于等级资料,开口资料;(3 3)有些方法在样本例数不多时,尚简便)有些方法在样本例数不多时,尚简便易行。易行。2 2、优点、优点 不能充分利用资料所提供的信息(仅考虑不能充分利用资料所提供的信息(仅考虑位次大小),故检验效率较参数检验低,犯位次大小),故检验效率较参数检验低,犯第二类错误的概率第二类错误的概率较参数检验大,同一资较参数检验大,同一资料要达到相同的检验效能(料要达到相同的检验效能(1-
4、1-),),则非参则非参数检验比参数检验所需的样本例数多。数检验比参数检验所需的样本例数多。因此,在进行统计分析时,应首先考虑因此,在进行统计分析时,应首先考虑是否满足参数检验,不满足参数检验时才考是否满足参数检验,不满足参数检验时才考虑使用非参数检验。虑使用非参数检验。3 3、缺点、缺点 (WilcoxonWilcoxon配对法)配对法)编号编号 离子交换法离子交换法 蒸馏法蒸馏法 差值差值 秩次秩次 (1)(2)(3)(4)=(2)-(3)(5)1 0.5 0.0 0.5 2 2 2.2 1.1 1.1 7 3 0.0 0.0 0.0 -4 2.3 1.3 1.0 6 5 6.2 3.4
5、2.8 8 6 1.0 4.6 -3.6 -9 7 1.8 1.1 0.7 3.5 8 4.4 4.6 -0.2 -1 9 2.7 3.4 -0.7 -3.5 10 1.3 2.1 -0.8 -5 表表9.1 9.1 两种方法测定两种方法测定1010名健康人尿汞值名健康人尿汞值(ugug/L)/L)H H0 0:差值总体中位数差值总体中位数M Md d=0 =0 H H1 1:差值总体中位数差值总体中位数M Md d0 0 0.050.05 2 2、求差值、求差值 1 1、建立假设和确定检验水准、建立假设和确定检验水准 (1)(1)依差值绝对值从小到大编秩,再根据差值依差值绝对值从小到大编秩,
6、再根据差值 的正负给秩次冠以正负号;的正负给秩次冠以正负号;(2)(2)差值为零时,舍去不计差值为零时,舍去不计(例数相应减例数相应减1)1);(3)(3)差值相等,符号相同,按顺序编秩;差值相等,符号相同,按顺序编秩;(4)(4)差值相等,符号不同,取平均秩次。差值相等,符号不同,取平均秩次。3 3、编秩:、编秩:(1)分别求正、负秩次之和分别求正、负秩次之和T+、T-本例:本例:T+=26.5;T-=18.5 (2)以绝对值较小的秩和为检验统计量,以绝对值较小的秩和为检验统计量,本例本例 T-18.5 注:总秩和注:总秩和=,本例本例T+T_=45,而而2)1(nn452)19(9 4 4
7、、求秩和并确定检验统计量、求秩和并确定检验统计量(1)(1)查表法查表法 当当n n5050时,查附表时,查附表9:9:界值表界值表(配对比较的符号秩和检验)(配对比较的符号秩和检验)以例数以例数n n确定查哪一行,然后自左向右用确定查哪一行,然后自左向右用T T与每一与每一 栏界值相比。栏界值相比。在界值范围之内,在界值范围之内,P P值大于表上方相应概值大于表上方相应概率率 在界值范围之外,在界值范围之外,P P值小于表上方相应概值小于表上方相应概率(往右移一栏继续查)率(往右移一栏继续查)本例本例 n n9 9,18.518.5,在双侧,在双侧P P0.10.1的的界值范围(界值范围(8
8、 83737)之内,)之内,P0.1P0.1 5 5、确定、确定P P值值 (2)(2)正态近似法正态近似法 当当n50n50时,可计算时,可计算u u值,确值,确定定P P值值 (属于非参数法)(属于非参数法)注:注:n50n50时,时,T T近似近似呈正态分布呈正态分布 而当相同秩次较多而当相同秩次较多(超过超过25%)25%)时时,需计算校正需计算校正u u值。值。(注:为相同差值的(注:为相同差值的)24/)12)(1(5.0|4/)1(|nnnnnTu48)(24)12)(1(5.0|4/)1(|3 jjttnnnnnTu P0.1P0.1,在在0.050.05水准上,水准上,不拒绝
9、不拒绝H H0 0,故尚不能认为两法测定尿故尚不能认为两法测定尿汞含量有差别。汞含量有差别。6 6、推断结论、推断结论 1 1、T T值的分布值的分布呈对称非连续性分布(而呈对称非连续性分布(而T T值的分布与原值的分布与原分布形式无关)。分布形式无关)。T T值的总体均数:值的总体均数:=n(n+1)/4 =n(n+1)/4 T T值的总体标准差:值的总体标准差:T 24/)12)(1(nnnT 配对设计差值的符号秩和检验的基本思想配对设计差值的符号秩和检验的基本思想(1 1)根据)根据T T分布,直接计算小于、等于分布,直接计算小于、等于T T的单侧概率作为假设检验的界值;的单侧概率作为假
10、设检验的界值;2 2、T T分布的统计学意义分布的统计学意义(2 2)n25n25时,时,T T分布较好地近似正态分布。分布较好地近似正态分布。(WilcoxonWilcoxon两样本比较法)两样本比较法)原始数据两样本比较的秩和检验原始数据两样本比较的秩和检验 表表9.3 9.3 两组小鼠发癌后生存日数两组小鼠发癌后生存日数 实验组实验组 对照组对照组 生存日数生存日数 秩次秩次 生存日数生存日数 秩次秩次 10 9.5 2 1 12 12.5 3 2 15 15 4 3 15 16 5 4 16 17 6 5 17 18 7 6 18 19 8 7 20 20 9 8 23 21 10 9
11、.5 90以上以上 22 11 11 12 12.5 13 14 n1=10 T1=170 n2=12 T2=83 H H0 0:两组小鼠生存日数总体分布相同两组小鼠生存日数总体分布相同 H H1 1:两组小鼠生存日数总体分布不同两组小鼠生存日数总体分布不同 0.050.05 1 1、建立假设和确定检验水准、建立假设和确定检验水准 (1)(1)先将两组数据分别从小到大排序,再先将两组数据分别从小到大排序,再 将两组数据统一由小到大编秩;将两组数据统一由小到大编秩;(2)(2)相同数据在同一组里,按顺序编秩;相同数据在同一组里,按顺序编秩;(3)(3)相同数据在不同组里,取平均秩次。相同数据在不
12、同组里,取平均秩次。2 2、编秩:、编秩:(1)(1)分别求各组的秩和分别求各组的秩和T T1 1、T T2 2 ;(2)(2)以样本例数以样本例数n n较小者的秩和较小者的秩和T T为检为检验统计量(若验统计量(若n n1 1=n=n2 2,任取一组秩和任取一组秩和为为T T););本例本例T T1 1170170 3 3、求秩和并确定检验统计量、求秩和并确定检验统计量(1)(1)查表法:查表法:以以n1n1和和n2n2n1n1,查附表,查附表10 T10 T界值表(两样本比较的秩和检验用)界值表(两样本比较的秩和检验用):在界值范围之内,在界值范围之内,P P值大于表上方相值大于表上方相应
13、概率应概率 在界值范围之外,在界值范围之外,P P值小于表上方相值小于表上方相应概率应概率 恰好等于界值,恰好等于界值,P P值等于表上方相应值等于表上方相应概率概率 4 4、确定、确定P P值值 本例本例 n110,n2n1=12-10=2;查查附表附表10 T界值表界值表 得:得:T界值界值 P值值 89 141 0.1 84 146 0.05 79 151 0.02 76 154 0.01170,在双侧,在双侧P0.01的界值范围(的界值范围(76154)之外,则)之外,则 P0.01。(2)(2)正态近似法:正态近似法:当当n n1 1或或/和和n n2 2-n-n1 1超出附超出附表
14、表1010范围时,可计算范围时,可计算u u值,确定值,确定P P值值 。而当相同秩次较多而当相同秩次较多(超过超过25%)25%)时时,需计算校正需计算校正u u值。值。12/)1(5.0|2/)1(|211 NnnNnTucuuc/)/()(133NNttCjj 本例本例Pu0.005,单侧单侧3.2905,P0.005 c8951.0 本例本例P0.005P3,每组例数每组例数5,以自由度,以自由度v=k-1,查附表查附表8,X2界值表界值表(此时(此时H服从服从X2分布)。分布)。本例本例 k3,每组例数每组例数5,以自由度,以自由度v=3-1=2,查附表查附表8,X2界值表得:界值表
15、得:X20.005,2=10.60。H14.95 X20.005,2=10.60,P0.005 5 5、确定、确定P P值值 本例本例PP0.005 5 5、确定、确定P P值值 本例本例 0.01 P0.005 0.01 P0.005,在,在0.050.05水准上,拒绝水准上,拒绝H0,接受接受H1,故可认为小故可认为小白鼠接种三种不同菌型的伤寒杆菌存白鼠接种三种不同菌型的伤寒杆菌存活日数不同或不全相同。活日数不同或不全相同。6 6、推断结论、推断结论 等级资料多个样本比较秩和检验等级资料多个样本比较秩和检验 表表 9 9.6 6 三三种种病病人人肺肺切切除除术术的的针针麻麻效效果果比比较较
16、 针针麻麻效效果果 肺肺癌癌 肺肺化化脓脓 肺肺结结核核 合合计计 秩秩次次范范围围 平平均均秩秩次次 (1 1)(2 2)(3 3)(4 4)(5 5)(6 6)(7 7)1 10 0 2 24 4 4 48 8 8 82 2 1 1-8 82 2 4 41 1.5 5 1 17 7 4 41 1 6 65 5 1 12 23 3 8 83 3-2 20 05 5 1 14 44 4.5 5 1 19 9 3 33 3 3 36 6 8 88 8 2 20 06 6-2 29 93 3 2 24 49 9.5 5 4 4 7 7 8 8 1 19 9 2 29 94 4-3 31 12 2
17、3 30 03 3.5 5 R Ri i 8 88 81 15 5.5 5 1 17 72 25 54 4.5 5 2 22 27 75 58 8.0 0 -n ni i 5 50 0 1 10 05 5 1 15 57 7 3 31 12 2 -R Ri i 1 17 76 6.3 31 1 1 16 64 4.3 33 3 1 14 44 4.9 96 6 -1 1、建立假设和确定检验水准、建立假设和确定检验水准 H H0 0:三种病人肺切除术针麻效果三种病人肺切除术针麻效果的总体分布相同的总体分布相同 H H1 1:三个总体的位置不同或不全同三个总体的位置不同或不全同 0.050.05
18、2 2、编秩:编秩:(1)(1)计算各等级的合计数计算各等级的合计数 (2)(2)确定秩次范围确定秩次范围 (3)(3)求平均秩次求平均秩次 3 3、求各组的秩和、求各组的秩和RiRi 4 4、计算、计算H H值和校正值和校正HcHc值值 本例本例 H=5.7731H=5.7731 C=1(t3jtj)(N3N)1(3)1(122 NnRNNHii8979.0)312312()1919()8888()123123()8282(133333 43.68979.07731.5 cH 5 5、确定、确定P P值值 本例本例 k k3 3,故以自由度故以自由度v=3-1=2v=3-1=2,查附查附表表
19、8 8,X X2 2界值表界值表:X X2 20.05,20.05,2=5.99,X=5.99,X2 20.025,20.025,2=7.38 =7.38 X X2 20.05,20.05,2 Hc X Hc X2 20.025,2 0.025,2 0.025 P0.05 0.025 P0.05 6 6、推断结论、推断结论 本例本例 0.025 P0.05,0.025 P0.05,在在0.050.05水水准上,拒绝准上,拒绝H0H0,接受,接受H1,H1,故可认为三种病故可认为三种病人肺切除针麻效果有差别(尚需进行两人肺切除针麻效果有差别(尚需进行两两比较)。两比较)。成组设计多个样本两两比较
20、的秩和检验成组设计多个样本两两比较的秩和检验(一)、各样本例数相等时(一)、各样本例数相等时 对例对例9.49.4进行两两比较进行两两比较 1 1、建立假设、建立假设 H0:H0:任两个总体分布相同任两个总体分布相同 H1:H1:任两个总体的位置不同任两个总体的位置不同 0.050.05 2 2、求各对比组秩和的差值求各对比组秩和的差值D D作为检验统作为检验统计量计量 3 3、以样本例数、以样本例数n n和组数和组数k k,查附表查附表1313,D D界值表,确定界值表,确定P P值。值。n=6,组数组数k=3 D0.05(6,3)=43.3,D0.01(6,3)=53.9 表表9.7 9.
21、7 例例9.49.4资料两两比较秩和差数的绝对值资料两两比较秩和差数的绝对值 D=RA-RB各组秩和各组秩和 课前课前21 课中课中92.5 课后课后57.5课前课前21 71.5*36.5课中课中92.5 35.0课后课后57.5 *P0.05/1/112/)1(21,BAknnNNCxD AnBn2,05.0D2,01.0D 一一(9D)二(二(11C)、)、三三(DSC1)=8.40,=18.78,=19.271R2R3R5 5、推断结论、推断结论 一、一、M M检验检验(Friedman(Friedman法法)查表法查表法 5 5名受试者穿名受试者穿5 5种不同的防护服测得的脉搏数(次
22、种不同的防护服测得的脉搏数(次/分)分)防护服防护服A 防护服防护服B 防护服防护服C 防护服防护服D 防护服防护服E编号编号 脉搏脉搏 秩次秩次 脉搏脉搏 秩次秩次 脉搏脉搏 秩次秩次 脉搏脉搏 秩次秩次 脉搏脉搏 秩次秩次 1 130 1 144 5 143 3.5 133 2 143 3.5 2 111 1.5 116 3 119 5 118 4 111 1.5 3 114 3 106 1 115 4 113 2 116 5 4 123 4 98 1 120 3 104 2 133 5 5 115 5 104 2 111 4 110 3 101 1 b 5 5 5 5 5 14.5 12
23、 19.5 13 16 15 15 15 15 15 (-)0.5 3 4.5 2 1 (-)2 0.25 9 20.25 4 1 RiRRRiRiR M M检验方法:检验方法:1 1、将每个伍组编秩,有相同的观察值则、将每个伍组编秩,有相同的观察值则取平均秩次;取平均秩次;2 2、求每个处理组的秩和、求每个处理组的秩和 ;3 3、求平均秩和、求平均秩和 ;=4 4、求、求M M;M=M=5 5、查附表查附表1212,M M界值表,确定界值表,确定P P值。值。iRRR)1(21 kb 2)(RRi H0:穿不同防护服脉搏总体分布相同穿不同防护服脉搏总体分布相同 H1:穿不同防护服脉搏总体分布
24、不同或不全相同穿不同防护服脉搏总体分布不同或不全相同 =0.05=0.05 用用b=5,k=5,b=5,k=5,查附表查附表1212,M M界值表得:界值表得:M0.05=113,M0.05 由于由于P0.05,接受接受H0,尚不能认为穿不同防护尚不能认为穿不同防护服脉搏不同。服脉搏不同。15)15(521 R3.341425.20925.0)(2 RRMi 狗服用阿司匹林后不同时间血中药物浓度(狗服用阿司匹林后不同时间血中药物浓度(r/mlr/ml)狗号狗号 0.5小时小时 1小时小时 6小时小时 8小时小时 24小时小时 48小时小时 1 51.6(3)135.2(4)169.8(6)13
25、7.2(5)31.9(2)0.4(1)2 49.6(3)101.6(4)158.4(6)133.0(5)18.7(2)0.0(1)3 40.6(3)88.4(4)142.8(6)126.6(5)18.1(2)2.0(1)4 11.2(2)37.2(4)131.8(6)130.3(5)17.5(3)0.2(1)5 17.8(2)48.2(4)118.0(5)124.5(6)18.7(3)1.8(1)6 14.4(2)41.6(4)120.8(5)123.5(6)24.8(3)3.0(1)15 24 34 32 15 6 iR二、二、F F检验法检验法 F F检验法方法和步骤:检验法方法和步骤:1
26、 1、将每个伍组编秩,有相同的观察值则取、将每个伍组编秩,有相同的观察值则取平均秩次;平均秩次;2 2、求每个处理组的秩和、求每个处理组的秩和 ;3 3、求所有秩次的平方和、求所有秩次的平方和A A;A=A=若无相同秩次若无相同秩次,则:则:A=A=4 4、计算计算B B值:值:B=B=iR 2ijR6)12)(1(kkbk 21iRb5 5、计算、计算F F值:值:F=F=6 6、确定确定P P值:以值:以 ,查查F F界值表(方差分析用),以计算所界值表(方差分析用),以计算所得得F F值与值与F F界值相比较确定界值相比较确定P P值;值;7 7、推断结论。、推断结论。BAkbkBb 4
27、/)1()1(211 k)1)(1(2 kb H0:狗服药后不同时间血中药物浓度总体分布相同狗服药后不同时间血中药物浓度总体分布相同H1:狗服药后不同时间血中药物浓度总体分布不同狗服药后不同时间血中药物浓度总体分布不同或不全相同或不全相同 =0.05 5466)162)(16(666)12)(1(kkbkA33.540)61532342415(6112222222 iRbB9.8733.5405464/)16(6633.540)16(4/)1()1(22 BAkbkBbF V V1 1=k-1=6-1=5=k-1=6-1=5,V V2 2=(b-1)(k-1)=(6-1)(6-1)=25=(b
28、-1)(k-1)=(6-1)(6-1)=25 查查F F界值表得:界值表得:F F0.01(5,25)0.01(5,25)=3.86=3.86,FFFF0.01(5,25)0.01(5,25),P0.01 P0.01 由于由于P0.01,P0.01,按按 =0.05,=0.05,拒绝拒绝H H0 0,接受接受H H1 1,狗服药后不同时间血中药物浓度不同或不狗服药后不同时间血中药物浓度不同或不全相同。全相同。随机区组设计资料两两比较的秩和检验随机区组设计资料两两比较的秩和检验 方法和步骤:方法和步骤:1 1、列出两两对比组;、列出两两对比组;2 2、求两两对比组秩和之差的绝对值、求两两对比组秩
29、和之差的绝对值、|RA-RB|;3 3、计算检验界值计算检验界值 ;v=(b-1)(k-1)C)1)(1()(2,kbBAbtCv 对例对例9.109.10做两两比较。做两两比较。398.3)16)(16()36.540546(6206.2)1)(1()(225,05.005.0 kbBAbtC598.4)16)(16()36.540546(62787.2)1)(1()(225,01.001.0 kbBAbtC 表表9.11 9.11 各组间的两两比较各组间的两两比较对比组对比组|RA-RB|P 对比组对比组|RA-RB|P1与与3|15-34|=19 0.051与与4|15-32|=17 0
30、.01 3与与5|34-15|=19 0.05 3与与6|34-6|=28 0.011与与6|15-6|=9 0.01 4与与5|32-15|=17 0.012与与3|24-34|=10 0.01 4与与6|32-6|=26 0.012与与4|24-32|=8 0.01 5与与6|15-6|=9 0.012与与5|24-15|=9 0.01 除服药后除服药后0.50.5小时与小时与2424小时,小时,6 6和和8 8小时药物浓度小时药物浓度无差别外,其余时间药物浓度不同。无差别外,其余时间药物浓度不同。狗服用阿司匹林后不同时间血中药物浓度(狗服用阿司匹林后不同时间血中药物浓度(r/mlr/ml)0.5小时小时 1小时小时 6小时小时 8小时小时 24小时小时 48小时小时 15 24 34 32 15 6iR