1、第十章第十章 基于秩次的非参数检验基于秩次的非参数检验(nonparametric test of transformation rank)要求:要求:1.理解并能区别参数性检验与非参数性检验理解并能区别参数性检验与非参数性检验2.掌握配对设计和成组设计的秩和检验掌握配对设计和成组设计的秩和检验3.了解多个样本两两比较的秩和检验了解多个样本两两比较的秩和检验4.掌握秩和检验的掌握秩和检验的SPSS统计程序操作统计程序操作参数检验与非参数检验参数检验与非参数检验参数检验(parametric test):在已知总体分布类型的基础上,对总体参数进行估计和检验。非参数检验(nonparametric
2、 test):总体分布类型未知,或非精确测量资料,或参数检验的条件得不到满足时,对资料的分布规律及特征进行统计推断。秩和检验、卡方检验、游程检验、序贯检验和Ridit分析都是非参数检验。参数检验与非参数检验的优缺点参数检验与非参数检验的优缺点 非参数检验的主要优点优点是对资料的要求不象参数检验那样严,适合处理非正态、方差不齐,以及分布类型不明确等资料。其次,有些问题本身还没有适当的参数检验方法可用,而非参数检验法则能予以处理。非参数检验的不足不足之处是,由于它对原始数据所包含的信息利用不充分,检验效率就低了。尤其是对适宜用参数检验法处理的资料,若用非参数法分析,一般犯第二类错误的概率比参数检验
3、大。故适宜用参数检验法的资料,应首选参数检验法。非参数检验适用对象非参数检验适用对象1.等级资料等级资料2.偏态资料偏态资料3.分布类型未知分布类型未知4.多组资料的变异度大,方差不齐,且不易变换达到齐性多组资料的变异度大,方差不齐,且不易变换达到齐性5.初步分析初步分析第一节第一节 单样本和单样本和 配对设计资料的符号秩和检验配对设计资料的符号秩和检验一、单样本资料的符号秩和检验一、单样本资料的符号秩和检验-Wilcoxon-Wilcoxon法法例例10-1 已知某地正常人尿铅含量的中位数为2.50mol/L。今对该地随机抽取16名工人,测得尿铅含量见表10-1。问该厂工人的尿铅含量是否高于
4、当地正常人?不是均数x表10-1 18名工人测得尿铅含量与2.50的比较(mol/L )编号编号尿氟含量尿氟含量(2)2.50秩次秩次编号编号尿氟含量尿氟含量(2)2.50秩次秩次(1)(2)(3)(5)(1)(2)(3)(5)10.62-1.88-1293.130.63720.78-1.72-10103.270.77832.13-0.37-5113.541.04942.48-0.02-1124.381.881252.540.042134.381.881262.680.183145.052.551472.730.234156.083.581583.010.5161611.278.7716H0:
5、该厂工人尿铅含量与正常人基本一致:该厂工人尿铅含量与正常人基本一致H1:该厂工人尿铅含量高于正常人:该厂工人尿铅含量高于正常人 单侧单侧=0.05当差值等于当差值等于0时,去掉该点。时,去掉该点。T+=108 T-=28(1)查表法()查表法(5 n50时)时)例例10-1的分析的分析 本例资料正态性检验本例资料正态性检验W=0.809,P=0.0036,即尿铅含量不服,即尿铅含量不服从正态分布,不宜用从正态分布,不宜用t检验。检验。本例本例 n=16,T=28(单侧),当(单侧),当=0.05时查表时查表9。结果:。结果:T=28(35,101),所以),所以P0.05,拒绝拒绝H0,可认为
6、该厂工人的尿铅含量高于当地正常人。可认为该厂工人的尿铅含量高于当地正常人。(2)正态近似法()正态近似法(n 50时)时)24/)12)(1(5.04/)1(nnnnnTZ 式中0.5是连续性校正值。因为T值是不连续的,而Z分布是连续的,这种校正影响甚微,常可省去。当相同“差值”(指绝对值)较多时(不包括差值为0者),改用校正公式:48)(24)12)(1(5.04/)1(3jjjttnnnnnTZ 式中tj 为第j个相同差值的个数。假定在差值中有2个1.5,3个6,5个13,则t1=2,t2=3,t3=5,(tj3-tj)=(23-2)+(33-3)+(53-5)=150 二、配对设计资料的
7、符号秩和检验二、配对设计资料的符号秩和检验 主要用于配对资料的检验(H0:差值总体中位数Md=0),其方法步骤如下:1.求差值:求各对数据(xi,yi)的差值 di=xi-yi 2.编秩:依差值的绝对数大小从小到大编秩,再根据差值的正、负给 秩冠以正负号。编秩时,若差值为0,弃去不计;若遇有差值的绝对值相等,取其平均秩次。3.求秩和并确定检验统计量T:分别求正、负秩次之和,记作T+和T-,并 以绝对值较小者为T值4.确定P值和作出结论:当配对数n50时,查配对设计T界值表,T在界内,P;T在界外,P .当配对数n50时,可用正态近似法的Z检验例10-2表10-2 电极法和分光光度法测定氟离子浓
8、度编号电极法分光光度法差数秩次(1)(2)(3)(4)=(3)-(2)(5)110.58.81.74221.618.82.89314.913.51.43430.227.62.6858.49.1-0.7-1.567.77.00.71.5716.414.71.75819.517.22.369127.0155.0-28.0-101018.716.32.47119.59.50.0-合计合计T+=43.5 T-=11.5 例例10-2 对11份工业污水测定氟离子浓度(mg/L),每份水样同时采用电极法和分光光度法测定。资料见表(2)、(3)。推断不同方法测定结果有无差别?(1 1)查表法)查表法(5 n
9、0.05,不拒绝,不拒绝H0,认为两法测定结果没有显著性差异。,认为两法测定结果没有显著性差异。(2)正态近似法)正态近似法Z检验统计量检验统计量(当配对数n50时)24/)12)(1(5.04/)1(nnnnnTZ 式中0.5是连续性校正值。因为T值是不连续的,而Z分布是连续的,这种校正影响甚微,常可省去。当相同“差值”(指绝对值)较多时(不包括差值为0者),改用校正公式:48)(24)12)(1(5.04/)1(3jjjttnnnnnTZ 式中tj 为第j个相同差值的个数。假定在差值中有3个4,5个2,2个7,则t1=3,t2=5,t3=2,(tj3-tj)=(33-3)+(53-5)+(
10、23-2)=150 Wilcoxon 配对法基本思想配对法基本思想 本法的基本思想基本思想是假定两种处理结果的效应相同,即差值之总体分布是对称的(H0:Md=0),总体中位数为0;同理,假定某种处理无作用,则 每一受试对象处理前后所得结果之差值的总体中位数亦为0。如果假设成立,则样本的正、负秩和应比较接近;若正、负秩和相差悬殊,则假设成立的可能性也小。第二节第二节 完全随机设计两个独立样本比较的秩和检验完全随机设计两个独立样本比较的秩和检验 主要用于成组比较资料的检验,其方法步骤如下:主要用于成组比较资料的检验,其方法步骤如下:1.编秩 在原假设“H0:两总体分布相同”下,将两组数据混合由小到
11、大统一编秩。编 秩时如遇有原始数据相同的,则取它们的平均秩次。2.求秩和并确定检验统计量 当两样本例数不等时,以样本例数小者为n1,其秩和为 统计量T;若n1=n2时,可任取一组的秩和为统计量T。3.确定P值和作出结论 当n110,n2-n110时,查成组设计T界值表(附表10)T在界内,P;T在界外,P .当n110 或 n2-n110时,可用正态近似法的Z检验一、定量资料两组独立样本的秩和检验一、定量资料两组独立样本的秩和检验例例10-3 用两种药物杀灭钉螺,每批用200300只活体钉螺,用药后清点钉螺的死亡数,并计算死亡率(%)。问两种药物杀死钉螺的效果有无差别?甲药甲药乙药乙药 死亡率
12、(死亡率(%)死亡率(死亡率(%)32.516.035.522.540.526.040.528.549.032.549.538.051.540.5n1=7n2=7一、定量资料两组独立样本的秩和检验一、定量资料两组独立样本的秩和检验编秩:编秩:甲药甲药乙药乙药 死亡率(死亡率(%)秩次秩次死亡率(死亡率(%)秩次秩次32.55.516.0135.5722.5240.51026.0340.51028.5449.01232.55.549.51338.0851.51440.510n1=7T1=71.5n2=7T2=33.5(1 1)查表法)查表法(当n110,n1-n2 10时)例例10-310-3分
13、析分析H0:两种药物杀死钉螺的效果无差别:两种药物杀死钉螺的效果无差别 =0.05 统计量统计量 T=33.5 查表查表10 本例本例n1=7,n1-n2=0,当当=0.05时(双侧)时(双侧),T=33.5(36,69),),所以所以P10,或 n1-n2 10时)12/)1(2/)1(211NnnNnTZ 式中N=n1+n2 当相同秩次较多时(25%),改用校正公式:)()(1,33NNttCCZZjjc 式中tj 为第j个相同秩次的个数。二、两组有序变量资料的秩和检验二、两组有序变量资料的秩和检验例例10-4 某地居民夏冬两个季节体内核黄素营养状况比较某地居民夏冬两个季节体内核黄素营养状
14、况比较状况例数夏季冬季合计缺乏102232不足141832适宜16420合计404484二、两组有序变量资料的秩和检验二、两组有序变量资料的秩和检验001.0,2103.38761.00048.38761.0848420203232323210048.312/)184(44405.02/)184(4020363333PCZZCZc编秩:编秩:状况例数秩次范围 平均秩次秩和夏季冬季合计夏季冬季缺乏=110223213216.5165363不足=2141832326448.5679873适宜=316420658474.51192298合计404484-20361534第三节第三节 多组独立样本比较
15、的秩和检验多组独立样本比较的秩和检验1.编秩 在原假设“H0:多总体分布相同”下,将各组数据混合由小到大统一编秩。编 秩时如遇有原始数据相同的,则取它们的平均秩次。2.求秩和 求每组秩次总和(Ri),i表示第i组。3.计算统计量H值(Kruskal-Wallis))1(3)(2)1(12NHiinRNN式中ni为样本量,N=ni 为样本总量,当各样本相同秩次较多(25%)时,应用校正统计量Hc)()(1,33NNttCCHHjjc4.确定P值和作出推断结论 当组数k=3,每组例数5时,查H界值表(附表11)得出P值;当最小样本例数大于5,则H近似服从v=k-1的2 分布,由2 界值表确定P值。
16、一、定量资料多组独立样本的秩和检验一、定量资料多组独立样本的秩和检验例例10-5 某医院用3种不同方法治疗15例胰腺癌患者,每种方法治疗5例。治疗后生存月数见表。问3种方法对胰腺癌患者疗效有无差别?甲法甲法乙法乙法丙法丙法生存月数生存月数生存月数生存月数生存月数生存月数362493710581278138一、定量资料多组独立样本的秩和检验一、定量资料多组独立样本的秩和检验 编秩:编秩:甲法甲法乙法乙法丙法丙法生存月数生存月数秩次秩次生存月数生存月数秩次秩次生存月数生存月数秩次秩次32.566214491232.577.5101355810121477.58101315810Ri34-60-26
17、Ni5-5-532.611535265605341151512)1(3)(222)1(122NHiinRNN 求统计量求统计量:H界值表界值表确定确定P值值解解:H0:3种方法治疗后患者生存月数的总体中位数相等 H1:3种方法治疗后患者生存月数的总体中位数不等 =0.0532.6H本例本例k=3,k=3,n ni 5 5,查表,查表1111,H H0.05=5.78=5.78,所以所以P0.05P0.05。可认为可认为3 3种方法治疗后患者生存月数的总体中位数不等。种方法治疗后患者生存月数的总体中位数不等。近似法近似法(当超出H界值表时)22)1(121)1(3)(2HkHNHiinRNN即)
18、(2二、有序变量多组独立样本的秩和检验二、有序变量多组独立样本的秩和检验例例10-6 某医院用3种方法治疗478例慢性喉炎,资料见表。问3种方法治疗慢性喉炎的疗效有无差别?疗效等级疗效等级(1)甲法甲法(2)乙法乙法(3)丙法丙法(4)合计合计(5)无效无效24202064好转好转26162264显效显效722414110痊愈痊愈1863222240二、有序变量多组独立样本的秩和检验二、有序变量多组独立样本的秩和检验编秩:编秩:疗效等级疗效等级(1)甲法甲法(2)乙法乙法(3)丙法丙法(4)合计合计(5)秩次范围秩次范围(6)平均秩次平均秩次(7)无效无效2420206416432.5好转好转
19、261622641512896.5显效显效722414110129238183.5痊愈痊愈1863222240239478358.5合计合计3089278478-Ri831821807013229114481-270.07196.41169.60239.50iR例例10-6分析分析)1(3)(2)1(12NHiinRNN011.44147837813229921807030883182147847812222H 856.047847824024011011064646464133333c种方法的效果有差别。可认为)(查表,3,05.099.52,2141.51205.0PkCHHC三、多个独立
20、样本间的多重比较三、多个独立样本间的多重比较 主要用于当经过多个样本比较的秩和检验拒绝H0,认为各总体分布不同或不完全相同时,常需作两两比较的秩和检验,以推断哪两个总体分布相同或不同。方法有:方法有:扩展的扩展的t检验检验 Nemenyi法检验法检验 q检验检验 几种方法理论上仍存在争议,故几种方法理论上仍存在争议,故SASSAS、SPSSSPSS等软件没有提等软件没有提供这方面的分析。供这方面的分析。扩展的扩展的 t 检验法检验法kNnnkNHNNNRRtjiji111211例例10-7对例10-6资料做三个样本间的两两比较对比组tP甲组与乙组73.664.7420.001甲组与丙组100.476.0620.10jiRR60.169781322941.196921807007.27030883182333222111nRRnRRnRR丙组:乙组:,甲组:其中: