1、3.4 Wilcoxon3.4 Wilcoxon符号秩检验符号秩检验符号检验只利用了样本差异方向上的信息,并没有考虑符号检验只利用了样本差异方向上的信息,并没有考虑差别的大小。差别的大小。本节的方法弥补了符号检验的不足。本节的方法弥补了符号检验的不足。3.4 Wilcoxon3.4 Wilcoxon符号秩检验符号秩检验本节的主要目的本节的主要目的:研究单峰对称分布的原因研究单峰对称分布的原因:研究单峰对称分布研究单峰对称分布1)1)不对称的单峰数据可通过变换化为对称的不对称的单峰数据可通过变换化为对称的2)2)多峰分布通过混合分布整体表示后多峰分布通过混合分布整体表示后,每一个分布也每一个分布
2、也可以用单峰堆成的分布表示可以用单峰堆成的分布表示一一 基本概念基本概念对称分布的对称中心一定是总体的中位数之一对称分布的对称中心一定是总体的中位数之一对称分布时,对称中心只有一个,而中位数不一定对称分布时,对称中心只有一个,而中位数不一定SoSo,对称中心比中位数更有意义。,对称中心比中位数更有意义。l对称中心是中位数,则对称中心两侧数据量应各一半对称中心是中位数,则对称中心两侧数据量应各一半l对称中心两侧数据分布应相同对称中心两侧数据分布应相同l若对称分布的中位数是唯一的,则中位数是对称中心,若对称分布的中位数是唯一的,则中位数是对称中心,此时中位数与期望是一致的。此时中位数与期望是一致的
3、。SoSo,只考虑数据符号是不够的,作为刻画数据中心位置,只考虑数据符号是不够的,作为刻画数据中心位置的对称中心,要求数据在两侧的疏密情况是对称的的对称中心,要求数据在两侧的疏密情况是对称的WilcoxonWilcoxon符号秩统计量的思想:符号秩统计量的思想:WilcoxonWilcoxon符号秩检验原理以及性质符号秩检验原理以及性质 如果数据关于如果数据关于0 0点对称,那么对称中心两侧的数据疏密程点对称,那么对称中心两侧的数据疏密程度应该一样,取正值数据在绝对值样本中的秩和与取负值在绝度应该一样,取正值数据在绝对值样本中的秩和与取负值在绝对值样本中的秩和相近。对值样本中的秩和相近。用用
4、表示表示 在绝对值样本中的秩,在绝对值样本中的秩,WilcoxonWilcoxon符号秩统计量定符号秩统计量定义为:义为:jRj|x|njjj 1WR I(X0)正等级的总和即正秩次总和正等级的总和即正秩次总和 负等级的总和即负秩次总和负等级的总和即负秩次总和njjj 1WR I(X0)正等级和负等级的总和是正等级和负等级的总和是n(n+1)/2n(n+1)/2例例3.113.11 如果样本值:如果样本值:9,13,-7,10,-18,49,13,-7,10,-18,4,计算符号秩统计,计算符号秩统计量。量。njjj 1WR I(X0)354 1 13 X1X2X3X4X5X6913-710-
5、184|X1|X2|X3|X4|X5|X6|R1+=3R2+=5R3+=2R4+=4R5+=6R6+=1在零假设情况下可以计算在零假设情况下可以计算WilcoxonWilcoxon符号秩统计量的精符号秩统计量的精确分布。确分布。WilcoxonWilcoxon符号秩和检验例子,并与符号检验比较符号秩和检验例子,并与符号检验比较01H:320,H:320 解:解:c(310,350,370,377,389,400,415,425,440,295,325,c(310,350,370,377,389,400,415,425,440,295,325,296,250,340,298,365,375,36
6、0,385)296,250,340,298,365,375,360,385)10305057698095105 12025-+-2710121416171819652470202245554065+-+-+1515 34911813iRi|X320|iWiRi|X320|使用WilcoxonWilcoxon符号秩检验法符号秩检验法计算如下:例例3.123.12用R的内置函数计算格式:wilcox.test(x,y=NULL,alternative=two.sided,mu=0,paired=F,exact=T,correct=T)alternativealternative two.sided
7、“or greater or less mumu X分布的中心位置pairedpaired 是否是配对 exactexact 使用W+的精确分布correctcorrect 使用正态近似例例3.123.1219可编辑可编辑 ssn wilcox.test(ss-320)Wilcoxon signed rank testdata:ss-320V=158,p-value=0.009453alternative hypothesis:true location is not equal to 0例例3.123.12S14,S5,n19,p0.06360.01 如果采用如果采用binombinom符号
8、检验法,即计算符号检验法,即计算Y Yi i=IXi320,=IXi320,S S+=SUM(Y=SUM(Yi i)(操作见下页操作见下页)结论:在结论:在10%10%显著性水平下拒绝显著性水平下拒绝H H0 0。WilcoxonWilcoxon符号秩检验采用了比符号检验更多的信息,一符号秩检验采用了比符号检验更多的信息,一般地,可以得到比较好的结果。般地,可以得到比较好的结果。但如果假定了总体分布的对称性,如果对称性不成立,则使但如果假定了总体分布的对称性,如果对称性不成立,则使用符号检验的结果更可靠。用符号检验的结果更可靠。01H:P0.5,H:P0.5例例3.123.12在配对样本的应用
9、在配对样本的应用 例例:新配方是否有助于防晒黑:新配方是否有助于防晒黑 某防晒美容霜制造者,欲了解一种新配方是否有助于防晒黑,对7个志愿者进行了试验。在每人脊椎一侧涂原配方的美容霜,另一侧涂新配方的美容霜。背部在太阳下暴晒后,按预先给定的标准测定晒黑程度如表 x=c(42,51,31,61,44,55,48)x=c(42,51,31,61,44,55,48)y=c(38,53,36,52,33,49,36)y=c(38,53,36,52,33,49,36)wilcox.test(y-x,alternative=less)wilcox.test(y-x,alternative=less)符号检验
10、与符号检验与WilcoxonWilcoxon符号秩检验的联系符号秩检验的联系:1 1区别区别(1)(1)符号检验仅使用各个观察值和中位数差值或配对样符号检验仅使用各个观察值和中位数差值或配对样本差值与中位数差值方向上的信息,而没有考虑差值的大本差值与中位数差值方向上的信息,而没有考虑差值的大小。由于其位置对称,从而导致符号提供信息的对称,导小。由于其位置对称,从而导致符号提供信息的对称,导致结论的对称性,显然结论是不科学的。致结论的对称性,显然结论是不科学的。(2)(2)符号秩检验不仅利用差值方向上的信息,还利用了符号秩检验不仅利用差值方向上的信息,还利用了差值大小的信息,因此,它提供的信息量
11、要多于符号检验。差值大小的信息,因此,它提供的信息量要多于符号检验。关于两种检验的功效有过不少的研究和报道,有兴趣的读关于两种检验的功效有过不少的研究和报道,有兴趣的读者可以去阅读有关书籍。在大多数情况下者可以去阅读有关书籍。在大多数情况下WilcoxonWilcoxon符号秩符号秩检验应该被优先使用。检验应该被优先使用。2 2共同点共同点(1)(1)符号检验和符号秩检验都是非参数检验,都能运符号检验和符号秩检验都是非参数检验,都能运用于单一观察的数据或配对观察数据的差,都能用于用于单一观察的数据或配对观察数据的差,都能用于总体中位数或差值总体的推断。总体中位数或差值总体的推断。(2)(2)它
12、们对总体所要求的假定都是极小的。对符号检它们对总体所要求的假定都是极小的。对符号检验来说,是总体连续;对符号秩检验来说,再增加一验来说,是总体连续;对符号秩检验来说,再增加一个关于中位数对称。个关于中位数对称。(3)(3)这两种检验数据测量层次的要求都不高。普通的这两种检验数据测量层次的要求都不高。普通的符号检验被使用于两分类总体,类似于回答符号检验被使用于两分类总体,类似于回答“是是”或或“不是不是”的问题,可用于定类尺度的测量,但要求差的问题,可用于定类尺度的测量,但要求差异的方向能够被表示出;符号秩检验至少要求定序尺异的方向能够被表示出;符号秩检验至少要求定序尺度测量,仅当等级和符号能够
13、被表示出时。由于两个度测量,仅当等级和符号能够被表示出时。由于两个检验都与符号有关,因而处理检验都与符号有关,因而处理0 0差值的方法是共同的,差值的方法是共同的,均被忽略不计。均被忽略不计。3 3与学生与学生t t检验的比较检验的比较 如果总体分布是对称性的,且方差已知,那么符号检验、符如果总体分布是对称性的,且方差已知,那么符号检验、符号秩检验、学生号秩检验、学生t t检验都可以被选择使用,因为在对称性分布情况检验都可以被选择使用,因为在对称性分布情况下,均值与中位数相等。然而,学生下,均值与中位数相等。然而,学生t t检验是建立在正态分布假设检验是建立在正态分布假设基础上,这是一个比对称
14、性假设严格得多的假定条件。当样本数基础上,这是一个比对称性假设严格得多的假定条件。当样本数据的正态假定可靠,学生据的正态假定可靠,学生t t检验作为一种最强有力的方法可被优先检验作为一种最强有力的方法可被优先选择。但当下列情况之一发生时,非参数检验的方法要优于参数选择。但当下列情况之一发生时,非参数检验的方法要优于参数检验方法。检验方法。(1)(1)样本数目很小;样本数目很小;(2)(2)作为一组数据的处理,样本的中位数似乎比均值更可靠;作为一组数据的处理,样本的中位数似乎比均值更可靠;(3)(3)对于所研究的问题来说,中位数是比均值更有代表性的位置对于所研究的问题来说,中位数是比均值更有代表
15、性的位置参数;参数;(4)(4)总体很少或者几乎没有一个概率分布总体很少或者几乎没有一个概率分布(对符号秩检验仅需要一对符号秩检验仅需要一个对称性假定个对称性假定);(5)(5)总体分布未知,但几乎很少类似于正态。总体分布未知,但几乎很少类似于正态。a=c(62,70,74,75,77,80,83,85,88)a=c(62,70,74,75,77,80,83,85,88)walsh=NULLwalsh=NULLfor(i in 1:length(a)-1)for(i in 1:length(a)-1)for(j in(i+1):length(a)for(j in(i+1):length(a)walsh=c(walsh,(ai+aj)/2)walsh=c(walsh,(ai+aj)/2)walsh=c(walsh,a)walsh=c(walsh,a)NW=length(walsh)NW=length(walsh)median(walsh)median(walsh)77.577.536可编辑可编辑