1、4.5 Friedman 检验2FriedmanFriedmanFriedman检验又称检验或两因素秩方差分析.1937FriedmanKendallSmith它是由于年提出的,后来又被和发展到多元度量的协同系数相关问题上.它是针对完全区组设计而提出的检验方法.Friedman对于随机区组的数据,传统的方差分析要求试验误差是正态分布的,当数据不符合方差分析的正态前提时,建立采用秩方差分析法.Friedman检验对试验误差没有正态分布的要求,仅仅依赖于每个区组内所观测的秩次.12,kFriedmank 检验的问题是个样本的位置参数(用)表示 是否相等.kknknk个样本是匹配的,可以由个条件下同
2、一组受试者构成,也可以将受试者分为组,每组均有个匹配的受试者,随机地将组受试者置于个条件下.在不同受试者匹配的样本中,应尽量使不同受试者的有关因素匹配即相似.假设检验问题:0121:.:.kHH不是所有的位置参数都相等1. 建立假设检验建立假设检验2. 选择检验统计量选择检验统计量01HkHk或者说,提出假设:个样本间无显著差异.:个样本间有显著差异. Friedman 检验所分析的数据应是定序尺度测量.kn获得的数据排出一个行列的表,列代表不同的受试者或匹配的受试小组,行代表各种条件(处理). Friedman 检验的实质是符号检验推广到多个处理的比较问题.Friedman由于区组的影响,检
3、验首先在每一个区组中计算各个处理的秩,再把每一个处理在各区组中的秩相加.11,2, .ijbiijjRjiRRik表示在第个区组中 处理的秩,则秩按照处理而求得的(行)和为,.注: 由于区组的影响,不同区组中的秩没有可比性.但是,如果按照不同的区组收集数据,那么同一区组中的不同处理之间的比较时有意义的比如,同个年龄段中比较药品的疗效比不分年龄来比较疗效要合理.因此,首先应在每一个区组内分配各处理的秩,从而得到秩数据表.随机化完全区组设计的秩数据表随机化完全区组设计的秩数据表 区组处理12b秩和Ri.1R11R12R1bR12R21R22R2bR2kRk1Rk2RkbRk秩和R.jk(k+1)/
4、2k(k+1)/2k(k+1)/2k(k+1)/2bk(k+1)/211,2, .ijbiijjRjiRRik其中表示在第个区组中处理的秩,(行)和,0H如果为真,则每一行中秩的分布应该是随机的,即各个秩出现在所有行中的频数应几乎相等.iiRRb在零假设成立的情况下,各处理的平均秩有下述性质2111,(),(,).21212iiijkkkE RD RCov RRb KruskalWallis接下来的做法与检验相同.22221111221()()(1),41.2kbkkiiiijiikiiSStRRbRRRbRbkRbk kbkR其中SSt计算处理平方和()MST计算总均方()211222111
5、()1211116411.12kbijijijkbijijVar RMSTSSTbkRRbkbk kkbk kRRbkbkbkkk2211112123 (1).(1)2(1)kkijjjb kQRRb kbk kbk kFriedman检验统计量为:22(1)1.QkkQ渐近服从自由度为的分布即.1FriedmankQQk建议用乘得校正式22112(1)4 .(1)(1)kiiijQSStFriQRbbk kkkedmanVar R 检验统计量为:3. 作出决策作出决策.1kbQWb k和 ,有零假设下的分布表可查,查的时对候要作变换于有限的22(.1).1Qkkkb 当查不到时,可用自由度为
6、的分布近似对于固定的 ,当时,在零假设下有201002.(1)1(31)2QHkHQkHHkQk检验步骤:()提出假设:个样本间无显著差异.:个样本间有显著差异.( )计算检验统计量( )作出决策当时,在水平上拒绝;当时,不能拒绝.4. 小结小结3,112,.()1(1)ckbi ji jiji jQQbk kQji当数据有相同秩时,秩取平均值,在某区组存在结时,此时需要对统计量进行修为第个区组的第 个结正:其中统计量 .2(1)1cQkk修正后统计量的数学期望等于,仍然服从分布.200.(1).HQkH,则拒绝不若实测反之拒绝cQQ的小样本零分布无表可查,但是其零分布的极限分布与一样.4.2
7、,(3)(4)A B Ckb例在不同的城市对不同的人群进行血液中铅含量的测试,一共有三个城市,代表着三种不同的处理.对试验者按职业分成四组取血.他们血铅含量如下表所示: 区组(职业)处理(城市)IIIIIIIVA801005165B52765253C405234350.05.不同汽车密度的城市居民的试判断血铅含对于显著性水平量是否一样, 区组(职业)处理(城市)IIIIIIIVRiA80(3)100(3)51(2)65(3)11B52(2)76(2)52(3)53(2)9C40(1)52(1)34(1)35(31)4()在表中加上各处理在每个区组 职业 中的秩,得340.8154 316.5.
8、QkbWQ由此算出,对,于和0.04170.8125.0.81250.0417.0.0417cP Wp此时查表得到相应于的临界值即也是值01231:.HH解:建立假设检验不是所有的位置参数都相等 220.0388.p按照近似值为,比上,到面的小一点得0.0.5也就是说,不同汽车密度的城市居民的对于水平,可以血铅含量的确拒绝零设不一样假1410例 某田径队对新入队的学员要进行四个部分的技术训练,以提高学员的身体素质。为检验这四个部分的技术训练是否确实有效,随机抽选了名新学员,分别接受四个部分的训练。每个训练结束后,均进行该部分的测试,成绩以分为最高。检测结果如下表所示:ABCD123456789
9、101112131410246357610853463510344101059455569310106637724108848467556667910技术训练等级学员编号试问在5%的显著性水平下四个部分技术训练的有效性有无显著差异?011HH解:()建立假设: 四个部分技术训练的有效性无显著差异: 四个部分技术训练的有效性有显著差异.2Q( )计算检验统计量学员编号技术训练A技术训练B技术训练C技术训练D123456789101112131441231233433112134121441423412414432132124332323412214434合计33333638()iR222212(
10、33333638 )3 14(41)0.7714144(41)Q 220(41)7.82(41.)3HQ( )作出决策所以不能拒绝表明四个技术训练的有效性没有显,而,著差异.Q计算检验统计量0.05练习: 根据下列资料,检验三种培训方案的有效性有无显著差异.学生组学生组方案方案A方案方案B方案方案C123456789101112131415161718112321122211111111323213231133232.5222231132313322322.5333Hollandre-Wolfe 两处理间的比较两处理间的比较当秩方差分析结果显示处理间存在差异时,(或者想知道某两个处理的比较时)
11、197.3ijijHollandrDRRSeWolfeE()提出两处理间的比较公式:ijRRij其中,分别表示第 样本与第样本(处理)的秩和22(1)(1)2121(1) / 6ijkkkSEVar bRbbkbbk k31()(1)66(1).giiiibbk kSEkg若有相同秩,则其中为同秩观测值个数,为同秩组数*1-*Z(1).ijDk k当实测数值,表示两处理间有差异,反之则无差异.其中时0.ijHijRR如果零假设为 处理和处理没有区别,那么,双边检验的统计量为*2*2(1),/ 6(1) 2.ijRRZbk kk kZ对于置信水平,如果,则拒绝零假设,这里总共可比较的对数为标准正
12、态分布分位数.Friedman 秩和检验的一大样本时基个方法于或者称之为成对处理的比较成对处理的比较显然这个检验很保守,也就是说,很不容易拒绝零假设.设来自四个地区的四名厨师制作名菜水煮鱼,四位美食专家评分结果如下表.专家(区组)地区(处理)ABCD185828279287758682390818076480758175试比较四个地区的四名厨师制作名菜水煮鱼的品质是否相同.Freidman由于不同评委在口味和美学欣赏上存在差异,因此适合用检验方法比较.0144HH解:假设检验问题:个地区的京城水煮鱼品质相同.:个地区的京城水煮鱼品质不同.专家(区组)地区(处理)ABCD1854822.5822.5791287475186382239048138027614803751.5814751.5秩和15811.55.521222232,1121123 (1)(1)12(15811.55.5 )3457.725,4457.7258.1316.121()44(41)1(1)kjjakbi ji jijStepQRn kbk kQQbk k 20.058.131637.82aQ结论一:实际测量,接受备择假设,即四个地区的水煮鱼在品质上存在显著差异.