1、第4章-多样本的非参数检验v如果如果k(2)个样本是按某种或者某些条件)个样本是按某种或者某些条件匹配的,那么匹配的,那么k个样本称为相关的,否则为独个样本称为相关的,否则为独立的。立的。K个相关和独立样本的差别与两个相个相关和独立样本的差别与两个相关和独立样本之间的差别类似。关和独立样本之间的差别类似。v多样本的问题是统计中最常见的一类问题。多样本的问题是统计中最常见的一类问题。主要涉及如何检验主要涉及如何检验n种不同方法、决策或试种不同方法、决策或试验条件(称为处理)所产生的结果是否一样验条件(称为处理)所产生的结果是否一样等问题,可以使用等问题,可以使用Kruskal-Wallis秩和检
2、验、秩和检验、卡方检验、正态记分检验、卡方检验、正态记分检验、Jonkheere-Terpstra检验、检验、Cochran Q检验、检验、Friedman检验等非参数检验方法。本章仅介绍其中的检验等非参数检验方法。本章仅介绍其中的最常用、重要的检验方法。最常用、重要的检验方法。复习:方差分析的基本思想复习:方差分析的基本思想组间方差组间方差1rSSAMSA组内方差组内方差rnSSEMSEv如果因素如果因素A的不同水平对结果没有影响,那么在组的不同水平对结果没有影响,那么在组间方差中只包含有随机误差,两个方差的比值会接间方差中只包含有随机误差,两个方差的比值会接近近1v如果不同水平对结果有影响
3、,组间方差就会大于组如果不同水平对结果有影响,组间方差就会大于组内方差,组间方差与组内方差的比值就会大于内方差,组间方差与组内方差的比值就会大于1v当这个比值大到某种程度时,就可以说不同水平之当这个比值大到某种程度时,就可以说不同水平之间存在显著差异,或者说因素间存在显著差异,或者说因素A对结果有显著影响。对结果有显著影响。F=组间方差和组内方差组间方差和组内方差组间离差平方和组内离差平方和riixxmSSA12)(rimjiijxxSSE112)(组间方差组间方差1rSSAMSA组内方差组内方差rnSSEMSE受因素受因素A和和 随随机机因素的影响因素的影响只受随机只受随机因素的影响因素的影
4、响多样本的非参数检验方法多样本的非参数检验方法vKruskal-Wallis检验(检验(K个独立样本)个独立样本)v多样本的多样本的 检验(检验(K个独立样本)个独立样本)vFriedman检验(检验(K个相关样本)个相关样本)vCochran Q检验(检验(K个相关样本)个相关样本)24.1 Kruskal-Wallis检验检验vKruskal-Wallis检验译为克拉夏尔检验译为克拉夏尔-瓦里斯检验,简称克氏检验。它是瓦里斯检验,简称克氏检验。它是1952年由年由Kruskal和和Wallis两人提两人提出的,是两个独立样本出的,是两个独立样本Mann-Whitney-Wilcoxon检验
5、的一种推广。检验的一种推广。4.1.1 基本思路与检验步骤基本思路与检验步骤v今要研究今要研究k个总体的分布是否相同,需要的数个总体的分布是否相同,需要的数据是据是k个独立的随机样本,其大小为个独立的随机样本,其大小为 样本独立地分别从各自的总体中抽取,总体样本独立地分别从各自的总体中抽取,总体分别具有连续的累积概率分布分别具有连续的累积概率分布 。数据的测量层次至少在定序尺度上。数据的测量层次至少在定序尺度上。vK-W检验前提是假定总体连续,除位置参数检验前提是假定总体连续,除位置参数不同外,分布相似。不同外,分布相似。knnn,.,21)(),.,(),(21xFxFxFk完全随机化设计数
6、据形态总体总体1总体总体2总体总体k重重复复R11R21Rn11R12R22Rn22.R1kR2kRnkk完全随机化设计数据的秩总体总体1总体总体2总体总体k重重复复x11x21xn11x12x22xn22.x1kx2kxnkk 为检验零假设,我们需要构造一个检验统计为检验零假设,我们需要构造一个检验统计量。方法是将所有数据按从小到大的顺序合并成量。方法是将所有数据按从小到大的顺序合并成一个单一的样本,其大小一个单一的样本,其大小 。将每。将每一个观察值给出一个等级即评秩,秩为整数,从一个观察值给出一个等级即评秩,秩为整数,从1到到N。对于。对于N个观察值来说,平均等级是个观察值来说,平均等级
7、是knnnN.21212)1(.21NNNNNNv对于含有对于含有 个观察值的第个观察值的第j个样本来说,等级总和个样本来说,等级总和的期望值是的期望值是 ,若以,若以Rj表示第表示第j个样本的实际等个样本的实际等级总和,则级总和,则 就表示就表示k个样本中第个样本中第j个样本等个样本等级总和与其均值的偏差。级总和与其均值的偏差。v如果如果H0为真,所有样本数据混合排列成一个单一为真,所有样本数据混合排列成一个单一的随机样本,等级即秩次应该在的随机样本,等级即秩次应该在k个样本之间均匀地个样本之间均匀地分布,各组中分布,各组中Rj的平均值差别不大,即各样本实际的的平均值差别不大,即各样本实际的
8、等级总和即秩次和等级总和即秩次和Rj与期望等级总和与期望等级总和 之间的之间的偏差应很小。偏差应很小。2/)1(Nnj2/)1(Nnj2/)1(NnRjjjnvKruskal-Wallis检验定义的统计量就是建立检验定义的统计量就是建立在实际等级总和在实际等级总和Rj与期望等级总和与期望等级总和 的的偏差的基础之上的。它定义为偏差的基础之上的。它定义为H,计算公式,计算公式为:为:2/)1(NnjMSTSSAH:总均方离差平方和:处理间离差平方和MSTSSAv严格地讲,v其中222211(1)/211()kkjjjjjjjR n NSSAHn R RM ST SnS22112211221()1
9、111(1)(21)(1)164+1)iinkijijnkijijSMSTRRNRNRNN NNN NSMSTN如果没有打结,则有N(N12v严格地讲,v其中221(1)/21kjjjjRnNHSn22112211221()1111(1)(21)(1)164+1)iinkijijnkijijSRRNRNRNN NNN NSN如果没有打结,则有N(N12H的一般计算公式kjjjjnNnRNNH122/)1()1(12H的简易计算公式)1()1(3)1(12H212kNnRNNkjjjv在小样本的情况下,已知(n1,n2,n3)和显著性水平,Kruskal-Wallis检验统计量的临界值可通过查表
10、得到。v在大样本情况下,服从。参照方差分析的统计量服从(k-1,N-k).2(1)k()(1)(1)Nk HFkNH 检验步骤:检验步骤:(1)建立假设 如果偏重于考察位置参数,则所建立的假设是:v注意:备择假设对于k2时不存在单侧备择的配对,因为对于 来说,有k!=k*(k-1)*3*2*1种不同的有序排列,不便于进行检验。xxFxFxFHk对所有的)(.)()(:210),.,2,1()(:1kjxFHj中至少有两个不相等kMMMH.:210),.,2,1(:1kjMHj中至少有两个不相等),.,2,1(kjMj 检验步骤:检验步骤:(1)建立假设建立假设 如果偏重于考察位置参数,则所建立
11、的假设是:如果偏重于考察位置参数,则所建立的假设是:v注意:备择假设对于注意:备择假设对于k2时不存在单侧备择的配对,时不存在单侧备择的配对,因为对于因为对于 来说,有来说,有k!=k*(k-1)*3*2*1种不同的有序排列,不便于进行检验。种不同的有序排列,不便于进行检验。xxFxFxFHk对所有的)(.)()(:210),.,2,1()(:1kjxFHj中至少有两个不相等kMMMH.:210),.,2,1(:1kjMHj中至少有两个不相等),.,2,1(kjMj (2)计算检验统计量)计算检验统计量H (3)作出决策。)作出决策。当当 数据支持数据支持H0,不能拒绝,不能拒绝H0;当当 数
12、据不支持数据不支持H0,拒绝,拒绝H0。vRefernces:Kruskal,W.H.and Wallis,W.A.(1952).Use of ranks in one-criterion variance analysis.J.Amer.Statist.Assoc.,47,583-621.时,2xH时,2xH 4.1.2 应用应用v 例例 为检验为检验4种训练方式的有效性是否存在显著种训练方式的有效性是否存在显著差异,将报名的差异,将报名的30名运动员随机地分为名运动员随机地分为4组组(运动员的条件基本相同),分别接受不同(运动员的条件基本相同),分别接受不同的培训。训练一段时间后,按规定的
13、要求进的培训。训练一段时间后,按规定的要求进行测试,测试成绩如下表所示:行测试,测试成绩如下表所示:训练方式训练方式A训练方式训练方式B训练方式训练方式C训练方式训练方式D607562767398867252688274648761857866705969796358657184778089试问试问4种训练方式的有效性是否存在显著差异(种训练方式的有效性是否存在显著差异(a=0.05)?解:(解:(1)建立假设)建立假设 (2)计算检验统计量)计算检验统计量 (3)作出决策)作出决策 ,数据在,数据在5%的显著的显著性水平上不能拒绝性水平上不能拒绝H0,表明,表明4种训练方式的有种训练方式的有
14、效性没有什么显著差异。效性没有什么显著差异。43210:MMMMH)4,3,2,1(:1jMHj中至少有两个不相等5537.0)130(*3)8129811271047120()130(*30122222H205.0205.0,815.7)3(xHx因为v存在打结数据,用H可以修正为:v这里,为结统计量,为结的个数。3311()()giiiHNNHCi数据结的处理数据结的处理4.1.3 练习练习v 在一项健康试验中,有在一项健康试验中,有3种生活方式,它们的减肥效果如下表种生活方式,它们的减肥效果如下表:生活方式生活方式123一个月后减一个月后减少的重量少的重量(单位:(单位:500g)3.7
15、3.73.03.92.77.35.25.35.76.59.04.97.18.7试问在试问在5%的显著性水平的显著性水平下,能否从这些调查数下,能否从这些调查数据中得出三种生活方式据中得出三种生活方式的减肥效果相同?的减肥效果相同?4.2 检验检验 v两个独立样本的两个独立样本的 检验可以直接推广到检验可以直接推广到k个个独立样本,用来检验独立样本,用来检验k个样本之间差异的显著个样本之间差异的显著性。性。2x2x4.2.1 基本思路与检验步骤基本思路与检验步骤 k个独立样本个独立样本 检验与两个独立样本的基本检验与两个独立样本的基本方法类似。这里不再详述。方法类似。这里不再详述。检验步骤:检验
16、步骤:(1)提出假设)提出假设2xxxFxFxFHk对所有的)(.)()(:210),.,2,1()(:1kjxFHj中至少有两个不相等 (2)计算检验统计量计算检验统计量 (3)作出决策作出决策 当当 时,数据在时,数据在a水平上拒绝水平上拒绝H0;当当 时,数据在时,数据在a水平上不能拒绝水平上不能拒绝 H0。)1)(1(2rkxQ)1)(1(2rkxQ2221111()(1)(1)nknkijijijijijijijfefQfxkneeijijffef多样本卡方检验的两点注意多样本卡方检验的两点注意统计量只是理论上的卡方值的一个估计,统计量只是理论上的卡方值的一个估计,在有些情况下这种估
17、计差异较大。在有些情况下这种估计差异较大。1.总的观察次数很小的情况,例如在总的观察次数很小的情况,例如在n=k=2时,小于时,小于20。2.大多数期望的观测次数小于。大多数期望的观测次数小于。ff4.2.2 应用应用v例例 某课题组欲了解某课题组欲了解“收听体育广播兴趣不同的收听体育广播兴趣不同的人,参加体育活动的情况是否也不相同人,参加体育活动的情况是否也不相同”。他们在全国抽选了他们在全国抽选了12个省的个省的2162人,按收听人,按收听体育广播的兴趣程度分为:很不喜欢、不喜体育广播的兴趣程度分为:很不喜欢、不喜欢、无所谓、喜欢、非常喜欢五类,各类人欢、无所谓、喜欢、非常喜欢五类,各类人
18、员参加体育活动情况如下表所示:员参加体育活动情况如下表所示:v 各类人员参加体育活动情况的人数各类人员参加体育活动情况的人数 很不喜欢很不喜欢不喜欢不喜欢无所谓无所谓喜欢喜欢非常喜欢非常喜欢合计合计不参加不参加偶尔参加偶尔参加经常参加经常参加天天参加天天参加153439615151464421840511939020411310857932581102489269302合计合计2514010867151962162试问:能否认为在试问:能否认为在0.05的显著性水平下,收听体育广播兴的显著性水平下,收听体育广播兴趣不同不影响参加体育活动?趣不同不影响参加体育活动?解:解:(1)提出假设)提出假
19、设 H0:收听体育广播兴趣不同不影响参加体育活动:收听体育广播兴趣不同不影响参加体育活动 H1:收听体育广播兴趣不同参加体育活动情况也不同:收听体育广播兴趣不同参加体育活动情况也不同 (2)计算检验统计量:)计算检验统计量:.55.55321621102*108635.7121621102*14074.1221621102*25312111eeerikjijijijeefQ1127795.141)((3)作出决策)作出决策 因为因为 所以数据在所以数据在5%的水的水平下拒绝平下拒绝H0,表明收听体育广播兴趣不同的,表明收听体育广播兴趣不同的人,参加体育活动的情况也不同。人,参加体育活动的情况也
20、不同。026.21)12()14)(15(205.0205.0 xx,026.21)12(7795.141205.0 xQ例例2 表中数据是由表中数据是由968个成人个案构成,根据他们的个成人个案构成,根据他们的政党派别以及他们在政党派别以及他们在1980年总体选举中的投票状况。年总体选举中的投票状况。类别类别党派认同党派认同坚定民坚定民主党派主党派民主民主党派党派独立民独立民主党派主党派独立独立派派独立共独立共和党派和党派共和共和党派党派坚定共坚定共和党派和党派总和总和1980年年总总体体候候选选人人里根里根2166325485131103492卡特卡特16812049191375381安德
21、安德森森71528121415495总和总和19620110985112153112968数据来源:密歇根大学政治学研究中心政治学校际研究联合数据来源:密歇根大学政治学研究中心政治学校际研究联合会(会(ICPSR)。)。解:首先根据公式计算期望次数如下:解:首先根据公式计算期望次数如下:类别类别党派认同党派认同坚定民坚定民主党派主党派民主民主党派党派独立民独立民主党派主党派独立独立派派独立共独立共和党派和党派共和共和党派党派坚定共坚定共和党派和党派总总和和1980年年总总体体候候选选人人里里根根2199.6266102.163255.405443.208556.9313177.7610356.
22、93492卡卡特特16877.1412079.114942.901933.461344.08760.22544.08381安安德德森森719.241519.732810.7128.341410.991515.01410.9995总总和和19620110985112153112968计算统计量:计算统计量:统计量的临界值统计量的临界值结论:拒绝投票偏好与党派无关的零假设。结论:拒绝投票偏好与党派无关的零假设。220.05(1)(1)(12)21.026xknx22221121664968 457.6399.62 102.1610.99nkijijijfQfe 4.2.3 练习练习v车间用车间用4
23、台机床加工同种零件。现随机抽取台机床加工同种零件。现随机抽取580件零件,测件零件,测得零件尺寸数据如下:得零件尺寸数据如下:过大过大合格合格过小过小合计合计1234132012559132144115818243080170180150合计合计5045080580尺寸件数机床号试问机床加工的零件尺寸有无差异(试问机床加工的零件尺寸有无差异(a=0.05)?)?4.3 Friedman检验检验v前面的前面的Kruskal-Wallis 检验都是针对完全随机试验检验都是针对完全随机试验数据的分析方法数据的分析方法.当各处理样本重复数据存在区组之当各处理样本重复数据存在区组之间的差异时间的差异时,
24、必须考虑区组对结果的影响必须考虑区组对结果的影响.对于随机对于随机区组的数据区组的数据,可以采用两因素的方差分析方法可以采用两因素的方差分析方法,但方但方差分析要求实验误差是正态分布的,当数据不符合差分析要求实验误差是正态分布的,当数据不符合方差分析的正态前提时方差分析的正态前提时,方差分析方法不再适用。方差分析方法不再适用。v Friedman于于1937年提出了秩方差分析法。此法对年提出了秩方差分析法。此法对试验误差没有正态分布的要求,仅仅依赖于每个区试验误差没有正态分布的要求,仅仅依赖于每个区组内所观察的秩次,因此又称弗利德曼的组内所观察的秩次,因此又称弗利德曼的 检验或检验或弗利德曼双
25、向评秩方差分析(弗利德曼双向评秩方差分析(two-way analysis of variance by ranks),后来又被,后来又被Kendall和和Smith发发展到多元度量的协同系数相关问题上。展到多元度量的协同系数相关问题上。2xv Friedman检验是对检验是对k个样本是否来自同一总体的检验。个样本是否来自同一总体的检验。k个样本是匹配的,可以由个样本是匹配的,可以由k个条件下同一组受试者构成,也个条件下同一组受试者构成,也可以将受试者分为可以将受试者分为n组,每组均有组,每组均有k个匹配的受试者,随机个匹配的受试者,随机地将地将k个受试者置于个受试者置于k个条件下。在不同受试
26、者匹配的样本个条件下。在不同受试者匹配的样本中,应尽量使不同受试者的有关因素匹配即相似。中,应尽量使不同受试者的有关因素匹配即相似。v每一个样本代表了一个处理。在实际中,除了处理之外,每一个样本代表了一个处理。在实际中,除了处理之外,往往还有别的因素起作用。比如在关于肥料(处理)效能往往还有别的因素起作用。比如在关于肥料(处理)效能的农业试验中,不同条件的土壤就构成了另一个因素,称的农业试验中,不同条件的土壤就构成了另一个因素,称为区组。如果随机地把所有处理分配到所有所有的区组中,为区组。如果随机地把所有处理分配到所有所有的区组中,使得总的变化可以分解为(使得总的变化可以分解为(1)处理造成的
27、不同;()处理造成的不同;(2)区)区组内的变化;(组内的变化;(3)区组之间的变化。当区组存在时,代表)区组之间的变化。当区组存在时,代表处理的样本的独立性就不再成立了。为进行与前面类似的处理的样本的独立性就不再成立了。为进行与前面类似的检验,就需要应用不同的检验统计量。其构造方法和思路检验,就需要应用不同的检验统计量。其构造方法和思路与完全区组试验正态总体条件下的检验统计量类似,只不与完全区组试验正态总体条件下的检验统计量类似,只不过是用秩来代替观察值。过是用秩来代替观察值。区组设计的情形 在没有区组影响的单因子实验设计的分析中,在没有区组影响的单因子实验设计的分析中,各样本的观测值是相互
28、独立的。每一个样本代表各样本的观测值是相互独立的。每一个样本代表了一种因素,习惯上称为了一种因素,习惯上称为“处理(处理(Treatment)”。然而,在实践中,往往还有其他因素。这种因素然而,在实践中,往往还有其他因素。这种因素习惯上称为习惯上称为“区组(区组(Block)”。如果完全随机地。如果完全随机地把所有处理都分配到所有区组中,这就是随机化把所有处理都分配到所有区组中,这就是随机化完全区组设计(完全区组设计(Randomized Complete Block Design)。随机化完全区组设计随机化完全区组设计 区组区组处理处理12n1x11x12x1n2x21x22x2nkXk1X
29、k2Xkn不完全区组设计不完全区组设计区组区组处理处理12341342836236304534048604445459 在实践中,并不一定能把每一在实践中,并不一定能把每一个处理分配到每一个区组中,这个处理分配到每一个区组中,这样就产生了不完全区组设计。其样就产生了不完全区组设计。其中最易处理的是平衡的不完全区中最易处理的是平衡的不完全区组设计(组设计(Balanced Incomplete Block Design,BIBD)。)。BIBD通常有五个参数:处理通常有五个参数:处理k,区组,区组n,每一区组的处理数每一区组的处理数r,每一处理,每一处理的区组数的区组数t,每两个处理在一个,每两
30、个处理在一个区组中的相遇次数区组中的相遇次数x。BIBD(4,4,3,3,2)实例如右图。)实例如右图。4.3.1 基本思路与检验步骤基本思路与检验步骤vFriedman检验就是用来检验各个样本所得的检验就是用来检验各个样本所得的结果在整体上是否存在显著差异。为对假设结果在整体上是否存在显著差异。为对假设作出判定,所分析的数据应是定序尺度测量。作出判定,所分析的数据应是定序尺度测量。获得的数据排出一个获得的数据排出一个n行行k列的表,行代表不列的表,行代表不同的受试者或匹配的受试小组,列代表各种同的受试者或匹配的受试小组,列代表各种条件条件,即有即有n个区组和个区组和k个处理。个处理。完全随机
31、区组数据分析表(完全随机区组数据分析表()1处处2 3理理 k和和 1 2区区 .组组 .b.和和N11x12x22x1bx2bxkx1kx2bkx.1n.2n.bn1.n2.nkn.3.n3bx21x13x23xijx随机化完全区组设计的秩次随机化完全区组设计的秩次()区组区组处理处理12n秩和秩和Ri.1R11R12R1n2R21R22R2nkRk1Rk2Rkn秩和秩和R.jk(k+1)/2k(k+1)/2k(k+1)/2k(k+1)/2nk(k+1)/2ijRv由于是定序尺度测量的数据,因此可以对每由于是定序尺度测量的数据,因此可以对每一行的观测结果分别评秩。如果一行的观测结果分别评秩。
32、如果Ho为真,则为真,则每一列中秩的分布应该是随机的,即各个秩每一列中秩的分布应该是随机的,即各个秩出现在所有列中的频数应几乎相等。出现在所有列中的频数应几乎相等。v接下来的做法接下来的做法与Kruskal-Wallis检验相同,计检验相同,计算组间平方和(算组间平方和(SSB)。)。222211112(1)()()4k+1R211),(),212(1)12kiknkiiiijiiiRnk kSSBRRnRRnkkRD Rnnk kMST其中 可以证明,E(v Friedman检验定义的统计量为:检验定义的统计量为:v之所以将之所以将SSB乘以系数乘以系数1/MST,是为了使得到统,是为了使得
33、到统计量渐进服从计量渐进服从 。v数据打结时,要对上述检验统计量做修正。数据打结时,要对上述检验统计量做修正。22112(1)123(1)(1)rkjjQxSSBk kRn knk k2(1)xk有结情形v秩取平均值,此时需要对秩取平均值,此时需要对 Q统计量进行修正:统计量进行修正:v修正后统计量修正后统计量 的数学期望等于的数学期望等于k-1,仍然服,仍然服从从 分布。分布。3,112()1(1)jagnj tj tjtQQnk kaQ2(1)xkv检验步骤:检验步骤:(1)提出假设)提出假设 Ho:k个样本间无显著差异个样本间无显著差异 H1:k个样本间有显著差异个样本间有显著差异(2)
34、计算检验统计量)计算检验统计量(3)作出决策)作出决策 当当 时,在时,在a水平上拒绝水平上拒绝Ho;当当 时,不能拒绝时,不能拒绝Ho。2rx22xxr22xxr4.3.2 应用应用v某田径队对新入队的学员要进行四个部分的某田径队对新入队的学员要进行四个部分的技术训练,以提高学员的身体素质。为检验技术训练,以提高学员的身体素质。为检验这四个部分的技术训练是否确实有效,随机这四个部分的技术训练是否确实有效,随机抽选了抽选了14名新学员,分别接受四个部分的训名新学员,分别接受四个部分的训练。每个训练结束后,均进行该部分的测试,练。每个训练结束后,均进行该部分的测试,成绩以成绩以10分为最高。检测
35、结果如下表所示:分为最高。检测结果如下表所示:ABCD123456789101112131410246357610853463510344101059455569310106637724108848467556667910技术训练等级学员编号试问在试问在5%的显著性水平下四个部分技术训练的有效性有无显著差异?的显著性水平下四个部分技术训练的有效性有无显著差异?解:(解:(1)建立假设)建立假设 Ho:四个部分技术训练的有效性无显著差异:四个部分技术训练的有效性无显著差异 H1:四个部分技术训练的有效性有显著差异:四个部分技术训练的有效性有显著差异v(2)计算检验统计量)计算检验统计量2rx学员
36、编号学员编号技术训练技术训练A技术训练技术训练B技术训练技术训练C技术训练技术训练D123456789101112131441231233433112134121441423412414432132124332323412214434合计合计33333638)(jR(3)作出决策)作出决策 ,所以不能拒绝,所以不能拒绝Ho,表明,表明四个技术训练的有效性没有显著差异。四个技术训练的有效性没有显著差异。7714.0)14(*14*3)38363333()14(*4*141222222rx2282.7)14(rxx4.3.3练习练习v根据下列资料,检验三种培训方案的有效性根据下列资料,检验三种培训
37、方案的有效性有无显著差异有无显著差异(a=0.05)?学生组学生组方案方案A方案方案B方案方案C123456789101112131415161718112321122211111111323213231133232.5222231132313322322.53334.4 Cochran Q检验检验v有时,观察值是以有时,观察值是以“是是”或或“否否”,“同意同意”或或“不同意不同意”等二元数据形式出现的。如果等二元数据形式出现的。如果用用Friedman检验将会出现很多打结现象,检验将会出现很多打结现象,Cochran检验解决了数据打结现象此方法检验解决了数据打结现象此方法是是Cochran
38、于于 1950年提出的。年提出的。v Cochran Q检验译为科库兰检验,它是用以检验译为科库兰检验,它是用以检验相关的检验相关的k个样本的频数或比例之间有无显个样本的频数或比例之间有无显著性差异的方法。著性差异的方法。4.4.1 基本思路与检验步骤基本思路与检验步骤v有有k个相关样本,每个样本有个相关样本,每个样本有n个观测结果,建议个观测结果,建议k个样本间是否有显著差异。为对假设作出判定,所个样本间是否有显著差异。为对假设作出判定,所分析的数据测量层次为定类尺度即可。获得的数据分析的数据测量层次为定类尺度即可。获得的数据可排成一个可排成一个n行行k列的表。如果列的表。如果H0为真,将测
39、量结果为真,将测量结果分为分为“成功成功”和和“失败失败”,“成功成功”与与“失败失败”应应随机地分布在表中的各行各列。随机地分布在表中的各行各列。Cochran认为,在认为,在零假设下,每个处理有同等的概率得到零假设下,每个处理有同等的概率得到“成功成功”。在其定义的在其定义的Cochran检验统计量中正是反映了这种检验统计量中正是反映了这种思想。思想。4.4.1 基本思路与检验步骤基本思路与检验步骤1处处2 3理理 k和和 1 2区区 .组组 .n.和和N11O12O22O1nO2nOkO1kO2nkO1y2yny1x2xkx3x3nO21O13O23OvCochran Q检验定义的统计量
40、为:检验定义的统计量为:v式中,式中,是第是第j列(处理)的总数,列(处理)的总数,是第是第i行(区组)行(区组)的总数。近似是指固定的总数。近似是指固定k,n趋于无穷大的情形。趋于无穷大的情形。v该检验量实际上是说明按样本数(该检验量实际上是说明按样本数(k)计算的总次数)计算的总次数与按观察对象或样品数(与按观察对象或样品数(n)计算的总次数的符合)计算的总次数的符合程度。程度。22112211(1)()(1)kkjjjjnniiiikkxxQkkyyjxiy检验步骤:检验步骤:(1)建立假设)建立假设 H0:k个样本间无显著差异个样本间无显著差异 H1:k个样本间有显著差异个样本间有显著
41、差异 由于三个及三个以上样本间差异的方向不便判定,由于三个及三个以上样本间差异的方向不便判定,因而通常只建立双侧备择进行检验。因而通常只建立双侧备择进行检验。(2)计算检验统计量)计算检验统计量Q (3)作出决策)作出决策 当当 时,拒绝时,拒绝H0;当当 时,不能拒绝时,不能拒绝H0。)1(2kxQ)1(2kxQ4.4.2 应用应用v例例 某商场为决定经营饮料的品种、数量,对消费某商场为决定经营饮料的品种、数量,对消费者的爱好进行了一次调查。随机抽取者的爱好进行了一次调查。随机抽取18个消费者,个消费者,请他们对四种饮料(热牛奶、酸奶、果汁、可口可请他们对四种饮料(热牛奶、酸奶、果汁、可口可
42、乐)的喜好作出评价。乐)的喜好作出评价。1代表喜好,代表喜好,0代表不喜好。代表不喜好。调查结果如下表所示。调查结果如下表所示。试问:在试问:在5%的显著性水平下消费者对饮料的爱好是的显著性水平下消费者对饮料的爱好是否存在差异?否存在差异?消费者消费者热牛奶热牛奶酸奶酸奶果汁果汁可口可乐可口可乐123456789101112131415161718100110000100111010000101011100011100011010001111000000101000100000100011 解:(解:(1)建立假设)建立假设 H0:消费者对四种饮料爱好无差异:消费者对四种饮料爱好无差异 H1:
43、消费者对四种饮料爱好有差异:消费者对四种饮料爱好有差异 (2)计算检验统计量)计算检验统计量Q :表示按样本数计算的消费者喜欢的总次数;:表示按样本数计算的消费者喜欢的总次数;:表示按观察对象(消费者)计算的对各种饮料喜欢的总:表示按观察对象(消费者)计算的对各种饮料喜欢的总 次数。次数。29,(6,7,8,8:414321jjjxxxxxx)喜欢可口可乐的总次数29,18(1,.,2,1,2:18118321iiiyyyyyy的次数)位消费者喜欢各种饮料第kjjx1niiy15238.0)31*82*9(29*429)36496464(*4)14()()1(22221212112niinii
44、kjjkjjyykxxkkQ(3)作出决策)作出决策 ,不能拒绝,不能拒绝Ho,可以在,可以在5%的显的显著性水平下认为消费者对四种饮料的爱好没著性水平下认为消费者对四种饮料的爱好没有显著差异。有显著差异。Qx28.7)14(205.04.4.3 练习练习v 教务管理部门想知道电视教学、课堂讲授、教务管理部门想知道电视教学、课堂讲授、课堂讨论这三种教学方法的效果是否有显著课堂讨论这三种教学方法的效果是否有显著差异。为此,抽选部分学生分为差异。为此,抽选部分学生分为18组,每组组,每组3名匹配的学生,他们的有关情况类似。名匹配的学生,他们的有关情况类似。各组中各组中3名学生被随机地指定接受某种教
45、学方名学生被随机地指定接受某种教学方法。实施不同教学方法后进行测验,成绩合法。实施不同教学方法后进行测验,成绩合格为有效,记为格为有效,记为1;成绩不合格为无效,记为;成绩不合格为无效,记为0,结果如下表所示。,结果如下表所示。v试问:三种教学方法的效果是否有显著差异试问:三种教学方法的效果是否有显著差异(a=0.05)?)?学生组学生组电视教学电视教学课堂讲授课堂讲授课堂讨论课堂讨论123456789101112131415161718000010001000000100011001110011111101010011101011111111此课件下载可自行编辑修改,仅供参考!此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢感谢您的支持,我们努力做得更好!谢谢