1、方差分析-多个样本均数比较的假设检验1.基本概念 t检验解决了推断两个总体均数是否相等的问题,但实际工作中还会遇到需要推断多个总体均数是否相等的问题。如:Ex1 为研究煤矿粉尘作业环境对尘肺的影响,将18只大鼠随机分到甲、乙、丙三个组,每组6只,分别在地面办公楼、煤碳仓库和矿井下染尘,12周后测量大鼠的全肺湿重,数据见下表,问不同环境下大鼠全肺湿重有无差别?返返回回甲组乙组丙组样本观测值4.24.55.63.34.43.63.34.24.7 本例的问题是,要比较不同环境下大鼠的全肺湿重有无差别,即需要对下列假设作出推断:H0:1=2=3 三种不同环境对大鼠的全肺湿重无影响ex2 为研究克拉霉素
2、的抑菌效果,对28个短小芽孢杆菌平板依据菌株的来源不同分成了7个区组,每组4个平板用随机的方式分配给标准药物高剂量组(SH)、标准药物低剂量组(SL),以及克拉霉素高剂量组(TH)、克拉霉素低剂量组(TL)。给予不同的处理后,观察抑菌圈的直径,结果见下表,问(1)4种处理效果是否不同?(2)不同菌源之间抑菌圈的直径大小是否不同?本例有两问,需要对如下两个假设作出推断:1.H0:SL=SH=TL=TH 4种处理效果相同2.H0:1=2=7 菌源对抑菌圈的直径大小没有影响区组SLSHTLTH118.0219.4118.0019.4618.72218.1220.2018.9120.3819.4031
3、8.0919.5618.2119.6418.88418.3019.4118.2419.5018.86518.2619.5918.1119.5618.88618.0220.1218.1319.6018.97718.2319.9418.0619.5418.94 这两个例子都涉及到多个均数的比较问题。为了解决这类问题,我们先复习一下几个相关的概念:试验指标:试验指标:要考察的指标称为试验指标-例1为全肺 湿重,例2为抑菌圈的直径;因素:因素:影响试验指标的条件称为因素因素-例1为组别,例2为药物(及剂量)、菌株来源;水平:水平:因素所处的状态称为该因素的水平-例1组别 这个因素有3个不同的水平;例2
4、药物(及剂量)因素有4个水平,菌株来源有7个水平。在一项试验中,如果影响试验指标的因素只有一个,则称该试验为单因素试验单因素试验(例1);如果影响试验指标的因素有多个,则称该试验为多因素试验多因素试验(例2)。2.完全随机设计的方差分析(单因素试验)完全随机设计又称为成组设计,即将受试对象随机分配到处理因素的不同水平组中,比较处理因素各个水平组间均数有无显著差别。这种设计只有一个处理因素,故称为单因素试验。现在回到例1的问题:我们在因素(组别)所处的每一水平下进行了独立试验,其结果是一随机变量。如果将因素的每一水平分别视为一个总体,各总体的均值分别为1、2、3,则表中数据可视为来自三个不同总体
5、的样本值。于是,例1的问题即为检验如下的假设:H0:1=2=3 H1:1、2、3不全相等水平A1A2As样本观测值x11x12x1sx21x22x2s样本总和T1T2Ts样本均值总体均值1x2xsx1完全随机设计(单因素)多个均数比较的资料11nx22nxsn sx2s 一般地,对于单因素试验,假设因素A有s个水平:A1,A2,As。在水平Aj(j=1,2,s)进行nj次独立试验,得到如下的试验结果:假定各水平Aj均为正态总体N(j,2),方差分析的任务是对假设 H0:1=2=s进行检验。当s=2 即只有两个总体时,我们采用的是t检验,所用的检验统计量为:121212 2XXXXtnnS这时,
6、考察的是两个样本均值之间的差异。对于多个总体的情形,很自然地,我们需要考察多个样本均值之间的差异。这需要对样本数据中的变异进行分析,即对所有数据的离均差平方和进行分解。为此,考虑:水平A1A2As样本观测值x11x12x1sx21x22x2s样本总和T1T2Ts样本均值总体均值1x2xsx1完全随机设计(单因素)多个均数比较的资料11nx22nxsn sx2s111jnsijjixxn11jnjijijxxn211()jnsijjiSSxx总总平方和(总变差)总均值各水平的均值可将总平方和SS总分解为:SSSSSS总组内组间其中:水平A1A2As样本观测值x11x12x1sx21x22x2s样
7、本总和T1T2Ts样本均值总体均值1x2xsx1完全随机设计(单因素)多个均数比较的资料11nx22nxsn sx2s211()jnsijjjiSSxx组内反映了各水平组内每个样本观察值与其样本均数之间的差异,故SS组内称为组内平方和(又称为误差平方和),其自由度为n-s;21()sjjjSSn xx组间水平A1A2As样本观测值x11x12x1sx21x22x2s样本总和T1T2Ts样本均值总体均值1x2xsx1完全随机设计(单因素)多个均数比较的资料11nx22nxsn sx2s反映了各水平下的样本均值与总平均值之间的差异,即各水平下样本均值之间的差异,故称SS组间为组间平方和(又称为因素
8、A的效应平方和)其自由度为s-1。如果假设H0:1=2=s成立,即各总体完全相同,这时,组间平方和SS组间反映的是抽样误差,它不应该很大。反之,SS组间若很大,不能用抽样误差来解释,则可认为H0不成立。根据平方和分解式:SSSSSS总组内组间我们来分析一下如下的统计量:(1)()SSsMSFSSnsMS组间组间组内组内MS组间 称为组间均方MS组内 称为组内均方 如果F值远大于1,则说明SS组间很大,SS组内很小,即SS总主要是由各水平组之间的差异引起的,即认为假设H0不成立;可以证明,如上定义的统计量 FF(n-s,s-1),故可利用这个统计量来对H0进行检验。如果F值接近于1,则说明SS组
9、间与SS组内较为接近,而SS组内反映的是随机误差,SS组间是由各水平之间的差异与随机误差两部分构成的,现在SS组间与SS组内很接近,即说明SS组间主要由随机误差构成,即水平之间的差异很小,因此没有理由认为H0不成立。(1)()SSsMSFSSnsMS组间组间组内组内6.56282.52784.0350SSSSSS组内总组间下面将例完整地做一遍。1)作假设H0:1=2=3 作业环境不影响大鼠全肺湿重。确定检验水准0.052)为计算F值,先计算出相关的统计量的值21()2.5278sjjjSSnxx组间211()6.5628jnsijjiSSxx总4.03500.269183SSMSns组内组内2
10、.52781.26413 1SSMSs组间组间1.2644.700.269MSFMS组间组内3)将算得的数据及相应统计量的自由度填入下面的方差分析表:方差分析表变异来源平方和SS自由度df均方MSF值P值组间2.52821.2644.70 0.05组内4.035150.269总6.563174)查F界值表,得 F0.05(2,15)3.68 4.70=F从而知 P 0.05于是拒绝H0,即认为不同粉尘环境影响大鼠的全肺湿重。3.随机区组设计资料的方差分析 随机区组设计又称为配伍组设计,是配对设计的扩展。其设计方法是按两个因素分组,一个是区组因素,一个是处理因素。具体做法是:按实验对象的自然属性
11、或对实验结果有影响的非研究因素设置区组,先将具有某种共同属性的实验对象分配到同一个区组内,再将各区组内的实验对象随机分配到各个不同的处理组中,每个实验对象接受一种处理,各处理组的实验对象数量相等。如ex2ex2 为研究克拉霉素的抑菌效果,对28个短小芽孢杆菌平板依据菌株的来源不同分成了7个区组,每组4个平板用随机的方式分配给标准药物高剂量组(SH)、标准药物低剂量组(SL),以及克拉霉素高剂量组(TH)、克拉霉素低剂量组(TL)。给予不同的处理后,观察抑菌圈的直径,结果见下表,问(1)4种处理效果是否不同?(2)不同菌源之间抑菌圈的直径大小是否不同?本例有两问,需要对如下两个假设作出推断:1.
12、H0:SL=SH=TL=TH 4种处理效果相同2.H0:1=2=7 菌源对抑菌圈的直径大小没有影响区组SLSHTLTH118.0219.4118.0019.4618.72218.1220.2018.9120.3819.40318.0919.5618.2119.6418.88418.3019.4118.2419.5018.86518.2619.5918.1119.5618.88618.0220.1218.1319.6018.97718.2319.9418.0619.5418.94随机区组的试验结果区组序号处理因素区组合计样本均数总体均数1组2组g组1x11x12x1gB112x21x22x2gB
13、22nxn1xn2xngBnn处理组合计T1T2Tg样本均数总体均数12gnx1x2xgx1x2x 一般地,随机区组设计的试验结果见下表:假定处理组各水平Aj均为正态总体N(j,2),区组各水平Bk均为正态总体N(k,2),方差分析的任务是:对假设:H0:1=2=g H0:1=2=n进行检验。与完全随机设计的情形类似,我们将总平方和分解为:+SSSSSSSS处理组区组总误差21()处理组gjjjSSn xx SS处理组表示各处理组的样本均值与全部观测数据的总平均值之间的差异,这种差异是由不同处理组及随机误差所引起的,故称SS处理组为处理组间平方和(又称为处理因素的效应平方和)其自由度为g-1。
14、其中21()区组niiiSSn xx SS区组表示各区组的样本均值与全部观测数据的总平均值之间的差异,这种差异是由不同区组及随机误差所引起的,故称SS区组为区组间平方和(又称为区组因素的效应平方和)其自由度为n-1。v=g-1v=n-1 SS误差表示处理和区组两个因素各水平组内每个样本观察值与其样本均数之间的差异,故SS误差称为误差平方和,其自由度为(g-1)(n-1)。于是,得检验统计量(1)(1)(1)SSgMSFSSgnMS处理处理误差误差(1)(1)(1)SSnMSFSSgnMS区组区组误差误差-处理区组总误差SSSSSSSSv=(g-1)(n-1)例2即是一个随机区组的方差分析问题。
15、1)作假设 本例有两问,需要对如下两个假设作出推断:1.H0:SL=SH=TL=TH 4种处理效果相同2.H0:1=2=7 菌源对抑菌圈的直径大小没有影响 检验水准:=0.052)计算相应的统计量,填入方差分析表中变异来源平方和SS自由度df均方MSF值P值处理16.117535.3725116.895 0.01区组1.095260.18253.970.05误差0.8273180.04596总18.04273)确定P值,作出推断结论查F界值表,得F0.01(3,18)=5.09116.859=F处理 F0.05(6,18)=2.663.97=F区组 从而对于处理组,按0.01的检验水准拒绝H0
16、,可认为4种处理效果不全相同。对于区组,按0.05的检验水准拒绝H0,可认为菌源对抑菌圈的直径大小有影响。方差分析的应用条件:1).各观察值相互独立,且服从正态分布;2).各组资料总体方差相等。注1:对于两种不同设计的平方和分解,有:完全随机设计:SS总SS处理SS组内 随机区组设计:SS总SS处理SS区组SS误差 由此可见,随机区组设计的优点是:从组内变异中分离出区组变异,使误差变异减小,因而更容易发现处理组间的差别,提高统计效率。每个区组内的若干个受试对象间具有良好的同质性,组间的均衡性较强。注2:当g=2时,完全随机设计方差分析的结果与两样本均数比较的t 检验等价,理论上有 t 2=F。
17、当g=2时,随机区组设计方差分析与配对设计资料的t 检验等价,理论上有 t 2=F。4.拉丁方设计资料的方差分析 由g个拉丁字母排成的g*g方阵,方阵的每行每列中每个字母都只出现一次,这样的方阵称为g阶拉丁方。如:DBCAACDBBDACCABDABCDBCDACDABDABC基本拉丁方拉丁方随机调换某两列(行)利用g阶拉丁方可按行、列、拉丁字母分别安排3个因素,每个因素有g个水平。如4阶拉丁方可安排3个因素:一二三四1DBCA2ACDB3BDAC4CABD Ex3 研究A、B、C、D四种食品以及甲、乙、丙、丁四种加工方法对小白鼠体重增加的影响。拟用4窝小白鼠,每窝4只,每只小白鼠随机喂养一种
18、食品、随机采用一种加工方法,8周后观察小白鼠的体重增加情况。实验结果如下表。问食品种类是否影响小白鼠体重的增加?食品加工方法是否影响小白鼠体重的增加?不同窝别的小白鼠体重增加是否不同?窝别甲乙丙丁1D80B70C51A482A47C75D78B453B48D80A47C524C46A81B49D77本例有三问,需要对如下三个假设作出推断:1.H0:A=B=C=D 四种食品对体重增加作用相同2.H0:1=2=3=4 窝别对体重增加无影响3.H0:甲=乙=丙=丁 食品加工方法对体重增加无影响 与完全随机设计的情形类似,我们将总平方和(总变异)分解为:+SSSSSSSSSS处理组列总行误差其中 SS
19、处理组表示各处理组的样本均值与全部观测数据的总平均值之间的差异,这种差异是由不同处理组及随机误差所引起的,故称SS处理组为处理组间平方和(又称为处理因素的效应平方和)其自由度为g-1。SS行表示行因素各水平组的样本均值与全部观测数据的总平均值之间的差异,其自由度为g-1。SS列表示列因素各水平组的样本均值与全部观测数据的总平均值之间的差异,其自由度为g-1。SS误差表示各因素各水平组内每个样本观察值与其样本均数之间的差异,其自由度为(g-1)(g-2)。于是,得检验统计量(1)(1)(2)SSgMSFSSggMS处理处理误差误差(1)(1)(2)SSgMSFSSggMS行行误差误差(1)(1)
20、(2)SSgMSFSSggMS列列误差误差计算相应的统计量,填入方差分析表中变异来源平方和SS自由度df 均方MSF值P值处理1726.25 3575.4179.85 0.05列区组1304.2 3434.7507.44 0.05误差350.50 6 58.417总3479.75 15根据P值,作出推断:1.拒绝H0,认为食品种类会影响大鼠体重增加;2.不拒绝H0,不能认为窝别可影响大鼠体重增加;3.拒绝H0,认为食品加工方法会影响大鼠体重增加。一、析因设计的有关概念 前面我们介绍了随机区组设计的方差分析,在那里,我们指出,随机区组设计实际上是两因素无重复的试验设计,即:随机区组的试验结果区组
21、序号处理因素区组合计样本均数总体均数1组2组g组1x11x12x1gB112x21x22x2gB22nxn1xn2xngBnn处理组合计T1T2Tg样本均数总体均数12gnx1x2xgx1x2x 如果我们将区组因素视为因素A,处理因素视为因素B,则可将上表改写为:因素A因素B水平1水平2水平s水平1x11x12x1s水平2x21x22X2s水平rxr1xr2xrs两因素无重复试验设计数据格式 在上表中,两因素各水平之间的组合共有r*s个,在每个组合下只有一个试验结果,故称该设计为两因素无重复试验设计。现在我们将上述设计作一个推广,先看一个例子:例1 为了研究药物治疗附加磁场对人体内磁性物质分布
22、的影响,安排两个药物组:实验组为“丝裂霉素+高分子物质+磁性物质磁场”,对照组为“丝裂霉素+高分子物质+磁性物质”。每组分别于给药后15分钟和60分钟处死实验小鼠,检测小鼠肝脏组织的磁性物质浓度,即铁浓度(mg/g)。采用22平衡设计,一个因素为药物,有2个水平,即实验组(A1)和对照组(A2);另一个因素为给药后时间,亦有2个水平,即15min(B1)和60min(B2)。两个因素有4种组合,每种组合重复例数为6。将24只小鼠随机分配到4个组合组,实验结果见下表,试分析之。实验组(B1)对照组(B2)15min(A1)0.5540.3370.5500.2760.5780.3130.7060.
23、3870.6860.4310.6510.36260min(A2)1.0150.5031.0050.6121.0710.5931.1060.6041.1550.6401.1450.560小鼠肝脏组织的铁浓度(mg/g)检测结果 在这个例子中,因素A与因素B共有2*2个组合,每个组合下效应指标X(小鼠肝组织的铁浓度)各有6次重复试验的结果。因此这是一个两因素等重复试验设计。这里每个因素各有两个水平,故又称为2*2析因设计。一般地,两因素等重复试验设计亦称为两因素(等重复)析因设计,它具有以下特点:处理因素:A、B水 平:A因素有r个水平、B因素有s个水平,共 有r*s种组合试验次数:每个组合下进行
24、了t次试验,共进行了 r*s*t次试验,效应指标X在每个组合下 都有t个取值,共有r*s*t个取值。两因素等重复试验设计的数据格式如下:两因素等重复试验设计的数据格式单独效应:其他因素水平固定时,某一因素各水平之间效应指标的差异。如因素A固定在A1水平时,因素B各水平之间效应指标X的差异即为因素B在A1水平上的单独效应。两因素等重复试验设计的数据格式主效应:某一因素各单独效应的平均效应。如因素B在Ai水平上的单独效应为MBi,则因素B的主效应即为各MBi的平均值。交互效应:如果因素A的水平发生变化时,因素B的单独效应也发生变化,则称因素A与B之间存在交互效应。反之亦然。二、两因素析因设计的方差
25、分析 两因素析因设计的方差分析,就是要对如下的假设进行检验:检验假设:H10:因素A的主效应为0 H20:因素B的主效应为0 H30:因素A与B之间不存在交互效应 为了对上述三个假设进行检验,按照Fisher的平方和分解思想,我们对总平方和进行如下的分解:平方和分解:TABA BESSSSSSSSSSSST称为总平方和,SSE称为误差平方和,SSA,SSB分别称为因素A,B的效应平方和,SSAB称为因素A,B的交互效应平方和。SST的自由度为rst1,SSE的自由度为rs(t1),SSA的自由度为(r1),SSB的自由度为(s1),SSAB的自由度为(r1)(s1)。为了检验H10、H20、H
26、30,需要构造如下的检验统计量:/(1)1,(1)/(1)AAESSrFF rrs tSSrs t/(1)1,(1)/(1)BBESSsFF srs tSSrs t/(1)(1)(1)(1),(1)/(1)A BA BESSrsFFrsrs tSSrs t例1 为了研究药物治疗附加磁场对人体内磁性物质分布的影响,安排两个药物组:实验组为“丝裂霉素+高分子物质+磁性物质磁场”,对照组为“丝裂霉素+高分子物质+磁性物质”。每组分别于给药后15分钟和60分钟处死实验小鼠,检测小鼠肝脏组织的磁性物质浓度,即铁浓度(mg/g)。采用22平衡设计,一个因素为药物,有2个水平,即实验组(A1)和对照组(A2
27、);另一个因素为给药后时间,亦有2个水平,即15min(B1)和60min(B2)。两个因素有4种组合,每种组合重复例数为6。将24只小鼠随机分配到4个组合组,实验结果见下表,试分析之。实验组(A1)对照组(A2)15min(B1)0.5540.3370.5500.2760.5780.3130.7060.3870.6860.4310.6510.36260min(B2)1.0150.5031.0050.6121.0710.5931.1060.6041.1550.6401.1450.560小鼠肝脏组织的铁浓度(mg/g)检测结果检验假设:H10:因素A的主效应为0 H20:因素B的主效应为0 H3
28、0:因素A与B之间不存在交互效应列出如下的方差分析表方差来源平方和自由度均方FP因素ASSAr1=SSA/(r1)因素BSSBs1=SSB/(s1)因素ABSSAB(r1)(s1)误差SSErs(t1)=SSE/rs(t1)总平方和SSTrst1 AMBM(1)(1)A BA BSSMrsEMAAEFMMBBEFMMA BA BEFMM方差来源 平方和自由度均方FP因素A0.883210.8832252.340.01因素B0.727310.7273207.800.01因素AB0.077810.077822.230.01误差0.070720 0.0035 总和1.759023 本例:三、三因素析
29、因设计的方差分析处理因素:A、B、C水 平:A因素有r个水平、B因素有s个水平、C因 素有m个水平,共有r*s*m种组合试验次数:每个组合下进行了t次试验,共进行了 r*s*m*t次试验,效应指标X在每个组合 下都有t个取值,共有r*s*m*t个取值。下面是一个三因素析因设计方差分析的例子。例2:小鼠种别A、体重B和性别C对皮内移植SRS瘤细胞生长特征影响的结果(肿瘤体积cm3)问A、B、C各自的主效应如何?三者间有无交互作用?例2:小鼠种别A、体重B和性别C对皮内移植SRS瘤细胞生长特征影响的结果(肿瘤体积cm3)问A、B、C各自的主效应如何?三者间有无交互作用?种别种别体重体重性别性别雄性
30、雌性昆明种24250.70690.18850.78540.34030.35810.250313151.08380.95500.94250.92150.33350.8514泸白种24250.06280.47120.09420.08800.04710.175913150.01260.25130.00940.36760.01250.1327种别种别A体重体重B性别性别C雄性雌性昆明种24250.70690.18850.78540.34030.35810.250313151.08380.95500.94250.92150.33350.8514泸白种24250.06280.47120.09420.088
31、00.04710.175913150.01260.25130.00940.36760.01250.1327检验假设:H10:因素A的主效应为0。H20:因素B的主效应为0H30:因素C的主效应为。H40:因素A与B之间不存在交互效应。H50:因素A与C之间不存在交互效应。H60:因素B与C之间不存在交互效应。H70:因素A、B、C之间不存在交互效应。平方和分解:TABCA BA CB CA B CESSSSSSSSSSSSSSSSSS SST:总平方和,自由度为rsmt1;SSE:误差平方和,自由度为rsm(t1);SSA:因素A的效应平方和,自由度为(r1);SSB:因素B的效应平方和,自由
32、度为(s1);SSC:因素C的效应平方和,自由度为(m1);SSAB:因素A、B的交互效应平方和,自由度为(r1)(s1);SSAC:因素A、C的交互效应平方和,自由度为(r1)(m1);SSBC:因素B、C的交互效应平方和,自由度为(s1)(m1)SSABC:因素A、B、C的交互效应平方和,自由度为(r1)(s1)(m1)/(1)1,(1)/(1)AAESSrFF rrsm tSSrsm t/(1)1,(1)/(1)BBESSsFF srsm tSSrsm t/(1)(1)(1)(1),(1)/(1)A BA BESSrsFFrsrsm tSSrsm t 为了检验H10、H20、H30,H4
33、0、H50、H60、H70需要构造如下的检验统计量:/(1)1,(1)/(1)CCESSmFF mrsm tSSrsm t/(1)(1)(1)(1),(1)/(1)A CA CESSrmFFrmrsm tSSrsm t/(1)(1)(1)(1),(1)/(1)B CB CESSsmFFsmrsm tSSrsm t/(1)(1)(1)(1)(1)(1),(1)/(1)A B CA B CESSrsmFFrsmrsm tSSrsm t 列出如下的方差分析表ASBS(1)(1)A BA BSSrsESAAEFSSBBEFSSA BA BEFSS方差来源平方和自由度均方F因素ASSAr1 =SSA/(
34、r1)因素BSSBs1 =SSB/(s1)因素CSSCm1 =SSC/(m1)因素ABSSAB(r1)(s1)因素ACSSAC(r1)(m1)因素BCSSBC(s1)(m1)因素ABCSSABC(r1)(s1)(m1)误差SSErsm(t1)N其余自由度之和 =SSE/rsm(t1)总平方和SSTrsmt1N1 AMBMCM(1)(1)A BA BSSMrs(1)(1)A CA CSSMrm(1)(1)B CB CSSMsm(1)(1)(1)A B CA B CSSMrsm EMAAEFMMBBEFMMCCEFMMA BA BEFMMA CA CEFMMB CB CEFMMA B CA B C
35、EFMM 方差来源平方和自由度均方FP因素A1.495911.495943.680.0001因素B0.221410.22146.460.0217因素C0.012410.01240.360.5562因素AB0.284110.28418.30 0.0109因素AC0.158610.15864.63 0.0470因素BC0.110110.11013.210.0919因素ABC0.065410.06541.910.1859误差0.54792*2*2(31)=160.0342总平方和2.89602*2*2*31=23 本例:四、处理因素的主效应与交互效应 对于析因设计方差分析所给出的处理因素的主效应及交
36、互效应是否显著的结果,一般说来,不应简单地直接下结论,需要具体情况具体分析。下面我们以两因素的情形为例来讨论:如果两个因素之间的交互效应不显著,则可直接根据其主效应是否显著来评估各因素对效应指标的作用大小;当两个因素之间的交互效应显著时,就不能简单地从主效应是否显著直接得出结论了。现在以交互效应显著为前提,来讨论因素A的主效应是否显著的三种情况:1.交互效应显著,A的主效应也显著,而且主效应的方向与单独效应的方向一致,如上图中的b图。此时,在因素B的两个水平上,因素A从A1到A2的变化引起的效应指标的变化趋势一致,只是变化幅度不同。这里的交互效应掩盖了因素A在因素B不同水平上的效应量的差异。显
37、然,在B1水平上,A的效应量大于其在B2水平上的效应量。2.交互效应显著,A的主效应也显著,这时A的效应方向可能会被交互效应歪曲。如上图中的a、d两个图。在a图中,因素A的变化在B1的水平上引起了效应指标的显著变化,但在B2水平上却未引起效应指标的变化,这就是说,A的变化不是在任何情况下都会引起效应指标发生变化的,它依赖于因素B的水平。在图d中,虽然A的变化在B的两个水下上都引起了效应指标的明显变化,但是变化的方向正好相反。从其主效应来看,A的水平提高可以促进效应指标值的升高,但实际上,当A在B1水下上提高时,反而会导致效应指标值降低。在上述两种情况下,显著的交互效应掩盖或歪曲了因素A的作用,
38、它在因素B的不同水平上的效应量是不同的。3.交互效应显著,A的主效应却不显著。这是由于交互效应掩盖了A的效应。如c、e、f三个图。从这些图中可以明显看到A的效应,但方差分析结果地会显示A的主效应不显著。这是因为A在B的两个水平上的效应方向相反,计算A的主效应时A1和A2的差异量被掩盖在了平均过程中。基于以上讨论,在分析方差分析结果时,应注意:当结果显示A的主效应及A与其它因素的交互效应都不显著时,说明A的效应不显著;当结果显示A的主效应不显著但A与其它因素的交互效应显著时,说明A其实对效应指标是有作用的,即A的主效应实际上是存在的,只不过其效应的大小和方向依赖于其它因素的不同水平。这时,不能简
39、单地依据A的主效应不显著直接推断A对效应指标没有影响,而应进一步作单独效应的检验,分别考察A在其它因素不同水平上的变化情况。多个均数间的多重比较 在方差分析中,若拒绝原假设,则说明多个总体均数不全相等,但究竟是哪些不等?却并没有解决。这需要对多个总体均数进一步作两两比较,即需要对如下假设进行检验。H0:1=2 1=3 1=g 2=3 2=g g-1=g 这里,每一个检验都是两个总体均数的比较,似乎都可以采用t 检验来做,但由于这里需要进行多重比较,重复使用t 检验会增大犯I类错误的概率。如需进行6次比较,每次犯I类错误的概率最大为0.05,则1.SNK-q检验 适用于多个总体均数的两两比较;2
40、.Dunnett-t检验 适用于多个实验组与一个共用对照组的比较;3.LSD-t检验 适用于多组中某一对或某几对在专业上有特殊意义的均数的比较。第1次比较时不犯一类错误的概率为:1-0.05前2次比较均不犯一类错误的概率为:(1-0.05)26次比较均不犯一类错误的概率为:(1-0.05)6 于是,6次比较中至少有一次犯一类错误的概率为:1-(1-0.05)6=0.26这个概率远大于0.05。故需采用特定的方法来作这种多重比较的假设检验。作这种多重比较,常用的方法有:多个方差的齐性检验 与t检验类似,在进行方差分析时,要求数据满足正态性和方差齐性的条件。正态性一般可根据专业知识来判断,也可用正态性检验来处理;对于方差齐性问题,前面解决了两个方差的齐性检验问题,现在来看多个方差的齐性检验问题。Bartlett检验 设从g个正态总体中独立抽取g个样本,求得各样本均数与样本方差,欲检验各总体方差是否相等:H0:21=22=2g 在H0成立的条件下,可用如下的统计量进行检验:22121111)ln=11)()13(1)gciiigiiSnSgnNkk(其中,合并方差22111)1)giiicgiinSSn(对于完全随机设计,合并方差S2c=MS组内