1、第 8 章单因素方差分析 1单因素试验和双因素试验单因素试验:在试验中所考察的因素只有一个双因素试验:在试验中所考察的因素有二个2水平因素在试验中所分的等级3处理在试验中,同一条件下的一组试验4重复每个处理内观察次数或样本数目8.1 方差分析原理 单因素试验的共同特点:一个因素a个水平a个处理n次重复 单因素试验方差分析的典型数据 Xi,i=1,2,3,a 为第i个水平 xij,i=1,2,a,j=1,2,n 为第i个水平(处理)下的第j次重复的观察值 njijixx1nxxii ainjaiiijxxx111 xanx1 设在每个水平下,总体的分布为 其中,,未知,但 ,称为方差齐性,这是方
2、差分析的前提 对于每个 ,定义 是无法控制的环境误差,称为随机误差aiNXii,1,2i2n21iXnjxijiij,21 0iiiijijxEE2,0Nijijiijx 22iijiijijxExVV 令 ,为水平Xi的效应,或第i个处理效应(treatment effect)显然,单因素方差分析的线性统计模型 aiia11aiii,2,1,aiii10ijiijxiinjaixijiij,2,1,2,1,1 固定效应和固定效应模型 若因素的a个水平是经过特意选择的恒定量,则该因素称为固定因素,这时各个水平的效应值i是固定的常量,称 i为固定效应。处理固定因素所采用的模型称为固定效应模型 比
3、较X1,X2,Xa的平均数有没有显著的差异等价于 aH210:aiHi,2,10:02 随机效应和随机效应模型随机效应和随机效应模型 若因素的a个水平是从该因素全部水平的总体中随机抽出的样本,其各水平的效应值i是随机变量,则该因素称为随机因素,i为随机效应。处理随机因素所用的模型称为随机效应模型比较的是整个总体的各水平的平均数是否存在差异0:20H8.2 固定效应模型 参数估计aiii,2,1aiHi,2,10:0)(0:iHiAijiijxjixijij,ixijiij.x ixiijxxijiijx.xxiijiijxiiiijiijx)(.)(.iijiijxxxxxxainjijTxx
4、SS112.eASSSS ainjiijixxxx112)(.)(ainjiijiiijixxxxxxxx1122).)(2)(.)(ainjiijiainjiijainjixxxxxxxx11112112).)(2)(.)(ainjiijaiixxxxn11212)(.)(ainjiijeaiiAainjijTxxSSxxnSSxxSS112121121naSSMSee1 andfT1anSSMSTT1 adfA)1(nadfe1aSSMSAAainjiijexxnaEMSE11211ainjiijxxnaE112111aiisaE121aia121 aiisEa12121aa221.)(1
5、1xxnaEMSEaiiAaiian122121.)(1xxEanaiiniinaan122/)1(1niiniiniiiniiaiiiniiaiiiniiaiiiiaiiiiiiiiiiaiiiiiiiiiiaiiiiaiinaanannaxaEnnaaxaxEnnaxxEnnaxxEananaxxExEnxExExxExExExxxxxxExxExxE1222122221222122211222112221222122212221221/)1()/(2/).(2/.).(2/)().(2/).)(2/).)(2).(/).(2)(2).)(2).()().(2)(2).)(2).()()(
6、).()(.)(比较两个方差是否相等,用F检验 aiiAeanMSEMSE12221iHi,0:0iHiA,0:eAMSEMSEH:0eAAMSEMSEH:eAeeAAdfdfFMSEMSMSEMSF,eAMSMSF 单尾上侧检验 单因素固定效应模型的方差分析表变异来源平方和自由度均方F均方期望处理间误差SSASSea-1a(n-1)MSAMSe总和SSTan-1 eAMSMS222n ainjijTxxSS112 ainjijanxanxx112222 ainjainjijijanxanxanxx1111222 222xxxxijij ainjijanxx1122anxC2 令ainjijC
7、x112 aiiAxxnSS12 aiiixxxxn1222 aiaiiianxannxanxnnxn11222aiiaiianxnaxanxxn12.1.2.21 aiianxxanxxn12221 aiianxxn1221ATeSSSSSSaiiCxn121 例表8-1,5个小麦品系株高调查结果 株号品 系IIIII1234564.665.364.866.065.864.565.364.663.763.967.866.367.166.868.571.872.170.069.171.069.268.269.568.367.5306.5322.0336.5354.0434.065.364.46
8、7.370.868.6 ix ix 例表8-1,5个小麦品系株高调查结果 株号品 系IIIII1234564.665.364.866.065.864.565.364.663.763.967.866.367.166.868.571.872.170.069.171.069.268.269.568.367.51682 x8.1133122ijx 96.11316425168222 anxC32.1472CxSSijT 例表8-1,5个小麦品系株高调查结果 =113296.7-113164.96=131.74 SSe=SST-SSA=147.32-131.74=15.58 株号品 系IIIII306.
9、5322.0336.5354.0434.065.364.467.370.868.6 ix ix anxxnSSiA21表5-5 不同小麦品系株高方差分析表 变异来源平方和 自由度均方FF0.05F0.01品系间误差131.7415.5842032.720.7841.95*2.874.43总和147.32248.4 多重比较 对于任意两组数据的平均数(方差齐性)存在问题 用不同的s2估计共同的2jijinnsxxt112211222jijjiinnsnsnsnsxxji22222jiss 解决方案用各个处理样本方差的平均数来估计2assssa222212nMSexxtji2nMSetxxji2|
10、2aiisa121MSeainjiijxxna112111ainjiijxxna112112t)1(2nat 成组法t检验与方差分析的对比每两组平均数比较所用的标准误,前者不相同,后者相同,因而减少了分析误差。方差分析时,自由度为a(n-1)大于成组法时的自由度2(n-1),提高了分析的辨别力。方差分析可通过适当的试验设计,减少试验误差。LSD法优缺点优点:计算简便,容易比较缺点:加大了犯类错误的概率 在多重比较时要求a组数据要相互独立 321xxx1排序:将需要比较的a个平均数由大到小排列品系号 平均数码 70.8 68.6 67.3 65.3 64.4顺序号 1x2x3x4x5x2求各平均
11、数间的差,列成下表0.92.02.91.33.34.22.23.55.56.41x2x3x4x5x4xjixx 3x2x顺序号平均数码 70.8 68.6 67.3 65.3 64.41x2x3x4x5x3求临界值求临界值Rk显著水平 0.05 0.01df误差项的自由度,df=a(n-1)k相比较的两个平均数之间所包含的平均数的个数(包括相比较的两个平均数)r(k,df)Duncan表值 平均数的标准差-标准误 aksdfkrRxk,),(432nMSesxnssnNxx222,变异来源平方和 自由度均方FF0.05F0.01品系间误差131.7415.5842032.720.7841.95
12、*2.874.43总和147.3224aksdfkrRxk,),(432k 2 3 4 5r0.05(k,20)r0.01(k,20)2.95 3.10 3.18 3.254.02 4.22 4.33 4.4020395.0578.0dfsxR0.05(k,20)R0.01(k,20)1.165 1.225 1.256 1.284 1.588 1.667 1.710 1.7384做显著性检验做显著性检验 a.列梯形表法 0.92.02.91.33.34.22.23.55.56.41x2x3x4x5x4xjixx 3x2xk 2 3 4 5R0.05(k,20)R0.01(k,20)1.165
13、1.225 1.256 1.2841.588 1.667 1.710 1.738*b.标记字母法:标记字母法:处理平均数差异显著性5%10%70.868.667.365.364.4 1x2x3x4x5x abbccABBCC0.92.02.91.33.34.22.23.55.56.41x2x3x4x5x4xjixx 3x2x*显著性检验结果(假设数据)AC4做显著性检验做显著性检验b.标记字母法:标记字母法:将全部平均数从大到小排列,在最大平均数上标以a;将该平均数与以下各平均数相比,凡相差不显著的,都标以a,直到某一个与之相差显著,则标以b;再以标有b的平均数为标准,与上方各个比它大的平均数
14、比,凡不显著的也一律标以b;再以标有b的最大平均数为标准,与以下未标记平均数比,凡不显著的继续标以b,直到某一个与之相差显著的平均数则标以c;如此重复下去,直到最小的一个平均数有了标记字母为止。b.标记字母法:标记字母法:处理平均数差异显著性5%10%70.868.667.365.364.4 0.92.02.91.33.34.22.23.55.56.41x2x3x4x5x4xjixx 3x2x*1x2x3x4x5x IV III I V II abcddABBCC b.标记字母法:标记字母法:处理平均数差异显著性5%10%70.868.667.365.364.4 0.92.02.91.33.3
15、4.22.23.55.56.41x2x3x4x5x4xjixx 3x2x*1x2x3x4x5x abcddABBCCACB假设8.3 随机效应模型 线性统计模型 是随机变量 与固定效应模型的区别1.2.3.ijiijxnjai2,1,2,1i2,0Ni222MSeEnMSEA0:0:220AHH 与固定效应模型的区别1方差分析的结论适用于全部水平的总体。2无需多重比较 随机效应模型方差分析表 an-1SST总和MSAMSea-1a(n-1)SSASSe处理间误差均方期望F均方自由度平方和变异来源eAMSMS222n8.3 补充说明 第 i 次处理(第i个水平)做了n i次观察(i=1,2,a)
16、(重复了ni次)总观察次数aiinN1ainjijTiNxxSS112.2ainjijixx11.1NdfTaiiiANxnxSS12.2.injijixx1.1adfAATeSSSSSSaNdfe 1线性可加性 2正态性 3方差齐性 相互独立和ijiijiijx,2,0Nij222221a 统计量 cqK3026.22aNsnsaNnacsnsaNqaiiiPaiiaiiiP1221111221113111 lglg充分大时,当iainn1min122aK其中 当各处理样本含量相同时11302621222cssanKaiilglg.1311naac 证:22122lg1lg1lg11lgiiaiiisnasnasnanasnanaq1311131113111311111311211111naanaaanaaaananaaannacai1221213026230262cssancqKilglg.第 8 章 结 束