1、17.4 双因子试验的方差分析 例1 农业生产中需要同时研究肥料和种子品种对农作物产量的影响。这样的问题就存在两个因子:一个因子是肥料的种类,一个因子是种子的品种。它们两者同时影响着农作物的产量。 -双因子试验双因子试验”。 2 一、双因子等重复试验的统计模型12,因子 有 个水平,rArA AA12,.因子 有 个水平sBsB BB(,)1, ;1,(2)现对因子 , 的水平的每对组合(称为水平组合)都作次试验(称为等重复试验),得到如下结果:ijABA Bir jst t 因素B因素A1A2ArA1B2BsB12,.,rsrsrstXXX21222,.,rrr tXXX11121,.,rr
2、r tXXX2 12 22,.,ssstXXX22122222,.,tXXX21121221,.,tXXX1 11 21,.,ssstXXX12112212,.,tXXX11111211,.,tXXX.3111,记总平均(一般平均)rsijijrs11,1,., ,siijjirs11,1,., ,rjijijsr,1,., ,1,., .水平 的(主)效应,水平 的(主)效应,iiijjjAirBjs22,(0,),1,., ,1,., ,1,., .,ijkijijkijkijkijXNir js kt 设各独立,均为未知参数.110,0.rsijij则41,., ,1,.,现()不一定成
3、立ijijir js11,1,., ,1,., .0,0.若上式不成立,记 ()水平 和水平的交互效应,易证()()ijijijijrsijijijABir js21121,., ,1,.,(0,),1,., ,1,., ,1,., .0,0.,.当() 0对于一切的都成立时,称因子A与因子B对响应无交互作用,否则称有交互作用。当因子A与因子B对响应无交互作用时,模型可写成各独立,均未知 ijijkijijkijkijkrsijijijir jsXNir js kt称为可加(主)效应模型5211112,(0,),1,., ,1,., ,1,., .0,00,0.,.当因子A与因子B对响应有交互
4、作用时,模型可写成()各独立,交互效应模型,()()()均未知 ijkijijijkijkijkrsrsijijijijijijijXNir js kt6 二、 可加效应模型的统计分析12,rArA AA因素 有 个水平,12,.sBsB BB因素 有 个水平(,)1, ;1,ijABA Bir js现对因素 , 的水平的每对组合只作一次试验(此时无法分离交互作用与误差),得到如下结果: 因素B因素A1A2ArA1B2BsB11X.rsX2rX1rX2sX22X21X1sX12X7111,rsijijrs记总平均11,1,., ,siijjirs11,1,., ,rjijijsr,1,., ,
5、1,., .水平 的效应,水平 的效应,iiijjjAirBjs22,(0,),1,., ,1,., .,ijijijijijijXNir js 设各独立,均为未知参数.110,0.rsijij则801121110212121:0,:,.,:0,:,.,rrssHHHH不全为零不全为零.,1,., ,1,., .ijijir js即0,1,., ,1,., .注意到现在不存在交互作用,故 ()ijir js2112,(0,),1,., ,1,., .0,0.,.ijkijijijijrsijijijXNir js 模型可写成各独立,均未知分别检验假设91111111,1,., ,1,., .r
6、ssrijiijjijijjiXXXX irXXjsrssr记号:211rsTijijSXX总偏差平方和(总变差)211rsEijijijSXXXX误差平方和21因子 的效应平方和rAiiASsXX21因子 的效应平方和sBjjBSrXX10011(1)1,(1)(1) ,(1)(1)1,(1)(1) 当成立时,显著性水平 的拒绝域为:W=AAEASrHFF rrsSrsFFrrs1TABESSSS性质:()02(1)1,(1)(1)(1)(1)1,(1)(1) 当成立时,显著性水平 的拒绝域为:W=BBEBSsHFF srsSrsFFsrs2221212(2),(1)(1)11,11riiE
7、AsjjBsSSEErsrrrSEss111111,1,., ,1,., .rssrijiijjijijjiTXTX irTXjs计算:22221112211,1,.rsrTijAiijisBjETABjTTSXSTrssrsTSTSSSSrrs12 1AASMSr1BBSMSsAAEMSFMSBBEMSFMS(1)(1)EESMSrs双因素无重复试验的方差分析表方差来源平方和自由度均方F比因素A因素B误差总和TSESBSAS1rs(1)(1)rs1s1r 13例2 假定对3个小麦品种和3块试验地块进行区组设计试验,得到如下的数据: 表 小麦品种区组试验数据 小麦品种(A)试验地块(B)总和B
8、1B2B3A1258279242779A2302314336952A3321318327966总和8819119052697211816759rsijijX14在这个问题中我们关心的是小麦的不同品种之间在产量上的差异。由于地块不同对小麦的产量也会有影响,因此在比较试验结果时,要扣除地块的影响之后再来比较品种的差异。假定品种与地块之间无交互效应,则可对上述数据进行双因子可加效应模型的方差分析。 15双因素无重复试验的方差分析表方差来源平方和自由度均方F比F值=0.05因素A7232.666723616.333312.506.94因素B168.0000284.0000 0.296.94误差1157
9、.33334289.3333总和8558.0000816在这个问题中我们所关心的是因素A的效应,由方差分析表知,原假设不成立,即认为小麦品种的产量之间有显著差异。在这里,品种3的单产最高,而品种1的产量最低,因此可以断定品种3明显地优于品种1。 1712nkn2i=1j=1i12nik2i=1设X ,X ,X 为n个相互独立同服从N(0,1)分布的随机变量,又设 ,其中Q(1,2, ) 是秩为 的关于X ,X ,X 的非负二次型,则Q柯赫伦(C(1,2, ) 相互独立,且分别服从自由度为 的分布的充要条件是 ofn chran)定理:iiiiiQXikfikf1812,因子 有 个水平,rAr
10、A AA12,.因子 有 个水平sBsB BB(,)1, ;1,(2)现对因子 , 的水平的每对组合(称为水平组合)都作次试验(称为等重复试验),得到如下结果:ijABA Bir jst t 因素B因素A1A2ArA1B2BsB12,.,rsrsrstXXX21222,.,rrr tXXX11121,.,rrr tXXX2 12 22,.,ssstXXX22122222,.,tXXX21121221,.,tXXX1 11 21,.,ssstXXX12112212,.,tXXX11111211,.,tXXX. 三、 交互效应模型的统计分析19211112,(0,),1,., ,1,., ,1,.
11、, .0,00,0.,.模型可写成()各独立,交互效应模型,()()()均未知 ijkijijijkijkijkrsrsijijijijijijijXNir js kt分别检验假设0112111:0,:,.,rrHH不全为零0212121:0,:,.,ssHH不全为零0311121311:0,:,.,() ()()()()不全为零.rsrsHH201111,rstijkijkXXrst记号:11,1,., ,1,., ,tijijkkXXir jst111,1,., ,stiijkjkXXirst111,1,., .rtjijkikXXjsrt 212111rstTijkijkSXX总偏差平方
12、和(总变差)21rAiiASstXX因素 的效应平方和21sBjjBSrtXX 因素 的效应平方和211,rsA BijijijA BStXXXX 交互效应平方和2111rstEijkijijkSXX误差平方和22011(1)1,1(1)1,1 当成立时,显著性水平 的拒绝域为:W=AAEASrHFF rrs tSrs tFFrrs t222122111221(2),(1)11(),11(1)(1)(1)(1)性质:()TABA BEriiEAsrsjijjijBA BSSSSSstSSEErs trrrttSSEEssrsrs02(1)1,1(1)1,1 当成立时,显著性水平 的拒绝域为:W
13、=BBEBSsHFF srs tSrs tFFsrs t23031(1)(1)(1)(1),1(1)(1)(1),1 当成立时,显著性水平 的拒绝域为:W=A BA BEA BSrsHFFrsrs tSrs tFFrsrs t11111111,1,., ,1,., ,1,., ,1,., .rsttijkijijkijkkstrtiijkjijkjkikTXTXir jsTXirTXjs 计算:2222111122221111,11,().rstrTijkAiijkisrsBjA BijABjijETABA BTTSXSTrststrstTTSTSTSSrtrsttrstSSSSS 24 1A
14、ASMSr1BBSMSs11A BA BSM SrsAAEMSFMSBBEMSFMSABABEMSFMS1EESMSrs t双因素试验的方差分析表方差来源平方和自由度均方F比因素A因素B交互作用误差总和TSESA BSBSAS1rst (1)rs t (1)(1)rs1s1r 25例3 为了比较3种松树在4个不同的地区的生长情况有无差别,在每个地区对每种松树随机地选取5株,测量它们的胸径,得到的数据列表如下。 松树数据表松树种类地区1234123, 15, 26,13, 2125, 20, 21, 16, 1821, 17, 16,24, 2714, 17, 19,20, 24228, 22,
15、 25,19, 2630, 26, 26,20, 2819, 24, 19,25, 2917, 21, 18,26, 23318, 10, 12,22, 1315, 21, 22, 14, 1223, 25, 19, 13, 22 18, 12, 23,22, 1926这是一批等重复的两种方式分组数据,记树种因素为A,地区因素为B,则A因素有3个水平,B因素有4个水平,总共有12个水平组合,每个组合(单元)有5个重复观测。 将树的胸径作为度量树的生长情况是否良好的数值指标,我们的目标是:由以上数据来判断不同树种及不同地区对松树的生长情况是否有影响(好或坏)? 这里要考虑的影响有三种:树种的单独
16、影响(A因素主效应),地区的单独影响(B因素主效应),以及不同树种和不同地区的结合所产生的交互影响(AB因素的交互效应)。这是一个典型的等重复双因素方差分析模型。 27输出各单元总和及因素水平总和: 松树数据的总和表单元总和B1B2B3B4水平总和A19810010594397A2120130116105471A3758410294355水平总和2933143232931223211126309rstijkijkX28方差来源平方和自由度均方F比F值=0.05因素A344.93332172.46679.453.19因素B46.0500315.35000.842.80交互作用113.600061
17、8.93331.042.30误差875.60004818.2417总和1380.183359双因素方差分析表29 进一步考查A因素不同水平的均值。注意到A因素的第二水平为最大:23.55,而第三水平的均值为最小:17.65,可以认为树种2的生长情况优于树种3。能够得出这个结论,得益于观测的等重复性。 然后再来看B因素的主效应,即在扣除松树种类的效应后,不同地区对树的胸径的影响。由方差分析表知, B因素的主效应不显著,即不同的地区对树的胸径没有显著影响。最后来看AB因素的交互效应,即在扣除两种效应后,由不同树种和不同地区的结合而产生的对树的胸径的影响,这种影响可以解释为某些地区特别适合(或特别不适合)某个树种的生长。结果也不显著。 首先来看A因素主效应,即在扣除地区效应后, 松树的不同种类对树的胸径的影响。由方差分析表可以看出,A因素主效应是显著的,即松树的不同种类对树的胸径有显著影响。2022-5-31课件结束!