1、第十四章 不完全区组设计和统计分析n第一节 不完全区组设计的主要类型n第二节 重复内分组和分组内重复设计的统计分析n第三节 简单格子设计的统计分析n第四节 平衡不完全区组设计的统计分析第一节 不完全区组设计的主要类型n一、田间试验常用设计的归类n二、重复内分组和分组内重复设计n三、格子设计n四、平衡不完全区组设计一、田间试验常用设计的归类n完全区组(complete block):每一区组包含全套处理。n不完全区组(incomplete block):即一套处理分成几个区组,或一个区组并不包含全部处理,但同样要通过区组实施地区控制。 二、重复内分组和分组内重复设计n重复内分组设计(block
2、in replication):将供试品种分为几个组,看作为主区,每个组内包含的各个品种看作为副区,重复若干次,主副区都按随机区组布置的设计。n例如20个品种,分为4组,每组包含5个品种,若重复3次,则田间布置可设计如下图: 重复内分组设计的田间布置n该例中重复内分组设计的自由度分析如下:重复重复重复区组(1)(2)(3)(4)(5) (6)(7)(8)(9)(10)(11) (12)420111017751591912331815816621381713121913918811271615251612620103146201441171471994111018115n变 异 来 源 DFn重
3、 复 2n组 间 3n误 差 (Ea) 6n组内品种间 16n误 差 (Eb) 32n总 59n组内品种间比较的误差将为: ;/32bEn各组平均数间比较的误差将为: ;n不同组品种间比较的误差(仿照裂区的情况)将为: 。n由于Ea与Eb常取不同数值,Ea往往大于Eb,例如 =3,若如此,则:n组内品种间比较的误差将为:n不同组品种间比较的误差将为:/5)(2/3)(aE/5)/5(2/3)(4abEEbaEE /32bE/1514535432515432bbbabEEEEEn两者比值为:n即不同组品种间比较的方差将比组内品种间比较的方差大40%,因而像这种不完全区组设计的方法,并不能保证任何
4、两个品种间比较具有相近的精确度。n分组内重复设计(replication in block):将供试材料分组后放在连片土地上的几组随机区组试验,通过土地连片而进行联合分析与比较。 1.47/5)/3(2/15)(14bbEE 分组内重复设计 分组1分组2分组3分组4区组(1)(2)(3)(4) (5)(6)(7) (8)(9)(10)(11)(12)191618131511541898181917121114352710716201915121313510692017161114152149710171820141312423686三、 格子设计n格子设计(lattice design):为了
5、克服重复内分组设计中组间品种比较和组内品种比较精确度悬殊的问题,对品种分组的方法可考虑从固定的分组改进为不固定的分组,使一个品种有机会和许多其他品种,甚至其他各个品种都在同一区组中相遇过。n(一) 格子设计的类别n平方格子设计(squared lattice ):供试品种数为区组内品种数的平方,区组内品种数为p,供试品种数为p2;n立方格子设计(cubic lattice ):供试品种数为区组内品种数的立方,区组内品种数为p,供试品种数为p3;n矩形格子设计:区组内品种数为p,供试品种数为p(p+1) 。 n(二) 平方格子设计n1. 仿照随机区组式的设计 按品种分组方法的变换次数有:n(1)
6、 简单格子设计(simple lattice)品种分组方法为二种,试验重复次数为2或2的倍数。 重复 I重复(1)1 2 3(4)1 4 7区组(2)4 5 6(5)2 5 8(3)7 8 9(6)3 6 9n(2) 三重格子设计(triple lattice):品种分组方法为三种,即在简单格子设计二种分组方法的基础上再增加对角线分组一种,重复次数为3或3的倍数。 n(3) 四重格子设计(quadruple lattice):在三重格子设计的基础上,再增加对角线一组, 重复 I重复重复 III(1)1 2 3(4)1 4 7(7)1 5 9区组(2)4 5 6(5)2 5 8(8)2 6 7(
7、3)7 8 9(6)3 6 9(9)3 4 8 n(4) 平衡格子设计(balanced lattice):品种分组方法增加到使每一对品种都能在同一区组中相遇一次。 分组法X分组法Y分组法Z分组法L区组(1)1 2 3 4 5(6)1 6 11 16 21(11)1 7 13 19 25(16)1 8 15 17 24(2)6 7 8 9 10(7)2 7 12 17 22(12)2 8 14 20 21(17)2 9 11 18 25(3)11 12 13 14 15(8)3 8 13 18 23(13)3 9 15 16 22(18)3 10 12 19 21(4)16 17 18 19
8、20(9)4 9 14 19 24(14)4 10 11 17 23(19)4 6 13 20 22(5)21 22 23 24 25(10)5 10 15 20 25(15)5 6 12 18 24(20)5 7 14 16 2355四重格子设计方法 n2. 仿照拉丁方的格子设计n(1) 平衡格子方设计(balanced lattice square) n重复数r=(p+1)/2,每对品种在行或列区组中共相遇一次; 重复重复重复重复(1) 1 2 3(4) 1 4 7(7) 1 5 9(10) 1 6 8区组(2) 4 5 6(5) 2 5 8(8) 2 6 7(11) 2 4 9(3) 7
9、 8 9(6) 3 6 9(9) 3 4 8(12) 3 5 733平衡格子设计 33平衡格子方设计在行或列中相遇一次,r r =(p p +1)/21 2 31 6 84 5 69 2 47 8 95 7 3n重复数r=(p+1),每对品种在行及列区组中均相遇一次,亦即共相遇二次。 159131234111166261014658712251537111511129101483948121616151413713104171214110158821311927161016351363121596451411444平衡格子方设计在行及列中共相遇二次,r r=(p p+1) n(2) 部分平衡格
10、子方设计(partially balanced lattice square):重复次数少于最小平衡重复数。与三重、四重格子设计类似,不一定每一对品种都在行或列区组中相遇。n格子设计的优点是:考虑了供试品种间平衡比较的问题。但由于供试品种数多,这常只能实施部分平衡,而事实上很难实施完全平衡,因为完全平衡所需的重复次数导致试验规模过大。n育种工作中产量比较在早、中期阶段,因供试材料多需要考虑适合大量处理的设计,但这时每份材料的种子数少,一般不可能进行小区较大的精确试验,因而实际应用中部分平衡的格子设计已可满足要求。四、平衡不完全区组设计n平衡不完全区组设计(balanced incomplete
11、 block design):设计的供试处理数不多,不须按格子设计那样每一重复包含有区组大小为k的k个区组,而可将各重复寓于全部区组之中,区组数与区组大小不一定相等,即全试验包括大小为k的区组共t (处理数)或 t 倍个。 图14.7 一种平衡不完全区组设计n例如品尝试验,对于一个人的味觉来说,品尝的对象增加太多时鉴别差异的灵敏度便下降,因而每个人只能品尝一部分。图14.7的情况,若有7个水果品种供鉴评,每人品尝3个,请7位品尝家作鉴评,便共品尝21次,每个品种品尝3次。此处每位专家区组(1) (2) (3) (4) (5) (6) (7)123456723456714567123 便是一个区
12、组,每区组包含3个品种。这时尽管每人并未将7个品种全部鉴评过,但因是均衡的,每个品种至少和其他6个品种比较过1次。这一试验可增加至14位专家则每对品种相遇2次,21位专家则相遇3次。因而可以请许多专家作出综合评判。第二节 重复内分组和分组内重复设计的统计分析n一、重复内分组设计的统计分析n二、分组内重复设计的统计分析一、重复内分组设计的统计分析n重复内分组用于品种(系)试验时有二种情况:一是大量品种(系)间的比较目的在于选拔高产优系(固定模型试验);另一是从一个群体内随机抽出大量家系进行试验,通过供试的样本推论总体的情况(随机模型试验)。 n假定重复内分组设计的供试品种为m=ab个,分a组,每
13、组有b个品种(系),重复r次,则重复内分组设计的线性模型为: (141) n固定模型时: , , , ;n随机模型时: Ak ,Bkl , 。 jklkljkkjjklBAykkA00klklBjk)(0,2eNjkl)(0,2N)(0,2AN)(0,2BNjk)(0,2eNjkl)(0,2N重复内分组设计的自由度及期望均方变 异 来 源DFMSEMS固定模型随机模型 重 复 r-1MS1 分组(区组,主区) a-1MS2 重复分组(Ea) (r-1)(a-1)MS3 分组内品种(系) a(b-1)MS4 重复分组内品种 (系)(Eb) a(b-1)(r-1) MS5222abbe222Aer
14、bb22eb22Br22222abbe2222ABerbrb22eb22Brn固定模型时分组间差异的测验,F = MS2/MS3 ;n分组内品种(系)间差异的测验 F = MS4/MS5 。n重复内分组设计着重在分组内品种间的比较,其n分组间比较,其 rESEbrbESEa(143)(142)n不同组品种间比较,其 (144) n随机模型时分组间变异的测验: (145)n分组内变异的测验: F=MS4/MS5 (146) aEEarSEab1)(14352MSMSMSMSFnF=(MS2+MS5)/(MS3+MS4)时,其有效自由度可用 Satterthwaite公式计算: (147)n(14
15、7)中fi为各均方对应的自由度。由(145)及(146)的关系可分别估计出及。 )/()()/()(42432324325252222521fMSfMSMSMSfMSfMSMSMS二、分组内重复设计的统计分析n分组内重复的设计的线性模型为: (148) n固定模型时: , , ;n随机模型时,Ak ,Bkl ,jklkjklkjklBAykkA00klklB0kjkjjkl)(0,2N)(0,2AN)(0,2BNn 。分组内重复设计的自由度及期望均方jkl)(0,2N变 异 来 源DFMSEMS固定模型随机模型 分 组 a-1MS1 分组内品种 a(b-1)MS2 分组内重复(区组) a(r-
16、1)MS3 重复组内品种(E) a(b-1)(r-1)MS422Arb22Br22b222222ABrrbrb22Br22bn固定模型时分组间差异的测验,F=MS1/MS4;n分组内品种(系)间差异的测验F=MS2/MS4。n分组内重复设计着重在分组内品种间的比较,其 (149)n 分组间可以比较,其 (1410)rESE/rbESE/n不同组品种间的比较,其 (1411)n随机模型时分组间差异的测验: (1412)n其有效自由度按Satterthwaite公式。分组内品种间差异测验: F=MS2/MS4 (1413)EbabrbSE)(113241MSMSMSMSF 由(1412)及(141
17、3)测验 及 。n在各分组品种(系)均为总体一随机样本的前题下,可假定分组平均数相等,从而对品种(系)平均数作统一调整。n重复内分组和分组内重复是目前品系产量早期比较试验较常用的设计,并常用于遗传参数的估计,尤其前者更为常用。2A2B第三节 简单格子设计的统计分析n一、简单格子设计分析的基本原理n二、简单格子设计的例题一、简单格子设计分析的基本原理n设有9个品种,重复2次的简单格子设计试验,这9个品种分别给以二位数的代号如下:n品种按横行、纵行分组,分别设置为一个重复,则其分组安排如下:1 2 311 12 134 5 621 22 237 8 931 32 33n由重复所得产量以x表示,重复
18、以y表示,各品种总和以t表示,则可以将试验结果整理如表14.3的形式(虚线表示区组)。 重复11 12 1321 22 2331 32 33重复11 21 3112 22 3213 23 33x11x12x13X1y11y12y13Y1t11t12t13T1x21x22x23X2y21y22y23Y2t21t22t23T2x31x32x33X3y31y32y33Y3t31t32t33T3X1X2X3XY1Y2Y3YT1T2T3TX 组Y 组品种总和简单格子设计试验结果符号表 n横行总和作为试验因子A(X分组)的效应,纵列为B(Y分组)的效应。此试验可看作为每个因子各具3个级别的二因子试验,其自
19、由度为:n由于重复中A因子的效应和区组效应混杂,重复 中B因子与区组混杂,整个试验相当于一个虚拟的二因子部分混杂试验,其混杂的效应是A与B主效。DFA2B2AB4总8n若将重复当作区组,那么本试验可按随机区组的方法进行方差分析,其自由度为(左图)n现在每一重复又划分为区组,要把区组的变异从误差中扣去以减小试验误差,故其自由度分析将为(右图)DF重复 1品种 8误差 8总 17DF 重复 1 区组(Eb) 4 品种 8区组内误差(Ei) 4总 17n由t11、t12、t33计算品种平方和中包含有区组的效应,夸大了品种的效应;n由X1 、X2 、X3 ,Y1 、Y2 、Y3计算区组平方和则又包含了
20、品种的效应,夸大了区组的效应。n关键:从品种效应中扣去区组部分,得到可以共同比较的调整的品种平均数及品种平方和;估计出除去品种效应的区组间变异,得到一个无偏的试验误差估计,进行合理的统计推断。n(一) 品种调整平均数的计算n 1=T1/6 为A因子第一级别的未调整平均数;n 1=T1/6 为B因子第一级别的未调整平均数。n如品种12的未调整平均数为v12,则:n (1414)n其中,m为全试验总平均数。tt12 1 . . 212 1 . . 2m (tm) (tm) (ttm)n(1414)说明任一品种总的离均差为横行离均差、纵 行离均差以及横行纵行互作效应三部分之和。n令: Ai表示不包含
21、区组效应A因子效应估计值;n Bi表示不包含区组效应B因子效应估计值。n则 :A因子第一个级别的估计值 , B因子第一个级别的估计值31YAi3 1XBin又令Ab 表示与区组混杂的A因子效应估计值,nBb 表示与区组混杂的B因子效应估计值n则 A因子第一个级别的估计值 , B因子第一个级别的估计值 若A0,B0分别表示X组及Y组综合在一起未调整的A因子及B因子效应,则:31XAb3 1YBb n求A及B的调整值比较合理的方法是以Ai、Bi及Ab、Bb各分组所获得结果的可靠程度进行加权平均,这里Ai、Bi效应没有区组效应在内,可用 衡量其可靠程度,其中 代表区组内误差的理论方差。nAb、Bb效
22、应混有区组效应,区组效应越大,Ab、Bb估计A及B的可靠程度越小,可用 衡量其可靠程度, 代表重复内区组间的理论方差(以小区为单位)。1010 在第一级别即为2在第一级别即为2tBBBtAAAbibi21w22)(1w2)(1415) (1416)n当区组间没有真实差异时, ,Ai、Bi和Ab、Bb 同等重要,故: wwBwwBBwwAwwAAbibi这样2)(222bibiBBBAAAn得到A及B的估计值后,可得: (1417)n因未调整的(v0-A0-B0+m)与调整后的(v -A-B +m )应是相等的,两者相减 v-v0=(A-A0)+(B-B0) (1418)n表示调整的品种平均数可
23、由v0、(A-A0)及(B-B0)三部分计算。 )()()(调整时)()()(未调整时mBAvmBmAmvmBAvmBmAmv 000000n由(1416)及(1415)可得:n令 n则 )(bAAwwwwAA00)(bBBwwwwBB00wwww)()(bbBBAAvv000(1419) 62623,3,3,311110111110111111111YXBBBXYAAAYBXBXAYAbibibibin以品种11为例,需求出A及B各第一级别的A0、Ab、 B0及Bb,其中n若令以上二矫正数分别以及代表,则: (1420) n其中vef 中的ef代表以二位数字表示的某品种,在具有二个重复参试材
24、料为p2的简单格子设计中 及 的通式可写为: 636636于是1111110111111101 YXYYXBBXYXXYAAbbbaefCCvv0aCbC n如果简单格子设计,每种分组重复二次,全试验共有四次重复,则: pYXCpXYCffbeea22 pYXCpXYCffbeea44 (1421)(1422)n 在品种平均数的横行及纵行旁求出 , 求 出 , 就可计算出各个品种的调整平均数。但为便于计算,一般直接在品种总和表旁求出品种总和的矫正数,计算出各个品种的调整总和,再求调整平均数。n2次重复时调整品种总和为: (1423) aCbCaaCCbbCC)2()2(ffeeefefYTXT
25、pttn(二) 与 及w与 的估计n上述品种调整平均数的计算需按 , 进行调整。n 可以由区组内均方Ei直接估计,主要需估计出 。n区组间均方的计算需由二部分平方和合并,要了解清楚这二部分平方和的计算,从一个四次重复的试验比较容易说明。2 2)( w 21 w2)(1 w22)( 表14.4 四次重复简单格子设计试验结果符号表X 分 组 法Y 分 组 法111213g11111213g12111213111213212223g21212223g22212223212223313233g31313233g32313233313233G1G2g13g23g33G3g14g24g34G4x11x12
26、x13X1y11y12y13Y1t11t12t13T1x21x22x23X2y21y22y23Y2t21t22t23T2x31x32x33X3y31y32y33Y3t31t32t33T3X1X2X3XY1Y2Y3YT1T2T3Tn在X、Y 两种分组各有重复时,从相同品种组的区组两次重复间的差异的效应扣去整个重复间差异的效应,可以估计出区组效应。其计算方法为(1424)二式之和。 92)(32)()()(92)(32)()()(243234332242321413221232312222121211 GGggggggGGgggggg(1424)n这部分平方和相当于A因子与重复的互作和B因子与 重
27、复的互作之和,称为成分(a)。n两种分组方法各对应X1与Y1之间差异的效应扣去整个分组方法总差异间的效应,也将属于区组的效应,其计算方法为(1425)二式之和。 94)(34)()()(94)(34)()()(22332222112233222211 YXYXYXYXYXYXYXYX(1425)n这部分平方和相当于A因子与分组方法的互作和B因 子与分组方法的互作之和,称为成分(b)。n因 T1-2X1=(X1+Y1-2X1)=Y1-X1n故成分(b)也可写为: (1426) 34)2()2()2()2()2()2(233222211233222211YTYTYTXTXTXT94)2(2YXn在
28、33简单格子设计具有4个重复时,成分(a)具有 2+2=4个自由度,成分(b)也具有2+2=4个自由度,(a)与(b)两者相加共有8个区组自由度。在只有2个重复时,显然成分(a)无从计算,因此仅由成分(b)代表区组的平方和。不过(1426)中分母将相应改变为23及29。 n分析成分(a)均方所估计的方差分量为 ,其中 为区组内误差, 为区组间的方差。n成分(b)均方所估计的方差分量为 ,这是因为成分(b)的两部分是从同一材料计算来的,所以只估计了 。n当只有二个重复时,只能由成分(b)计得区组的均方( ),但是由方差分析原理,正常的区组项均方应由 组成。所以对区组的理论方差的估计要作适当调整。
29、 22bip2i2b22bip2122ibp2122bip21222bip)(n所以, (1427) n当有四次重复时,成分(a)与(b)综合的均方所估计的分量为,即ibbiibbibbibibEEpEEEpEEpEpE2)(或2222121222222 ibEEw21n所以, (1428) n(三) 品种平均数间比较的误差计算n同区组内品种间比较:34)(或34343443ibbiibbibbibEEpEEEpEEpEE2222 ibEEw43 n异区组品种间比较: n不论区组异同,品种间相互比较:prEwwwprwpSEi121)(1)2(142)(1prEwwwprwpSEi(1429)
30、(1430) n若 由成分(a)单独估计,则 , 。当EbEi时, ,上列各公式均变为 ,这就类似随机区组时的公式。当Eb很大时, 接近于1,(1429)、(1430)、(1431)三公式相应变为: )12(141)(1)(1prEwwwpprwSEiwbEw1ibibEEEE0rEi2(1431) , 和n这种情况下,A与B的效应相当于由Ai及Bi单独估计,Ab及Bb对A、B均未提供信息。n(四) 品种平方和的调整n直接按格子设计进行测验,则要对品种平方和进行调整,对于简单格子设计,其矫正数为: pprEi1pprEi213pprEi (1432)n其中,Ku为未调整的成分(b)平方和,Kb
31、为调整的成分(b)平方和。nKb由(1425)计算,表14.3中的Ku可由下式计算: buKKww)(118618622YYYYXXXX232221232221(1433) 表14.5 简单格子设计方差分析表变 异 来 源DF 重复 r-1 区组(调整的) r(p-1) 2(p-1) 2(p-1) 品种(未调整的) p2-1 区组内误差(Ei) (p-1)(rp-p-1) 总 r p2-1)(成分)(成分ban (五) 期望均方n简单格子设计用于单因素试验,其期望均方和随机区组的情况一样,区组内误差估计了 ,调整的品种均方估计了 (随机模型)或 (固定模型)。n二、简单格子设计的例题n(一)
32、二次重复简单格子设计的例题2)(22vr)(22vrn 例14.1 表14.6为一个55大豆品种重复二次简单格子设计的试验结果。其田间排列是随机的。随机的步骤:n 在每一重复内分别独立地随机安排区组;n 在每一区组内分别独立地随机安排品种代号;n 将各品种随机决定品种代号。表14.6 55大豆品种简单格子设计的产量试验结果(r r=2,kgkg/区)n分析步骤如下:n1. 从表14.6计算各区组总和(这里即Xe及Yf),重复总和(这里即X及Y)各品种(未调整)总和(tef)以及Te 、Tf值。并按随机区组进行方差分析。结果列于表14.7。n随机区组方差分析结果品种间无显著差异。进一步再按格子设
33、计分析。表14.7 随机区组方差分析表2. 计算消去品种效应的区组平方和。 由成分(b)单独估计。按(1425),r =2时为:2222)()(pYXpYTXTffee2)2(222变异来源DFSSMSF重 复1212.18品 种24559.2823.301误 差24720.3230.01总491491.78n在表14.6上分别计算Te-2Xe及Tf -2Yf值,代进上式得:n3. 列出分解有区组变异的方差分析表(表14.8)。252392)2(2895231)(9)(15)(48)(8)(61)(2222222=501.84 表14.8 55简单格子设计(r r= =2)方差分析表变 异 来
34、 源DFSSMSF 重复1212.18 品种(未调整)24559.2823.30 重复内区组(调整) 8501.8462.73(Eb)4.59* 区组内误差16218.4813.66(Ei) 总491491.78n调整后重复内区组间的变异很显著,说明将区组划出是很必要的。n4. 计算调整的品种总和( )。n由(1423),在简单格子设计两个重复时:eft62.7313.6662.73bibEEEwwww=0.7820 50.7820p=0.1564 n调整品种总和 = n在表14.6中分别计算 及 然后计算各品种调整的总和 ,以品种(1)为例:n =30+9.5-1.4=38.1。其余类推,全
35、部结果列于表14.6的末端。n5. 计算品种平均数间比较的误差。n同区组品种平均数间比较:eft)2()2)(ffeeefYTXTpt)2)(eeXTp)2)(ffYTpeft11t 2.817.8980.15641213.661prESEi异区组品种平均数间比较:2.998.9650.156421213.66)2(1prESEi全试验品种平均数相互比较:2.938.61060.782021213.66)12(1prESEi一般用2.93作标准误进行品种间比较即可。n6. 计算调整的品种平方和再进一步测验品种差异的显著性.n按(1432)品种平方和的矫正数为: buKKww)(1其中Ku仿(1
36、433)为:2222rpYrpYrpXrpXfe2122121221 350.0025392587808025289568613222222222w501.84.00.07321)3500.008945/00.7820(1559.28Kb为调整的区组成分(b)平方和,即表14.9中的501.84。 w=1/Ei=1/13.66=0.073211/(2Eb-Ei)=1/(262.73-13.66)=0.008945=559.28+85.30=644.58故调整品种平方和 调整的品种均方及F 测验如下:按照简单格子设计的分析结果调整以后的品种均方比 未调整时增大了,误差比随机区组时降低了,因而提高
37、了试验的精确性。它与随机区组设计相比较,所提高的效率可估计如下: 变 异 来 源自由度平方和均 方F品种(调整)24644.5826.861.97区组内误差16218.4813.66即提高了74。n本试验品种间无显著差异,所以不必进一步再做品种平均数间的比较。% 117417.2230.01)60.78202(113.6630.01130.01格子设计有效误差均方随机区组误差均方相对效率)(priEn(二) 四次重复简单格子设计的例题n例14.2 上例55大豆试验,原为一个四次重复的简单格子设计,若表14.6中的是第一重复及第三重复,今将第二重复,第四重复的结果补充列在表14.9中,重复与重复
38、属同一种分组,重复与重复属另一种分组。n分析步骤如下:n1. 从表14.6及14.9计算各重复各区组的总和g,重复总和G,同品种的两个区组总和Xe及Yf ,各品种 表14.9 55大豆品种简单格子设计、重复的产量结果(r r=2,kgkg/区) (未调整)总和tef以及Te 、Tf值。n按随机区组预先进行方差分析(表14.10)。随机区组方差分析结果品种间无显著差异,进一步按格子设计分析。表14.10 随机区组方差分析表变异来源DFSSMSF重 复r-1=4-1=3226.19品 种p2-1=25-1=24791.2432.961.53误 差(r-1)(p2-1)=721547.5621.49
39、总 992564.99n2. 计算消去品种效应的区组平方和。n这里包括成分(a)及成分(b)两部分。n成分(a)的计算: 2243221243221)()()()(pGGGGpgggg225284)(8777)(8068)(6881)(6872)(3222222164.72252357)(392361)(289 22n成分(a)的另一种计算方法可适用于更多次重复的分析。n即由相同分组方法内品种组与二次重复的交互作用项计算。n 区组平方和(区组总SS )222)(pYXpg22602.1850749650-584756132222222n 重复间平方和(重复SS )222)( pYXpG2212
40、8.1850749650-5357392361289222222 品种组间平方和(品种组SS) )(222pYXpYXfe2222309.28507496501017114210422222 n 成分(a)=区组总SS -重复SS -品种组SS =602.18 -309.28-128.14=164.72n计算结果与前相同。n成分(b) r=4时,为:n3. 列出分解有区组变异的方差分析表(表14.11)。621.28100749)-2(6502048)(3)(29)(63)4242222222 )()()( 2222pYXpYTXTffee表14.11 55简单格子设计(r r= =4)方差分
41、析表4. 计算调整的品种总和。0.073513.6011iEw )(成分)(成分ba变 异 来 源DFSSMS 重 复 r-1=3226.19 品种(未调整) p2-1=24791.2432.96 重复内区组间 r(p-1)=16786.0049.12(Eb) 2(p-1)=8 2(p-1)=8164.72621.28 区组内误差 (p-1)(rp-p-1)=56761.5613.60(Ei) 总 r p2-1=992564.99 0.016413.6049.124343ibEEw0.63510.01640.07350.0164-0.0735wwww-0.127050.6351peft)22(
42、ffeeefYTXTpt() 调整品种总和 )2(eeXTp)2ffYTp(15t在表14.9中分别计算出及然后计算各品种调整的总和,方法同上例。如品种15 =72+(+8.8)+(-61)=74.7,余类推。全部计算结果列于表14.9的末端。5. 计算品种平均数间比较的误差。1.963.8320.12701413.601prESEi同区组品种 异区组品种 2.064.2640.127021413.6021prESEi 全试验品种 2.034.120)150.63512(1413.60)12(1prESEi 6. 计算调整品种平方和并进一步测验品种差异的 显著性。 309.2825274965
43、052171157142104222222222121 222rpYXrpYXKfeu)buKKww(1791.24621.28)309.280.07350.0164(10.6351791.24此即计算成分(a)时的品种组间平方和一项。 调整品种平方和 =791.24+154.33=945.57n调整的品种均方及F 测验如下:n按格子设计分析,扣除了重复内区组间的变异,降低了试验误差,使品种间的变异呈现出显著性。n7. 进一步可以计算出调整的平均数,并由全试验品种SE 计算LSD 进行品种间的比较。方法同随机区组,此处从略。变异来源自由度平方和均方F品种(调整)24945.5739.402.9
44、0*区组内误差56761.5613.60第四节 平衡不完全区组设计的统计分析n例14.3 设若对某种水果7个品种进行风味品尝,请7位专家评分,每位专家按图14.7的计划鉴评3个品种,其第1号为对照品种,评分范围为最低0分,最高5分,结果列于表14.12。该试验具有处理数t=7,区组数k=3,重复数r=k=3,两两品种在同一区组相遇1次。n这一设计的线性模型为: (1434) ijjiijbty表14.12 七个品种风味的专家评分结果(平衡不完全区组设计)区组(专家)品种与评分yij区组总和B(1) 3.5 3.8 4.111.4(2) 3.4 4.0 3.310.7(3) 4.1 4.3 4.
45、613.0(4) 4.3 4.2 4.613.1(5) 3.7 4.6 3.912.2(6) 4.0 4.8 3.712.5(7) 4.9 4.0 4.513.4G=86.3n其分析步骤如下:n1. 在表14.12中计算未调整的区组总和(B )及全试验总和(G )。计算未调整的品种总和(Tt)列于表14.13;同时计算出品种所在区组各区组总和的和数(Bt ),如品种1为11.4+12.2+13.4=37.0等,列于表14.13。应与kG 相等,可用以验算数据。n2. 计算各品种的W 值。nW =(t-k)T-(t-1)Bt+(k-1)G=4T-6Bt+2G(本例情况)。按(1434)将各小区的
46、线性组成相加、减,可以发现不同品种的W值只包含区组效应,因而W值间的变异表示了调整后区组间的变异,其总和W 应为0。表14.13 平衡不完全区组设计数据分析表调整处理平均 数Cy品 种TtBtW调整处理总和Tc=Tt+wW 1(CK)11.437.0-3.811.263.75 210.934.68.611.223.74 312.637.10.412.614.20 412.737.5-1.612.644.21 511.236.01.411.253.75 613.237.7-0.813.174.39 714.339.0-4.214.144.7186.3258.90.086.29n3. 进行方差分析
47、。n全试验21个小区的总变异中包含有品种间纯变异、区组间纯变异、由于区组不完全而导致的品种与区组相混杂的一部分变异、以及区组内的误差四部分。其中品种与区组相混杂的一部分变异包含在处理总和(T )间的变异中,也包含在区组总和(B )间的变异中。因混杂的这一部分变异不论在前者还是在后者是同一个成分,因此在方差分析中只须考虑一个方面便可。n由W 值计算调整的区组间平方和的公式为: (1435)n本例中为 342)=0.6629n未调整的品种平方和:1)(kkttrW(2(7111.363.0114CrTt2全试验总平方和ijijCy4.09812区组内平方和=4.0981-3.0114-0.6629
48、=0.4238表14.14 平衡不完全区组设计的方差分析表 此处所获的Ee,实际上只是一个初步估计值,并不立即用于进行F测验,而需作进一步调整。 4. 计算加权因子w ,并调整处理总和及平方和。 (1436) bebEktEEw1)( 变 异 来 源DFSSMS调整MS F品种(未调整) t -1=63.01140.5020.42787.035* F0.05=3.58, F0.01=6.37区组(已调整) b-1=60.66290.110(Eb)区组内误差 tr-2t+1=80.42380.053(Ee)0.0608总 tr-1=204.0981 按(Tt+wW )计算调整的品种总和(Tc),
49、如品种1(CK) 为11.4+(-3.8)(0.0370)=11.26等,填入表14.13。 (1437) 本例中 0.03701)0.1107(30.0530.110wCrTc2调整的处理平方和本例中2.5665CrTc2相应的均方为 2.5665/6=0.4278。n5. 计算有效误差并作进一步方差分析。n 有效误差E =Ee1+(t-k )w n 本例中E =0.0531+(7-3)0.0370=0.0608n将调整的品种均方和有效误差填入表14.14右端,这时可进行F 测验。F 测验的结果表明品种间风味评价上有很显著的差异。必须说明平衡不完全区组设计的方差分析中根据加权因子w 调整的处
50、理均方和误差均方都是近似的,包括w 值本身也有抽样波动,所以这一F 测验也是一种近似的测验。n6. 处理间的比较。n处理平均数间比较可用LSD 法,此例中已经F 测验证实品种间有显著差异,故实际上已用了Fisher保护最小显著差数法(FPLSD )。0.1420.0608/3 rEsSEy/ FPLSD0.05=0.4640.14222.3062yst测验结果如下: 品种2153467评分3.743.753.754.024.214.394.71显著性比较结果,品种2、5、3与对照间无显著差异,品种4、6、7的风味评价均优于对照,尤其品种7最佳,优于品种3、4。第十五章 抽样调查n 第一节 抽样