1、第三章单因素试验设计与分析第三章单因素试验设计与分析 单因素试验单因素试验(single-factor experiment)是指整个试验中只变是指整个试验中只变更、比较一个试验因素的不同更、比较一个试验因素的不同水平,其他作为试验条件的因素水平,其他作为试验条件的因素均严格控制一致。这是一种最基本的、最简单的试验设计均严格控制一致。这是一种最基本的、最简单的试验设计.例如在育种试验中,将新育成的若干品种与原有品种进行比例如在育种试验中,将新育成的若干品种与原有品种进行比较以测定其改良的程度,此时,品种是试验的唯一因素,新育较以测定其改良的程度,此时,品种是试验的唯一因素,新育成品种与原有品种
2、即为处理或水平,在试验过程中,除品种不成品种与原有品种即为处理或水平,在试验过程中,除品种不同外,其它环境条件和栽培管理措施都应严格控制一致。同外,其它环境条件和栽培管理措施都应严格控制一致。又如为了明确某一品种的耐肥程度又如为了明确某一品种的耐肥程度,施肥量就是试验因素施肥量就是试验因素,不不同的施肥量即为处理,品种及其它栽培管理措施都相同。同的施肥量即为处理,品种及其它栽培管理措施都相同。第一节完全随机设计第一节完全随机设计 在试验中只考虑一个因子的水平变化,试验所处理的环境条件一致,并且试验要求采用随机的方法来执行,这样的一种试验设计方法叫做完全随机设计.该设计分析简便,但由于试验要求的
3、环境条件基本一致,所以一般适用于实验室培养试验及网、温室的盆钵试验。完全随机设计具体田间作法:将各处理随机分配到各个试验单元(或小区)中,每一处理的重复数可以相等或不相等,这种设计对试验单元的安排灵活机动,单因素或多因素试验皆可应用.问题问题:现有现有A、B、C、D、E五个品种五个品种,如何比较它如何比较它 们的产量是否有显著的差异们的产量是否有显著的差异?能否应用假设检验的方法能否应用假设检验的方法 1.比较比较A与与B差异的显著性差异的显著性 2.比较比较B与与C差异的显著性差异的显著性 3.比较比较C与与D差异的显著性差异的显著性 4.比较比较D与与E差异的显著性差异的显著性解决方法解决
4、方法一一如果如果:1.A与与B差异不显著差异不显著 2.B与与C差异不显著差异不显著 3.C与与D差异不显著差异不显著 4.D与与E差异不显著差异不显著A、B、C、D、E差异不显著差异不显著?能否应用假设检验的方法能否应用假设检验的方法 比较比较A、B、C、D、E五个品种中任意五个品种中任意两个的差异显著性两个的差异显著性?A、B、C、D、E五个品种中任意两个的组合有多少种五个品种中任意两个的组合有多少种?A、B、C、D、E 差异不显著差异不显著?解决方解决方法二法二 如果都选择显著水平如果都选择显著水平a a=0.05,而且任意两个品种之间的差异是而且任意两个品种之间的差异是不显著的不显著的
5、 任意两个品种之间的差异不显著的概率为任意两个品种之间的差异不显著的概率为0.95,则所有则所有10种组种组合差异不显著的概率为合差异不显著的概率为(0.95)100.599,即即A、B、C、D、E 差异不显著的概率为差异不显著的概率为0.599A、B、C、D、E五个品种产量的差异显著性五个品种产量的差异显著性?BDAEC重复 DEBCA重复 AEBCD重复 DCEBA重复 重复品种A y11y12y13y14B y21y22y23y24C y31y32y33y34D y41y42y43y44E y51y52y53y54如何分析这20个小区的产量的差别?25425325225124424324
6、2241234233232231224223222221214213212211)()()()()()()()()()()()()()()()()()()()(yyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyySST 5141241254124412341224121)()()()()()(ijijjjjjjjjjjjyyyyyyyyyyyySST 称为总偏差平方和,显然小区数与SST 有很大的关系.如果SST很小接近于0,说明这五个品种的产量差异不显著,反之能否说明这五个品种的产量差异显著呢?显然,小区数(重复试验)越多,SST越大,因此不能直接由SST的大小来
7、推断五个品种的产量差异的显著性.事实上造成总偏差SST的原因有两个:1.试验的随机误差引起的偏差试验的随机误差引起的偏差2.品种之间的不同引起的偏差品种之间的不同引起的偏差 5141251412)()()(ijiiijijijTyyyyyySS514122)(2)()(ijiiijiiijyyyyyyyy 51415141251412)(22)()(ijiiijijiijiijyyyyyyyyteiiijiijSSSSyyyy 0)(4)(512514124151)()(2jiijiiyyyy)()(2414151jijijiiyyyy 5141)(2ijiijiyyyy0)44()(251i
8、iiiyyyy512)(4iiyy是每个处理平均值与总平均值差的平方称为处理平方和,记为SSt 5122512)2(4)(4iiiiityyyyyySS其中交叉乘积项其中交叉乘积项 512515124244iiiiiyyyy25122251220420404yyyyyiiii2042512yyii称202yC为矫正数.51412)(ijiijyy是每个观察值与相应处理平均值差的平方,是纯粹的试验误差项,记为 SSe 如果比值如果比值SSt/SSe小于小于1,说明处理引起的偏差没有试验的随机说明处理引起的偏差没有试验的随机误差大误差大,即试验的随机误差是产生差异的主要原因即试验的随机误差是产生差
9、异的主要原因,因此有理由认因此有理由认为这五个品种的产量没有显著的差异为这五个品种的产量没有显著的差异;如果比值如果比值SSt/SSe大于大于1,说说明这五个品种产量的差异明这五个品种产量的差异,是总偏差产生的原因是总偏差产生的原因,但能否说明这五但能否说明这五个品种产量的差异显著呢个品种产量的差异显著呢?以下从理论上来探讨这个问题以下从理论上来探讨这个问题.设有设有A因素有因素有a个处理,每一组合仅有个处理,每一组合仅有n个观察值,个观察值,则全试验共有则全试验共有na个观察值,资料整理形式如个观察值,资料整理形式如处理处理 1 2 i a重复重复 1 y11 y21 yi1 ya1 2 y
10、12 y22 yi2 ya2 :j y1j y2j yij yaj :n y1n y2n yin yan和和 yi.y1 y2 yi yaijyT.2.1.aiyyyy平均一一.完全随机设计的方差分析完全随机设计的方差分析 每一个观察值的线性模型为每一个观察值的线性模型为:处理间变异处理间变异i=(i-)处理内变异处理内变异ij=(yij-i)ijiijynjai,.,2,1;,.,2,1(一一)平方和与自由度分解平方和与自由度分解1单方面分类资料的线性统计模型 其中是所有处理的公共参数,叫总平均;i是第i个处理的效应,ij为随机误差项,且服从正态分布ij N(0,s 2)2.平方和与自由度的
11、分解 用每一个观察值与总平均值之差的平方和来衡量试验的用每一个观察值与总平均值之差的平方和来衡量试验的N=an个观察值的总波动个观察值的总波动,称之为总偏差平方和称之为总偏差平方和,并用并用SST表示之表示之,即即 ainjainjiiijijTyyyyyySS111122)()()(ainjiijiainjiijainjiyyyyyyyy11112112)(2)()(ainjiijaiiyyyyn11212)()(其中交叉乘积项其中交叉乘积项 ainjiijiyyyy11)(2njiijaiiyyyy11)()(2)()(2111njinjijaiiyyyy0)()(21iiaiiynyny
12、yaiiyyn12)(是每个处理平均值与总平均值差的平方称为处理平方和,记为SSt aiiiaiityyyynyynSS12212)2()(aiaiiaiiynyynyn12112221222122yanynynayanynaiiaiiNynyaii212称NyC2为矫正数.ainjiijyy112)(是每个观察值与相应处理平均值差的平方,是纯粹的试验误差项,记为 SSe于是可得:etTSSSSSS即总平方和分解为处理平方和与误差平方和之和.其中ainjainjijainjainjijijTyyyyyySS112111111222)(nayynaynanayyyainjijainjijainj
13、ij2112211112)(2Cyainjij112自由度的分解 由于0)(11ainjijyy 故只要任意给定na-1个变量的值,那么剩余的一个变量的值便可惟一的确定,也就是说na个变量中,有na-1个变量是自由的,称为总的自由度,记作 11NnadfT对于第i个处理,因 0)(1njiijyy故这n个变量中有n-1个变量是自由的,全试验共有a个处理,故误差的自由度为 aNnadfe)1(故这a个变量中有a-1个变量是自由的,此即为处理的自由度,记为1 adft同理,由于 0)(1aiiyy于是可得自由度分解式为:etTdfdfdfN-1=(a-1)+(N-a)即求得各变异来源的自由度和平方
14、和后,进而可得:eeetttdfSSMSdfSSMS/误差均方处理均方(1)统计假设 由于固定模型的目的是为了测验a个水平之间的差异,故所作的统计假设为:H0:1 1 2=a=0 ;H1:i 0(至少有一个i成立)或者:H0:1 1 2=a ;H1:i j(至少有一对i,j成立)(2)期望均方 ainjiijeeyyEaNaNSSEMSE112)(1)()(ainjiiijiEaN112)(1ainjiijEaN112)(1ainjaiiijnEaN11122122222)(1)(1sssssaNaNanaaN用类似的方法可得:1)(122anMSEaiits(3)F 测验 因为SSt的自由度
15、与SSe的自由度相加等于N-1,由Cochram定理,可得SSt/s 2及SSe/s 2是独立分布的c2 随机变数.因此,在原假设下,统计量 etetMSMSaNSSaSSF)()(/1/0 服从 F(a-1,N-a)分布.其中MSt和MSe分别为处理均方和误差均方.从分子和分母的期望均方知F0是测验假设 H0:1 1 2=a ;H1:i j(至少有一对i,j成立)的适宜统计量.如果F0 Fa a (a-1,N-a)则我们拒绝H0,即认为即认为a个处理之间差异显著个处理之间差异显著.),1(aNaFaa将以上测验的过程总结于下表,称之为方差分析表 单方面分类单方面分类(固定效应模型固定效应模型
16、)方差分析表方差分析表变变 异异来来 源源处理间处理间误误 差差总变异总变异自由度自由度a-1N-aN-1平方和平方和SStSSeSST均均 方方MSt=SSt/(a-1)MSe=SSe/(N-a)F0MSt/MSe 例例3.1 华南热带农业大学遗传育种教研室于华南热带农业大学遗传育种教研室于2004年春季进行年春季进行了光敏雄性不育水稻与旱稻离体穗茎室内杂交制种试验了光敏雄性不育水稻与旱稻离体穗茎室内杂交制种试验,其中其中4个杂交组合成功地获得了大量的个杂交组合成功地获得了大量的F1代种子,于同年夏季在农学代种子,于同年夏季在农学院基地网室进行田间试验院基地网室进行田间试验,采用完全随机设计
17、采用完全随机设计,于成熟期随机抽于成熟期随机抽取取5棵单株测产棵单株测产(单位:单位:g/株株),其中组合其中组合3作为对照作为对照,试验数据见表试验数据见表33,试作方差分析。试作方差分析。iy512.5y表33 水、旱稻杂种F1不同组合的单株产量(g/株)组合 F1123(CK)4 单株产量 2.89 4.88 3.03 2.57 2.01 5.07 3.52 2.66 1.09 2.05 6.23 3.94 4.26 3.22 5.1612.29 13.68 10.48 11.07 10.14 总和 Ti15.3814.3922.8157.66T=110.24平均3.0762.8784.
18、56211.532第一步:作统计假设H0:1 1 2 2=4 ;H1:i j(至少有一对i,j成立)第二步:计算各种平方和 64.6075424.11022NyC77.27764.60714.1088.489.22222CySSijT08.25064.6074/)66.5781.2239.1438.15(/22222CnySSit69.2708.25077.277tTeSSSSSS第三步:进行F测验并列出方差分析表 24.3)16,3(05.0F29.5)16,3(01.0F 表34 水、旱稻杂种F1不同组合的单株产量方差分析表变异来源杂交组合间杂交组合内(误差)总变异df 31619SS25
19、0.08 27.69277.77MS83.36 1.73 F0值48.16*F显著临界值F0.05(3,16)=3.24F0.01(3,16)=5.29 a=0.05F0=54.14a=0.01一、复因子试验的基本定义一、复因子试验的基本定义 复因子试验复因子试验(multi-factor experiments)指试验中具有两指试验中具有两个或两个以上因子的试验个或两个以上因子的试验,通常又称析因试验通常又称析因试验.作复因子试验作复因子试验时时,因子各水平之间全部可能的组合都要进行试验因子各水平之间全部可能的组合都要进行试验.因此因此,该设该设计是一种全面实施的试验设计。计是一种全面实施的
20、试验设计。例如,因子例如,因子A有有a个水平个水平,因子因子B有有b个水平个水平,则每重复包含了则每重复包含了ab 个个处理组合。处理组合。babbBBBABBBABBBA21212211第二节第二节 复因子试验的基本定义与原理复因子试验的基本定义与原理 复因子试验比单因子试验更为有效复因子试验比单因子试验更为有效.它不仅能解决各因素水它不仅能解决各因素水平间比较问题平间比较问题,且能分析出因子间的交互作用且能分析出因子间的交互作用,为最优处理组合为最优处理组合选取提供了科学的依据选取提供了科学的依据.如防治某种病害如防治某种病害,甲农药的最佳浓度未必是乙农药的最佳浓度甲农药的最佳浓度未必是乙
21、农药的最佳浓度.如我们进行如我们进行“药剂与浓度药剂与浓度”试验试验,就不仅能分别搞清楚甲、乙农药就不仅能分别搞清楚甲、乙农药的最佳浓度的最佳浓度,还可以知道这两种农药同时施用效果是否更佳还可以知道这两种农药同时施用效果是否更佳.二、主效应与交互作用二、主效应与交互作用试验因子对试验指标所起的增加或减少的作用称为试验效应试验因子对试验指标所起的增加或减少的作用称为试验效应.在单因子试验在单因子试验,同一因子内两种水平之间试验指标的差值称为同一因子内两种水平之间试验指标的差值称为该因子的简单效应。该因子的简单效应。例如对某水稻品种进行施肥试验例如对某水稻品种进行施肥试验,施氮施氮10kg/亩亩,
22、产量为产量为350kg/亩亩,施氮施氮15kg亩,产量为亩,产量为450kg/亩。则在每亩施氮亩。则在每亩施氮10kg的的基础上增施基础上增施5kg的效应即为的效应即为450350100(kg/亩)亩).在复因子试验中在复因子试验中,不但可以了解各因子的简单效应不但可以了解各因子的简单效应,还可了解还可了解各因素的主效应各因素的主效应(main effect)和因子间的交互作用和因子间的交互作用(interaction).以下为以下为22复因子试验复因子试验,设有氮肥设有氮肥N和磷肥和磷肥P各各25斤斤,问将这两种问将这两种肥料合施于肥料合施于1亩地上的胶树上效果好亩地上的胶树上效果好,还是分
23、别单独施于还是分别单独施于1亩地上亩地上的胶树上效果好?试验的因子、水平、如表的胶树上效果好?试验的因子、水平、如表41。表表41 因子、水平表因子、水平表 因子因子 水平水平氮肥氮肥(N)磷肥磷肥(P)100225斤斤/亩亩25斤斤/亩亩 该试验的该试验的4个处理组合是个处理组合是:N1P1表示既不施表示既不施N肥也不施肥也不施P肥肥;N1P2表示不施表示不施N肥肥,但施但施P肥肥25斤斤;N2P1表示施表示施N肥肥25斤斤,但不施但不施P肥肥;N2P2表示表示N肥和肥和P肥各施肥各施25斤斤.试验结果如下试验结果如下:(单位单位:公斤公斤)N PN1 N2N2-N1 P180 10020P
24、290 12030P2-P110 20 由由N2-N1栏可得栏可得,每亩施用氮肥后在无磷肥时的效应每亩施用氮肥后在无磷肥时的效应(即效果即效果)为为20公斤公斤,施用氮肥后在有磷肥时的效应为施用氮肥后在有磷肥时的效应为30公斤公斤,这这20公斤和公斤和30公斤都称为氮肥的简单效应公斤都称为氮肥的简单效应,而它们之和而它们之和50公斤称为氮肥的公斤称为氮肥的总效应总效应.同理可得磷肥的总效应为同理可得磷肥的总效应为30公斤公斤.下面回答两种肥合施效果好还是分开施效果好下面回答两种肥合施效果好还是分开施效果好.两种肥合施时产量为两种肥合施时产量为120公斤公斤,比不施肥小区的产量比不施肥小区的产量
25、80公斤公斤增产干胶增产干胶40公斤公斤;单施氮肥的产量是单施氮肥的产量是100公斤公斤,比不施肥小区产比不施肥小区产量量80公斤增产干胶公斤增产干胶20公斤公斤;单施磷肥的产量是单施磷肥的产量是90公斤公斤,比不施肥比不施肥小区产量小区产量80公斤增产干胶公斤增产干胶10公斤公斤;(120-80)-(100-80)+(90-80)=10(公斤公斤)由此得到两种肥料合施比分开施增产的干胶量为由此得到两种肥料合施比分开施增产的干胶量为:10公斤干胶表明公斤干胶表明:氮磷两肥合施能起相互促进的作用氮磷两肥合施能起相互促进的作用,即有磷即有磷肥更能发挥氮肥的作用肥更能发挥氮肥的作用,或有氮肥更能发挥
26、磷肥的作用或有氮肥更能发挥磷肥的作用,习惯上习惯上称这称这10公斤干胶为氮磷肥的总交互作用公斤干胶为氮磷肥的总交互作用.(正的交互作用正的交互作用)N PN1 N2N2-N1 P180 10020P290 10515P2-P110 5 由此得到两种肥料合施比分开施增产的干胶量为由此得到两种肥料合施比分开施增产的干胶量为:(105-80)-(100-80)+(90-80)=-5(公斤公斤)N PN1 N2N2-N1 P180 10020P290 11020P2-P110 10 (110-80)-(100-80)+(90-80)=0 0(公斤公斤)二、单、复因子试验方差分析不同点二、单、复因子试验
27、方差分析不同点1必须将处理组合的必须将处理组合的SS和和DF进一步分解为各个进一步分解为各个因子及其各项交互作用的因子及其各项交互作用的SS和和DF,从而进行因子,从而进行因子主效应及交互作用效应的主效应及交互作用效应的F测验。测验。2要用二向表来计算各因子及各项交互作用的平要用二向表来计算各因子及各项交互作用的平方和方和.【返回】【返回】第二节第二节 复因子完全随机设计与分析复因子完全随机设计与分析 将全部试验小区统一编号将全部试验小区统一编号,按随机的方法安排每个处理组合按随机的方法安排每个处理组合,即为复因子随机设计。即为复因子随机设计。一、二因素完全随机设计及分析一、二因素完全随机设计
28、及分析 假设试验包含假设试验包含A,B两个因子两个因子,分别有分别有a,b个水平个水平,共有共有ab个处个处理组合理组合.若每个处理均重复若每个处理均重复r次次,则试验共需则试验共需N=abr个个试验单元个个试验单元.每个试验单元上安排哪一个实验完全是随机的每个试验单元上安排哪一个实验完全是随机的.设处理设处理AiBj 的第的第k次观察值为次观察值为yijk,其线性统计模型为其线性统计模型为:yijk=+a ai+b bj +(ab ab)ij +ijk其中其中:i=1,2,a;j=1,2,b;k=1,2,n.为总平均为总平均;a ai 为因子为因子A的第的第i 处理的效应处理的效应;b bj
29、 为因子为因子B的第的第j 个个处理的效应处理的效应;(ab ab)ij 为为AiBj的交互效应的交互效应;ijk N(0,s s 2)为随机误差为随机误差.BA B1 B2 BbTiA1 y111 y121 y1b1 y112 y122 y1b2 y11r y12r y1brT1 T11 T12 T1b Aa ya11 ya21 yab1 ya12 ya22 yab2 ya1r ya2r yabrTaTa1 Ta2 TabTjT1 T2 Tb1.平方和的分解平方和的分解总平方和总平方和:abrTyyySSijkijkijkijkT222)(各处理各处理AiBj的总平方和的总平方和:abrrT
30、TSSijijAB221 A的主效应平方和的主效应平方和:abrbrTTSSiiA221B的主效应平方和的主效应平方和:abrarTTSSjjB221交互效应的平方和交互效应的平方和:SSSSSSBAABBASS误差平方和误差平方和:SSSSSSABTe 2.自由度的分解自由度的分解1,1abdfabrdfABT)1(,)1)(1(rabdfbadfeBA1,1bdfadfBA显然有显然有:eBABATeBABATdfdfdfdfdfSSSSSSSSSS二、固定模型、随机模型和混合模型的方差分析二、固定模型、随机模型和混合模型的方差分析 从试验的目的上看从试验的目的上看,考察的因素可分固定和随
31、机两种考察的因素可分固定和随机两种.若试验的若试验的目的是为了比较目的是为了比较A或或B各水平主效应的效果是否差异显著各水平主效应的效果是否差异显著,则则A和和 B是固定的,即试验的统计模型为固定模型。这时有是固定的,即试验的统计模型为固定模型。这时有:0)(,0)(,0,0jijiijjjiiababba若试验的目的是为了由若试验的目的是为了由A1,A2,Aa估计估计A的总体参数的总体参数 i 和和s sA2,由由B1,B2,Bb估计估计B的总体参数的总体参数 j 和和s sB2,这种情况下这种情况下A,B 均为均为随机效应随机效应,试验模型为随机模型试验模型为随机模型.模型不同,模型不同,
32、F测验和统计推断也不同测验和统计推断也不同.1.固定模型固定模型 对于固定模型对于固定模型,我们关心的是我们关心的是A和和B的主效应及它们的交互效的主效应及它们的交互效应是否有显著差异应是否有显著差异,统计分析分两步进行统计分析分两步进行.第一步:变因差异显著性分析第一步:变因差异显著性分析 0:10aHaaA的统计的统计假设为假设为:备择假设备择假设:H1:a ai不全相等不全相等0:10bHbbB的统计的统计假设为假设为:备择假设备择假设:H1:b bi不全相等不全相等备择假设为备择假设为ijH)(:1ab不全相等不全相等.abH)()(:110ababAB的统计假设为的统计假设为:变异变
33、异来源来源平方和平方和自由度自由度(df)均方均方 期望均方期望均方固定模型固定模型 ASSAdfA=a-1MSA s s 2+brKA2BSSBdfB=b-1MSB s s 2+arKB2ABSSAB(a-1)(b-1)MSAB s s 2+rK2AB误差误差SSeab(r-1)MSes s 2总变异总变异SSTabr-1 eBABAeBBeAAMSMSFMSMSFMSMSF,三、实例三、实例例例4.1 设有四个果树品种设有四个果树品种(A)与两种管理方案与两种管理方案(B)的产量比较试验的产量比较试验,作完全随机实验作完全随机实验,重复重复3次次,得试验结果如表得试验结果如表45,试作方差
34、分析试作方差分析.品种品种(A)方案方案(B)A1A2A3A4B的和的和TjB的平均的平均(yj)B1yijk12013014510095125160155140190180170T1j3953204555401710142.5y1jk132106152180B2yijk655055130140150185175160150175160T2j1704205204851595132.9 y2jk56140173162A的和的和Ti5657409751025T=3305A平均平均(yi )94123163171 y=135.8第一步:资料整理第一步:资料整理.计算矫正数及各种平方和计算矫正数及各种
35、平方和 04.455126324330522abrTC96.3639804.4551261601001202222CySSijkijkT96.3419804.4551263/)485320395(/2222CrTSSijijAB00.220096.3419896.36398ABTeSSSSSS46.2288604.45512632/)1025975740565(/22222CbrTSSiiA04.355104.45512634/)15951710(/222CarTSSjjB46.10761BAABBASSSSSSSS第二步第二步 作方差分析作方差分析变异来源变异来源自由度自由度平方和平方和均方均方F0值值F0.05F0.01品种品种(A)322886.467628.8255.48*3.245.29管理方案管理方案(B)1 551.04 551.044.014.498.53AB310761.463587.1526.09*3.245.29误差误差162200.00137.50总和总和2336398.96 F测验结论测验结论:品种间差异极显著品种间差异极显著,管理方案间差异不显著管理方案间差异不显著,品种品种与管理方案存在极显著互作与管理方案存在极显著互作,即不同品种适合的管理方案差异即不同品种适合的管理方案差异极显著极显著.