1、u、t 检验可以判断两组数据平均数间的差异显著性,检验可以判断两组数据平均数间的差异显著性,而多组数据平均数之间的差异显著性还能不能用这种方法呢?而多组数据平均数之间的差异显著性还能不能用这种方法呢?显然不行,显然不行,whywhy?1.1.检验过程烦琐。如果实验包含检验过程烦琐。如果实验包含4 4个处理则需要进行个处理则需要进行C C4 42 2 6 6次次t t检验检验2.2.无统一的试验误差,误差估计的精确性和检验的灵敏性低。无统一的试验误差,误差估计的精确性和检验的灵敏性低。有有6 6个标准误,误差估计不统一,精确度降低个标准误,误差估计不统一,精确度降低3.3.推断的可靠性低,检验时
2、犯推断的可靠性低,检验时犯错误概率大。错误概率大。6次都接受的概率为次都接受的概率为(0.95)60.735,故犯,故犯错误概率增大为错误概率增大为0.2650.265因此,现在学习一类能解决多个平均数之间的显著性检验方法因此,现在学习一类能解决多个平均数之间的显著性检验方法一一 、概念、概念 又叫变量分析,是英国著名统计学家又叫变量分析,是英国著名统计学家R.A.R.A.FisherFisher于于2020世纪提出的。它是用以检验世纪提出的。它是用以检验差异的假设检验方法。它是一类特定情况下差异的假设检验方法。它是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的统计假设检验,或者
3、说是平均数差异显著性检验的一种引伸。的一种引伸。(Analysis of variance,ANOVA)一、方差分析的基本思想一、方差分析的基本思想总变异处处理理效效应应试试验验误误差差思考:每个思考:每个观测值不同的原因观测值不同的原因?二、方差分析的目的二、方差分析的目的处理效应处理效应试验误差试验误差相差不大,说明试验处理对指标影响不大。相差不大,说明试验处理对指标影响不大。相差较大,即处理效应比试验误差大得多,相差较大,即处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。说明试验处理影响是很大的,不可忽视。按照方差分析的思想,把一个试验的总变异依按照方差分析的思想,把一个试
4、验的总变异依据据分为处理效应的变异和试验误差的变异。分为处理效应的变异和试验误差的变异。首先,将总平方和和总首先,将总平方和和总df分解为两个变异部分。分解为两个变异部分。xxxxxxjj 因为因为处理内的变异是处理内的变异是由随机误差引起由随机误差引起处理间平均数的处理间平均数的差异是由处理效差异是由处理效应引起的:应引起的:根据线性可加模型,则有:根据线性可加模型,则有:(xi x)(x-x)(x-xi)+(x-x)2 2(x-xi)+(xi x)(xi x)2(x-x)2 1 n 1 n(x-xi)2+(x-xi)(xi x)21 n+1 n 每一个处理每一个处理n n 个观测值离均差平
5、方和累加:个观测值离均差平方和累加:(x-xi)2+2(x-xi)(xi x)+(xi x)2 0总平方和总平方和 SST 处理内或组处理内或组内平方和内平方和 SSe处理间或组处理间或组间平方和间平方和 SSt下面来具体看看总平方和的计算下面来具体看看总平方和的计算SST SSt+SSeSST (x-x)21 n 1 k=x2-T2 kn(x)2 kn x2-SST x2-C令矫正数令矫正数C ,则:则:T2 knnxxxx222)()(再看看处理平方和的计算再看看处理平方和的计算SSt n1 k(xi x)2 k n(-2 +)1x xi i2 2 x xi ixx2=n n -+nknk
6、1 k x xi i2 2 2n 1 k xx xi ix2=-2nk +n1 k x xi i2 2 x2 nkxnkx2 2 =-n1 k x xi i2 2 nkxnkx2 2 =-n n1 k T Ti i2 2 n2 nkT T2 2(nk)2=T Ti i2 2 -Cn11 k x xi i=kxx xi i=T Ti in n=T TnknkxnkTTni221总平方和:总平方和:SST x2-C 处理间平方和:处理间平方和:SSt=T Ti i2 2 -Cn1处理内平方和:处理内平方和:SSe=SST -SSt同样道理同样道理,总自由度也可分解为处理间自由度和处理内自由度:,总
7、自由度也可分解为处理间自由度和处理内自由度:dfT =dft+dfe总总 df 处理间处理间df 处理内处理内df dfT=nk-1nk-1dft=k-1k-1dfe=dfT-dft=nk-1-(k-1)=k(n-1)=nk-k对于一个对于一个k处理每处理有处理每处理有n次重复的实验而言,次重复的实验而言,根据各变异部分的平方和和自由度,可求得根据各变异部分的平方和和自由度,可求得处理间方差处理间方差(st2)和和处理内方差处理内方差(se2 ):):st2=SStdftSSedfese2=一般把一般把作为分子,称为大方差,作为分子,称为大方差,作为作为分母,称为小方差,求出两者之比为分母,称
8、为小方差,求出两者之比为F F值进行值进行F F检验。从而检验。从而确定确定各种原因(各种原因(、)在总变异中所占的重要程度。)在总变异中所占的重要程度。22etssF 二者相比,如果相差不大,说明不同处理的变异在总二者相比,如果相差不大,说明不同处理的变异在总变异中所占的位置不重要,也就是不同试验处理对结果影变异中所占的位置不重要,也就是不同试验处理对结果影响不大。响不大。如果相差较大,也就是处理效应比试验误差大得多,如果相差较大,也就是处理效应比试验误差大得多,说明试验处理的变异在总变异中占有重要的位置,不同处说明试验处理的变异在总变异中占有重要的位置,不同处理对结果的影响很大,不可忽视。
9、理对结果的影响很大,不可忽视。平方和平方和自由度自由度方差方差F值值F0.05、0.01处理间处理间处理内处理内总变异总变异CxSST2tTeSSSSSSCTnSSit211 nkdfT1 kdft)1(nkdfeeeedfSSs2tttdfSSs2综上所述,可归纳成方差分析表综上所述,可归纳成方差分析表(analysis of variance table)如果F值不显著,则方差分析结论是变异来源主要是误差引起的,所以过程到此结束。而如果F值显著,说明变异来源主要是因为处理的差异,具体何种处理存在差异?还需要进一步多重比较!要明确不同处理平均数两两间差异的显著性,要明确不同处理平均数两两间差
10、异的显著性,每个处理的平均数都要与其他的处理进行比较,每个处理的平均数都要与其他的处理进行比较,这种差异显著性的检验就叫多重比较。这种差异显著性的检验就叫多重比较。多重比较方法多重比较方法least significant difference LSD法法least significant ranges LSR法法LSDLSD法的实质是两个平均数相比较的法的实质是两个平均数相比较的t t检验法。检验法。LSRLSR法克服了法克服了LSDLSD法的局限性,采用不同平均数法的局限性,采用不同平均数间用不同的显著差数标准进行比较,它可用于平均间用不同的显著差数标准进行比较,它可用于平均数间的所有相互
11、比较。数间的所有相互比较。(一一)最小显著差数法(最小显著差数法(LSD法)法)检验的步骤检验的步骤 (1)(1)先计算出达到差异显著的最小差数,记为先计算出达到差异显著的最小差数,记为LSDLSD 不过,平均数差数标准误的计算公式需要注意:不过,平均数差数标准误的计算公式需要注意:21212121txxxxstxxsxx 得得由由212101.001.005.005.0 xxxxstLSDstLSD nssnnnnssexxexx2212122112121 时,时,当当处理内方差处理内方差(2)(2)再用两个处理平均数的差值绝对值再用两个处理平均数的差值绝对值 与与LSDLSD比较:比较:x
12、 x1 1x x2 2-x x1 1x x2 2-LSD 即即 和和 在给定的在给定的水平上差异不显著水平上差异不显著 x x1 1x x2 2拒绝拒绝H Ho o 接受接受H Ho o(一一)最小显著差数法(最小显著差数法(LSD法)法)x x1 1x x2 2即即 和和 在给定的在给定的水平上差异显著水平上差异显著x x1 1x x2 2-LSD (一一)最小显著差数法(最小显著差数法(LSD法)法)梯形法标记字母法(3)(3)表示比较结果表示比较结果品种品种 平均数平均数差异显著性差异显著性0.050.05 0.010.01大白大白沈花沈花沈白沈白沈黑沈黑30.930.927.927.9
13、25.825.824.124.1a aababb bb bA AABABABABB Bix1.24 ix8.25 ix9.27 ix 梯形比较法梯形比较法 又叫三角形法,是将各处理的平均数差数按梯形列于又叫三角形法,是将各处理的平均数差数按梯形列于表中,并将这些差数和表中,并将这些差数和LSDLSD值比较:值比较:差数差数 LSDLSD0.05 0.05 差异显著差异显著*差数差数 LSDLSD0.01 0.01 差异极显著差异极显著*差数差数 LSDLSD0.05 0.05 差异不显著差异不显著 不同品种间不同品种间4 4个月增重量差异显著表个月增重量差异显著表LSD0.05=4.6513L
14、SD0.01=6.5233结果表明:大白和沈黑增重量差异达到了极显著标准,大结果表明:大白和沈黑增重量差异达到了极显著标准,大白与沈白之间的差异达到了显著标准,其他品种间差异不显著白与沈白之间的差异达到了显著标准,其他品种间差异不显著 梯形比较法梯形比较法 ix1.24 ix8.25 ix9.27 ix 标记字母法标记字母法 首先将全部平均数首先将全部平均数从大到小从大到小依次排列。然后在依次排列。然后在最大最大的平均的平均数上标字母数上标字母a a,将该平均数与,将该平均数与以下各平均数以下各平均数相比,凡相比,凡相差不显相差不显著著的(的(LSDLSD)都标上字母)都标上字母a a,直至某
15、个与之,直至某个与之相差显著相差显著的则标的则标字母字母b b。再以。再以该标有该标有b b的平均数的平均数为标准,与各个为标准,与各个比它大比它大的平均数的平均数比较,凡差数差异不显著的在字母比较,凡差数差异不显著的在字母a a的右边加标字母的右边加标字母b b。然后再。然后再以以标标b b的最大平均数的最大平均数为标准与以下未曾标有字母的平均数比较,为标准与以下未曾标有字母的平均数比较,凡差数差异不显著的继续标以字母凡差数差异不显著的继续标以字母b b,直至差异显著的平均数,直至差异显著的平均数标字母标字母c c,再与上面的平均数比较。如此重复进行,直至最小,再与上面的平均数比较。如此重复
16、进行,直至最小的平均数有了标记字母,并与上面的平均数比较后为止。的平均数有了标记字母,并与上面的平均数比较后为止。标记字母法标记字母法 LSD0.05=1.28LSD0.01=1.920.010.05平均数平均数品种品种De5.73CDde6.57CDde6.72BCDcd7.06BCDcd7.35ABCbcd7.78ABCbc8.01ABab8.74Aa9.39差异显著性差异显著性ix9 9个培养基配方差异显著表个培养基配方差异显著表在各平均数间,凡在各平均数间,凡有一个相同标记字母的即有一个相同标记字母的即为差异不显著,凡具不同为差异不显著,凡具不同标记字母的即为差异显著。标记字母的即为差
17、异显著。差异极显著标记方法差异极显著标记方法相同,但用大写字母标记。相同,但用大写字母标记。0.010.05平均数平均数品种品种5.736.576.727.067.357.788.018.749.39差异显著性差异显著性ixLSDLSD法应用法应用 (一一)最小显著差数法(最小显著差数法(LSD法)法)1.1.LSDLSD 法实质上是法实质上是t t 检验检验,但,但LSDLSD 法是利用法是利用F F 检验检验中的误差自由度中的误差自由度dfdfe e 查查t t 临界值,利用误差方差临界值,利用误差方差s se e2 2 计计算平均数差异标准误,从一定程度上缓解了算平均数差异标准误,从一定
18、程度上缓解了t t检验过检验过程中的三个弊病,但是程中的三个弊病,但是LSDLSD法仍然存在提高犯法仍然存在提高犯错误错误的概率,所以进行的概率,所以进行LSDLSD检验必须限制其应用范围。检验必须限制其应用范围。2.2.LSDLSD 法适用于法适用于各处理组与对照组各处理组与对照组的比较,不适用的比较,不适用于处理组间的比较。于处理组间的比较。(二二)最小显著极差法(最小显著极差法(LSR法)法)是指不同平均数间用不同的显著差数标准进行是指不同平均数间用不同的显著差数标准进行比较,可用于平均数间的所有相互比较。比较,可用于平均数间的所有相互比较。新复极差法新复极差法(New multiple
19、 rang method)SSR法法、Duncan法 q q 检验检验 (q-test)SNK1、新复极差法(、新复极差法(SSR)(1)(1)按相比较的样本容量计算按相比较的样本容量计算平均数标准误平均数标准误:当当n1 n2n时时(2)(2)根据误差方差根据误差方差s se e2 2所具有自由度所具有自由度dfdfe e和比较所含平均数个数和比较所含平均数个数M M,查查SSRSSR值值(附表(附表8 8),然后算出最小显著极差值(),然后算出最小显著极差值(LSRLSR值值)。)。(3)(3)将各平均数按大小顺序排列,用各个将各平均数按大小顺序排列,用各个M M值的值的LSRLSR值,值
20、,检验检验各平均数间极差的显著性。各平均数间极差的显著性。nsexS2 xSSSRLSR 例例例:例:n=4,se2=9.113,dfe12查附表查附表8,当,当dfe 12,M2时,时,LSR0.05 1.50943.084.65LSR0.01 1.5094 4.326.52当当M M3 3,M M4 4时,按同理计算,将结果列于下表:时,按同理计算,将结果列于下表:SSR0.05 3.08,SSR0.014.32)(5094.14113.92kgnsSex 不同品种不同品种4 4个月增重量试验个月增重量试验LSRLSR值(新复极差法)值(新复极差法)M234SSR0.05SSR0.01LS
21、R0.05LSR0.013.084.324.656.523.224.504.886.793.314.625.006.97品种品种平均数平均数大白大白沈花沈花沈白沈白沈黑沈黑30.927.925.824.1大白与沈黑:大白与沈黑:M M4 4,极差,极差6.86.85.005.00大白与沈白:大白与沈白:M M3 3,极差,极差5.15.14.884.88大白与沈花:大白与沈花:M M2 2,极差,极差3.03.04.654.65M=M=相隔数相隔数 +2+2品种品种平均数平均数差异显著性差异显著性0.050.01大白大白沈花沈花沈白沈白沈黑沈黑30.927.925.824.1aabbbAAAA
22、结论:猪的结论:猪的4 4个品种中只有大白与沈黑,大白与沈白个品种中只有大白与沈黑,大白与沈白4 4个月增重量差异达到显著,其他品种间差异不显著。个月增重量差异达到显著,其他品种间差异不显著。猪品种间猪品种间4 4个月增重量差异显著性比较表(新复极差法)个月增重量差异显著性比较表(新复极差法)也称也称Newman-keulsNewman-keuls检验,方法与新复极差法相检验,方法与新复极差法相似,其区别仅在于计算最小显著极差似,其区别仅在于计算最小显著极差LSRLSR时不是查时不是查SSRSSR,而是查,而是查q q值(附表值(附表9 9)还对上例作还对上例作q q检验检验:1.5094,查
23、查q值表,值表,dfe12,M=2时时q0.05 3.08,q0.014.32。同理可查。同理可查M3,M=4时的时的q值,算出最小显著极差值,算出最小显著极差LSR。2、q-检验法检验法xSqLSR xSM234q0.05q0.01LSR0.05LSR0.013.084.324.656.523.775.045.697.614.205.506.348.30不同品种不同品种4个月增重量试验个月增重量试验LSR值(值(q检验)检验)品种品种平均数平均数大白大白沈花沈花沈白沈白沈黑沈黑30.930.927.927.925.825.824.124.1大白与沈黑:大白与沈黑:M M4 4,极差,极差6.
24、86.86.346.34大白与沈白:大白与沈白:M M3 3,极差,极差5.15.15.695.69大白与沈花:大白与沈花:M M2 2,极差,极差3.03.04.654.65品种品种平均数平均数差异显著性差异显著性0.050.01大白大白沈花沈花沈白沈白沈黑沈黑30.927.925.824.1aababbAAAA结论:猪的结论:猪的4 4个品种中只有大白与沈黑个品种中只有大白与沈黑4 4个月增重量个月增重量差异达到显著,都还未到及显著水平,其他品种间差异差异达到显著,都还未到及显著水平,其他品种间差异不显著。不显著。猪品种间猪品种间4 4个月增重量差异显著性比较表(个月增重量差异显著性比较表
25、(q q检验)检验)LSD0.05=4.6513LSD0.01=6.5233M234q0.05q0.01LSR0.05LSR0.013.084.324.656.523.775.045.697.614.205.506.348.30M234SSR0.05SSR0.01LSR0.05LSR0.013.084.324.656.523.224.504.886.793.314.625.006.97当样本数当样本数k=2k=2时,时,LSDLSD法、法、LSRLSR法和法和q q检验法的显著性尺度是相同的。检验法的显著性尺度是相同的。当当M3M3时,三种检验的显著尺度便不相同。时,三种检验的显著尺度便不相同
26、。因此,在实际计算中:因此,在实际计算中:对于精度要求高的试验对于精度要求高的试验q检验法检验法一般试验一般试验SSR检验法检验法试验中各个处理均数皆与对照相比的试验试验中各个处理均数皆与对照相比的试验LSD检验法检验法方差分析的基本步骤方差分析的基本步骤(3 3)将样本数据的)将样本数据的总平方和总平方和与与总自由度总自由度分解为各变分解为各变异因素的平方和与自由度;先求出校正值异因素的平方和与自由度;先求出校正值C C(4 4)列方差分析表进行)列方差分析表进行F F检验检验,以弄清各变异因素,以弄清各变异因素在总变异中的重要程度;在总变异中的重要程度;(5 5)对各处理平均数进行)对各处
27、理平均数进行多重比较多重比较。(1 1)提出假设)提出假设(2 2)确定显著性水平)确定显著性水平 在试验中所考虑的因素只有一个时,称为单在试验中所考虑的因素只有一个时,称为单因素实验。因素实验。它是最简单的一种,它适用于只研究一个试验它是最简单的一种,它适用于只研究一个试验因素的资料,目的在于正确判断该试验因素各处因素的资料,目的在于正确判断该试验因素各处理的相对效果(各水平的优劣)理的相对效果(各水平的优劣)组组内内观观测测数数目目的的不不同同组内观测次数相等方差分析组内观测次数不相等的方差分析一、组内观测次数相等的方差分析一、组内观测次数相等的方差分析 是指在是指在k k组处理中,每一处
28、理皆含有组处理中,每一处理皆含有n n个观测值,其方个观测值,其方差分析方法前面已做介绍,这里以方差分析表的形式给出差分析方法前面已做介绍,这里以方差分析表的形式给出有关计算公式:有关计算公式:s se e2 2k(n-1)k(n-1)SSSSe e误差或处理内误差或处理内nk-1nk-1SSSST T总和总和s st t2 2k-1k-1SSSSt t处理间处理间F F均方均方自由度自由度平方和平方和变异来源变异来源F Fs st t2 2s se e2 2例例:测定东北、内蒙古、河北、安徽、贵州测定东北、内蒙古、河北、安徽、贵州5 5个地区黄鼬冬季针毛的长度,每个地区随机抽取个地区黄鼬冬季
29、针毛的长度,每个地区随机抽取4 4个样本,测定个样本,测定的结果如表,试比较各地区黄鼬针毛长度差异显著性。的结果如表,试比较各地区黄鼬针毛长度差异显著性。地区地区东北东北内蒙古内蒙古河北河北安徽安徽贵州贵州合计合计1 132.032.029.229.225.225.223.323.322.322.32 232.832.827.427.426.126.125.125.122.522.53 331.231.226.326.325.825.825.125.122.922.94 430.430.426.726.726.726.725.525.523.723.7126.4126.4109.6109.61
30、04.1104.199.099.091.491.4530.5530.531.6031.6027.4027.4026.0326.0324.7524.7522.8522.8526.5326.533997.443997.443007.993007.992709.982709.982453.162453.162089.642089.6414258.2114258.21x2xx在这里,在这里,k=5k=5,n=4n=4。(2 2)确定显著性水平,)确定显著性水平,=0.05=0.05,0.010.01(3 3)计算统计量,包括离均差平方和与自由度:)计算统计量,包括离均差平方和与自由度:51.14071
31、455.53022nkTC7.18651.1407121.142582CxSST71.17351.14071)4.916.1094.126(41222CTnSSit21(1 1)提出假设:)提出假设:H H0 0:东北、内蒙古、河北、安徽、贵州5个地区 黄鼬冬季针毛的长度,相等,没有差异。H HA A:东北、内蒙古、河北、安徽、贵州5个地区 黄鼬冬季针毛的长度不完全相等。tTeSSSSSS186.7-173.7112.991 nkdfT201191 kdft5(41)15)1(nkdfe(4 4)计算方差:)计算方差:43.43471.1732tttdfSSs866.01599.122eeed
32、fSSs514(5 5)进行)进行F F 检验:检验:15.50866.043.4322etssF查查F F 值表,得值表,得F F0.05(4,15)0.05(4,15)3.063.06,F F0.01(4,15)0.01(4,15)4.894.89,故,故F FF F0.01 0.01,P 0.01P 0.01,说明,说明5 5个地区黄鼬冬季针毛长度差异极个地区黄鼬冬季针毛长度差异极显著。显著。变异来源变异来源SSSSdfs s2 2F FF F0.050.05F F0.010.01地区间地区间地区内地区内173.71173.7112.9912.994 4151543.4343.430.8
33、70.8750.1550.15*3.063.064.894.89总变异总变异186.70186.701919不同地区黄鼬冬季针毛长度方差分析表不同地区黄鼬冬季针毛长度方差分析表这里用最小显著差数法(这里用最小显著差数法(LSDLSD)进行检验。)进行检验。658.04866.022221nssexx查查t t 值表,当值表,当dfe=15=15时,时,t t0.05 0.05 2.1312.131,t t0.01 0.01 2.9472.947,于是有:于是有:LSD0.05=2.131 0.658=1.402 LSD0.01=2.947 0.658=1.939本例中各组内观测数相等,而且组内
34、方差均为本例中各组内观测数相等,而且组内方差均为0.8660.866,故,故任何两组的比较均可用任何两组的比较均可用LSDLSD0.05 0.05 及及LSDLSD0.010.01。地区地区平均数平均数差异显著性差异显著性0.050.050.010.01东北东北内蒙古内蒙古河北河北安徽安徽贵州贵州31.6031.6027.4027.4026.0326.0324.7524.7522.8522.85a ab bbcbcc cd dA AB BBCBCCDCDD D结果表明,东北与其它地区,内蒙古与安徽、贵州,结果表明,东北与其它地区,内蒙古与安徽、贵州,河北与贵州黄鼬冬季针毛长度差异均达到极显著水
35、平,河北与贵州黄鼬冬季针毛长度差异均达到极显著水平,安徽与贵州差异达到显著水平,而内蒙古与河北、河北安徽与贵州差异达到显著水平,而内蒙古与河北、河北与安徽差异不显著。与安徽差异不显著。有时由于试验条件的限制,不同处理的观测次数不同,有时由于试验条件的限制,不同处理的观测次数不同,k k个处理的观测次数依次是个处理的观测次数依次是n n1 1 、n n2 2 、n nk k的单因素分组资料,的单因素分组资料,前面介绍的方差分析方法仍然可用,但由于总观测次数不是前面介绍的方差分析方法仍然可用,但由于总观测次数不是nknk,而是,而是 次,在计算平方和时公式稍有改变。次,在计算平方和时公式稍有改变。
36、kiin1组内观测次数不相等的方差分析组内观测次数不相等的方差分析se2ni-1 SSe误差或处理内误差或处理内SST总和总和st2k-1处理间处理间F方差方差自由度自由度平方和平方和变异来源变异来源Fst2se2CnTii2ni-k 二、组内观测次数不相等的方差分析二、组内观测次数不相等的方差分析在作多重比较时,首先应计算平均数的标准在作多重比较时,首先应计算平均数的标准误。由于各组内观测次数不等,因此应需先算得各误。由于各组内观测次数不等,因此应需先算得各n ni i的平均数的平均数n n0 0:1022knnniiin02022 21nssnssexxex或各个处理的样本容量用于LSR检
37、验用于LSD检验例:用某种小麦种子进行切胚乳试验,例:用某种小麦种子进行切胚乳试验,实验分为三种处理:整粒小麦(实验分为三种处理:整粒小麦(I I),切去一半胚乳(),切去一半胚乳(IIII),切去),切去全部胚乳(全部胚乳(IIIIII),同期播种与条件较一致的花盆内,出苗后每盆),同期播种与条件较一致的花盆内,出苗后每盆选留两株,成熟后进行单株考种,每株粒重结果如表,试进行方差选留两株,成熟后进行单株考种,每株粒重结果如表,试进行方差分析。分析。处理处理株号株号合计合计平均数平均数12345678910III21202429252224252822232525292130312627242
38、626 20 2120424414625.524.424.3小麦切胚乳试验单株粒重(小麦切胚乳试验单株粒重(g g)处理处理株号株号合计合计平均数平均数12345678910III21202429252224252822232525292130312627242626 20 2120424414625.524.424.3小麦切胚乳试验单株粒重(小麦切胚乳试验单株粒重(g)n1 8,n2 10,n3 6,N24(3)计算统计量计算统计量5.147012414624420422inTC(1 1)提出假设:)提出假设:H H0 0:3种切胚乳实验后,每株小麦粒重相等。H HA A:3种切胚乳实验后,
39、每株小麦粒重不完全相等。(2 2)确定显著性水平,)确定显著性水平,=0.05=0.05,0.010.01SST x2 C=212+292+262-C=230.58.66146102448204222CSStSSe SST-SSt 230.5-6.8223.7231241iTndf21324kndfie2131 kdft(4 4)计算方差:)计算方差:3.228.62 tttdfSSs7.10217.2232 eeedfSSs列方差分析表列方差分析表变异来源变异来源SSdfs2FF0.05F0.01处理间处理间处理内处理内6.8223.72213.410.70.318总变异总变异230.523
40、由表中结果可知,由表中结果可知,F F1 1,表明三种处理的每株粒重无,表明三种处理的每株粒重无显著差异。显著差异。(5 5)进行)进行F F 检验:检验:318.07.104.322 etssF小麦切胚乳试验单株粒重方差分析表小麦切胚乳试验单株粒重方差分析表由于由于F检验不显著,不需要再作多重比较。检验不显著,不需要再作多重比较。如果如果F检验显著,则需要进一步计算检验显著,则需要进一步计算n0,并求得,并求得 (用于(用于LSR检验)检验)或或 (用于(用于LSD检验),即检验),即x xS88.7224)6108(2422221022knnniiin16.187.10 02nssex64
41、.187.10220221nssexxx x1 1x x2 2-S需要指出的是,不等观测次需要指出的是,不等观测次数的试验要尽量避免,因为这样数的试验要尽量避免,因为这样的试验数据不仅计算麻烦,而且的试验数据不仅计算麻烦,而且也降低了分析的灵敏度。也降低了分析的灵敏度。第三节第三节 多因素方差分析多因素方差分析定义定义:是指对:是指对试验指标试验指标同时受到两个或两同时受到两个或两个以上试验个以上试验因素因素作用的试验资料的方差分析。作用的试验资料的方差分析。试验指标(experimental index):为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。
42、常用的试验指标有:身高、体重、日增重、酶活性、DNA含量等等。一、相关概念一、相关概念固定因素:指因素的水平是经过特意选择的固定因素:指因素的水平是经过特意选择的随机因素:指因素的水平是从该因素水平总体中随随机因素:指因素的水平是从该因素水平总体中随 机抽出的样本机抽出的样本试验因素(experimental factor):试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上因素对试验指标的影响时,则称为两因素或多因素试验。固定效应固定效应(fixed effect):由固定因素所引起的效应。:由固定因素所引起的效应。随机效应随机
43、效应(random effect):由随机因素引起的效应。:由随机因素引起的效应。因素水平(level of factor):试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如研究3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素的3个水平。试验处理(treatment):事先设计好的实施在实验单位上的具体项目就叫试验处理。如进行饲料的比较试验时,实施在试验单位上的具体项目就是具体饲喂哪一种饲料。对对单因素试验单因素试验而言,水平和处理是一致的,一个水平而言,水平和处理是一致的,一个水平就是一个处理;就是一个处理;对对多因素试验多因素试验而言,处理就是指水平与水而言,处理
44、就是指水平与水平的组合平的组合试验单位(experimental unit):在实验中能接受不同试验处理的独立的试验载体叫试验单位。一只小白鼠,一条鱼,一定面积的小麦等都可以作为实验单位。重复(repetition):在实验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪,就说这个处理(饲料)有4个重复。主效应和主效应和互作互作主效应主效应(main effectmain effect):各试验因素的相对独立作用:各试验因素的相对独立作用互作互作(interactioninteraction):某一因素在另一因素的
45、不同水平上所产生的效应不同。某一因素在另一因素的不同水平上所产生的效应不同。因素间的交互作用显著与否关系到主效应的利用价值,因素间的交互作用显著与否关系到主效应的利用价值,如果交互作用如果交互作用不显著不显著,则各因素的效应可以,则各因素的效应可以累加累加,各因素的,各因素的最优水平组合起来最优水平组合起来,即为最优的处理组合。,即为最优的处理组合。如果交互作用如果交互作用显著显著,则各因素的效应就,则各因素的效应就不能累加不能累加,最优处理,最优处理组合的选定应根据组合的选定应根据各处理组合的直接表现选定各处理组合的直接表现选定。有时交互作。有时交互作用相当大,甚至可以忽略主效应。用相当大,
46、甚至可以忽略主效应。不同离子不同离子对木聚糖对木聚糖酶活性酶活性的影响的影响(mg/ml)(mg/ml)0.000.250.500.751.001.250.000.060.120.180.240.300.000.401.201.602.000.000.400.600.801.001.20Na+K+Cu2+Mn2+实验指标实验指标因素因素水平水平对于由样本估计的线性模型为对于由样本估计的线性模型为:xij=x+ti+eijx 样本平均数样本平均数ti 样本处理效应样本处理效应eij 试验误差试验误差二、数学模型二、数学模型xij=+i+ij 要求要求ij 是相互独立的,且服是相互独立的,且服从标
47、准正态分布从标准正态分布 N(0,2)根据的根据的i i不同假定,可将数学模型分为以下三种:不同假定,可将数学模型分为以下三种:固定模型固定模型 随机模型随机模型 混合模型混合模型 二、数学模型二、数学模型每个因素都是固定因素每个因素都是固定因素每个因素均为随机因素每个因素均为随机因素其中有因素是固定因素,也其中有因素是固定因素,也有因素是随机因素有因素是随机因素三种模型在计算上类似,但在对待检验及结果解释时有三种模型在计算上类似,但在对待检验及结果解释时有所不同所不同。(一一)固定模型固定模型(fixed model)(fixed model)指各个处理的效应值指各个处理的效应值i i 是固
48、定值是固定值,各个的,各个的平均效应平均效应i i i i 是一个常量,且是一个常量,且i i 0 0。就是说除去随机误差以后每个处理所产生。就是说除去随机误差以后每个处理所产生的效应是固定的。的效应是固定的。二、数学模型二、数学模型实验因素的各水平是根据试验目的事先主观实验因素的各水平是根据试验目的事先主观选定的而不是随机选定的。选定的而不是随机选定的。不同离子对木聚糖酶活性的影响不同离子对木聚糖酶活性的影响(mg/ml)(mg/ml)0.000.250.500.751.001.250.000.060.120.180.240.300.000.401.201.602.000.000.400.6
49、00.801.001.20 固定模型固定模型 Na+K+Cu2+Mn2+在固定模型中,除去随机误差之后的每个处理在固定模型中,除去随机误差之后的每个处理所产生的效应是固定的,试验重复时会得到相所产生的效应是固定的,试验重复时会得到相同的结果同的结果方差分析所得到的结论只适合于选定的那几个方差分析所得到的结论只适合于选定的那几个水平,并不能将其结论扩展到未加考虑的其它水平,并不能将其结论扩展到未加考虑的其它水平上。水平上。固定模型固定模型 二、数学模型二、数学模型(二二)随机模型随机模型(random model)(random model)指各处理的效应值指各处理的效应值i i 不是固定的数值
50、,而不是固定的数值,而是由随机因素所引起的效应。是由随机因素所引起的效应。这里这里i i 是一个随机变量,是从期望均值为是一个随机变量,是从期望均值为 0 0,方,方差为差为2 2 的标准正态总体中得到的随机变量。得出的结的标准正态总体中得到的随机变量。得出的结论可以推广到多个随机因素的所有水平上。论可以推广到多个随机因素的所有水平上。二、数学模型二、数学模型 随机模型随机模型 美国的黑核桃品种对不同地理条件的适应情况美国的黑核桃品种对不同地理条件的适应情况气候、水肥、土壤气候、水肥、土壤无法人为控制无法人为控制河南河南 北京北京 广广 州州 江苏江苏 新疆新疆 如果实验条件不能人为控制,那么