生物统计学：方差分析课件.ppt_163文库

资源描述

1、什么是方差分析?（一个例子）表8-1 该饮料在五家超市的销售情况超市无色粉色橘黄色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8【例例8.18.1】某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种，分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况，见表8-1。试分析饮料的颜色是否对销售量产生影响。什么是方差分析?（例子的进一步分析）

2、1.检验饮料的颜色对销售量是否有影响，也就是检验四种颜色饮料的平均销售量是否相同2.设 1 1为无色饮料的平均销售量，2 2粉色饮料的平均销售量，3 3为橘黄色饮料的平均销售量，4 4为绿色饮料的平均销售量，也就是检验下面的假设H H0 0:1 1 2 2 3 3 4 4 H H1 1:1 1,2 2,3 3,4 4 不全相等不全相等3.检验上述假设所采用的方法就是方差分析一、3组以上数据采用t检验的缺点：1.检验过程烦琐 2.无统一的试验误差，误差估计的精确性和检验的灵敏性低3.推断的可靠性低，检验的 I 型错误率大由于上述原因，多个平均数的差异显著性检验不宜用 t 检验，须采用方差分析法。

3、ANOVA 由英国统计学家R.A.Fisher首创，为纪念Fisher，以F命名，故方差分析又称 F 检验（F test）。用于推断多个总体均数有无差异这种方法是将k个处理的观测值作为一个整体看待，把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度，进而获得不同变异来源总体方差估计值；通过计算这些总体方差的估计值的适当比值，就能检验各样本所属总体平均数是否相等。“方差分析法是一种在若干能相互比较的资料组中，把产生变异的原因加以区分开来的方法与技术”，方差分析实质上是关于观测值变异原因的数量分析。几个常用术语:1.试验指标(experimental index)为衡量试验结

4、果的好坏或处理效应的高低，在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同，选择的试验指标也不相同。在畜禽、水产试验中常用的试验指标有：日增重、产仔数、产奶量、产蛋率、瘦肉率、某些生理生化和体型指标(血糖含量、体高、体重)等。2.试验因素(experimental factor)试验中所研究的影响试验指标的因素叫试验因素。如研究如何提高猪的日增重时，饲料的配方、猪的品种、饲养方式、环境温湿度等都对日增重有影响，均可作为试验因素来考虑。当试验中考察的因素只有一个时，称为单因素试验；若同时研究两个或两个以上的因素对试验指标的影响时，则称为两因素或多因素试验。试验因素常用大写字母A、

5、B、C、等表示。3.因素水平(level of factor)试验因素所处的某种特定状态或数量等级称为因素水平，简称水平。如比较3个品种奶牛产奶量的高低，这3个品种就是奶牛品种这个试验因素的3个水平；研究某种饲料中4种不同能量水平对肥育猪瘦肉率的影响，这4种特定的能量水平就是饲料能量这一试验因素的4个水平。因素水平用代表该因素的字母加添足标1，2，来表示。如 A1、A2、，B1、B2、，等。4.试验处理(treatment)事先设计好的实施在试验单位上的具体项目叫试验处理，简称处理。在单因素试验中，实施在试验单位上的具体项目就是试验因素的某一水平。例如进行饲料的比较试验时，实施在试验单位(某种

6、畜禽)上的具体项目就是喂饲某一种饲料。所以进行单因素试验时，试验因素的一个水平就是一个处理。在多因素试验中，实施在试验单位上的具体项目是各因素的某一水平组合。例如进行3种饲料和3个品种对猪日增重影响的两因素试验，整个试验共有33=9个水平组合，实施在试验单位(试验猪)上的具体项目就是某品种与某种饲料的结合。所以，在多因素试验时，试验因素的一个水平组合就是一个处理。5.试验单位(experimental unit)在试验中能接受不同试验处理的独立的试验载体叫试验单位。在畜禽、水产试验中，一只家禽、一头家畜、一只小白鼠、一尾鱼，即一个动物；或几只家禽、几头家畜、几只小白鼠、几尾鱼，即一组动物都可作

7、为试验单位。试验单位往往也是观测数据的单位。6.重复(repetition)在试验中，将一个处理实施在两个或两个以上的试验单位上，称为处理有重复；一处理实施的试验单位数称为处理的重复数。例如，用某种饲料喂4头猪，就说这个处理(饲料)有4次重复。1 方差分析的基本原理与步骤本节结合单因素试验结果的方差分析介绍其原理与步骤。一、线性模型与基本假定假设某单因素试验有k个处理，每个处理有n次重复，共有nk个观测值。这类试验资料的数据模式如表1所示。表1 k个处理每个处理有n个观测值的数据模式表中表示第i个处理的第j个观测值（i=1,2,k；j=1,2,n）；表示第i个处理n个观测值的和；表示

8、全部观测值的总和；表示第i个处理的平均数；表示全部观测值的总平均数；可以分解为ijx.1niijjxx111.knkijiijixxx1././niijijxxnxn11././knijijxxknxknijx (1)表示第i个处理观测值总体的平均数。为了看出各处理的影响大小，将再进行分解，令 (2)(3)则 (4)其中表示全试验观测值总体的平均数；ijiijx11kiikiiijiijxii ai 是第 i 个处理的效应（treatment effects）表示处理i对试验结果产生的影响。显然有 (5)ij是试验误差，相互独立，且服从正态分布N（0，2）。（4）式叫做单因素试验的线性

9、模型（linear model）亦称数学模型。在这个模型中Xii表示为总平均数、处理效应i、试验误差ij之和。10kii 由ij 相互独立且服从正态分布 N（0，2），可知各处理Ai(i=1，2，k)所属总体亦应具正态性，即服从正态分布N(i,2)。尽管各总体的均数可以不等或相等，2则必须是相等的。所以，单因素试验的数学模型可归纳为：效应的可加性（additivity）、分布的正态性（normality）、方差的同质性（homogeneity）。这也是进行其它类型方差分析的前提或基本假定。i 若将表（1）中的观测值 xij（i=1,2,k;j=1,2,n）的数据结构（模型）用样本符号来表

10、示，则（6）与（4）比较可知.()()ijiijiiijxxxxxxxteijiijx （4）、（6）两式告诉我们：每个观测值都包含处理效应（i-或），与误差（或 )，故kn个观测值的总变异可分解为处理间的变异和处理内的变异两部分。.ixxijix.ijixx二、平方和与自由度的剖分在方差分析中是用样本方差即均方（mean squares）来度量资料的变异程度的。表1中全部观测值的总变异可以用总均方来度量。总变异处理间变异处理内变异总平方和（总df）处理间平方和（处理间df）处理内平方和（处理内df）（一）总平方和的剖分（一）总平方和的剖分在表在表6-1中，反映全部观测值总

11、变异的总中，反映全部观测值总变异的总平方和是各观测值平方和是各观测值xij与总平均数的离均差平与总平均数的离均差平方和，记为方和，记为SST。即。即2.11()knTijijSSxx22111122112211111(.)(.)(.)(.)2(.)(.)(.)(.)2(.)(.)(.)knknijiijiijijkniiijiijiijkknkniiijiijiiijijxxxxxxxxxxxxxxnxxxxxxxx因为其中所以（7）（7）式中，为各处理平均数与总平均数的离均差平方和与重复数n的乘积，反映了重复 n 次的处理间变异，称为处理间平方和，记为SSt，即.1()0nijijxx

12、222.11111()()()knkknijiijiijiijxxnxxxx21(.)kiinxx21(.)ktiiSSnxx (7)式中，为各处理内离均差平方和之和，反映了各处理内的变异即误差，称为处理内平方和或误差平方和，记为SSe，即于是有 SST=SSt+SSe （8）这个关系式中三种平方和的简便计算公式如下：2.11()knijiijxx2.11()kneijiijSSxx (9)其中，C=/kn称为矫正数。（二）总自由度的剖分在计算总平方和时，资料中的各个观测值要受这一条件的约束，故总自由度等于资料中观测值的总个数减1，即kn-1。总自由度记为dfT，即dfT=kn-1。2

13、112.11knTijijktiiSSxCSSxCneTtSSSSSSkinjijxx110.)(2xdfTkn-1；dftk-1；dfekn-k 因为所以 (10)综合以上各式得：(11)1(1)()(1)(1)nkknkkkk n Ttedfdfdf11TteTtdfkndfkdfdfdf 各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方，分别记为 MST（或）、MSt（或）和MSe（或）。即（12）总均方一般不等于处理间均方加处理内均方。2TS2tS2eS2/TTTTMSSSSdf2/ttttMSSSSdf2/eeeeMSSSSdf 【例1】某水产研究所为了比较

14、四种不同配合饲料对鱼的饲喂效果，选取了条件基本相同的鱼20尾，随机分成四组，投喂不同饲料，经一个月试验以后，各组鱼的增重结果列于下表。表2 饲喂不同饲料的鱼的增重（单位：10g）这是一个单因素试验，处理数这是一个单因素试验，处理数k=4，重复数，重复数n=5。各项平方和及自由度计算如下：。各项平方和及自由度计算如下：矫正数矫正数总平方和总平方和 22./550.8/(4 5)15169.03Cxnk222231.927.928.5TijSSxCC 15368.715169.03199.67222221.1(155.9131.4123.7139.8)515283.3 15169.03 114.

15、27tiSSxCnC处理间平方和处理内平方和199.67114.2785.40eTtSSSSSS 总自由度处理间自由度处理内自由度用SSt、SSe分别除以dft和dfe便得到处理间均方MSt及处理内均方MSe。因为方差分析中不涉及总均方的数值，所以不必计算之。15 4 119Tdfnk 14 13tdfk 19316eTtdfdfdf/114.27/338.09/85.40/165.34ttteeeMSSSdfMSSSdf三、期望均方三、期望均方方差分析的一个基本假定是要求各处理观测值总方差分析的一个基本假定是要求各处理观测值总体的方差相等，体的方差相等，即即（i=1,2,k）表示第）

16、表示第i个处理观测值总体的方差。个处理观测值总体的方差。如果所分析的资料满足这个方差同质性的要求，如果所分析的资料满足这个方差同质性的要求，那么各处理的样本方差那么各处理的样本方差S21，S22，S2k 都是都是2的无偏估计（的无偏估计（unbiased estimate）量。）量。S2i(i=1,2,k)是由试验资料中第是由试验资料中第i个处理的个处理的n个个观测值算得的方差。观测值算得的方差。2222212,ki 显然，各S2i的合并方差（以各处理内的自由度n-1为权的加权平均数）也是2的无偏估计量，且估计的精确度更高。很容易推证处理内均方MSe就是各的合并。2eS2iS2221222

17、221121212.)1()1()(估计ekkkkkiiijeeeSdfdfdfSdfSdfSdfdfdfdfSSSSSSnkSSnkxxdfSSMS 其中SSi、dfi（i=1，2，k）分别表示由试验资料中第i个处理的n个观测值算得的平方和与自由度。这就是说，处理内均方MSe是误差方差2的无偏估计量。试验中各处理所属总体的本质差异体现在处理效应的差异上。我们把称为效应方差，它也反映了各处理观测值总体平均数的变异程度，记为。i22/(1)()/(1)iiakki2221iak 四、四、F分布与分布与F检验检验（一）（一）F分布分布设想我们作这样的抽样试验，即在一正设想我们作这样的

18、抽样试验，即在一正态总体态总体N（，2）中随机抽取样本含量为）中随机抽取样本含量为n的的样本样本k个，将各样本观测值整理成个，将各样本观测值整理成表表1 的形式。的形式。此时所谓的各处理没有真实差异，各处理只此时所谓的各处理没有真实差异，各处理只是随机分的组。因此，由（是随机分的组。因此，由（12）式算出的）式算出的和和都是误差方差都是误差方差的估计量。以的估计量。以为为分母，分母，为分子，求其比值。统计学上把两为分子，求其比值。统计学上把两个均方之比值称为个均方之比值称为F值。即值。即 2tS2eS22eS2tS （14）F具有两个自由度：若在给定的k和n的条件下，继续从该总体进行

19、一系列抽样，则可获得一系列的F值。这些F值所具有的概率分布称为 F 分布（F distribution）。F分布密度曲线是随自由度df1、df2的变化而变化的一簇偏态曲线，其形态随着df1、df2的增大逐渐趋于对称，如图1所示。22/teFSS121,(1)tedfdfkdfdfk n图1F分布的取值范围是（0，+），其平均值 =1。用表示F分布的概率密度函数，则其分布函数为：(15)因而F分布右尾从到+的概率为：(16)F()f FF F()()()FF FP FFf F dFF()1()()FP FFF Ff F dF 附表4列出的是不同 df1 和 df2 下，P（F ）=0.05

20、和P（F ）=0.01时的F值，即右尾概率=0.05和=0.01时的临界F值，一般记作，。FF120.05(,)df dfF120.01(,)df dfF (二)F检验附表4是专门为检验代表的总体方差是否比代表的总体方差大而设计的。若实际计算的F值大于，则 F 值在=0.05的水平上显著，我们以95%的可靠性(即冒5%的风险)推断代表的总体方差大于代表的总体方差。这种用F值出现概率的大小推断两个总体方差是否相等的方法称为 F检验(F-test)。2tS2eS120.05(,)df dfF2tS2eS 在方差分析中所进行的F 检验目的在于推断处理间的差异是否存在，检验某项变异因素的

21、效应方差是否为零。因此，在计算F 值时总是以被检验因素的均方作分子，以误差均方作分母。应当注意，分母项的正确选择是由方差分析的模型和各项变异原因的期望均方决定的。在单因素试验结果的方差分析中，无效假设为H0：1=2=k，备择假设为 HA：各i不全相等，或H0：=0,HA:0；F=MSt/MSe，也就是要判断处理间均方是否显著大于处理内(误差)均方。如果结论是肯定的，我们将否定H0；反之，不否定H0。22 反过来理解：如果H0是正确的，那么MSt与MSe都是总体误差2的估计值，理论上讲F值等于1；如果H0是不正确的，那么 MSt之期望均方中的就不等于零，理论上讲 F 值就必大于1。但是由于抽样的

22、原因，即使H0正确，F值也会出现大于1的情况。所以，只有F值大于1达到一定程度时，才有理由否定H0。实际进行F检验时，是将由试验资料所算得的F值与根据df1=dft (大均方，即分子均方的自由度)、df2=dfe(小均方，即分母均方的自由度)查附表4所得的临界F值，相比较作出统计推断的。若F ，即P0.05，不能否定H0，统计学上，把这一检验结果表述为：各处理间差异不显著，在F值的右上方标记“ns”，或不标记符号；120.05(,)df dfF120.01(,)df dfF120.05(,)df dfF 若 F ，即0.01P0.05，否定H0，接受HA，统计学上，把这一检验结果表述为：各处

23、理间差异显著，在F值的右上方标记“*”；若F ，即P0.01，否定H0，接受HA，统计学上，把这一检验结果表述为：各处理间差异极显著，在 F 值的右上方标记“*”。120.05(,)df dfF120.01(,)df dfF120.01(,)df dfF 对于【例1】：因为 F=MSt/MSe=38.09/5.34=7.13*；根据 df1=dft=3，df2=dfe=16 查附表4，得F0.01(3，16)；因为 FF0.01(3，16)=5.29,P0.01 表明四种不同饲料对鱼的增重效果差异极显著，用不同的饲料饲喂，增重是不同的。表3 表2资料方差分析表在方差分析中，通常将变异来源

24、、平方和、自由度、均方和F值归纳成一张方差分析表，见表3。在实际进行方差分析时，只须计算出各项平方和与自由度，各项均方的计算及F检验可在方差分析表上进行。五、多重比较统计上把多个平均数两两间的相互比较称为多重比较(multiple comparisons)。多重比较的方法甚多，常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法)（一）最小显著差数法 (LSD法，least significant difference)此法的基本作法是：1、F检验显著2、计算出显著水平为的3、与其比较。LSD.ijxxLSD 若 LSD时，则与在水平上差异显著；反之，则在水平上差异不显著。.i

25、jxx.ix.jx (17)式中：为在F检验中误差自由度下，显著水平为的临界t值，为均数差异标准误，由(18)式算得。(18).()eijaa dfxxLSDtS)(edft.ijxxS.2/ijxxeSMSn其中为F检验中的误差均方，n为各处理的重复数。eMS 当显著水平=0.05和0.01时，从t值表中查出和，代入(17)式得：(19)0.05()edft0.01()edft.0.050.05()0.010.01()eijeijdfxxdfxxLSDtSLSDtSLSD法步骤：(1)列出平均数的多重比较表比较表中各处理按其平均数从大到小自上而下排列；(2)计算最小显著差数和；(

26、3)将平均数多重比较表中两两平均数的差数与、比较，作出统计推断。0.05LSD0.01LSD0.05LSD0.01LSD 表4 例1中四种饲料平均增重的多重比较结果 (LSD法)Step 1计算和查t值表得：t0.05(dfe)=t0.05(16)=2.120 t0.01(dfe)=t0.01(16)=2.921 所以，显著水平为0.05与0.01的最小显著差数为.2/2 5.34/51.462ijxxeSMSn.0.050.05()0.010.01()2.120 1.4623.0992.921 1.4624.271eijeijdfxxdfxxLSDtSLSDtS0.05LSD0.01L

27、SDStep 2 将表4中的6个差数与，比较：0.05LSD0.01LSD 小于，标记“ns”，或不标记符号；介于与之间标记“*”；大于，标记“*”。0.05LSD0.05LSD0.01LSD0.01LSDStep 3结果关于LSD 法的应用有以下几点说明：1、LSD 法实质上就是t检验法。它解决了本章开头指出的检验法检验过程烦琐，无统一的试验误差且估计误差的精确性和检验的灵敏性低这两个问题。但LSD法并未解决推断的可靠性降低、犯I型错误的概率变大的问题。2、因为LSD法实质上是t检验，故有人指出其最适宜的比较形式是：在进行试验设计时就确定各处理只是固定的两个两个相比，每个处理平均

28、数在比较中只比较一次。例如，在一个试验中共有4个处理，设计时已确定只是处理1与处理2、处理3与处理4(或1与3、2与4；或1与4、2与3)比较，而其它的处理间不进行比较。因为这种比较形式实际上不涉及多个均数的极差问题，所以不会增大犯I型错误的概率。综上所述，对于多个处理平均数所有可能的两两比较，LSD法的优点在于方法比较简便，克服一般检验法所具有的某些缺点，但是由于没有考虑相互比较的处理平均数依数值大小排列上的秩次，故仍有推断可靠性低、犯I型错误概率增大的问题。为克服此弊病，统计学家提出了最小显著极差法。(二)最小显著极差法 (LSR法,Least significant ranges)LSR

29、法的特点是把平均数的差数看成是平均数的极差，根据极差范围内所包含的处理数(称为秩次距)k的不同而采用不同的检验尺度，以克服LSD法的不足。这些在显著水平上依秩次距k的不同而采用的不同的检验尺度叫做最小显著极差LSR。因为LSR法是一种极差检验法，所以当一个平均数大集合的极差不显著时，其中所包含的各个较小集合极差也应一概作不显著处理。LSR法克服了LSD法的不足，但检验的工作量有所增加。常用的LSR法有q检验法和新复极差法两种。1、q检验法(q test)此法是以统计量q的概率分布为基础的。q值由下式求得：(20)/xqS 式中，为极差，为标准误，分布依赖于误差自由度dfe及秩次距k。利用q检

30、验法进行多重比较时，为了简便起见，不是将由(20)式算出的q值与临界q值比较，而是将极差与比较，从而作出统计推断。即为水平上的最小显著极差。/xeSMSn(,)ea dfkq(,)ea dfkxqS(,)ea dfkxqS (21)当显著水平=0.05和0.01时，从附表5(q值表)中根据自由度及秩次距 k 查出和代入(21)式得 (22)实际利用q检验法进行多重比较时，可按如下步骤进行：,(,)ea ka dfkxLSRqSedf0.05(,)edfkq0.01(,)edfkq0.05,0.05(,)0.01,0.01(,)eekdfkxkdfkxLSRqSLSRqS (1)列出

31、平均数多重比较表；(2)由自由度dfe、秩次距k查临界q值，计算最小显著极差LSR0.05,k，LSR0.01,k；(3)将平均数多重比较表中的各极差与相应的最小显著极差LSR0.05,k,LSR0.01,k比较，作出统计推断。对于【例1】，各处理平均数多重比较表同表4。在表4中，极差1.54、1.68、3.22的秩次距为2；极差3.22、4.90的秩次距为3；极差6.44的秩次距为4。因为，MSe=5.34，故标准误为根据dfe=16，k=2，3，4 由附表5查出=0.05、0.01水平下临界q值，乘以标准误求得各最小显著极差，所得结果列于表5。xS/5.34/51.033xeSMSn

32、xS 表表5 q值及值及LSR值值将表4中的极差1.54、1.68、3.22 与表5中的最小显著极差 3.099、4.266比较；将极差3.22、4.90与3.770、4.948比较；将极差6.44与4.184、5.361比较。检验结果，除A4与 A3的差数3.22由LSD法比较时的差异显著变为差异不显著外，其余检验结果同法。2、新复极差法(new multiple range method)此法是由邓肯(Duncan)于1955年提出，故又称Duncan法，此法还称SSR法(shortest significant ranges)。新复极差法与q检验法的检验步骤相同，唯一不同的是计算最小显

33、著极差时需查SSR表(附表6)而不是查q值表。最小显著极差计算公式为 (23),(,)ea ka dfkxLSRSSRS 其中是根据显著水平、误差自由度dfe、秩次距k，由SSR表查得的临界SSR，。=0.05 和=0.01 水平下的最小显著极差为：(24)对于【例6.1】，各处理均数多重比较表同表4。已算出 =1.033，依dfe=16 k=2,3,4,由附表6查临界SSR0.05(16,k)和SSR0.01(16,k)值，乘以 =1.033，求得各最小显著极差，所得结果列于表6-6。/xeSMSn0.05,0.05(,)0.01,0.01(,)eekdfkxkdfkxLSRSSRSLSRS

34、SRSxSxS 表表6 SSR值与值与LSR值值将表4中的平均数差数(极差)与表6中的最小显著极差比较，检验结果与 q检验法相同。当各处理重复数不等时，为简便起见，不论LSD法还是LSR法，可用(6-25)式计算出一个各处理平均的重复数n0，以代替计算或所需的n。(25)式中k为试验的处理数，(i=1,2,k)为第i处理的重复数。.ijxxSxS2011iiinnnknin 以上介绍的三种多重比较方法，其检验尺度有如下关系：LSD法新复极差法q检验法当秩次距k=2时，取等号；秩次距 k 3时，取小于号。在多重比较中，LSD法的尺度最小，q检验法尺度最大，新复极差法尺度居中。用上述排

35、列顺序前面方法检验显著的差数，用后面方法检验未必显著；用后面方法检验显著的差数，用前面方法检验必然显著。一般地讲，一个试验资料，究竟采用哪一种多重比较方法，主要应根据否定一个正确的 H0 和接受一个不正确的H0的相对重要性来决定。如果否定正确的 H0是事关重大或后果严重的，或对试验要求严格时，用检验法较为妥当；如果接受一个不正确的H0是事关重大或后果严重的，则宜用新复极差法。生物试验中，由于试验误差较大，常采用新复极差法；F检验显著后，为了简便，也可采用LSD法。(三)多重比较结果的表示法各平均数经多重比较后，应以简明的形式将结果表示出来，常用的表示方法有以下两种。1、三角形法此法是将多重

36、比较结果直接标记在平均数多重比较表上，如表4所示。此法的优点是简便直观，缺点是占的篇幅较大。2、标记字母法此法是先将各处理平均数由大到小自上而下排列；然后在最大平均数后标记字母，并将该平均数与以下各平均数依次相比，凡差异不显著标记同一字母，直到某一个与其差异显著的平均数标记字母b；再以标有字母b的平均数为标准，与上方比它大的各个平均数比较，凡差异不显著一律再加标b，直至显著为止；再以标记有字母 b的最大平均数为标准，与下面各未标记字母的平均数相比，凡差异不显著，继续标记字母b，直至某一个与其差异显著的平均数标记c；如此重复下去，直至最小一个平均数被标记、

37、比较完毕为止。这样，各平均数间凡有一个相同字母的即为差异不显著，凡无相同字母的即为差异显著。用小写拉丁字母表示显著水平=0.05，用大写拉丁字母表示显著水平=0.01。在利用字母标记法表示多重比较结果时，常在三角形法的基础上进行。此法的优点是占篇幅小，在科技文献中常见。对于【例1】，现根据表4所表示的用新复极差法进行多重比较结果用字母标记如表7所示(注意，用新复极差法进行多重比较，表4中A4与A3的差数3.22在=0.05的水平上不显著，其余的与LSD法同)。表7 表4多重比较结果的字母标记(SSR法)在表7中，先将各处理平均数由大到小自上而下排列。当显著水平=0.05时，先在平均数3

38、1.18行上标记字母a；由于31.18与27.96 之差为3.22，在=0.05水平上显著，所以在平均数27.96行上标记字母b；然后以标记字母b的平均数27.96 与其下方的平均数 26.28 比较，差数为1.68，在=0.05水平上不显著，所以在平均数26.28行上标记字母b ；再将平均数27.96与平均数24.74比较，差数为3.22，在=0.05水平上不显著，所以在平均数24.74行上标记字母b。类似地，可以在=0.01 将各处理平均数标记上字母，结果见表6-7。q检验结果与SSR法检验结果相同。由表7看到，A1饲料对鱼的平均增重极显著地高于A2和A3饲料，显著高于A4饲

39、料；A4、A2、A3 三种饲料对鱼的平均增重差异不显著。四种饲料其中以A1饲料对鱼的增重效果最好。应当注意，无论采用哪种方法表示多重比较结果，都应注明采用的是哪一种多重比较法。七、方差分析的基本步骤方差分析的基本步骤归纳如下：（一）计算各项平方和与自由度；（二）列出方差分析表，进行F检验；（三）若F检验显著，则进行多重比较。多重比较的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法：包括q检验法和新复极差法)。表示多重比较结果的方法有三角形法和标记字母法。第二节单因素试验资料的方差分析根据各处理内重复数是否相等，单因素试验资料的方差分析又分为重复数相等和重复数不等两种情况。一

40、、各处理重复数相等的方差分析【例3】抽测5个不同品种的若干头母猪的窝产仔数，结果见表12，试检验不同品种母猪平均窝产仔数的差异是否显著。表12 五个不同品种母猪的窝产仔数这是一个单因素试验，k=5,n=5。现对此试验结果进行方差分析如下：1、计算各项平方和与自由度 22./265/(5 5)2809.00Cxkn22222222222.(8131413)2809.002945.002809.00136.0011(5141604865)2809.0052882.202809.0073.20TijtiSSxCSSxCn136.0073.2062.80eTtSSSSSS15 5 124,15 1

41、4,24420TteTtdfkndfkdfdfdf 2、列出方差分析表，进行F检验表13 不同品种母猪的窝产仔数的方差分析表根据df1=dft=4,df2=dfe=20查临界F值得：F0.05(4,20)=2.87,F0.05(4,20)=4.43 因为FF0.01(4,20)，即P0.01，表明品种间产仔数的差异达到1%显著水平。3、多重比较采用新复极差法，各处理平均数多重比较表见表14。表表14 不同品种母猪的平均窝产仔数不同品种母猪的平均窝产仔数多重比较表多重比较表(SSR法法)因为MSe=3.14,n=5，所以为：根据dfe=20，秩次距k=2，3，4，5由附表6查出=0.

42、05和=0.01的各临界SSR值，乘以 =0.7925，即得各最小显著极差，所得结果列于表15。xS/3.14/50.793xtSMSnxS 表15 SSR值及LSR值二、各处理重复数不等的方差分析设处理数为k；各处理重复数为n1,n2,nk；试验观测值总数为N=ni。则 (28)2.22./,/,1,1,TijtiieTtTteTtCxNSSxC SSxnC SSSSSSdfNdfkdfdfdf 【例4】5个不同品种猪的育肥试验，后期30天增重(kg)如表16所示。试比较品种间增重有无差异。表16 5个品种猪30天增重此例处理数k=5，各处理重复数不等。现对此试验结果进行方差分析如下：1

43、、计算各项平方和与自由度 22./460.5/258482.41CxN222222.22222(21.519.517.016.0)8482.418567.75 8482.41 85.34/(121.0/6 103.0/6 91.5/5 78.8/4 66.5/4)8482.418528.91 8482.4146.5085.34 46.5038.84125 1TijtiieTtTSSxCSSxnCSSSSSSdfN 2415 1424 420teTtdfkdfdfdf 2、列出方差分析表，进行F检验临界F值为：F0.05(4,20)=2.87,F0.01(4,20)=4.43，因为品种间的F值

44、 5.99F0.01(4,20)，P0.01，表明品种间差异极显著。表17 5个品种育肥猪增重方差分析表 3、多重比较采用新复极差法，各处理平均数多重比较表见表18。因为各处理重复数不等，应先由(25)式计算出平均重复次数n0来代替标准误中的n，此例于是，标准误为：/xeSMSn22222201166544254.9615 125iiinnnknxS0/1.94/4.960.625xeSMSn表18 5个品种育肥猪平均增重多重比较表(SSR法)根据dfe=20，秩次距k=2,3,4,5，从附表6中查出=0.05与=0.01的临界SSR值，乘以 =0.625，即得各最小显极差，所得结果列于

45、表19。xS 表19 SSR值及LSR值表第三节两因素试验资料的方差分析两因素试验资料的方差分析是指对试验指标同时受到两个试验因素作用的试验资料的方差分析。两因素试验按水平组合的方式不同，分为交叉分组和系统分组两类，因而对试验资料的方差分析方法也分为交叉分组方差分析和系统分组方差分析两种。一、交叉分组资料的方差分析设试验考察A、B两个因素，A因素分a个水平，B因素分b个水平。所谓交叉分组是指A因素每个水平与B因素的每个水平都要碰到，两者交叉搭配形成ab个水平组合即处理，试验因素A、B在试验中处于平等地位。试验单位分成 ab 个组，每组随机接受一种处理，因而试验数据也按两因素两方向分组。

46、这种试验以各处理是单独观测值还是有重复观测值又分为两种类型。(一)两因素单独观测值试验资料的方差分析对于A、B两个试验因素的全部ab个水平组合，每个水平组合只有一个观测值，全试验共有ab个观测值，其数据模式如表20所示。表20 两因素单独观测值试验数据模式表20中.1.11.111,1,1,biijjbniijjijjiaabjijijiijxxxxxxbxxxxa11./abijijxxab 两因素单独观测值试验资料的数学模型为：(29)式中，为总平均数；(1,2,;1,2,)ijlijijlxia jb i，j分别为Ai、Bj的效应:i=i-,j=j-,i、j分别为Ai、Bj观测值总体平

47、均数，且i=0,j=0;ijl为随机误差，相互独立，且服从N(0，2)。交叉分组两因素单独观测值的试验，A因素的每个水平有b次重复，B因素的每个水平有a次重复，每个观测值同时受到A、B 两因素及随机误差的作用。因此全部 ab 个观测值的总变异可以剖分为 A 因素水平间变异、B因素水平间变异及试验误差三部分；自由度也相应剖分。平方和与自由度的剖分式如下：(30)各项平方和与自由度的计算公式为:矫正数总平方和 A因素平方和 B因素平方和 (31)TABeTABeSSSSSSSSdfdfdfdf2./Cxab22.1111()ababTijijijijSSxxxC22.111()aaAiiiiS

48、SbxxxCb22.111()bbBjjjjSSaxxxCa 误差平方和 SSe=SST-SSA-SSB 总自由度 dfT=ab-1 A因素自由度 dfA=a-1 B因素自由度 dfB=b-1 误差自由度 dfe=dfT-dfA dfB =(a-1)(b-1)相应均方为/,/,/AAABBBeeeMSSSdfMSSSdfMSSSdf 【例5】为研究雌激素对子宫发育的影响，现有4窝不同品系未成年的大白鼠，每窝3只，随机分别注射不同剂量的雌激素，然后在相同条件下试验，并称得它们的子宫重量，见表21，试作方差分析。表21 各品系大白鼠注射不同剂量雌激素的子宫重量(g)这是一个两因素单独观测值试验资料

49、。A因素(品系)有4个水平，即a=4；B因素(雌激素注射剂量)有 3 个水平，即 b=3，共有ab=34=12个观测值。方差分析如下：1、计算各项平方和与自由度 22./1098/(4 3)100467.0000Cxab2222222222.2222.(1061166387)100467.0000113542 100467.000013075.000011(367225314192)100467.00003106924.6667100467.00006457.666711(260358480)100467.004TijAiBjSSxCSSxCbSSxCa00106541.0000 100

50、467.00006074.000013075.00006457.66676070000543.333314 3 1 11,14 1313 12,11 3 26eTABTABeTABSSSSSSSSdfabdfadfbdfdfdfdf 2、列出方差分析表，进行F检验表22 表21资料的方差分析表根据df1=dfA=3,df2=dfe=6 查临界F值，F0.01(3,6)=9.78；根据df1=dfB=2，df2=dfe=6查临界F值，F0.01(2,6)=10.92。因为 A 因素的 F 值 23.77 F0.01(3,6)，P0.01，表明不同品系间差异极显著；B 因素的 F 值3

展开阅读全文