1、第六章第六章 方差分析方差分析 在实际研究过程中,对三个及三个以上多个样本平均数进行比较,用t或u检验会出现的问题:第六章第六章 方差分析方差分析 在实际研究过程中,对三个及三个以上多个样本平均数进行比较,用t或u检验会出现的问题:所出现的问题所出现的问题检验过程繁锁无统一的试验误差,误差估计的精确性和检验的灵敏性低推断的可靠性降低,犯I类错误的概率增加方差分析(analysis of variance, ANOVA)又叫变量分析,是英国著名统计学家R.A. Fisher于1923年提出的。方差分析是将所有处理的观测值作为一个整体,一次比较就对所有各组间样本平均数是否有差异作出判断。如果差异不
2、显著,则认为他们都是相同的,如果差异显著,再进一步比较是哪组数据与其他数据不同。第六章第六章 方差分析方差分析 方差分析方差分析 是对两个或多个样本平均数差异学著性检验的方法,是将测量数据的总变异按照变异来源分解为处理效应和试验误差,并做出其数量估计。分类分类单因素方差分析二因素方差分析多因素方差分析基本步骤基本步骤分解F检验多重比较第六章第六章 方差分析方差分析 方差分析方差分析 是对两个或多个样本平均数差异性作显著性检验的方法,是将测量数据的总变异按照变异来源分解为处理效应和试验误差,并做出其数量估计。多重比较多重比较最小显著差数法最小显著极差法第六章第六章 方差分析方差分析 方差分析方差
3、分析 是对两个或多个样本平均数差异性作显著性检验的方法,是将测量数据的总变异按照变异来源分解为处理效应和试验误差,并做出其数量估计。多重比较多重比较最小显著差数法最小显著极差法基本假定条件基本假定条件正态性可加性方差同质性数据缺失数据缺失可利用误差平方和最小的原则对其进行弥补第六章第六章 方差分析方差分析1. 方差分析的基本原理1. 相关术语相关术语1) 试验因素试验中所研究的影响试验指标的原因或原因组合称为试验因素(experimental factor)或处理因素(treatment factor),简称因素或因子。按性质不同,可分为可控因素和非控因素。可控因素(controllable
4、factor)非控因素(uncontrollable factor)试验因素常用大写字母A、B、C等来表示。第六章第六章 方差分析方差分析1. 方差分析的基本原理1. 相关术语相关术语2) 因素水平每个试验因素的不同状态(处理的某种特定状态或数量上的差别)称为因素水平(level of factor),简称水平。水平常用大写字母添加下标1、2、3等来表示,如A1、A2、A3、 ,B1、 B2、 B3 , C1、 C2、C3 等来表示。1) 试验因素第六章第六章 方差分析方差分析1. 方差分析的基本原理1. 相关术语相关术语2) 因素水平试验处理(experimental treatment)通
5、常也称为处理(treatment),指对受试对象给予的某种外部干预,是试验实施因子水平的一个组合。1) 试验因素3) 试验处理单因素处理(single factor treatment)多因素处理(multiple factor treatment)4) 试验单位 5) 重复 二因素处理(single factor treatment)ijiijx2. 方差分析的基本原理方差分析的基本原理观测值的差异处理效应误差效应 方差分析的基本思想就是将测量数据的总变异按照变异原因不同进行分解,分为处理效应和试验误差,并对其进行数量估计。判定标准?方差,即均方(mean squares)0i), 0(02
6、Ni3. 数学模型数学模型ijiij样本ijiijetxxx固定模型(fixed model)随机模型(random model)混合模型(mixed model) 不同的模型在平方和及自由度的计算上是相同的,但在进行假设检验时,F值的计算公式是不同的,具有不同的侧重点4. 平方和与自由度的分解平方和与自由度的分解Nx22总平方和(total sum of squares总自由度(total degree of freedom)1) 平方和的分解CTnSSSSSSSSitetT212) 自由度的分解) 1(11kndfkdfnkdfdfdfdfetTetTTSS. i.xxxxxxiijij2
7、. i2. i2. i2.)()(2)()()(xxxxxxxxxxxxxxiiijijiijij0)()(2)(21. i.1. injijinjiijxxxxxxxxkiiknijknijxxnxxxx12.1i1j2. i1i1j2. .)()()(T1i1j2. .SS)(knijxxt12.SS)(kiixxnekinjiijSSxx112.)(etTSSSSSSnkTxnkxxxxxxxxijijijijijknij22222.21i1j2. .T)()()()()(2)()(SSnkTTnSSnkTxSSitijT22221)(nkTCxTij2tTeitijTSSSSSSCTn
8、SSCxSS2213) 算计方差etTSSSSSSeeetttdfSSsdfSSs22) 1(11kndfkdfnkdfdfdfdfetTetT5. 统计假设的显著性检验统计假设的显著性检验-F检验检验重复重复饲料饲料A1A2A3A412345319279318284359248257268279262221236273249258270308290245286总和Ti1559131412371399T=5509平均数xi311.8262.8247.4279.8275.4505.151745420550922nkTC60.855135.1143595.19986etTSSSSSS处理内方差SS
9、e也就是饲料内方差可以估计误差方差处理间方差SSt饲料间方差,可以估计不同饲料喂养增重的差异。F检验(F-test)被检验因素的均方误差均方22etssF 变异来源变异来源dfSSS2FF0.05F0.01饲料间饲料内31611435.358551.63811.78534.487.132*3.245.29总变异1919986.956. 多重比较多重比较1) 最小显著差数法(LSD法)2)最小显著极差法(LSR法) 为了比较不同处理平均数两两间差异的显著性,每个处理的平均数都要与其他处理的平均数进行比较,统计上把多个平均数两两间的相互比较称为多重比较(multiple comparisons)是
10、Fisher最早用于检验所有总体均数间两两相等假设的方法,其实质是两个平均数相比较的t检验法。是在一定的显著水平上,根据极差范围内所包含的处理数据(也称为秩次距)M的不同而采用不同的显著差数标准进行比较。其又可分为新复极差检验和q检验。最小显著差数法(LSD)首先计算出达到差异显著的最小差数,记为LSD;然后与两个处理平均数的差值进行比较;如果处理的平均数差值大于LSD,则认为在给定的显著水平上有显著性差异,反之,则认为没有显著性差异。21212121xxxxstxxsxxt212101. 001. 005. 005. 0 xxxxstLSDstLSDnssnnsnsnssexxnnexx22
11、122221212)11(212121 多重比较结果表示方法多重比较结果表示方法标记字母法梯形法标记字母法,首先将全部平均数从大到小依次排列,然后在最大的平均数上标记字母a,将该平均数以下各平均数相比,凡相差不显著的(LSD0.05说明处理平均数间的差异达到显著水平,在右上角标上“*”;差数 LSD0.01,说明处理平均数间差异达到极显著水平,在差数的右上角标“*”,反之如差数小于LSD说明差异不显著。饲料饲料平均数平均数差异显著性差异显著性X-247.4X-262.8X-279.8A1A4A2A3311.8279.8262.8247.464.4*32.4*15.449.0*17.032.0*
12、利用LSD法进行多重比较的步骤, 1) 计算最小显著差数LSD0.05和LSD0.01; 2) 列出平均数的多重比较表,表中各处理按其平均数从大到小依次进行排列。 3) 将两两平均数的差数与 LSD0.05和LSD0.01 进行比较,作出统计推断。不足,在差数比较时没有考虑到大小排列上的次序,仍有推断可靠性低,犯I类错误概率增加的问题。最小显著极差法(LSR法) 相对于LSD法,该类方法同时考虑到平均数差数的秩序问题,然后进行不同的显著性标准进行比较,因此比LSD法更为可靠。LSR检验又可分为新复极差检验和q检验新复极差检验是由邓肯提出的,因此又称Duncan法或SSR法;q检验法也称为Stu
13、dent-Newman-Keuls法,SNK新复极差检验,新复极差检验是由邓肯于1955年提出的,又称Duncan法,或SSR法。其比较步骤如下: 1) 按相比较的样本容量计算平均数标准误,当按相比较的样本容量计算平均数标准误,当n1=n2=n时,有:时,有: 2) 查查s2e所具有自由度所具有自由度dfe和比较所含平均数个数和比较所含平均数个数M时的时的SSR值,然后计算最小显著极差:值,然后计算最小显著极差:nssex2xsSSRLSR 3) 将各平均数按大小顺序排列,用各个将各平均数按大小顺序排列,用各个M值的值的LSRa值即值即可检验各平均数间差异的显著性。:可检验各平均数间差异的显著
14、性。:变异来源变异来源dfSSS2FF0.05F0.01饲料间饲料内31611435.358551.63811.78534.487.132*3.245.29总变异1919986.95对上面的各组平均值作新复极差检验:对上面的各组平均值作新复极差检验:)(34.1055 .5342gnssex查附表获得查附表获得df=16,M=2时,时,SSR的值的值:查附表获得查附表获得df=16,M=2时,时,SSR的值的值:SSR0.05=3.0, SSR0.01=4.13,则:,则:70.4234.1013. 402.3134.1000. 301. 005. 0LSRLSRsSSRLSRxM234SSR
15、0.05SSR0.01LSR0.05LSR0.013.004.1331.0242.703.144.3132.4744.573.244.4233.5045.70M234SSR0.05SSR0.01LSR0.05LSR0.013.004.1331.0242.703.144.3132.4744.573.244.4233.5045.70饲料饲料平均数平均数A1A4A2A3311.8279.8262.8247.4当当A1与与A4比较时,比较时,M=2,差值,差值(32.0)31.02且小于且小于42.70,所以两者差异,所以两者差异达到显著水平;达到显著水平;当当A1与与A2比较时,比较时,M=3,差值
16、,差值(49.0)44.57,所以差异达到极显著水平;,所以差异达到极显著水平;同理可将本个平均数一一用此方法进行比同理可将本个平均数一一用此方法进行比较和显著性水平判断。较和显著性水平判断。饲料饲料平均数平均数差异显著性差异显著性0.050.01A1A4A2A3311.8279.8262.8247.4abbbAABBB饲料饲料平均数平均数差异显著性差异显著性0.050.01A1A4A2A3311.8279.8262.8247.4abbccAABBBLSR法法LSD法法新复极差检验(new multiple range test)是由邓肯于1955年提出,因此又称Duncan法或SSR(sho
17、rtest significant ranges)法。q检验法也称为Student-Newman-Keuls (SNK)检验,是以统计量q的概率分布为基础的,方法与新复极差检验相似,其区别仅在于计算最小显著极差时不是查SSR,而是相q值。 对三种检验方法的比较中发现,当样本数(处理数)k=2时,LSD法、SSR法和q检验的显著尺度是相同的,当k3时三种显著尺度便不相同:LSD法法SSR法法q法法因此 对于精度要求高的研究-q检验 一般试验-SSR检验方差分析的基本步骤1) 将样本数据的总平方和与总自由度分解为各变异因素的平方和与自由度;2) 列方差分析表进行F检验,分析各变异因素在总变异中的重
18、要程度;3) 若F检验显著,对各处理平均数进行多重比较第六章第六章 方差分析方差分析2. 单因素方差分析按重复数分类按重复数分类单因素试验(single factor experiment)资料的方差分析是比较简单的一种,目的在于正确判断试验因素各水平的相对效果。在单因素方差分析中,根据组内观测数目(重复数)是否相同,可分为组内观测次数相等的方差分析和组内观测资料不等的方差分析组内观测次数相等的方差分析组内观测次数不相等的方差分析一、一、 组内观测次数相等的方差分析组内观测次数相等的方差分析K组资料中,每一处理组皆含有n个观测值,其方差分析方法前面已做过介绍,此处只给出相关的计算公式:变异来源
19、变异来源dfSSs2F处理间处理内总变异nk-1) 1(1nkktTettSSSSSSCnTSS222etss22etssCxSST2例:例:测定东北、内蒙古、河北、安徽、贵州测定东北、内蒙古、河北、安徽、贵州5个地区黄鼬冬季针毛的长度,个地区黄鼬冬季针毛的长度,每个地区随机抽取每个地区随机抽取4个样本,测定的结果列于表中,试比较各地区其针毛长度的个样本,测定的结果列于表中,试比较各地区其针毛长度的差异显著性。差异显著性。不同地区黄鼬冬季针毛长度不同地区黄鼬冬季针毛长度(cm)地区东北内蒙古河北安徽贵州123432.032.831.230.429.227.426.326.725.526.125
20、.826.723.325.125.125.522.322.522.923.7变异来源变异来源dfSSs2F处理间处理内总变异nk-1) 1(1nkktTettSSSSSSCnTSS222etss22etssCxSST2不同地区黄鼬冬季针毛长度不同地区黄鼬冬季针毛长度(cm)地区东北内蒙古河北安徽贵州合计123432.032.831.230.429.227.426.326.725.526.125.826.723.325.125.125.522.322.522.923.7总和126.4109.6104.199.091.4530.5n4444420平均值31.627.426.0324.7522.85
21、26.53均方和399730072709245320891425899.1271.17370.18671.17351.14071)4 .916 .1094 .126(41170.18651.1470121.1425851.14701545 .5302222222tTeitTSSSSSSCTnSSCxSSnkTC15) 14(5) 1(4151191201nkdfkdfnkdfetT866. 01599.12428.43471.17322eeetTtdfSSsdfSSs01. 089. 406. 31478.50866. 0428.43)15, 4(01. 0)15, 4(01. 0)15, 4
22、(05. 022PFFFFssFet组间有极显著性差异!哪一组?计算结果:变异来源变异来源dfSSs2F处理间处理内总变异nk-1) 1(1nkktTettSSSSSSCnTSS222etss22etssCxSST2变异来变异来源源dfSSs2FF0.05(4,15)F0.01(4,15)处理间处理内415173.7112.9943.4280.86650.16*3.064.89总变异19多重检验1.: (最小显著差数法)658. 04866. 022221nssexx939. 1658. 0947. 2402. 1658. 0131. 201. 005. 0LSDLSD当自由度为15时,可以得
23、到t0.05、t0.01水平的值分别为:2.131, 2.947地区地区东北东北内蒙古内蒙古河北河北安徽安徽贵州贵州31.627.4026.0324.7522.85东北31.60内蒙古27.40河北26.03安徽24.75贵州22.85地区地区东北东北内蒙古内蒙古河北河北安徽安徽贵州贵州31.627.4026.0324.7522.85东北31.604.25.576.858.75内蒙古27.401.372.654.55河北26.031.283.18安徽24.751.9贵州22.85地区地区东北东北内蒙古内蒙古河北河北安徽安徽贵州贵州31.627.4026.0324.7522.85东北31.604
24、.25.576.858.75内蒙古27.40*1.372.654.55河北26.03*1.283.18安徽24.75*1.9贵州22.85*多重检验2.: (最小显著极差法 LSR法)1) 按相比较的样本容量计算平均数标准误nssex22) 根据整体方差的自由度和各个M值,查出所对应的SSR值,然后计算出最小显著极差:xsSSRLSR3) 将各平均数按大小顺序排列,用各个M值的LSR值来检查各平均数间差异的显著性。465. 04866. 02nssex查表,当df=15,M=2时,SSR0.05和0.01水平的值分别为:3.01,4.17。)(94. 117. 4416. 0)(40. 101
25、. 3416. 001. 005. 0mmLSRmmLSRM2345SSR0.05SSR0.01LSR0.05LSR0.013.014.171.401.943.164.351.472.023.254.461.512.073.314.551.542.12地区地区东北东北内蒙古内蒙古河北河北安徽安徽贵州贵州31.627.4026.0324.7522.85东北14.25.576.858.75内蒙古2*1.372.654.55河北3*1.283.18安徽4*1.9贵州5*M2345SSR0.05SSR0.01LSR0.05LSR0.013.014.171.401.943.164.351.472.023
26、.254.461.512.073.314.551.542.12地区地区东北东北内蒙古内蒙古河北河北安徽安徽贵州贵州31.627.4026.0324.7522.85东北14.25.576.858.75内蒙古2*1.372.654.55河北3*1.283.18安徽4*1.9贵州5*M2345q0.05q0.01LSR0.05LSR0.013.014.171.401.943.674.831.472.024.085.251.902.444.375.562.032.59多重检验3.: (q法)二、二、 组内观测次数不相等的方差分析组内观测次数不相等的方差分析当每组资料中,每一处理组的观测值个数n不同时,
27、上面所述的方差分析方法仍然可用,只是总观测数要重新计算,不是nk。相对应的,计算平方和的公式也稍有改变。变异来源变异来源dfSSs2F处理间处理内总变异knki1tTeittSSSSSSCnTSS222etss22etssCxSST21in多重比较-平均数的标准误-平均样本量n0) 1()(220knnnniii020221,ns而snssexxex第六章第六章 方差分析方差分析3. 二因素方差分析按重复数分类按重复数分类 二因素试验(two factor experiment)方差分析中,需要对因素的主效和因素间的互作进行分析。因素间的交互作用显著与否关系到主效的利用价值,有时互作效应相当大
28、,甚至可以忽略主效应。二因素间是否存在互作可根据专门的统计方法或专业知识进行判断。无重复观测值的二因素方差分析具有重复 观测值的二因素方差分析一、无重复观测值的二因素方差分析一、无重复观测值的二因素方差分析 即在试验中,依据经验或专业知识判断二因素无互作时,每个处理可不设重复。假定A因素有a个水平,B因素有b个水平,每个处理组合只有一个观测值。其分组资料模式如下:因素因素A因素因素BB1B2Bb总和Ti .平均数xi .A1A2Aax11x21xa1x12x22xa2x1bx2bxabT1.T2 .Ta .x1.x2 .xa .总合T. jT. 1T. 2T. bT平均数x. jx. 1x.
29、2x. bx 在无重复观测值的二因素试验资料中,A因素的每一个水平可看作有b个重复,B因素的每一个水平可看作有a个重复。因此每个观测值既受A因素影响,又受到B因素的影响。 若因素间不存在互作时,则二因素方差分析观测值的线性模型为:ijjiijx 其中, 、 分别是A因素和B因素的效应,可以是固定的,也可以是随机的,且 。 是随机误差,彼此独立且服从 。ij0ji), 0(2Nij(1) 平方和的分解BATjiijejjBiiAijijTSSSSSSxxxxSSCaTxxaSSCbTxxbSSCxxxSSabTC2.2.2.2.2.22.2)()()()(2) 自由度的分解) 1)(1(111b
30、adfbdfadfabdfeBAT(2) 各项方差的计算eeeBBBAAAdfSSsdfSSsdfSSs222例:将一种生长激素配成M1、M2、M3、M4、M5五种浓度,并用H1、H2、H3三种时间浸渍某大豆种子,出苗45天后得各处理每一植株的平均干物重(g),结果列于下表,试作方差分析并进行多重比较。浓度浓度(A)时间时间H1H2H3M1M2M3M4M513123102141239514133104浓度浓度(A)时间时间Ti.xi.H1H2H3M1M2M3M4M513123102141239514133104T.jx.j浓度浓度(A)时间时间Ti.xi.H1H2H3M1M2M3M4M5131
31、2310214123951413310441379291113.6712.333.09.673.67T.j404344127x.j8.08.68.88.4793. 4)(73. 1)(07.289)(73.295)(27.10752.2.2.2.2.22.2BATjiijejjBiiAijijTSSSSSSxxxxSSCaTxxaSSCbTxxbSSCxxxSSabTC(1) 平方和的分解(2) 自由度的分解8) 1)(1(2141141badfbdfadfabdfeBAT(2) 各项方差的计算变异来源变异来源dfSSs2FF0.05F0.01浓度间(A)时间间(B)误 差428289.071
32、.734.9372.270.870.62117.19*1.413.844.467.018.65总变异14295.73二、具有重复观测值的二因素方差分析二、具有重复观测值的二因素方差分析 在有重复观测值的二因素试验资料中,其典型设计是,A因素有a个水平,B因素有b个水平,所以每一次重复就包括ab个试验,如果设计重复n次的话,则试验的总观测数为abn。ijkijjiijkx)( 方差分析的步骤和前面介绍的相类似,唯一不同的是F检验的方法有些区别。第六章第六章 方差分析方差分析4. 多因素方差分析ijklijkikjkijkjiijklx)()()()(2)(ijklijkijklexxSS1. 误
33、差平方和:ijklijklTabcnTxSS222. 总平方和:3. 总平方和可分解为:eABCACBCABCBATSSSSSSSSSSSSSSSSSS4. 接下来的自由度计算、分解以及F值的计算和多重检验均与前面所介绍的相同。第六章第六章 方差分析方差分析5. 方差分析缺失数据的估计缺失数据可用统计学方法从理论上进行估计,然后用前面介绍过的方法进行方差分析。但是必须明确:1) 缺失数据估计并不能恢复原来的数据,只能补足后不致于干扰其他数据;2) 估计数据不能提供任何新的信息。原则原则-保证误差平方和最小保证误差平方和最小一、缺失一个数据的估计方法一、缺失一个数据的估计方法B1B2B3B4B5
34、B6B7B8合计合计A1A2A3A4303727303946374241X36354243244042513746394441473835333838494346309305+x278324总和124164112+x1491761711441761216+xBATeSSSSSSSS 假定表中的x23项是缺失的,在运算时,就需要把他补上。我们可以根据误差平方和公式进行估计。222222222)1216(321)176124(41)324309(81)463730(xxSSSSSSSSBATe根据误差平方和最小的原则,可以令 ,则可以得到x=42.857.0dxdSSe 将估计出的x值数据填写在表
35、中,在进行方差分析时,总了要求总自由度dfT和误差自由度dfe数需要减1外,其他的运算过程仍然按照前面介绍的方法进行。二、缺失两个数据的估计方法二、缺失两个数据的估计方法B1B2B3B4B5B6B7B8合计合计A1A2A3A4303727303946374241X36354243244042513746394441473835y3838494346309305+x278+y324总和124164112+x149176171111+y1761216+x+y 同样,我们根据误差方平方和公式及误差和最小原则,通过对x和y求偏导数,也可以求到x和y的估计值。但是,应该注意的是:虽然通过缺失值估计可以弥
36、补数据缺失的影响,但是其自由度也同时降低了,这样在进行F检验时,其灵敏度相应会降低,对分析结果不利。第六章第六章 方差分析方差分析6. 方差分析的基本假定和数据转换一、基本假定一、基本假定1. 正态性 (normality)2. 可加性 (additivity)3. 方差同质性 (homogeneity)即实验误差服从正态分布(0, 2)处理效应与误差效应是可加的,并服从方差分析的数学模型。所有试验的误差方差应具备同质性,即不同处理不能影响随机误差的方差,也称方差齐性。1. 正态性 (normality)试验误差应当是服从正记分布的独立的随机变量。因为方差分析只能估计随机误差,顺序排列或顺序取
37、样资料不能作方差分析。应用方差分析的资料应服从正态分布,即每一观测值应围绕相应的平均数呈正态分布,非正态分布的资料进行适当数据转换后,亦能进行方差分析ijijx2. 可加性 (additivity)即处理效应与误差效应是可加的,并服从方差分析的数学模型,这样才能将试验的总变异分解为各种原因所引起的变异,以确定各变异在总变异中所占的比例,最终对试验结果作为客观评价。ijiijxijklijkikjkijkjiijklx)()()()(2)(ijklijkijklexxSS3. 方差同质性(homogeneity)所有试验的误差方差应具备同质性,即不同处理不能影响随机误差的方差,也称为方差齐性,即
38、:22221n二、数据转换二、数据转换1. 平方根转换2. 对数转换3. 反正弦转换 主要针对符合泊松分布的观测数据,一般将原来的数值转换为其开平方,或者原数值加1的开平方。这样可以减少极端大的变量对方差的影响,从而获得方差的同质性。 对于来自总体和上面提到的方差分析基本假定相抵触的数据,在进行方差分析之前必须进行适当的处理,即数据转换,来变更测量标尺。 对于已知资料中的效应是成比例的,而不是可加的,或者标准差与平均数成比例时,可以用对数转换。一般是将原数据转换为对数,使其转换后具有可加性。 如果数据是比例数或以百分率表示的,其分布趋向于二项分布,方差分析时应作反正弦转换,转换后的数值 是以度
39、为单位的,因此也称为角度转换。平方根平方根转换转换 有些生物学观测数据为泊松分布而非正态分布,如一定面有些生物学观测数据为泊松分布而非正态分布,如一定面积上某种杂草株数或昆虫头数等,样本平均数与其方差有比例关积上某种杂草株数或昆虫头数等,样本平均数与其方差有比例关系。采用平方根转换可以对方差进行降缩,减少极端大的变量对系。采用平方根转换可以对方差进行降缩,减少极端大的变量对于方差的影响,从而获得同质的方差。于方差的影响,从而获得同质的方差。1&xx例1. 平方根转换处理处理A1A2A3A4A5123443844231938053842237731577611515217318716183677
40、20平均值394.75412.0085.2537.7535.25燕麦田中某种杂草的株数燕麦田中某种杂草的株数处理处理A1A2A3A4A5123420.921.017.919.523.220.519.417.78.87.812.37.24.15.69.34.04.25.18.84.5平均值19.820.29.05.85.6资料的平方根资料的平方根变异来源变异来源dfSSs2FF0.05处理间误差415866.6669.995216.6664.66646.433.06总变异19936.658 组间的数据相关太大,方差同质性是不成立的,而且即使计算出误差的方差,也无法与各组进行比较。对数对数转换转换
41、 如果已知资料中的效应是成比例的而不是可加的,或者标如果已知资料中的效应是成比例的而不是可加的,或者标准差准差(极差极差)与平均数成比例时,可以使用对数转换。一般是将原与平均数成比例时,可以使用对数转换。一般是将原数据转换为对数,从而使方差变与比较一致而且由相乘性变为相数据转换为对数,从而使方差变与比较一致而且由相乘性变为相加性加性。如果原始数据包括。如果原始数据包括0,可以采用,可以采用lg(x+1)转换的方法。转换的方法。 通常情况下,对数据换对于削弱大数的作用要比平方根转通常情况下,对数据换对于削弱大数的作用要比平方根转换强。例如,换强。例如,1、10、100进行平方根转换是进行平方根转
42、换是1、3.16、10,进行进行对数转换则为对数转换则为0、1、2.例2. 对数转换时期时期捕蛾灯捕蛾灯1234519.123.439.523.416.650.1166.0223.958.964.6123.0407.4398.2229.1251.2mean24.4112.7281.8Dif.22.9173.8284.4正比正比变异来源变异来源dfSSs2FF0.05时间间捕蛾灯误差4280.48762.75040.01200.12191.37520.01508.0891.173.844.46总变异19936.658时期时期捕蛾灯捕蛾灯对数对数1234519.123.439.523.416.65
43、0.1166.0223.958.964.6123.0407.4398.2229.1251.21.281.371.601.371.221.702.222.351.771.812.092.612.602.362.40mean24.4112.7281.81.371.972.41Dif.22.9173.8284.40.380.650.52反正弦反正弦转换转换 如果数据是比例数或以百分率表示的,其分布趋于二项分如果数据是比例数或以百分率表示的,其分布趋于二项分布,方差分析时应作反正弦转换,转换后的数值是以度为单位的布,方差分析时应作反正弦转换,转换后的数值是以度为单位的角度,因此也称为角度转换,转换公式
44、为:角度,因此也称为角度转换,转换公式为:其中其中P为百分数资料,为百分数资料,为相应的角度值。为相应的角度值。P1sin例3. 反正弦转换处理处理2h4h6h对照对照123456855091829078807075656065556549526050959091858093不同贮藏时间有生活力花粉百分数不同贮藏时间有生活力花粉百分数(%)变异来源变异来源dfSSs2FF0.05处理间误差3201963.515392.875654.50519.64433.323.10总变异232356.39有生活力花粉百分数的反正弦值有生活力花粉百分数的反正弦值处理处理2h4h6h对照对照12345667.2
45、63.472.564.971.662.063.456.860.053.750.853.747.953.744.446.150.745.077.171.672.567.263.474.7mean66.956.448.071.1用用LSD法做多重比较:法做多重比较:29. 7845. 26644.192234. 5086. 26644.1922)20(01. 0201. 0)20(05. 0205. 0tnsLSDtnsLSDee处理处理mean与对照差异与对照差异反转换值反转换值对照对照2h4h6h71.166.956.448.04.214.7*23.1*89.584.669.455.2 比较结
46、果表明,贮藏比较结果表明,贮藏4h和和6h的花粉生活力均极显著地低于对照,的花粉生活力均极显著地低于对照,上表右边一列是将各反正弦平均数再转换为百分数,可以看出贮藏上表右边一列是将各反正弦平均数再转换为百分数,可以看出贮藏2h、4h和和6h后,花粉生活力分别比对照降低后,花粉生活力分别比对照降低4.9%、20.1%和和34.5%. 无论采用何种数据转换方法,在对转换后的数据无论采用何种数据转换方法,在对转换后的数据进行方差分析时,若经检验差异显著,在进行多重比进行方差分析时,若经检验差异显著,在进行多重比较时需用转换后的数据进行计算,但在解释分析其最较时需用转换后的数据进行计算,但在解释分析其最终结果时,应还原为原来的数值。终结果时,应还原为原来的数值。 对于一般非连续性的数据最好在方差分析前先检对于一般非连续性的数据最好在方差分析前先检查各处理平均数内均方是否存在相关性,各处理内均查各处理平均数内均方是否存在相关性,各处理内均方间的变异是否较大。如果存在相关性,或者变异较方间的变异是否较大。如果存在相关性,或者变异较大,则应考虑对数据作出转换。大,则应考虑对数据作出转换。