1、第三节第三节 二因素方差分析二因素方差分析两种因素共同影响实验结果的一种方差分析。两种因素共同影响实验结果的一种方差分析。固定模型:两种因素都是固定因素固定模型:两种因素都是固定因素随机模型:两种因素都是随机因素随机模型:两种因素都是随机因素混合模型:一个是固定因素,一个是随机因素。混合模型:一个是固定因素,一个是随机因素。无重复观察值的二因素方差分析无重复观察值的二因素方差分析具有重复观察值的二因素方差分具有重复观察值的二因素方差分析析一、无重复观测值的二因素方差分析一、无重复观测值的二因素方差分析因素因素A因素因素B总和总和平均数平均数B1B2BbA1A2Aax11x21xa1x12x22
2、xa2x1bx2bxab总和总和 T平均数平均数 1x 2x ax iT ixjT jx 1T 2T2 T aTbT 1 T1 x2 xbx xA因素的效应因素的效应B因素的效应因素的效应ijjiijx 随机误差,独立,正态分布随机误差,独立,正态分布无效假设:无效假设:H01:A因素各个处理均值相等,即因素各个处理均值相等,即H02:B因素各个处理均值相等,即因素各个处理均值相等,即bjj,.,2,1,0 aii,.,2,1,0 数学模型数学模型abTC2 矫正数:矫正数:CxxxSSijijT 22)(总变异:总变异:CbTxxbSSAiiA 22)(因素变异:因素变异:CaTxxaSSB
3、jjB 22)(因素变异:因素变异:BATjiijeSSSSSSxxxxSS )(2组组内内变变异异:2.自由度的分解自由度的分解1 abdfT总自由度:总自由度:1 adfAA的的自自由由度度:1 bdfBB的的自自由由度度:)1)(1(badfe组组内内自自由由度度:3.方差计算:方差计算:AAAdfSSs 2BBBdfSSs 2eeedfSSs 2期望方差期望方差E(s2)固定模型固定模型随机模型随机模型混合模型混合模型AssBssessTss2As2Bs2es22eAss22eBss22 b 22 a 2 22 b 22 a 2 22 b 22 a 2 iT ixjT jx 1、各变异
4、来源的平方和的计算:、各变异来源的平方和的计算:矫正数矫正数总变异总变异因素因素A的变异的变异 因素因素B的变异的变异 误差误差27.10753512722 nkTC73.2952 CxSSijT06.2892 CbTSSiA73.12 CaTSSjB94.4 BATeSSSSSSSS2.自由度的计算自由度的计算8)1)(1(2141141 badfbdfadfabdfeBAT3.方差分析表方差分析表;65.846.401.784.3)8,2(01.0)8,2(05.0)8,4(01.0)8,4(05.0 FFFF4.多重比较(多重比较(SSR检验)检验)455036202.bssex 注意:
5、由于注意:由于A因素差异显著,所以检验因素差异显著,所以检验A因素导因素导致的平均值差异,因而用致的平均值差异,因而用B因素的组数(即因素的组数(即A因因素的样本容量)。素的样本容量)。SSR值与值与LSR值(值(dfe=8)本例中对两个因素造成的结果进行了方差分本例中对两个因素造成的结果进行了方差分析,在估计误差时(组内误差析,在估计误差时(组内误差SSe),是认为两个),是认为两个因素因素没有互作没有互作,或者,或者互作很小互作很小。若两因素若两因素有互作有互作,则,则误差项均方值较大误差项均方值较大,可能,可能掩盖试验因素的显著性,掩盖试验因素的显著性,增加犯增加犯错误错误的可能性。的可
6、能性。然而,目前已学习过的手段都然而,目前已学习过的手段都没法没法研究交互因研究交互因素,因此一般使用素,因此一般使用设置重复来正确估计实验误差,设置重复来正确估计实验误差,研究因素间的交互作用。研究因素间的交互作用。1x ax iT ixjT jx 1T2 T aTbT 1 T1 x2 xbx xA因素的效应因素的效应B因素的效应因素的效应ijkijiiijkx )(随机误差,独立,正态分布随机误差,独立,正态分布A、B的交互作用的交互作用线性数学模型:线性数学模型:1.总变异总变异 自由度自由度 平方和平方和 abnTCCxxxSSabndfijkabnijkTT221112)(1 2.A
7、因素引起的变异因素引起的变异 自由度自由度 平方和平方和CbnTxxbnSSadfiaiAA 221)(13.B因素引起的变异因素引起的变异自由度自由度平方和平方和BAijijjiabijABABSSSSCnTxxxxnSSbadf 2211)()1)(1(4.A、B因素的交互作用引起的变异因素的交互作用引起的变异自由度自由度平方和平方和CanTxxanSSbdfjbjBB 221)(15.随机误差引起的变异随机误差引起的变异自由度自由度平方和平方和ABBATijabnijkeeSSSSSSSSxxSSnabdf )()1(2111SSASSBSSeSSTSS2As2Bs2esABSS2ABs
8、方差分析表方差分析表22eAss22eBss22eABss22 bn 22 an 22 n 2 22ABAss22ABBss22eABss2 222 bnn 222 ann 22 n 22ABAss22eBss22eABss2 222 bnn 22 an 22 n 光照光照(A)温度温度(B)25摄氏度摄氏度30摄氏度摄氏度35摄氏度摄氏度5h/d143138120107101100 80 83 89 93101 7610h/d 96103 78 91 79 61 83 59 80 76 61 6715h/d 79 83 96 98 60 71 78 64 67 58 71 83【例【例】研究
9、昆虫滞育期长短与环境的关系研究昆虫滞育期长短与环境的关系都减去都减去8080光照(光照(A)标本号标本号温度(温度(B)2530355h/d1234635840272120 0 3 91321-4271188443910h/d12341623-211 -1-19 3-21 0-4-19-13-2648-38-3615h/d1234-1 31618-20 -9 -2-16-13-22 -9 3-5236-47-41272-41-38T=193 iTijTijTijTjT 1、自由度与平方和的分解、自由度与平方和的分解35143313114526691034533193222 abndf.CxSS
10、.abnTCTTa=3,b=3,n=4总变异:总变异:21310653672 adf.CbnTSSAiAA因素变异因素变异25391.0613 12jBBTSSCandfb B因素变异因素变异A、B因素交互作用的变异因素交互作用的变异误差变异(亚组内变异)误差变异(亚组内变异)94464422)1)(1(2.SSSSCnTSSbadfBAijABAB 2111(1)334127()3303.25eabneijkijTABABdfab nSSxxSSSSSSSS()2、方差分析与、方差分析与F 测验测验方差分析表方差分析表)(2222eBeAssssF 22eABssF 由于两因素均可人为控制,
11、所以是由于两因素均可人为控制,所以是固定模型固定模型。3、多重比较(、多重比较(SSR)昆虫滞育期长短主要决定于昆虫滞育期长短主要决定于光照和温度,与光照和温度,与二者之间的相互作用关系不大二者之间的相互作用关系不大分别对光照时间和温度进行多重比较分别对光照时间和温度进行多重比较19343341222.bnssex 光照(光照(A)间平均数标准误)间平均数标准误19343341222.anssex 温度(温度(B)间平均数标准误)间平均数标准误SSR值与值与LSR值(值(dfe=27)光照(光照(A)平均数平均数差异显著性差异显著性=0.05=0.015h/d90aA10h/d-9bB15h/
12、d-17bBijT温度(温度(B)平均数平均数差异显著性差异显著性=0.05=0.012591aA35-13bB30-14bBijT第四节 多因素方差分析不作要求,与二因素方差分析类似。不作要求,与二因素方差分析类似。实际工作中,往往需要考察实际工作中,往往需要考察三个或多个因素三个或多个因素的效应。的效应。这相当于把二因素方差分析这相当于把二因素方差分析扩展到一般情况扩展到一般情况。如在一个试验中,如在一个试验中,A因素有因素有a水平,水平,B因素有因素有b水平,水平,C因素有因素有c水平等,假设每一处理都有水平等,假设每一处理都有n次重复,那次重复,那么总观测次数为么总观测次数为abcn次
13、。这里仅对三因素的情况进次。这里仅对三因素的情况进行分析。行分析。设有一个三因素方差分析模型,各取了设有一个三因素方差分析模型,各取了a、b、c个水平,个水平,每一处理有每一处理有n次重复。对观测值,其线性数学模型为:次重复。对观测值,其线性数学模型为:xijkl=+i+j+k+()ij+()ik+()jk+()ijk+ijkl总体平均数总体平均数随机误差随机误差:A因素、因素、B因素、因素、C因素的效应因素的效应i、j、k:AB、AC、BC的交互效应的交互效应()ij、()ik、()jk:三因素的交互效应(三因素的交互效应(ABC)()ijkxijkl=+i+j+k+()ij+()ik+()
14、jk +()ijk+ijkl同时应满足下列四个条件:同时应满足下列四个条件:0)(ijk 0kji 0)()()(ikjkij)0(2 ,Nijkl是是独独立立分分布布,服服从从实际分析时,可将三因素试验数据列成三个二实际分析时,可将三因素试验数据列成三个二因素表(因素表(A、B因素组合,因素组合,B、C因素组合,因素组合,A、C因因素组合素组合),把三因素方差分析化为二因素方差分析。),把三因素方差分析化为二因素方差分析。因此可以计算出因此可以计算出SSA、SSB、SSC、SSAB、SSBC、SSAC。总平方和可分解为:总平方和可分解为:eABCBCACABCBATSSSSSSSSSSSSS
15、SSSSS 总自由度的分解:总自由度的分解:dfT=dfA+dfB+dfC+dfAB+dfAC+dfBC+dfABC+dfeabcnTxSSijklijklT22 总平方和总平方和为全部试验观测值的平方和,即:为全部试验观测值的平方和,即:2)(ijklijkleijkxxSS误差平方和误差平方和SSe显然等于在同一处理下数据的变异显然等于在同一处理下数据的变异平方和,即:平方和,即:由于胱氨酸、蛋氨酸和蛋白质都是可以控制由于胱氨酸、蛋氨酸和蛋白质都是可以控制的,所以适用于固定模型。的,所以适用于固定模型。a=4,b=3,c=2,n=2。【例【例】为了研究在牲畜饲料中添加胱氨酸(因素为了研究在
16、牲畜饲料中添加胱氨酸(因素A)、)、蛋氨酸(因素蛋氨酸(因素B)和蛋白质(因素)和蛋白质(因素C)对牲畜日增)对牲畜日增重(重(kg)的影响,设计了下面的试验,每一组共)的影响,设计了下面的试验,每一组共用两头牲畜作重复,结果用两头牲畜作重复,结果见下表见下表,试作方差分析。,试作方差分析。蛋氨酸蛋氨酸(B)胱氨酸胱氨酸(A)00.050.100.1505.055.384.814.3119.550.0254.574.825.365.3320.080.0504.975.115.385.3820.8414.5915.3115.5515.0260.47 jT iT资料资料AB表表(1)将数据分别累加
17、:)将数据分别累加:蛋白质蛋白质(C)胱氨酸胱氨酸(A)00.050.100.15126.226.627.637.2327.70148.378.697.927.7932.7714.5915.3115.5515.0260.47kT iT资料资料AC表表蛋氨酸蛋氨酸(B)蛋白质蛋白质(C)121408.9510.6019.550.0259.5910.4920.080.0509.1611.6820.8427.7032.7760.47 jTkT 资料资料BC表表(2)计算平方和:)计算平方和:1796.76223447.6022 abcnTCCxSSijklijklT 20409.227.197.01
18、1.1222 C27561289297208212222.C.CxnSSijkijkt 5355.023477.3270.27222.CCabnTSSkCBAijABSSSSCcnTSS 2.2544022)385385055(222.SSSSC.BA 0427022302155914222.C.CbcnTSS.iA 0526.022484.2055.19222.CCacnTSSjBCBjkBCSSSSCanTSS 2.0821024)68116010958(222.SSSSC.CB CAkiACSSSSCbnTSS 2.2399023)797626226(222.SSSSC.CA )289.
19、297.208.2(222CSSSSSSSSTtTe 2.0409-1.27560.7653BCACABCBAijkABCSSSSSSSSSSSSCnTSS 206850 2892972082222.SSSSSSSSSSSSC.BCACABCBA tSS()自由度的分解为()自由度的分解为:47122341 abcndfT3141 adfA2131 bdfB1121 cdfC6)13()14()1)(1(badfAB3)12()14()1)(1(cadfAC2)12()13()1)(1(cbdfBC6)12()13()14()1)(1)(1(cbadfABC24)12(234)1(nabcdf
20、e(4)结果列入方差分析表:)结果列入方差分析表:变异来源变异来源dfSSs2FF0.05F0.01胱氨酸胱氨酸A30.04270.01420.4453.014.72蛋氨酸蛋氨酸B20.05260.02630.8243.405.61蛋白质蛋白质C10.53550.535516.787*4.267.82AB60.25430.04241.3292.513.67AC30.23990.08002.5083.014.72BC20.08210.04101.2853.405.61ABC误差误差6240.06850.76530.01140.03190.3572.513.67总变异总变异47363.99检验结果
21、表明,蛋白质对猪日增重影响极其显著,胱检验结果表明,蛋白质对猪日增重影响极其显著,胱氨酸及蛋氨酸的影响不显著,可能的原因是在饲料中并不氨酸及蛋氨酸的影响不显著,可能的原因是在饲料中并不缺乏这两种氨基酸。缺乏这两种氨基酸。第五节第五节 方差分析缺失数据的估计方差分析缺失数据的估计弥补缺失数据的原则:弥补缺失数据的原则:使补上缺失的数据后,使补上缺失的数据后,误差平方和最小。误差平方和最小。注意:缺失的数据不能恢复或者代替原来的数注意:缺失的数据不能恢复或者代替原来的数据,只能补足后才能进行方差分析,而估计的据,只能补足后才能进行方差分析,而估计的数据没有携带任何新的信息,所以在试验过程数据没有携
22、带任何新的信息,所以在试验过程中尽量避免这类情况发生。中尽量避免这类情况发生。缺失数据的估计方法缺失数据的估计方法B1B2B3B4B5B6B7B8合计合计A13039414242393838309A23746x4351443549305+xA3273736243741y43245+yA43042354046473846324总和总和124164112+x149176171111+y1761183+x+y例:例:2222222222222 (3046)1 309(305)(245)32481124(112)(111)17641(1183)32eTABSSSSSSSSxyxxxyxy求误差平方和:
23、43857420)1183(161)111(21)542(4120)1183(161)112(21)305(41200 .xyxyyyyxxxxdydSSdxdSSee解解得得:,有有:为为使使误误差差平平方方和和最最小小即即注意:总自由度和误差自由度都要减注意:总自由度和误差自由度都要减1(有几个未知(有几个未知数,就减几)。数,就减几)。第六节、方差分析的基本假定和数据转换第六节、方差分析的基本假定和数据转换1、处理效应处理效应与与误差误差(环境)(环境)效应效应是是可加可加的;的;可加性是否显著有专门的统计方法可加性是否显著有专门的统计方法2、试验、试验误差误差是独立的是独立的随机随机变
24、量,且是变量,且是正态正态分布;分布;非正态性分布的资料进行适当数据转换非正态性分布的资料进行适当数据转换3、所有、所有处理的误差方差处理的误差方差都是都是同质同质的。的。将变异特别明显的数据剔除将变异特别明显的数据剔除数据转换:数据转换:xx 1、平方根转换:、平方根转换:减少减少服从服从泊松泊松分布的数据的分布的数据的极端大的变量对方差的影极端大的变量对方差的影响响。即观察样本值差异是否很大。即观察样本值差异是否很大。数据较小时采用数据较小时采用1 xix燕麦田中某种杂草的株数燕麦田中某种杂草的株数处理处理A1A2A3A4A5120.923.28.84.14.2221.020.57.85.
25、65.1317.919.412.39.38.8419.517.77.24.04.519.820.29.05.85.6ix变异来源变异来源dfSSs2FF0.05F0.01处理间处理间4866.663216.66646.43*3.064.89误差误差1569.9954.666总变异总变异19936.658方差分析表方差分析表xxlg 数据包括有数据包括有0,lg(x+1)2、对数转换:、对数转换:资料的资料的效应成比例效应成比例或或标准差与平均数成比例标准差与平均数成比例,将其转,将其转变为具有变为具有可加性可加性且且方差变成比较一致方差变成比较一致。对于消除极大数的作用强于平方根转换。对于消除
26、极大数的作用强于平方根转换。时期时期捕蛾灯捕蛾灯对数值对数值119.150.1123.01.281.702.09223.4166.0407.41.372.222.61339.5223.9398.11.602.352.60423.458.9229.11.371.772.36516.664.6251.21.221.812.4019.8112.7281.81.371.972.41极差极差22.9173.8284.40.380.650.52ix变异来源变异来源dfSSs2FF0.05F0.01时期间时期间40.48760.12198.08*3.847.01捕蛾灯捕蛾灯22.75041.375291.1
27、7*4.468.65误差误差80.12000.0150总变异总变异143.3603对数转换后数据的方差分析表对数转换后数据的方差分析表p1sin 处理的成数处理的成数3、反正弦转换:、反正弦转换:成数成数或或百分数百分数、趋于、趋于二项二项分布的分布的接近于接近于0和和100的的资料资料方差变大方差变大,将其进行转换,满足,将其进行转换,满足方差同质性、方差同质性、分布正态性分布正态性。不同贮藏时间有生活力花粉百分数不同贮藏时间有生活力花粉百分数处理处理2h4h6h对照对照167.263.447.977.1263.456.853.771.6372.560.044.472.5464.953.74
28、6.167.2571.650.850.763.4662.053.745.074.766.956.448.071.1ix变异来源变异来源dfSSs2FF0.05F0.01处理间处理间31963.515654.50533.32*3.104.49误差误差20392.87519.644总变异总变异232356.39方差分析表方差分析表处理处理与对照差异与对照差异反转换值反转换值对照对照71.189.52h66.94.284.64h56.414.7*69.46h48.023.1*55.2花粉生活力比较表花粉生活力比较表ix方差分析方差分析基本假定基本假定数据转换数据转换缺失数据缺失数据的估计的估计试验数据的方差分析试验数据的方差分析组内观测组内观测次数相等次数相等组内观测组内观测次数不等次数不等无重复无重复观测值观测值有重复有重复观测值观测值小结小结单因素单因素方差分析方差分析二因素二因素方差分析方差分析多因素多因素方差分析方差分析方差分析的基本步骤:方差分析的基本步骤:确定数学模型确定数学模型平方和自由度的分解平方和自由度的分解进行多重比较进行多重比较列方差分析表,进行列方差分析表,进行 检验检验Fnhttp:/ http:/ http:/ 绝不反对科学家拿博士学位绝不反对科学家拿博士学位http:/