1、生物统计学第五章 方差分析第一节 方差分析的基本问题 第二节 单因素方差分析第三节 双因素方差分析学习目标1.解释方差分析的概念解释方差分析的概念2.解释方差分析的基本思想和原理解释方差分析的基本思想和原理3.掌握单因素方差分析的方法及应用掌握单因素方差分析的方法及应用4.掌握双因素方差分析的方法及应用掌握双因素方差分析的方法及应用3第一节 方差分析的基本问题一一.方差分析的内容方差分析的内容二二.方差分析的原理方差分析的原理三三.F 分布分布什么是方差分析?(Analysis of Variance,ANOVA)什么是方差分析?(概念要点)1.检验多个总体均值是否相等检验多个总体均值是否相等
2、通过对各观察数据误差来源的分析来判断多个通过对各观察数据误差来源的分析来判断多个总体均值是否相等总体均值是否相等2.变量变量n1个定类尺度的自变量个定类尺度的自变量2个或多个个或多个(k 个个)处理水平或分类处理水平或分类n1个定距或比例尺度的因变量个定距或比例尺度的因变量3.用于分析完全随机化试验设计用于分析完全随机化试验设计6什么是方差分析?(一个例子)株号株号变种变种A1变种变种A2变种变种A3变种变种A41234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8某农场培育出一
3、种新型草莓品种。在该草莓新品种的培育过程某农场培育出一种新型草莓品种。在该草莓新品种的培育过程中,由于遗传变异产生了四个异化的变种,分别为变种中,由于遗传变异产生了四个异化的变种,分别为变种A1、变种、变种A2、变、变种种A3 和变种和变种A4。这四个变种的种植环境和管理措施等可能影响其生长的。这四个变种的种植环境和管理措施等可能影响其生长的因素全部相同。现希望了解变异对株高的影响,调查数据见表因素全部相同。现希望了解变异对株高的影响,调查数据见表6-1。试分。试分析该品种草莓的变异是否对株高产生影响。析该品种草莓的变异是否对株高产生影响。7什么是方差分析?(例子的进一步分析)1.检验变异对草
4、莓株高是否有影响,也就是检检验变异对草莓株高是否有影响,也就是检验四个变种的平均株高度是否相同验四个变种的平均株高度是否相同2.设设 1为变种为变种A1的平均株高,的平均株高,2为为变种变种A2的平的平均株高,均株高,3为变种为变种A3的平均株高,的平均株高,4为为变种变种A4的平均株高,的平均株高,也就是检验下面的假设也就是检验下面的假设H0:1 1 2 2 3 3 4 4 H1:1 1,2 2,3 3,4 4 不全相等不全相等3.检验上述假设所采用的方法就是方差分析检验上述假设所采用的方法就是方差分析8方差分析的基本思想和原理方差分析的基本思想和原理(几个基本概念)1.因素或因子因素或因子
5、所要检验的对象称为因素或因子所要检验的对象称为因素或因子要分析遗传变异对草莓株高是否有影响,要分析遗传变异对草莓株高是否有影响,变异变异是要检是要检验的验的因素或因子因素或因子2.水平水平因素的具体表现称为水平因素的具体表现称为水平A1、A2、A3、A4四种变异四种变异就是因素的就是因素的水平水平3.观察值观察值在每个因素水平下得到的样本值在每个因素水平下得到的样本值每种变异的株高就是观察值每种变异的株高就是观察值10方差分析的基本思想和原理(几个基本概念)1.试验试验这里只涉及一个因素,因此,称为单因素四水平的试验这里只涉及一个因素,因此,称为单因素四水平的试验2.总体总体因素的每一个水平可
6、以看作是一个总体因素的每一个水平可以看作是一个总体比如,比如,A1、A2、A3、A4四种变异,可以看作是四个总体四种变异,可以看作是四个总体3.样本数据样本数据上面的数据可以看作是从这四个总体中抽取的样本数据上面的数据可以看作是从这四个总体中抽取的样本数据11方差分析的基本思想和原理n通过比较两类误差,以检验均值是否相等通过比较两类误差,以检验均值是否相等n比较的基础是方差比比较的基础是方差比n如果系统如果系统(不同水平或处理不同水平或处理)误差显著地不同于随误差显著地不同于随机误差,则均值就是不相等的;反之,均值就是机误差,则均值就是不相等的;反之,均值就是相等的相等的n误差是由各部分误差是
7、由各部分(同一水平内和各水平间同一水平内和各水平间)的误差的误差占总误差的比例来测度的占总误差的比例来测度的12方差分析的基本思想和原理(两类误差)1.随机误差随机误差在因素的同一水平在因素的同一水平(同一个总体同一个总体)下,样本的各观察值之间下,样本的各观察值之间的差异的差异比如,同一种变异的草莓不同抽样个体的株高是不同的比如,同一种变异的草莓不同抽样个体的株高是不同的不同抽样个体株高的差异可以看成是随机因素的影响,或不同抽样个体株高的差异可以看成是随机因素的影响,或者说是由于抽样的随机性所造成的,称为者说是由于抽样的随机性所造成的,称为随机误差随机误差 2.系统误差系统误差在因素的不同水
8、平在因素的不同水平(不同总体不同总体)下,各观察值之间的差异下,各观察值之间的差异比如,同一抽样编号,不同变异的草莓株高也是不同的比如,同一抽样编号,不同变异的草莓株高也是不同的这种差异可能是由于抽样的这种差异可能是由于抽样的随机性随机性所造成的,所造成的,也可能也可能是由是由于于变异本身变异本身所造成的,后者所形成的误差是由系统性因素所造成的,后者所形成的误差是由系统性因素造成的,称为造成的,称为系统误差系统误差13方差分析的基本思想和原理(两类方差)1.组内方差组内方差因素的同一水平因素的同一水平(同一个总体同一个总体)下样本数据的方差下样本数据的方差比如,变种比如,变种A1的的5个样本株
9、高的方差个样本株高的方差组内方差只包含组内方差只包含随机误差随机误差2.组间方差组间方差因素的不同水平因素的不同水平(不同总体不同总体)下各样本之间的方差下各样本之间的方差比如,比如,A1、A2、A3、A4四个变种株高之间的方差四个变种株高之间的方差组间方差既包括组间方差既包括随机误差随机误差,也包括,也包括系统误差系统误差14方差分析的基本思想和原理(方差的比较)1.如果不同变异如果不同变异(水平水平)对株高对株高(结果结果)没有影响,那么没有影响,那么在组间方差中只包含有随机误差,而没有系统误在组间方差中只包含有随机误差,而没有系统误差。这时,组间方差与组内方差就应该很接近,差。这时,组间
10、方差与组内方差就应该很接近,两个方差的比值就会接近两个方差的比值就会接近12.如果不同的水平对结果有影响,在组间方差中除如果不同的水平对结果有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组内方差,组间方差与组内方组间方差就会大于组内方差,组间方差与组内方差的比值就会大于差的比值就会大于13.当这个比值大到某种程度时,就可以说不同水平当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异之间存在着显著差异15方差分析中的基本假定方差分析中的基本假定1.每个总体都应服从正态分布每个总体都应服从正态分布对于因素的每一个
11、水平,其观察值是来自服从正态分对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本布总体的简单随机样本例如,每种变异的草莓株高必须服从正态分布例如,每种变异的草莓株高必须服从正态分布2.各个总体的方差必须相同各个总体的方差必须相同对于各组观察数据,是从具有相同方差的总体中抽取对于各组观察数据,是从具有相同方差的总体中抽取例如,四种变异的草莓株高的总体方差都相同例如,四种变异的草莓株高的总体方差都相同3.观察值是独立的观察值是独立的每个编号样本的株高都与其他编号样本的株高独立每个编号样本的株高都与其他编号样本的株高独立17方差分析中的基本假定1.在上述假定条件下,判断变异对株高是否
12、有显在上述假定条件下,判断变异对株高是否有显著影响,实际上也就是检验具有相同方差的四著影响,实际上也就是检验具有相同方差的四个正态总体的均值是否相等的问题个正态总体的均值是否相等的问题。2.如果四个总体的均值相等,可以期望四个样本如果四个总体的均值相等,可以期望四个样本的均值也会很接近。的均值也会很接近。四个样本的均值越接近,我们推断四个总体均值四个样本的均值越接近,我们推断四个总体均值相等的证据也就越充分相等的证据也就越充分样本均值越不同,我们推断总体均值不同的证据样本均值越不同,我们推断总体均值不同的证据就越充分就越充分 18方差分析中基本假定 如果原假设成立,即 H0:1=2=3=4n四
13、种变异草莓的株高的均值都相等四种变异草莓的株高的均值都相等n没有系统误差没有系统误差 这意味着每个样本都来自均值为、方差为2的同一正态总体。19方差分析中基本假定如果备择假设成立,即如果备择假设成立,即H1:i(i=1,2,3,4)不全相等不全相等n至少有一个总体的均值是不同的至少有一个总体的均值是不同的n有系统误差有系统误差 这意味着四个样本分别来自均值不同的四个正态总体这意味着四个样本分别来自均值不同的四个正态总体 20一.单因素方差分析的步骤二.方差分析中的多重比较三.单因素方差分析中的其他问题单因素方差分析的数据结构 水平水平A1 水平水平A2 水平水平Ak22提出假设提出假设构造检验
14、统计量构造检验统计量统计决策统计决策提出假设1.一般提法H0:1=2=k (因素有k个水平)H1:1,2,k不全相等2.对前面的例子H0:1=2=3=4变异对株高没有影响变异对株高没有影响H1:1,2,3,4不全相等变异对株高有影响变异对株高有影响24构造检验的统计量1.为检验为检验H0是否成立,需确定检验的统计量是否成立,需确定检验的统计量 2.构造统计量需要计算构造统计量需要计算水平的均值水平的均值全部观察值的总均值全部观察值的总均值离差平方和离差平方和平均平方平均平方(MS,Mean Square)25构造检验的统计量(计算水平的均值)1.假定从第i个总体中抽取一个容量为ni的简单随机样
15、本,第i个总体的样本均值为该样本的全部观察值总和除以观察值的个数2.计算公式为),2,1(1kinxxinjijii式中:ni为第 i 个总体的样本观察值个数 xij 为第 i 个总体的第 j 个观察值 26构造检验的统计量(计算全部观察值的总均值)1.全部观察值的总和除以观察值的总个数2.计算公式为 kkiiikinjijnnnnnxnnxxi21111式中:27构造检验的统计量(前例计算结果)株号株号(j)水平水平A(i)变种变种A1变种变种A2变种变种A3变种变种A41234526.528.725.129.127.231.228.330.827.929.627.925.128.524.2
16、26.530.829.632.431.732.8合计合计136.6147.8132.2157.3573.9水平均值水平均值观察值个数观察值个数 x1=27.32n1=5x2=29.56n2=5x3=26.44n3=5x4=31.46n4=5总均值总均值x=28.69528构造检验的统计量(计算总离差平方和 SST)1.全部观察值 与总平均值 的离差平方和SST2.反映全部观察值的离散状况3.其计算公式为(Sum of Squares for Total)ijxxkinjijixxSST11229构造检验的统计量(计算误差项平方和 SSE)1.每个水平或组的各样本数据与其组平均值的离差平方和SS
17、E2.反映每个样本各观察值的离散状况,又称组内离组内离差平方和差平方和3.该平方和反映的是随机误差的大小4.计算公式为(Sum of Squares for Error)kinjiijixxSSE112前例的计算结果:SSE=39.08430构造检验的统计量(计算水平项平方和 SSA)1.各组平均值 与总平均值 的离差平方和SSA2.反映各总体的样本均值之间的差异程度,又称组组间平方和间平方和3.该平方和既包括随机误差,也包括系统误差4.计算公式为(Sum of Squares for factor A)kiiikinjixxnxxSSAi12112前例的计算结果:SSA=76.8455),2
18、,1(kixix31构造检验的统计量(三个平方和的关系)总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系kiiikinjiijkinjijxxnxxxxii1211211232构造检验的统计量(三个平方和的作用)SST反映了全部数据总的误差程度反映了全部数据总的误差程度SSE反映了随机误差的大小反映了随机误差的大小SSA反映了随机误差和系统误差的大小反映了随机误差和系统误差的大小33构造检验的统计量(三个平方和的作用)若原假设成立,即若原假设成立,即1 2 k为真,则为真,则表明没有系统误差,组间平方和表明没有系统误差,组间平方和SSA除以自由除以自由度
19、后的度后的均方均方与组内平方和与组内平方和SSE和除以自由度后和除以自由度后的的均方均方差异就不会太大差异就不会太大如果如果组间均方组间均方显著地大于显著地大于组内均方组内均方,说明各,说明各水平水平(总体总体)之间差异不仅有随机误差,还有系之间差异不仅有随机误差,还有系统误差统误差34构造检验的统计量(三个平方和的作用)判断因素的水平是否对其观察值有影响,实判断因素的水平是否对其观察值有影响,实际上就是比较际上就是比较组间方差组间方差与与组内方差组内方差之间差异之间差异的大小的大小为检验这种差异,需要构造一个用于检验的为检验这种差异,需要构造一个用于检验的统计量统计量35构造检验的统计量(计
20、算均方 MS)1.各离差平方和的大小与观察值的多少有关,为各离差平方和的大小与观察值的多少有关,为了消除观察值数目对离差平方和大小的影响,了消除观察值数目对离差平方和大小的影响,需要计算其平均值,这就是均方,也称为方差需要计算其平均值,这就是均方,也称为方差2.计算方法是用离差平方和除以相应的自由度计算方法是用离差平方和除以相应的自由度3.三个平方和的自由度分别是三个平方和的自由度分别是SST的自由度为的自由度为n-1,其中,其中n为全部观察值的个数为全部观察值的个数SSA的自由度为的自由度为k-1,其中,其中k为因素水平为因素水平(总体总体)个数个数SSE的自由度为的自由度为n-k36构造检
21、验的统计量(计算均方 MS)SSA的均方也称为组间方差组间方差,记为MSA,计算公式为1kSSAMSASSE的均方也称为组内方差组内方差,记为MSE,计算公式为knSSEMSE6152.25148455.76MSA前例的计算结果:4428.2420084.39MSE前例的计算结果:37构造检验的统计量(计算检验的统计量 F)1.将MSA和MSE进行对比,即得到所需要的检验统计量F2.当H0为真时,二者的比值服从第一自由度为k-1、第二自由度为 n-k 的 F 分布,即),1(knkFMSEMSAF486.104428.26152.25F前例的计算结果:38构造检验的统计量(F分布与拒绝域)MS
22、EMSAF 39统计决策 将统计量的值F与给定的显著性水平的临界值F进行比较,作出接受或拒绝原假设H0的决策根据给定的显著性水平根据给定的显著性水平,在,在F分布表中查找与分布表中查找与第一自由度第一自由度df1k-1、第二自由度、第二自由度df2=n-k 相应相应的临界值的临界值 F 若若FF ,则拒绝原假设,则拒绝原假设H0,表明均值之间的,表明均值之间的差异是显著的,所检验的因素差异是显著的,所检验的因素(A)对观察值有显对观察值有显著影响著影响若若F F ,则不能拒绝原假设,则不能拒绝原假设H0,表明所检验,表明所检验的因素的因素(A)对观察值没有显著影响对观察值没有显著影响 40单因
23、素方差分析表(基本结构)方差来源方差来源组间组间(因素影响因素影响)组内组内(误差误差)总和总和41单因素方差分析(Excel 的输出结果)方差分析:单因素方差分析方差分析:单因素方差分析SUMMARYSUMMARY组组计数计数求和求和平均平均方差方差列 1列 15 5136.6136.627.3227.322.6722.672列 2列 25 5147.8147.829.5629.562.1432.143列 3列 35 5132.2132.226.4426.443.2983.298列 4列 45 5157.3157.331.4631.461.6581.658方差分析方差分析差异源差异源SSSS
24、dfdfMSMSF FP-valueP-value F critF crit组间组间76.845576.84553 325.61525.615 10.48610.4860.00050.0005 3.23893.2389组内组内39.08439.08416162.44282.4428总计总计115.93115.93191942单因素方差分析(一个例子)【例例5.2】为了对几个养鸡场的蛋鸡品质进行综合评价,经济动物协会在阿狗鸡场、阿蛇鸡场、阿猫鸡场、阿龙鸡场分别抽取了不同的样本,其中阿狗鸡场抽取7只蛋鸡,阿蛇鸡场抽取了6只蛋鸡,阿猫鸡场抽取5只蛋鸡、阿龙鸡场抽取了5只蛋鸡,记录三个月中蛋鸡的产蛋个
25、数,结果见表5.3。试分析这四个养鸡场的蛋鸡产蛋量是否有显著差异?(0.05)43单因素方差分析(一个例子)观察值观察值(j)养鸡场养鸡场(A)阿狗鸡场阿狗鸡场阿蛇鸡场阿蛇鸡场阿猫鸡场阿猫鸡场阿龙鸡场阿龙鸡场123456757554645545347 624960545655 5149485547 7068636960 44单因素方差分析(计算结果)解:设四个养鸡场的蛋鸡产蛋个数的均值分别为1、2、3、4,则需要检验如下假设H0:1=2=3=4(四个鸡场的蛋鸡产蛋量无显著差异)H1:1,2,3,4不全相等 (有显著差异)Excel输出的结果如下差异源差异源SS自由度自由度MSFP-值 值临界值
26、临界值组间组间845.21743281.7391 14.78741 3.31E-05 3.127354组内组内3621919.05263总和总和1207.21722 结论:拒绝结论:拒绝H0,四个养鸡场的蛋鸡产蛋量有显著差异。四个养鸡场的蛋鸡产蛋量有显著差异。45方差分析中的多重比较方差分析中的多重比较(作用)1.多重比较是通过对总体均值之间的配对比较来进一步检验具体哪些均值之间存在差异2.多重比较方法有多种,这里介绍Fisher提出的最小显著差异方法,简写为LSD,该方法可用于判断到底哪些均值之间有差异3.LSD方法是对检验两个总体均值是否相等的t 检验方法的总体方差估计加以修正(用MSE来
27、代替)而得到的 47方差分析中的多重比较(步骤)1.提出假设H0:i=j(第i个总体的均值等于第j个总体的均值)H1:i j(第i个总体的均值不等于第j个总体的均值)2.检验的统计量为 )(11kntnnMSExxtjiji3.若|t|t2,拒绝H0;若|t|t2,不能拒绝H048方差分析中的多重比较(基于统计量xi-xj的LSD方法)1.通过判断样本均值之差的大小来检验 H02.检验的统计量为:xi xj3.检验的步骤为 提出假设提出假设H0:i=j(第第i个总体的均值等于第个总体的均值等于第j个总体的均值个总体的均值)H1:i j(第第i个总体的均值不等于第个总体的均值不等于第j个总体的均
28、值个总体的均值)计算计算LSDjinnMSEtLSD112若若|xi-xj|LSD,拒绝,拒绝H0,若若|xi-xj|2.096 A1与与A2的的草莓株高草莓株高有有显著差异显著差异|x1-x3|=|27.3-26.4|=0.92.096 A1与与A4的的草莓株高草莓株高有有显著差异显著差异|x2-x3|=|29.5-26.4|=3.12.096 A2与与A3的的草莓株高草莓株高有有显著差异显著差异|x2-x4|=|29.5-31.4|=1.92.096 A3与与A4的的草莓株高草莓株高有有显著差异显著差异51一.双因素方差分析的基本问题二.双因素方差分析的数据结构三.双因素方差分析的步骤四.
29、一个应用实例双因素方差分析的基本问题双因素方差分析(概念要点)1.分析两个因素(因素A和因素B)对试验结果的影响 2.分别对两个因素进行检验,分析是一个因素起作用,还是两个因素都起作用,还是两个因素都不起作用3.如果A和B对试验结果的影响是相互独立的,分别判断因素A和因素B对试验指标的影响,这时的双因素方差分析称为无交互作用的双因素方差分析无交互作用的双因素方差分析4.如果除了A和B对试验结果的单独影响外,因素A和因素B的搭配还会对试验结果产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析有交互作用的双因素方差分析 5.对于无交互作用的双因素方差分析,其结果与对每个因素分别进
30、行单因素方差分析的结果相同54双因素方差分析的基本假定1.每个总体都服从正态分布对于因素的每一个水平,其观察值是来自正态分布总体的简单随机样本2.各个总体的方差必须相同对于各组观察数据,是从具有相同方差的总体中抽取的3.观察值是独立的55双因素方差分析的数据结构 因素因素A(i)B1 B2 BrA1A2:Ak 平均值平均值jx.2.x1.x.ix.2xrx.1x.kxx),2,1;,2,1(rjkixij56双因素方差分析的数据结构 jx.ix 是因素A的第i个水平下各观察值的平均值),2,1(1.kirxxrjiji 是因素B的第j个水平下的各观察值的均值),2,1(1.rjkxxkiijj
31、 是全部 kr 个样本数据的总平均值xkrxxkirjij 1157双因素方差分析的步骤提出假设1.对因素A提出的假设为H0:1=2=i=k (i为第i个水平的均值)H1:i (i=1,2,k)不全相等2.对因素B提出的假设为H0:1=2=j=r (j为第j个水平的均值)H1:j(j=1,2,r)不全相等59构造检验的统计量1.为检验H0是否成立,需确定检验的统计量 2.构造统计量需要计算总离差平方和总离差平方和水平项平方和水平项平方和误差项平方和误差项平方和均方均方 60构造检验的统计量(计算总离差平方和 SST)1.全部观察值 与总平均值 的离差平方和2.反映全部观察值的离散状况3.计算公
32、式为),2,1;,2,1(rjkixijxkirjijxxSST11261构造检验的统计量(计算SSA、SSB和SSE)1.因素A的离差平方和SSAkirjixxSSA112.kirjjxxSSB112.2.因素B的离差平方和SSB3.误差项平方和SSEkirjjiijxxxxSSE112.62构造检验的统计量(各平方和的关系)总离差平方和(SST)、水平项离差平方和(SSA和SSB)、误差项离差平方和(SSE)之间关系kirjjiijkirjjkirjikirjijxxxxxxxxxx11.112.112.11263构造检验的统计量(计算均方 MS)1.各离差平方和的大小与观察值的多少有关,
33、为各离差平方和的大小与观察值的多少有关,为消除观察值多少对离差平方和大小的影响,需消除观察值多少对离差平方和大小的影响,需要将其平均,这就是要将其平均,这就是均方均方,也称为方差,也称为方差2.计算方法是用离差平方和除以相应的自由度计算方法是用离差平方和除以相应的自由度3.三个平方和的自由度分别是三个平方和的自由度分别是总离差平方和总离差平方和SST的自由度为的自由度为 kr-1因素因素A的离差平方和的离差平方和SSA的自由度为的自由度为 k-1因素因素B的离差平方和的离差平方和SSB的自由度为的自由度为 r-1随机误差平方和随机误差平方和SSE的自由度为的自由度为(k-1)(r-1)64构造
34、检验的统计量(计算均方 MS)1.因素A的均方,记为MSA,计算公式为1kSSAMSA2.因素B的均方,记为MSB,计算公式为)1)(1(rkSSEMSE1rSSBMSB3.随机误差项的均方,记为MSE,计算公式为65构造检验的统计量(计算检验的统计量 F)1.为检验因素A的影响是否显著,采用下面的统计量)1)(1(,1rkkFMSEMSAFA2.为检验因素B的影响是否显著,采用下面的统计量)1)(1(,1rkrFMSEMSBFB66统计决策 将统计量的值F与给定的显著性水平的临界值F进行比较,作出接受或拒绝原假设H0的决策根据给定的显著性水平在F分布表中查找相应的临界值 F 若FA F,则拒
35、绝拒绝原假设H0,表明均值之间的差异是显著的,即所检验的因素(A)对观察值有显著影响若FB F,则拒绝拒绝原假设H0,表明均值之间有显著差异,即所检验的因素(B)对观察值有显著影响 67双因素方差分析表(基本结构)方差来源方差来源 因素因素A 因素因素B误差误差总和总和68双因素方差分析(一个例子)品种品种(因素因素A)销售地销售地(因素因素B)B1B2B3B4B5A1A2A3A4365345358288 350368323280 343363353298 340330343260 323333308298 有四个品种的水稻稻种在五个镇销售,为分析水稻稻种的品种(因素A)和销售地(因素B)对销
36、售量是否有影响,对每个品种在各地的销售量取得以下数据,见表5.4。试分析水稻品种和销售地对水稻稻种的销售量是否有显著影响?69双因素方差分析(提出假设)1.对因素A提出的假设为H0:1=2=3=4 (水稻品种对销售量没有影响)H1:i (i=1,2,4)不全相等 (水稻品种对销售量有影响)2.对因素B提出的假设为H0:1=2=3=4=5 (地区对销售量没有影响)H1:j(j=1,2,5)不全相等 (地区对销售量有影响)70双因素方差分析(Excel 输出的结果)FA18.10777F3.4903,拒绝原假设H0,说明水稻的品种对销售量有显著影响 FB2.100846 F3.2592,接受原假设
37、H0,说明销售地对水稻稻种的销售量没有显著影响差异源差异源SSdfMSFP-valueF crit 行行(因素因素A)13004.5534334.8518.10777 9.46E-053.4903 列列(因素因素B)2011.74502.9252.100846 0.1436653.2592 误差误差2872.712239.3917 总和总和17888.951971本章小结1.方差分析方差分析(ANOVA)的概念的概念2.方差分析的思想和原理方差分析的思想和原理3.方差分析中的基本假设方差分析中的基本假设4.要求掌握利用要求掌握利用Excel和和SPSS进行方进行方差分析的基本技术差分析的基本技术72为了调查三块小麦田的出苗情况,在每块为了调查三块小麦田的出苗情况,在每块麦田中按均匀分布原则设立了一些取样点,麦田中按均匀分布原则设立了一些取样点,每取样点记录每取样点记录30垅长的基本苗数,所得垅长的基本苗数,所得结果列于下表。三块田的出苗情况是否有结果列于下表。三块田的出苗情况是否有差异?差异?121 29 24 22 25 30 27 26220 25 25 23 29 31 24 26 20 21324 22 28 25 21 2673Thanks!74