1、方差分析方差分析方差分析的理论假设方差分析的理论假设方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤方差分析的检验方差分析的检验 某饮料企业生产一种新型饮料。饮料的颜色分为黄色、无色、粉某饮料企业生产一种新型饮料。饮料的颜色分为黄色、无色、粉色和绿色四种。为确定饮料的颜色是否对饮料的销售量有显著影响,色和绿色四种。为确定饮料的颜色是否对饮料的销售量有显著影响,从从5个超市中搜集了该种饮料的样本数据如下表所示。管理者想用这个超市中搜集了该种饮料的样本数据如下表所示。管理者想用这些样本数据来检验假设:颜色对销售量没有显著影响。些样本数据来检验假设:颜色对销售量没有显著影响。超市超市黄色无色
2、粉色绿色1 12 23 34 45 527.925.128.524.226.526.528.725.129.127.231.228.330.827.929.630.829.632.431.732.8样本均值样本均值样本方差样本方差=26.44 =3.298 =27.32=2.672 =29.56=2.143=31.46=1.658总均值总均值 =28.695 方差分析是对多个总体均值是否相等这一假设进行检验。方差分析是对多个总体均值是否相等这一假设进行检验。四种颜色饮料销售量样本数据1x21s总体1总体2总体3总体4因变量或称响应变量因变量或称响应变量自变量或称因素水平1水平2水平3水平4处理
3、处理1处理处理2处理处理3处理处理42x22s3x23s4x24sx样本样本1样本样本2样本样本3样本样本4方差分析的基本原理方差分析的理论假设方差分析的理论假设方差分析的理论假设方差分析的理论假设1.对每个总体,响应变量服从正态分布对每个总体,响应变量服从正态分布:2.对每个总体,响应变量的方差相同对每个总体,响应变量的方差相同:3.观察值是独立的观察值是独立的2242322212,jjjNX总体11总体33总体44总体2243214321,不尽相等224232221224232221方差分析的理论假设方差分析的理论假设4321143210,:HH4321 原假设为假时,样本均值来自不同的抽
4、样分布。原假设为真时,样本均值来自同一个抽样分布。不尽相等不尽相等4321,不尽相等不尽相等nx22_nx22_1_x2_x3_x4_x22_x33_x1_x1方差分析的基本原理方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤nx22_2222_xxnn得由222_xxnsn的估计量组间估计量所以6152.2514695.2846.31695.2856.29695.2832.27695.2844.265222222_xns样本容量相等的组间估计量 可由样本均值间的差异导出可由样本均值间的差异导出2一个估计量,一个估计量,此估计量称为此估计量称为2 的组间估计量:的组间估计量:1_x2_
5、x3_x4_x方差分析的基本原理方差分析的理论假设方差分析的理论假设方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤式中:表示水平的个数。每个样本方差都给出2的无偏估计。将其进行平均可得出2的又一个估计量,此估计量称为2 的组内估计量。2.4428 41.6582.1432.6723.29822rsj样本方差的平均数样本容量相等组内估计量r23411_x2_x3_x4_x方差分析的基本原理方差分析的理论假设方差分析的理论假设方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤H0为真时,组间估计是2的无偏估计。H0为假时,2 的组间估计必然偏大。由于2 的组内估计不受总体均值是否相
6、等的影响,所以无论H0为真或为假,组内估计总是2的无偏估计。H0为真,则2的两个估计量必然很接近,其比值将接近于1;H0 为假,组间估计将大于组内估计,其比值也将偏大。本例中:组间估计/组内估计=25.6152/2.4428=10.486。23411_x2_x3_x4_x1_x2_x3_x4_x方差分析的基本原理方差分析的理论假设方差分析的理论假设方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤服从分子自由度为 ,分母自由度为 的 分布。(25.25)自由度(5.5)自由度(2.1)自由度不同自由度下的F分布曲线的组内估计量的组间估计量22F1r0FrnT方差分析的基本原理方差分析的基
7、本思路和基本步骤方差分析的基本思路和基本步骤0(3,16)自由度下的F分布曲线。486.104428.2615.2522的组内估计量的组间估计量F3.2410.48605.0结论:有理由拒绝原假设,接受备择假设,即:饮料的颜色对饮料的销售量有显著影响。方差分析的基本原理方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤单因素方差分析的步骤某计算机产品公司拥有三个工厂,为确定工厂中有多少员工了解全面质量管理,分别从每个工厂选取一个由6名员工组成的随机样本,并对他们进行质量意识测试。得到数据资料如下表所示。管理者想用这些数据来检验假设:三个工厂的平均测试分数相同。观察值工厂1工厂2工厂312
8、3456857582767185717573746982596462697567三个工厂18名员工的测试分数方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤第一步:建立假设第一步:建立假设第二步:计算样本均值第二步:计算样本均值第三步:计算总样本均值第三步:计算总样本均值第四步:计算样本方差第四步:计算样本方差第五步:计算总体方差的组间估计第五步:计算总体方差的组间估计第六步:计算总体方差的组内估计第六步:计算总体方差的组内估计第七步:计算第七步:计算F F统计量统计量第八步:编制方差分析表第八步:编制方差分析表第九步:做出统计决策第九步:做出统计决策单因素方差分析的步骤方差分析的基本
9、思路和基本步骤方差分析的基本思路和基本步骤水平水平1总体1水平水平2水平水平3总体2总体3r32113210,:,HH观察值观察值工厂工厂1工厂工厂2工厂工厂3123456857582767185717573746982596462697567不尽相等不尽相等不尽相等第 个总体的均值水平的个数jj式中:单因素方差分析的步骤方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤jx_7968571768275851_x观察值工厂1工厂2工厂3123456857582767185717573746982596462697567样本均值797466第 个水平下的样本均值j第 个水平下的第 个观察值
10、j第第 个水平下的样个水平下的样本容量本容量jijxijn式中:单因素方差分析的步骤方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤733667479xTrjniijnxxj11xrxrnxnrxxrjjrjniijrjniijjj1_1111nnnnr21若则有:式中:总样本均值rTnnnn21单因素方差分析的步骤方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤21_21jnijijjnxxsj2js341679857971797679827975798522222221s观察值观察值工厂工厂1工厂工厂2工厂工厂31234568575827671857175737469825
11、96462697567样本均值样本均值797466样本方差样本方差342032总均值总均值73第 个水平下的样本方差j式中:单因素方差分析的步骤方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤与 相联系的自由度treatmentstoduespuareofsumSSTRSSAtreatmentstoduespuaremeanMSTRMSA组间平方和组间均方)()(21_11rxxnrSSAMSArjjjSSA式中:1r 反映组间差异,它只有一个约束 。组数为 。因此,其自由度为 。0_xxnjjr1rSSA2_1xxnSSAjrjj258137366737473796111222212
12、_21_xrjjrjjjnsrxxnrxxnrSSAMSAnnnnr21若则有:2582516135161rSSTRMSA516273666227374673796单因素方差分析的步骤方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤 反映组内差异。各组自由度为 共有 组,因此,自由度为 。errortoduespuareofsumSSEerrortoduespuaremeanMSE组内平方和组内均方SSE相联系的自由度为与SSErnTrnsnrnSSEMSETrjjjT121式中:式中:rnrrnnrTjj1r1jn430321620163416112rjjjsnSSE67.28154
13、30318430112_12rnxxrnsnrnSSEMSETrjjijTrjjjT算法二:算法二:67.2815430318430rnSSEMSET单因素方差分析的步骤方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤 统计量服从 分布,其分子自由度为 ,分母自由度为 。MSEMSAF rnT00.967.28258MSEMSAF0FMSEMSAFF1r单因素方差分析的步骤方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤方差来源平方和SS自由度df均方MSF值组间组内SSASSESSTr-1nT-rnT-1MSAMSEMSA/MSE方差来源平方和SS自由度df均方MSF值组间组
14、内总差异51643094621517258.0028.679.00 方差分析表总差异总差异单因素方差分析的步骤方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤 =+SST211_211_211rjnijijrjnijrjniijjjjxxxxxxSSASSE 方差分析可被视为将总平方和分解为不同方差分析可被视为将总平方和分解为不同成分的一种统计方法。成分的一种统计方法。总平方和 =组间平方和 +组内平方和单因素方差分析的步骤方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤05.068.315,2,105.0FrnrFT68.300.967.28258MSEMSTRF068.30
15、0.9(2,15)自由度下的)自由度下的F分布曲线分布曲线拒绝拒绝域域接受域接受域结论:拒绝原假设,接受原接受备择假设,即三个工厂的平均测试分数不尽相同。3211,:,H不尽相等不尽相等时,则有:临界值3210:H05.0单因素方差分析的步骤方差分析的基本思路和基本步骤方差分析的基本思路和基本步骤方差齐性检验方差齐性检验是对因素变量不同水平下各观测变量总体方差是否相等进行分析。在前面方差分析的基本思想中关于方差分析的前提假设,第2个前提假设是对每个总体,响应变量的方差相同:,如果没有满足这个前提假设,就不能认为各个总体分布相同,因此有必要对方差是否齐性进行检验。SPSS单因素方差分析中,方差齐
16、性检验采用了方差同质性(homogeneity of variance)检验方法,其原假设是:各水平下观测变量总体的方差无显著性差异。检验方法有:Bartlett检验、Levene检验。方差相等性检验方差相等性检验方差相等性检验方差相等性检验方差相等性检验方差相等性检验方差相等性检验方差相等性检验221210:rH不尽相等,:222211r,HBartlett方差齐性检验统计量是自由度为 的 统计量:式中:代表总体方差的组内估计MSE,它是样本方差的加权平均,公式为:给定显著性水平 ,检验中的拒绝准则为:。应注意,Bartlett检验结果只在样本数据具有正态性时有效。1r222ln)1(12j
17、cssrjjn2csrjjjrjjcnsns1212)1()1(22方差相等性检验方差相等性检验方差相等性检验方差相等性检验221210:rH不尽相等,:222211r,HLevene方差齐性检验统计量:式中:;或 或 或 ,其中,为第 个处理下的样本中位数,为第 个处理下的样本中截除样本容量10%后的均值。给定显著性水平 ,检验中的拒绝准则为rjjiijrjjTzzrzzrnW11212)()1()()(rTnnnn21jijijxxZejijijMxZjijijxxZejMjjxj),1(rnrFWT单因素方差分析的基本分析只能判断因素变量是否对观测变量产生了显著影响。如果因素变量确实对观
18、测变量产生了显著影响,进一步还应确定因素变量的不同水平对观测变量的影响程度如何,其中哪个水平的作用明显区别于其他水平,哪个水平的作用不显著的,等等。解决此问题的一类方法就是多重比较检验。多重比较检验利用了全部观测变量值,实现了对各个水平下观测变量总体均值的逐对比较。由于多重比较检验问题也是假设检验问题,因此也遵循假设检验的基本步骤。多 重 比 较 检 验 的 原 假 设 和 备 择 假 设 分 别是 ,多重比较检验构造检验统计量,因检验统计量构造的不同多重比较检验方法有很多种。方差分析中的多重比较方差分析中的多重比较方差分析的多重比较方差分析的多重比较方差分析的多重比较方差分析的多重比较jij
19、iHH:10jijijinnMSExxt11原假设与备择假设检验统计量 t统计量服从自由度为nT-r的t分布。jijinnMSEtxx11202t22t2若即拒绝原假设拒绝原假设211tnnMSExxtjiji则方差分析的多重比较-最小显著性差异法(least significant difference 简写为LSD)方差分析中的多重比较方差分析中的多重比较-最小显著性差异法最小显著性差异法rntnnMSExxtTjijiji11 Fisher LSD法对两总体均值相等性检验方法中的总体方差估计替换为MSE,得出自由度为nT-r的t统计量,用于总体均值的多重比较。2211)11(212122
20、221121212_1_nntnnsnsnnnxxt方差分析的多重比较方差分析的多重比较方差分析的多重比较四种颜色饮料销售量样本数据超市黄色无色粉色绿色1234527.925.128.524.226.526.528.725.129.127.231.228.330.827.929.630.829.632.431.732.8均值26.4427.3229.5631.46096.251514428.212.2112jinnMSEt096.288.032.2744.2621 xx096.212.356.2944.2631 xx096.202.546.3144.2641 xx096.224.256.293
21、2.2732 xx096.214.446.3132.2742 xx096.290.146.3156.2943 xx结论:黄色与无色无显著差异;粉色与绿色无显著差异。4428.2MSE05.0,4,4,3,2,15rini12.216025.02trntT已知查表得计算得方差分析的多重比较方差分析的多重比较方差分析的多重比较双因素方差分析 某商品有五种不同的包装方式,在五个不同地区销售,现从每个地区随机抽取一个规模相同的超级市场,得到该商品不同包装的销售量资料如下表所示。现欲检验包装方式与销售地区对该商品销售量是否有显著影响。trbl方式方式1方式方式2方式方式3方式方式4方式方式5地区地区1地
22、区地区2地区地区3地区地区4地区地区52022241626121014422202018816101218620146101810某商品不同地区不同包装的销售量某商品不同地区不同包装的销售量 双因素方差分析是对不同处理及不同区组总体均值是否相等进行检验。双因素方差分析双因素方差分析双因素方差分析第一步:建立假设第一步:建立假设第二步:计算样本均值和总样本值第二步:计算样本均值和总样本值第三步:计算离差平方和第三步:计算离差平方和第四步:计算均方值第四步:计算均方值第五步:计算第五步:计算F F统计量统计量第六步:编制双因素方差分析表第六步:编制双因素方差分析表第七步:做出统计决策第七步:做出统
23、计决策双因素方差分析双因素方差分析双因素方差分析543211543210,:,HH543211543210,:,HH关于不同处理下的总体关于不同区组下的总体(包装方式之间销售量无差别)(包装方式之间销售量有差别)(地区之间销售量有差别)(地区之间销售量无差别)不尽相等不尽相等双因素方差分析双因素方差分析双因素方差分析 trbl方式1方式2方式3方式4方式5区组均值地区1地区2地区3地区4地区5202224162612101442220201881610121862014610181015.214.016.810.418.8处理均值21.612.416.413.211.615.04不同地区不同包
24、装销售量的样本均值与总样本均值不同地区不同包装销售量的样本均值与总样本均值双因素方差分析双因素方差分析双因素方差分析211kirjijxxSSTSSBLSSTRSSTSSE96.88004.151004.15202236.33504.156.1104.156.2152236.19904.158.1804.152.1552224.34636.19936.33596.880组间平方和区组平方和组内平方和总平方和双因素方差分析双因素方差分析双因素方差分析84.831536.335组内均方组内均方区组均方区组均方组间均方组间均方84.491536.11964.21151524.346双因素方差分析双因
25、素方差分析 服从分子自由度为 分母自由度为 的 分布。双因素方差分析303142.264.2184.49874307.364.2184.83trF1r11krF 服从分子自由度为 分母自由度为 的 分布。blF1k11krF双因素方差分析双因素方差分析双因素方差分析方差来源平方和SS自由度df均方MSF值处理区组误差总计SSASSBLSSESSTr-1k-r(r-1)(k-1)nT-1MSAMSBLMSEFtrFbl双因素方差分析表双因素方差分析表方差来源平方和SS自由度df均方MSF值处理区组误差总计335.36199.36346.24880.9644162483.8449.8421.643.8743072.303142l双因素方差分析双因素方差分析双因素方差分析005.0006917.3(4,16)自由度下的F分布曲线拒绝域拒绝域接受域接受域结论:该商品销售量地区间无显著差异。包装方式间有显著差异。006917.316,4874307.305.0FFtr006917.316,4303142.205.0FFbl双因素方差分析双因素方差分析结结 束束
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。