1、第10章 方差分析10.1 方差分析的基本原理10.2 单因素方差分析10.3 双因素方差分析方差分析(ANOVA)最早由英国统计学家费舍尔在进行试验设计时为解释试验数据而提出的一种统计方法。在不同试验条件下取得不同样本,需要根据样本数据判断不同试验条件下平均数是否相等。在假设检验中,介绍了两个总体平均数之差的假设检验,本章可以看做是对这一问题的拓展,方差分析可用于多个平均数的比较。同时,根据对平均数影响的因素多少,可分为单因素方差分析、双因素方差分析和多因素方差分析。10.1.1方差分析的数据结构方差分析是分析多个平均数是否相等的问题,因此,可以根据不同的条件将样本数据安排在一张数据表中。比
2、如要检验三台机器生产的次品数是否存在差异(即理论上三个机器平均的次品数是否相等)。我们可以观察三台机器一周5天各自生产的次品数,用表10-1表示。表10-1 三台机器每天生产的次品数列平均:总平均:响应变量(因变量)、自变量(因素)单因素方差分析和双因素方差分析 机器1机器2机器3475349504655545861525450515149jCijjjxCx1.1491x562x491xkjCiijkjjjxCx111110.1.2 方差分析中关于数据的基本假定1.每个总体数据服从正态分布。2.对于每一个总体具有相同的方差3.响应变量观察值相互独立。10.1.3组间变差和组内变差1、借助图形的
3、直觉观察2.方差分解1)样本间离差或组间离差(Sum Square Between Group,SSB)2)随机误差来解释,我们定义组内离差(Sum Square Error in Group,SSE)21)(kjjjxxCSSB130)5251(5)5256(5)5249(5222SSB211)(kjCijijjxxSSE94)5149()5151()5151()5150()5154()5652()5661()5658()5654()5655()4946()4950()4949()4953()4947(222222222222222SSE3)总离差平方和SST211)(kjCiijjxxSS
4、TSSESSBSST10.1.4 F-检验为了比较组间水平因素和组内随机因素对于离差偏离程度的影响,英国统计学家费舍尔构造了F统计量其中:(k-1)、(n-k)分别是F分布的自由度。SSB/(k-1)叫做组间均方差,SSE/(n-k)叫做组内均方差。MSEMSBknSSEkSSBF)/()1/(在满足三个基本假定的条件下,公式10.6所计算的统计量服从F分布,当数据来自方差相等的正态总体时,观察公式:MSEMSBknxxkCxxFrjCijijrjjjj)/()()1/()/(21121根据F分布的规律,若原假设1=2=3成立,则组间均方差相对于组内均方差而言,比值应该接近于1,如果F统计量数
5、值非常大,落入小概率区间,则拒绝原假设。这一小概率也就是假设检验的显著性水平,是事先给定的,通常取1%、5%或10%。2979.812/942/130)/()1/(MSEMSBknSSEkSSBF取显著性水平5%,F 临界值F0.05(2,12)=3.885。观察下图,统计量值落入3.885的右侧,即小概率区间,因此拒绝H0,有充分理由认为3台机器生产的次品数存在显著差异。10.2 单因素方差分析10.2.1 单因素方差分析的数据结构观察值因素A1A2Ak1x11x12x1k2x21x2krxr1xr2xrk10.2.2 单因素方差分析的步骤1、提出原假设和备择假设H0:1=2=3(自变量对响
6、应变量没有显著影响)H1:1,2,3不全等(自变量对响应变量有显著影响2、构造统计量3、与临界值比较做决策 则落入拒绝域,拒绝原假设。则落入非拒绝域,不能拒绝原假设)/()()1/()(21121knxxkxxCFrjCijijrjjjj),1(knkFF),1(knkFF4、方差分析表一般的方差分析表结构不同机器生产的次品数的方差分析表差异源SSdfMSFP-valueF crit组 间SSBr-1MSBMSB/MSE组 内SSEn-rMSE总 计SSTn-1差异源SSdfMSFpF crit组 间130 265 8.290.005463.8852组 内 94127.8333总 计22414
7、5、用EXCEL进行方差分析的过程不同佣金支付方式下销售业务员销售额销售提成固定薪金销售提成+加固定薪金165120140981151561309022021012611219510713418715523524080用EXCEL进行方差分析的操作步骤:第一步:选择“数据”下的“数据分析”(EXCEL2003下为“工具”-数据分析)。第二步:在“数据分析工具”框中选择“单因素方差分析”,单击确定。第三步:在出现的对话框(如图10-3)中用鼠标选择数据区域A1:C8;“标志位于第一行”前的选择框打钩;显著性水平 处输入0.05;分组方式按“列”;输出区域选择A12。点击确定得到图(10-4)。图
8、10-3 单因素方差分析过程图10-4 单因素方差分析结果:方差分析表10.2.3方差分析中的多重比较若|t|ta/2,拒绝原假设。等价于故将:称为最小显著性差异方法(least significant difference,LSD)。)/()()/(211knxxknSSEMSEkjCijijj)/1/1(MjijinnSExxt)/1/1(M|2/jijinnSEtxx)/1/1(M2/jiijnnSEtLSD对于例10-1中如果要进行两两比较,则根据图10-4中的MSE计算出:取显著性水平a=0.05,根据公式10.11分别计算LSD得到:7.61|21 xx8.8|31 xx9.52|
9、32 xx00.49)7171(43.17691788.2)/1/1(M)277(212/12nnSEtLSD51.51)6171(43.17692010.2)/1/1(M)267(312/13nnSEtLSD51.51)6171(43.17692010.2)/1/1(M)267(322/23nnSEtLSD10.3 双因素方差分析在双因素方差分析中,根据因素A和因素B对响应变量所起作用的方式不同,可分为独立无交互双因素方差分析和交互双因素方差分析。1、独立无交互双因素方差分析数据结构列因素12k行因素1x11x12x1k2x21x22x2krxr1xr2xrk2、方差分解因此定义行因素的第i
10、个水平下,样本平均值:定义列因素的第j个水平下,样本平均值:定义总的样本品均值kjijixkx1.1riijjxrx1.1kjriijxrkx111总离差平方和 行因素不同水平下的离差平方和列因素不同水平下的离差平方和随机离差平方和可通过离差平方和关系满足kjriijxxSST112)(riixxkSSR12.)(kjjxxrSSC12.)(SSESSCSSRSSTkjrijiijxxxxkSSE112.)(SSESSCSSRSST行因素的检验统计量列因素的检验统计量)1)(1(,1()1)(1/()1/(krrFkrSSErSSRFR)1)(1(,1()1)(1/()1/(krkFkrSSE
11、kSSCFC3、运用EXCEL进行独立无交互方差分析图10-7 独立无交互双因素方差分析结果10.3.2交互双因素方差分析在双因素方差分析中,在两个变量各自影响响应变量的同时,可能存在两个因素交互对响应变量产生影响,也就是说两个自变量并不独立,可能存在不同自变量的组合条件下响应变量存在差异。列因素12 k行因素1x111x121x1k1x112x122x1k2.x11mx12mx1km2x211x221x2k1x212x222x2k2.x21mx22mx2kmrxr11xr21xrk1xr12xr22xrk2.xr1mxr2mxrkm 例10.3 分段式定价方案是电力公司鼓励用户在高峰期尽量节
12、约用电而在非高峰期错时使用电力的一种措施。为了了解用户对若干定价方案的满意度,进行一项试验。试验中考虑两个因素,即价格比(高峰期电价与非高峰期电价的比值)和高峰期的时间长度。每个因素考察三个水平,共计个水平组合下让用户进行满意度打分。假定每个定价方案下随机抽取4个用户组成样本,得到的用户评价数据如表。1)在0.05显著性水平下,说明价格比和高峰期时长是否对用户满意度产生影响。2)在0.05显著性水平下,说明价格比和高峰期时长是否对用户满意度存在交互作用。933价格比2:13:14:1高峰期时长6小时25 31 24 26 26 28 28 29 25 27 27 26 9小时26 25 33 27 24 28 29 30 25 30 26 27 12小时22 33 30 20 27 31 25 25 26 21 27 27
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。