1、演讲者: XXX第九章 方差分析管理统计学Management statistics北京理工大学管 理 与 经 济 学 院北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics一、方差分析及其基本思想二、单因素方差分析三、双因素方差分析目录学习目标1. 解释方差分析的概念2. 解释方差分析的基本思想和原理3. 掌握单因素方差分析的方法及应用4. 理解多重比较的意义5. 掌握双因素方差分析的方法及应用北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Man
2、agement statistics方差分析方差分析就是针对一定因素(factor)分析各总体的各个因素水平(factor level)是否有差异。单因素方差分析(one-way analysis of variance) 针对一个因素所进行。双因素方差分析(two-way analysis of variance) 针对两个因素进行。北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics方差分析前提条件是被检验的样本为服从正态分布总体中的随机样本,各个总体的标准差相等,并且样本的选择是独立的。北 京 理
3、 工 大 学Beijing institute of technology管 理 统 计 学Management statistics相关术语1.因素或因子(factor)所要检验的对象2.水平或处理(treatment)因子的不同表现3.观察值在每个因素水平下得到的样本值北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics相关术语4.数据的误差用平方和(sum of squares)表示,称为方差方差5.水平内方差(within groups)因素的同一水平(同一个总体)下样本数据的方差比如,零售业被
4、投诉次数的方差组内方差只包含随机误差随机误差6.水平间方差(between groups)因素的不同水平(不同总体)下各样本之间的方差北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics相关术语7.随机误差因素的同一水平(总体)下,样本各观察值之间的差异比如,同一行业下不同企业被投诉次数是不同的这种差异可以看成是随机因素的影响,称为随机误差随机误差 8.系统误差因素的不同水平(不同总体)下,各观察值之间的差异比如,不同行业之间的被投诉次数之间的差异这种差异可能是由于抽样的随机性所造成的,也可能是由于行业
5、本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差系统误差北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics方差分析的基本思想和原理方差分析的基本思想和原理 比较两类误差,以检验均值是否相等 比较的基础是方差比(F分布) 如果系统(处理)误差显著地不同于随机误差,则均值就是不相等的;反之,均值就是相等的 误差是由各部分的误差占总误差的比例来测度的北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics
6、1234F分布方差分析中所用到的概率分布)(因素水平内方差)(因素水平间方差MSEMSAF北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics单因素方差分析单因素方差分析分析步骤:北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics建立原假设选择显著性水平确定决策点计算并决策建立原假设一般提法:H0: m1 = m2 = mk 自变量对因变量没有显著影响 H1: m1 ,m2 , ,mk不全相等自变量对因变量有显
7、著影响 注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所 有的均值都不相等 北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics选择显著性水平 显著水平不同,拒绝域也就不同,方差分析得到的结论也有可能会不同,实际中通常选择0.05的显著水平。北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics确定决策点F 分布F(k-1,n-k)拒绝H0不拒绝H0),1(knkFF北 京 理 工 大 学Beiji
8、ng institute of technology管 理 统 计 学Management statistics计算并决策方差分析表方差类型离差平方和SS自由度df均方MSF值因素水平间方差SSAk-1因素水平间方差SSEn-k总差异SSTn-1MSAkSSA 1MSEknSSEMSEMSA北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics计算并决策1.总离差平方和SST2.因素水平间离差平方和SSA3.因素水平内离差平方和SSE 为样本观测值; 因素的 每一个的观测值之和; 因素的每一个水平包含的观
9、察值的个数。nXXSST22)(nXnTSSAcc22)()(SSASSTSSEXcTcn北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics单因素方差分析的多重比较1.区间置信法(CID) 式中, 为参加检验的两个样本中第一个样本的均值; 为第二个样本的均值; 的取值根据自由度n-k可以在t分布表中查得; MSE为因素水平内方差,根据方差分析表可以计算得到; 为第一个样本中观察值的个数; 为第二个样本中观察值的个数。 2121121nnMSEtxx1x2x2t1n2n北 京 理 工 大 学Beijin
10、g institute of technology管 理 统 计 学Management statistics单因素方差分析的多重比较2.最小显著性差异法(LSD) 公式成立,则可认为两个因素水平的样本均值有显著差异; 反之,则认为两个因素水平的样本均值没有显著差异。2122111nnMSEtxx北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics双因素方差分析双因素方差分析分析步骤:北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Managemen
11、t statistics建立原假设和备择假设选择显著性水平确定决策点计算并决策建立原假设和备择假设 H0: m1 = m2 = = mj = = mr (mj为第j个水平的均值) H1: mj (j =1,2,r) 不全相等北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statisticsH0: m1 = m2 = = mi = = mk (mi为第i个水平的均值) H1: mi (i =1,2, , k) 不全相等对行因素提出的假设对列因素提出的假设选择显著性水平 显著水平不同,拒绝域也就不同,方差分析得到的结论也
12、有可能会不同,实际中通常选择0.05的显著水平。北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics确定决策点 对于行因素,F临界值为: 对于列因素,F临界值为: )1)(1()1(bkSSEkSSRFA)1)(1()1(bkSSEkSSCFB北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics计算并决策方差类型离差平方和SS自由度df均方MSF值行因素SSRk-1列因素SSCb-1随机性误差SSE(k-1)(b
13、-1)总差异SSTn-1MSRkSSR 1MSCbSSC 1MSEbkSSE)1)(1(MSEMSRMSEMSC北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statistics双因素方差分析表计算并决策1.总离差平方和SST2.因素水平间离差平方和SSR3.因素水平内离差平方和SSC 列因素的每一个水平的观察值之和; k为列因素的每一个水平包含的观察值的个数。nXXSST22)(nXnTSSRcc22)()(nxkBSSCt22)()(tB北 京 理 工 大 学Beijing institute of technology管 理 统 计 学Management statisticsThe End管理统计学Management statistics北京理工大学管 理 与 经 济 学 院