1、一、单因素方差分析二、无重复的双因素分析三、有重复的双因素分析ONE WAY ANOVA单因变量单因素。广义线性模型:四个过程1.Univariate过程:单因变量多因素。2.Multivariate过程:多因变量多因素。3.Repeated过程:重复测量数据时。4.Variance Components过程:用于对层次数据拟合方差成分模型。2015/11/5统计分析综合实验史慧萍2 设每个检验的显著水平为,则检验c个独立的比较,则犯一类错误的概率为 1(1)k若组为三、五组,采用T检验(=0.05)就需进行3次、10次的两两比较,则犯一类错误的概率为:1(10.05)3=0.141(10.0
2、5)10=0.402015/11/5统计分析综合实验史慧萍3方差分析是比较多组的总体均值是否相等的一种数据分析方法。方差分析的目的是:判断分组是否有效。(检验均数(组间或变量间)差别是否具有统计意义)有效的分组应该是组间差距大,组内差距小,这是方差分析的判别依据,方差分析主要是将样本方差进行合理分解,比较数据的组间差异和组内差异,从而进行判断。2015/11/5统计分析综合实验史慧萍4因素(Factor):因素是可能对应变量有影响的变量,一般,因素会有不止一个水平,而分析的目的就是考察或比较各个水平对应变量的影响是否相同。例如影响农作物产量的因素有气温、降雨量、日照时间等。在方差分析中,因素的
3、取值范围不能无限,只能有若干水平,即应当为分类变量。水平Level:因素的不同取值等级称作水平,例如性别有男、女两个水平。需要注意的是,有些时候水平是人为划分出来的,比如身高被分为高、中、低三个水平。单元(Cell):指各个因素之间的组合,我们所说的方差齐就是指的各个单元的方差齐。互交作用(Interaction):如果一个因素的效应大小在另一个因素不同水平下明显不同,则称为两因素间存在交互作用。2015/11/5统计分析综合实验史慧萍5各样本的独立性正态性方差齐2015/11/5统计分析综合实验史慧萍6Xij=+i+ij(有些时候写成Xij=i+ij)Xij=表示第i组变量的第j个观测值其中
4、:表示所有处理的总的平均数,为一常数i=i,为一参数,表示影响因素在第i个水平下对应变量的附加效果,并假设所有的i之和为零ij为第i组实验第j个处理单位的个别效应,也称个别差异或随机效应,ijN(0,2),表示随机误差项,且所有ij间相互独立。2015/11/5统计分析综合实验史慧萍7H0:1=2=,=r=,即i=0,i=1,rH1:1、2、r 之间不完全相等(或者i不全等于零,或者至少有一个i不等于零。)2015/11/5统计分析综合实验史慧萍8Xij=+i+j+ijk其中:1.表示所有处理的总的平均数,为一常数;2.i是A因素的第i个水平的效果,即A因素的主效应;3.j是B因素的第j个水平
5、的效果,即B因素的主效应;4.ijk为误差项。ijk N(0,2),且所有ijk间相互独立。,为一参数,表示第i个处理的效果ij为独立正态(0,2)的随机变量,表示随机误差项2015/11/5统计分析综合实验史慧萍9Xij=+i+j+()ij+ijk其中:1.表示所有处理的总的平均数,为一常数;2.i是A因素的第i个水平的效果,即A因素的主效应;3.j是B因素的第j个水平的效果,即B因素的主效应;4.()ij是A因素的第i个水平和B因素的第j个水平之间的互交作用(附加效应);5.ijk为误差项。ijk N(0,2),且所有ijk间相互独立。,为一参数,表示第i个处理的效果ij为独立正态(0,2
6、)的随机变量,表示随机误差项2015/11/5统计分析综合实验史慧萍10A因素的主效应(说明A无影响)H0A:i*=,即i=0,i=1,r(或者因素A的主效应是否显著异于零)H1A:i不全等于零(或者1*、2*、r*之间不完全相等)B因素的主效应(说明B无影响)H0B:*j=,即j=0,j=1,s(或者因素B的主效应是否显著异于零)H1B:j不全等于零(或者*1、*2、*s 之间不完全相等)A、B因素的互交作用(说明A与B无互交效应)H0C:Cij=ijij=0(或者因素A和因素B的互交作用是否显著异于零)2015/11/5统计分析综合实验史慧萍11(一)目的检验某一个控制因素的改变是否会给观
7、察变量带来显著影响。例如:不同肥料某农作物亩产量不同学历工资收入推销策略推销额2015/11/5统计分析综合实验史慧萍12(二)基本思路(1)入手点:检验控制变量的不同水平下,各总体的分布是否存在显著差异,进而判断控制变量是否对观测变量产生了显著影响。(2)前提:不同水平下各总体服从方差相等的正态分布。(3)H0:不同水平下,各总体均值无显著差异。即:不同水平下控制因素的影响不显著。(4)构造F统计量因为:总变差=组间差异+组内差异可证明:SST=SSA+SSE(设:k个水平)考察平均的组间差异与平均的组内差异的比值(或方案间的方差与与所有方案内的方差之比),于是(5)结论:F值较大,F值的相
8、伴概率小于或等于用户给定的显著性水平,则拒绝H0,认为不同水平下各总体均值有显著差异;F值较小,F值的相伴概率大于用户给定的显著性水平,则不能拒绝H0,可以认为不同水平下各总体均值无显著差异。2015/11/5统计分析综合实验史慧萍13),1()/()1/(knkFMSEMSAknSSEkSSAF单因素方差分析抽样结果A的水平试验指标平均值A1x11,x12,x13,x1,n1x1A2x21,x22,x23,x2,n2x2.Akxk1,xk2,xk3,xk,nkxk每个因素水平的试验个数分别为:n1,n2,nk。XijN(i,2)H0:1=2=k=2015/11/5统计分析综合实验史慧萍14单
9、因素方差分析表方差来源平方和自由度均方F值因素ASSAk1MSA=SSA/(k-1)误差SSEnkMSE=SSE/(n-k)总和SSTn1SPSS判断:当Sig.时,拒绝零假设,认为因素A影响显著;Sig.,接受零假设,认为因素A影响不显著。2015/11/5统计分析综合实验史慧萍15),1()/()1/(knkFMSMSknSSkSSFEAEA(三)应用举例不同的施肥量是否对亩产量造成了显著影响观测变量的数据安排控制变量可以定义成定类或定序变量观察方差分析表不同推销方式是否对推销额有显著影响观察方差分析表(四)进一步的分析前提的检验:各水平下方差齐性检验实现方法:option中的statis
10、tics:Homogeneity-of-variance,检验各水平下各总体方差是否齐性。H0:各水平下各总体方差无显著差异。2015/11/5统计分析综合实验史慧萍16目的:如果总体均值存在差异,F检验不能说明哪个水平造成了观察变量的显著差异。多重比较将对每个水平的均值逐对进行比较检验。多重比较方法1.LSD法:即最小显著性差异法,实际上就是t检验的变形,用t检验完成各组间的配对比较,检验的敏感性比较高,各水平间的均值存在微小差异也有可能被检验出来,但此方法对第一类弃真错误的概率不进行控制和调整。2.Bonferroni法:即修正最小显著性差异法,与LSD法基本相同,不同的是对第一类弃真错误
11、的概率进行了控制。3.Tukey法:即Tukey显著差异,应用这种方法要求各水平观测个数相等,与LSD法相比,对第一类弃真错误的概率进行了有效的处理。4.Scheffe法:使用了F统计量为检验统计量,对可能的组合进行同步进入的配对比较,可用于检验分组均值所有可能的线性组合。当各水平个案数不相等,或者想进行复杂的比较时,用此法较为稳妥,但灵敏度不是很高。5.S-N-K法:全称是Studend-Newman-Keuls法,是运用最广泛的一种两两比较方法。它采用Student Range 分布进行所有各组均值间的配对比较。该方法保证在H0真正成立时总的水准等于实际设定值,即控制了一类错误。单因素方差
12、分析方法选择策略一般可以参照如下标准:如果存在明确的对照组,要进行的是验证性研究,即计划好的某两个或几个组间(和对照组)的比较,宜用Bonferroni(LSD)法;若需要进行的是多个均数间的两两比较(探索性研究),且各组个案数相等,适宜用Tukey法;其它情况宜用Scheffe法。2015/11/5统计分析综合实验史慧萍17例:不同岗位的平均工资问题,是任何单位的人事管理都要考虑的根本问题。若某单位的工作岗位可以分为三类:一线工人、科级以上干部、一般干部。试比较这三类职工的当前的平均工资有无显著差异?数据见“CH4CH8茎叶箱方差工资性别岗位300余”。2015/11/5统计分析综合实验史慧
13、萍182015/11/5统计分析综合实验史慧萍192015/11/5统计分析综合实验史慧萍202015/11/5统计分析综合实验史慧萍21比较多重比较选项2015/11/5统计分析综合实验史慧萍22均数分布图LDS:LDS法,实际上就是t检验的变形,只是在变异和自由度的计算上利用了整个样本信息,而不仅仅是所比较两组的信息,因此它的敏感度最高,在比较时仍然存在放大水准(一类错误)的问题,但换之言就是总的二类错误非常的小,要是LSD法都没检验出差错,那恐怕是真的没差别。S-N-K:即Student Newman Keuls法,是运用最广泛的一种两两比较法。他采用Student Range分布进行所
14、有各组均值间的配对比较。该方法保证在H0真正成立时总的水准等于实际设定值即控制了第一类错误。Bonfeeroni:由LDS法修正而来,通过设置每个检验的水准来控制总的水准,该方法的敏感度介于LDS法和Scheffe法之间。2015/11/5统计分析综合实验史慧萍23Sidak:也是从t检验修正而来的,和Bonfeeroni法非常相似,但比Bonfeeroni法保守。TUKEY:即Tukeys honestly signficant difference法(Tukeys HSD),同样采用Student Range分布统计量进行所有组间均值的两两比较。但与S-N-K法不同的是,它控制的是所有比较
15、中最大的一类错误概率值不超过水准。Scheffe:当各组人数不相等,或者想进行复杂的比较时,用此法较为妥当。它检验的是各个均数的线性组合,而不是只检验某一对均数间的差异,并控制整体水准等于0.05。但正因如此,它相对比较保守,有时方差分析F值有显著性,用该法两两比较却找不出差异来。Dunnentt:将所有的处理组均数分别与指定的对照组均数比较,并控制所有比较中最大一类错误概率值不超过水准,请注意该方法并不适用于完全两两比较的情况。选定此方法会激活下面的Control Category框。用于设定对照组及单双侧检验。2015/11/5统计分析综合实验史慧萍24样本数、均值、标准差、标准误、95%
16、置信区间、最小值、最大值。2015/11/5统计分析综合实验史慧萍25Descripti vesDescripti ves当前 工资285$31,888.56$12,165.077$720.597$30,470.17$33,306.95$15,750$78,50026$72,555.35$16,491.949$3,234.337$65,894.10$79,216.59$45,625$103,50055$27,734.64$7,862.361$1,060.160$25,609.14$29,860.13$15,900$68,125366$34,153.23$16,068.091$839.893$3
17、2,501.60$35,804.87$15,750$103,500一线 工人科以 上干部一般 机关员 工Tot alNM eanStd.Deviati onStd.ErrorLower BoundUpper Bound95%Confidence Interval forM eanM i nim umM axi m umP=0.0000.05,接受零检验,认为本问题具有方差齐性。2015/11/5统计分析综合实验史慧萍64Levenes Test of Equality of Error VariancesLevenes Test of Equality of Error Variancesa
18、aDependent Variable:指标U1.882827.105Fdf1df2Sig.Tests the null hypothesis that the error variance of the dependent variable is equal across groups.Design:Intercept+政策作用+企业类型+政策作用*企业类型a.2015/11/5统计分析综合实验史慧萍65Tests of Between-Subjects EffectsTests of Between-Subjects EffectsDependent Variable:指标U4.164a8
19、.5217.101.00042.993142.993586.564.0001.9612.98113.379.0001.2702.6358.661.001.5644.1411.925.1351.97927.07352.610366.14335SourceCorrected ModelIntercept政策作用企业类型政策作用*企业类型ErrorTotalCorrected TotalType III Sumof SquaresdfMean SquareFSig.R Squared=.678(Adjusted R Squared=.582)a.首先是所用方差分析模型的检验,F值为7.101,p=0
20、.000,因此所用的模型有统计学意义,可以用它来继续判断模型中的系数有无统计学意义;第二行是截距,它在我们的分析中没有实际意义;第三行政策作用的F统计值是13.3793955658,相应的显著概率p=0.0000.05,说明政策作用对企业指标U的作用是显著的。第四行企业类型的F统计值是8.661450385492,相应的显著概率p=0.0000.05,说明交互作用与零没有显著差异。2015/11/5统计分析综合实验史慧萍66Multiple ComparisonsMultiple ComparisonsDependent Variable:指标U-.2559*.11091.029-.4835-
21、.0284-.6220*.11301.000-.8538-.3901.2559*.11091.029.0284.4835-.3660*.10838.002-.5884-.1436.6220*.11301.000.3901.8538.3660*.10838.002.1436.5884-.2559.11053.096-.5478.0359-.6220*.13506.001-.9870-.2569.2559.11053.096-.0359.5478-.3660.16009.095-.7807.0486.6220*.13506.001.2569.9870.3660.16009.095-.0486.78
22、07(J)企业评价政策等级作用中作用大作用小作用大作用小作用中作用中作用大作用小作用大作用小作用中(I)企业评价政策等级作用小作用中作用大作用小作用中作用大LSDTamhaneMeanDifference(I-J)Std.ErrorSig.Lower BoundUpper Bound95%Confidence IntervalBased on observed means.The mean difference is significant at the.05 level.*.2015/11/5统计分析综合实验史慧萍67Multiple ComparisonsMultiple Comparis
23、onsDependent Variable:指标U-.3406*.11091.005-.5681-.1130-.5303*.11301.000-.7622-.2984.3406*.11091.005.1130.5681-.1897.10838.091-.4121.0326.5303*.11301.000.2984.7622.1897.10838.091-.0326.4121-.3406*.11849.026-.6469-.0342-.5303*.15853.012-.9504-.1102.3406*.11849.026.0342.6469-.1897.16673.610-.6256.2461.
24、5303*.15853.012.1102.9504.1897.16673.610-.2461.6256(J)科技企业规模中规模大规模小规模大规模小规模中规模中规模大规模小规模大规模小规模中规模(I)科技企业规模小规模中规模大规模小规模中规模大规模LSDTamhaneMeanDifference(I-J)Std.ErrorSig.Lower BoundUpper Bound95%Confidence IntervalBased on observed means.The mean difference is significant at the.05 level.*.2015/11/5统计分析综合实验史慧萍682015/11/5统计分析综合实验史慧萍692015/11/5统计分析综合实验史慧萍70注:用SPSS 统计软件进行方差分析是非常简便和快捷的,但是,要注意SPSS 进行方差分析时,对数据的输入的格式是有要求的,一般来说,定义的分组变量主要是用来表示因子的不同水平。如果输入的数据的格式不对,那么将得不到正确的结果。所以,在用SPSS 进行方差分析时要注意到这一点。2015/11/5统计分析综合实验史慧萍71
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。