1、第章均值比较检验和方差分析本章内容n第一节 均值比较n第二节 T检验n第三节 方差分析要点:n均值比较是对同一样本进行分组,对组与组之间平均水平的比较。nT检验主要运用在两个样本间平均水平的比较。n方差分析运用于两个以上样本的均数比较。第一节 均值比较一、Means过程nMeans过程是按用户指定条件,对样本进行分组计算均值和标准差。n计算公式:nxxnii111例1n以下是某个班同学的数学成绩,比较不同性别同学的数学成绩平均值和方差。性别数学male99 79 59 89 79 89 99female88 54 56 23 70 80 67步骤:nAnalyzeCompare MeansMe
2、ansnDependent List 对话框数学nIndependent List对话框性别nOption按钮,选择统计项目Means过程是按用户指定条件,对样本进行分组计算均值和标准差。检验某个变量的样本均值与某个指定总体均值之间是否存在显著差异。Option按钮,选择统计项目说明3个组之间都存在显著差别Test Variables:数学Test of Homogeneity of Variances当以全及总体平均数为中心各加减一个抽样平均误差范围时,此范围的抽样指标占总体所有可能指标的68.一类是在研究过程中人为施加的控制变量。相反,如果相伴概率值大于显著水平,则接受零假设,认为各水平下
3、总体方差相等。423,大于显著水平0.两总体方差未知且相同情况下,T统计量计算公式:在这里选择Homogeneity of variance test(方差相等检验方法)。某百货公司的营销部根据不同家庭的价值观细分了女性服装市场,分为保守型、传统型和潮流型,另外调查了不同类型家庭收入,见下表(单位:千元)。Missing Values:Exclude casesT统计量计算公式如右:说明3个组之间都存在显著差别05,因此不能拒绝H0,可以认为11名同学的成绩与全国数学平均成绩相比,没有显著差异。2、样本来自的两个总体服从正态分布相反,如果相伴概率值大于显著水平,则接受零假设,认为各水平下总体方
4、差相等。第一组:使用Fa化肥第二节 T检验一、单一样本T检验二、两个独立样本T检验一、单一样本T检验n检验某个变量的样本均值与某个指定总体均值之间是否存在显著差异。n计算公式:nD是样本均值与检验值的差。nS.E.Mean:样本均差,或抽样平均误差nS是样本标准差,n为样本数nsDMeanESxxt/.中心极限定理n如果总体存在有限的平均数和方差时,不管总体是否属于正态分布,只要当抽样单位数不断增加,当样本容量大于30后,即当抽样单位数足够大时,样本平均数x分布趋近于正态发布。n当以全及总体平均数为中心各加减一个抽样平均误差范围时,此范围的抽样指标占总体所有可能指标的68.27%。两倍时为95
5、.45%。这个倍数称为概率度正态分布x-uu68.27%-2u2u95.45%接受域否决域否决域抽样平均误差n样本平均数x的平均数等于总体平均数,样本平均数分布的方差等于总体方差除以样本容量。).()(2MeanESnSXx所有样本的个数抽样平均误差T分布n当样本容量小于30,样本平均数分布服从n-1个自由度的T分布。nSPSS将根据T分布表给出t值对应的相伴概率值。如果相伴概率值小于或等于用户设想的显著性水平a,则拒绝H0,认为总体均值和检验值之间存在显著差异。反之,总体均值和检验值之间不存在差异。例2n上题中,数学高考成绩与全国平均成绩70之间是否存在显著差异?步骤nAnalyzeComp
6、are MeansOne Sample T TestnTest Variables:数学nTest Values:70Option:nConfidence Interval:95%nMissing Values:Exclude cases结果与讨论例如:农业上检验某种新型化肥的效果,做增产试验。一类是在研究过程中人为施加的控制变量。假设两个总体的方差相等,显著水平为0.均值比较是对同一样本进行分组,对组与组之间平均水平的比较。用B方法生产所需时间:单击Post Hoc按钮,打开一个对话框,在其中选择一种或几种比较分析的方法,选择LSD(Least-Significant Difference)
7、最小显著法。SST:总变异的平方和05,因此不能拒绝H0,可以认为11名同学的成绩与全国数学平均成绩相比,没有显著差异。单击Post Hoc按钮,打开一个对话框,在其中选择一种或几种比较分析的方法,选择LSD(Least-Significant Difference)最小显著法。假设学生作业时间服从正态分布,老师建议时间不低于36小时,检验其平均时间是否与老师建议的时间相符?样本平均数x的平均数等于总体平均数,样本平均数分布的方差等于总体方差除以样本容量。当以全及总体平均数为中心各加减一个抽样平均误差范围时,此范围的抽样指标占总体所有可能指标的68.方差分析运用于两个以上样本的均数比较。总的离
8、差平方和为5250,其中控制变量不同水平造成的组间离差平方和为3686,组内离差平方和为1563.两总体方差未知且相同情况下,T统计量计算公式:当以全及总体平均数为中心各加减一个抽样平均误差范围时,此范围的抽样指标占总体所有可能指标的68.二、两个独立样本T检验Test Variables:数学本例中大于相伴概率0.两总体方差未知且相同情况下,T统计量计算公式:99 23 89 70 50 67 78 89 56nT值为0.566n相伴概率Sig=0.584nSig0.05,因此不能拒绝H0,可以认为11名同学的成绩与全国数学平均成绩相比,没有显著差异。作业n抽取一个由12名学生组成的随机样本
9、,调查他们在作业上花费的时间。假设学生作业时间服从正态分布,老师建议时间不低于36小时,检验其平均时间是否与老师建议的时间相符?314026303638294038303538二、两个独立样本T检验n所谓独立样本是指两个样本之间彼此独立没有任何关联,两个独立样本各自接受相同的测量,研究者的主要目的是了解两个变量之间是否有显著差异存在。n检验的前提:1、两个样本相互独立 2、样本来自的两个总体服从正态分布计算步骤n利用F检验判断两总体的方差是否相同。Spss采用Levene F方法检验两总体方差是否相同,自动计算F统计量,并根据F分布表给出统计量对于的相伴概率和显著水平a进行比较,从而判断方差是
10、否相同。n根据第一步的结果,决定T统计量和自由度的计算公式,进而对T检验的结论作出结论n两个独立样本T检验的零假设H0为两总体均值之间不存在显著差异。n在两总体方差未知且不等时,nT统计量计算公式如右:22222121212221212222121/1nnsnnsnsnsfssxxtnnn两总体方差未知且相同情况下,T统计量计算公式:1)1()1(/212222112222211nnsnsnSssxxtpnpnp评判标准:nSpss将会根据计算的T值和T分布表,给出相应的相伴概率值Sig。n 如果相伴概率值小于或等于显著水平a,则拒绝H0,认为两总体均值之间存在显著差异,相反,相伴概率大于显著
11、水平a,则不能拒绝H0,认为两总体均值之间不存在显著差异。例3n清华、北大学生的高考数学成绩表学校数学清华99 88 79 59 54 89 79 56 89北大99 23 89 70 50 67 78 89 56步骤:nAnalyzeCompare MeansIndependent-Sample T TestnTest Variables:数学nTest Values:SourceDefine Groups假设两个总体的方差相等,显著水平为0.T统计量计算公式如右:样本平均数x的平均数等于总体平均数,样本平均数分布的方差等于总体方差除以样本容量。二、两个独立样本T检验SPSS将根据T分布表给
12、出t值对应的相伴概率值。SPSS自动计算F统计值,F服从(k-1,n-k)个自由度的F分布(k是水平数,n为个案数),SPSS依据F分布表给出相应的相伴概率值。单击option按钮,出现一个对话框。Option按钮,选择统计项目当以全及总体平均数为中心各加减一个抽样平均误差范围时,此范围的抽样指标占总体所有可能指标的68.用B方法生产所需时间:SPSS自动计算F统计值,F服从(k-1,n-k)个自由度的F分布(k是水平数,n为个案数),SPSS依据F分布表给出相应的相伴概率值。Option按钮,选择统计项目SST:总变异的平方和利用F检验判断两总体的方差是否相同。检验某个变量的样本均值与某个指
13、定总体均值之间是否存在显著差异。05,因此不能拒绝H0,可以认为11名同学的成绩与全国数学平均成绩相比,没有显著差异。Missing Values:Exclude casesTest Values:SourceDefine Groups上题中,数学高考成绩与全国平均成绩70之间是否存在显著差异?05,因此不能拒绝H0,可以认为11名同学的成绩与全国数学平均成绩相比,没有显著差异。均值比较是对同一样本进行分组,对组与组之间平均水平的比较。Independent List对话框性别两总体方差未知且相同情况下,T统计量计算公式:Spss将会根据计算的T值和T分布表,给出相应的相伴概率值Sig。当以全
14、及总体平均数为中心各加减一个抽样平均误差范围时,此范围的抽样指标占总体所有可能指标的68.在方差相等时看T检验结果,T检验值等于相伴概率0.假设学生作业时间服从正态分布,老师建议时间不低于36小时,检验其平均时间是否与老师建议的时间相符?用B方法生产所需时间:一类是在研究过程中人为施加的控制变量。以下是某个班同学的数学成绩,比较不同性别同学的数学成绩平均值和方差。抽取一个由12名学生组成的随机样本,调查他们在作业上花费的时间。2、样本来自的两个总体服从正态分布在两总体方差未知且不等时,2、样本来自的两个总体服从正态分布抽取一个由12名学生组成的随机样本,调查他们在作业上花费的时间。Means过
15、程是按用户指定条件,对样本进行分组计算均值和标准差。05,因此不能拒绝H0,可以认为11名同学的成绩与全国数学平均成绩相比,没有显著差异。单击option按钮,出现一个对话框。单击continue返回。检验某个变量的样本均值与某个指定总体均值之间是否存在显著差异。Test Variables:数学Ni为第i水平下的样本容量。n本例中大于相伴概率0.461,大于显著水平0.05,不能拒绝方差相等的假设,可以认为两个学校学生数学成绩方差无显著差异;n在方差相等时看T检验结果,T检验值等于相伴概率0.423,大于显著水平0.05,不能拒绝T检验的零假设,可以认为两个学校学生数学平均成绩无显著差异。作
16、业 一家企业生产某种产品,随机抽取50名工人,分成两个组,每组25名工人,用A方法生产所需时间:6.857.95.27.66.16.27.14.666.46.16.67.76.455.95.26.57.47.16.156.37作业 用B方法生产所需时间:假设两个总体的方差相等,显著水平为0.05,这两种方法效率是否有显著差异?5.26.75.76.68.54.24.55.37.975.94.95.34.27.16.55.96.76.64.25.97.15.875.7第三节 方差分析n方差分析是研究一个或多个可分组的自变量与一个连续的因变量之间的统计关系,并且测定自变量对因变量的影响和作用的一种
17、统计分析方法。nT检验适合在两个样本间的比较。对于两组以上的均数比较,必须使用方差分析的办法。n造成结果差异的原因可分为两类:一类是不可控的随机变量;一类是在研究过程中人为施加的控制变量。n方差分析的的基本思想是:通过分析不同变量的变异对总变异的贡献大小,确定控制变量对研究结果影响力的大小,是否对结果产生了显著影响。如果没有,就是随机变量的作用。方差分析有:n单因素重复试验n双因素重复试验n双因素无重复试验单因素试验n单因素方差分析测试某一个控制变量的不同水平是否给观察变量造成了显著差异和变动。例如:农业上检验某种新型化肥的效果,做增产试验。将土地分为三组:第一组:使用Fa化肥 第二组:使用F
18、b化肥 第三组:使用传统化肥(对照)总变异SST=SSA+SSEn其中:SST:总变异的平方和SSA:组间离差平方和SSE:组内离差平方和kinjiijkiiiixxSSExxnSSA1112)()(SSA:是各水平组均值和总体均值离差的平方和,反映了控制变量的影响。SSE:是每个数据与本水平组平均值离差的平方和,反映了数据抽样误差的大小程度。K:水平数 ;Ni为第i水平下的样本容量。计算公式,进行F检验nF服从(k-1,n-k)个自由度的F分布)/()1/(knSSEkSSAFnSPSS自动计算F统计值,F服从(k-1,n-k)个自由度的F分布(k是水平数,n为个案数),SPSS依据F分布表
19、给出相应的相伴概率值。n如果相伴概率值小于或等于显著水平a,则拒绝零假设,认为各水平下总体均值有显著差异,反之,则认为控制变量不同水平下各总体均值没有显著差异。例题 三组学生的数学成绩组别数学组别数学组别数学199279355188256350199289367189299367194270356190289356研究一个班3组同学(分别接受3种不同的教学方法)在数学成绩上是否有显著差异.步骤n在“Analyze”菜单“Compare Means”中选择One-Way ANOVA命令。n在弹出的对话框中,选择“数学”变量添加到Dependent List框中,选择“组别”变量添加到Factor
20、框中。n单击option按钮,出现一个对话框。由于方差分析的前提是各个水平下总体服从方差相等的正态分布,因此必须对方差分析的前提进行检验。方差相等检验方法n在这里选择Homogeneity of variance test(方差相等检验方法)。如果相伴概率值小于或等于显著水平,则拒绝零假设,认为各水平下总体方差不等;相反,如果相伴概率值大于显著水平,则接受零假设,认为各水平下总体方差相等。单击continue返回。n单击Post Hoc按钮,打开一个对话框,在其中选择一种或几种比较分析的方法,选择LSD(Least-Significant Difference)最小显著法。a默认为0.05,单
21、击Continue返回。n单击Contrasts按钮,选择Linear,作线形分解。SPSS自动计算F统计值,F服从(k-1,n-k)个自由度的F分布(k是水平数,n为个案数),SPSS依据F分布表给出相应的相伴概率值。Independent List对话框性别Option按钮,选择统计项目两个独立样本T检验的零假设H0为两总体均值之间不存在显著差异。SST=SSA+SSE检验某个变量的样本均值与某个指定总体均值之间是否存在显著差异。抽取一个由12名学生组成的随机样本,调查他们在作业上花费的时间。由于方差分析的前提是各个水平下总体服从方差相等的正态分布,因此必须对方差分析的前提进行检验。方差分
22、析运用于两个以上样本的均数比较。当以全及总体平均数为中心各加减一个抽样平均误差范围时,此范围的抽样指标占总体所有可能指标的68.方差分析的的基本思想是:通过分析不同变量的变异对总变异的贡献大小,确定控制变量对研究结果影响力的大小,是否对结果产生了显著影响。如果相伴概率值小于或等于显著水平a,则拒绝零假设,认为各水平下总体均值有显著差异,反之,则认为控制变量不同水平下各总体均值没有显著差异。如果总体存在有限的平均数和方差时,不管总体是否属于正态分布,只要当抽样单位数不断增加,当样本容量大于30后,即当抽样单位数足够大时,样本平均数x分布趋近于正态发布。如果相伴概率值小于或等于显著水平a,则拒绝H
23、0,认为两总体均值之间存在显著差异,相反,相伴概率大于显著水平a,则不能拒绝H0,认为两总体均值之间不存在显著差异。样本平均数x的平均数等于总体平均数,样本平均数分布的方差等于总体方差除以样本容量。05,不能拒绝方差相等的假设,可以认为两个学校学生数学成绩方差无显著差异;抽取一个由12名学生组成的随机样本,调查他们在作业上花费的时间。Confidence Interval:95%从上表可以看出,相伴概率为0,小于显著性水平0.Missing Values:Exclude cases一类是在研究过程中人为施加的控制变量。Missing Values:Exclude cases结果与讨论n单因素方
24、差分析的前提检验结果Test of Homogeneity of Variances数学 Levene Statisticdf1df2 Sig.3.862 2 15 .044方差检验从上表可以看出,相伴概率为0,小于显著性水平0.05,表示拒绝零假设,也就是说3个组中至少有一个组和其他两个组有明显的区别。总的离差平方和为5250,其中控制变量不同水平造成的组间离差平方和为3686,组内离差平方和为1563.6多重比较3个组之间的相伴概率都小于显著水平0.05,说明3个组之间都存在显著差别作业3 方差分析n某百货公司的营销部根据不同家庭的价值观细分了女性服装市场,分为保守型、传统型和潮流型,另外
25、调查了不同类型家庭收入,见下表(单位:千元)。能否推断出不同类型的家庭的收入是否存在明显不同?保守型家庭收入43472237412536502232493150263247324138512833505442传统型家庭收入35335443384045383429432332372548414847334945292132Test of Homogeneity of Variances一类是在研究过程中人为施加的控制变量。如果相伴概率值小于或等于显著水平,则拒绝零假设,认为各水平下总体方差不等;05,因此不能拒绝H0,可以认为11名同学的成绩与全国数学平均成绩相比,没有显著差异。样本平均数x的平
26、均数等于总体平均数,样本平均数分布的方差等于总体方差除以样本容量。2、样本来自的两个总体服从正态分布Option按钮,选择统计项目说明3个组之间都存在显著差别Test Variables:数学05,因此不能拒绝H0,可以认为11名同学的成绩与全国数学平均成绩相比,没有显著差异。Test Values:70一家企业生产某种产品,随机抽取50名工人,分成两个组,每组25名工人,用A方法生产所需时间:如果相伴概率值小于或等于显著水平a,则拒绝H0,认为两总体均值之间存在显著差异,相反,相伴概率大于显著水平a,则不能拒绝H0,认为两总体均值之间不存在显著差异。两总体方差未知且相同情况下,T统计量计算公式:造成结果差异的原因可分为两类:一类是不可控的随机变量;第章均值比较检验和方差分析88 54 56 23 70 80 67说明3个组之间都存在显著差别从上表可以看出,相伴概率为0,小于显著性水平0.样本平均数x的平均数等于总体平均数,样本平均数分布的方差等于总体方差除以样本容量。总的离差平方和为5250,其中控制变量不同水平造成的组间离差平方和为3686,组内离差平方和为1563.传统型家庭收入35335443384045383429432332372548414847334945292132