1、2022-6-61 第五章第五章 参数估计与假设检验参数估计与假设检验 2022-6-62主要内容主要内容第一节第一节 单一样本单一样本T检验检验 (One-Sample T Test)第二节第二节 独立样本独立样本T检验检验 (Independent-Sample T Test)第三节第三节 配对样本配对样本T检验检验 (Paired-Sample T Test)2022-6-63均值比较与均值比较的检验过程均值比较与均值比较的检验过程均值比较的概念均值比较的概念统计分析常常采取抽样研究的方法,即从总体中随机抽取一统计分析常常采取抽样研究的方法,即从总体中随机抽取一定数量的样本进行研究来推断
2、总体的特性。由于总体中的每定数量的样本进行研究来推断总体的特性。由于总体中的每个个体间均存在差异,即使严格遵守随机抽样原则也会由于个个体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体参多抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同;又由于实验者测量技术的差别或测量仪器数之间有所不同;又由于实验者测量技术的差别或测量仪器精确程度的差别等等也会造成一定的偏差,使样本统计量与精确程度的差别等等也会造成一定的偏差,使样本统计量与总体参数之间存在差异。由此可以得到这样的认识:总体参数之间存在差异。由此可以得到这样的认识:均值不均值不相
3、等的两组样本不一定来自均值不同的总体相等的两组样本不一定来自均值不同的总体。能否用样本均值估计总体均值?两个变量均值接近的样本是能否用样本均值估计总体均值?两个变量均值接近的样本是否来自均值相同的总体?换句话说,否来自均值相同的总体?换句话说,两组样本某变量均值不两组样本某变量均值不同,其差异是否具有统计意义同,其差异是否具有统计意义?能否说明总体具有显著性差?能否说明总体具有显著性差异?这是各种研究工作中经常提出的问题。这就要进行均值异?这是各种研究工作中经常提出的问题。这就要进行均值比较。比较。2022-6-64一、一、 简介简介 主要用于检验单个变量的均值与假设检验值(给定的常数)之间是
4、否存在差异,也可进行单样本的参数区间估计。二、完全窗口分析二、完全窗口分析 按AnalyzeCompare MeansOne-Sample T Test顺序,打开One-Sample T Test主对话框(如图5-1)第一节第一节 单一样本单一样本T检验检验2022-6-65图图5-1 One-Sample T Test主对话框主对话框图图5-2 Options对话框对话框Test Variables框:用于框:用于选取需要选取需要分析的变分析的变量量Test Value:输输入已知的入已知的总体均值,总体均值,默认值为默认值为0Confidence Interval:输输入置信区间,入置信区
5、间,一般取一般取90、95、99等。等。Missing Values:在检验变量中含在检验变量中含有缺失值的观测将有缺失值的观测将不被计算。不被计算。在任何一个变量在任何一个变量中含有缺失值的观中含有缺失值的观测都将不被计算测都将不被计算2022-6-66三、例题分析三、例题分析(一) 05-1 某校在对一项教学改革措施的评价中,随机抽取了60位学生进行态度调查,他们的10项态度7级量表的态度反应资料见下表:教学改革态度反应得分(教学改革态度反应得分(x)人数(人数(f)1020220306304010405012506020607010合计合计60试构造学生态度得分平均值的试构造学生态度得分
6、平均值的98%的置信区间。的置信区间。2022-6-67(二)以04-7的资料来说明。已知另一地区16-18岁的少年血红蛋白平均值为11.657 (g%),检验这一地区16-18岁少年血红蛋白平均值是否与另一地区的平均值相等。1、操作步骤、操作步骤 1)(打开数据文件“04-7血红蛋白血红蛋白.sav”。)按AnalyzeCompare MeansOne Sample T Test顺序,打开主对话框。 2)将变量hb选入 Test Variable框。 3)在Test Value中输入 11.657,后单击OK。2022-6-682、结果分析、结果分析O On ne e- -S Sa am m
7、p pl le e S St ta at ti is st ti ic cs s4011.44482.2690.3588HBNMeanStd.DeviationStd. ErrorMean表表5-1 单个样本统计量单个样本统计量 表5-1 是血红蛋白值的观测量个数、均值、标准差和均值的标准误等统计量。2022-6-69O On ne e- -S Sa am mp pl le e T Te es st t-.59239.558-.2122-.9379.5134HBtdfSig.(2-tailed)MeanDifferenceLowerUpper95% ConfidenceInterval of
8、theDifferenceTest Value = 11.657表表5-2 单个样本检验单个样本检验 从表5-2可看出,t值为-0.592,自由度为39,显著值为0.558,样本均值与检验值的差为-0.2122,该差值95%的置信区间是-0.93790.5134。 2022-6-610(三)为了解某村1300户农民的年收入状况,不重复抽取70户家庭进行调查,得出每户农民年平均收入为4500元,标准差为260元。试求该村每户农民年平均收入95%的置信区间。(四)某商品的零售商要求总代理增加广告费支出,认为如此每星期平均销售量可达20000箱。总代理增加广告费三个月后想了解平均销售情况,随机抽取1
9、6家零售店调查,发现每星期平均销售量只有15000箱,标准差为6000箱。假设销售量服从正态分布,试问平均销售量的下降是否因偶然因素所致(0.01)?2022-6-611一、一、 简介简介 用于检验对于两组来自独立总体的样本,其独立总体的均值或中心位置是否一样。如果两组样本彼此不独立,应使用配对T检验(Paired -Sample T Test )。如果分组不止一个,应使用One-Way ANOVA 过程进行单变量方差分析。如果想比较的变量是分类变量,应使用Crosstabs功能。 独立样本T检验还要求总体服从正态分布,如果总体明显不服从正态分布,则应使用非参数检验过程(Nonparametr
10、ic test)。第二节第二节 独立样本独立样本T检验检验122022-6-6两个独立样本之差的抽样分布两个独立样本之差的抽样分布 m m1s s1总体总体1s s2 m m2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2m m1- 1- m m2 2132022-6-6两个总体均值之差的两个总体均值之差的检验检验 (s s12、 s s22 已知已知)1.假定条件假定条件n两个样本是独立的随机样本n两个总体都是正态分布n若不是
11、正态分布, 可以用正态分布来近似(n130和 n230) 2.检验统计量为检验统计量为142022-6-6两个总体均值之差的两个总体均值之差的检验检验 (s s12、 s s22 未知,大样本未知,大样本)检验统计量为检验统计量为152022-6-6两个总体均值之差的两个总体均值之差的检验检验 (s s12、 s s22 未知但相等未知但相等,小样本小样本)1.1.检验具有等方差的两个总体的均值检验具有等方差的两个总体的均值2.2.假定条件假定条件n两个样本是独立的随机样本n两个总体都是正态分布n两个总体方差未知但相等3.3.检验统计量检验统计量162022-6-6两个总体均值之差的两个总体均
12、值之差的检验检验 (s s12、 s s22 未知且不相等未知且不相等,小样本小样本)1.检验具有不等方差的两检验具有不等方差的两个总体的均值个总体的均值2.假定假定条件条件n两个样本是独立的随机样本n两个总体都是正态分布n两个总体方差未知且不相等s12 s223.检验检验统计量统计量172022-6-6方差齐性检验(方差齐性检验(Levene F方法):方法):计算两组样本的均值计算两组样本的均值计算各个样本与本组均值的平均离差绝对值;计算各个样本与本组均值的平均离差绝对值;利用单因素方差分析推断两独立总体平均离差绝对值是利用单因素方差分析推断两独立总体平均离差绝对值是否有显著差异。否有显著
13、差异。在对两独立样本进行在对两独立样本进行T检验时,两组样本方差相等和不等检验时,两组样本方差相等和不等时,计算时,计算t值使用的公式不同,所以首先进行方差值使用的公式不同,所以首先进行方差F检验。检验。用户需要用户需要根据根据F检验的结果,自己选择检验的结果,自己选择t检验输出中的结检验输出中的结果果,得出最后结论。,得出最后结论。如果推断两总体方差相等,则看方如果推断两总体方差相等,则看方差相等的差相等的T检验值和检验值和P值;如果推断两总体方差不相等,值;如果推断两总体方差不相等,则看方差不相等的则看方差不相等的T检验值和检验值和P值。值。2022-6-618图图53 独立样本独立样本T
14、检验主对话框检验主对话框从源变量框中选取从源变量框中选取要作检验的变量。要作检验的变量。为分组变量,为分组变量,只能有一个。只能有一个。二、完全窗口分析二、完全窗口分析 按AnalyzeCompare MeansIndependent-Sample T Test顺序,打开Independent- Sample T Test主对话框(如图5-3)2022-6-619在检验变量中含有缺在检验变量中含有缺失值的观测将不被计算。失值的观测将不被计算。在任何一个变量中含在任何一个变量中含有缺失值的观测都将不有缺失值的观测都将不被计算被计算输入置信区输入置信区间,一般取间,一般取90、95、99等。等。图
15、图5-5 Independent-Sample T Test的的Options对话框对话框图图54 Define Groups 主对话框主对话框分别输入分组变量的取值条分别输入分组变量的取值条件,如件,如1为男,为男,2为女等。为女等。输入分界点值,如体重输入分界点值,如体重60公公斤等。斤等。2022-6-620三、例题分析三、例题分析(一) 05-2 某一个新的制造过程可以增加电池的使用寿命,假设电池使用寿命服从正态分布。在新电池中随机抽15个,而在旧电池中随机抽12个同时测试其使用寿命,资料如下,试求新旧两种电池平均寿命之差的95%的置信区间。新电池(日):18.2,10.4,12.6,
16、18.0,11.7, 15.0,24.0,17.6,23.6,24.8,19.3,20.5, 19.8,17.1,16.3旧电池(日):12.1,7.5,8.6,13.9,7.8,15.1,17.9,10.6,13.8,14.2,15.3,11.62022-6-621(二)仍以04-7的资料来说明,要求检验男生和女生血红蛋白平均含量是否相等。1、操作步骤 1)打开数据文件“04-7血红蛋白血红蛋白.sav”。按AnalyzeCompare Means Independent-Sample T Test顺序,打开主对话框。 2)将变量hb选入 Test Variable框。 3)在sex选入Gr
17、ouping Variable框中作为检验变量。 4)打开Define Groups对话框,在Group1输入1, Group2输入2,单击Continue,再单击OK。2022-6-622G Gr ro ou up p S St ta at ti is st ti ic cs s2112.65292.0531.44801910.10951.6989.38981,212HBNMeanStd.DeviationStd. ErrorMean2、结果分析 表5-3 是血红蛋白值的观测量个数、均值、标准差和均值的标准误等统计量。表表5-3 分组统计量分组统计量2022-6-623表表5-4 独立样本独
18、立样本T检验结果检验结果I In nd de ep pe en nd de en nt t S Sa am mp pl le es s T Te es st t.376.5444.24238.0002.5434.59961.32963.75714.28337.722.0002.5434.59381.34093.7458Equal variances assumedEqual variances notassumedHBFSig.Levenes Test forEquality of VariancestdfSig.(2-tailed)MeanDifferenceStd. ErrorDiffer
19、enceLowerUpper95% ConfidenceInterval of theDifferencet-test for Equality of Means 从表5-4可看出,Equal variances assumed 行是假设方差相等进行的检验,当方差相等时考察这一行的结果;Equal variances not assumed行是假设方差不等进行的检验,当方差不等时考察这一行的结果。在Levenes Test for Equality of Variance列中,P值为 0.5440.05,可认为方差是相等的,所以应考察第一行的结果。可看出,P值为 0.0000.05,所以认为均
20、值是不等的。 2022-6-624一、一、 简介简介利用来自两个总体的配对样本,推断两个总体的均值是否存在显著性差异。所谓配对样本,可以是个案在“前”、“后”两种状态下某属性的两种不同特征,也可以是对某事物两个不同侧面的描述。两配对样本的样本容量应该相等,两组样本观察值的顺序一一对应,不能随意改变;样本来自的总体服从或近似服从正态分布。第三节第三节 配对样本配对样本T检验检验2022-6-625二、二、 两配对样本两配对样本T检验的实现思路检验的实现思路提出原假设:两总体均值不存在显著差异;选择检验统计量。两配对样本T检验是间接通过单样本T检验实现的。配对样本T检验实际上是先求出每对观测值之差
21、值,对差值变量求平均。检验配对变量均值之间差异是否显著,实质是检验差值变量的均值与0之间差异的显著性;计算样本统计量观测值和概率P值;根据显著性水平和概率P值进行统计推断。2022-6-626观察序号观察序号样本样本1 1样本样本2 2差值差值1x 11x 21D1 = x 11 - x 212x 12x 22D2 = x 12 - x 22M MM MM MM Mix 1ix 2iDi = x 1i - x 2iM MM MM MM Mnx 1nx 2nDn = x 1n- x 2n三、配对样本的三、配对样本的 t 检验检验 1、数据、数据形式形式2022-6-6272、检验统计量、检验统计
22、量2022-6-628从源变量框中选从源变量框中选取成对变量移入。取成对变量移入。所选变量。所选变量。同图同图55图图56 Paired-Sample T Test 对话框对话框 四、完全窗口分析四、完全窗口分析按AnalyzeCompare MeansPaired-Sample T Test顺序,打开Paired -Sample T Test主对话框(如图5-6)。2022-6-629五、例题分析五、例题分析(一)(一)05-3 为了研究吸烟有害广告对吸烟者减少吸烟量是否有作用。从某吸烟者总体中随机抽取33位吸烟者,调查他们在观看广告前后的每天吸烟量(支),数据如下表。试问影片对他们的吸烟量
23、有无产生作用?请构造观看广告前后吸烟量之差的99%的置信区间。表表5-5 广告前后吸烟量数据广告前后吸烟量数据编号看前X1(支)看后X2(支)编号看前X1(支)看后X2(支)编号看前X1(支)看后X2(支)120181217102313112151513333424242231410142520252225411101584264850512131641402741346161217191028667191518263029913826201916163038279221720312031251110167212718322910119922623328212022-6-630(二)(二)05
24、-4 某单位研究饲料中缺乏维生素E与肝中维生素A含量的关系,将大白鼠按性别、体重等配为8对,每对中两只大白鼠分别喂给正常饲料和维生素E缺乏饲料,一段时期后测定其肝中维生素A含量(mol/L)如下,现在想知道饲料中缺乏维生素E对鼠肝中维生素A含量有无影响。大白鼠配对编号肝中维生素A含量(mol/L)正常饲料组维生素E缺乏组137.225.7220.925.1331.418.8441.433.5539.834.0639.328.3736.126.2831.918.3表表5-6 配对样本配对样本T检验数据检验数据2022-6-6311、操作步骤、操作步骤 1)输入数据并定义变量名:正常饲料组测定值为
25、x1,维生素E缺乏饲料组测定值为x2(数据文件“饲料(配饲料(配对对T检验)检验).sav”。) 2)按AnalyzeCompare MeansPaired-Sample T Test 顺序,打开主对话框。 3)单击变量x1,再单击x2,将x1,x2送入Variables框。左下方Current Selections框中出现Variable1、 Variable2 4)单击OK。2 2、输出结果及分析、输出结果及分析2022-6-632P Pa ai ir re ed d S Sa am mp pl le es s S St ta at ti is st ti ic cs s34.75086.
26、6492.35126.23885.8212.058正常饲料组维生素E缺乏组Pair1MeanNStd.DeviationStd. ErrorMeanP Pa ai ir re ed d S Sa am mp pl le es s C Co or rr re el la at ti io on ns s8.586.127正常饲料组 & 维生素E缺乏组Pair1NCorrelationSig.表表5-6 配对样本配对样本T检验描述统计量检验描述统计量 表5-6可看出,变量x1的均数、标准差、标准误分别为34.750、6.649、2.351,变量x2的均数、标准差、标准误分别为26.238、5.82
27、1、2.058。表表5-7 配对样本配对样本T检验相关性检验相关性 表5-7可看出,本例共有8对观测值,相关系数为0.586,相关系数的显著性检验表明P值为0.127。2022-6-633P Pa ai ir re ed d S Sa am mp pl le es s T Te es st t8.5135.7192.0223.73113.2944.2107.004正常饲料组 - 维生素E缺乏组Pair1MeanStd.DeviationStd. ErrorMeanLowerUpper95% ConfidenceInterval of theDifferencePaired Difference
28、stdfSig.(2-tailed)表表5-8 配对样本配对样本T检验结果检验结果 表5-8说明变量x1 、x2两两相减的差值均数、标准差、差值均数的标准误差分别为8.513、5.719、2.022,95置信区间为3.731 ,13.292。配对检验结果表明t为4.21,自由度为7,P值为0.004,差别在统计上具有高度显著性,即饲料中缺乏维生素E对鼠肝中维生素A含量确有影响。2022-6-634 第六章 方差分析2022-6-635主要内容第一节 方差分析简介第二节 单因素方差分析第三节 多因素方差分析第四节 协方差分析2022-6-636第一节第一节 方差分析简介方差分析简介 方差分析是英
29、国统计学家R. A. Fisher(1890-1962)在进行试验设计时为解释试验数据而首先引入的。方差分析是一种通过分析样本资料各项差异的来源以检验三个以上总体平均数是否相等的统计方法。目前,方差分析方法在各个领域都得到了广泛应用。 方差分析的核心就是方差可分解。即将总变异分解为由随机误差造成的变异(组内SS)与由均数差异造成的变异(组间SS)两个部分。如果后者大于前者,且具有统计学意义,我们将拒绝零假设,即认为总体中均数间存在差异。2022-6-637一、方差分析的作用一、方差分析的作用 在诸多领域的数量分析研究中,找到众多影响因素中重要的影响因素在诸多领域的数量分析研究中,找到众多影响因
30、素中重要的影响因素是非常重要的。比如:在农业生产中,我们总是希望在尽量少的投入成本是非常重要的。比如:在农业生产中,我们总是希望在尽量少的投入成本下得到较高的农作物产量。这就需要首先分析农作物的产量究竟受到哪些下得到较高的农作物产量。这就需要首先分析农作物的产量究竟受到哪些因素的影响。有许多因素会影响农作物的产量,如种子的品种、施肥量、因素的影响。有许多因素会影响农作物的产量,如种子的品种、施肥量、气候、地域等,他们都会给农作物的产量带来或多或少的影响。如果我们气候、地域等,他们都会给农作物的产量带来或多或少的影响。如果我们能够掌握在众多的影响因素中,哪些因素对农作物的产量起到了主要的、能够掌
31、握在众多的影响因素中,哪些因素对农作物的产量起到了主要的、关键性的作用,我们就可以根据实际情况对这些关键因素加以控制。关键性的作用,我们就可以根据实际情况对这些关键因素加以控制。 进一步,在掌握关键影响因素,如品种、施肥量因素等之后,我们还进一步,在掌握关键影响因素,如品种、施肥量因素等之后,我们还要对不同的品种、不同的施肥量条件下的产量进行对比分析,研究究竟哪要对不同的品种、不同的施肥量条件下的产量进行对比分析,研究究竟哪个品种的产量高,施肥量究竟多少最合适,哪种品种与哪种施肥量搭配最个品种的产量高,施肥量究竟多少最合适,哪种品种与哪种施肥量搭配最优,等等。在这些分析研究的基础上,我们就可以
32、计算出各个组合方案的优,等等。在这些分析研究的基础上,我们就可以计算出各个组合方案的成本和收益,并选择最合理的种植方案,主动的在农作物种植过程中对各成本和收益,并选择最合理的种植方案,主动的在农作物种植过程中对各种影响因素加以准确控制,进而获得最理想的效果。种影响因素加以准确控制,进而获得最理想的效果。2022-6-638二、相关概念二、相关概念 1 1、影响因素的分类:在所有的影响因素中根据是否可以人为控制可以分为、影响因素的分类:在所有的影响因素中根据是否可以人为控制可以分为两类,一类是人为可以控制的因素,称为控制因素或控制变量,如种子品两类,一类是人为可以控制的因素,称为控制因素或控制变
33、量,如种子品种的选定,施肥量的多少;另一类因素是认为很难控制的因素,称为随机种的选定,施肥量的多少;另一类因素是认为很难控制的因素,称为随机因素或随机变量,如气候和地域等影响因素。在很多情况下随机因素指的因素或随机变量,如气候和地域等影响因素。在很多情况下随机因素指的是实验过程中的抽样误差。是实验过程中的抽样误差。2 2、控制变量的不同水平:控制变量的不同取值或水平,称为控制变量的不、控制变量的不同水平:控制变量的不同取值或水平,称为控制变量的不同水平。如甲品种、乙品种;同水平。如甲品种、乙品种;1010公斤化肥、公斤化肥、2020公斤化肥、公斤化肥、3030公斤化肥等。公斤化肥等。3 3、观
34、测变量:受控制变量和随机变量影响的变量称为观测变量,如农作物、观测变量:受控制变量和随机变量影响的变量称为观测变量,如农作物的产量等。的产量等。 方差分析就是从观测变量的方差入手,研究诸多控制变量中哪些变量方差分析就是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量以及对观测变量有显著影响的各个控制变是对观测变量有显著影响的变量以及对观测变量有显著影响的各个控制变量其不同水平以及各水平的交互搭配是如何影响观测变量的一种分析方法量其不同水平以及各水平的交互搭配是如何影响观测变量的一种分析方法。2022-6-639三、方差分析的原理 方差分析认为,如果控制变量的不同水平
35、对观测变量产生了显著影响,那么它和随机变量共同作用必然使得观测变量值显著变动;反之,如果控制变量的不同水平没有对观测变量产生显著影响,那么观测变量值的变动就不明显,其变动可以归结为随机变量影响造成的。 建立在观测变量各总体服从正态分布和同方差的假设之上,方差分析的问题就转化为在控制变量不同水平上的观测变量均值是否存在显著差异的推断问题了。 综上所述,方差分析从对观测变量的方差分解入手,通过推断控制变量各水平下各观测变量的均值是否存在显著差异,分析控制变量是否给观测变量带来了显著影响,进而再对控制变量各个水平对观测变量影响的程度进行剖析。 根据控制变量的个数可将方差分析分为单因素方差分析、多因素
36、方差分析;根据观测变量的个数可将方差分析分为一元方差分析(单因变量方差分析)和多元方差分析(多因变量方差分析)。2022-6-640四、方差分析过程四、方差分析过程1、One-Way过程:单因素简单方差分析过程。在Compare Means菜单项中,可以进行单因素方差分析、均值多重比较和相对比较。2、General Linear Model(简称GLM)过程:GLM过程由Analyze菜单直接调用。这些过程可以完成简单的多因素方差分析和协方差分析,不但可以分析各因素的主效应,还可以分析各因素间的交互效应。2022-6-641n在General Linear Model菜单项下有四项:nUniv
37、ariate:提供一个因变量与一个或多个因素变量的方差分析。nMultivariate:可进行多因变量的多因素分析nRepeated Measure:可进行重复测量方差分析nVariance Component:可进行方差成分分析。通过计算方差估计值,可以帮助我们分析如何减小方差。2022-6-642第二节第二节 单因素方差分析单因素方差分析一、简介一、简介 单因素方差分析是检验由单一因素影响的多组样本某因变量的均值是否有显著差异的问题。如果各组之间有显著差异,说明这个因素(分类变量)对因变量是有显著影响的,因素的不同水平会影响到因变量的取值。二、完全窗口分析二、完全窗口分析 按Analyze
38、Compared Means One-Way Anova顺序单击。打开 One-Way Anova主对话框,如图6-1。2022-6-643选入因变选入因变量,可有量,可有多个变量多个变量选入分组变量,选入分组变量,必须满足只取有必须满足只取有限个水平的条件。限个水平的条件。 图图6-1 One-Way Anova主对话框主对话框见图见图 6-2见图见图 6-3见图见图 6-42022-6-644(1)Contrasts选项 Contrasts选项用来实现先验对比检验和趋势检验。 如果进行趋势检验,则应选择Polynomial选项,然后在后面的下拉框中选择趋势检验的方法。其中Linear表示线
39、性趋势检验;Quadratic表示进行二次多项式检验;Cubic表示进行三次多项式检验,4th和5th表示进行四次和五次多项式检验。 如果进行先验对比检验,则应在Coefficients后依次输入系数ci,并确保ci0。应注意系数输入的顺序,它将分别与控制变量的水平值相对应。2022-6-645图图62 Contrasts对话框对话框对组间平方和进行对组间平方和进行多项式分解,并在多项式分解,并在其后的参数框中选其后的参数框中选定阶数。定阶数。 如一阶:如一阶:Linear,二阶:,二阶:Quadratic,三阶:,三阶:Cubic.最高可达最高可达五阶五阶输入多项式各组均值的系数,输入一个系
40、数单击输入多项式各组均值的系数,输入一个系数单击Add按钮,系按钮,系数进入下面方框,依次输入各组均值的系数。数进入下面方框,依次输入各组均值的系数。如果多项式中只包括第一与第四组的均值的系数,必须把第二、如果多项式中只包括第一与第四组的均值的系数,必须把第二、第三个系数输入为第三个系数输入为0。如果只包括第一与第二组的均值,则第三、第四个可不输入。如果只包括第一与第二组的均值,则第三、第四个可不输入。可同时建多个多项式,输入一组后按可同时建多个多项式,输入一组后按Next按钮;如果要修改则按钮;如果要修改则按按Previous按钮,修改后按按钮,修改后按Change按钮,删除按按钮,删除按R
41、emove按钮。按钮。显示每组系显示每组系数的总和。数的总和。2022-6-646(2)Post Hoc选项 Post Hoc选项用来实现多重比较检验。 提供了18种多重比较检验的方法。其中Equal Variances Assumed框中的方法适用于各水平方差齐性的情况。在方差分析中,由于其前提所限,应用中多采用Equal Variances Assumed框中的方法。多重比较检验中,SPSS默认的显著性水平为0.05,可以根据实际情况修改Significance level后面的数值以进行调整。2022-6-647图图63 Post Hoc对话框对话框在此对话框中选择进行多重比较的方法在此
42、对话框中选择进行多重比较的方法1.用用t检验完成组间成对均值的比较,对多重比较错误率不检验完成组间成对均值的比较,对多重比较错误率不 进行调整进行调整2.同上,但通过设置每个检验的误差率来控制整个误差率同上,但通过设置每个检验的误差率来控制整个误差率3.用用t检验完成多重配对比较,为多重比较调整显著值,但检验完成多重配对比较,为多重比较调整显著值,但 比比2的界限要小的界限要小4.对所有可能的组合进行同步进入的均值配对比较对所有可能的组合进行同步进入的均值配对比较5.用用F检验进行多重比较检验进行多重比较6.在在Studentized Range分布下进行多重比较分布下进行多重比较7.用用St
43、udentized Range分布进行所有各组均值间的配对比分布进行所有各组均值间的配对比较较8.用用Studentized Range统计量进行所有组间均值的配对比统计量进行所有组间均值的配对比较较, 用所有配对比较集合的误差率作为试验误差率用所有配对比较集合的误差率作为试验误差率9.同同8,但其临界值是但其临界值是TUKEY和和S-N-K的相应值的平均值的相应值的平均值10.进行配对比较时进行配对比较时,使用的逐步顺序与使用的逐步顺序与Student-Newman- Keuls检验的顺序一样,但并不是给每个检验设定一个检验的顺序一样,但并不是给每个检验设定一个误差率误差率,而是给所有检验的
44、误差率设定一个临界值而是给所有检验的误差率设定一个临界值11.用用Studentized最大系数进行比较检验和范围检验最大系数进行比较检验和范围检验12.用用Studentized最大系数进行配对比较检验最大系数进行配对比较检验13.用用Studentized最大系数进行比较检验最大系数进行比较检验,使用贝叶斯逼近使用贝叶斯逼近14.用用t检验进行配对比较检验进行配对比较1.用用t检验进行配对比较,检验进行配对比较,2.用用Studentized 最大系数进行配对比较检验最大系数进行配对比较检验3.同上同上,这种方法有时比较自由这种方法有时比较自由4.用用Studentized Range统计
45、量进行配对比较检验统计量进行配对比较检验规定显著性水平规定显著性水平,默认为默认为0.052022-6-648(3)Option选项 Option选项用来对方差分析的前提条件进行检验,并可输出其他相关统计量和对缺失数据进行处理。 Homogeneity of variance test选项实现方差齐性检验;Descriptive选项输出观测变量的基本描述统计量;Brown-Forsythe、Welch选项可计算其统计量以检验各组均值的相等性,当方差齐性不成立时应选择使用这两个统计量而不是F统计量。Means Plot选项输出各水平下观测变量均值的折线图;Missing Values框中提供了两
46、种缺失数据的处理方式。2022-6-649图图 64 Options对话框对话框 选择缺失值的处置方式选择缺失值的处置方式:在检验变量中含有缺失值的观测将不被计算在检验变量中含有缺失值的观测将不被计算在任何一个变量中含有缺失值的观测都将不被计算在任何一个变量中含有缺失值的观测都将不被计算规定输出的统计量规定输出的统计量:输出描述统计量输出描述统计量,包括观测量数包括观测量数目目,均值均值,最小值最小值,最大值最大值,标准差标准差,标标准误差准误差,各组中每个因变量均值的各组中每个因变量均值的95%的置信区间的置信区间用用Levene检验进行方差一致性检验进行方差一致性检验检验输输出出均均数数分
47、分布布图图三、例题分析三、例题分析 例1 06-1某灯泡厂用四种不同配料方案制成的灯丝,生产了四批灯泡。每批灯泡中随机抽取若干个灯泡测其使用寿命(单位:小时),数据如表6-1,求四种灯丝的灯泡的使用寿命有无显著差异。2022-6-650表表6-1 灯泡使用寿命灯泡使用寿命 在该例中,设灯泡的使用寿命为因变量,灯丝的配料为因子,四种配料方案为四水平,为单因子四水平的实验。(数据文件:06-1灯灯泡寿命泡寿命.sav) 灯泡灯泡灯丝灯丝12345678甲1600161016501680170017001780乙15001640140017001750丙16401550160016201640160
48、017401800丁1510152015301570164016802022-6-6511、不使用选择项操作步骤、不使用选择项操作步骤1)定义两个变量:Filament变量,取值1、2、3、4分别代表甲、乙、丙、丁,标签为“灯丝”Hours变量其值为灯泡的使用寿命,标签为“灯泡使用寿命”2)按AnalyzeCompared Means One-Way Anova顺序打开“单因素分析”主对话框。3)从源变量框中选取hours进入Dependent List框中;选取filament变量进入Factor框中,单击“OK”运行。4)输出结果及分析2022-6-652A AN NO OV VA AHO
49、URS39776.456313258.8191.638.209178088.93228094.951217865.3825Between GroupsWithin GroupsTotalSum ofSquaresdfMean SquareFSig.表表6-2 灯泡使用寿命的单因素方差分析结果灯泡使用寿命的单因素方差分析结果表6-2说明:第一列:方差来源;第二列:离差平方和;第三列:自由度; 第四列:均方;第五列:F值; 第六列:F统计量的P值。2、使用选择项操作步骤、使用选择项操作步骤1)定义变量和选取变量同1(第1-3步)的操作步骤2022-6-6532)在主对话框中单击“Contrast”
50、,在Contrast对话框中选择多项式比较,选择一次多项式比较各组均值,共指定两组多项式系数:系数依次为1、-1、-1、1,这是检验灯丝对灯泡使用寿命的影响及甲、丁效应和与乙、丙效应和是否有显著差异系数依次为1、-1、1、-1,这是检验灯丝对灯泡使用寿命的影响及甲、丙效应和与乙、丁效应和是否有显著差异3)打开Post Hoc Multiple Comparisons 对话框,选择多重比较:在Equal Variance Assumed栏中选择 LSD和 Duncan在Equal Variance Not Assumed栏中选择 Tamhanes T22022-6-6544)打开Options对