1、SPSSSPSS实验五 SPSS的方差分析方差分析概述方差分析概述单因素方差分析单因素方差分析多因素方差分析多因素方差分析协方差分析协方差分析SPSSSPSS第一节第一节 方差分析概述方差分析概述 在科学实验中常常要探讨在科学实验中常常要探讨不同实验条件或处理方不同实验条件或处理方法对实验结果的影响法对实验结果的影响。通常是比较不同实验条件。通常是比较不同实验条件下下总体均值总体均值间的差异间的差异 举例举例u医学界研究几种药物对某种疾病的疗效;医学界研究几种药物对某种疾病的疗效;u农业研究土壤、肥料、日照时间等因素对某种农作物农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响产量的影响
2、u不同饲料对牲畜体重增长的效果等不同饲料对牲畜体重增长的效果等u不同广告形式、地区规模等因素对广告效果的影响等不同广告形式、地区规模等因素对广告效果的影响等 都可以使用方差分析方法去解决都可以使用方差分析方法去解决SPSSSPSS 方差分析方差分析是检验多个总体均值是否相等一是检验多个总体均值是否相等一种方法种方法。本质上是。本质上是研究分类型自变量对数研究分类型自变量对数值型因变量的影响。值型因变量的影响。方差分析概念方差分析概念控制因素控制因素(控制变量控制变量):在方差分析中,所要检验的在方差分析中,所要检验的对对象象称为因素。其常为一个或多个离散型的分类变量。称为因素。其常为一个或多个
3、离散型的分类变量。水平:因素的不同类别或不同取值水平:因素的不同类别或不同取值为因素的不同水平。为因素的不同水平。因素的每一个水平可以看作一个整体。因素的每一个水平可以看作一个整体。观测因素(观测变量):观测因素(观测变量):在进行方差分析时,每个控在进行方差分析时,每个控制因素水平下得到的样本数据。制因素水平下得到的样本数据。几个基本概念几个基本概念SPSSSPSS 方差分析中判断总体均值是否相等一般是方差分析中判断总体均值是否相等一般是通过对数据变异来源的分析判断得到。通过对数据变异来源的分析判断得到。变异来源有两种情况:变异来源有两种情况:控制因素和随机因控制因素和随机因素素。随机误差随
4、机误差:在同一因素下的观察值由于抽:在同一因素下的观察值由于抽样的随机性造成的误差(抽样误差)。样的随机性造成的误差(抽样误差)。控制因素控制因素:控制变量不同而造成的变异。:控制变量不同而造成的变异。方差分析基本原理方差分析基本原理SPSSSPSS 数据变异用离均差数据变异用离均差平方和平方和表示。表示。组内误差(组内误差(随机误差随机误差)数据误差数据误差 组间误差组间误差(系统误差系统误差)衡量同一水衡量同一水平下样本数平下样本数据的误差据的误差衡量控制变量不同造成衡量控制变量不同造成的变差的变差SPSSSPSS 方差分析的方差分析的核心是方差可分解核心是方差可分解。这里的方。这里的方差
5、是指通过计算各观测值偏离均值的平方差是指通过计算各观测值偏离均值的平方和再除以和再除以n-1得到。这样,在给定得到。这样,在给定n的情况的情况下,方差就是离差平方和,简称下,方差就是离差平方和,简称SST。观察量的总平方和观察量的总平方和SST分解为组间离差平方分解为组间离差平方和和SSA和组内误差平方和和组内误差平方和SSE,即:即:SST=SSA+SSESPSSSPSS 由误差来源的分析得知,判断分类型自变由误差来源的分析得知,判断分类型自变量对数值型因变量受否有影响,就是量对数值型因变量受否有影响,就是检验检验数值型变量存在差异的原因数值型变量存在差异的原因。如果这种差。如果这种差异主要
6、是异主要是系统误差系统误差,则分类型变量对该数,则分类型变量对该数值存在值存在显著影响显著影响,否则差异不显著。否则差异不显著。根据统计学原理,根据统计学原理,组间均方和组内均方的组间均方和组内均方的比值构成比值构成F分布。给定显著性水平,通过和分布。给定显著性水平,通过和F分布统计量的概率分布统计量的概率P的比较的比较,推出总体均,推出总体均值是否存在显著差异。值是否存在显著差异。SPSSSPSS方差分析一般应满足方差分析一般应满足3个基本假设,即要求个基本假设,即要求:l各个总体应服从正态分布各个总体应服从正态分布l各个总体的方差相同各个总体的方差相同l观测值是独立的。观测值是独立的。SP
7、SSSPSS第二节 单因素方差分析u单因素方差分析的基本思想单因素方差分析的基本思想u单因素方差分析的数学模型单因素方差分析的数学模型u单因素方差分析的基本步骤单因素方差分析的基本步骤u单因素方差分析的基本操作单因素方差分析的基本操作u单因素方差分析的应用举例单因素方差分析的应用举例u单因素方差分析的进一步分析及应用单因素方差分析的进一步分析及应用SPSSSPSS单因素方差分析的基本思想单因素方差分析的基本思想 单因素方差分析研究的是单因素方差分析研究的是一个分类型自变一个分类型自变量量对对一个数值型因变量一个数值型因变量的影响。的影响。例如:学历是对工资收入的影响。例如:学历是对工资收入的影
8、响。概念概念SPSSSPSS 明确观测变量和控制变量明确观测变量和控制变量 eg:前面例子中前面例子中观测量观测量是收入是收入 控制变量控制变量是学历是学历 剖析观测变量的方差剖析观测变量的方差 比较观测变量总离差平方和各部分的比例比较观测变量总离差平方和各部分的比例如果组间离差平方和所占比例较大,则说明观测变量的变如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起的,否则,则不是。动主要是由控制变量引起的,否则,则不是。基本思想基本思想SSTSSASSE211()inkijijSSTxx21()kiiiSSAn xx211()inkijiijSSExxSPSSSPSS单
9、因素方差分析的数学模型单因素方差分析的数学模型ijiijx(1,2,.,)iiaik11kiik(1,2,.,;1,2,.)ijiijxaik jr(1,2,.,;1,2,.)ik jr在水平在水平A Ai i下的第下的第j j次试验的样本值次试验的样本值 可以定义为:可以定义为:ijx单因素方差分析的数学模型为单因素方差分析的数学模型为SPSSSPSS单因素方差分析的基本步骤单因素方差分析的基本步骤(1)建立原假设和备择假设建立原假设和备择假设。(2)构造统计量)构造统计量其中,n为总体数目012:KH112:,KH 不全相等/(1)(1,)/()MSASSA kFF knkMSESSEnk
10、SPSSSPSS(3)计算统计量的观测值和概率)计算统计量的观测值和概率P值值(4)给定显著性水平,得出结论。)给定显著性水平,得出结论。当当 拒绝原假设,即认为控制变量不同水拒绝原假设,即认为控制变量不同水平下观测变量各总体的均值存在显著差异;平下观测变量各总体的均值存在显著差异;当当 时,则不能拒绝原假设,即认为控制变时,则不能拒绝原假设,即认为控制变量不同水平下观测变量各总体的均值没有显著差量不同水平下观测变量各总体的均值没有显著差异异ppSPSSSPSS单因素方差分析的基本操作及应用举例单因素方差分析的基本操作及应用举例以广告城市与销售额以广告城市与销售额.sav为例为例分析分析比较均
11、值比较均值单因素单因素AVOVAAVOVA广告形式对销售额的单因素方差分析广告形式对销售额的单因素方差分析方法方法一一SPSSSPSSSPSSSPSSSPSSSPSS因为因为F F值对应的概率值对应的概率P P值小于值小于0.050.05,所以拒绝原假设,即认为不同广告形所以拒绝原假设,即认为不同广告形式对销售额有显著差异。式对销售额有显著差异。SPSSSPSS方法二方法二比较均值比较均值分析分析均值均值SPSSSPSSSPSSSPSSSPSSSPSS单因素单因素方差分方差分析一定析一定要选上要选上SPSSSPSSSPSSSPSS5.2.5单因素方差进一步分析 一、方差齐性检验 对控制变量不同
12、水平下各观测变量总体方差是否相等进行分析(方差分析前提条件)二、多重比较检验 如果控制变量确实对观测变量产生了显著影响,进一步应确定控制变量的不同水平对观测变量的影响程度如何,其中哪个水平的作用显著区别其它水平。其构造检验统计量的方法有LSD方法、bonferroni方法、tukey方法、scheffe方法、s-n-k方法等。三、其它检验先验对比检验、趋势检验SPSSSPSS单因素方差分析的进一步分析单因素方差分析的进一步分析进一步进一步分析分析SPSSSPSSSPSSSPSS方差相等时的一些多重比较方法即最小显著性差异法。即最小显著性差异法。用用T检验完成组间成对检验完成组间成对均值的比较。
13、检验的敏感度较高,即使是均值的比较。检验的敏感度较高,即使是各个水平间的均值存在细微差别也有可能各个水平间的均值存在细微差别也有可能被检验出来,但此方法对第一类弃真错误被检验出来,但此方法对第一类弃真错误不进行控制和调整不进行控制和调整LSDLSD方法方法SPSSSPSS 即修正最小显著性差异法。即修正最小显著性差异法。用用T检验完成组间成检验完成组间成对均值的比较,但通过设置每个检验的误差率来对均值的比较,但通过设置每个检验的误差率来控制整个误差率。因此采用此方法看到的显著值控制整个误差率。因此采用此方法看到的显著值是多重比较完成后的调整值。是多重比较完成后的调整值。用用q检验完成各水平下检
14、验完成各水平下观测值个数相等观测值个数相等时组间成对时组间成对均值的比较。一定程度可以保证犯一类错误的概均值的比较。一定程度可以保证犯一类错误的概率总体上不增大。率总体上不增大。BonferroniBonferroni方法方法TukeyTukey方法方法SPSSSPSS 当各当各水平下观测值个数不相等,或者想进水平下观测值个数不相等,或者想进行复杂的比较时,或对所有可能的组合进行复杂的比较时,或对所有可能的组合进行同步比较时,可选用此方法行同步比较时,可选用此方法。这种检验。这种检验被用来检验组间均值的所有可能的线性组被用来检验组间均值的所有可能的线性组合,而不只是成对组合,并控制整体显著合,
15、而不只是成对组合,并控制整体显著性水平为性水平为0.05。这种方法相对比较保守,有。这种方法相对比较保守,有时候方差分析时候方差分析F值有显著性,用该方法进行值有显著性,用该方法进行两两比较却找不出差异。两两比较却找不出差异。ScheffeScheffe方法方法SPSSSPSS 目的是寻找同质子集,简单地说,各组均目的是寻找同质子集,简单地说,各组均值首先按从小到大的顺序排列,然后根据值首先按从小到大的顺序排列,然后根据多重比较结果将所有的组分为若干个子集,多重比较结果将所有的组分为若干个子集,子集之间的各组间有差别(子集之间的各组间有差别(P值小于值小于0.05),),子集之内的各组间无差别
16、。子集之内的各组间无差别。S-N-KS-N-K方法方法SPSSSPSS其他检验SPSSSPSS趋势检验趋势检验问题:分析不同问题:分析不同地区地区的销售额总体上是否会随着地的销售额总体上是否会随着地区人口密度的减少(地区编号大人口密度低)而呈区人口密度的减少(地区编号大人口密度低)而呈现某种变化趋势(现某种变化趋势(SPSSSPSS先验对先验对比检验比检验所有系数之所有系数之和为和为0 0在多重比较分析后得知宣传品广告效果最差,其在多重比较分析后得知宣传品广告效果最差,其余略有差异(先验的结论)。这里可以对报纸、余略有差异(先验的结论)。这里可以对报纸、广播和体验的整体效果进行进一步的对比分析
17、。广播和体验的整体效果进行进一步的对比分析。SPSSSPSS单因素方差分析应用举例的进一步单因素方差分析应用举例的进一步分析分析以广告城市与销售额以广告城市与销售额.sav为例为例不同广告形式下销售额不同广告形式下销售额总体方差齐性检验总体方差齐性检验SPSSSPSS因为因为P P值大于值大于0.050.05,所以不能拒绝原假设,所以不能拒绝原假设,即认为方差齐性即认为方差齐性SPSSSPSSSPSSSPSS多重比较检验多重比较检验(分析哪种广告形式作用明显)(分析哪种广告形式作用明显)SPSSSPSSSPSSSPSS广告形式多重比较检验的相似性子集广告形式多重比较检验的相似性子集此方此方法在
18、法在相似相似性子性子集划集划分中分中用得用得最多最多SPSSSPSS趋势检验趋势检验(分析销售额是否会随着地区(分析销售额是否会随着地区人口密度减少而呈现出某种趋势)人口密度减少而呈现出某种趋势)SPSSSPSSSPSSSPSS因为因为F F值对应的概率值对应的概率P P值小于值小于0.050.05,所,所以拒绝原假设,即认为地区和销售额以拒绝原假设,即认为地区和销售额之间不是零线性相关之间不是零线性相关SPSSSPSS先验对比检验先验对比检验SPSSSPSS因为因为T T值对应的概率值对应的概率P P值大于值大于0.050.05,所以不能拒绝原假设,即认为报纸所以不能拒绝原假设,即认为报纸广
19、告的效果与广播、体验的总体效广告的效果与广播、体验的总体效果没有显著差异果没有显著差异SPSSSPSS练习 对四个服务行业的服务质量进行评价,较高对四个服务行业的服务质量进行评价,较高得分表示较高的服务质量。对航空公司、得分表示较高的服务质量。对航空公司、零售业、旅馆业和汽车制造业进行的评定零售业、旅馆业和汽车制造业进行的评定数据见四种不同行业评价得分数据见四种不同行业评价得分.sav。在显著。在显著性水平性水平=0.05下,检验四种行业质量等级的下,检验四种行业质量等级的总体均值是否差异显著?你的结论如何?总体均值是否差异显著?你的结论如何?SPSSSPSS第三节 多因素方差分析 在上一节课
20、,我们已经研究了不同在上一节课,我们已经研究了不同广告广告形式形式对产品销售有显著影响,对产品销售有显著影响,不同地区不同地区的的产品销售额也存在显著差异,然而,产品销售额也存在显著差异,然而,不同不同广告形式和不同地区的搭配广告形式和不同地区的搭配是否会对销售是否会对销售额产生影响呢?而额产生影响呢?而哪种搭配方式哪种搭配方式又可以获又可以获得得最理想的销售业绩最理想的销售业绩呢?呢?问题引出问题引出SPSSSPSS本节主要内容u多因素方差分析的基本思想多因素方差分析的基本思想u多因素方差分析的数学模型多因素方差分析的数学模型u多因素方差分析的基本步骤多因素方差分析的基本步骤u多因素方差分析
21、的基本操作多因素方差分析的基本操作u多因素方差分析的应用举例多因素方差分析的应用举例u多因素方差分析的进一步分析及应用多因素方差分析的进一步分析及应用SPSSSPSS多因素方差分析的基本思想多因素方差分析的基本思想 多因素方差分析用来研究多因素方差分析用来研究两个及两个以两个及两个以上控制变量上控制变量是否是否对观测变量对观测变量产生显著影响。产生显著影响。它不仅能分析多个因素对观测变量的它不仅能分析多个因素对观测变量的独立独立影响影响,更能够分析多个控制因素的更能够分析多个控制因素的交互作交互作用用能否对观测变量的分布产生显著影响,能否对观测变量的分布产生显著影响,进而找到有利于观测变量的最
22、优组合。进而找到有利于观测变量的最优组合。概念概念SPSSSPSSu确定观测变量和若干个控制变量确定观测变量和若干个控制变量u剖析观测变量的方差剖析观测变量的方差u比较观测变量总离差平方和和各部分所占比较观测变量总离差平方和和各部分所占的比例的比例基本思想基本思想SPSSSPSS剖析观测变量的方差剖析观测变量的方差第一,控制变量独立作第一,控制变量独立作用的影响用的影响第二,控制变量交互作第二,控制变量交互作用的影响用的影响第三,第三,随机因素的影响随机因素的影响211()krAijiijSSTSSASSBSSABSSESSAnxx211()rkBijiijSSBnxx2111()ijnrkA
23、BijkijijkSSExxSSTSSA SSB SSCSSAB SSBCSSABCSSESPSSSPSS多因素方差分析的数学模型多因素方差分析的数学模型 设控制变量设控制变量A有有k个水平,个水平,B有有r个水平,每个水平,每个交叉水平下均有个交叉水平下均有l个样本,则在控制变量个样本,则在控制变量A的水平的水平Ai和控制变量和控制变量B的水平的水平Bj下的第下的第k个样本值个样本值 定义为:定义为:ijkx()ijkijijijkxabab(1,2,.;1,2.,;1,2.,)ik jr kl多因素方差多因素方差分析的饱分析的饱和模型和模型SPSSSPSS多因素方差分析的基本步骤多因素方差
24、分析的基本步骤 提出零假设提出零假设 选择检验统计量选择检验统计量012121112:00()()()0kkkrHaaabbbababab112121112:,00()()()0kkkrHa aabbbababab不全为,不全为,不全为/(1)/(1)/(1)/(1)/(1)(1)/(1)ABABSSA kMSAFSSE kr lMSESSBrMSBFSSE kr lMSESSABkrMSABFSSE kr lMSE/(1)/(1)(1)/(1)/(1)(1)ABSSA kMSAFSSABkrMSABSSBrMSAFSSABkrMSAB固定固定效效应应模模型型随机效应模型随机效应模型SPSSS
25、PSS 计算检验统计量观测值和概率计算检验统计量观测值和概率P值值 给出显著性水平给出显著性水平 ,并作出统计决策,并作出统计决策(1)若)若FA的概率的概率p ,则拒绝原假设,即认,则拒绝原假设,即认为控制变量为控制变量A的不同水平对观测变量产生了的不同水平对观测变量产生了显著影响。显著影响。(2)FB的概率的概率p ,则拒绝原假设,即认为,则拒绝原假设,即认为控制变量控制变量B的不同水平对观测变量产生了显著的不同水平对观测变量产生了显著影响。影响。(3)FAB的概率的概率p ,则拒绝原假设,即认为则拒绝原假设,即认为控制变量控制变量A、B的交互作用对观测变量产生了的交互作用对观测变量产生了
26、显著影响,然后再依此对显著影响,然后再依此对A、B的效应进行检的效应进行检验验SPSSSPSS多因素方差分析的基本操作多因素方差分析的基本操作以广告城市与销售额以广告城市与销售额.sav为例为例分析分析一般线性模型一般线性模型单变量单变量SPSSSPSSSPSSSPSSSPSSSPSS因为概率P小于0.05,所以拒绝原假设,即认为线性模型对观测变量有一定的解释作用后面的几个概率中,除了交互作用中概率大于后面的几个概率中,除了交互作用中概率大于0.05外,其余的全小于外,其余的全小于0.05,说明除了交互作,说明除了交互作用差异不显著外,其它的都显著用差异不显著外,其它的都显著SPSSSPSS多
27、因素方差分析的进一步分析l两因素的非饱和模型:SST=SSA+SSB+SSEl三因素的非饱和模型:SST=SSA+SSB+SSC+SSABC+SSE多因素方差分析的非饱和模型多因素方差分析的非饱和模型多因素方差分析的其他功能多因素方差分析的其他功能l 均值检验均值检验l 模型分析模型分析SPSSSPSS多因素方差分析的进一步分析的操作多因素方差分析的进一步分析的操作以广告城市与销售额以广告城市与销售额.sav为例为例建立建立非饱和非饱和模型模型SPSSSPSSSPSSSPSS均值比较的操作均值比较的操作SPSSSPSSSPSSSPSSSPSSSPSSSPSSSPSSSPSSSPSSSPSSSP
28、SSSPSSSPSS练习 某教学实验中,采用不同的教学方法和某教学实验中,采用不同的教学方法和不同的教材进行教学实验,获得一系列数不同的教材进行教学实验,获得一系列数据,现在分析不同教学方法和不同教材对据,现在分析不同教学方法和不同教材对教改成绩的影响,数据附在文件夹教改成教改成绩的影响,数据附在文件夹教改成绩绩.sav。要求:进行均值的多重比较,方法。要求:进行均值的多重比较,方法选用选用LSD法,得出教改成绩多因素方差分法,得出教改成绩多因素方差分析的饱和模型表和非饱和模型表,并得出析的饱和模型表和非饱和模型表,并得出教学方法和教材的交互作用图。教学方法和教材的交互作用图。SPSSSPSS
29、第四节 协方差分析 问题引出:问题引出:在分析不同的饲料对生猪增重是否产生在分析不同的饲料对生猪增重是否产生显著差异时,如果仅仅是分析饲料的作用,显著差异时,如果仅仅是分析饲料的作用,即用单因素方差分析来进行,而不考虑生即用单因素方差分析来进行,而不考虑生猪自身各自不同的身体条件(比如猪最初猪自身各自不同的身体条件(比如猪最初时的体重)时,得出的结论很可能是片面时的体重)时,得出的结论很可能是片面的,不准确的。这时,如何才能准确地反的,不准确的。这时,如何才能准确地反映不同饲料对生猪体重的影响呢?映不同饲料对生猪体重的影响呢?SPSSSPSSu协方差分析的基本思路协方差分析的基本思路u协方差分
30、析的数学模型协方差分析的数学模型u协方差分析的基本操作协方差分析的基本操作u协方差分析的应用举例协方差分析的应用举例 本节主要内容本节主要内容SPSSSPSS协方差分析的基本思路协方差分析的基本思路基本概念基本概念 协方差分析是指将那些协方差分析是指将那些很难人为控制很难人为控制的控制因素作为协变量的控制因素作为协变量,并在排除协变量,并在排除协变量对观测变量影响的条件下,分析控制变量对观测变量影响的条件下,分析控制变量对观测变量的作用,从而更加准确地对控对观测变量的作用,从而更加准确地对控制变量进行评价。制变量进行评价。SPSSSPSS 基本同方差分析的基本思想基本同方差分析的基本思想,除此
31、之外,除此之外,考虑了考虑了协变量协变量的影响,认为观察变量的变的影响,认为观察变量的变化受四个方面的影响:化受四个方面的影响:即控制变量的独立即控制变量的独立作用,控制变量的交互作用,协变量的作作用,控制变量的交互作用,协变量的作用和随机因素的作用用和随机因素的作用,并在扣除协变量的,并在扣除协变量的影响后,再分析控制变量对观测变量的影影响后,再分析控制变量对观测变量的影响。响。协方差分析的基本思想协方差分析的基本思想SPSSSPSS 方差分析中的零假设是:方差分析中的零假设是:协变量对观测变协变量对观测变量的线性影响不显著量的线性影响不显著;在协变量影响扣除;在协变量影响扣除的条件下,控制变量各水平下观测变量的的条件下,控制变量各水平下观测变量的总体均值无显著差异,控制变量各水平对总体均值无显著差异,控制变量各水平对观测变量的效应同时为零观测变量的效应同时为零。用。用F统计量进行统计量进行检验。检验。SPSSSPSS协方差分析的数学模型协方差分析的数学模型 单因素协方差分析的数学模型是:ijiijijxazSPSSSPSS协方差分析的基本操作协方差分析的基本操作以生猪与饲料以生猪与饲料.sav为例为例SPSSSPSSSPSSSPSSSPSSSPSSSPSSSPSSSPSSSPSSSPSSSPSSSPSSSPSSSPSSSPSS
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。