第8章-方差分析课件.pptx

上传人(卖家):三亚风情 文档编号:2915104 上传时间:2022-06-10 格式:PPTX 页数:67 大小:947.18KB
下载 相关 举报
第8章-方差分析课件.pptx_第1页
第1页 / 共67页
第8章-方差分析课件.pptx_第2页
第2页 / 共67页
第8章-方差分析课件.pptx_第3页
第3页 / 共67页
第8章-方差分析课件.pptx_第4页
第4页 / 共67页
第8章-方差分析课件.pptx_第5页
第5页 / 共67页
点击查看更多>>
资源描述

1、第 8 章 方差分析8.1 方差分析方差分析的基本原理的基本原理8.2 单因素方差分析单因素方差分析8.3 双因素方差分析双因素方差分析8.1.1 8.1.1 什么是方差分析?什么是方差分析? 8.1.2 8.1.2 误差分解误差分解 8.1.3 8.1.3 方差分析的基本假定方差分析的基本假定什么是方差分析(ANOVA)?(analysis of variance) 1. 检验多个总体均值是否相等;通过分析观测数据的误差来判断各总体均值是否相等;用方差来衡量误差的大小。2. 研究分类型自变量对数值型因变量的影响; 一个或多个分类自变量u2个或多个 (k 个) 处理水平或分类一个数值型因变量3

2、. 有单因素方差分析和双因素方差分析;单因素方差分析:一个分类自变量双因素方差分析:两个分类自变量yyyy-M-d什么是方差分析? (例题分析)yyyy-M-d什么是方差分析? (例题分析)1.分析“超市位置”和“竞争者数量”对销售额的影响;2.如果只分析超市位置或只分析竞争者数量一个因素对销售额的影响,则称为单因素方差分析单因素方差分析(one-way analysis of variance);3.如果只分析超市位置和竞争者数量两个因素对销售额的单独影响,但不考虑它们对销售额的交互效应交互效应(interaction),则称为只考虑主效应的双因素方差分析;4.如果除了考虑超市位置和竞争者数

3、量两个因素对销售额的单独影响外,还考虑二者对销售额的交互效应,则称为考虑交互效应的双因素方差分析。8.1.2 误差分解8.1 方差分析的基本原理方差分析的基本原理yyyy-M-d方差分析的基本原理(误差分解)1.总误差总误差(total error):反映全部观测数据的误差;所抽取的全部36家超市的销售额之间差异;2.组间组间误差误差(between-group error)处理处理误差误差(treatment error) :由于不同处理造成的误差,它反映了处理(超市位置)对观测数据(销售额)的影响,也叫做系统误差系统误差;3.组内误差组内误差(within-group error) 随机误

4、差随机误差(random error) :由于随机因素造成的误差,也简称为误差误差(error) ;yyyy-M-d方差分析的基本原理(误差分解)1.数据的误差可以用平方和平方和(sum of squares)来表示,常简记为SS; 总平方和总平方和,记为,记为SST;反映全部数据总误差大小的平方和;抽取的全部36家超市销售额之间的误差平方和 组间平方和,记为组间平方和,记为SSA;反映系统误差(处理误差) 大小的平方和;也称为处理平方和(treatment sum of squares)组内平方和,记为组内平方和,记为SSE;反映随机误差大小的平方和;也称为误差平方和(sum of squa

5、res of error)yyyy-M-d方差分析的基本原理(误差分解)总误差总误差总平方和总平方和(SST)系统误差系统误差随机误差随机误差组间平方和组间平方和(SSA)组内平方和组内平方和(SSE)yyyy-M-d方差分析的基本原理(误差分析)1. 方差分析的基本原理,就是要分析数据的总误差中有没有系统误差。 如果超市的不同位置对销售额没有显著影响,意味着没有系统误差。 这时,每种处理所对应的总体均值(i)应该相等。2. 如果存在系统误差,每种处理所对应的总体均值(i)至少有一对不相等;3. 就例8-1而言,在只考虑超市位置一个因素的情况下,方差分析也就是要检验下面的假设:H0 : 1 2

6、 3 H1 : 1 , 2 , 3 不全相等不全相等方差分析的基本原理(方差比较)1.若不同位置对销售额没有影响,则组间方差中只包含随机误差,没有系统误差。这时,组间方差与组内方差经过平均后的数值就应该很接近,它们的比值就会接近1;2.若不同位置对销售额有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差平均后的数值就会大于组内方差平均后的数值,它们之间的比值就会大于1;当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自变量对因变量有影响;yyyy-M-d方差分析的基本假定1.正态性(normality)。每个总体都应服从正态分布,即对于因素的每一个水平

7、,其观测值是来自正态分布总体的简单随机样本;在例8-1中,要求每个位置超市的销售额必须服从正态分布;检验总体是否服从正态分布的方法有很多,包括对样本数据作直方图、茎叶图、箱线图、正态概率图等 ;2.方差齐性(homogeneity variance)。各个总体的方差必须相同,对于分类变量的每个水平,有12=22=k2;在例8-1中,要求不同位置超市的销售额的方差都相同;3.独立性(independence)。每个样本数据是来自因素各水平的独立样本(该假定不满足对结果影响较大);在例8-1中,3个样本数据是来自不同位置超市的3个独立样本;单因素方差分析的数学模型l设因素A有k种处理(比如超市位置

8、有“居民区”、“商业区”、“写字楼”3种),单因素方差分析可用下面的线性模型来表示 :l设总均值为,第i个处理的效应可以用第i个处理的均值与总均值的差表示,记为i,即i=i-;这样,第i个处理均值被分解成i=i+,方差分析模型可以改写为 :ijiijyijiijy8.2 8.2 单因素方差分析单因素方差分析8.2.1数据结构8.2.2分析步骤8.2.3关系强度的测量8.2.4方差分析中的多重比较单因素方差分析的数据结构(one-way analysis of variance) 观测值观测值 ( j )因素因素(A) i 水平水平A1 水平水平A2 水平水平Ak12:n x11 x21 xk1

9、 x12 x22 xk2 : : : : : : : : x1n x2n xkn提出假设1. 一般提法:H0: 1 = 2 = k 自变量对因变量没有显著影响; H1: 1 ,2 , ,k不全相等自变量对因变量有显著影响; 2. 要注意的是: 若拒绝原假设,只是表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等。 构造检验的统计量构造统计量需要计算:各个水平的均值;全部观测值的总均值;各个离差平方和;各个均方(MS,即方差) 。构造检验的统计量(计算水平的均值)1.假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观测值总和除以观测值的个数;2.计

10、算公式为 构造检验的统计量(计算全部观测值的总均值)1.全部观测值的总和除以观测值的总个数;2.计算公式为 构造检验的统计量(计算总离差平方和 SST)1.全部观测值 与总平均值 的离差平方和;2.反映全部观测值的离散状况;3.其计算公式为:构造检验的统计量(计算组间平方和 SSA)1.各组平均值 与总平均值 的离差平方和;2.反映各总体的样本均值之间的差异程度,又称水平项平方和;3.该平方和既包括随机误差,也包括系统误差;4.计算公式为 :构造检验的统计量(计算组内平方和 SSE)1.每个水平或组的各样本数据与其组平均值的离差平方和;2.反映每个样本各观测值的离散状况,又称误差项平方和(或残

11、差平方和);3.该平方和反映的是随机误差的大小;4.计算公式为 :构造检验的统计量(三个平方和的关系)总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和 (SSA) 之间的关系:构造检验的统计量(计算均方MS)1.各误差平方和的大小与观测值的多少有关,为消除观测值多少对误差平方和大小的影响,需要将其平均,这就是均方,均方,即方差;2.计算方法是用误差平方和除以相应的自由度;3.三个平方和对应的自由度分别是:SST 的自由度为n-1,其中n为全部观测值的个数;SSA的自由度为k-1,其中k为因素水平的个数;SSE 的自由度为n-k;构造检验的统计量(计算均方 MS)1. 组间方

12、差:组间方差:SSA的均方,记为MSA,计算公式为:组内方差组内方差SSEMSE构造检验的统计量(计算检验统计量 F )1.将MSA和MSE进行对比,即得到所需要的检验统计量F;2.当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为 n-k 的 F 分布,即 :构造检验的统计量(F分布与拒绝域)单因素方差分析结果(基本结构)yyyy-M-d单因素方差分析(例题分析)拒绝拒绝H0Spss方差分析预处理 分析之前需要将原始数据进行调整; 将超市位置作为一个单独的变量,作为spss是一列; 并对其取值居民区、商业区、写字楼分别进行赋值编码; 保证超市位置的变量类型为数值,度量尺度为名义。y

13、yyy-M-d用SPSS进行方差分析选择【分析-比较均值】,并选择【单因素方差分析ANOVA】;将因变量选入因变量列表框,将影响因素选入因子列表框;点确定;另,使用教材介绍的GLM分析方法;A AN NO OV VA A销售额174008.0287004.00013.357.000214958.0336513.879388966.035Between GroupsWithin GroupsTotalSum ofSquaresdfMean SquareFSig.yyyy-M-d用SPSS进行方差分析(均值图)关系强度的测量 1.拒绝原假设表明因素(自变量)与观测值之间有关系;2.组间平方和(SS

14、A)度量了自变量对因变量的影响效应;实际上,只要组间平方和SSA不等于0,就表明两个变量之间有关系(只是是否显著的问题) ;当组间平方和(SSA)比组内平方和(SSE)大,而且大到一定程度时,就意味着两个变量之间的关系显著;反之,就意味着两个变量之间的关系不显著。关系强度的测量 1.变量间关系的强度用自变量平方和(SSA)及残差平方和(SSE)占总平方和(SST)的比例大小来反映;2.自变量平方和占总平方和的比例记为R2 ,即:3.其平方根R也可以用来测量两个变量之间的关系强度。方差分析中的多重比较(multiple comparison procedures)1.通过对总体均值之间的配对比较

15、来进一步检验到底哪些均值之间存在差异;2.可采用Fisher提出的最小显著性差异最小显著性差异方法,简写为LSD;3. LSD是对检验两个总体均值是否相等的t检验方法的总体方差估计加以修正,即用MSE代替两个总体的方差计算得到的。方差分析中的多重比较(步骤)1.提出假设H0: i = j (第i个总体的均值等于第j个总体的均值)H1: i j (第i个总体的均值不等于第j个总体的均值)2.计算检验的统计量: 3.计算LSD:4. 决策:若 ,拒绝H0; 若 ,不拒绝H0yyyy-M-d多重比较的LSD方法(例题分析)第第1步:步:提出假设检验1:检验2:检验3:第2步:计算检验统计量检验1:检

16、验2:检验3:012112013113023123HHHHHH:,:,:,:12132337942546379260119425260165yyyyyyyyyy-M-d多重比较的LSD方法(例题分析)第第3步:步:计算LSD第第4步:步:做出决策112.0345 6513.8788 ()67.041212LSD 1213234667.0411967.0416567.04yyyyyyyyyy-M-d用SPSS进行多重比较【例例8-3】多重比较多重比较8.3 8.3 双因素方差分析双因素方差分析8.3.1双因素方差分析及其类型8.3.2无交互作用的双因素方差分析8.3.3有交互作用的双因素方差分析

17、双因素方差分析(two-way analysis of variance) 1.分析两个因素(行因素Row和列因素Column)对试验结果的影响; 2.如果两个因素对试验结果的影响是相互独立的,分别判断行因素和列因素对试验数据的影响,这时的双因素方差分析称为无交互作用的双因素方差分析无交互作用的双因素方差分析或无重复双因素方差分析无重复双因素方差分析(Two-factor without replication);3.如果除了行因素和列因素对试验数据的单独影响外,两个因素的搭配还会对结果产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差有交互作用的双因素方差分析分析或可重复双因素

18、方差分析可重复双因素方差分析 (Two-factor with replication );双因素方差分析的基本假定1. 每个总体都服从正态分布;对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本2. 各个总体的方差必须相同;对于各组观测数据,是从具有相同方差的总体中抽取的3. 观测值是独立的;yyyy-M-d双因素方差分析(数学模型)l设因素A有I种处理(比如超市位置有“居民区”、“商业区”、“写字楼”3种处理),因素B有J种处理(比如竞争者数量有0个、1个、2个、3个及以上4种处理),双因素方差分析可用下面的线性模型来表示:ij0ijkijijijyijkijijy无交互作用双

19、因素方差分析 (例题分析)不同品牌的彩电在各地区的销售量数据不同品牌的彩电在各地区的销售量数据 品牌因素品牌因素地区因素地区因素地区地区1地区地区2地区地区3地区地区4地区地区5品牌品牌1品牌品牌2品牌品牌3品牌品牌4365345358288 350368323280 343363353298 340330343260 323333308298 数据结构 数据结构 分析步骤(提出假设)提出假设; 对行因素提出的假设为:H0: 1 = 2 = = i = = k (i为第i个水平的均值)H1: i (i =1,2, , k) 不全相等 对列因素提出的假设为:H0: 1 = 2 = = j = =

20、 r (j为第j个水平的均值)H1: j (j =1,2,r) 不全相等分析步骤(构造检验的统计量)计算平方和(SS);总误差平方和:行因素误差平方和:列因素误差平方和: 随机误差项平方和:分析步骤(构造检验的统计量) 总离差平方和(SST )、水平项离差平方和 (SSR和SSC) 、误差项离差平方和(SSE) 之间的关系:SST = SSR +SSC+SSE 分析步骤(构造检验的统计量)计算均方(MS);各个离差平方和除以相应的自由度;三个平方和的自由度分别是:总离差平方和SST的自由度为kr-1;行因素的离差平方和SSR的自由度为k-1;列因素的离差平方和SSC的自由度为r-1;随机误差平

21、方和SSE的自由度为 (k-1)(r-1); 分析步骤(构造检验的统计量)计算均方(MS);行因素的均方,记为MSR,计算公式为:列因素的均方,记为MSC ,计算公式为:随机误差项的均方,记为MSE ,计算公式为:分析步骤(构造检验的统计量) 计算检验统计量(F);检验行因素的统计量:检验列因素的统计量:分析步骤(统计决策) 将统计量的值F与给定的显著性水平的临界值F进行比较,作出决策;根据给定的显著性水平在F分布表中查找相应的临界值 F ;若FRF ,则拒绝拒绝原假设H0 ,表明均值之间的差异是显著的,即所检验的行因素对观测值有显著影响;若FCF ,则拒绝拒绝原假设H0 ,表明均值之间有显著

22、差异,即所检验的列因素对观测值有显著影响; 双因素方差分析结果(基本结构)双因素方差分析(例题分析)提出假设;对品牌因素提出的假设为:H0: 1=2=3=4 (品牌对销售量没有影响)H1: i (i =1,2, , 4)不全相等(品牌对销售量有影响)对地区因素提出的假设为:H0: 1=2=3=4=5 (地区对销售量没有影响)H1: j (j =1,2,5) 不全相等(地区对销售量有影响)双因素方差分析(例题分析) 结论:结论: FR18.10777F3.4903,拒绝原假设H0,说明彩电的品牌对销售量有显著影响; FC2.100846 F3.2592,不拒绝原假设H0,不能认为销售地区对彩电的

23、销售量有显著影响。差异源差异源SSdfMSFP-valueF crit 行行(品牌品牌)13004.5534334.8518.107779.46E-053.4903 列列(地区地区)2011.74502.9252.1008460.1436653.2592 误差误差2872.712239.3917 总和总和17888.9519yyyy-M-d双因素方差分析在用SPSS中进行双因素方差分析时,需要把多个样本的观测值作为一个变量输入,然后把两个因素分表单列,并与相应的销售额对应;第第1步:步:选择【分析】,并选择【广义线性模型-广义线性模型】进入主对话框;第2步:在模型标签下默认选线性,在响应标签下

24、将因变量选入【因变量】框中,在预测标签中将影响因素选入【因子】框中,在模型标签将两个因子选入模型窗口,需要考虑交互作用时,选上交叉项;第3步:其他标签默认,点击确定; 双因素方差分析(关系强度的测量)1.行平方和(行SS)度量了品牌这个自变量对因变量(销售量)的影响效应;2.列平方和(列SS)度量了地区这个自变量对因变量(销售量)的影响效应;3.这两个平方和加在一起则度量了两个自变量对因变量的联合效应;4.联合效应与总平方和的比值定义为R2:5.其平方根R反映了这两个自变量合起来与因变量之间的关系强度 。双因素方差分析(关系强度的测量)例题分析:品牌因素和地区因素合起来总共解释了销售量差异的8

25、3.94%;其他因素(残差变量)只解释了销售量差异的16.06%;R=0.9162,表明品牌和地区两个因素合起来与销售量之间有较强的相关关系 。yyyy-M-d有交互作用双因素方差分析(例题分析)【 例 8-1】确定超市的位置和竞争者的数量对销售额是否有显著影响:有交互作用双因素方差分析(例题分析)【例例】城市道路交通管理部门为研究不同的路段和不同的时间段对行车时间的影响,让一名交通警察分别在两个路段和高峰期与非高峰期亲自驾车进行试验,通过试验取得共获得20个行车时间(分钟)的数据,如下表。试分析路段、时段以及路段和时段的交互作用对行车时间的影响 。有交互作用情况下的数据结构:行因素行因素(i

26、) 列列因素因素 (j) A1 A2 ArB1 y111 y121 y1r1 : : : : y11m y12m y1rmB2 y211 y221 y2r1 : : : : y21m y22m y2rmBk yk11 yk21 ykr1 : : : : yk1m yk2m ykrm有交互作用双因素方差分析(平方和的计算)设: 为对应于行因素的第i个水平和列因素的第j个 水平的第l层的观测值 ; 为行因素的第i个水平的样本均值 ; 为列因素的第j个水平的样本均值 ; 对应于行因素的第i个水平和列因素的第j个水 平组合的样本均值 ; 为全部n个观测值的总均值 ;有交互作用双因素方差分析(平方和的计算)1.总平方和:2.行变量平方和:3.列变量平方和:4.交互作用平方和:5.误差项平方和:有交互作用双因素分析(方差分析表的结构)本章小结1.方差分析方差分析(ANOVA)的概念的概念2.方差分析方差分析的原理的原理3.方差分析中的基本假设方差分析中的基本假设4.单因素方差分析单因素方差分析5.双因素方差分析双因素方差分析平时作业七 8.3、8.4

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第8章-方差分析课件.pptx)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|