数学建模之方差分析课件.ppt

上传人(卖家):晟晟文业 文档编号:4707173 上传时间:2023-01-03 格式:PPT 页数:68 大小:903.16KB
下载 相关 举报
数学建模之方差分析课件.ppt_第1页
第1页 / 共68页
数学建模之方差分析课件.ppt_第2页
第2页 / 共68页
数学建模之方差分析课件.ppt_第3页
第3页 / 共68页
数学建模之方差分析课件.ppt_第4页
第4页 / 共68页
数学建模之方差分析课件.ppt_第5页
第5页 / 共68页
点击查看更多>>
资源描述

1、第一讲第一讲 方差分析方差分析 1.1 方差分析的概念方差分析的概念 1.2 单因素方差分析单因素方差分析 1.3 有交互作用的双因素方差分析有交互作用的双因素方差分析 1.4 无交互作用的双因素方差分析无交互作用的双因素方差分析 一、问题的引入一、问题的引入 在实际应用中,我们常常会遇到需要对两个在实际应用中,我们常常会遇到需要对两个以及两个以上总体均值是否相等进行检验,从而以及两个以上总体均值是否相等进行检验,从而判断某一种因素对我们所研究的对象是否产生了判断某一种因素对我们所研究的对象是否产生了显著的影响。显著的影响。1.1 1.1 方差分析的概念方差分析的概念 例例1:某饮料生产企业研

2、制出一种新型饮料。饮料:某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期该饮经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况,料的销售情况,饮料的颜色是否对销饮料的颜色是否对销售量产生影响。售量产生影响。该饮料在五家超市的销售情况该饮料在五家超市的销售情况超市超市无色无色粉色粉

3、色 橘黄色橘黄色绿色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8 例例2 某公司为了研究三种不同内容的广告宣传对某种某公司为了研究三种不同内容的广告宣传对某种无季节性的无季节性的大型机械的销售量是否有显著影响,经调查统大型机械的销售量是否有显著影响,经调查统计,一年四个季度的销售量计,一年四个季度的销售量(单位单位:台台)如下如下:A1是强调运输方便性的广告,是强调运输方便性的广告,A2是强调节省燃料的是强调节省燃料的经济性的广告,经济性的广告,A3是强调噪音低的优

4、良性的广告是强调噪音低的优良性的广告.试判断试判断:新闻广告的类型对该种机械的销售量是否有显著影响新闻广告的类型对该种机械的销售量是否有显著影响?若若影响显著,哪一种广告内容为好影响显著,哪一种广告内容为好?广告类型广告类型第一季度第一季度第二季度第二季度第三季度第三季度第四季度第四季度A1A1163176170185A2A2184198179190A3A3206191218224 方差分析:在若干个能够相互比较的资料组中,方差分析:在若干个能够相互比较的资料组中,判别各组资料是否存在差异以及分析差异原因的判别各组资料是否存在差异以及分析差异原因的方法和技术。方法和技术。方差分析方差分析由英国

5、统计学家由英国统计学家R.A.Fisher首创,为纪首创,为纪念念Fisher,方差分析又称,方差分析又称 F 检验检验(F test)。用)。用于推断于推断多个总体均值多个总体均值有无差异有无差异二、基本概念二、基本概念 1.因素又称因子,指需要考察的引起数据变动的主因素又称因子,指需要考察的引起数据变动的主要原因,通常用要原因,通常用A、B、C表示。表示。如:要分析饮料的颜色对销售量是否有影响,颜色如:要分析饮料的颜色对销售量是否有影响,颜色是要检验的因素或因子是要检验的因素或因子.又如:要分析新闻广告的内容对某种机械的销售量又如:要分析新闻广告的内容对某种机械的销售量是否有显著影响,新闻

6、广告类型是所要检验的因素。是否有显著影响,新闻广告类型是所要检验的因素。可以控制可以控制的试验条的试验条件件单因素方差分析:在实验中考察的因素只有一个。单因素方差分析:在实验中考察的因素只有一个。多因素方差分析:多因素方差分析:在实验中考察的因素有两个以上。在实验中考察的因素有两个以上。双因素方差分析:双因素方差分析:在实验中考察的因素有两个。在实验中考察的因素有两个。2.2.水平:水平:因子在实验中的不同状态。因子在实验中的不同状态。如:例如:例1中中橘黄色、粉色、绿色和无色透明橘黄色、粉色、绿色和无色透明四四种颜色就是因素的四个水平。种颜色就是因素的四个水平。3.3.交互影响:交互影响:如

7、果因子间存在相互作用,称之为如果因子间存在相互作用,称之为“交互影响交互影响”;如果因子间是相互独立的,则称;如果因子间是相互独立的,则称为无交互影响。为无交互影响。4.4.观察值:在每个因素不同水平下得到的样本值。观察值:在每个因素不同水平下得到的样本值。如例如例1 1中每种颜色饮料的销售量就是观察值。中每种颜色饮料的销售量就是观察值。三、方差分析的基本思想三、方差分析的基本思想n比较两类误差比较两类误差 以检验均值是否相等以检验均值是否相等n随机误差和系统误差随机误差和系统误差 随机误差:随机误差:在因素的同一水平在因素的同一水平(同一个总体同一个总体)下,下,样本的各观察值之间的差异。样

8、本的各观察值之间的差异。比如,同一种颜色的饮料在不同超市上的销售量比如,同一种颜色的饮料在不同超市上的销售量是不同的。不同超市销售量的差异可以看成是随机因是不同的。不同超市销售量的差异可以看成是随机因素的影响,或者说是由于抽样的随机性所造成的,称素的影响,或者说是由于抽样的随机性所造成的,称为随机误差为随机误差。系统误差:系统误差:在因素的不同水平在因素的不同水平(不同总体不同总体)下,各观下,各观察值之间的差异。察值之间的差异。比如,同一家超市,不同颜色饮料的销售量也是不比如,同一家超市,不同颜色饮料的销售量也是不同的。这种差异可能是由于抽样的随机性所造成的,也同的。这种差异可能是由于抽样的

9、随机性所造成的,也可能是由于颜色本身所造成的,后者所形成的误差是由可能是由于颜色本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差。系统性因素造成的,称为系统误差。n比较的基础是方差比比较的基础是方差比n组内方差、组间方差组内方差、组间方差 组内方差:组内方差:因素的同一水平因素的同一水平(同一个总体同一个总体)下样本下样本数据的方差。数据的方差。比如,无色饮料在比如,无色饮料在5家超市销售数量的方差。组内方家超市销售数量的方差。组内方差只包含随机误差差只包含随机误差 组间方差:组间方差:因素的不同水平因素的不同水平(不同总体不同总体)下各样下各样本之间的方差本之间的方差 比如,

10、例比如,例1中中橘黄色、粉色、绿色和无色橘黄色、粉色、绿色和无色透明透明四种颜色饮料销售量之间的方差。组间四种颜色饮料销售量之间的方差。组间方差既包括随机误差,也包括系统误差。方差既包括随机误差,也包括系统误差。方差的比较方差的比较 如果不同颜色如果不同颜色(水平水平)对销售量对销售量(结果结果)没有影响,没有影响,那么在组间方差中只包含有随机误差,而没有那么在组间方差中只包含有随机误差,而没有系统误差。这时,组间方差与组内方差就应该系统误差。这时,组间方差与组内方差就应该很接近,两个方差的比值就会接近很接近,两个方差的比值就会接近1。如果不同的水平对结果有影响,在组间方差如果不同的水平对结果

11、有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,中除了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组内方差,组间方差与这时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于组内方差的比值就会大于1。当这个比值大到某种程度时,就可以说不同当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异。水平之间存在着显著差异。四、基本假定四、基本假定1.每个总体都应服从每个总体都应服从正态分布正态分布对于因素的每一个水平,其观察值是来自服从正态对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本分布总体的简单随机样本比如,每种颜色饮料的销售量必须服从正态

12、分布比如,每种颜色饮料的销售量必须服从正态分布2.各个总体的各个总体的方差必须相同方差必须相同对于各组观察数据,是从具有相同方差的总体中抽对于各组观察数据,是从具有相同方差的总体中抽取的。取的。比如,四种颜色饮料的销售量的方差都相同。比如,四种颜色饮料的销售量的方差都相同。3.不同水平下的不同水平下的样本相互独立样本相互独立一、数学模型一、数学模型 jAAAAsAjs(,21在水平在水平个水平个水平有有设因素设因素得到如下表得到如下表次独立试验次独立试验进行进行下下,)2(,),2,1 jjnns.的结果的结果表表1观察结果观察结果水平水平样本总和样本总和样本均值样本均值总体均值总体均值1A2

13、AsA11X21X11nX12X22X22nXsX1sX2snsX1 T2 TsT 1 X2 XsX 1 2 s 1.2 单因素方差分析单因素方差分析假设假设;),(),2,1(,),2,1(.1 22221均未知均未知与与的正态总体的正态总体均值分别为均值分别为来自具有相同方差来自具有相同方差下的样本下的样本各个水平各个水平 jjjjnjjjNsjXXXsjAj .2下的样本之间相互独立下的样本之间相互独立不同水平不同水平jA),(2 jijNX 因为因为).,0(2 NXjij所以所以 可写成可写成那么那么表示随机误差表示随机误差记记ijijjijXX,均未知均未知与与独立独立各各.,2,

14、1,2,1 ,),0(,22 jjijijijjijsjniNX单因素试验方差分析的数学模型单因素试验方差分析的数学模型需要解决的问题需要解决的问题.,:,:211210不全相等不全相等ssHH 1.检验假设检验假设.,.2221 s估估计计未未知知参参数数数学模型的等价形式数学模型的等价形式.1,11 sjjjsjjnnnn 记记总平均总平均.,2,1,sjjj .02211 ssnnn .,平均的差异平均的差异平均值与总平均值与总下的总体下的总体表示水平表示水平应应的效的效水平水平jjAA 独立独立各各 .0,2,1,2,1 ,),0(,12sjjjjijijijjijnsjniNX 均未

15、知均未知与与独立独立各各.,2,1,2,1 ,),0(,22 jjijijijjijsjniNX原数学模型原数学模型改写为改写为.,:,:211210不不全全相相等等ssHH 检验假设检验假设等价于等价于检验假设检验假设.,:,0:211210不不全全为为零零ssHH sjniijjXnX111数据的总平均数据的总平均 sjniijTjXXS112)(总离差平方和总离差平方和(总变差总变差)jniijjjXnX11下下的的样样本本平平均均值值水水平平jA二、平方和的分解二、平方和的分解 sjniijTjXXS112)(sjnijjijjXXXX112)()(sjnijsjnijijjjXXXX

16、112112)()(sjnijjijjXXXX11)(20 sjnijsjnijijTjjXXXXS112112)()(AESS sjnijijEjXXS112)(误差(残差)平方和误差(残差)平方和 sjjjsjnijAXXnXXSj12112)()(212XnXnsjjj 组间离差平方和组间离差平方和(效应平方和效应平方和)组内平方和组内平方和 ST是全部观察值与总平均值的离差平方和,反映是全部观察值与总平均值的离差平方和,反映全部观察值的离散状况,从而反映了全部数据总全部观察值的离散状况,从而反映了全部数据总的误差程度。的误差程度。SA既包括随机误差,也包括系统误差,反映的是既包括随机误

17、差,也包括系统误差,反映的是随机误差和系统误差的大小。随机误差和系统误差的大小。sjniijTjXXS112)(sjjjsjnijAXXnXXSj12112)()(总误差平方和总误差平方和=组间误差平方和组间误差平方和+组内误差平方和组内误差平方和 如果组间方差明显高于组内方差,说明样本数据如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因子是引起波动的主要波动的主要来源是组间方差,因子是引起波动的主要原因,可认为因子对实验的结果存在显著的影响;原因,可认为因子对实验的结果存在显著的影响;反之,如果波动的主要部分来自组内方差,则因反之,如果波动的主要部分来自组内方差,则因子

18、的影响就不明显,没有充足理由认为因子对实验或子的影响就不明显,没有充足理由认为因子对实验或抽样的结果有显著作用。抽样的结果有显著作用。判断因子的不同水平是否对其观察值有影响,实判断因子的不同水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小。际上就是比较组间方差与组内方差之间差异的大小。检验这种差异,需要构造一个用于检验的统计量检验这种差异,需要构造一个用于检验的统计量。TAESSS),(),1(/,22220snSsSHEA 为真时为真时因为因为,0为真时为真时所以所以 H).,1()()1(22snsFsnSsSEA )()1(snSsSEA 检验假设检验假设.,:,

19、0:211210不全为零不全为零ssHH ).,1()()1(snsFsnSsSFEA 拒绝域为拒绝域为组间均组间均方差方差组内均组内均方差方差ASES三、假设检验三、假设检验单因素试验方差分析表单因素试验方差分析表方差来源方差来源因素因素A误差误差总和总和平方和平方和自由度自由度 均方均方F比比ASESTS1 ssn 1 n1 sSSAAsnSSEE EASSF ,1,111 sjniijniijjjjXTsjXT记记,2112nTXSsjniijTj .ATESSS ,212nTnTSsjjjA 四、单因素方差分析的四、单因素方差分析的Matlab实现实现p=anova1(X,group)

20、输入:输入:X是一个向量,从第一个总体的样本到第是一个向量,从第一个总体的样本到第r个总个总体的样本依次排列,体的样本依次排列,group是与是与X有相同长度的向量,有相同长度的向量,表示表示X中的元素是如何分组的中的元素是如何分组的.group中某元素等于中某元素等于i,表示表示X中这个位置的数据来自第中这个位置的数据来自第i个总体个总体.因此因此group中中分量必须取正整数,从分量必须取正整数,从1直到直到r.p=anova1(X)%比较比较X中各列数据的均值是否相等中各列数据的均值是否相等此时输出的此时输出的p是零假设成立时,数据的概率,当是零假设成立时,数据的概率,当p0.05称差异

21、是显著的,当称差异是显著的,当p0.01称差异是高度显著的称差异是高度显著的.输入输入X各列的元素相同,即各总体的样本大小相等,各列的元素相同,即各总体的样本大小相等,称为均衡数据的方差分析,不均衡时用下面的命令称为均衡数据的方差分析,不均衡时用下面的命令例例1 某水产研究所为了比较四种不同配合饲料对某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼鱼的饲喂效果,选取了条件基本相同的鱼20尾,尾,随机分成四组,投喂不同饲料,经一个月试验以随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。后,各组鱼的增重结果列于下表。表表1 饲喂不同饲料的鱼的增(单

22、位:饲喂不同饲料的鱼的增(单位:10g)饲料饲料鱼的增重(鱼的增重(xij)A131.927.931.828.435.9A224.825.726.827.926.2A322.123.627.324.925.8A427.030.829.024.528.5四种不同饲料对鱼的增重效果是否显著四种不同饲料对鱼的增重效果是否显著?解:这是单因素均衡数据的方差分析,解:这是单因素均衡数据的方差分析,Matlab程序程序如下:如下:A=31.9 27.9 31.8 28.4 35.9 24.8 25.7 26.8 27.9 26.2 22.1 23.6 27.3 24.9 25.8 27.0 30.8 29

23、.0 24.5 28.5;%原始数据输入原始数据输入 B=A;%将矩阵转置将矩阵转置,Matlab中要求各列为不同水平中要求各列为不同水平p=anova1(B)运行后得到一表一图,表是方差分析表(重要);运行后得到一表一图,表是方差分析表(重要);图是各列数据的盒子图,离盒子图中心线较远的对应于图是各列数据的盒子图,离盒子图中心线较远的对应于较大的较大的F值,较小的概率值,较小的概率p.SourceSource方差来源方差来源SSSS平方和平方和dfdf自由度自由度MSMS均方差均方差F F统计量统计量P P值值ColumnsColumns(因素因素A A组间组间)SSSSA Ar-1r-1S

24、S/(r-1)SS/(r-1)7.147.140.00290.0029ErrorError误差误差(组内)(组内)SSSSE En-rn-rSS/(n-rSS/(n-r)TotalTotal总和总和SSSST Tn-1n-1表中所列出的各项意义如下:表中所列出的各项意义如下:因为因为p=0.00291时,时,anova2还返回第三个还返回第三个p值:值:H0AB:因素:因素A与因素与因素B没有交互效应。没有交互效应。解释:解释:如果任意一个如果任意一个p p值接近于值接近于0 0,则认为相关的零假,则认为相关的零假 设不成立。设不成立。由于燃料和推进器对应的由于燃料和推进器对应的p p值均大于值均大于0.050.05,所以可,所以可以接受零假设以接受零假设H0AH0A和和H0BH0B,认为燃料和推进器对火箭的,认为燃料和推进器对火箭的射程没有显著影响。射程没有显著影响。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(数学建模之方差分析课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|