ImageVerifierCode 换一换
格式:PPT , 页数:77 ,大小:893.05KB ,
文档编号:3941250      下载积分:28 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-3941250.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(晟晟文业)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(假设检验与方差分析OK课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

假设检验与方差分析OK课件.ppt

1、第六章第六章 假设检验与方差分析假设检验与方差分析第一节第一节 假设检验的基本原理假设检验的基本原理 第二节第二节 总体均值的假设检验总体均值的假设检验 第三节第三节 总体比例的假设检验总体比例的假设检验 第四节第四节 单因子方差分析单因子方差分析第五节第五节 双因子方差分析双因子方差分析第六节第六节 Excel在假设检验与方差在假设检验与方差 分析中的应用分析中的应用第一节第一节 假设检验的基本原理假设检验的基本原理一一 什么是假设检验什么是假设检验二二 原假设与备择假设原假设与备择假设三三 检验统计量检验统计量四四 显著性水平、显著性水平、P-值与临界值值与临界值五五 双侧检验和单侧检验双

2、侧检验和单侧检验六六 假设检验的两类错误假设检验的两类错误七七 关于假设检验结论的理解关于假设检验结论的理解一、什么是假设检验一、什么是假设检验先举一个例子先举一个例子:例例6-1:假定咖啡的分袋包装生产线的装袋重量服从:假定咖啡的分袋包装生产线的装袋重量服从正态分布正态分布N(,2)。生产线按每袋净重。生产线按每袋净重150克的技术克的技术标准控制操作。现从生产线抽取简单随机样本标准控制操作。现从生产线抽取简单随机样本n=100袋,测得其平均重量为袋,测得其平均重量为 =149.8克,样本标克,样本标准差准差S=0.872克。问该生产线的装袋净重的期望值是克。问该生产线的装袋净重的期望值是否

3、为否为150克(即问生产线是否处于控制状态)克(即问生产线是否处于控制状态)?X所谓假设检验,就是事先对总体的参数或总体分布所谓假设检验,就是事先对总体的参数或总体分布形式做出一个假设,然后利用抽取的样本信息来判形式做出一个假设,然后利用抽取的样本信息来判断这个假设(原假设)是否合理,即判断总体的真断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否存在显著的系统性差异,所以实情况与原假设是否存在显著的系统性差异,所以假设检验又被称为显著性检验。假设检验又被称为显著性检验。一个完整的假设检验过程,包括以下几个步骤:一个完整的假设检验过程,包括以下几个步骤:(1)提出假设;)提出假设;

4、(2)构造适当的检验统计量,并根据样本计)构造适当的检验统计量,并根据样本计 算统计量的算统计量的具体数值;具体数值;(3)规定显著性水平,建立检验规则;)规定显著性水平,建立检验规则;(4)做出判断。)做出判断。二、原假设与备择假设二、原假设与备择假设原假设一般用原假设一般用H0表示,通常是设定总体参数等于某表示,通常是设定总体参数等于某值,或服从某个分布函数等;备择假设是与原假设值,或服从某个分布函数等;备择假设是与原假设互相排斥的假设,原假设与备择假设不可能同时成互相排斥的假设,原假设与备择假设不可能同时成立。所谓假设检验问题实质上就是要判断立。所谓假设检验问题实质上就是要判断H0是否正

5、是否正确,若拒绝原假设确,若拒绝原假设H0,则意味着接受备择假设,则意味着接受备择假设H1。如在例如在例6-1中,我们可以提出两个假设:假设平均袋中,我们可以提出两个假设:假设平均袋装咖啡重量与所要控制的标准没有显著差异,记为装咖啡重量与所要控制的标准没有显著差异,记为H0:=150;假设平均袋装咖啡重量与所要控制的;假设平均袋装咖啡重量与所要控制的标准有显著差异,记为标准有显著差异,记为H1:150。三、检验统计量三、检验统计量所谓检验统计量,就是根据所抽取的样本计算的用所谓检验统计量,就是根据所抽取的样本计算的用于检验原假设是否成立的随机变量。于检验原假设是否成立的随机变量。检验统计量中应

6、当含有所要检验的总体参数,以便检验统计量中应当含有所要检验的总体参数,以便在在“总体参数等于某数值总体参数等于某数值”的假定下研究样本统计的假定下研究样本统计量的观测结果。量的观测结果。检验统计量还应该在检验统计量还应该在“H0成立成立”的前提下有已知的的前提下有已知的分布,从而便于计算出现某种特定的观测结果的概分布,从而便于计算出现某种特定的观测结果的概率。率。例例6-2 构造例构造例6-1的检验统计量的检验统计量,并计算相应的样本观测值。并计算相应的样本观测值。四、显著性水平、四、显著性水平、P-值与临界值值与临界值小概率事件在单独一次的试验中基本上不会发生,小概率事件在单独一次的试验中基

7、本上不会发生,可以不予考虑。可以不予考虑。在假设检验中,我们做出判断时所依据的逻辑是:在假设检验中,我们做出判断时所依据的逻辑是:如果在原假设正确的前提下,检验统计量的样本观如果在原假设正确的前提下,检验统计量的样本观测值的出现属于小概率事件,那么可以认为原假设测值的出现属于小概率事件,那么可以认为原假设不可信,从而否定它,转而接受备择假设。不可信,从而否定它,转而接受备择假设。至于小概率的标准是多大?这要根据实际问题而定。至于小概率的标准是多大?这要根据实际问题而定。假设检验中,称这一标准为显著性水平,用来表示假设检验中,称这一标准为显著性水平,用来表示,在应用中,通常取,在应用中,通常取

8、=0.01,=0.05。一般来说,。一般来说,犯第一类错误可能造成的损失越大,犯第一类错误可能造成的损失越大,的取值应当的取值应当越小。越小。对假设检验问题做出判断可依据两种规则:一是对假设检验问题做出判断可依据两种规则:一是P-值规则;二是临界值规则。值规则;二是临界值规则。(一)(一)P-值规则值规则 所谓所谓P-值,实际上是检验统计量超过值,实际上是检验统计量超过(大于或小于大于或小于)具体样本观测值的概率。如果具体样本观测值的概率。如果P-值小于所给定的显值小于所给定的显著性水平,则认为原假设不太可能成立;如果著性水平,则认为原假设不太可能成立;如果P-值值大于所给定的标准,则认为没有

9、充分的证据否定原大于所给定的标准,则认为没有充分的证据否定原假设。假设。例例6-3假定假定 =0.05,根据例,根据例6-2的结果,计算该问题的的结果,计算该问题的P-值,并做出判断。值,并做出判断。解:查标准正态概率表,当解:查标准正态概率表,当z=2.29时,阴影面积为时,阴影面积为0.9890,尾部面积为,尾部面积为10.9890=0.011,由对称性可知,由对称性可知,当当z=2.29时,左侧面积为时,左侧面积为0.011。0.011/2=0.0250.011这个数字意味着,假若我们反复抽取这个数字意味着,假若我们反复抽取n=100的的样本,在样本,在100个样本中仅有可能出现一个使检

10、验统个样本中仅有可能出现一个使检验统计量等于或小于计量等于或小于2.29的样本。该事件发生的概率小的样本。该事件发生的概率小于给定的显著性水平,所以,可以判断于给定的显著性水平,所以,可以判断=150的假的假定是错误的,也就是说,根据观测的样本,有理由定是错误的,也就是说,根据观测的样本,有理由表明总体的表明总体的 与与150克的差异是显著存在的。克的差异是显著存在的。(二)临界值规则(二)临界值规则假设检验中,还有另外一种做出结论的方法:根据假设检验中,还有另外一种做出结论的方法:根据所提出的显著性水平标准(它是概率密度曲线的尾所提出的显著性水平标准(它是概率密度曲线的尾部面积)查表得到相应

11、的检验统计量的数值,称作部面积)查表得到相应的检验统计量的数值,称作临界值,直接用检验统计量的观测值与临界值作比临界值,直接用检验统计量的观测值与临界值作比较,观测值落在临界值所划定的尾部(称之为拒绝较,观测值落在临界值所划定的尾部(称之为拒绝域)内,便拒绝原假设;观测值落在临界值所划定域)内,便拒绝原假设;观测值落在临界值所划定的尾部之外(称之为不能拒绝域)的范围内,则认的尾部之外(称之为不能拒绝域)的范围内,则认为拒绝原假设的证据不足。这种做出检验结论的方为拒绝原假设的证据不足。这种做出检验结论的方法,我们称之为临界值规则。法,我们称之为临界值规则。显然,显然,P-值规则和临界值规则是等价

12、的。在做检验值规则和临界值规则是等价的。在做检验的时候,只用其中一个规则即可。的时候,只用其中一个规则即可。P-值规则较之临界值规则具有更明显的优点。这主值规则较之临界值规则具有更明显的优点。这主要是:第一,它更加简捷;第二,在值规则的检验要是:第一,它更加简捷;第二,在值规则的检验结论中,对于犯第一类错误的概率的表述更加精确。结论中,对于犯第一类错误的概率的表述更加精确。推荐使用推荐使用P-值规则。值规则。例例6-4假定假定=0.05,根据例,根据例6-2的结果,用临界值规则做出的结果,用临界值规则做出判断。判断。解:查表得到,临界值解:查表得到,临界值z0.025=1.96。由于。由于 z

13、=2.29 1.96,即,检验统计量的观测值落在临,即,检验统计量的观测值落在临界值所划定的左侧(即落在拒绝域),因而拒绝界值所划定的左侧(即落在拒绝域),因而拒绝=150克的原假设。上面的检验结果意味着,由样克的原假设。上面的检验结果意味着,由样本数据得到的观测值的差异提醒我们:装袋生产线本数据得到的观测值的差异提醒我们:装袋生产线的生产过程已经偏离了控制状态,正在向装袋重量的生产过程已经偏离了控制状态,正在向装袋重量低于技术标准的状态倾斜。低于技术标准的状态倾斜。五、双侧检验和单侧检验五、双侧检验和单侧检验 图图6-1 双侧、单侧检验的拒绝域分配双侧、单侧检验的拒绝域分配/21 /2Z/2

14、 Z/2(a)双侧检验 Z 0(b)左侧检验 0 Z(c)右侧检验 表表6-1 拒绝域的单、双侧与备择假设之间的对应关系拒绝域的单、双侧与备择假设之间的对应关系拒绝域拒绝域位置位置P-值检验的显著值检验的显著性水平判断标准性水平判断标准原假设原假设备择假设备择假设双侧双侧/2H0:0H1:0左单侧左单侧 H0:0H1:0六、假设检验的两类错误六、假设检验的两类错误显著性检验中的第一类错误是指:原假设事实上正显著性检验中的第一类错误是指:原假设事实上正确,可是检验统计量的观测值却落入拒绝域,因而确,可是检验统计量的观测值却落入拒绝域,因而否定了本来正确的假设。这是弃真的错误。发生第否定了本来正确

15、的假设。这是弃真的错误。发生第一类错误一类错误 的概率在双侧检验时是两个尾部的拒绝的概率在双侧检验时是两个尾部的拒绝域面积之和;在单侧检验时是单侧拒绝域的面积。域面积之和;在单侧检验时是单侧拒绝域的面积。显著性检验中的第二类错误是指:原假设事实上不显著性检验中的第二类错误是指:原假设事实上不正确,而检验统计量的观测值却落入了不能拒绝域,正确,而检验统计量的观测值却落入了不能拒绝域,因而没有否定本来不正确的原假设,这是取伪的错因而没有否定本来不正确的原假设,这是取伪的错误。发生第二类错误的概率误。发生第二类错误的概率 是把来自是把来自=1(10)的的总体的样本值代入检验统计量所得结果落入接受域总

16、体的样本值代入检验统计量所得结果落入接受域的概率。的概率。根据不同的检验问题,对于根据不同的检验问题,对于 和和 大小的选择有不同大小的选择有不同的考虑。例如,在例的考虑。例如,在例6-1中,如果检验者站在卖方的中,如果检验者站在卖方的立场上,他较为关心的是不要犯第一类错误,即不立场上,他较为关心的是不要犯第一类错误,即不要发生产品本来合格却被错误地拒收这样的事情,要发生产品本来合格却被错误地拒收这样的事情,这时,这时,要较小。反之,如果检验者站在买者的立要较小。反之,如果检验者站在买者的立场上,他关心的是不要把本来不合格的产品误当作场上,他关心的是不要把本来不合格的产品误当作合格品收下,也就

17、是说,最好不要犯第二类错误,合格品收下,也就是说,最好不要犯第二类错误,因此,因此,要较小。要较小。在样本容量在样本容量n不变的条件下,犯两类错误的概率常不变的条件下,犯两类错误的概率常常呈现反向的变化,要使常呈现反向的变化,要使 和和 都同时减小,除非增都同时减小,除非增加样本的容量。为此,统计学家奈曼与皮尔逊提出加样本的容量。为此,统计学家奈曼与皮尔逊提出了一个原则,即在控制犯第一类错误的概率了一个原则,即在控制犯第一类错误的概率 情况情况下,尽量使犯第二类错误的概率下,尽量使犯第二类错误的概率 小。在实际问题小。在实际问题中,我们往往把要否定的陈述作为原假设,而把拟中,我们往往把要否定的

18、陈述作为原假设,而把拟采纳的陈述本身作为备择假设,只对犯第一类错误采纳的陈述本身作为备择假设,只对犯第一类错误的概率的概率 加以限制,而不考虑犯第二类错误的概率加以限制,而不考虑犯第二类错误的概率 。七、关于假设检验结论的理解七、关于假设检验结论的理解这就是说,在假设检验中,相对而言,当原假设被这就是说,在假设检验中,相对而言,当原假设被拒绝时,我们能够以较大的把握肯定备择假设的成拒绝时,我们能够以较大的把握肯定备择假设的成立。而当原假设未被拒绝时,我们并不能认为原假立。而当原假设未被拒绝时,我们并不能认为原假设确实成立。设确实成立。第二节第二节 总体均值的假设检验总体均值的假设检验一一 单个

19、总体均值的检验单个总体均值的检验二二 双总体均值是否相等的检验双总体均值是否相等的检验一、单个总体均值的检验一、单个总体均值的检验(一)总体为正态分布,总体方差已知(一)总体为正态分布,总体方差已知 来自总体的样本为来自总体的样本为(x1,x2,xn)。对于假设:。对于假设:H0:=0,在,在H0成立的前提下,有检验统计量成立的前提下,有检验统计量 02(0,1)ZNnX(二)总体分布未知,总体方差已知,大样本(二)总体分布未知,总体方差已知,大样本 来自总体的样本为来自总体的样本为(x1,x2,xn)。对于假设:。对于假设:H0:=0,在,在H0成立的前提下,如果样本足够大成立的前提下,如果

20、样本足够大(n30),近似地有检验统计量),近似地有检验统计量 02(0,1)ZNnX(三)总体为正态分布,总体方差未知(三)总体为正态分布,总体方差未知来自总体的样本为来自总体的样本为(x1,x2,xn)。对于假设:。对于假设:H0:=0,在,在H0成立的前提下,有检验统计量成立的前提下,有检验统计量 若自由度若自由度(n-1)30,该,该t统计量近似服从标准正态分统计量近似服从标准正态分布。布。02(1)Stt nnX(四)总体分布未知,总体方差未知,大样本(四)总体分布未知,总体方差未知,大样本来自总体的样本为来自总体的样本为(x1,x2,xn)。对于假设:。对于假设:H0:=0,在,在

21、H0成立的前提下,如果总体偏斜适度,成立的前提下,如果总体偏斜适度,且样本足够大,近似地有检验统计量且样本足够大,近似地有检验统计量2(0,1)0SX-mZNn例例6-5 某厂采用自动包装机分装产品,假定每包产品的重某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为量服从正态分布,每包标准重量为1000克,某日随克,某日随机抽查机抽查9包,测得样本平均重量为包,测得样本平均重量为986克,样本标准克,样本标准差是差是24克。试问在克。试问在=0.05的显著性水平上,能否认的显著性水平上,能否认为这天自动包装机工作正常?为这天自动包装机工作正常?解:解:第一步:确定原假设

22、与备择假设。第一步:确定原假设与备择假设。H0:=1000,H1:1000第二步:构造出检验统计量,计算检验统计量的观测值。第二步:构造出检验统计量,计算检验统计量的观测值。由于总体标准差未知,用样本标准差代替,相应检验统由于总体标准差未知,用样本标准差代替,相应检验统计量是计量是t-统计量。统计量。75.192410009860nsXt第三步:确定显著性水平,确定拒绝域第三步:确定显著性水平,确定拒绝域=0.05,查,查t-分布表分布表(自由度自由度n-1=8),得临界值是得临界值是t0.025(8)=2.306,拒绝域是,拒绝域是 2.306。第四步:判断。第四步:判断。由于由于 2.30

23、6,检验统计量的样本观测值落入接受域,检验统计量的样本观测值落入接受域,所以不能拒绝。样本数据没有充分说明这天的自动包装所以不能拒绝。样本数据没有充分说明这天的自动包装机工作不正常。机工作不正常。tt二、双总体均值是否相等的检验二、双总体均值是否相等的检验(一)两个正态总体,方差相等(但未知)(一)两个正态总体,方差相等(但未知)为检验两个总体均值是否相等,我们提出原假设为检验两个总体均值是否相等,我们提出原假设H0:1=2。可以证明,在原假设成立的条件下,。可以证明,在原假设成立的条件下,以下检验统计量服从自由度为以下检验统计量服从自由度为n1+n2-2的的t-分布。即分布。即当当n1+n2

24、-2 30时,上述检验统计量近似服从标准正时,上述检验统计量近似服从标准正态分布。态分布。12122211221212211112XXtt nnnSnSnnnn(二)两个正态总体,方差不相等(也未知)(二)两个正态总体,方差不相等(也未知)这时,使用检验统计量这时,使用检验统计量 12221212XXtSS+nn (三)两个非正态总体,样本量足够大(三)两个非正态总体,样本量足够大 那么,只要那么,只要n1和和n2都足够大,在原假设都足够大,在原假设H0:1=2成成立的条件下,以下检验统计量近似服从标准正态分立的条件下,以下检验统计量近似服从标准正态分布。布。12221212XXZSS+nn例

25、例6-6某工厂为了比较两种装配方法的效率,分别组织了某工厂为了比较两种装配方法的效率,分别组织了两组员工,每组两组员工,每组9人,一组采用新的装配方法,另人,一组采用新的装配方法,另外一组采用旧的装配方法。假设两组员工设备的装外一组采用旧的装配方法。假设两组员工设备的装配时间均服从正态分布,两总体的方差相等但未知。配时间均服从正态分布,两总体的方差相等但未知。现有现有18个员工的设备装配时间见表个员工的设备装配时间见表6-2,根据这些数,根据这些数据,是否有理由认为新的装配方法更节约时间?据,是否有理由认为新的装配方法更节约时间?(显著性水平(显著性水平0.05)表表6-2 两组员工设备的装配

26、时间两组员工设备的装配时间 单位:小时单位:小时 新方法(新方法(x2)353129253440273231旧方法(旧方法(x1)323735384144353134解:原假设与备择假设如下:解:原假设与备择假设如下:H0:旧旧-新新 0H1:旧旧-新新 0 该题属于两个正态总体,方差相等(但未知)的情该题属于两个正态总体,方差相等(但未知)的情况。因此,可利用下式计算检验统计量。况。因此,可利用下式计算检验统计量。1222112212121111236.333331.55562.33978 17.5+8 20.027829+9-29xxtnsnsnnnn查表可知,显著性水查表可知,显著性水平

27、为平为0.05、自由度为、自由度为16的单侧临界值为的单侧临界值为1.7459。t 统计量的样统计量的样本观测值本观测值2.33971.7459,因此,因此应拒绝原假设,即认应拒绝原假设,即认为新的装配方法更节为新的装配方法更节约时间。约时间。第三节第三节 总体比例的假设检验总体比例的假设检验一一 单个总体比例的假设检验单个总体比例的假设检验二二 两个总体的比例是否相等的检验两个总体的比例是否相等的检验一、单个总体比例的假设检验一、单个总体比例的假设检验 例例6-7一项调查结果声称,某市小学生每月零花钱达到一项调查结果声称,某市小学生每月零花钱达到200元的比例为元的比例为40%,某科研机构为

28、了检验这个调,某科研机构为了检验这个调查是否可靠,随机抽选了查是否可靠,随机抽选了100名小学生,发现有名小学生,发现有47人每月零花钱达到人每月零花钱达到200元,调查结果能否证实早先元,调查结果能否证实早先调查调查40%的看法?(的看法?(=0.05)解:由条件充分大,可以利用正态近似的公式进行解:由条件充分大,可以利用正态近似的公式进行计算。计算。H0:=40%H0:40%确定拒绝域临界值确定拒绝域临界值z0.025=1.96,Z显著水显著水平标准平标准 =0.05,所以不能拒绝,所以不能拒绝H0,即没有得到足以表明,即没有得到足以表明四种配方的饲料下小鸡增重水平有差异的显著证据。四种配

29、方的饲料下小鸡增重水平有差异的显著证据。临界值规则:根据给定的显著水平临界值规则:根据给定的显著水平 =0.05,查表得临界,查表得临界值为值为F0.05(3,17)=3.20。因。因F=1.063.20,检验统计量的样本,检验统计量的样本值落入接受域,所以不能拒绝值落入接受域,所以不能拒绝H0,即没有得到足以表明,即没有得到足以表明四种配方的饲料下小鸡增重水平有差异的显著证据。四种配方的饲料下小鸡增重水平有差异的显著证据。表表6-4 方差分析表方差分析表变异变异来源来源离差离差平方和平方和自由度自由度均方差均方差F值值P-值值临界值临界值组间组间7112.14332370.7141.0123

30、20.4115733.196774组内组内39811.67172341.863总计总计46923.8120三、关于方差分析的两点说明三、关于方差分析的两点说明(一)方差分析中变量的类型(一)方差分析中变量的类型方差分析中的因变量是数量型变量。自变量可以是品质方差分析中的因变量是数量型变量。自变量可以是品质型变量,也可以是数量型变量。当自变量是数量型变量型变量,也可以是数量型变量。当自变量是数量型变量的时候,也要对其作统计分组设计,也就是将它按品质的时候,也要对其作统计分组设计,也就是将它按品质型变量来处理。型变量来处理。(二)总体的正态性和同方差(二)总体的正态性和同方差方差分析适用于多个正态

31、总体方差分析适用于多个正态总体Yi(i=1,2,m)均值的均值的比较,且要求它们具有相同的方差。不过在实际应用中,比较,且要求它们具有相同的方差。不过在实际应用中,即使对于正态性和同方差性都存在很大背离的数据,方即使对于正态性和同方差性都存在很大背离的数据,方差分析仍不失为一种提供有用的近似信息的技术。差分析仍不失为一种提供有用的近似信息的技术。第五节第五节 双因子方差分析双因子方差分析一一 问题的提出问题的提出 二二 有交互作用的双因子方差分析有交互作用的双因子方差分析一、问题的提出一、问题的提出方差分析中的方差分析中的“因子因子”,也称因素。它是一个独立,也称因素。它是一个独立的变量(自变

32、量)。在上一节的例子中,我们要分的变量(自变量)。在上一节的例子中,我们要分析饲料是否为影响增重产生差异的原因,所以饲料析饲料是否为影响增重产生差异的原因,所以饲料是因子。该例中所考察的因子只有是因子。该例中所考察的因子只有“饲料饲料”一个,一个,而其他因子如鸡的品种,饲养条件等保持不变,我而其他因子如鸡的品种,饲养条件等保持不变,我们称这种方差分析为单因子方差分析。如果要同时们称这种方差分析为单因子方差分析。如果要同时考察饲料和鸡的品种两个因子对小鸡的增重是否有考察饲料和鸡的品种两个因子对小鸡的增重是否有影响,则称之为双因子方差分析。影响,则称之为双因子方差分析。表表6-5 二因子有重复观测

33、数据表二因子有重复观测数据表 B因子的各种处理因子的各种处理Bj B1B2BcA因因子子的的各各种种处处理理 AiA1y111y121y1c1y11n11y12n12y1cn1cAryr11yr21yrc1yr1nrlyr2nr2yrcnrc在这里要注意,不能把在这里要注意,不能把A的的r个处理和个处理和B的的c个处理看个处理看成成“随机样本随机样本”。现在的。现在的rc个处理是个处理是rc个总体,即个总体,即Ai和和Bj的每一种搭配形成的组格都是一个总体(随的每一种搭配形成的组格都是一个总体(随机变量机变量Yij)。对一个组格总体的)。对一个组格总体的nij个观测个观测yij1,yij2,y

34、ijnij 才是随机样本。才是随机样本。我们把我们把Ai与与Bj的搭配所形成的组格总体即随机变量的搭配所形成的组格总体即随机变量Yij的期望值记作的期望值记作 ij,于是可以写出与表,于是可以写出与表6-5(样本)(样本)相应的总体期望值表如表相应的总体期望值表如表6-6。表表6-6 组格总体期望值表组格总体期望值表 B因子的各种处理因子的各种处理Bj 平均平均B1B2BcA因子因子的各的各种处种处理理 AiA1 11 12 1c 1.A2 21 22 2c 2.Ar r1 r2 rc r.平均平均 .1 .2 .c .11iijjcc 11rjijir .1111111.rcrcijijij

35、ijrcrc 一般的双因子方差分析的任务是:一般的双因子方差分析的任务是:检查因子检查因子A对变量对变量Y是否显著地有影响;也就是要检查因是否显著地有影响;也就是要检查因子子A的各种处理对的各种处理对Y的作用是否显著地有差别;或者说,的作用是否显著地有差别;或者说,也就是要检查各个也就是要检查各个 i.是否显著地不相等。是否显著地不相等。检查因子检查因子B对的变量对的变量Y是否显著地有影响;也就是要检查是否显著地有影响;也就是要检查因子因子B的各种处理对的各种处理对Y的作用是否显著地有差别;或者说,的作用是否显著地有差别;或者说,也就是要检查各个也就是要检查各个 .j是否显著地不相等。是否显著

36、地不相等。检查因子检查因子A和因子和因子B的交互作用对变量的交互作用对变量Y是否显著地有影是否显著地有影响;也就是要检查因子响;也就是要检查因子A的的r种处理与因子种处理与因子B的的c种处理的种处理的各种搭配下的交互作用对各种搭配下的交互作用对Y的作用是否显著地有差别。如的作用是否显著地有差别。如果事先已经得知因子果事先已经得知因子A 和因子和因子B相互独立并无交互作用。相互独立并无交互作用。则不必对此项进行检验。此时的方差分析称为无交互作则不必对此项进行检验。此时的方差分析称为无交互作用的双因子方差分析。用的双因子方差分析。相应地可以建立以下三个原假设:相应地可以建立以下三个原假设:备择假设

37、是上述原假设所列全相等的各项备择假设是上述原假设所列全相等的各项“不全相不全相等等”。rH2101:cH2102:03:()()ijijH二、有交互作用的双因子方差二、有交互作用的双因子方差 分析分析 样本数据的方差分析恒等式:样本数据的方差分析恒等式:SST=SSA+SSB+SSAB+SSE式中,式中,SST是总离差平方和,是总离差平方和,SSA 是是A因子处理间的离差平方和,因子处理间的离差平方和,SSB 是是B因子处理间的离差平方和,因子处理间的离差平方和,SSAB 是是AB交互作用处理间的离差平方和,交互作用处理间的离差平方和,SSE 是组格内离差平方和。是组格内离差平方和。2().i

38、jkijkyySST2.().iijkyySSA2.().jijkyySSB2.().ijijijkyyyySSAB2.ijkijijkyySSE()以上式中的各种样本平均数定义为:以上式中的各种样本平均数定义为:总样本平均数总样本平均数 组格样本平均数组格样本平均数 A因子各组处理样本平均数因子各组处理样本平均数B因子各组处理样本平均数因子各组处理样本平均数 式中,式中,r是是A因子处理的种类,因子处理的种类,c是是B因子处理的种类因子处理的种类,nij 是是第第ij个组格总体所包含的样本观测值个数。个组格总体所包含的样本观测值个数。ricjijnkijkijyrcny1111ijnkijk

39、ijijyny1.1.11ciijjyyc.11rjijiyyr将各种总离差平方和分别除以各自的自由度,可得将各种总离差平方和分别除以各自的自由度,可得到相应于各离差平方和来源的方差。即到相应于各离差平方和来源的方差。即 ricjijn111SSTMST总总方方差差1rASSAMSA因子处理间方差因子处理间方差1cBSSBMSB因子处理间方差因子处理间方差)1)(1(crABSABMAB交交互互作作用用处处理理间间方方差差 ricjijrcn11SSEMSE组组格格内内方方差差分别针对前面给出的三个原假设可建立下列检验统分别针对前面给出的三个原假设可建立下列检验统计量计量(1)针对)针对H01

40、:(2)针对)针对H02:(3)针对)针对H03:11/(1)(1)/()MSASSAMSESSEArcijijrFF rnrc11/(1)(1)/()MSBSSBMSESSEBrcijijcFF cnrc)1)(1()()1)(1(11 crFrcncrFricjijABSSESABMSEMAB例例6-10 为了分析光照因素为了分析光照因素A与噪音因素与噪音因素B对工人生产有无影对工人生产有无影响,光照效应与噪音效应有交互作用,在此两因素响,光照效应与噪音效应有交互作用,在此两因素不同的水平组合下做试验,结果如表不同的水平组合下做试验,结果如表6-7(表中数据(表中数据为产量,单位:件)为产

41、量,单位:件)1B2B3B1A2A3A4A表表6-7因素因素BB1B2B3因因素素AA1151517191916161821A2171717151515192222A3151716181716181818A4182020151617171717解:设定以下三对假设:解:设定以下三对假设:H01:光照因素:光照因素A对产量没有显著影响;对产量没有显著影响;H11:光照因素:光照因素A对产量有显著影响。对产量有显著影响。H02:噪音因素:噪音因素B对产量没有显著影响;对产量没有显著影响;H12:噪音因素:噪音因素B对产量有显著影响。对产量有显著影响。H03:光照效应与噪音效应没有交互作用;:光照效

42、应与噪音效应没有交互作用;H13:光照效应与噪音效应有交互作用。:光照效应与噪音效应有交互作用。将表将表6-7的数据输入的数据输入Excel,进行,进行“有重复双因素分有重复双因素分析析”。Excel输出的方差分析表如下:输出的方差分析表如下:表表6-8 方差分析表方差分析表 差异源差异源SS离差平方和离差平方和Df自由度自由度MS方差方差FF统计量统计量P-valueP-值值F crit临界值临界值(B因素因素)28.388889214.19449.462960.000933.40283(A因素因素)2.083333330.694440.462960.710773.00879交互交互63.8

43、33333610.63897.092590.00022.50819内部内部36241.5总计总计130.3055635从上表可知:从上表可知:FA=0.46296 F0.05(2,24)=3.40283,拒绝,拒绝H02,有充分,有充分证据说明噪音对产量有显著影响;证据说明噪音对产量有显著影响;FAB=7.09259F0.05(6,24)=2.50819,拒绝,拒绝H03,有充分,有充分证据说明光照与噪音存在交互作用并由此对产量产证据说明光照与噪音存在交互作用并由此对产量产生显著影响。生显著影响。第六节第六节 Excel在假设检验与方差分析在假设检验与方差分析 中的应用中的应用一一 假设检验假

44、设检验 二二 方差分析方差分析 一、假设检验一、假设检验【例【例6-11】使用例】使用例6-1的数据进行假设检验的数据进行假设检验(=0.05,双侧检验)。,双侧检验)。解:操作步骤如下。解:操作步骤如下。(1)构造工作表,见)构造工作表,见图图6-2。图中方框内为计算所。图中方框内为计算所得数据,方框外为原始输入数据。得数据,方框外为原始输入数据。(2)计算检验统计量)计算检验统计量Z。在。在B6单元格输入公式单元格输入公式=(B1-B2)/(B3/SQRT(B4)(3)计算临界值。在)计算临界值。在B7中输入公式中输入公式=ABS(NORMSINV(B5/2)Excel文件文件(4)计算)

45、计算p-值。在值。在B8中输入公式中输入公式=NORMSDIST(B6)(5)根据以上的计算结果,使用临界值规则或)根据以上的计算结果,使用临界值规则或p-值规值规则进行判断,检验统计量的观测值落在拒绝域,因则进行判断,检验统计量的观测值落在拒绝域,因而拒绝而拒绝 =150克的原假设。克的原假设。图图6-2例例6-12利用利用Excel求解例求解例6-6的问题。的问题。解:原假设与备择假设如下:解:原假设与备择假设如下:H0:旧旧-新新0 H1:旧旧-新新 0(1)输入数据,见)输入数据,见图图6-3。A、B列为原始输入数据。列为原始输入数据。(2)使用分析工具库中的)使用分析工具库中的t-检

46、验:双样本等方差假检验:双样本等方差假设设分析工具,调出该对话框,按分析工具,调出该对话框,按图图6-4所示填写。所示填写。单击单击“确定确定”按钮,可以得到按钮,可以得到图图6-3 D-F列所示的结列所示的结果。果。(3)结果分析(略)。)结果分析(略)。Excel文件文件二、方差分析二、方差分析【例【例6-13】用】用Excel实现例实现例6-8的计算过程。的计算过程。解:操作步骤如下。解:操作步骤如下。(1)输入数据,见)输入数据,见图图6-5,其中第一行中的数字表示,其中第一行中的数字表示小鸡序号。小鸡序号。(2)调出)调出 方方 差差 分分 析:单因素方差分析析:单因素方差分析 对话

47、框,对话框,按按图图6-6所示填写。所示填写。(3)单击)单击确定确定按钮,即可得到方差分析的结果。输按钮,即可得到方差分析的结果。输出结果包括两个部分,第一部分是每一组数据的观出结果包括两个部分,第一部分是每一组数据的观测值个数,总和、平均和方差。第二部分是方差分测值个数,总和、平均和方差。第二部分是方差分析表,见析表,见表表6-4。表表6-4 方差分析表方差分析表变异变异来源来源离差离差平方和平方和自由度自由度均方差均方差F值值P-值值临界值临界值组间组间7112.14332370.7141.012320.4115733.196774组内组内39811.67172341.863总计总计46

48、923.8120Excel文件文件例例6-14用用Excel实现例实现例6-10的计算过程。的计算过程。解:该项工作可以使用解:该项工作可以使用方差分析:可重复双因素方方差分析:可重复双因素方差分析差分析工具来完成。工具来完成。(1)输入数据,如)输入数据,如图图6-7所示。其中,所示。其中,B2:B4单元格单元格存放的是在存放的是在“A1”与与“B1”因素水平共同作用下,进因素水平共同作用下,进行行3次试验所得的结果;次试验所得的结果;D5:D7单元格存放的是在单元格存放的是在“A3”与与“B2”因素水平共同作用下,进行因素水平共同作用下,进行3次试验次试验所得的结果,其余类推。所得的结果,其余类推。(2)调出)调出方差分析:可重复双因素分析方差分析:可重复双因素分析对话框,其对话框,其填写如填写如图图6-8所示。所示。(3)单击)单击确定确定按钮,得到方差分析表(见表按钮,得到方差分析表(见表6-8,略)。略)。Excel文件文件

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|