《应用统计学》课件第二十一讲.ppt

上传人(卖家):momomo 文档编号:4827988 上传时间:2023-01-15 格式:PPT 页数:50 大小:1.27MB
下载 相关 举报
《应用统计学》课件第二十一讲.ppt_第1页
第1页 / 共50页
《应用统计学》课件第二十一讲.ppt_第2页
第2页 / 共50页
《应用统计学》课件第二十一讲.ppt_第3页
第3页 / 共50页
《应用统计学》课件第二十一讲.ppt_第4页
第4页 / 共50页
《应用统计学》课件第二十一讲.ppt_第5页
第5页 / 共50页
点击查看更多>>
资源描述

1、第七章 假设检验与方差分析 正常人的平均体温是正常人的平均体温是37oC吗?吗?当问起健康的成年人体温是多少时,多数人 的 回 答 是37oC,这似乎已经成了一种共识。下面是一个研究人员测量的50个健康成年人的体温数据 37.136.936.937.136.436.936.636.236.736.937.636.737.336.936.436.137.136.636.536.737.136.236.337.536.937.036.736.937.037.136.637.236.436.637.336.137.137.036.636.936.737.236.337.136.736.837.037

2、.036.137.0正常人的平均体温是正常人的平均体温是37oC吗?吗?根据样本数据计算的平均值是36.8oC,标准差为0.36oC 根据参数估计方法得到的健康成年人平均体温的95%的置信区间为(36.7,36.9)。研究人员发现这个区间内并没有包括37oC 因此提出“不应该再把37oC作为正常人体温的一个有任何特定意义的概念”我们应该放弃“正常人的平均体温是37oC”这个共识吗?本章的内容就将提供一套标准统计程序来检验这样的观点第七章 假设检验与方差分析 当我们利用样本资料去推断总体时,其结果的正确性、可靠性受到人们的质疑。在此情况下,假设检验与方差分析方法应运而生,它可以科学地对统计推断结

3、果的正确性、可靠性做出具有一定把握程度的回答。1假设检验的意义及程序 一、假设检验的意义 假设检验也称显著性检验,是指对未知的总体某一数量特征提出某种假设,再根据样本的实际资料来验证该假设是否成立的一种统计分析方法。假设检验是论证抽样推断结果可靠性的一种手段。什么是假设检验什么是假设检验?(hypothesis test)1.先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计方法2.有参数检验和非参数检验3.逻辑上运用反证法,统计上依据小概率原理n小概率是在一次试验中,一个几乎不可能发生的事件发生的概率n在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 在日

4、常的社会经济活动中,由于我们通常难以完全知道所关心的总体的数量特征及其变化情况,因而对总体进行研究比较时,常常需要对总体的状况做出某种假设。例如,考察目前股票市场上价格走势是否正常,我们只能依据过去长期观察的平均水平和变异情况,对当前股票价格水平做出正常或不正常的假设,但是,这种平均水平毕竟只是过去的情况或正常条件下的反映,属于一种假设,是否符合当前的实际情况,还需要进一步的验证。又如,工厂生产某种革新产品,推广某项新配方、新方法,企业经营管理者都十分关心产品质量是否有所提高,这也需要先做出假设,然后依据样本的实际资料、采用一定的程序来检验所做的假设是否合理,从而决定新产品、新配方、新方法的市

5、场开发或应用推广的问题。统计假设检验是用实际的抽样指标去检验假设的总体指标,目的在于判断假设总体和现实总体是否存在显著性差异。当然,假设检验和区间估计所考虑的问题是不同的,两者所关心的结论也不一样。在假设检验中,通常我们所关心的是检验总体参数值有无变化(即是否存在显著性差异),而检验过程就是利用样本资料所含的信息判断差异是否显著;而在区间估计中,目的在于通过从总体中抽取的样本资料推断总体参数在一定概率水平下的可能置信区间。假设检验按总体分布形式是否已知分为两种:如果总体的分布形式已知,只是对总体分布模型的未知参数提出假设,并进行检验,则称这种假设检验为参数假设检验;如果总体的分布形式未知,而要

6、对其分布形式、特征值等信息进行假设检验,则称这种假设检验为非参数假设检验。二、假设检验的基本原理(一)假设检验的基本思想与小概率原则 1基本思想 假设检验的基本思想是先对所研究的命题提出一种假设无显著性差异的假设,并假定这一假设成立,然后由此导出其必然结果。如果证明这种结果出现的可能性很小,那么有理由用“反证法”认为原假设是错误的,从而拒绝接受这个假设;否则,没有理由拒绝原假设,可以接受原假设。2小概率原则 我们已经知道,假设检验的基本思想是利用“反证法”来拒绝或接受原假设。用“反证法”的理论依据就是在实践中运用很广泛的“小概率原理”,即小概率事件在一次试验中出现的可能性很小,通常认为,在实践

7、中,这一小概率事件在一次实验中是不可能发生的。如果在假设检验中小概率事件居然在取得该样本的一次试验中发生了,我们就有理由怀疑原来对该事件假设的正确性,从而拒绝原假设成立。对显著性水平的理解必须把握下面两个要点:第一,显著性水平并不是一个固定不变的值,它的大小随着我们所研究问题的性质及我们对结论的准确性所作的要求不同而变动,主要是依据拒绝区间所可能承担的风险来决定。一般而言,显著性水平多采用0.01,0.05,0.10等数值。第二,统计上所讲的显著性与实际生活、工作中的显著性是不一样的。(二)假设检验中命题的基本形式 1原假设 原假设通常是指根据已有的资料或经过周密考虑后确定的,需要通过样本去推

8、断其正确与否的命题,一般用H0表示。原假设原假设(null hypothesis)1.又称“0假设”,研究者想收集证据予以反对的假设,用H0表示2.所表达的含义总是指参数没有变化或变量之间没参数没有变化或变量之间没有关系有关系 3.最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它 4.总是有符号 ,或 nH0:=某一数值nH0:某一数值nH0:某一数值l例如,H0:10cm(二)假设检验中命题的基本形式 例如,要检查2003年新生婴儿的平均体重与去年的3190克有无显著差异”,可以提出原假设2003年新生婴儿的平均体重与去年的3190克没有什么差异”,其表示为克3190:0uH(

9、二)假设检验中命题的基本形式 2备择假设 备择假设是与原假设相对立的假设,即原假设被否定之后而决定选择的假设,一般用H1表示。1.也称“研究假设”,研究者想收集证据予以支持的假设,用H1或Ha表示2.所表达的含义是总体参数发生了变化或变量之间有某种关系3.备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设 4.总是有符号 ,或 nH1:某一数值nH1:某一数值nH1:3190克 反之,如果关心的问题是平均体重是否有所减少,则原假设表示新生儿的平均体重没有任何减少,备择假设表示平均体重比上年减少,即H0:u3190克H1:u 临界值,拒绝H0n左侧检

10、验:统计量 临界值,拒绝H0(四四)两类错误与显著性水平两类错误与显著性水平1.研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误2.原假设和备择假设不能同时成立,决策的结果要么拒绝H0,要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误 3.第类错误(a错误)n原假设为正确时拒绝原假设n第类错误的概率记为a,被称为显著性水平n2.第类错误(错误)n原假设为错误时未拒绝原假设n第类错误的概率记为(Beta)a 错误和 错误的关系你要同时减少两类你要同时减少两类错误的惟一办法错误的惟一办

11、法是增加样本量是增加样本量两类错误的控制1.一般来说,对于一个给定的样本,如果犯第类错误的代价比犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合理;反之,如果犯第类错误的代价比犯第类错误的代价相对较低,则将犯第类错误的概率定得高些2.一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第类错误的发生概率显著性水平a(significant level)1.事先确定的用于拒绝原假设H0时所必须的证据2.能够容忍的犯第类错误的最大概率(上限值)n2.原假设为真时,拒绝原假设的概率n 抽样分

12、布的拒绝域n3.表示为 a(alpha)n 常用的 值有0.01,0.05,0.10n4.由研究者事先确定三、假设检验的基本程序(一)写出所有已知(二)建立统计假设(三)规定显著性水平值,确定统计量的否定域及临界值(四)确定假设检验的样本统计量及其分布,计算统计量(五)做出统计决策2总体均值的假设检验 一、一个总体均值的假设检验(一)双侧检验1U检验法),(2nuNx),(2uN从服从正态分布的总体中,抽取容量为n的样本,则样本平均数服从其数学期望值为总体平均数u,其方差为总体方差的n分之一的正态分布,即2总体均值的假设检验 因此以U作为检验统计量的假设检验,亦称为U检验法。)1,0(/Nnu

13、x将其标准化,有nuxU/通常记例1 某地区有30 000户居民,根据历史资料,其家庭每月收入服从正态分布,每月户均收人为750元,标准差为150元。今年该区域市社会经济调查队随机抽取100户居民,计算出户均收人为780元。据此抽样结果,是否可以认为该区居民户的月均收入水平没有发生显著的变化?(显著性水平=005)解:(1)设立原假设和备择假设。元uH元uH750:;750:10。和),96.1 96.1,(2)给定显著性水平=0.05。由于是双侧检验,两边025.0u拒绝区间概率各为/2=0.025,即下临界值为025.0u上临界值为,拒绝区间概率为0.05,则接受区间的概率为1-0.95。

14、U服从正态分布,查标准96.1u正态概率双侧临界值表,可得因此,下96.1025.0u96.1025.0u临界值上临界值拒绝域为(3)选择样本统计量,根据抽样平均数计算实际的样本统计量值。21530100/150750780/nuxU因此否定原假设,认为该区居民的月均收入有发生显著变化。),96.1(4)检验判断。由于U2落在否定域内,式中,S*表示样本修正标准差。)1(/*0ntnSuxT2双侧T检验法当总体方差未知,且是小样本,检验00:;Huu10:Huu时,常采用服从自由度为n-1的t分布的统计量,可记为千克uH千克uH100:100:10例2 某糖厂用自动打包机装糖,每包糖的重量均服

15、从正态分布,其标准重量为100千克,某日开工后测得9包重量如下:93.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5现以95的把握程度判断该日打包机工作的正常状况。解:(1)设立原假设和备择假设。(2)有95的把握程度判断,因此其显著性水平005。由于是双侧检验,两侧拒绝区间的概率各为/20025,查自由度为8的t分布临界值表,可得t=2.306,拒绝区域为(-,-2.306或2.306,+)。(3)选择样本检验统计量,根据抽样平均数计算实际的样本检验统计量值。812.09/546.2100311.99/*0nSuxT(4)检验判断。由于T-0.81

16、2,落在拒绝域以外,在一次抽样中,小概率事件没有发生,不能拒绝原假设,因此接受原假设,即可认为机器工作正常。(二)单侧假设检验单侧检验,是指假设检验中只注意假设值是否偏高(或偏低)的单方向检验。1单侧U检验法例3 假日饭店有500张客床,正常时间每床月租金为100美元,平均订位率70。现在经理进行一项试验,采取优惠措施把房价降低15,经过36天,平均每天出租床位406张,其标准差78张,试以005的显著性水平评估优惠措施是否有明显的效果。(4)做出检验决策。因为UU,因此,在005显著性水平下,拒绝原假设,接受备择假设,即假日饭店的优惠措施使订位率有显著的提高。01:500 70%350;:3

17、50HuHu4063504.3/78/36xuUn解:(1)建立假设。(2)给定显著性水平。显著性水平=0.05查标准正态概率双侧临界值表有Ul.645。(3)计算样本观察值的检验统计量,如下:2单侧T检验 单侧T检验是指正态总体分布的平均数已知,方差未知,且为小样本时的检验。例4 某制造厂生产某装置,规定其平均工作温度为190,今从一个由16台装置构成的随机样本,求得工作温度的平均数和修正标准差分别是194和8,假设工作温度服从正态分布(=0.05),能否说明平均温度比规定的要高?10.95(1)(15)1.753,tnta1.753,)0*194 1902/8/16xuTSn01:190;:190HuHu解:由于总体方差未知,且为小样本,当原假设为真时,它服从自由度为15的t分布。由给定的显著性水平005,且属单边检验,查分布临界值表确定临界值为即拒绝域为再由样本数据计算T检验统计量。21735,故否定原假设,即样本数据说明了平均温度比制造厂规定的要高。如果总体分布未知,且是大样本时,根据中心极限定理,都可采用U检验法来构造样本检验统计量。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(《应用统计学》课件第二十一讲.ppt)为本站会员(momomo)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|