1、第十一章第十一章 假设检验假设检验 假设检验的基本原理假设检验的基本原理 显著水平检验法与正态总体检验显著水平检验法与正态总体检验1谢谢观赏2019-8-23第十一章第十一章 假设检验假设检验 一、检验问题的提法一、检验问题的提法 假设检验是即同估计密切联系,但又有重要区别的一种推假设检验是即同估计密切联系,但又有重要区别的一种推断方法。断方法。例如:某种电子元件寿命例如:某种电子元件寿命X X服从参数为服从参数为的指数分布,随机抽取的指数分布,随机抽取其中的其中的n件。测得其寿命数据,件。测得其寿命数据,问题问题,这批元件的平均寿命是多少?,这批元件的平均寿命是多少?问题问题,按规定该型号元
2、件当寿命不小于,按规定该型号元件当寿命不小于5000(h)为合格,问为合格,问该批元件是否合格?该批元件是否合格?问题问题是对总体未知参数是对总体未知参数=E(X)=1/作出估计。回答作出估计。回答“是是多少?多少?”,是定量的。问题,是定量的。问题则是对假设则是对假设“这这批元件合格批元件合格”做做出接受还是拒绝的回答,因而是定性的。出接受还是拒绝的回答,因而是定性的。2谢谢观赏2019-8-23第十一章第十一章 假设检验假设检验 对上述例子,还可做更细致考察,设想如基于一次观察对上述例子,还可做更细致考察,设想如基于一次观察数据算出数据算出的估计值的估计值 ,我们能否就此接受,我们能否就此
3、接受“这这批批元件合格元件合格”的这一假设呢?的这一假设呢?尽管尽管 但这个估计仅仅但这个估计仅仅是一次试验的结果,能否保证下一次测试结果也能得到是一次试验的结果,能否保证下一次测试结果也能得到的的估计值大于估计值大于5000呢?呢?也就是说从观察数据得到的结果也就是说从观察数据得到的结果 与参考值与参考值5000的差异仅仅是偶然的呢?还是总体均值的差异仅仅是偶然的呢?还是总体均值确实确实有大于有大于5000的的“趋势趋势”?)(5001h),(5000h5001 这些问题是以前没有研究过的。一般而言,估计问题是这些问题是以前没有研究过的。一般而言,估计问题是回答总体分布的未知参数是多少?或范
4、围有多大?而假设检回答总体分布的未知参数是多少?或范围有多大?而假设检验问题则是回答观察到的数据差异只是机会差异,还是反映验问题则是回答观察到的数据差异只是机会差异,还是反映了总体的真实差异?因此两者对问题的提法有本质不同。了总体的真实差异?因此两者对问题的提法有本质不同。3谢谢观赏2019-8-23第十一章第十一章 假设检验假设检验 下面通过一个例子介绍下面通过一个例子介绍原假设和备择假设原假设和备择假设二二.原假设和备择假设原假设和备择假设4谢谢观赏2019-8-23例例1 1(酒精含量酒精含量)一种无需医生处方即可达到的治一种无需医生处方即可达到的治疗咳嗽和鼻塞的药。按固定其酒精含量为疗
5、咳嗽和鼻塞的药。按固定其酒精含量为5 5.今从今从一出厂的一批药中随机抽取一出厂的一批药中随机抽取1010瓶瓶,测试其酒精含量测试其酒精含量得到的得到的1010个含量的百分数个含量的百分数:5.01,4.87,5.11,5.21,5.03,4.96,4.78,4.98,4.88,5.06 如果酒精含量服从正态分布如果酒精含量服从正态分布N(,0.00016),问该问该批药品的酒精含量是否合乎规定批药品的酒精含量是否合乎规定?任务任务:通过样本推断通过样本推断X X的均值的均值是否等于是否等于5.假设假设:上面的任务就是要通过样本去检验上面的任务就是要通过样本去检验“X X的均值的均值=5”这样
6、一个假设是否成立这样一个假设是否成立.(.(在数理统计中把在数理统计中把“X X的均值的均值=5”=5”这样一个待检验的假设记作这样一个待检验的假设记作“H H0 0:=5”:=5”称为称为 “原假设原假设”或或“零假设零假设”.表明数据的表明数据的“差异差异”是偶是偶然的然的,总体没有总体没有“变异变异”发生发生.5谢谢观赏2019-8-23 原假设的对立面是原假设的对立面是“X X的均值的均值10”10”记作记作“H H1 1:10”10”称为称为“对立假设对立假设”或或“备择假设备择假设”.表表明数据的明数据的“差异差异”不是偶然的不是偶然的,是总体是总体“变异变异”的的表现表现.把它们
7、合写在一起就是把它们合写在一起就是:H H0 0:=10 :=10 H H1 1:1010 原假设原假设H H0 0表明含量符合规定,这个表明含量符合规定,这个5 5也称之为也称之为期望数,尽管期望数,尽管1010个数据都个数据都5 5与有出入,这只是抽与有出入,这只是抽样的随机性所致样的随机性所致;备择假设备择假设H H1 1表明总体均值表明总体均值已经偏已经偏离了期望数离了期望数5 5,数据与期望数,数据与期望数5 5的差异是其表现的差异是其表现.假设检验假设检验的任务的任务 必须在原假设与必须在原假设与备择备择假设假设之间作一选择之间作一选择6谢谢观赏2019-8-23检验统计量检验统计
8、量是构造一个适当的能度量观察数与原假是构造一个适当的能度量观察数与原假设下的期望数之间的差异程度的统计量设下的期望数之间的差异程度的统计量,此统计量为此统计量为检验统计量检验统计量.特点特点:在原假设在原假设H0下分布式完全一致或者说可以计算下分布式完全一致或者说可以计算.因而通过标准化因而通过标准化 可得到检验统计量可得到检验统计量1000016.0 ,05NXXX三三.检验统计量检验统计量 本例的观察数通过样本平均本例的观察数通过样本平均 表示表示,它是它是的一的一个无偏估计个无偏估计,而在下的期望数为而在下的期望数为=5,5,在在H H0 0下下00016.05X10n期望数期望数观察值
9、观察值z7谢谢观赏2019-8-23 从试验数据判断是否导致一个矛盾的结果从试验数据判断是否导致一个矛盾的结果,一个重一个重要的依据是小概率事件的实际推断原理要的依据是小概率事件的实际推断原理.看例看例1,1,由由观察数据观察数据,可算得的可算得的 观察值为观察值为4.989,4.989,代入统计量代入统计量Z Z的表达式的表达式,得得Z Z的观察值为的观察值为 四四.否定论证及实际推断原理否定论证及实际推断原理7509.201265.00348.000016.0011.010Z 否定论证是假设检验的重要推理方法否定论证是假设检验的重要推理方法,其要旨是其要旨是:先假定原假设先假定原假设H H
10、0 0成立成立,如果从试验观察数据及此假定如果从试验观察数据及此假定将导致一个矛盾的结果将导致一个矛盾的结果,则必须否定这个原假设则必须否定这个原假设;反之反之,如果不出矛盾的结果如果不出矛盾的结果,就不能否定原假设就不能否定原假设.X8谢谢观赏2019-8-23 在在H H0 0下下,Z服从标准正态分布服从标准正态分布,对于特定的一次试验对于特定的一次试验,统计量统计量Z取得观察值取得观察值-2.7509,是十分罕见的,以至于,是十分罕见的,以至于实际不会发生实际不会发生.事实上事实上,当当H H0 0成立时成立时,事件事件96.1Z发生的机会只有发生的机会只有5 5(如图如图)这是一个小概
11、率事件这是一个小概率事件.今从试验数据得到今从试验数据得到Z=-2.7509,Z=-2.7509,由于由于 表明这一小概率事件在该次试验中发生表明这一小概率事件在该次试验中发生,这与实际这与实际推断原理矛盾推断原理矛盾.因此否定原假设因此否定原假设.至此本例已获得解答至此本例已获得解答,即基于即基于数据该批药品的酒精含量不符合规定数据该批药品的酒精含量不符合规定.96.17509.2注意注意:在否定论中最终能否得出矛盾的结果,取决于数据在否定论中最终能否得出矛盾的结果,取决于数据.2221ze02.51.961.96-2.75099谢谢观赏2019-8-23第二节第二节 显著水平检验法与正态总
12、体检验显著水平检验法与正态总体检验正确正确正确正确假设检验的两类错误假设检验的两类错误H0 为真为真H0 为假为假真实情况真实情况所作判断所作判断接受接受 H0拒绝拒绝 H0第一类错误第一类错误(弃真弃真)第二类错误第二类错误(取伪取伪)注意注意:不可能消除这两种错误不可能消除这两种错误,而只能控制发生而只能控制发生这两类错误之一的概率这两类错误之一的概率.10谢谢观赏2019-8-23第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验 假设假设H H0 0与与H H1 1从一开始就不是从一开始就不是“平等的平等的”.在很多情况下在很多情况下,人们希望通过收集数据拒绝人们希
13、望通过收集数据拒绝H H0 0,从而达到接受从而达到接受H H1 1的目的的目的.因因而控制犯第一类错误概率就变得十分重要了而控制犯第一类错误概率就变得十分重要了,使得拒绝了使得拒绝了一个真实的一个真实的H H0 0的可能性降低到一个我们能接受的程度的可能性降低到一个我们能接受的程度.二二.显著水平检验法显著水平检验法 显著水平检验法显著水平检验法:在数据收集之前就已经设定好一个在数据收集之前就已经设定好一个检验规则检验规则,即文献上称之为拒绝域即文献上称之为拒绝域R,使得当样本观察值落入使得当样本观察值落入R就拒绝就拒绝R0.对拒绝域对拒绝域R R的要求是的要求是:在在H H0 0 下下 样
14、本落入样本落入RR为一小概率为一小概率事件事件,挤兑预先给定的挤兑预先给定的0011有有 P(样本落入样本落入R|H0)11谢谢观赏2019-8-23作为未知参数作为未知参数的点估计的点估计,因此因此 偏小应该拒绝偏小应该拒绝H H0 0.若若H0成立成立,269XX302.2692NX例例3 3 某降价盒装饼干,其包装上的广告上称每盒质量为某降价盒装饼干,其包装上的广告上称每盒质量为269g269g.但有顾客投诉,钙饼干质量不足但有顾客投诉,钙饼干质量不足269g269g。为此质检部门从准备出。为此质检部门从准备出厂的一批盒装饼干中,随机抽取厂的一批盒装饼干中,随机抽取3030盒,由测得的盒
15、,由测得的3030个质量数据个质量数据算出样本平均为算出样本平均为268.268.假设盒装饼干质量服从正态分布假设盒装饼干质量服从正态分布N(N(,2 22 2),),以显著水平以显著水平=0.05=0.05检验该产品广告是否真实检验该产品广告是否真实.解解:依题意依题意,可设原假设可设原假设H H0 0:=269 :=269 备择假设备择假设 H H1 1:269269则有则有226930XZ则在下则在下Z ZN(0,1),N(0,1),即即Z Z的分布已知,因而的分布已知,因而Z Z可以做检验统计量,可以做检验统计量,偏小等价于偏小等价于Z Z偏小,从而得到拒绝域的形式如下偏小,从而得到拒
16、绝域的形式如下kXR226930其中其中k k待定,称之为待定,称之为临界值临界值.12谢谢观赏2019-8-23=0.05,为求显著水平为求显著水平0.05的检验的检验,只需选取只需选取k使得使得645.195.0k05.0|0HkZP查表可得查表可得因而得到水平因而得到水平0.050.05检验的拒绝域检验的拒绝域645.1226930 XR代入数据得代入数据得Z=-2.74,Z=-2.74,显然小于临界值显然小于临界值-1.645,-1.645,因而依据检验因而依据检验规则应该拒绝规则应该拒绝H0,即该盒装广告有不实广告行为即该盒装广告有不实广告行为.总结求解步骤总结求解步骤13谢谢观赏2
17、019-8-23例例4(4(例例3 3续续)在上例中,若盒装饼干重量服从正态分布在上例中,若盒装饼干重量服从正态分布N(N(,2 2),),与与2 2均未知,已知样本平均均未知,已知样本平均 修正样本标准差为修正样本标准差为 ,求解相同的问题,求解相同的问题.第二节第二节 显著水平检验法与正态总体检显著水平检验法与正态总体检验验三三.正态总体的显著水平检验正态总体的显著水平检验268X8.1S此时不能用使用此时不能用使用Z Z作为统计量作为统计量,因为因为:26930XZ其中其中未知未知,今用今用S*代替代替,得到得到t t的统计量的统计量S S*SXT26930由正态总体抽样分布基本定理可知由正态总体抽样分布基本定理可知:14谢谢观赏2019-8-23第二节第二节 显著水平检验法与正态总体检显著水平检验法与正态总体检验验在H0下:,kTR同上例作相同的分析同上例作相同的分析,可得到拒绝域为可得到拒绝域为),29(tT临界值通过查自由度为临界值通过查自由度为2929的的t t分布表可得到分布表可得到.699.1)29(95.0tk最后计算最后计算T T的观察值的观察值044.38.126926830t15谢谢观赏2019-8-2316谢谢观赏2019-8-23