1、第七章第七章 假设检验假设检验要求:理解假设检验的基本概念和基本步骤。要求:理解假设检验的基本概念和基本步骤。 掌握正态总体均值的假设检验掌握正态总体均值的假设检验 例如,一工厂据以往经验某一生产线装配一只例如,一工厂据以往经验某一生产线装配一只某种部件的平均时间为某种部件的平均时间为1010(分);放射性物体铀(分);放射性物体铀在一定时间间隔内放射的到达计数器上的在一定时间间隔内放射的到达计数器上的 粒子粒子数数X X服从泊松分布等等。服从泊松分布等等。 人们常需要判断总体是否具有这种特性,因此人们常需要判断总体是否具有这种特性,因此根据这些预知的有关知识提出两个相互对立的假根据这些预知的
2、有关知识提出两个相互对立的假设设。其中一个叫原假设或零假设其中一个叫原假设或零假设H H0 0;另一个叫备;另一个叫备择假设择假设H H1 1. . 利用样本判断拒绝利用样本判断拒绝H H0 0还是接受还是接受H H0 0,这,这样的问题叫做假设检验问题。样的问题叫做假设检验问题。样本均值样本均值 为为 X 的无偏估计,的无偏估计, (以分计以分计)近似服从正态分布,均值为近似服从正态分布,均值为10,标准差为,标准差为0.5.例例1 根据以往经验,某工厂装配一只某种部件的时间根据以往经验,某工厂装配一只某种部件的时间现在随机地选定现在随机地选定10只部件只部件, 测得某装配时间为测得某装配时
3、间为 9.8 10.4 10.6 9.6 9.7 9.9 10.9 11.1 9.5 10.1问是否可以认为现在装配时间的均值没有改变问是否可以认为现在装配时间的均值没有改变.解解 此问题就是已知此问题就是已知=0.5,现在装配时间现在装配时间XN(,0.52)检验假设检验假设001:10,:10HH( =0.05)0X X能较好反映能较好反映 的大小的大小. 当当 为真时,为真时, 0H差异不能过大。差异不能过大。 若差异较大,就怀疑若差异较大,就怀疑H0的正确性,而拒绝的正确性,而拒绝H000 1( , )XZNn 当当 为真时,为真时, 0H衡量衡量 的大小的大小 0 xzn 衡量衡量
4、的大小的大小 ,归结为,归结为 0 x 0 xzkn 设一临界值设一临界值 k0,若,若就认为有较大偏差;就认为有较大偏差;则认为则认为 不真,拒绝不真,拒绝 0H0H0,xzkn 0H则接受则接受 若若 由于是由于是利用样本利用样本作出判断的,事实上作出判断的,事实上H H0 0为真时为真时, ,也也有可能取到观测值有可能取到观测值 使使x0 xkn 另一方面,另一方面,H H0 0事实上是不真的事实上是不真的, ,也有可能取到观也有可能取到观测值测值 使使x0 xkn 作出拒绝作出拒绝H H0 0决策,这是一种错误,即犯了决策,这是一种错误,即犯了“弃真弃真”的的( (或称或称第一类第一类
5、) )错误错误. . 作出接受作出接受H0H0决策,这也是一种错误,即犯了决策,这也是一种错误,即犯了“取伪取伪”的的( (或称或称第二类第二类) )错误错误. . 我们希望犯两类错误的概率都小,不幸的是我们希望犯两类错误的概率都小,不幸的是当当样本容量样本容量n n固定时,若减小一类错误概率,则犯另一固定时,若减小一类错误概率,则犯另一类错误的概率增大类错误的概率增大. . 当样本容量当样本容量n n固定时,我们总是固定时,我们总是控制犯第一类错控制犯第一类错误的概率误的概率. .即事先选定一个数较小的正数即事先选定一个数较小的正数 ,(,( =0.05=0.05,0.010.01等等),)
6、,使得使得犯第一类错误的概率犯第一类错误的概率 ,即,即 P拒绝拒绝 | 为真为真0H0H0,HP0XknP拒绝拒绝 | 为真为真0H0H,P001XZNn( , )/2kz0/2Xzn显著性检验:显著性检验: P拒绝拒绝 | 为真为真0H0H拒绝域拒绝域z z 20.025zz01.96Xn0Xkn1.96;由样本值求出由样本值求出16.10 x 统计量统计量Z的观测值没有落在拒绝域中,故接受的观测值没有落在拒绝域中,故接受H0,认为部件装配时间的均值为认为部件装配时间的均值为10(分钟)。(分钟)。010.16100.510 xn0.16 101.01191.960.59.8 10.4 1
7、0.6 9.6 9.7 9.9 10.9 11.1 9.5 10.101.96Xn拒绝域:显著性检验显著性检验 只对犯第一类错误的概率只对犯第一类错误的概率P(P(拒绝拒绝H H0 0|H|H0 0为真为真) )加以加以控制使之控制使之,而不考虑犯第二类错误的概率,而不考虑犯第二类错误的概率P(P(接受接受H H0 0|H|H0 0为不真为不真) ) ,这种检验称为,这种检验称为显著性检验显著性检验。为显著性水平。为显著性水平。检验准则(实际推断原理)检验准则(实际推断原理)通过大量实践表明,小概率事件在一次试验中几乎不会发生通过大量实践表明,小概率事件在一次试验中几乎不会发生。通常通常取很小
8、取很小( (取取 =0.05,0.01=0.05,0.01等等),),若若H H0 0为真,即为真,即= = 0 0时,时,0/2Xzn是一个小概率事件。根据实际推断原理是一个小概率事件。根据实际推断原理, ,如果如果H H0 0为真,为真,则由一次试验得到的观察值则由一次试验得到的观察值 ,满足不等式,满足不等式x0/2xzn几乎是不会发生的。现在一次观察中竟然出现了几乎是不会发生的。现在一次观察中竟然出现了, ,则则我们有理由怀疑我们有理由怀疑H H0 0的正确性的正确性, ,因而拒绝因而拒绝H H0 0, ,否则接受否则接受H H0.0.数学中的反证法数学中的反证法 设定一个假设以后设定
9、一个假设以后, ,如果出现的事实与之矛盾,如果出现的事实与之矛盾,则绝对地否定假设则绝对地否定假设. .假设检验的基本方法假设检验的基本方法( (带概率性质的反证法带概率性质的反证法 ):): 如果假设如果假设H H0 0是正确的是正确的话话, ,出现一个概率很小的出现一个概率很小的 事件事件, ,这与小概率事件的实际推断原理相矛盾,则这与小概率事件的实际推断原理相矛盾,则以很大的把握否定假设以很大的把握否定假设H H0 0. .假设检验的步骤假设检验的步骤1. 1. 根据实际问题要求,提出原假设根据实际问题要求,提出原假设H H0 0及备择假设及备择假设H H1 1;2. 2. 给出显著性水
10、平给出显著性水平,选择合适的统计量作为检验,选择合适的统计量作为检验统计量,给出拒绝域的形式,然后按统计量,给出拒绝域的形式,然后按 PP拒绝拒绝 H H0 0 | H| H0 0 为真为真 确定拒绝域;确定拒绝域;3. 3. 根据样本值计算检验统计量的值;根据样本值计算检验统计量的值; 4. 4. 作出决策,即当检验统计量的值落在拒绝域内则作出决策,即当检验统计量的值落在拒绝域内则拒绝原假设拒绝原假设H H0 0,否则接受原假设,否则接受原假设H H0 0. .二、正态总体均值的假设检验二、正态总体均值的假设检验在实际工作中,往往把不轻易否定的命题作为原在实际工作中,往往把不轻易否定的命题作
11、为原假设假设.1. 单个正态总体单个正态总体均值均值 的假设检验的假设检验212XN( ,),XXXX.设总体未知, , ,是来自总体 的样本,给定显著性水平n 0100HH:双侧假设检验:01000100HHHH:单侧假设检验:提出原假设和备择假设提出原假设和备择假设 第一步:第一步:1.已知已知),(2 NX2 已知已知, 的检验的检验 第二步:第二步:给出显著性水平给出显著性水平,选取统计量,选取统计量XZn双侧检验双侧检验四个步骤:四个步骤:0100: HH给出拒绝域为给出拒绝域为0Xkn(查表确定临界值查表确定临界值)/2kz(Z检验法检验法)第三步:根据样本值计算检验统计量的观测值
12、第三步:根据样本值计算检验统计量的观测值0 xzn第四步:判断第四步:判断/2|zz则拒绝则拒绝H0/2|zz则接受则接受H0某车间用一台包装机包装葡萄糖某车间用一台包装机包装葡萄糖. .包得的袋装糖包得的袋装糖当机器正常时当机器正常时, ,某日开工后为检验包装机是否正常某日开工后为检验包装机是否正常, ,包装的糖包装的糖9 9袋袋, ,称得净重为称得净重为( (公斤公斤):):0.497 0.506 0.518 0.524 0.4980.497 0.506 0.518 0.524 0.4980.511 0.520 0.515 0.5120.511 0.520 0.515 0.512问机器是否
13、正常问机器是否正常? ?例2重是一个随机变量重是一个随机变量X, , 且且),(2 NX其均值为其均值为=0.5=0.5公斤公斤, , 标准差标准差=0.015=0.015公斤公斤. .随机地抽取它所随机地抽取它所5 . 0:00H5 . 0:1 H解:先提出假设解:先提出假设( =0.05=0.05)0XZn选取统计量:选取统计量:拒绝域:拒绝域:0/2|,xzzn计算得计算得022.21.96xzzn511. 0)512. 0497. 0(91 x/20.0251.96,zz于是拒绝于是拒绝 ,0H认为包装机工作不正常。认为包装机工作不正常。 右边检验右边检验查表确定临界值查表确定临界值k
14、z取取 , (4),若zz 0XZn(2)H H0 0为真为真, ,选取统计量:选取统计量: ,拒绝域为拒绝域为 (3)计算)计算 则拒绝则拒绝 ,接受接受1;H0H0.H反之,接受反之,接受 0100:;:) 1 (HH0 xzkn 0 xzn 0左边检验左边检验查表确定临界值查表确定临界值kz取取 , 0 xzn (4),若 zz 0XZn(2)选取统计量:)选取统计量:拒绝域为拒绝域为 (3)计算)计算 则拒绝则拒绝 ,接受,接受1;H0H0.H反之,接受反之,接受 0100:;:) 1 (HH0 xzkn 0例例32( ,3 ),XN (0.05) 0XZn(2)选取统计量:)选取统计
15、量:1700 某大学男生身高某大学男生身高 今测得今测得9名男生身高名男生身高 平均为平均为 172,Xcm 问是否可以认为该校男生平均身高问是否可以认为该校男生平均身高 超过超过170cm呢?呢? 0010(1):;:HH 0 xzzn 拒绝域为拒绝域为 解解 查表确定临界值查表确定临界值0.05kzz65. 1 93170172 2 65. 1 H;H10 用用用用H;H10 用用用用 取取 , 0 xzn (3)计算)计算 可以认为该校男生平均身高超过可以认为该校男生平均身高超过170cm. 则拒绝则拒绝 ,0H如题目问:是否有明显提高如题目问:是否有明显提高 是否有明显下降是否有明显下
16、降 212)(11 nkkXXnS提出原假设和备择假设提出原假设和备择假设 第一步:第一步:第二步:第二步: 选取统计量选取统计量0tXSn0100: HH拒绝域为拒绝域为0/2(1)xttnSn22. 未知时,未知时, 的检验的检验 (t 检验检验)未知未知 ,可用样本方差,可用样本方差2 代替代替 2 ) 1( nt) 1(2/nt) 1(2 /nt双侧检验法双侧检验法0 xtsn第四步:判断第四步:判断2| |(1)ttn则接受则接受H02| |(1)ttn则拒绝则拒绝H0第三步:计算第三步:计算t统计量的观测值统计量的观测值) 1( nt) 1(2/nt) 1(2 /nt0100:;:
17、)1( HH右边检验右边检验查表确定临界值查表确定临界值(1)ktn 取取 , 0 xtksn 0 xtsn (4),tt 0XtSn (2)选取统计量:)选取统计量: 拒绝域为拒绝域为 (3)计算)计算 则拒绝则拒绝 ,接受,接受1;H0H0.H反之,接受反之,接受 0左边检验左边检验查表确定临界值查表确定临界值(1)ktn 取取 , 0 xtn (4),tt 0XtSn (2)选取统计量:)选取统计量: 拒绝域为拒绝域为 (3)计算)计算 则拒绝则拒绝 ,接受,接受1;H0H0.H反之,接受反之,接受 0100:;:)1( HH0 xtksn 0显著差别?爆破压力显著差别?爆破压力X服从正
18、态分布服从正态分布 =0.05=0.05解解: : 提出假设提出假设 H H0 0: =549=549; H H1 1:549549nSXT0 对一批新的某种液体存储罐进行耐裂试验对一批新的某种液体存储罐进行耐裂试验, ,重复测量重复测量5 5次次, ,测得爆破压力数据为(单位斤测得爆破压力数据为(单位斤/ /寸寸2 2): :545 545 530 550 545545 545 530 550 545过去该种液体存储罐的平均爆破压力为过去该种液体存储罐的平均爆破压力为549549斤寸斤寸( (可可看作真值看作真值),),因为未知方差因为未知方差2 2,故采用,故采用t t检验法。检验法。取统
19、计量取统计量例4试问这批新罐的平均爆破压力与过去有无试问这批新罐的平均爆破压力与过去有无5490 由样本算得由样本算得这里这里543549| | | 1.777.58/5t接受接受H0。即这批新罐的平均爆破压力与过去无显即这批新罐的平均爆破压力与过去无显著差别。著差别。22543.5,7.58xs776. 2)4(025. 0 t拒绝域拒绝域/ 2(1)ttn776. 2)4()1(025. 02 tnt 查表查表例例1 一化学制品制备过程一天生产的化学制品产一化学制品制备过程一天生产的化学制品产量量(以吨计以吨计)近似服从正态分布。当设备运转正常时近似服从正态分布。当设备运转正常时一天产量的
20、均值为一天产量的均值为800吨。测得上周吨。测得上周5天的产量分别天的产量分别为为785,805,790,790,802.问是否可以认为日产量的均问是否可以认为日产量的均值显著小于值显著小于800.(取(取=0.05)解:设日产量解:设日产量XN(, 2), , 2均未知。均未知。 800:;800:10HH取检验假设因因2均未知,故采用均未知,故采用t检验检验. n=5,t0.05(4)=2.13180 xtsn0.05(4)2.1318t 拒绝域拒绝域62. 8, 4 .794sx计算得794.4800=-1.4527-2.13188.61975t统计量统计量t的观测值没有落在拒绝域内,故
21、接受的观测值没有落在拒绝域内,故接受H0,认,认为日产量均值不是显著小于为日产量均值不是显著小于800.假设检验方法假设检验方法p p值检验法值检验法临界值法临界值法. .p p值检验法值检验法例例1 根据以往经验,某工厂装配一只某种部件的时间根据以往经验,某工厂装配一只某种部件的时间(以分计以分计)近似服从正态分布,均值为近似服从正态分布,均值为10,标准差为,标准差为0.5.现在随机地选定现在随机地选定10只部件只部件, 测得某装配时间为测得某装配时间为 9.8 10.4 10.6 9.6 9.7 9.9 10.9 11.1 9.5 10.1,问是否可以认为现在装配时间的均值没有改变,问是
22、否可以认为现在装配时间的均值没有改变.解解 现在装配时间现在装配时间XN(,0.52),检验假设检验假设001:10,:10HH( =0.05)采用采用Z Z检验法检验法, ,检验统计量为检验统计量为./0nXZ的观察值为,代入上式计算得zx16.1001.0119z .3124. 0)0119. 1 (220119. 1|0ZPzZPp 由于由于p值值0.05,故接受,故接受H0,即,即 认为部件装配时间的均值为认为部件装配时间的均值为10(分钟)。(分钟)。值的定义为值的定义为一般一般 p,.的最小显著性水平的最小显著性水平是是由由值值假假设设检检验验问问题题的的)(valueyproba
23、bilitp绝绝值得出的原假设可被拒值得出的原假设可被拒检验统计量的样本观察检验统计量的样本观察的的值值可可以以根根据据检检验验统统计计量量任任一一检检验验问问题题的的 p下一个特定的下一个特定的统计量在统计量在样本观察值的以及检验样本观察值的以及检验0H)(10点点所规定的参数的分界所规定的参数的分界与与一般是一般是参数值参数值HH.对应的分布求出对应的分布求出,),(2均均值值的的检检验验中中例例如如在在正正态态分分布布 N 当当未知时,未知时, 可采用检验统计量可采用检验统计量定义).1( ntt那么在检验问题那么在检验问题,/0在以下三个检验问题中在以下三个检验问题中nXt ,0时时当
24、当 ,0tt的的观观察察值值为为如如果果由由样样本本求求得得统统计计量量中中0100:,: HH00ttPp 值值中中0100:,: HH00ttPp 值值 ,0右侧尾部面积右侧尾部面积t; 3如如图图;如图如图4 ,0左侧尾部面积左侧尾部面积t图3图4中中0100:,: HH时时当当0)(0 ti00ttPp 值值000ttttP ;如如图图右右侧侧尾尾部部面面积积5)(20t 时时当当0)(0 tii值值p00ttPp 值值000ttttP ),)(iii综合综合; 6)(20如如图图界界定定的的尾尾部部面面积积由由t 图5图6.)1(分分布布的的概概率率密密度度曲曲线线上上述述各各图图中
25、中的的曲曲线线均均为为 nt一般都给出检验问题的一般都给出检验问题的.0H下下接接受受则则在在显显著著性性水水平平 ,中中在在现现代代计计算算机机统统计计软软件件.值值p值的定义,值的定义,按按p, 水水平平对对于于任任意意指指定定的的显显著著性性就有就有,值值)若)若( p1;0H下下拒拒绝绝则则在在显显著著性性水水平平 ,值值)若)若( p2,方法方法值来确定检验拒绝域的值来确定检验拒绝域的利用利用p.0的拒绝域的拒绝域便的去定便的去定有了这两条结论就能方有了这两条结论就能方H这种这种.值检验法值检验法称为称为p.绝域的更多的信息绝域的更多的信息临界值法给出了有关拒临界值法给出了有关拒的的拒拒绝绝域域时时,用用临临界界值值法法来来确确定定0H,时知道要拒绝时知道要拒绝0H05. 0 例例如如当当,也也要要拒拒绝绝再再取取001. 0H 但不但不.0H绝绝再降低一些是否也要拒再降低一些是否也要拒能知道将能知道将 值法值法而而p.0的最小显著性水平的最小显著性水平给出了拒绝给出了拒绝 H值法比值法比因此因此p作业:P208 1、4(另附spss操作结果)、539谢谢!谢谢!