1、7Chapter总体分布的假设检验总体分布的假设检验总体分布参数及总体分布参数及Test sHyperthesi7.17.1 总体分布参数的假设检验总体分布参数的假设检验 1 1.假假设设检检验验的的基基本本概概念念 统计的基本任务是根据对样本的考察来统计的基本任务是根据对样本的考察来对总体的某些情况作出判断。采用先对总体对总体的某些情况作出判断。采用先对总体X的分布律或未知参数作某种假设,再运用统计的分布律或未知参数作某种假设,再运用统计分析的方法来检验这一假设是否正确,从而作分析的方法来检验这一假设是否正确,从而作出接受或拒绝的决定。这就是假设检验问题。出接受或拒绝的决定。这就是假设检验问
2、题。常把一个要检验的假设记作常把一个要检验的假设记作H0,称为原假设称为原假设(或零假设),与(或零假设),与H0对立的假设对立的假设H1,称为备择,称为备择假设。假设。1Def2Def某工厂在正常情况下生产的电灯泡的寿命某工厂在正常情况下生产的电灯泡的寿命X(小时小时)N(1600,802).从该工厂生产的一批灯从该工厂生产的一批灯泡中随机抽取泡中随机抽取10个灯泡,测得它们寿命为:个灯泡,测得它们寿命为:1450,1480,1640,1610.1500,1600,1420,1530,1700.1550如果标准差不变,试检验这批灯泡的寿命如果标准差不变,试检验这批灯泡的寿命均值均值也是也是1
3、600,或大于,或大于1600,或小于,或小于1600.eg以上有三种不同的形式,在统计学中通常记作:以上有三种不同的形式,在统计学中通常记作:;为为,为为16001600110HH)(;为为,为为16001600210HH)(.)(16001600310为为,为为HH由于是根据总体的一个样本的观测值及小由于是根据总体的一个样本的观测值及小 概率原理对所提出的假设进行检验并决定接受概率原理对所提出的假设进行检验并决定接受 或放弃所提出的假设,或放弃所提出的假设,因此假设检验的结果因此假设检验的结果会出现以下两类错误:会出现以下两类错误:在原假设为真时,决定放弃原假设,在原假设为真时,决定放弃原
4、假设,称为称为第一类错误第一类错误,其出现的概率通常记作,其出现的概率通常记作;在原假设不真时,决定接受原假设,在原假设不真时,决定接受原假设,称为称为第二类错误第二类错误,其出现的概率通常记作,其出现的概率通常记作。通常只限定犯第一类错误的最大概率通常只限定犯第一类错误的最大概率,不考虑犯第二类错误的概率不考虑犯第二类错误的概率。这样的假设。这样的假设 检验又称为显著性检验。检验又称为显著性检验。3Def =0.05=0.05。以下所讲述的假设检验,都是。以下所讲述的假设检验,都是显著性检验。显著性检验。当当H H0 0为为0 0、假设检验的结果是放弃、假设检验的结果是放弃H H0 0时,时
5、,如果如果=0.05=0.05,则称,则称与与0 0有显著的差异或有显著的差异或 差异显著;如果水平差异显著;如果水平=0.01=0.01,则称,则称与与0 0有有 极显著的差异或差异极显著。极显著的差异或差异极显著。0.010.01或或0.050.05或其他的数值,在未加说明时或其他的数值,在未加说明时 概率概率称为显著性水平称为显著性水平,可以等于可以等于 假设检验的步骤如下:假设检验的步骤如下:提出提出H H0 0和和H H1 1;指定概率指定概率;寻求统计量寻求统计量g(Xg(X1 1,X,X2 2,X,Xn n)及其分布;及其分布;当统计量的观测值当统计量的观测值g(x1,x2,g(
6、x1,x2,xn),xn)满足满足不等式时拒绝不等式时拒绝H H0 0、否则接受、否则接受H H0 0。在在H H0 0为真时构造小概率事件并推导为真时构造小概率事件并推导g g所满足的不等式;所满足的不等式;习惯上称观测值习惯上称观测值g g(x1,x2,xn)所所满足的不等式为假设检验方案,称满足的不等式为假设检验方案,称这个不等式所确定的观测值这个不等式所确定的观测值g g 的取的取值范围为假设检验的拒绝域。值范围为假设检验的拒绝域。拒绝域由两个区间构成的假设检拒绝域由两个区间构成的假设检验被形容为双侧检验,拒绝域由一个验被形容为双侧检验,拒绝域由一个区间构成的假设检验被形容为单侧检区间
7、构成的假设检验被形容为单侧检验。后面将要讲述的内容可以粗糙地验。后面将要讲述的内容可以粗糙地概括为:概括为:4Def H0为相等、为相等、H1为不相等为不相等的假设检验的假设检验为双侧检验,观测值为双侧检验,观测值g 较大或较小时较大或较小时拒绝拒绝H0;H0为相等、为相等、H1为大于为大于的假设检验为单的假设检验为单侧检验,观测值侧检验,观测值g 较大时较大时拒绝拒绝H0;H0为相等、为相等、H1为小于为小于的假设检验为的假设检验为单侧检验,观测值单侧检验,观测值g 较小时较小时拒绝拒绝H0。2.2.一个正态总体均值或方差的假设检验一个正态总体均值或方差的假设检验x为为 ,修正方差的观测值为
8、修正方差的观测值为s s*2 2,离均差,离均差平方和的观测值为平方和的观测值为ssss,显著性水平为,显著性水平为,则有:则有:设总体设总体X X服从服从N(,N(,2 2)分布,分布,X X的一个的一个样本为样本为X X1 1、X X2 2、X Xn n、均值为、均值为 、修正、修正方差为方差为S S*2 2、离均差平方和为、离均差平方和为SSSS,样本,样本的观测值为的观测值为x1,x2,xn ,均值的观测值均值的观测值X结论结论1 1)若若2 2已知,对于给定的数值已知,对于给定的数值0 0,作一个正态总体均值的假设检验时,作一个正态总体均值的假设检验时,H H0 0为为0 0,而,而
9、H H1 1分别为分别为0 0,0 0,0 0。可设可设,nXU0它的观测值它的观测值,nxu0当当H H0 0为真时,为真时,所所以以因因为为),1,0(NU,)(.5011uUP;.00501,认认为为时时拒拒绝绝当当Huu,)(12uUP;001,认认为为时时拒拒绝绝当当Huu,)(13uUP.001,认认为为时时拒拒绝绝当当Huu也可使用区间估计的结果做假设检验:也可使用区间估计的结果做假设检验:,1)1(5.01uUP;005.0105.01,认为接受时当HunXunX,1)2(1uUP;0001,认为时接受当HunX,1)3(1uUP;0010,认为时接受当HunX结论结论2 2)
10、若若2 2未知,对于给定的数值未知,对于给定的数值0 0,作一个正态总体均值的假设检验时,作一个正态总体均值的假设检验时,H H0 0为为0 0,而,而H H1 1分别为分别为0 0,0 0,0 0。可设可设,*nSXT0它的观测值它的观测值,*nsxt0当当H H0 0为真时,为真时,所所以以因因为为),1(ntT,)()(.11501ntTP;.00501,认认为为时时拒拒绝绝当当Htt,)()(121ntTP;001,认认为为时时拒拒绝绝当当Htt,)()(131ntTP.001,认认为为时时拒拒绝绝当当Htt 结论结论3 3),20未未知知,对对于于给给定定的的数数值值若若作一个正态总
11、体方差的假设检验时,作一个正态总体方差的假设检验时,分分别别为为,而而为为12020HH.)(,)(,)(202202202321可设可设,202SS它的观测值它的观测值,202ss当当H H0 0为真时,为真时,所所以以因因为为),1(22 n ,)()(.25012250211nP,.0250122502H时时拒拒绝绝或或当当;202认认为为,)()(12212nP,)(02121Hn时时拒拒绝绝当当;202认认为为,)1()3(22nP,)1(022Hn时拒绝当.202认为 作物栽培作物栽培已知豌豆百粒重已知豌豆百粒重X(X(单位:单位:g)g)服从正态分布服从正态分布N(37.72,0
12、.1089)N(37.72,0.1089),在改善栽,在改善栽培条件后随机抽出培条件后随机抽出9 9粒,平均重量粒,平均重量37.9237.92,问,问改善栽培条件是否显著地提高了豌豆的百粒改善栽培条件是否显著地提高了豌豆的百粒重,重,0.050.05。解:因为改善栽培条件不会降低豌豆籽的解:因为改善栽培条件不会降低豌豆籽的百粒重,所以设百粒重,所以设 H0为为37.72,H1为为37.721egnxu09237723710890902.,.,.,xn计算出计算出u=1.818,查查正正态态分分布布表表由由,65.195.0 u.72.37,0认为拒绝 H 品种提纯品种提纯一个混杂的小麦品种,
13、一个混杂的小麦品种,其株高的标准差为其株高的标准差为14cm14cm,经提纯后随机地,经提纯后随机地抽出抽出1010株,它们的株高株,它们的株高(单位:单位:cm)cm)为为90,90,105,101,95,100,100,101,105,93,97105,101,95,100,100,101,105,93,97,试,试检验提纯后的群体是否比原来的群体较为检验提纯后的群体是否比原来的群体较为整齐,整齐,0.050.05。解:提纯后的群体应该比原来的群体解:提纯后的群体应该比原来的群体较为整齐,故设较为整齐,故设 H0为为2196,H1为为2196,2eg,202ss,1019620n,由由观观
14、测测值值及及,.,.113112182ss计计算算得得,自自由由度度为为分分布布表表查查由由92,.,.)()(.33333399220502而而.,19620认认为为因因此此拒拒绝绝 H 3.3.两个正态总体均值或方差的假设检验两个正态总体均值或方差的假设检验),(),(222211NYNX总总体体设设总总体体观观测测值值的的一一个个样样本本为为,nXXXX21,2121YYYxxxn的的一一个个样样本本为为为为它它们们相相互互观观测测值值为为,mmyyyY21均均值值的的观观测测值值与与独独立立且且均均值值为为,YX,与与,离离均均差差平平方方和和为为与与为为SSYSSXyx2*XSssy
15、ssx,修修正正方方差差为为与与观观测测值值为为,显显著著性性水水平平与与观观测测值值为为与与222*,yxYssS,则则有有:为为结论结论4 4)已已知知,作作两两个个正正态态和和若若2221,总总体体均均值值的的假假设设检检验验时时H0为为12,而,而H1分别为分别为12,12,12。可设可设,mnYXU2221它的观测值它的观测值,mnyxu2221当当H0为真时为真时,因为,因为UN(0,1),所以,所以,)(.5011uUP;.210501,认认为为时时拒拒绝绝当当Huu,)(12uUP;2101,认认为为时时拒拒绝绝当当Huu,)(13uUP.2101,认认为为时时拒拒绝绝当当Hu
16、u结论结论5 5)未未知知,但但若若222221,假假设设检检验验时时,作作两两个个正正态态总总体体均均值值的的H0为为12,而,而H1分别为分别为12,12,12。可设可设,mnSYXTw11它的观测值它的观测值,mnsyxtw11,22mnssyssxsw式式中中当当H H0 0为真时,为真时,所所以以因因为为),2(mntT,)()(.21501mntTP;.210501,认认为为时时拒拒绝绝当当Htt,)()(221mntTP;2101,认认为为时时拒拒绝绝当当Htt,)()(231mntTP;2101,认认为为时时拒拒绝绝当当Htt结论结论6 6)若若1 1和和2 2未知,作两个正态
17、总体未知,作两个正态总体方差的假设检验时,方差的假设检验时,分分别别为为,而而为为122210HH.)(,)(,)(222122212221321可设可设,*22YXSSF 它的观测值它的观测值,*22yxssf 当当H H0 0为真时,为真时,所所以以因因为为),1,1(mnFF),()(.11150mnFFP,),(.11501mnFF,.050150HFfFf时时拒拒绝绝或或当当;2221认认为为,),()(1121mnFFP,),(0111HmnFf时时拒拒绝绝当当;2221认认为为,),()(113mnFFP,),(011HmnFf时时拒拒绝绝当当.2221认认为为 例例1.61.6
18、作物裁培作物裁培根据资料测算,某品种根据资料测算,某品种小麦产量小麦产量(单位:单位:Kg/mKg/m2 2)的的2 20.40.4。收获前。收获前在麦田的四周取在麦田的四周取1212个样点,得到产量的均值个样点,得到产量的均值=1.2=1.2,在麦田的中心取,在麦田的中心取8 8个样点,得到产量个样点,得到产量x的均值的均值 =1.4=1.4,试检验麦田四周及中心处每,试检验麦田四周及中心处每平方米产量是否有显著的差异平方米产量是否有显著的差异(=0.05)(=0.05)?y 解:因为要检验麦田四周及中心处每平方解:因为要检验麦田四周及中心处每平方米产量是否有显著的差异,所以设米产量是否有显
19、著的差异,所以设 H0为为12,H1为为12,,mnyxu2221,.,408122221mn容容量量为为,.,.,.69304121uyx计计算算出出由由查标准正态分布的分布函数值表得到查标准正态分布的分布函数值表得到 u0.975=1.96,|u|1.96,因此应该接受,因此应该接受H0,认为认为12,即麦田四周及中心处每平,即麦田四周及中心处每平方米产量没有显著的差异。方米产量没有显著的差异。例例1.81.8产量调查产量调查调查某地每亩调查某地每亩3030万苗万苗和和5050万苗的稻田各万苗的稻田各5 5块,分别得到亩产量块,分别得到亩产量800,800,840,870,920,8508
20、40,870,920,850和和900,880,890,890,840900,880,890,890,840,试检验两种密度的亩产量是否有显著的差异?试检验两种密度的亩产量是否有显著的差异?解:本例要检验解:本例要检验12,未未知知,应应先先检检验验和和由由于于22212221例中未给出显著性水平,可认为例中未给出显著性水平,可认为=0.05=0.05。设。设 ,*22yxssf 根据容量为根据容量为n nm m5 5的两个样本观测值算出的两个样本观测值算出,.,*5093550193022fssyx则由则由查查F分布的分位数表得到分布的分位数表得到F0.975(4,4)9.60,,.),(.6091440250F,.6096091 f而而.2221应该接受应该接受下面检验下面检验12,设设 H0为为12,H1为为12,,mnsyxtw11,22mnssyssxsw式式中中根据容量为根据容量为n nm m5 5的两个样本观测值算出的两个样本观测值算出,*550193022yxss,22007720ssyssx,880856yx,.,078112402tsw分分布布表表得得查查由由t,.)(.306289750t,.3062t,21因因此此认认为为即两种密度的亩产量没有显著的差异。即两种密度的亩产量没有显著的差异。作 业P186 习题7.11,2,6,7,9