1、第八章第八章 假假 设设 检检 验验 第一节 假设检验的概念 在总体X的分布完全未知,或只知其分布但不知其参数的情况下,我们对X的分布或分布中的参数作出某种假设,然后根据样本,用统计分析方法检验这一假设是否合理,从而作出接受或拒绝这一假设的决定一、基本概念一、基本概念 对总体 X 的分布或分布中的参数提出假设,就称为统计假设 所提出的假设叫做原假设原假设(或零假设),记为 H0,对立于原假设的假设称为备择假设备择假设(或对立假设),记为H1 假设检验就是根据样本,适当构造一个统计量,按照某种规则,决定是接受 H0(拒绝H1)还是拒绝 H0(接受H1),所使用的统计量称为检验统计量 只对总体分布
2、中的参数提出假设进行检验的问题,称为参数检验 二、两类错误二、两类错误 在确定检验法则时,应尽可能使犯两类错误的概率都较小但是,一般说来,当样本容量给定以后,若减少犯某一类错误的概率,则犯另一类错误的概率往往会增大,要使犯两类错误的概率都减小,只好增大样本容量 由于检验法则是依据样本作出的,因此假设检验的结果可能犯两类错误:第一类错误:当原假设H0为真时,作出的决定却是拒绝H0,犯这类错误的概率记为 ,即P拒绝H0|H0为真=第二类错误:当原假设H0不正确时,作出的决定却是接受H0,犯这类错误的概率记为 ,即P接受H0|H0不正确=在给定样本容量的情况下,我们总是控制犯第一类错误的概率,让它小
3、于或等于 ,而不考虑犯第二类错误的概率这种检验问题称为显著性检验问题显著性检验问题数 称为显著性水显著性水平平 的大小依具体情况确定,通常取 =0.1,0.05,0.01 在对假设进行检验时,常使用某个统计量T,称为检验统计量 当检验统计量取某个区域 W 中的值时,我们就拒绝原假设 H0,则称区域W 为拒绝域拒绝域拒绝域的边界点称为临界点当检验统计量在某区域中取值时,我们就接受 H0,则称此区域为接受域接受域 例1 某车间用一台包装机包装味精,每袋标准重量为100g,由已往经验知每袋重量的标准差 保持不变,每隔一定时间需要检查包装机的工作情况,现抽取 9 袋,测得它们的净重为:99.0,100
4、.2,99.3,99.1,99.6,99.2,99.9,100.1,99.3 假定每袋重量服从正态分布,试问这段时间内包装机的工作是否正常(取显著性水平 )?g5.005.0 解 设每袋重量 ,回答包装机的工作是否正常,相当于判断 是否正确因此原假设H0:,备择假设为H1:)5.0,(2NX)(10001000,100在 H0 正确条件下 是一个统计量,且 又因为 是 的无偏估计,所以 不应该很大,即 大过某个常数时,就应该拒绝H0拒绝域的形式为nXu/0)1,0(NuX|0XknX/0|0X.当 的取值大于 时就应拒绝H0,否则接受H0 于是令犯第一类错误的概率为 ,即 查标准正态分布表可得
5、 ,于是有 ./|0knXP2/uk./|2/0unXPnXu/|02/u 现在 所以拒绝H0,即认为这段时间内包装机的工作不正常,96.1,52.9991,9,5.0,1002/910uxxniinxu/|096.188.29/5.0|10052.99|*参数检验的一般步骤为:1根据问题的要求,提出原假设 H0和备择假设 H1;2给出显著性水平 及样本容量 n;3在H0正确下确定检验统计量 T 及拒绝域的形式;4按犯第一类错误的概率等于 求出拒绝域W;5根据样本值计算 T 的观察值 t,当 时,拒绝H0,否则接受H0 Wt 三、双边检验与单边检验三、双边检验与单边检验 在备择假设H1:中,可
6、能大于 ,也可能小于 ,称H1为双边备择假设,相应的检验称为双边检验 如果对假设H0:,H1:进行检验称为右边检验 如果对假设H0:,H1:进行检验称为左边检验 右边检验的拒绝域为 ,左边检验的拒绝域为 000kt kt 0000 例2 某工厂生产的固体燃料推进器的燃烧率服从正态分布 ,,现在用新方法生产了一批推进器,从中抽取 n=25只,测得样本均值为 设在新方法下总体的标准差仍为 ,问这批新推进器的燃烧率是否较以往生产的推进器的燃烧率有显著提高?取显著性水平 sN/cm40),(2s/cm2sx/cm25.41s/cm205.0 解 ,依题意检验假设为 H0:(即新方法未提高燃烧率)H1:
7、(即新方法提高了燃烧率)这是一个右边检验问题,其检验统计量为 ,拒绝域为 现在 ,00400)1,0(/0NnXu645.105.0uuu645.1125.325/24025.41/0nxu 即 u 的取值落在拒绝域中,所以在显著性水平 =0.05下拒绝 H0,接受 H1,即认为这批新推进器较以往提高了燃烧率 第二节 单个正态总体均值与方差的假设检验 一、方差已知时,正态总体均值的假设检验u 检验 假设总体 ,(X1,X2,Xn)是来自总体 X 的样本,已知,这里要检验的假设是H0:,H1:),(2NX200 当H0成立时,检验统计量 )1,0(/0NnXu 类似地可以检验单边假设(见表8-1
8、)上述检验所用统计量服从标准正态分布,称为 u 检验法 对于给定的显著性水平 ,拒绝域为|2/uuuW 例1 一种元件,要求其平均寿命不小于1000h,现在从一批这种元件中随机抽取25件,测得平均寿命为 950 h,已知这种元件寿命服从 =100 h 的正态分布,试在显著性水平 =0.05 条件下确定这批元件是否合格 解 H0:,H1:.当H0为真时,检验统计量 10001000)1,0(/1000NnXu 对于给定的显著性水平 =0.05,查表得 此题是一个左边检验的问题,拒绝域为 现在 n=25,=100,=950 所以拒绝H0,而接受H1,即认为这批元件不合格 645.105.0 uu6
9、45.1uu645.15.2/1000nxux 二、方差未知时,正态总体均值的二、方差未知时,正态总体均值的假设检验假设检验t t 检验检验 设总体 ,未知,(X1,X2,Xn)是来自总体 X 的样本这里要检验的是H0:,H1:),(2NX200.)1(/0ntnSXT 对于给定的显著性水平 ,拒绝域为 .2)1(|2/ntt 我们用 S 2 代替 ,当H0为真时,检验统计量 上述检验统计量服从 t 分布,称这种检验为 t 检验类似地可以进行单边检验(见表8-1)解 这里是在总体方差 未知的情况下,检验假设 H0:,H1:在H0成立时,检验统计量 对于给定的显著性水平 =0.05,拒绝域为15
10、001502.)1(/0ntnSXT.)1(|2/ntt 例2 某车间加工一种零件,要求长度为150mm,今从一批加工后的这种零件中抽取 9 个,测得长度如下:147,150,149,154,152,153,148,151,155 假设零件长度服从正态分布,问这批零件是否合格(取 =0.05)?这里 所以接受H0,即认为这批零件合格,15191,991iixxn,5.7)(1919122iixxs,739.25.7s.306.2)8()1(025.02/tnt.306.2096.1/|0nsxt 三、正态总体方差的假设检验三、正态总体方差的假设检验 检验检验2 设总体 ,(X1,X2,Xn)为
11、X 的样本,给定显著性水平 1当 已知时,方差 的假设检验 H0:,H1:其中 为已知常数检验统计量),(2NX202202.)()(121220nXTnii220 对于给定的显著性水平 ,拒绝域为 或 上述检验的统计量服从 分布,称此种检验为 检验,类似地可以进行单边检验(见表 8-1))(22/1nt)(22/nt22 或 2当 未知时,的假设检验 H0:,H1:检验统计量 对于给定的显著性水平 =0.1,拒绝域为2202.)1()1(2202nSnT202)1(22/1nt)1(22/nt 例3 某厂生产的尼龙纤维的纤度在正常情况下服从正态分布,其标准差 =0.048,某日抽取5根纤维,
12、测得它们的纤度为1.32,1.36,1.55,1.44,1.40 试问能否认为这一天尼龙纤维的纤度的标准差 =0.048(取 =0.1)?解 这里要检验的假设是 H0:=0.048,H1:0.048 检验统计量 对于给定的显著性水平 =0.1,拒绝域为 或 .)1(048.0)1(222nSnT)1(22/1nt)1(22/nt 这里 =1.414,=0.00778,所以拒绝H0,即不能认为这一天尼龙纤度的标准差 =0.048,711.0)4()1(295.022/1n,488.9)4()1(205.022/nx2s.)4(51.13048.000778.0)15(205.02t第三节 两个正
13、态总体均值差与方差比的假设检验 设总体 X 与 Y 相互独立,,(X1,X2,Xm)与(Y1,Y2,Yn)分别为来自总体 X 与 Y 的相互独立的样本),(211NX),(222NY 一、方差已知时,两个正态总体均值差的假设检验u 检验 设 为已知,要检验的假设为 H0:,H1:,也可以写成 H0:,H1:2221,2102121021 检验统计量为 对于给定的显著性水平 ,查表得 ,使得 拒绝域为.)1,0(2221NnmYXu2/u,|2/uuP.|2/uu 二、方差未知但相等时,两个正态总体均值差的假设检验 t 检验22221,)2(11nmtnmsYXtw 设 为未知,要检验的假设为
14、H0:1=2(12=0),H1:12 检验统计量 其中 ,对于 给定的显著性水平,查表得t/2()使 得 P|t|t/2()=,从而可知拒绝域为|t|t/2()2)1()1(22212nmSnSmsw2wwss2 nm2 nm2 nm 注意 当 与 未知时,首先要检验方差齐性,即要检验 =,然后才能使用上述检验法21222122 例1 在甲、乙两个工厂生产的蓄电池中,分别取5个测量电容量,数据如下:甲厂:143 141 138 142 140 乙厂:141 143 139 144 141设甲、乙两厂蓄电池的电容量分别服从 N(1,)和N(2,),且 =.问两厂的电容量有无显著差异(取=0.05
15、)?21222122 解法一 设X,Y分别表示甲、乙两厂蓄电池 的电容量,于是有XN(1,),YN(2,),=要检验的假设为H0:1=2,H112 检验统计量 拒绝域为|t|t/2(m+n2)2221.)2(11nmtnmsYXtw2221 这里=0.05,m=n=5,查表得 t/2(m+n2)=t 0.025(8)=2.306,(143+141+138+142+140)=140.8,(141+143+139+144+141)=141.6,51x51y =0.6535 2.306,即|t|t0.025(8),因此接受原假设H0,即认为甲乙两厂蓄电池的电容量无显著 差异 (143 140.8)2
16、+(141 140.8)2+(138 140.8)2+(142 140.8)2+(140 140.8)2=3.699,(141 141.6)2+(143 141.6)2+(139 141.6)2+(144 141.6)2+(141 141.6)2=3.799,=3.7499,4121s4122s84422212sssw51517499.3|6.1418.140|11|nmSyxtw 解法二 (当两个样本容量相等时,两个正态总体均值是否相等的检验,可化为单个总体 Z=XY 的均值是否为零的检验)设 Z=XY,则 Z N(,2),其中=12,由已知数据可知Z的样本观察值为22212 2,2,1,2
17、,1 需要检验的假设为 H0:=0,H1:0 检验统计量为 拒绝域为|t|t/2(n1)1(/ntnSZt.这里=0.05,n=5,查表得 t/2(n1)=t0.025(4)=2.7764,(22121)=0.8,s2=2.699于是 =0.2177 2.7764 因此接受原假设 H0,即认为两厂蓄电池的电容量无显著差异51z5/699.28.0/|nszt 注 两种解法的结果相同,而后一种解法的计算量较前一种解法要小得多另外,后一种解法可以取消 的要求2221 三、两个正态总体方差比的假设检三、两个正态总体方差比的假设检验验F 检验检验 1均值1,2已知时,方差比 的假设检验2221/这里要
18、检验的假设为 H0:,H1:由于 且 与 相互独立,在H0成立的条件下,有22212221,)()(1,)()(12122222221212121nYmXnjjmii.),()()(/1221212221nmFmnYXnmFnjjmii2122 对于给定的显著性水平,查表得F/2(m,n)和 F1/2(m,n),我们有PF1/2(m,n)F F/2(m,n)=1,因此得到拒绝域为F F1/2(m,n)或 F F/2(m,n)这种利用 F 分布进行检验的方法,称为 F 检验 2均值1,2未知时,方差比 的假设检验2221/这里要检验的假设为 H0:,H1:由于22212221,)1()1(,)1
19、()1(22222222212121nSnmSm 且 与 相互独立,在H0成立的条件下,有.)1,1(1/1/22212221nmFSSnmF2122 PF1/2(m1,n1)F/2(m1,n1)=1,因此得到拒绝域为 F1/2(m1,n1)或 F/2(m1,n1)对于给定的显著性水平,查表得 F/2(m1,n1)和 F1/2(m1,n1),我们有2221SS2221SS2221SS 例2 从两个正态总体分别独立地抽取样本观察值如下:甲:4.4 4.0 2.0 4.8 乙:6.0 1.0 3.2 0.4能否认为两个样本观察值来自同一总体(取=0.05)解 设两个正态总体分别为 XN(1,)和Y
20、N(2,),首先检验 H0:=由于1,2未知,所以检验统计量为 F=F(m1,n1)拒绝域为 F1/2(m1,n1)或 F/2(m1,n1)22212221SS21222221SS2221SS 这里=0.05,m=n=4,查表得 F/2(m1,n1)=F0.025(3.3)=15.44,F1/2(m1,n1)=由于 0.065 =0.24 15.44,因此接受原假设H0,即认为两个正态总体的方差相同(=),065.044.151)3.3(1)1,1(1025.02/FmnF,8.3x,6.2y,55.121s,44.622s2221ss44.655.12122 下面再检验假设 :1=2 0H
21、由于 =但未知,所以取检验统计量为 拒绝域为|t|t/2(m+n2)2122.)2(11nmtnmsYXtw 因为t/2(m+n2)=t0.025(6)=2.4469,而 =0.82 2.4469,所以接受 ,即认为两个正态总体的均值相同4141644.6355.13|65.280.3|11|nmsyxtw0H 综上所述,在显著性水平 =0.05下,认为两个样本值来自同一总体 名 称条 件假 设 统 计 量 及 其 分 布拒 绝 域H 0H 1附表附表 正态总体参数的假设检验表正态总体参数的假设检验表总 体 数已 知已 知未 知未 知 检 验 检 验 ut222221,222111220021
22、21000000212121212121)1,0(0NnXu)1,0(2221NnmYXu)1(0ntnSXt)2(11nmtnmSYXtw2)1()1(22212nmSnSmSw|u|u/2u u u -u|u|u/2u u u -u|t|t/2(n1)t t(n1)t -t(n1)|t|t/2(m+n2)t t(m+n2)t -t(m+n2)检 验 已 知未 知21202202202202202202202202附表附表 正态总体参数的假设检验表正态总体参数的假设检验表(续表续表)检 验 已 知未 知21,22221222122212221 名 称条 件假 设 统 计 量 及 其 分 布拒
23、 绝 域H 0H 121,F2221222122212221总 体 数miinX122202)()(1)1()1(22022nSn),()()(122121nmFYmXnFnjjmii)1,1(2221nmFSSF)(22/12n)(22/2n)(22n)(212n或)1(22/12n)1(22/2n)1(22n)1(212n或),(12/mnFF),(2/nmFF),(nmFF),(1mnFF或)1,1(12/mnFF)1,1(2/nmFF)2,1(nmFF)1,1(1mnFF或第四节 大样本情况下非正态总体均值的假设检验 设非正态总体 X 具有有限的均值 E(X)=和非零方差 D(X)=2
24、,当样本容量 n 很大(n50)时,由中心极限定理可知 近似地服从标准正态分布N(0,1),要检验的假设为H0:=0 nXDXEXu/)()((1)当方差2已知时,在H0成立的条件下,检验统计量 (1)近似服从标准正态分布N(0,1),对于给定的显著性水平,查表得 u/2,使 ,因此得到拒绝域为nXu/0|2/uuP.|2/uu (2)当方差2未知时,用 S2 代替2,检验统计量为 (2)仍然近似服从标准正态分布 N(0,1),拒绝域为nSXu/0.|2/uu (3)右边检验 H0:=0,H1:0的拒绝域为 左边检验 H0:=0,H1:0的拒绝域为.uu.uu 例1 某工厂生产一批产品,要求次
25、品率不超过10%,如果从产品中抽取50件,发现有8件次品,可否认为这批产品合格(取=0.05)?解 设次品率为 p,要检验的假设为 H0:p=p0=0.1,H1:p0.1 由于总体 X 服从参数为 p 的(0-1)分布,方差为2=D(X)=p(1p)在H0 成立的条件下,检验统计量为拒绝域为 uu.)1(/0000npppXnpXu 这里 u=u0.05=1.645,n=50,于是因此,在显著性水平=0.05下接受H0,即认为这批产品合格16.0508x,645.1414.1509.01.01.016.0u 例2 对于一个未知分布的总体 X,从中抽取容量为150的样本观察值,算得 ,s=4,在
26、显著性水平=0.05下检验假设H0:=04.0 x 解 这里方差2未知,因此检验统计量为 拒绝域为 查表得 =u0.025=1.96./0nSXu2/|uu 2/u由于所以接受H0,即认为总体的均值=0,96.122.15044.0/|0|nsxu 在总体 X 的分布未知时,检验总体的分布函数 F(x)是否与已知的分布函数 F0(x)有显著差别,即检验H0:F(x)=F0(x)这类问题称为非参数检验 若总体分布为离散型,则上述假设相当于 H0:总体 X 的分布律为 若总体分布为连续型,则相当于检验假设H0:f(x)=f0(x)(f0(x)为已知密度函数)2,1,ipaXPii第五节 总体分布的
27、假设检验 检验2区间的频率为 ,如果假设 H0 成立,即 F(x)=F0(x),则落入第 i个区间内的概率为 在这里,视 称 pi 为理论频率,称 nipi 为理论频数 为检验假设H0,在实数轴上取k1个点 t1 t2tk1,把实数轴分成 k 个区间:(,t1,(t1,t2,(tk1,)对于总体 X 的一个样本观察值(x1,x2,,xn),计算出 x1,x2,xn 落入第 i 个区间 (ti1,ti的个数ni(称为实际频数),则落入该),2,1(/kinni.,2,1)()(1001kitFtFtXtPpiiiiiktt,0 由频率与概率的关系知道,当原假设H0成立时,(ni/npi)2 应该
28、比较小,也应该比较小,因此比较小才合理上式称为皮尔逊统计量kinpnpnnppnniiiiii,2,1)(/)/(22kiiiinpnpn12)(如果F0(x)中含有r 个未知参数1,2,r 即总体 X 的分布函数为 F0(x;1,2,r),则应先求出1,2,r 的极大似然估计 ,再求出r,21.,2,1),;(),;(2110210kitFtFpririi 可以证明,在假设H0成立的条件下,不论F0(x)是怎样的分布函数,当样本容量充分大时,皮尔逊统计量总是近似地服从自由度为k1的 分布kiiiinpnpn122)(2 对于给定的显著性水平,当样本容量 n 很大时,有原假设H0的拒绝域为,)
29、1(22kP.)1(22kW当 n 充分大时,统计量近似地服从自由度为 k r 1的 分布此时假设 H0:的拒绝域为kiiiipnpnn122)(2),;()(210rxFxF.)1(22rkW 注意 在使用上述皮尔逊 检验法时,通常应取 n 50,且每个 npi 5,如果某些区间的 npi 太小,则应适当地将相邻若干个区间合并,使合并后的区间上 npi 超过 5,此时要相应减少自由度2 例1 在一实验中,每隔一定时间观察一次由某种铀所放射的到达计数器上的粒子数 X,共观察于 100 次,得结果如表 8-2 所示其中 ni 是观察到有 i 个粒子的次数从理论上考虑,X 应服从泊松分布试在显著性
30、水平=0.05下检验这一理论分析是否符合实际?表表8-2 铀放射的铀放射的粒子数的实验记录粒子数的实验记录 i 0 1 2 3 4 5 6 7 8 9 10 11 ni 1 5 16 17 26 11 9 9 2 1 2 1 100 当H0成立时,有,!e2.42.4iiXPpii.,2,1,0,!e2.41002.4iipnii 解 此问题要检验的假设为 H0:,其中 0未知,由极大似然估计法知,2,1,0,!eiiiXPi.2.4 x 将计算结果列于表 8-3 中,其中有些理论频数 小于 5 的组予以适当合并,使新的一组内理论频数 均5,如表 8-3 中花括号所示ipnipn 表表 8-3
31、 检验计算表检验计算表 i ni 0 1 1.5 1 5 6.3 2 16 13.2 2.8 0.594 3 17 18.5 1.5 0.122 4 26 19.4 6.6 2.245 5 11 16.3 5.3 1.723 6 9 11.4 2.4 0.505 7 9 6.9 2.1 0.639 8 2 3.6 9 1 1.7 10 2 0.7 0.5 0.038 11 1 0.3 12 0 0.2 100 10 0.0 0.0 6.281 iipnn)/()(2iiipnpnn 1.8 0.4152ipn 此时 k=8,r=1,因此,所用的 分布的自由度为 k r 1=8 11=6 拒绝域为 =12.592 由于 =6.281 12.592,所以在显著性水平=0.05下接受H0,即认为样本来自=4.2 的泊松分布总体也就是说,由理论分析导出的结论是符合实际的2)1(2rk.592.12)6(205.02)6(205.02