1、7.1 假设检验的基本思想与概念7.2 正态总体参数假设检验7.3 其它分布参数的假设检验7.4 分布拟合检验7.1 假设检验的基本思想与概念 7.1.1 假设检验问题 某产品出厂检验规定某产品出厂检验规定:次品率次品率p不不超过超过4%才能出厂才能出厂.现从一万件产品中任意现从一万件产品中任意抽查抽查12件发现件发现1件次品件次品,问该批产品能否出问该批产品能否出厂?若抽查结果发现厂?若抽查结果发现3件次品件次品,问能否出厂?问能否出厂?引例引例1 1 抽查抽查12件发现件发现1件按理不能出厂件按理不能出厂.分析分析04.0083.012/1直接算直接算求检验准则:求检验准则:抽取的抽取的1
2、2个产品中至少有几个次品则判个产品中至少有几个次品则判断不合格?断不合格?思路:思路:假定假定p4%,该批产品不能出厂该批产品不能出厂.对总体对总体 提出假设提出假设1(;)(1),0,1xxX f x pppx04.0:;04.0:10pHpH要求利用样本观察值要求利用样本观察值)13(121orxii对提供的信息作出接受对提供的信息作出接受 (可出厂可出厂),还还是接受是接受 (不准出厂不准出厂)的判断的判断.0H1H),(1221xxx出厂检验问题的数学模型出厂检验问题的数学模型(1)(1)小概率原理小概率原理:认为概率很小的事件在一次试验认为概率很小的事件在一次试验中实际上不会出现中实
3、际上不会出现,并且小概率事件在一次试验并且小概率事件在一次试验中出现了中出现了,就被认为是不合理的就被认为是不合理的.(2)(2)基本思想基本思想:先对总体的参数或分布函数的先对总体的参数或分布函数的作作出某种假设出某种假设,然后找出一个在假设下发生可能性然后找出一个在假设下发生可能性甚小的甚小的小概率事件小概率事件.如果试验或抽样的结果使该小概率事件发生了如果试验或抽样的结果使该小概率事件发生了,这与小概率原理相违背这与小概率原理相违背,表明原来的假设有问题表明原来的假设有问题,应应拒绝这个假设拒绝这个假设.若该小概率事件在一次试验或若该小概率事件在一次试验或抽样中并未出现抽样中并未出现,表
4、明试验或抽样结果支持这个表明试验或抽样结果支持这个假设假设,则则接受原来的假设接受原来的假设.需要根据实际问题的需要需要根据实际问题的需要,对总体参数或分对总体参数或分布函数的表达式做出某种假设布函数的表达式做出某种假设(称为称为统计假统计假设设),),再利用从总体中获得的样本信息来对所再利用从总体中获得的样本信息来对所作假设的真伪做出判断或进行检验作假设的真伪做出判断或进行检验.这种利用样本检验统计假设真伪的过程叫做统计检验统计检验(假设检验假设检验)7.1.2 假设检验的基本步骤 一、一、建立假设 在假设检验中,常把一个被检验的假设称为原假设,用 表示,通常将不应轻易加以否定的假设作为原假
5、设。当 被拒绝时而接收的假设称为备择假设,用 表示,它们常常成对出现。0H0H1H在引例1中,我们可建立如下两个假设:0:4%Hp vs1:4%Hp 二、选择检验统计量 由样本对原假设进行判断总是通过一个统计量完成的,该统计量称为检验统计量。找出在原假设 成立条件下,该统计量所服从的分布。0H三、选择显著性水平,给出拒绝域形式小概率原理中小概率原理中,关于关于“小概率小概率”的值通常根据实的值通常根据实际问题的要求而定际问题的要求而定,如取如取=0.1,0.05,0.01=0.1,0.05,0.01等等,为检验的显著性水平为检验的显著性水平(检验水平检验水平).根据所要求的显著性水平根据所要求
6、的显著性水平,描写小概率事件的描写小概率事件的统计量的取值范围称为该原假设的统计量的取值范围称为该原假设的拒绝域拒绝域(否定否定域域),),一般用一般用W W表示;一般将表示;一般将 称为称为接受域接受域。拒绝域的边界称为该假设检验的拒绝域的边界称为该假设检验的临界值临界值.W/2/2X(x)接受域接受域P(|U|u1/2)=拒绝域拒绝域拒绝域拒绝域 u1/2-u1/2例例7.1.1 某厂生产的合金强度服从某厂生产的合金强度服从 ,其中,其中 的设计值的设计值 为不低于为不低于110(Pa)。为保证质量,该。为保证质量,该 厂每天都要对生产情况做例行检查,以判断生厂每天都要对生产情况做例行检查
7、,以判断生 产是否正常进行产是否正常进行,即该合金的平均强度不低于即该合金的平均强度不低于 110(Pa)。某天从生产中随机抽取某天从生产中随机抽取25块合块合金,金,测得强度值为测得强度值为x1,x2,x25,其均值为,其均值为 (Pa),问当日生产是否正常?,问当日生产是否正常?(,16)N108x H0:=110 原假设原假设原假设的对立面原假设的对立面:H1:0)00(,1)/XUNnn当样本容量当样本容量 一定时一定时,小小,就大就大,反之反之,小小,就大就大.n在进行假设检验时在进行假设检验时,我们采取的原则是我们采取的原则是:控制犯第一类错误控制犯第一类错误(即即 事先给定且很小
8、事先给定且很小)的同时使犯的同时使犯第二类错误的概率达到最小第二类错误的概率达到最小.关于原假设与备择假设的选取关于原假设与备择假设的选取H H0 0与与H H1 1地位应平等地位应平等,但在控制犯第一类错误的概但在控制犯第一类错误的概率率 的原则下的原则下,使得采取拒绝使得采取拒绝H H0 0 的决策变得的决策变得较慎重较慎重,即即H H0 0得到特别的保护得到特别的保护.因而因而,通常把有把握的、有经验的结论作为原通常把有把握的、有经验的结论作为原假设假设,或者尽可能使后果严重的错误成为第一或者尽可能使后果严重的错误成为第一类错误类错误.犯第一类错误的概率犯第一类错误的概率 和犯第二类错误
9、的和犯第二类错误的概率概率 可以用同一个函数表示,即所谓的可以用同一个函数表示,即所谓的势函数势函数。势函数是假设检验中最重要的概势函数是假设检验中最重要的概念之一,定义如下:念之一,定义如下:定义定义7.1.1 设检验问题设检验问题0011:HvsH的拒绝域为的拒绝域为W,则样本观测值落在拒绝域,则样本观测值落在拒绝域内的概率称为该检验的内的概率称为该检验的势函数,势函数,记为记为 01()(),gPWx (7.1.3)势函数势函数 是定义在参数空间是定义在参数空间 上的一个函数。上的一个函数。犯犯两两类错误的概率都是参数类错误的概率都是参数 的函数,并可由势的函数,并可由势函数算得,即:函
10、数算得,即:()g01(),()1(),g 对例对例7.1.17.1.1,其拒绝域为,其拒绝域为 ,由,由(7.1.3)可可以算出该检验的势函数以算出该检验的势函数()()4/54/54/5xccgP xcP Wx c这个势函数是 的减函数 1vv0g同时可得如下结论:同时可得如下结论:利用这个势函数容易写出犯利用这个势函数容易写出犯两两类错误的概率类错误的概率分别为分别为()4/5,c 0和和()1,4/5c 1,1思考:思考:吗?吗?当当 减小时,减小时,c 也随之减小,必导也随之减小,必导致致 的增大;的增大;当当 减小时,减小时,c 会增大,必导致会增大,必导致 的的增大;增大;说明:
11、在样本量一定的条件下不可能找到一说明:在样本量一定的条件下不可能找到一个使个使 和和 都小的检验。都小的检验。英国统计学家 Neyman 和 Pearson 提出水平为 的显著性检验的概念。(),g则称该检验是则称该检验是显著性水平为显著性水平为 的显著性检的显著性检验验,简称,简称水平为水平为 的检验的检验。定义定义7.1.2 对检验问题对检验问题00:H对11:H如果一个检验满足对任意的如果一个检验满足对任意的 ,0都有都有 求势函数求势函数例:例:见见P334 NO.27.2 正态总体参数假设检验 参数假设检验常见的有三种基本形式(1)0010:HvsH(2)0010:HvsH(3)00
12、10:HvsH 当备择假设 在原假设 一侧时的检验称 为单侧检验;0H1H 当备择假设 分散在原假设 两侧时的检验 称为双侧检验。0H1H 2)确定检验统计量确定检验统计量:00|/HXun成 立)1,0(N H0:=0(已知已知);H1:0 (双侧检验)双侧检验)1)提出原假设和备择假设提出原假设和备择假设:H0:=0;H1:0,3)对给定对给定,由原假设成立时由原假设成立时P(|u|u1/2)=得得 拒绝条件为拒绝条件为|u|u1/27.2.1 单个正态总体均值的检验一、已知 时 的检验设总体设总体XN(,2),X1,X2,Xn 为一组样本,为一组样本,/2/2X(x)接受域接受域P(|U
13、|u1-/2)=否定域否定域否定域否定域 u1-/2-u1-/2双侧统计检验双侧统计检验U检验检验该检验用该检验用 u 检验统计量,故称为检验统计量,故称为u 检验。检验。2)对统计量对统计量:1)提出原假设和备择假设提出原假设和备择假设:H0:0;H1:0,3)故故 拒绝条件为拒绝条件为U u1-0/XUn对给定的对给定的有有在H0下有,/0nXnX011/XXuunn所以所以011()()/XXPuPunnX(x)接受域接受域否定域否定域 u1-单侧(右侧)统计检验P(u1-)U 2)选择统计量选择统计量:1)提出原假设和备择假设提出原假设和备择假设:H0:0;H1:0,3)对给定对给定,
14、否定域为否定域为U-u1-,0/XunX(x)接受域接受域否定域否定域 -u1-单侧(左侧)统计检验P(2.776,故拒绝原假设,认为该厂生产的铝材的长度不满足设定要求。若取=0.05,则 t0.975(4)=2.776.239.5,0.4,xs故检验法条件检验统计量拒绝域u 检验已知t 检验未知原假设0H备择假设1H00000011/2|uuuuuu0/xun0/xtsn11/2(1)(1)|(1)t tnt t nt tn000000表7.2.1 单个正态总体的均值的检验问题(比如单总体均值检验中(比如单总体均值检验中,当已知总体方差时,用当已知总体方差时,用U U 统计量统计量;总体方差
15、未知时,用总体方差未知时,用t t 统计量)统计量)三、假设检验与置信区间的关系 这里用的检验统计量与6.5.5节中置信区间所用的枢轴量是相似的。这不是偶然的,两者之间存在非常密切的关系。设 是来自正态总体 的样本,现在 未知场合讨论关于均值 的检验问题。考虑双侧检验问题:1,nxx2(,)N 0010:HvsH它可以改写为1/201/2(1)(1)ssWxtnxtnnn并且有0()1,PW若让0 在(-)内取值,就可得到 的1-信区间:这里0并无限制.1/2(1)sxtnn01/2|(1)sWxtnn则水平为的检验接受域为 00:H关于 的水平为的显著性检验。00:H是一一对应的。类似地,“
16、参数 的1-置信上限”与“关于00:H 的单侧检验问题的水平的检验”反之若有一个如上的1-置信区间,也可获得所以:“正态均值 的1-置信区间”与“关于 的双侧检验问题的水平的检验”参数 的1-置信下限与另一个单侧检验也是一一对应的。是一一对应的。假设检验与置信区间对照假设检验与置信区间对照2211(,)x ux unn201xun接受域置信区间检验统计量及其在H0为真时的分布枢轴量及其分布 0 0(2 已知)1,0(0NnXU(2 已知)(0,1)XUNn原假设 H0备择假设 H1待估参数接受域置信区间检验统计量及其在H0为真时的分布枢轴量及其分布原假设 H0备择假设 H1待估参数 0 0(2
17、未知))1(0nTnSXT(2未知))1(0nTnSXT)2nstx20tnsx,(2nstx接受域置信区间11假设检验区间估计统计量 枢轴量对偶关系相似函数假设检验与区间估计的联系假设检验与区间估计的联系7.2.2 两个正态总体均值差的检验检验法条件原假设备择假设检验统计量拒绝域u检验已知t 检验未知0H1H12,12,1212121212122212xyumn11/2|uuuuuu11wxytsmn11/2(2)(2)|(2)ttm ntt m nttm n 12121212121212大样本检u 验 未知m,n充分大近似t 检验未知m,n不很大12,12,22yxxyussmn11/2|
18、uuuuuu22yxxytssmn11/2(1)(1)|(1)ttlttlttl121212121212121212121212444022/,11yxsslsmmnn2220/xyssmsn例7.2.3 某厂铸造车间为提高铸件的耐磨性而 试制了一种镍合金铸件以取代铜合金铸件,为此,从两种铸件中各抽取一个容量分别为 8和9的样本,测得其硬度为 镍合金:76.43 76.21 73.58 69.69 65.29 70.83 82.75 72.34铜合金:73.66 64.27 69.34 71.37 69.77 68.12 67.27 68.07 62.61 根据经验,硬度服从正态分布,且方差保
19、持不变。试在显著性水平下判断镍合金的硬度是否有明显提高。解:用X 表示镍合金的硬度,Y 表示铜合金的硬 度,则由假定,21(,),XN 22(,).YN 要检验的假设是:012112:HvsH经计算,89221173.39,68.2756,()205.7958,()91.1552iiiixyxxyy从而1(205.795891.1552)4.4494892ws 73.3968.27562.2210114.449478t查表知0.95(15)1.7531,t由于0.95(15)tt故拒绝原假设,可判断镍合金硬度有显著提高。7.2.3 正态总体方差的检验一、单个正态总体方差的检验 设 是来自 的样
20、本,对方差亦可考虑如下三个检验问题:1,nxx2(,)N 22220010:HvsH22220010:HvsH22220010:HvsH通常假定 未知,它们采用的检验统计量是相同的,均为 若取显著性水平为,则对应三个检验问题的拒绝域依次分别为22201,ns2211;Wn221;Wn222221211Wnn或例7.2.4 某类钢板每块的重量X 服从正态分布,其一项质量指标是钢板重量的方差不得超过 0.016(kg2)。现从某天生产的钢板中随机抽取 25块,得其样本方差S2=0.025(kg2),问该天生 产的钢板重量的方差是否满足要求。解:原假设为20:0.016,H备择假设为21:0.016
21、,H此处n=25,若取=0.05,则查表知20.952436.4152220124 0.02537.536.4150.016ns由此,在显著性水平0.05下,我们拒绝原假设,认为该天生产的钢板重量不符合要求。现计算可得接受域置信区间2222221(1)(1)(,)(1)(1)nsnsnn22221022(1)nS检验统计量及其在H0为真时的分布枢轴量及其分布原假设 H0备择假设 H1待估参数 2 02 2=02 2(未知)1()1(22022nSn(未知)2222(1)(1)nSn二、两个正态总体方差比的F 检验 设 是来自 的样本,是来自 的样本。考虑如下三个假设检验问题 1,mxx211(
22、,)N 1,nyy222(,)N 2222012112:HvsH通常 ,均未知,记 ,分别是由算得的 的无偏估计和由 算得的 的无偏估计.122xs2ys1,nyy1,mxx21222222012112:HvsH2222012112:HvsH可建立检验统计量:22xysFs三种检验问题对应的拒绝域依次为11,1 WFFmn1,1WFFmn21,1WFFmn121,1FFmn。或例7.2.5 甲、乙两台机床加工某种零件,零件 的直径服从正态分布,总体方差反映了加工 精度,为比较两台机床的加工精度有无差别,现从各自加工的零件中分别抽取7件产品和8 件产品,测得其直径为 X (机床甲)16.2 16
23、.4 15.8 15.5 16.7 15.6 15.8Y (机床乙)15.9 16.0 16.4 16.1 16.5 15.8 15.7 15.0这就形成了一个双侧假设检验问题,原假设是 备择假设为 此处 m=7,n=8,经计算22012:,H22112:H20.2729,xs 0.27291.2610.2164F 查表知0.9756,75.12F于是 ,若取 =0.05,20.2164,ys 0.0250.975110.1757,65.70FF其拒绝域为0.175 5.12WFF或 由此可见,样本未落入拒绝域,即在0.05水平下可以认为两台机床的加工精度一致。问问 题题母亲嗜酒是否影响下一代
24、的健康母亲嗜酒是否影响下一代的健康 美国的美国的Jones医生于医生于1974年观察了母年观察了母亲在妊娠时曾患慢性酒精中毒的亲在妊娠时曾患慢性酒精中毒的6名七名七岁儿童(称为甲组)岁儿童(称为甲组).以母亲的年龄,文以母亲的年龄,文化程度及婚姻状况与前化程度及婚姻状况与前6名儿童的母亲名儿童的母亲相同或相近,但不饮酒的相同或相近,但不饮酒的46名七岁儿童名七岁儿童为对照租为对照租(称为乙组称为乙组).测定两组儿童的智测定两组儿童的智商,结果如下:商,结果如下:甲 组 6 78 19乙 组 46 99 16人数智商平均数样本标准差nxs智商组别 由此结果推断母亲嗜酒是否影响下一代的智力?若有影
25、响,推断其影响程度有多大?提示提示 前一问题属假设检验问题 后一问题属区间估计问题 智商一般受诸多因素的影响.从而可以),(),(222211uNuN和 本问题实际是检验甲组总体的均值是否比乙组总体的均值偏小?若是,这个差异范围有多大?前一问题属假设检验,后一问题属区间估计.解解假定两组儿童的智商服从正态分布.由于两个总体的方差未知,而甲组的样本容量较小,因此采用大样本下两总体均值比较的U检验法似乎不妥.故2221122210:;:HH当 为真时,统计量 0H)45,5(2221FSSF 采用方差相等(但未知)时,两正态总体均值比较的 t 检验法对第一个问题作出回答.为此,利用样本先检验两总体
26、方差是否相等,即检验假设拒绝域为 1.0取/21/2(5,45)(5,45)FFFF或/20.05(5,45)(5,45)FF1/20.95(5,45)(5,45)2.43FF0.951/(45,5)0.22F202191.41,16F 得0.9500.05(5,45)(5,45)FFFF 的观察值的观察值未落在拒绝域内,故接受 .即可认为0H两总体方差相等.下面用 t 检验法检12验 是否比 显著偏小?即检验假设211210:;:uuHuuH当 为真时,检验统计量 0H)2(11212121nntnnSXXTw01.0,2)1()1(212222112取nnSnSnSw其中 的观察值T,46
27、,6,16,19212221nnSS将00.992.962.54(50)Tt代入得99,7821xx嗜酒会对儿童智力发育产生不良影响.落在拒绝域内,故拒绝 .即认为母亲0H 下面继续考察这种不良影响的程度.为此要对两总体均值差进行区间估计.2112112211(2)wXXStnnnn的置信区间为的置信度为112uu取 并代入相应数据可得,01.00.995(50)2.67,16.32wtS于是置信度为 99%的置信区间为 4616167.232.167899)91.39,09.2(91.1821由此可断言:在99%的置信度下,嗜酒母亲所生孩子在七岁时的智商比不饮酒的母亲所生孩子在七岁时的智商平
28、均要低 2.09 到 39.91.故限制显著性水平的原则体现了“保护原假设”的原则.注注 大家是否注意到,在解决问题时,两次假设检验所取的显著性水平不同.前者远1.0在检验方差相等时,取 ;在01.0检验均值是否相等时取 .比后者大.为何这样取呢?因为检验的结果与检验的显著性水平 有关.小,则拒绝域也会小,产生的后果使原假设难以被拒绝.0H0H 在 较大时,若能接受 ,说明为真的依据很充足;同样,在 很小时,我们仍然拒绝 .说明 不真的理由就更充足.0H0H 说明在所给数据下,得出相应的1.02221本例中,对 ,得出 可被接受,01.0及对 ,21uu 可被拒绝的结论.结论有很充足的理由.另外在区间估计中,取较小的显著 若反之,取较小的置信水平,则可01.0水平 (即较大的置信水平),从而使得区间估计的范围较大.减少估计区间的长度,使区间估计精确提高,但相应地区间估计的可靠度降低了,即要冒更大的风险.