1、8.1 假设检验的基本原理与两类错误假设检验的基本原理与两类错误8.2 正态总体的假设检验正态总体的假设检验8.3 分布拟合检验分布拟合检验第第8 8章章 假设检验假设检验下面通过一个具体实例引出假设检验的一些重要概念和基本思想下面通过一个具体实例引出假设检验的一些重要概念和基本思想。例例8.1.1 某厂生产一种零件的尺寸某厂生产一种零件的尺寸 服从正态分布服从正态分布 ,从,从过去较长一段时间的生产情况来看,零件的平均尺寸为过去较长一段时间的生产情况来看,零件的平均尺寸为 mm,为检验该厂某批零件是否符合标准,现对该,为检验该厂某批零件是否符合标准,现对该批零件随机抽取批零件随机抽取6件得到
2、其尺寸数据(单位:件得到其尺寸数据(单位:mm)32.56,29.66,31.64,30.00,31.87,31.03,问该批零件的平均尺寸与过去是否有显著差异?问该批零件的平均尺寸与过去是否有显著差异?X(,1.21)N 8.1 8.1 假设检验的基本原理与两类错误假设检验的基本原理与两类错误 我们的问题是判断该批零件的平均尺寸我们的问题是判断该批零件的平均尺寸 是否为是否为30.50mm,若若 mm,则认为其与过去没有显著差异,否则就,则认为其与过去没有显著差异,否则就有显著差异有显著差异.于是提出假设:于是提出假设:0010:30.50:30.50HH称称 为为零假设或原假设零假设或原假
3、设(original hypothesis),),为为备备择假设或对立假设择假设或对立假设(alternative hypothesis).一般地,把一般地,把关于未知分布的各种陈述称为统计假设,简称为假设关于未知分布的各种陈述称为统计假设,简称为假设.若总体若总体分布类型已知,仅对总体分布中未知参数的假设称为参数假分布类型已知,仅对总体分布中未知参数的假设称为参数假设设.如上例中仅对参数如上例中仅对参数 的假设的假设.在有些实际问题中总体分布在有些实际问题中总体分布未知,需对总体分布类型提出假设,这类对总体分布类型的未知,需对总体分布类型提出假设,这类对总体分布类型的假设称为非参数假设假设称
4、为非参数假设.0H1H 在假设检验中,零假设和对立假设的选择要看具体的在假设检验中,零假设和对立假设的选择要看具体的目的和要求而定,如果我们希望通过样本观测值获得对目的和要求而定,如果我们希望通过样本观测值获得对某个论断的有力支持,则一般把这一论断的否定作为原某个论断的有力支持,则一般把这一论断的否定作为原假设假设.因为仅通过一次抽样无法去证实一个论断,但用来因为仅通过一次抽样无法去证实一个论断,但用来否定一个论断的理由则比较充分否定一个论断的理由则比较充分.如上例中如上例中 为原假设,为原假设,为对立假设为对立假设.00:30.50H10:30.50H 在统计假设提出之后,就要寻找一个检验法
5、则,在在统计假设提出之后,就要寻找一个检验法则,在 与与 之间作出判断,若拒绝原假设之间作出判断,若拒绝原假设 ,就意味着接受对立假设,就意味着接受对立假设 ,否则就不能拒绝(即接受)原假设,否则就不能拒绝(即接受)原假设 .例例8.1要检验总体要检验总体均值均值 ,根据参数估计知样本均值是总体均值的良好估计,根据参数估计知样本均值是总体均值的良好估计,可考虑能否用样本均值,可考虑能否用样本均值 来进行判断,由抽样的结果知来进行判断,由抽样的结果知样本均值为样本均值为1(32.5629.6631.6430.0031.8731.03)=31.136x 本次抽样本次抽样 的取值的取值 与过去生产零
6、件的平均尺寸之间差异为与过去生产零件的平均尺寸之间差异为0.63mm,这种差异有以下两种不同的解释,这种差异有以下两种不同的解释.(1)若)若 成立,这种差异是由抽样的随机性造成的成立,这种差异是由抽样的随机性造成的.0H1H0H1H0HXX0H8.1.2 8.1.2 假设检验的基本思想假设检验的基本思想(2)若若 不成立,抽样的随机性不可能造成不成立,抽样的随机性不可能造成0.63mm这么这么大的差异,说明该批零件尺寸与过去生产的零件尺寸确实有大的差异,说明该批零件尺寸与过去生产的零件尺寸确实有明显差异明显差异.从而问题的关键是从而问题的关键是0.63mm的差异能否用抽样的随机性来解的差异能
7、否用抽样的随机性来解释释.为回答这一问题,由参数估计知道,样本均值为回答这一问题,由参数估计知道,样本均值 的大小的大小在一定程度上反映了总体均值的大小在一定程度上反映了总体均值的大小.由于由于 未知,用未知,用 代代替替 与与30.50作比较,如选用作比较,如选用 作为衡量作为衡量 是是否成立的指标否成立的指标.如果如果 成立,则成立,则 应该较小,如果应该较小,如果 较大,则差异就不能仅仅解释为样本随机性的影较大,则差异就不能仅仅解释为样本随机性的影响了,从而有理由怀疑响了,从而有理由怀疑 是否成立是否成立.这样问题就转化为找一这样问题就转化为找一个合理的临界值个合理的临界值,使得,使得当
8、当 时,接受时,接受 ;当当 时,拒绝时,拒绝 ;|30.50|XC|30.50|XC0H0H0HXX|30.50|X0H0H|30.50|X|30.50|X0H称(称(8.1.1)为一个检验例)为一个检验例8.1.1中中 假设的检验法假设的检验法.该检验法该检验法给出的检验规则实质上是把样本给出的检验规则实质上是把样本 的所有可能取的所有可能取值(值(或或 的子集)分为互不相交的两部分:的子集)分为互不相交的两部分:01(,):|30.50|nnWxxRxC11(,):|30.50|nnWxxRxC于是检验法(于是检验法(8.1.1)又可表述为)又可表述为当当 时,接受时,接受 ;当当 时,
9、拒绝时,拒绝 ;10(,)nxxW11(,)nxxW0H0H0H1(,)nXXnRnR 因此问题是如何确定常数因此问题是如何确定常数?为确定常数为确定常数 ,我们适当,我们适当选择一个小正数选择一个小正数 ,称作显著性水,称作显著性水平(平(level of significance),在),在 成立的条件下,确定成立的条件下,确定随机事件随机事件 为小概率事件,即为小概率事件,即0H|30.50|XC0|30.50|成 立PXCH 根据小概率事件的实际不可能原理,即根据小概率事件的实际不可能原理,即“在一次试验中小概在一次试验中小概率事件几乎是不可能发生的率事件几乎是不可能发生的”原理原理.
10、由(由(8.1.2)确定的事件为)确定的事件为小概率事件,实际上是不可能发生的小概率事件,实际上是不可能发生的.如果根据抽样的结果,如果根据抽样的结果,小概率事件小概率事件 在一次抽样中发生了,则说明在一次抽样中发生了,则说明抽样得到的结果与原假设抽样得到的结果与原假设 不相符,因而有理由怀疑不相符,因而有理由怀疑 的正确性的正确性.即在显著水平即在显著水平 给定时,拒绝给定时,拒绝 .如果在一次抽如果在一次抽样中小概率事件样中小概率事件 没有发生,则没有充分理没有发生,则没有充分理由拒绝由拒绝 ,从而只能接受,这就是显著性检验,从而只能接受,这就是显著性检验.|30.50|XC0H0H0H|
11、30.50|XC0HCC(0.01 0.05 0.1),等 上例中取上例中取 ,因为总体,因为总体 ,在,在 成立条件下,成立条件下,0.052(,)XN0H20(,)XNn0(0,1)/XUNn查正态分布表有查正态分布表有/2|P Uu根据(根据(8.1.2)式)式 ,。/2/Cun/2Cun所以所以1.11.960.88.6C即即|30.50|0.880.05.PX而代入样本观测值而代入样本观测值|30.50|0.630.88x上式也等价于上式也等价于30.500.63|1.401.96/1.1/6xn 给定给定 时,根据小概率事件原理,不能拒绝时,根据小概率事件原理,不能拒绝 ,即认为该
12、批零件的尺寸与过去生产的零件尺寸没有显著差,即认为该批零件的尺寸与过去生产的零件尺寸没有显著差异异。0.050H通过上例分析,我们知道假设检验的基本思想是:从通过上例分析,我们知道假设检验的基本思想是:从 成立成立出发,构造合适的检验法,根据小概率事件原理,如果导出出发,构造合适的检验法,根据小概率事件原理,如果导出“不不合理合理”的结论,则拒绝的结论,则拒绝 ,否则就不能拒绝,否则就不能拒绝 ,因而只能接,因而只能接受受 。上述思想可以概括为具有概率性质的反证法上述思想可以概括为具有概率性质的反证法.假设检验假设检验的一般步骤为:的一般步骤为:(1)根据实际问题的要求提出原假设)根据实际问题
13、的要求提出原假设 与对立假设与对立假设 .(2)选取适当的统计量)选取适当的统计量 ,作为衡量,作为衡量 是否成立是否成立的标准,在的标准,在 成立时,成立时,的分布或渐近分布已知的分布或渐近分布已知.(3)给定显著水平)给定显著水平 ,在,在 成立的条件下,借助统计量成立的条件下,借助统计量 确定一个小概率事件,从而把样本空间分为两个确定一个小概率事件,从而把样本空间分为两个互不相交的区域,即拒绝域互不相交的区域,即拒绝域 和接受域和接受域 .(4)作出判断,若样本观测值落入拒绝域)作出判断,若样本观测值落入拒绝域 ,则拒绝,则拒绝 ,否则接受否则接受 .0H0H0H0H0H1H1(,)nT
14、 XX1(,)nT XX0H0H0H1(,)nT XX1W0W1W0H0H 显著性检验是根据样本对原假设显著性检验是根据样本对原假设 作出接受还是拒绝的判断作出接受还是拒绝的判断,由于样本的随机性和局限性,由于样本的随机性和局限性.因此在作判断时,我们有可能犯因此在作判断时,我们有可能犯两类错误:一类错误是,当两类错误:一类错误是,当 为真时,根据样本拒绝了为真时,根据样本拒绝了 ,这类错误称之为第一类错误,也称为,这类错误称之为第一类错误,也称为“弃真错误弃真错误”.其发生的概其发生的概率称为犯第一类错误的概率,通常记为率称为犯第一类错误的概率,通常记为 ,即,即0H0H0H(拒绝|为真)=
15、.P0H0H 另一类错误是,当另一类错误是,当 为不真时,根据样本接受了为不真时,根据样本接受了 ,这,这类错误称之为第二类错误,也称为类错误称之为第二类错误,也称为“采伪错误采伪错误”,其发生的概,其发生的概率称为犯第二类错误的概率,通常记为率称为犯第二类错误的概率,通常记为 ,即,即 (接受(接受|不真)不真)=.在此我们把两类错的各种情况总结于表在此我们把两类错的各种情况总结于表8-1中中.0H0HP0H0H 母体情况母体情况 为真为真不真不真样样本本 (拒绝域)(拒绝域)犯第一类错误(概率为犯第一类错误(概率为 )正确正确(概率为(概率为 )(拒绝域)(拒绝域)正确(概率为正确(概率为
16、 )犯第二类错误(概率为犯第二类错误(概率为 )0H1W1-1W1-表表8-1 两类错误两类错误0H 对于给定的一对对于给定的一对 和和 ,总可以找到很多不同的拒绝域,总可以找到很多不同的拒绝域 ,我们总希望找到这样的拒绝域,我们总希望找到这样的拒绝域 ,使得犯两类错误的,使得犯两类错误的概率概率 和和 都很小都很小.但是当样本容量但是当样本容量 固定时,要想固定时,要想 和和 都很小是不可能的,通常减少犯其中一类错误的概率,则都很小是不可能的,通常减少犯其中一类错误的概率,则犯另一类错误的概率就会增加犯另一类错误的概率就会增加。0H1H1W1Wn 基于这种情况,纽曼基于这种情况,纽曼皮尔逊(
17、皮尔逊(Neyman-Pearson)提)提出了一个原则:即出了一个原则:即在样本容量在样本容量 固定时,控制犯第一类错固定时,控制犯第一类错误的概率误的概率 ,寻找最优的检验法则,使犯第二类错误的概,寻找最优的检验法则,使犯第二类错误的概率率 尽量小尽量小.具体实行这一原则有时也有许多困难,因而降低具体实行这一原则有时也有许多困难,因而降低要求,仅对犯第一类错误的概率要求,仅对犯第一类错误的概率 加压控制,而不考虑犯加压控制,而不考虑犯第二类错误的概率第二类错误的概率 ,这类假设检验问题称为显著性假设,这类假设检验问题称为显著性假设检验问题,相应的检验称为检验问题,相应的检验称为显著性检验显
18、著性检验.一般情形下,显著一般情形下,显著性检验法是较容易找到的,我们将在正态总体情形下详细讨性检验法是较容易找到的,我们将在正态总体情形下详细讨论论.n设总体设总体 ,是来自总体是来自总体 的样本,的样本,为显为显著水平著水平.(1)方差方差 已知,均值已知,均值 的检验的检验 检验的问题为检验的问题为 (为已知常数),为已知常数),(8.2.1)由第六章抽样分布的理论知,当由第六章抽样分布的理论知,当 成立时,成立时,(8.2.2)选取选取 作为此假设检验的统计量,对给定的显著水平作为此假设检验的统计量,对给定的显著水平 ,2(,)XN1(,)nXXX201:HH00H0(0,1)/XUN
19、nU/2|P Uu因而拒绝域可取为因而拒绝域可取为 或或 把样本观测察值把样本观测察值 代入代入,得到统计量,得到统计量 的观察值的观察值 若若 ,则拒绝,则拒绝 ,否则就接受,否则就接受 .称此检验法为称此检验法为 检验法检验法.1/2|WUu110/2(,):|nWxxxun1(,)nxx0/xun/2|uu0H0HU例例8.2.1 某种电器元件的电阻某种电器元件的电阻 ,从过去生产情况看,从过去生产情况看,其平均电阻一直保持在,其平均电阻一直保持在2.64 ,标准差为,标准差为0.06 .改变加工工改变加工工艺后,测得艺后,测得100个元件,其平均电阻为个元件,其平均电阻为2.62 ,标
20、准差不变,标准差不变.问问新工艺的平均电阻与原来的有无显著差异?(取显著水平新工艺的平均电阻与原来的有无显著差异?(取显著水平 )解解 检验问题为检验问题为 .使用使用 检验法,计算统计量检验法,计算统计量 的观测值的观测值由由 ,查表得,查表得 ,由于,由于 ,所,所以拒绝以拒绝 ,即认为新工艺元件的平均电阻与原来有显著差异,即认为新工艺元件的平均电阻与原来有显著差异.2(,)XN0.0101:2.64:2.64HHUU02.622.643.33.0.006/xUn0.010.0052.58u0.005|3.33 2.58uu0H以上讨论的假设检验问题中,提出的是以上讨论的假设检验问题中,提
21、出的是双侧检验双侧检验,即对立假设,即对立假设 .有时在实际问题中,我们仅关心总体均值是变大有时在实际问题中,我们仅关心总体均值是变大还是减小的情况,因而对立假设为还是减小的情况,因而对立假设为 或或 ,这两类检验统称为这两类检验统称为单侧检验单侧检验.其检验方法与双侧检验类似,只其检验方法与双侧检验类似,只是拒绝域相应变为是拒绝域相应变为 和和 .另外,如果总体分布为非正态分布,但在另外,如果总体分布为非正态分布,但在 成立的条件下成立的条件下,统计量,统计量 的极限分布为正态分布,则在样本容量的极限分布为正态分布,则在样本容量 较大时,较大时,近似服从正态分布,这时近似服从正态分布,这时
22、检验法仍可使用检验法仍可使用.如对产品次品如对产品次品率的检验,泊松分布参数的检验等率的检验,泊松分布参数的检验等.10:H10:H10:HUu UuU0HnUU例例8.2.2 某地区成年男性中吸烟占某地区成年男性中吸烟占75%,经过戒烟宣传之后,进,经过戒烟宣传之后,进行了抽样调查,发现行了抽样调查,发现100名被调查的成年男性,有名被调查的成年男性,有63人是吸烟者人是吸烟者,问戒烟宣传是否受到了成效?(取显著水平,问戒烟宣传是否受到了成效?(取显著水平 .)解解 检验问题为检验问题为 .令令 表示该调查该地区一名成年男性中吸烟的人数,则表示该调查该地区一名成年男性中吸烟的人数,则 ,为来
23、自总体为来自总体 的样本的样本.由中心极限定理中由中心极限定理中知,在知,在 成立的条件下,统计量成立的条件下,统计量 近似服从标准正态分布近似服从标准正态分布.因此可使用因此可使用 检验法。检验法。0.050010:0.75:0.75HppHppX(1,)Xbp1100(,)XX0HX000(1)XpUnppU计算计算 的观测值的观测值对给定的对给定的 ,查表,查表 ,因此拒绝,因此拒绝 ,即认为戒烟宣传收到了成效,即认为戒烟宣传收到了成效.(2)方差方差 未知,均值未知,均值 的检验的检验对(对(8.3)式给出的假设检验问题,可构造如下的统计量)式给出的假设检验问题,可构造如下的统计量 ,
24、(8.2.3)其中其中 .从而对给定的显著水平从而对给定的显著水平 ,有,有 ,所以拒绝域可取为,所以拒绝域可取为 .称此检称此检验法为验法为 检验法检验法.U0.630.751002.770.75 0.25 U0.050.051.65u0.052.771.65 uu0H20(1)/Xtt nSn2211()1niiSXXn/2|(1)P t tn/2|(1)ttnt例例8.2.3 已知某种矿石含铁量服从正态分布,从中抽取已知某种矿石含铁量服从正态分布,从中抽取5个样个样品,经测定其含铁量(品,经测定其含铁量(%)分别为:)分别为:3.24,3.26,3.24,3.27,3.25,问在显著水平
25、问在显著水平 下,能否接受假设:这批矿石的含下,能否接受假设:这批矿石的含铁量为铁量为3.25?解解 检验问题为检验问题为 .由于总体方差由于总体方差 未知,采用未知,采用 检验法检验法 ,.由此得统计量的观测值由此得统计量的观测值0.0501:HH2t(3.24 3.26 3.24 3.27 3.25)/5 3.252x52211()0.0001751iisxx03.2523.250.343/0.013038/5XtSn对给定的对给定的,查表查表 而而 ,故接受,故接受 .即能认为这批矿石的含铁量为即能认为这批矿石的含铁量为3.25%.对于以上假设检验问题,若采用第七章的区间估计的方法对于以
26、上假设检验问题,若采用第七章的区间估计的方法,能否作出对原假设,能否作出对原假设 的判断?的判断?根据方差根据方差 未知,对均值未知,对均值 的区间估计的区间估计.对给定的对给定的 ,可得其置信区间,可得其置信区间 0.050.025(4)2.776,t0.025|0.343 2.776(4)tt0H00:3.25H2/2/2(4),(4)SSxtxtnn0.0130380.013038(3.2522.776,3.2522.776)55 )根据小概率原理,若根据小概率原理,若 成立,对给定的成立,对给定的 ,可得置信度为,可得置信度为95%的置信区间应该包含的置信区间应该包含 ,而现在,而现在
27、一次样本的调查结果表明一次样本的调查结果表明 ,因而无,因而无法拒绝法拒绝 ,即认为这批矿石的含铁量为,即认为这批矿石的含铁量为3.25%.通过本例可以看出,区间估计与假设检验的统计之处是相通的通过本例可以看出,区间估计与假设检验的统计之处是相通的.实际上,假设检验的接受域也恰好是相应的区间估计的置信区实际上,假设检验的接受域也恰好是相应的区间估计的置信区间间.0:H0)0H8.2.2 单个正态总体方差单个正态总体方差 的假设检验的假设检验设总体设总体 ,是来自总体是来自总体 的样本,的样本,未知未知.检验的问题为检验的问题为 (为已知常数),为已知常数),(8.2.4)由于样本方差由于样本方
28、差 是是 的无偏估计,根据的无偏估计,根据Fisher定理,当定理,当 成立成立时,时,从而可选取从而可选取 作为检验统计量作为检验统计量.对给定的显著水平对给定的显著水平 有有 所以其拒绝域为所以其拒绝域为 .称此检验称此检验法为法为 检验法检验法.2(,)XN1(,)nXXX01:HH02S20H22220(1)(1)nSn222221/2/20(1)(1),或Pnn22221/2/20(1)(1)nn2例例8.2.4设某车间生产的铜丝的折断力设某车间生产的铜丝的折断力 ,通常情形,通常情形下下 ,现从某批产品中抽查,现从某批产品中抽查5根铜丝测得其折断力(单位根铜丝测得其折断力(单位:公
29、斤)分别为:公斤)分别为 578,572,570,568,582,问在显著水平问在显著水平 下,能否接受该批铜丝的折断力的方差下,能否接受该批铜丝的折断力的方差仍为仍为 64?解解 检验的问题为检验的问题为 ,由于总体均值由于总体均值 未知,采用未知,采用 检验法检验法 ,.由此得统计量的观测值由此得统计量的观测值2(,)XN2 22220010:HH2-(578572570568582)/5574x52211()3 451iisxx2220(1)1362.125.64ns对给定的对给定的 ,查表,查表 ,因而,因而,故接受,故接受 .即能认为这批铜丝的折断力的方差仍为即能认为这批铜丝的折断力
30、的方差仍为64.以上(以上(8.2.4)式的检验中,若均值)式的检验中,若均值 是已知的,检验是已知的,检验统计量相应地为统计量相应地为 从而对给定的显著水平从而对给定的显著水平 ,其拒绝域为,其拒绝域为 .上述讨论的是关于方差假设检验问题的双侧检验情况,同样关上述讨论的是关于方差假设检验问题的双侧检验情况,同样关于方差假设检验问题也存在单侧检验情形:于方差假设检验问题也存在单侧检验情形:220.0250.975 ,2 0H02022120()()niiXn22221/2/20()()nn22220010:HH22220010:HH检验检验参数参数条条件件统计量及统统计量及统计量的分布计量的分
31、布显著水平显著水平 下拒下拒绝域绝域均均值值已已知知未未知知方方差差已已知知未未知知表表8-2 单个正态总体参数的假设检验单个正态总体参数的假设检验220H1H1212121212121212121212122212(0,1)XYUNnm/2|uu uuuu(2)11 wX Ytt n mSn m/2|(2)t tn m(2)tt n m(2)t t n m2212221222122212221222122212221222122212221222122112211()1()(,)niimjjXnFYmFnm2122(1,1)SFF nmS1/2/2(,)(,)或FFn mFFn m1(,)F
32、Fn m(,)FF n m1/2/2(1,1)(1,1)或FFnmFFnm1(1,1)FFnm(1,1)FFnm 前面讨论了在总体分布形式已知的前提下对其参数的假设前面讨论了在总体分布形式已知的前提下对其参数的假设检验问题,但在实际问题中,往往总体分布形式是未知的,检验问题,但在实际问题中,往往总体分布形式是未知的,需要对总体分布形式进行推断需要对总体分布形式进行推断.这类根据样本对总体分布类型这类根据样本对总体分布类型进行假设检验的问题,统称为非参数假设检验进行假设检验的问题,统称为非参数假设检验.本节主要讨本节主要讨论论 拟合检验拟合检验.设总体设总体 的分布的分布 未知,未知,是来自总体
33、的样本,是来自总体的样本,检验问题检验问题 总体总体 的分布的分布 ,(8.3.1)其中其中 是某个已知分布函数是某个已知分布函数.2X()F x1(,)nXX0:HX0()()F xF x0()F x为解决(为解决(8.3.1)式提出的假设检验是否成立,皮尔逊)式提出的假设检验是否成立,皮尔逊(K.Pearson)提出了)提出了 拟合检验法拟合检验法.其基本思想是将样本观其基本思想是将样本观测值决定的经验分布函数来替代总体分布,并与假设的理论测值决定的经验分布函数来替代总体分布,并与假设的理论分布相比较分布相比较.由于抽样的随机性和样本容量有限性,两者之由于抽样的随机性和样本容量有限性,两者
34、之间必然存在一些偏差间必然存在一些偏差.问题是这种偏差能否解释为仅仅是样问题是这种偏差能否解释为仅仅是样本的随机性和试验次数有限而带来的随机波动,还是因为所本的随机性和试验次数有限而带来的随机波动,还是因为所配合的理论分布与样本分布之间确实具有实质性差异所导致配合的理论分布与样本分布之间确实具有实质性差异所导致的的.如果两者偏差是显著的,则认为总体分布不服从该理论如果两者偏差是显著的,则认为总体分布不服从该理论分布,即拒绝分布,即拒绝 ,否则接受,否则接受 .拟合检验法的基本步骤如下:拟合检验法的基本步骤如下:0H0H2(1)根据样本观测值的取值范围,把总体)根据样本观测值的取值范围,把总体
35、的一切可能取值的一切可能取值的集合的集合 (或或 的子集)分成的子集)分成 个互不相交的区个互不相交的区间间 ,统计样本观测值落入各区间的频数,统计样本观测值落入各区间的频数 与频率与频率(2)在)在 成立的条件下,计算总体成立的条件下,计算总体 落在每个区间的概率落在每个区间的概率.若若 中含有未知参数,先需用极大似然估计法估计出参数,中含有未知参数,先需用极大似然估计法估计出参数,再求相应的概率再求相应的概率.选取统计量选取统计量 ,(8.3.2)XD1R1Rk1,kAA,=1,iik/,=1,.iifn ik0HX0()F x(),=1,.iipP XAik22211()()kkiiii
36、iiiinpnfpnpp直观上,直观上,统计量可理解为观测频数与理论期望频数的相对统计量可理解为观测频数与理论期望频数的相对差异,也可理解为观测频率与理论概率差的加权平和差异,也可理解为观测频率与理论概率差的加权平和.当当 成立时,成立时,值应该比较小,因此当值应该比较小,因此当 值大于某一临界值时,值大于某一临界值时,就应该拒绝就应该拒绝 .基于上述直观理解,皮尔逊采用(基于上述直观理解,皮尔逊采用(8.3.2)式确定的统计量)式确定的统计量作为检验作为检验 的统计量,并证明了如下定理:的统计量,并证明了如下定理:定理定理8.3.1(皮尔逊定理)对充分大的(皮尔逊定理)对充分大的 ,当,当
37、成立时,成立时,统计量(统计量(8.3.2)近似地服从自由度为)近似地服从自由度为 的的 分布,其分布,其中中 为待估参数的个数为待估参数的个数.20H220H0Hn0H1 kr2r(3)在)在 成立的条件下,给定显著水平成立的条件下,给定显著水平 有有 ,可得拒绝域为可得拒绝域为 .(4)根据样本观测值计算)根据样本观测值计算 值值若若 ,拒绝,拒绝 ;若;若 ,接受,接受 .需要指出的是应用需要指出的是应用 拟合检验时,要求样本容量拟合检验时,要求样本容量 较大,一般分为较大,一般分为5至至7个区间,且样本观测值落入每个区间个区间,且样本观测值落入每个区间的频数不能少于的频数不能少于4,若
38、少于,若少于4,则应并入相邻的区间,则应并入相邻的区间.尽管尽管 拟合检验对于离散型和连续型总体分布都适用,但它依赖拟合检验对于离散型和连续型总体分布都适用,但它依赖于区间的划分,于区间的划分,拟合检验实质上只是检验了拟合检验实质上只是检验了 是否为真,并未真正检验总体分布是否为真,并未真正检验总体分布 是否是否为为 .0H22(1)Pkr2(1),)kr222(1)kr0H22(1)kr0H2(30)n22(),iiP XAp1,2,ik()F x0()F x例例8.3.1 自自1875年至年至1955年,对其中年,对其中63年的观测中,某市夏季年的观测中,某市夏季共有共有180天下过暴雨天
39、下过暴雨.把把5至至9月作为夏季,每年夏季共月作为夏季,每年夏季共153天天.在统计的在统计的63年中,某市一年夏季有年中,某市一年夏季有 天发生过暴雨的年数天发生过暴雨的年数 如下表:如下表:n(0,1,2,)nn012345678合计合计 481419104211063n9n表表8-5试问:观测结果能否说明某市一年内夏季发生暴雨的天数试问:观测结果能否说明某市一年内夏季发生暴雨的天数服从泊松分布服从泊松分布?0.05解解 以以 表示某市一年内夏季发生暴雨的天数,根据容量为表示某市一年内夏季发生暴雨的天数,根据容量为63的样本来检验假设的样本来检验假设 总体总体 服从泊松分布服从泊松分布.当
40、当 成立时,成立时,未知未知.首先要求出首先要求出 的极大似然的极大似然估计值估计值把把 的一切可能取值分为的一切可能取值分为7个个组,组,则在,则在 成立时,可求出成立时,可求出 的值如下:的值如下:X0:HX0H(),0 XP2.8571.XX6,0,1,2,3,4,5,6,7,kAk kA0H,0,1,6ip i02.85710(2.8571)0.0574;0!pe2.857112.85710.1641;1!pe22.85712(2.8571)0.2344;2!pe32.85713(2.8571)0.2233;3!pe42.85714(2.8571)0.1595;4!pe42.85715
41、(2.8571)0.0911;5!pe2.857166(2.8571)0.0702.!kkpek列表计算列表计算 值值 2一年中暴雨天数一年中暴雨天数 实际年数实际年数 假设概率假设概率 期望年数期望年数 040.05743.610.0399180.164110.340.52962140.234414.770.04013190.223314.071.72744100.159510.050.0002540.09115.740.527567821100.07024.420.0399合计合计631.00063.002.9046表表8-6kkkpknp2()/kkknpnp9统计量统计量 给定显著水平
42、给定显著水平 ,查,查表表 ,而而 ,所以不能否认某市的一年夏天的暴雨天数所以不能否认某市的一年夏天的暴雨天数 服从泊松分布,服从泊松分布,即接受即接受 .例例8.3.2 研究混凝土抗压强度的分布,研究混凝土抗压强度的分布,200件混凝土制件的抗件混凝土制件的抗压强度以分组形式列出,如下表压强度以分组形式列出,如下表:2620(63)2.9046.63kkkkpp0.05220.05(1)(7 1 1)11.07 k r220.052.904611.07(5)X0H压强区间(压强区间(98kPa)频数频数压强区间(压强区间(98kPa)频数频数1064263056141902002202302
43、00210230240210220240250 表表8-7 要求在给定显著水平要求在给定显著水平 下检验假下检验假设设 混泥土抗压强度混泥土抗压强度 .解解 原假设所定的正态分布的参数原假设所定的正态分布的参数 未知,由第七章未知,由第七章极大似然估计知,极大似然估计知,的极大似然估计值分别为的极大似然估计值分别为 设设 表示第表示第 组的中值,于是有组的中值,于是有61200,iin0.050:H2(,)XN2,2,2211,()niixxxn*ixi*11195 10205 26245 14221.200niiixxn2*211()200niiixx2221(26)10(16)26(24)
44、14152.200 12.33.在正态分布在正态分布 下,计算下,计算 落在每组理论概落在每组理论概率值率值为计算统计量为计算统计量 的值,我们把计算的结果列表如下:的值,我们把计算的结果列表如下:2(221 12.33),NX11()(),1,6,iiiiipP aXauui221,().2ixuiiiaxuuedx2压强区间压强区间频数频数标准化区间标准化区间 理论概率理论概率 期望频数期望频数 100.0459.00.11260.14228.40.20560.28156.20.00640.29959.80.29300.17134.20.52140.06212.40.23合计合计2001.0002001.35表表8-8Xi1(,iiuuipinp2()iiinpnp190200200210210220220230230240240250(,1.70(1.70,0.89(0.89,0.08(0.08,0.73(0.73,1.54(1.54,)从以上计算得出从以上计算得出 值为值为1.35.在给定显著水平在给定显著水平 下,查下,查 分布表,得临界值为分布表,得临界值为 .因为因为 ,不能拒绝,不能拒绝 ,即认为混凝土,即认为混凝土制件的抗压强度的分布为正态分布制件的抗压强度的分布为正态分布.20.05220.05(62 1)7.815220.051.357.815(3)0H