1、 第六章第六章-第八章知识结构图第八章知识结构图数理统计数理统计抽样分布抽样分布 统计推断统计推断常用的常用的统计量统计量四个重四个重要分布要分布参数估计参数估计假设检验假设检验正态总体的正态总体的样本均值与样本均值与方差的分布方差的分布(重要统计量重要统计量的分布的分布)矩矩估估计计法法点估计点估计 区间估计区间估计极大极大似然似然估计估计法法均值均值的区的区间估间估计计方差方差的区的区间估间估计计均值的均值的检验检验方差的方差的检验检验单个单个总体总体两个两个总体总体正态总体正态总体假设检验假设检验参数假设检验参数假设检验非参数假设检验非参数假设检验总体分布已知,总体分布已知,检验关于未知
2、参数检验关于未知参数的某个假设的某个假设总体分布未知时的总体分布未知时的假设检验问题假设检验问题根据样本的信息检验关于根据样本的信息检验关于总体的某个假设是否正确。总体的某个假设是否正确。第八章第八章 假设检验假设检验 假设检验问题假设检验问题:假设检验问题分类假设检验问题分类:一一.假设检验的基本思想假设检验的基本思想设总体设总体 X 含有未知参数含有未知参数 (或总体分布函数或总体分布函数 F(x)未知未知)检验下述假设检验下述假设:假设假设 或或 00:H 0()()F xF x 是某个已知常数或是某个已知常数或 是某个已知的分布函数。是某个已知的分布函数。0)(0 xF 第一节第一节
3、假设检验假设检验 其中:其中:则则抽取容量为抽取容量为 n 的样本,利用样本提供的信息对的样本,利用样本提供的信息对0H0H假设假设作出判断,从而确定是否接受作出判断,从而确定是否接受例如例如:0:Hx 显然显然 是可以被接受的是可以被接受的.0H 二二.判断判断“假设假设”的根的根据据小概率事件原理小概率事件原理小概率事件在一次试验中是小概率事件在一次试验中是几乎几乎不可能发生的不可能发生的2(,),XN 未知未知检验假设:检验假设:如果在假设如果在假设 成立的条件下某事件是小概率事件成立的条件下某事件是小概率事件,0H不是一定不发生不是一定不发生X因为因为 是总体是总体 X 的待估计参数的
4、待估计参数 的无偏估计。的无偏估计。但在一次试验中但在一次试验中却却发生了发生了,0H于是就可怀疑假设于是就可怀疑假设0.H的正确性从而拒绝的正确性从而拒绝现用一个例子来说明这个原则现用一个例子来说明这个原则.现有两个盒子,各装有现有两个盒子,各装有100个球个球.99个白球个白球一个红球一个红球99个个例如:例如:99个红球个红球一个白球一个白球99个个现从两盒中随机取出一个盒子现从两盒中随机取出一个盒子问:问:这个盒子里是白球这个盒子里是白球 99个还是红球个还是红球 99 个?个?若假设:若假设:这个盒子里有这个盒子里有 99 个白球个白球.当从中随机摸出一个球时,发现是红球:当从中随机
5、摸出一个球时,发现是红球:此时应如何判断这个假设是否成立呢此时应如何判断这个假设是否成立呢?假设其中真有假设其中真有 99 个白球,个白球,摸出红球的概率只有摸出红球的概率只有 1/100,但此小概率事件在一次试验中但此小概率事件在一次试验中 竟然竟然发生了,这就不得不怀疑发生了,这就不得不怀疑所作的假设。所作的假设。.这是小概这是小概率事件率事件概率反证法概率反证法要求在原假设成立的条件下导出的结要求在原假设成立的条件下导出的结论是绝对成立的,如果事实与之矛盾,论是绝对成立的,如果事实与之矛盾,则完全绝对地否定原假设。则完全绝对地否定原假设。这个例子中所使用的推理方法,这个例子中所使用的推理
6、方法,称为是称为是带概率性质的反证法带概率性质的反证法.在假设检验中,常称这个小概率在假设检验中,常称这个小概率为为显著性水平显著性水平,用用 表示表示.注注如果小概率事件在一次试验中居然发生了,如果小概率事件在一次试验中居然发生了,则就可以以很大的把握否定原假设,否则则就可以以很大的把握否定原假设,否则就不能否定原假设。就不能否定原假设。它不同于它不同于一般的反一般的反证法证法一般反证法一般反证法 三三.假设检验的两类错误假设检验的两类错误 1.第一类错误第一类错误(弃真弃真):如果如果 是正确的,是正确的,但却被错但却被错 误地否定了。误地否定了。0H 2.第二类错误第二类错误(取伪取伪)
7、:如果如果 是不正确的,是不正确的,但却被错误地接受了。但却被错误地接受了。0H若设若设 犯两类错误的概率分别为犯两类错误的概率分别为:P 拒绝拒绝H0|H0为真为真 =P 接受接受 H0|H0 不真不真 =则则显著性水平显著性水平 为犯第一类错误的概率。为犯第一类错误的概率。两类错误是两类错误是互相关联互相关联的,的,要同时降低两类错误的概率要同时降低两类错误的概率 ,或者要,或者要在在 不变的条件下降低不变的条件下降低 ,则需要,则需要增加增加样样本容量本容量 n,先对先对犯第一类错误(弃真)的概率加以控制,犯第一类错误(弃真)的概率加以控制,同时同时再考虑再考虑使犯第二类错误(取伪)的概
8、率使犯第二类错误(取伪)的概率尽可能的小。尽可能的小。在实际问题中,在实际问题中,通常的做法通常的做法是:是:注注当样本容量当样本容量 n 固定固定时,时,一类错误概率的减少必导致另一类错误一类错误概率的减少必导致另一类错误 概率的增加。概率的增加。四四.假设检验的具体做法假设检验的具体做法例例1.罐装可乐容量的检验问题罐装可乐容量的检验问题在一条生产可乐的流水线上罐装在一条生产可乐的流水线上罐装可乐不断地封装,然后装箱外运。可乐不断地封装,然后装箱外运。试问:如何检验这批罐装可乐的试问:如何检验这批罐装可乐的容量是否合格呢?容量是否合格呢?分析:分析:若把每一罐可乐都打开倒入量若把每一罐可乐
9、都打开倒入量杯杯,检验容量是否合于标准。检验容量是否合于标准。罐装可乐的容量按标准应在罐装可乐的容量按标准应在 350 毫升和毫升和 360 毫升之间。毫升之间。这显然是这显然是不可行不可行的。的。每隔每隔 1小时,抽查小时,抽查 5 罐,得罐,得 5个容量的值:个容量的值:X1,X5 ,根据这些值来判断生产是否正常根据这些值来判断生产是否正常.如发现不正常如发现不正常 则应停产,找出原因,排除故障,然后再生产;则应停产,找出原因,排除故障,然后再生产;如生产正常如生产正常,则继续按规定时间再抽样,以此监督生则继续按规定时间再抽样,以此监督生 产,保产,保 证质量。证质量。通常的办法是:通常的
10、办法是:进行抽样检查进行抽样检查.显然:显然:即,即,每隔一定时间,抽查若干罐每隔一定时间,抽查若干罐。如:如:2.也不能总认为正常,有了问题不能及时也不能总认为正常,有了问题不能及时发发 现,这也同样要造成损失现,这也同样要造成损失.1.不能由不能由 5 罐容量的数据,在把握不大的情罐容量的数据,在把握不大的情 况下就判断生产况下就判断生产 不正常,因为停产的损失不正常,因为停产的损失 是很大的;是很大的;如何处理这两如何处理这两者的关系?者的关系?如何处理这两者的关系?如何处理这两者的关系?现用假设检验的方法来处理这对矛盾现用假设检验的方法来处理这对矛盾在正常生产条件下,由于种种随机因素的
11、在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在影响,每罐可乐的容量应在 355 毫升上下毫升上下波动波动.这些因素中没有哪一个占有特殊重这些因素中没有哪一个占有特殊重 注意到:注意到:故故:可以认为样本是取自正态总体可以认为样本是取自正态总体 2(,)N 现抽查了现抽查了n 罐,测得容量为:罐,测得容量为:12,nXXX当生产比较稳定时,当生产比较稳定时,是一个常数是一个常数.2 现在要检验的假设是:现在要检验的假设是:假定每罐容量假定每罐容量服从正态分布服从正态分布是合理的是合理的.要的地位要的地位.因此,根据中心极限定理,因此,根据中心极限定理,00(355)H0:它的对立假
12、设是:它的对立假设是:称称 H0 为为原假设原假设(或(或 零假设零假设)称称 H1 为为备择假设备择假设(或(或 对立假设对立假设).在实际问题中,在实际问题中,往往把不轻易往往把不轻易否定的命题作否定的命题作为原假设为原假设.00(355)H0:H1:0 那么,如何判断原假设那么,如何判断原假设H0 是否成立呢?是否成立呢?由于由于 是正态分布的期望值,它的无偏估计量是是正态分布的期望值,它的无偏估计量是 0X 来判断来判断 H0 是否成立是否成立.X样本均值样本均值 ,0 因此可以根据因此可以根据 与与 的差距的差距X而较大、较小是一个相对的概念,而较大、较小是一个相对的概念,那么它应由
13、什么原则来确定?那么它应由什么原则来确定?对差异作对差异作定量定量的分析,以确定其性质的分析,以确定其性质.问题归结为:问题归结为:非本质的因素所引起的随机波动。非本质的因素所引起的随机波动。注意到:注意到:较小时,可以认为较小时,可以认为 H0 是成立的;是成立的;当当0X 当当较大时,应认为较大时,应认为 H0 不成立不成立.0X 生产已生产已不正常不正常当差异是由抽样的随机性引起时,则称其为当差异是由抽样的随机性引起时,则称其为“抽样误差抽样误差”或或 随机误差随机误差;它反映了由偶然、它反映了由偶然、然而,这种随机性的波动是有一定限度的然而,这种随机性的波动是有一定限度的,如果差异超过
14、了这个限度,如果差异超过了这个限度,如何判断差异是由如何判断差异是由“抽样误差抽样误差”还是还是“系统误差系统误差”所引起的?所引起的?从而问题就从而问题就转化为:转化为:解决的方法:解决的方法:给出一个量的界限给出一个量的界限,即,即显著性水平显著性水平.从而从而提出假设:提出假设:H0:0355H1:0355因为因为 已知,已知,所以所以构造统计量构造统计量为:为:则称其为则称其为“系统误差系统误差”.则就不能用抽样的随机则就不能用抽样的随机性来解释了。性来解释了。此时可认为这个差异反映了事物的本此时可认为这个差异反映了事物的本质差别,质差别,检验统计量:检验统计量:0XUn N(0,1)
15、2|PUu 对给定的显著性水平对给定的显著性水平 ,查正态分布的上分位,查正态分布的上分位点的值点的值 ,使:,使:2u 即即2|Uu 是一个小概率事件是一个小概率事件故可以故可以取拒绝域取拒绝域 C为:为:2:|CUu 如果由样本值算得该统计量的实测值落入区域如果由样本值算得该统计量的实测值落入区域C,则拒绝则拒绝 H0;否则就接受;否则就接受 H0.如果如果H0 是对的,那么衡量差异大小的某个统是对的,那么衡量差异大小的某个统计量落入区域计量落入区域 C (拒绝域拒绝域)是个小概率事件。是个小概率事件。这里所这里所依据的逻辑依据的逻辑是:是:如果如果该统计量的实测值落入该统计量的实测值落入
16、C,即,即 H0 成立下的成立下的小概率事件发生了,那么就认为小概率事件发生了,那么就认为 H0 不可信而否不可信而否定它;否则就不能否定定它;否则就不能否定 H0 而只好接受而只好接受 H0不否定不否定 H0并不是肯定并不是肯定 H0一定对,而只是说差异一定对,而只是说差异还不够显著,还没有达到足以否定还不够显著,还没有达到足以否定 H0 的程度的程度。故假设检验又称为故假设检验又称为“显著性检验显著性检验”注注如果在如果在 很小的情况下很小的情况下H0 基于这个理由,人们常把基于这个理由,人们常把 时拒绝时拒绝 H0 称为是称为是显著的。显著的。0.05 如果显著性水平如果显著性水平 取得
17、很小,则拒绝域也会取得很小,则拒绝域也会比比 0H0.01 把在把在 时拒绝时拒绝 称为是称为是 高度显著的。高度显著的。0H难于被拒绝。难于被拒绝。较小。较小。其产生的后果是:其产生的后果是:则说明实际情则说明实际情仍被拒绝了,仍被拒绝了,况很可能与之有显著差异。况很可能与之有显著差异。某工厂生产的一种螺钉,标准要求长度是某工厂生产的一种螺钉,标准要求长度是 32.5 毫米毫米.实际生产的产品,其长度实际生产的产品,其长度 X 假定服从正假定服从正态分布态分布 其中其中 未知,现从该厂生未知,现从该厂生产的一批产品中抽取产的一批产品中抽取 6 件件,得尺寸数据如下:得尺寸数据如下:2(,),
18、N 2 32.56,29.66,31.64,30.00,31.87,31.03问:这批产品是否合格问:这批产品是否合格?这批产品这批产品(螺钉长度螺钉长度)的全的全体组成问题的总体为体组成问题的总体为 X 例例2 解解:则问题是要检验则问题是要检验 E(X)是否为是否为32.5.由已知,由已知,设设:提出原假设和备择假设提出原假设和备择假设 01:32.5:32.5HH 第一步:第一步:因为已知因为已知 2(,),XN 2 未知未知.第二步:第二步:能衡量能衡量差异大差异大小且分小且分布已知布已知故取故取检验统计量检验统计量为:为:32.5(5)6XttS 32.56XtS 在在 成立下求出它
19、的分布为:成立下求出它的分布为:0H 第三步:第三步:即即“”是一个是一个小概率事件小概率事件.2|(5)tt 小概率事件在一次小概率事件在一次试验中基本上是试验中基本上是不会发生不会发生.20.005(5)(5)4.0322tt 使得:使得:2|(5)Ptt 故得故得否定域否定域为:为:0.01 对给定的显著性水平对给定的显著性水平 查查 分布表得临界分布表得临界值:值:t:|4.0322Ct 故不能拒绝故不能拒绝H0,即应接受,即应接受H0 第四步:第四步:没有落入没有落入拒绝域拒绝域 接受接受 H0 这这并不意味并不意味着着 H0一定对,一定对,只是差异还不够显著,不足以否定只是差异还不
20、够显著,不足以否定 H0 将样本值代入,计算出统计量将样本值代入,计算出统计量 的实测值:的实测值:t|2.9974.0322t 可认为这批产品是合格的。可认为这批产品是合格的。结论:结论:注注例例3.设某异常区磁场强度服从正态分布设某异常区磁场强度服从正态分布 ,由以前观察知道由以前观察知道 ,现有一台,现有一台新型号的仪器,用它对该区进行磁测,抽取了新型号的仪器,用它对该区进行磁测,抽取了41个点,其样本均值与方差为:个点,其样本均值与方差为:200(,)N 0056,2061.1,20Xs问:此仪器测出的结果是否符合要求问:此仪器测出的结果是否符合要求?解解:以以 分别表示用这台机器测出
21、的异常区的分别表示用这台机器测出的异常区的磁场强度磁场强度 X 的均值和均方差的均值和均方差(标准差标准差)。,于是:于是:2(,20),XN 这里这里 是未知的是未知的.,20 根据长期实践的经验表明异常区磁场强度的标根据长期实践的经验表明异常区磁场强度的标准差比较稳定,所以可设准差比较稳定,所以可设 提出假设:提出假设:00:56H10:56H 第一步:第一步:第二步:第二步:0(0,1)XUNn 由已知条件取由已知条件取检验统计量检验统计量为:为:第三步:第三步:0.05 对给定的显著性水平对给定的显著性水平 查正态分布表得临查正态分布表得临界值:界值:0.050.02521.96kzz
22、00XPkn 使得:使得:01.96Xkn 故得否定域为:故得否定域为:0:1.96XCn 即:即:是一个是一个小概率小概率事件事件.第四步:第四步:将样本值代入,计算出统计量将样本值代入,计算出统计量 的实测值:的实测值:U061.1565.11.6321.96203.12541xun 没有落入没有落入拒绝域拒绝域故不能拒绝故不能拒绝H0,即应接受,即应接受H0 结论:结论:可认为这台仪器测出的结果是符合可认为这台仪器测出的结果是符合要求的要求的,即这台机器是基本正常的即这台机器是基本正常的备择假设备择假设 表示表示 可能大于可能大于 也可也可1H 0 故故称称其为其为 双边备择假设。双边备
23、择假设。拒绝域与临界点拒绝域与临界点(1)当统计量取某个区域当统计量取某个区域 C 中的值时,拒绝原假中的值时,拒绝原假 设设 ,则称区域,则称区域 C 为为 拒绝域。拒绝域。0H(2)拒绝域的边界点称为拒绝域的边界点称为 临界点临界点.单边检验单边检验(1)右边检验右边检验:00:H 10:H(2)左边检验左边检验:00:H 10:H 注注从而对应的假设检验称为从而对应的假设检验称为 双边假设检验。双边假设检验。0,能小于能小于0 xkn 则则称称 与与 的的差异显著差异显著.x0 在正态分布中针对显著性水平在正态分布中针对显著性水平 ,一般有:,一般有:0 xkn 则则称称 与与 的的差异
24、不显著差异不显著.x0 例如例如,当当当当 五五.假设检验问题的步骤假设检验问题的步骤3.确定检验统计量及拒绝域的形式确定检验统计量及拒绝域的形式1.根据实际问题要求,提出原假设根据实际问题要求,提出原假设 及备择假设及备择假设0H1H2.给定显著性水平给定显著性水平 及样本容量及样本容量.n4.按按 ,求出拒绝域,求出拒绝域 )(00为真为真拒绝拒绝HHP5.取样本,根据样本观察值确定接受取样本,根据样本观察值确定接受 还是拒绝还是拒绝0H0H21(0,1)XUNn 某编织物强力指标某编织物强力指标 X 的均值的均值 公斤。公斤。改改进工艺后生产了一批编织物,今从中取进工艺后生产了一批编织物
25、,今从中取 30 件,件,测得测得 公斤。公斤。假设强力假设强力X 指标服从正指标服从正态分布态分布 ,且已知,且已知 公斤。公斤。021 21.55X 1.2 2(,)N 提出假设提出假设:01:21:21HH取统计量取统计量:否定域否定域 C C 为:为:0.012.33Uz 是一小概是一小概率事件率事件0.01Uu 例例40.01 问:在显著性水平问:在显著性水平 下,新生产编织物比下,新生产编织物比 过去的编织物强力是否有提高过去的编织物强力是否有提高?解解:并由样本值计算并由样本值计算,得得统计量统计量 U 的实测值为:的实测值为:1.2,30n 故拒绝原假设故拒绝原假设 H0,可认
26、为新生产编,可认为新生产编织物比过去的编织物强力是有提高的织物比过去的编织物强力是有提高的 落入否定域落入否定域此时可能会犯第一类错误,此时可能会犯第一类错误,但犯错误的概率不会超过但犯错误的概率不会超过 0.01.由已知,由已知,2.512.33u 注注1.已知,关于已知,关于 的检验的检验 (U 检验检验)2 在在 已知条件已知条件下用服从下用服从 的统计量检验正的统计量检验正态总体态总体 的方的方法为法为 U 检验法检验法2)1,0(N(1)检验假设检验假设:0010:,:HH取检验统计量取检验统计量:0(0,1)XNn 第二节第二节 正态总体均值的假设检验正态总体均值的假设检验 一一.
27、单个正态总体单个正态总体 均值均值 的检验的检验),(2 N 则在显著性水平则在显著性水平 下下,的的拒绝域拒绝域:0H02xun 的拒绝域的拒绝域0H的接受域的接受域0H2 2(2)检验假设:检验假设:0010:,:HH0()或或取检验统计量取检验统计量:0(0,1)XNn 则在显著性水平则在显著性水平 下下,的的拒绝域拒绝域:0H0 xun 的接受域的接受域0H的拒绝域的拒绝域0H0 xun 或或 1 u u 1 的接受域的接受域0H的拒绝域的拒绝域0H例例1.已知某钢铁厂的铁水含碳量在正常情况下服从已知某钢铁厂的铁水含碳量在正常情况下服从正态分布正态分布2(4.55,0.108),N 现
28、又测了现又测了5 炉铁水,炉铁水,其含碳量分别为其含碳量分别为:4.28,4.4,4.42,4.35,4.37问:当总体标准差没有改变时,现在生产是否正常问:当总体标准差没有改变时,现在生产是否正常?解解:假设假设0010:4.55,:4.55HH总体标准差没有改变,即总体标准差没有改变,即 已知的情况已知的情况2 统计量统计量0(0,1)XUNn (0.05)给定显著性水平给定显著性水平05.0 从而:从而:0.02521.96zz 04.3644.550.1083.95xn 4.284.404.424.354.374.3645x 经计算经计算 则:则:1.96 拒绝拒绝 ,可认为现在的生产
29、是不正常的。,可认为现在的生产是不正常的。0H例例2 已知某正态总体的方差为已知某正态总体的方差为 49,抽测,抽测 24个样本值个样本值的均值为的均值为8.55 x问:总体均值问:总体均值 是否成立是否成立55 (0.05)解解:01:55,:55HH显然它与检验显然它与检验:0H55 时的讨论是一样的。时的讨论是一样的。0.051.64zz 0(0,1)XUNn 取统计量取统计量因为是单边检验,因为是单边检验,所以:所以:假设假设给定显著性水平给定显著性水平05.0 5555.8557724240.56x 接受接受 ,即可以认为总体均值,即可以认为总体均值 是成立的是成立的0H55 (1)
30、对于对于00100:,:()HH或或与与的讨论均可归为如下统一形式的讨论的讨论均可归为如下统一形式的讨论:00100:,:()HH或或 因为它们的拒绝域是一致的因为它们的拒绝域是一致的 经计算经计算1.64 00100010:,:,:HHHH或或注注(2)对于对于0010:,:HH与与00100:,:()HH或或检验过程中检验过程中唯一不同唯一不同的是在查正态分布表时,的是在查正态分布表时,前者前者是利用概率关系式:是利用概率关系式:20();xPzn 而而后者后者是利用概率关系式:是利用概率关系式:0()xPzn 0()xPzn 或或2.未知,关于未知,关于 的检验的检验 (t 检验检验)2
31、 (1)检验假设检验假设:0010:,:HH0(1)Xt nsn 在在 未知条件下用服未知条件下用服从从 的统计量的统计量检验正态总体检验正态总体 的方的方法为法为 检验法检验法2(0,1)N t2 2s2 因为因为 未知,所以可以考虑用未知,所以可以考虑用 的无偏估计的无偏估计 来代替,故有来代替,故有:取检验统计量取检验统计量 0000knsxPHHP为真为真拒绝拒绝 则有:则有:2(1)ktn 02(1)xtnsn (2)检验假设:检验假设:0010:,:HH0010:,:HH则在显著性水平则在显著性水平 下下,的的拒绝域拒绝域:0H2t 2t 1 2 2 的拒绝域的拒绝域0H的接受域的
32、接受域0H或或0(1)xtnsn )1(0 ntnsx 或或 同同(1)讨论类似,则在显著性水平讨论类似,则在显著性水平 下下,的的拒绝域拒绝域:0Ht 1 的拒绝域的拒绝域0H 的接的接 受域受域0H 1 t 的接的接 受域受域0H的拒绝域的拒绝域0H 例例3某库房要验收大批同类物质,根据以往的经验,某库房要验收大批同类物质,根据以往的经验,这批物质每件的重量服从正态分布。按规定这批这批物质每件的重量服从正态分布。按规定这批物质平均每件重量应为物质平均每件重量应为 100 公斤,今抽取公斤,今抽取10 件件,测得其均值测得其均值299.6,4.044xs问:能否接受这批物质问:能否接受这批物
33、质?0.05 0010:100,:100HH解解:10099.61000.6294.0441010 xs2 未知,未知,所以用所以用 t 检验检验。经计算经计算设设 取统计量为取统计量为:(1)Xsnt n 接受接受 ,即可认为该库房应接受这批物质。,即可认为该库房应接受这批物质。0H 二二.两个正态总体均值差的检验两个正态总体均值差的检验设设 是来自是来自 的样本的样本,112,nXXX211(,)N 212,nY YY是来自是来自 的样本的样本,它们相互独立它们相互独立222(,)N 2221,ssyx分别是两个总体的均值与方差分别是两个总体的均值与方差1.当当 未知时未知时(t 检验检验
34、)22221 012112:,:HH 为已知常数,显著水平为为已知常数,显著水平为 0.0522(101)(101)2.2622tt 而而20.6229262 检验假设检验假设:检验统计量检验统计量1212()(2)11wXYt nnsnn 22112212(1)(1)(2)wnsnssnn 同单个总体的讨论类似,有:同单个总体的讨论类似,有:)11()(210021knnsyxPHHPw为真为真拒绝拒绝122(2)ktnn 其中:其中:在显著性水平在显著性水平 下下,的拒绝域的拒绝域:0H12212(2)11wxytnnsnn 22221 当当 未知时未知时 检验假设检验假设012112:,
35、:HH012112:,:HH或或其讨论同前类似其讨论同前类似,在显著性水平在显著性水平 下下,的拒绝域的拒绝域:0H注注1212()(2)11wxytnnsnn 1212()(2)11wxytnnsnn 或或2.当当 均已知时均已知时(U 检验检验)2212,012112:,:HH检验假设检验假设:为已知常数,显著水平为为已知常数,显著水平为 检验统计量检验统计量221212()(0,1)XYNnn 同单个正态总体的讨论类似,有同单个正态总体的讨论类似,有:)()(2221210021knnyxPHHP为真为真拒绝拒绝2kz 在显著性水平在显著性水平 下下,的的拒绝域拒绝域:0H当当 均已知时
36、均已知时2212,检验假设检验假设:012112:,:HH012112:,:HH221212xyznn 221212xyznn 或或 或或2221212xyznn 注注其讨论同前类似其讨论同前类似,在显著性水平在显著性水平 下下,的拒绝域的拒绝域:0H3.基于成对数据的假设检验基于成对数据的假设检验(t 检验检验)逐对比较法逐对比较法为了比较两种性能之间的差异,在为了比较两种性能之间的差异,在相同的条件下作对比试验,得到一相同的条件下作对比试验,得到一批成对的观察值。对观察值进行分批成对的观察值。对观察值进行分析,作出推断的方法。析,作出推断的方法。例例4 现要比较甲、乙两种橡胶制成的轮胎的耐
37、磨性。现要比较甲、乙两种橡胶制成的轮胎的耐磨性。今从甲、乙两种轮胎中各随机的取今从甲、乙两种轮胎中各随机的取 8 个,又从个,又从两组中各取一个组成一对,共两组中各取一个组成一对,共 8 对;对;再随机的取再随机的取 8 架飞机,将架飞机,将 8 对轮胎随机地搭配对轮胎随机地搭配给这给这 8 架飞机作耐磨性试验,当飞机飞行了一架飞机作耐磨性试验,当飞机飞行了一定时间后测得轮胎的磨损量的数据定时间后测得轮胎的磨损量的数据(单位:毫单位:毫克克)如下:如下:甲甲乙乙4900 5220 5500 6020 6340 7660 8650 48704930 4900 5140 5700 6110 688
38、0 7930 5010试问:这两种轮胎的耐磨性有无显著的差别?试问:这两种轮胎的耐磨性有无显著的差别?0.05 解:解:设设 X,Y:甲、乙两种轮胎的磨损量:甲、乙两种轮胎的磨损量并设并设 X,Y 均服从正态分布,即:均服从正态分布,即:2212(,),(,)XNYN方法一:数据不配对分析方法一:数据不配对分析将所观察的两行数据将所观察的两行数据分别分别作为作为 X,Y 的样本的样本依题意,依题意,检验假设检验假设:012112:,:HH因为因为已知已知22212,122(2)Ct ttnn 22126145,5825,1633900,1053875xyss所以所以在给定的显著性水平在给定的显
39、著性水平0.05 下下0H的拒绝域为:的拒绝域为:经计算经计算22112212(1)(1)1343887.5(2)wnsnssnn12120.5161111wwxyxytssnnnn 取统计量为取统计量为:121211(2)WXYSnnt nn 120.0522(2)(14)2.1448tnnt 0.5162.1448t 因为:因为:0H所以所以接受接受 ,可认为这两种轮胎的耐磨性可认为这两种轮胎的耐磨性无显著差异无显著差异。方法二:数据配对分析方法二:数据配对分析在方法一中是将所观察的两行数据在方法一中是将所观察的两行数据分别分别作作为为X,Y 的样本,而没有去区别它们是否的样本,而没有去区
40、别它们是否来自于同一架飞机。来自于同一架飞机。注意到注意到:事实上事实上:不同的飞机其试验的条件是不完全一致的,不同的飞机其试验的条件是不完全一致的,有的甚至于有很大的差异,有的甚至于有很大的差异,的试验条件的不同会对试验数据产生干扰的试验条件的不同会对试验数据产生干扰.所以飞机之间所以飞机之间容易将飞机之间的试验条件的差异容易将飞机之间的试验条件的差异与轮胎之间耐磨性的差异交织在一与轮胎之间耐磨性的差异交织在一起,分辨不出轮胎之间起,分辨不出轮胎之间真正真正的差异。的差异。方法一的不足:方法一的不足:方法二的做法:方法二的做法:观察分析观察分析同一架同一架飞机上两种轮胎的磨飞机上两种轮胎的磨
41、损量的差异,作出推断。损量的差异,作出推断。今令:今令:,1,2,8iiiDXYi01:0,:0DDHH 2(,)DDDN 128,D DD并令并令是总体是总体的样本的样本从而将原问题转化为单个正态总体中当从而将原问题转化为单个正态总体中当2 未知时未知时 关于关于的假设检验问题。的假设检验问题。检验假设:检验假设:按单个正态总体中当按单个正态总体中当 未知时,关于未知时,关于 的假设检验的假设检验的计算公式,可得的计算公式,可得 的的拒绝域拒绝域为:为:2 0H2(1)Ct ttn 经计算经计算2320,89425,3202.83894258dsdtsn0.0522.83(7)2.365tt
42、0.0522(1)(7)2.365tnt 因为:因为:取统计量为取统计量为:(1)Xsnt n 0H所以所以拒绝拒绝 ,可认为这两种轮胎的耐磨性可认为这两种轮胎的耐磨性有显著差异有显著差异。用两种不同的方法得到了两种不同的结论,用两种不同的方法得到了两种不同的结论,那么究竟应该采取哪一个结论比较合理呢?那么究竟应该采取哪一个结论比较合理呢?显然,应该采取第二种方法得出的结论是合理的显然,应该采取第二种方法得出的结论是合理的因为因为数据配对的方法是针对同一架飞机的,数据配对的方法是针对同一架飞机的,它是排除了因飞机之间的试验条件的不同它是排除了因飞机之间的试验条件的不同而对数据产生的干扰,而对数
43、据产生的干扰,注注所以所以它是直接反映了这两种轮胎的耐磨性它是直接反映了这两种轮胎的耐磨性的显著差异的情况的显著差异的情况.可认为这两种轮胎的耐磨性有显著差异可认为这两种轮胎的耐磨性有显著差异方法得出的结论方法得出的结论,即即因此因此,应采取第二种,应采取第二种 基于成对数据的假设检验的基于成对数据的假设检验的一般提法一般提法:111222,(,)nnnDXYDXYDXY1122(,),(,),(,)nnX YX YXY设有设有 对相互独立的观察结果:对相互独立的观察结果:n令令12,nDDD则则相互独立。相互独立。12,nDDD又由于又由于是由同一因素所引起的,所以可认为它们服从同是由同一因
44、素所引起的,所以可认为它们服从同2(,)1,2,;iDDDNin 现假设现假设2,DD未知未知即即12,nDDD是来自正态总体的一个样本。是来自正态总体的一个样本。2,Dd s其样本均值与样本方差的观察值为其样本均值与样本方差的观察值为一分布。一分布。检验假设检验假设010101(1):0,:0(2):0,:0(3):0,:0DDDDDDHHHHHH由单个正态总体均值的由单个正态总体均值的 t 检验检验,可得检验问题,可得检验问题(1)、(2)、(3)的拒绝域分别为:的拒绝域分别为:2(1)Ddttnsn (1)Ddttnsn(1)Ddttnsn 是来自总体的样本。是来自总体的样本。检验假设检
45、验假设22220010:,:HH(为已知常数为已知常数)20 取检验统计量取检验统计量22220(1)(1)nsn 第三节第三节 正态总体方差的假设检验正态总体方差的假设检验 一一.单个正态总体单个正态总体 方差方差 的检验的检验(检验检验)2(,)N 2 2 12,nXXX22(,),XN 总体总体均未知,均未知,其中:其中:2212122(1),(1)knkn 使得使得:2022122200(1)(1)()()nsnsPkk P 当当 为真时拒绝为真时拒绝 0H0H202021202220(1)(),2(1)()2nsPknsPk 为计算方便,习惯上取:为计算方便,习惯上取:则在显著性水平
46、则在显著性水平 下下,的的拒绝域拒绝域:0H2120(1)nsk 2220(1)nsk 或或212 22 1 2 2 的拒绝域的拒绝域0H的接受域的接受域0H例例1.某厂生产的钢丝质量一贯比较稳定,今从产品中某厂生产的钢丝质量一贯比较稳定,今从产品中随机抽取随机抽取10 根,检查其折断力,得数据如下根,检查其折断力,得数据如下:578,572,570,568,572,570,570,572,590,584 钢丝折断力服从钢丝折断力服从),(2 N问:是否可接受钢丝折断力的方差为问:是否可接受钢丝折断力的方差为 64(0.05)解解:22220010:64,:64HH 检验假设:检验假设:2,因
47、为因为均未知,均未知,所以所以取检验统计量:取检验统计量:22220(1)(1)nsn 574.6x 2220.050.02522(9)19.023 2220.050.9751122(9)2.7 10221(1)()464.4iinsxx 经计算:经计算:接受接受 ,即可认为钢丝的折断力的方差为,即可认为钢丝的折断力的方差为 64 0H2.77.2619.0232220(1)464.4(1)7.2664nsn 当总体服从正态分布,当总体服从正态分布,未知未知 22220010:,:HH220()是否成立时其讨论完全同上述类似,是否成立时其讨论完全同上述类似,22120(1)(1)nsn 222
48、0(1)(1)nsn 检验假设检验假设:则在显著性水平则在显著性水平 下下,的的拒绝域拒绝域:0H或或注注二二.两个正态总体方差的假设检验(两个正态总体方差的假设检验(F 检验)检验)12,nXXX211(,)N 是来自总体是来自总体 的样本,的样本,12,nY YY 是来自总体是来自总体 的样本,的样本,222(,)N 且两个样本相互独立。其样本方差分别为且两个样本相互独立。其样本方差分别为,2221ss且且 均未知。均未知。221212,检验假设检验假设22220010:,:HH 取检验统计量取检验统计量2211122222(1,1)sFF nns 2212211221222112222(
49、1,1)(1,1)sPFnnssFnns P 当当 为真时拒绝为真时拒绝 0H0H使得使得:则在显著性水平则在显著性水平 下下,的的拒绝域拒绝域:0H21122122(1,1)sFnns 或或2112222(1,1)sFnns 212F 1 的拒绝域的拒绝域0H的接受域的接受域0H 22F 1 的接受域的接受域0H的拒绝域的拒绝域0H 检验假设检验假设:2222012112:,:HH2222012112:,:HH 单边检验单边检验同上面双边检验的讨论类似,可得同上面双边检验的讨论类似,可得 的的拒绝域拒绝域为为:0H)1,1(212221 nnFss 2111222(1,1)sFnns 或或习
50、惯上亦称两个总体习惯上亦称两个总体方差相等的检验为:方差相等的检验为:两总体方差两总体方差齐性齐性的检验的检验注注例例2.解解:2222012112:,:HH试问:这两批葡萄酒的醇含量的均方差有无显著试问:这两批葡萄酒的醇含量的均方差有无显著 差异?差异?(0.1)检验假设检验假设现要检测两批葡萄酒的醇含量,分别对它们现要检测两批葡萄酒的醇含量,分别对它们进行进行 6 次和次和 4 次的测定,检测得各自的标准次的测定,检测得各自的标准差为差为 0.07 和和 0.06;假定这两批葡萄酒醇的含;假定这两批葡萄酒醇的含量均服从正态分布,量均服从正态分布,且且 均未知。均未知。221212,因为因为