1、第四节 区间估计区间估计 引言引言 前面,我们讨论了参数点估计前面,我们讨论了参数点估计.它它是用样本算得的一个值去估计未知参数是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误近似值,它没有反映出这个近似值的误差范围,使用起来把握不大差范围,使用起来把握不大.区间估计区间估计正好弥补了点估计的这个缺陷正好弥补了点估计的这个缺陷.求置信区间的一般步骤求置信区间的一般步骤:1.明确问题明确问题,是求什么参数的置信区间是求什么参数的置信区间?置信水平置信水平 是多少是多少?12.寻找参数寻找参数 的一个良好的点
2、估计的一个良好的点估计T(X1,X2,Xn)称称S(T,)为为枢轴量枢轴量.3.寻找一个待估参数寻找一个待估参数 和估计量和估计量T的函数的函数 S(T,),且其分布为已知且其分布为已知.4.对于给定的置信水平对于给定的置信水平 ,根据,根据S(T,)的分布,确定常数的分布,确定常数a,b,使得,使得 1 1 P(a S(T,)b)=5.对对“aS(T,)b”作等价变形作等价变形,得到如下得到如下形式形式:121P,21 1 则则 就是就是 的的100()的置信区间的置信区间.可见,确定区间估计很关键的是要寻找可见,确定区间估计很关键的是要寻找一个待估参数一个待估参数 和估计量和估计量T 的函
3、数的函数S(T,),且且S(T,)的分布为已知的分布为已知,不依赖于任何未知不依赖于任何未知参数参数 (这样我们才能确定一个大概率区间这样我们才能确定一个大概率区间).而这与总体分布有关,所以,而这与总体分布有关,所以,总体分布的总体分布的形式是否已知,是怎样的类型,至关重要形式是否已知,是怎样的类型,至关重要.这里,我们主要讨论总体分布为这里,我们主要讨论总体分布为正态正态的情形的情形.若样本容量很大,即使总体分布若样本容量很大,即使总体分布未知,应用中心极限定理,可得总体的近未知,应用中心极限定理,可得总体的近似分布,于是也可以近似求得参数的区间似分布,于是也可以近似求得参数的区间估计估计
4、.主要讨论以下几种情形:主要讨论以下几种情形:单个正态总体均值单个正态总体均值 和方差和方差 的区间估计的区间估计.2 两个正态总体均值差两个正态总体均值差 和方差比和方差比 的区间估计的区间估计.21 2221 书末附有书末附有 分布、分布、t 分布、分布、F分布的上侧分布的上侧分位数表,供使用分位数表,供使用.需要注意的事项在教需要注意的事项在教材上有说明材上有说明.2 至于如何由标准正态分布函数表查表至于如何由标准正态分布函数表查表求得分位数,若你对分布函数定义熟悉的求得分位数,若你对分布函数定义熟悉的话,这个问题不难解决话,这个问题不难解决.在求置信区间时,要查表求分位数在求置信区间时
5、,要查表求分位数.,),(,12221本方差本方差分别是样本均值和样分别是样本均值和样的样本的样本总体总体为为并设并设设给定置信水平为设给定置信水平为SXNXXXn 一、单个总体 的情况 ,)1(2为已知为已知 由例由例1可知可知:1 的置信区间的置信区间的一个置信水平为的一个置信水平为 .2/znX 的置信区间的置信区间均值均值 1.包糖机某日开工包了包糖机某日开工包了1212包糖包糖,称得质量称得质量(单单位位:克克)分别为分别为506,500,495,488,504,486,505,506,500,495,488,504,486,505,513,521,520,512,485.513,5
6、21,520,512,485.假设重量服从正态分布假设重量服从正态分布,解解,12,10 n,92.502 x计算得计算得,10.0)1(时时当当 05.02/zz 查表得查表得0.05).0.10(1 10,和和分别取分别取置信区间置信区间的的试求糖包的平均质量试求糖包的平均质量且标准差为且标准差为.新建文件夹新建文件夹42-1.ppt42-1.ppt2-12-1,95.021 ,645.1例例2 2/znx645.1121092.502 ,67.507 2/znx645.1121092.502 ,17.498 90%的置信区间为的置信区间为的置信度为的置信度为即即).67.507,17.4
7、98(,05.0)2(时时当当 ,975.021 025.02/zz 95%的置信区间为的置信区间为的置信度为的置信度为同理可得同理可得).58.508,26.497(.,1 ;,1,置信区间也较小置信区间也较小较小时较小时当置信度当置信度置信区间也较大置信区间也较大较大时较大时当置信度当置信度从此例可以看出从此例可以看出 附表附表2-22-2,96.1查表得查表得 ,)2(2为未知为未知 ,2/直接使用此区间直接使用此区间不能不能中含有未知参数中含有未知参数由于区间由于区间 znX ,222 替换替换可用可用的无偏估计的无偏估计是是但因为但因为SSS 1 的置信区间的置信区间的置信度为的置信
8、度为 .)1(2/ntnSX 推导过程如下推导过程如下:,1)1()1(2/2/ntnSXntnSXP即即 1 的置信区间的置信区间的置信度为的置信度为于是得于是得 .)1(2/ntnSX ),1(/ntnSX 又根据第六章定理三知又根据第六章定理三知 ,1)1(/)1(2/2/ntnSXntP则则解解 有一大批糖果有一大批糖果,现从中随机地取现从中随机地取16袋袋,称得重称得重量量(克克)如下如下:496509502506496493505514512497510504503499508506设袋装糖果的重量服从正态分布设袋装糖果的重量服从正态分布,试求总体均值试求总体均值,151 0.05
9、,n :)1(分布表可知分布表可知查查 nt)15(025.0t,2022.6,75.503 sx计算得计算得 .0.95 的置信区间的置信区间的置信度为的置信度为 附表附表3-13-1,1315.2例例3 5%9 的置信区间的置信区间的置信度为的置信度为得得 1315.2162022.675.503).1.507,4.500(即即就是说估计袋装糖果重量的均值在就是说估计袋装糖果重量的均值在500.4克与克与507.1克之间克之间,这个估计的可信程度为这个估计的可信程度为95%.).(61.621315.2162022.6 克克其误差不大于其误差不大于 ,的近似值的近似值为为若依此区间内任一值
10、作若依此区间内任一值作 这个误差的可信度为这个误差的可信度为95%.推导过程如下推导过程如下:,22的无偏估计的无偏估计是是因为因为 S),1()1(222 nSn 根据第六章第二节定理二知根据第六章第二节定理二知 1 2的置信区间的置信区间的置信度为的置信度为方差方差 .)1()1(,)1()1(22/1222/2 nSnnSn .,未知的情况未知的情况只介绍只介绍根据实际需要根据实际需要 .22的置信区间方差 1 2的置信区间的置信区间的置信度为的置信度为于是得方差于是得方差 ,1)1()1()1(22/2222/1 nSnnP则则 ,1)1()1()1()1(22/12222/2 nSn
11、nSnP即即 .)1()1(,)1()1(22/1222/2 nSnnSn 1 的置信区间的置信区间的一个置信度为的一个置信度为标准差标准差 .)1(1,)1(122/122/nSnnSn 进一步可得进一步可得:注意注意:在密度函数不对称时在密度函数不对称时,2分布分布分布和分布和如如F 习惯上仍取对称的分位点来习惯上仍取对称的分位点来确定置信区间确定置信区间(如图如图).(续例续例2)求例求例2 2中总体标准差中总体标准差 的置信度为的置信度为0.950.95的置信区间的置信区间.解解,151 0.975,21 0.025,2 n :)1(2分布表可知分布表可知查查 n )15(2025.0
12、,2022.6 s计算得计算得)15(2975.0 代入公式得标准差的置信区间代入公式得标准差的置信区间).60.9,58.4(附表附表4-14-1,488.27,262.6附表附表4-24-2例例4 需要指出的是,给定样本,给定置信水需要指出的是,给定样本,给定置信水平,平,置信区间也置信区间也不是唯一不是唯一的的.对同一个参数,我们可以构造许多置信区间对同一个参数,我们可以构造许多置信区间.N(0,1)nXU 取枢轴量取枢轴量由标准正态分布表,对任意由标准正态分布表,对任意a、b,我们可我们可以求得以求得P(aUb).,2已知 例如,设例如,设X1,Xn是取自是取自 的样本,的样本,),(
13、2 N求参数求参数 的置信水平为的置信水平为 的的 1置信区间置信区间.N(0,1)nXU 例如,由例如,由P(-1.96U1.96)=0.95)(ufu96.196.195.0我们得到我们得到 均值均值 的置信水平为的置信水平为 1的的置信区间为置信区间为96.1,96.1nXnX 由由 P(-1.75U2.33)=0.95这个区间比前面一个要长一些这个区间比前面一个要长一些.置信区间为置信区间为33.2,75.1nXnX 我们得到我们得到 均值均值 的置信水平为的置信水平为 1的的)(ufu33.275.1我们总是希望置信区间尽可能短我们总是希望置信区间尽可能短.类似地,我们可得到若干个不
14、同的置信类似地,我们可得到若干个不同的置信区间区间.任意两个数任意两个数a和和b,只要它们的纵标包含,只要它们的纵标包含f(u)下下95%的面积,就确定一个的面积,就确定一个95%的置信的置信区间区间.0buuu)(ufaaabb950.950.950.在概率密度为单峰且对称的情形,当在概率密度为单峰且对称的情形,当a=-b时时求得的置信区间的长度为最短求得的置信区间的长度为最短.0buuu)(ufaaabb950.950.950.a=-b 即使在概率密度不对称的情形,如即使在概率密度不对称的情形,如 分布分布,F分布分布,习惯上仍取对称的分位点来,习惯上仍取对称的分位点来计算未知参数的置信区
15、间计算未知参数的置信区间.2 我们可以得到未知参数的的任何我们可以得到未知参数的的任何置信水置信水平小于平小于1的的置信区间,并且置信区间,并且置信水平越高,置信水平越高,相应的相应的置信区间置信区间平均长度平均长度越长越长.)(22n)(221n)(xfx)(2nX 也就是说,要想得到的区间估计可靠也就是说,要想得到的区间估计可靠度高,区间长度就长,估计的精度就差度高,区间长度就长,估计的精度就差.这是一对矛盾这是一对矛盾.实用中应在保证足够可靠的前提下,实用中应在保证足够可靠的前提下,尽量使得区间的长度短一些尽量使得区间的长度短一些.休息片刻继续休息片刻继续二、两个总体 的情况.,),(,
16、),(,122212222121121的样本方差的样本方差分别是第一、二个总体分别是第一、二个总体总体的样本均值总体的样本均值分别是第一、二个分别是第一、二个的样本的样本个总体个总体为第二为第二的样本的样本第一个总体第一个总体为为并设并设设给定置信度为设给定置信度为SSYXNYYYNXXXnn 讨论两个总体均值差和方差比的估计问题讨论两个总体均值差和方差比的估计问题.均为已知均为已知和和2221)1(1 21的置信区间的置信区间的一个置信度为的一个置信度为 .2221212/nnzYX ,21的无偏估计的无偏估计分别是分别是因为因为 YX推导过程如下推导过程如下:,21的无偏估计的无偏估计是是
17、所以所以 YX 21的置信区间的置信区间两个总体均值差两个总体均值差 1.,的独立性及的独立性及由由YX,1211 nNX ,2222 nNY ,22212121 nnNYX 可知可知 ,1,0 22212121NnnYX 或或 1 21的置信区间的置信区间的一个置信度为的一个置信度为于是得于是得 .2221212/nnzYX ,)2(2221均为未知均为未知和和 ),50(21则有则有即可即可实用上实用上都很大都很大和和只要只要 nn 1 21的近似置信区间的近似置信区间的一个置信度为的一个置信度为 .2221212/nSnSzYX ,)3(222221为未知为未知但但 1 21的置信区间的
18、置信区间的一个置信度为的一个置信度为 .11)2(21212/nnSnntYXw.,2)1()1(2212222112wwwSSnnSnSnS 其中其中例例5为比较为比较,两种型号步枪子弹的枪口速度两种型号步枪子弹的枪口速度,随机地取随机地取型子弹型子弹10发发,得到枪口速度的平均值为得到枪口速度的平均值为),s/m(5001 x),s/m(10.1 1 s标准差标准差随机地取随机地取型子弹型子弹20发发,得枪口速度平均值为得枪口速度平均值为),s/m(4962 x),s/m(20.1 2 s标准差标准差假设两总体都可认为近似假设两总体都可认为近似地服从正态分布地服从正态分布,且由生产过程可认
19、为它们的方差且由生产过程可认为它们的方差相等相等,求两总体均值差求两总体均值差 .950 21的置的置的置信度为的置信度为 信区间信区间.解解 由题意由题意,两总体样本独立且方差相等两总体样本独立且方差相等(但未知但未知),0.025,2 ,20,1021 nn,28221 nn :)1(分布表可知分布表可知查查 nt,0484.2)28(025.0 t,2820.11910.19 222 ws,1688.12 wwSs .950 21的置信区间的置信区间的一个置信度为的一个置信度为于是得于是得 201101)28(025.021tSxxw),93.04().93.4,07.3(即所求置信区间
20、为即所求置信区间为 .,21为未知的情况为未知的情况仅讨论总体均值仅讨论总体均值 1 2221的置信区间的置信区间的一个置信度为的一个置信度为 .)1,1(1,)1,1(1212/12221212/2221 nnFSSnnFSS推导过程如下推导过程如下:),1()1(1221211 nSn 由于由于 ),1()1(2222222 nSn 2221的置信区间的置信区间两个总体方差比两个总体方差比 2.,)1()1(2222221211相互独立相互独立与与且由假设知且由假设知 SnSn 根据根据F分布的定义分布的定义,知知 ),1,1(2122222121 nnFSS 22222121 SS即即
21、)1()1()1()1(222222121211 nSnnSn ),1,1(21 nnF,1 )1,1()1,1(212/22222121212/1 nnFSSnnFP ,1)1,1(1)1,1(1212/122212221212/2221 nnFSSnnFSSP 1 2221的置信区间的置信区间的一个置信度为的一个置信度为于是得于是得 .)1,1(1,)1,1(1212/12221212/2221 nnFSSnnFSS 解解,181 n,132 n例例6 研究由机器研究由机器 A 和机器和机器 B 生产的钢管内径生产的钢管内径,随随机抽取机器机抽取机器 A 生产的管子生产的管子 18 只只,
22、测得样本方差为测得样本方差为均未知均未知,求方差比求方差比 .900 的置的置的置信度为的置信度为区间区间.设两样本相互独设两样本相互独);mm(34.0 221 s).mm(29.0 222 s抽取机器抽取机器B生产的管子生产的管子 13 只只,测测得样本方差为得样本方差为立立,且设由机器且设由机器 A 和机器和机器 B 生产的钢管内径分别服生产的钢管内径分别服从正态分布从正态分布),(),(222211 NN)2,1(,2 iii 2221 信信,10.0 ),mm(34.0 221 s),mm(29.0 222 s,59.2)12,17()1,1(05.0212/FnnF)12,17()
23、12,17(95.02/1FF ,38.21)17,12(105.0 F .900 2221的置信区间的置信区间的一个置信度为的一个置信度为于是得于是得 38.229.034.0,59.2129.034.0 .79.2,45.0 解解,91 n,62 n,02.0 例例7甲、乙两台机床加工同一种零件甲、乙两台机床加工同一种零件,在机床甲在机床甲加工的零件中抽取加工的零件中抽取9个样品个样品,在机床乙加工的零件在机床乙加工的零件信区间信区间.假定测量值都服从正态分布假定测量值都服从正态分布,方差分别为方差分别为的置的置在置信度在置信度,245.0 21 s,357.0 22 s由所给数据算得由所
24、给数据算得0.98下下,试求这两台机床加工精度之比试求这两台机床加工精度之比.,2221 21 中抽取中抽取6个样品个样品,并分别测得它们的长度并分别测得它们的长度(单位单位:mm),3.10)5,8()1,1(99.0212/1 FnnF)5,8()5,8(01.02/FF ,63.61)8,5(199.0 F .980 21的置信区间的置信区间的一个置信度为的一个置信度为于是得于是得 )1,1(1,)1,1(1212/12221212/2221 nnFSSnnFSS 357.063.6245.0,3.10357.0245.0 .133.2,258.0 一个正态总体未知参数的置信区间一个正态
25、总体未知参数的置信区间待估参数待估参数随机变量随机变量随机变量随机变量的分布的分布双侧置信区间的上、下限双侧置信区间的上、下限 2 已知已知2 未知未知2 已已知知 未知未知 nX/nSX/niiX1221 niiXX1221 10,N 1 nt n2 12 n nzX 2 nSntX 12 nXnXniinii211221222 11211221222 nXXnXXniinii 两个正态总体未知参数的置信区间(一)两个正态总体未知参数的置信区间(一)待估参数待估参数随机变量随机变量随机变量随机变量的分布的分布双侧置信区间的上、下限双侧置信区间的上、下限21 均已知均已知、222 但未知但未知
26、2221 nmYX222121 nmSYXw1121 10,N 2 nmt nmzYX22212 nmSnmtYXw1122 21122212 nmSnSmSw其中其中两个正态总体未知参数的置信区间(二)两个正态总体未知参数的置信区间(二)待估待估参数参数随机变量随机变量随机变量随机变量的分布的分布 双侧置信区间的上、下限双侧置信区间的上、下限2221 njjmiiYmXn1222212121/nmF,njjmiiYmXnnmF12212121 均已知均已知、21 均未知均未知、21 njjmiiYmXnnmF122121121 ,22222121 SS),11(nmF ,22211112SS
27、nmF 222111112SSnmF ,三、单侧置信区间三、单侧置信区间 上述置信区间中置信限都是双侧的,但上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在对于有些实际问题,人们关心的只是参数在一个方向的界限一个方向的界限.例如对于设备、元件的使用寿命来说,平均例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了寿命过长没什么问题,过短就有问题了.这时,可将置信上限取这时,可将置信上限取为为+,而只着眼于置信下,而只着眼于置信下限,这样求得的置信区间限,这样求得的置信区间叫单侧置信区间叫单侧置信区间.于是引入单侧置信区间和置信限的定义:于是引入单侧置
28、信区间和置信限的定义:11P),(2111nXXX 满足满足设设 是是 一个待估参数,给定一个待估参数,给定,0 若由样本若由样本X1,X2,Xn确定的统计量确定的统计量则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间.),1 11 称为单侧置信下限称为单侧置信下限.),(2122nXXX 又若统计量又若统计量 满足满足 12P2 则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间.,(2 1 称为单侧置信上限称为单侧置信上限.单个单个正态总体均值与方差的单侧置信区间正态总体均值与方差的单侧置信区间 ,)(,2均为未知均为未知方差是方差
29、是的均值是的均值是设正态总体设正态总体 X ,21是一个样本是一个样本nXXX),1(/ntnSX 由由,1)1(/ntnSXP有有,1)1(ntnSXP即即,),1(ntnSX 1 的置信下限的置信下限的置信水平为的置信水平为 ).1(ntnSX ),1()1(222 nSn 又根据又根据,1)1()1(2122 nSnP有有 1的单侧置信区间的单侧置信区间的一个置信水平为的一个置信水平为于是得于是得 12的单侧置信区间的单侧置信区间的一个置信水平为的一个置信水平为于是得于是得 ,)1()1(,0212 nSn 12的单侧置信上限的单侧置信上限的置信水平为的置信水平为 .)1()1(2122
30、 nSn ,1)1()1(2122 nSnP即即设灯泡寿命服从正态分布设灯泡寿命服从正态分布.求灯泡寿命均求灯泡寿命均值值 的置信水平为的置信水平为0.95的单侧置信下限的单侧置信下限.例例8从一批灯泡中随机抽取从一批灯泡中随机抽取5只作寿命试只作寿命试验,测得寿命验,测得寿命X(单位:小时)如下:(单位:小时)如下:1050,1100,1120,1250,1280)1(ntnSX 由于方差由于方差 未知,取枢轴量未知,取枢轴量2 解:解:的点估计取为样本均值的点估计取为样本均值 X 对给定的置信水平对给定的置信水平 ,确定分位数,确定分位数)1(nt 1 1)1(ntnSXP使使即即 1)1
31、(nSntXP于是得到于是得到 的置信水平为的置信水平为 的单侧置的单侧置信区间为信区间为 1,)1(nSntX 将样本值代入得将样本值代入得 的置信水平为的置信水平为0.95的单侧置信下限是的单侧置信下限是1065小时小时 的置信水平为的置信水平为 的单侧置信下限为的单侧置信下限为 1即即nSntX)1(同学们可通过练习,掌握各种求未同学们可通过练习,掌握各种求未知参数的知参数的 置信区间的具体方法置信区间的具体方法.这一讲,我们介绍了区间估计这一讲,我们介绍了区间估计.数学奖菲尔兹奖与阿贝尔奖,沃尔夫奖 为什么诺贝尔在以他名字命名的奖项中不设立数学奖?这个问题曾经引起许多猜测。比较流行的说
32、法有两种:一个传说是诺贝尔本人认为数学与人类的进步没有直接的关联,因而不值得为数学设立专门奖项;另一个更为广泛的说法是,当时瑞典的领头数学家莱夫勒,他是诺贝尔的情敌,如果设立诺贝尔数学奖,则很可能非莱夫勒莫属。当然,事实真相究竟如何,现在已经难以精确地考证,但诺贝尔部设立数学奖却早已成为不争的事实,引起数学界的普遍抱怨。菲尔兹是加拿大的数学家,热心倡导数学国际交流活动,曾成功组织了多伦多举办的第7届国际数学大会。菲尔兹是莱夫勒的好朋友,他对诺贝尔不设立数学奖颇有不满,于是他提议将第7届国际数学大会剩余经费用来设立一个数学奖。在他去世前,菲尔兹又把自己的财产中的一大笔钱捐献出来,以增加数学奖的费
33、用。在1932年苏黎世举行的第9届数学大会上,大会组织成员决定把这个数学奖命名为“菲尔兹奖”。菲尔兹奖用来奖励年龄不超过40岁的年轻数学家,每次获奖者不超过4人,每位获奖者可得到一枚纯金奖章和一笔数额不大的奖金。1982年华裔美国数学家丘成桐获得了菲尔兹奖,成为目前唯一获此殊荣的华人。菲尔兹奖每4年颁发一次,且奖金数量远远不能和诺贝尔奖相比较。2002年,挪威政府宣布将于2003年开始颁发“阿贝尔奖”,以纪念挪威天才的青年数学家阿贝尔诞辰200周年。这项奖金每年一次,奖金约50万美元。这足可以和诺贝尔奖金相比较。菲尔兹奖面向的是青年数学家,而诺贝尔奖获得者往往超过了40岁。在数学界还有以色列政府颁发的“沃尔夫奖”,该奖项没有年龄限制。我国数学家陈省身就是一名获奖者。有人称赞费尔兹奖为“青年数学奖”,把沃尔夫奖称为数学的“终身成就奖”,由此,可以看出两个奖项在数学界地位相当。