1、A16.4 参数的区间估计参数的区间估计2010年11月A2p 矩估计与极大似然估计,都是一种点估计。矩估计与极大似然估计,都是一种点估计。p点估计的两个缺陷点估计的两个缺陷: (1)不能说明估计值与真值的偏差到底有多大(精确性); (2)不能说明这个估计有多大的可信度(可靠性); p区间估计是指用一个区间估计是指用一个(随机随机) 区间去做未知参数区间去做未知参数 的估计,可以解决这两个不足的估计,可以解决这两个不足 。点估计与区间估计点估计与区间估计: :A3例例: :设有一批电子元件的寿命XN(a,),现从中抽取容量为的一组样本,算得其样本均值为小时,试估计a 解:由点估计,a的估计值为
2、 . 实际上a的值是非真是000呢?显然,不同的抽样,可得到不同的 值,故000与a会有差异这种差异有多大呢? 我们从另一个角度考虑5000a aA4/21( , )(0,1)1(01),1XXN anXaUNnXaPn由于a= 是一个随机变量,它有自己的分布因此, 于是对给定的一个正数有 z=1-A5/2/2/2110.051.96,10.7212.480.95P XXnnP即 zaz=1- 如果取有Z于是有 a= 这95%的把握认为a在区间(10.72 , 12.48) 内.就是说,我们有这样一种方式的估计称为区间估计.?2/z为什么要取ch7-62211.96 ( 1.96) 3.92z
3、z -2-1120.10.20.30.42z21z取 = 0.05/2/211XaPnXaPnz=1-z=23311.84 ( 2.13) 3.97zz -2-1120.10.20.30.432z31z/21/2ZZ 在保持面积不变的条件下在保持面积不变的条件下, 以对称区间的长度为最短以对称区间的长度为最短 .A712122X,(0 1),(,),(,),1,1,)1.:,nnXXXXXX 1212121设总体 的分布中含有未知参数是任意给定的正数如果能从样本出发确定出两个统计量使得 P成立 我们称为,区间(为参数 的置信度为的定义置信度或置信概率分别称为置信上限和置置信区间信下限.A8n置
4、信度为置信度为 0.950.95 是指是指 100 100 组样本值所得置信区组样本值所得置信区间的间的实现实现中中, ,约有约有9595个能覆盖个能覆盖 , ,而不是说一个而不是说一个实现实现以以 0.95 0.95 的概率覆盖了的概率覆盖了 . .n要求要求 以很大的可能被包含在置信区间内以很大的可能被包含在置信区间内, ,就是就是说说 , , 概率概率 要尽可能大要尽可能大, ,即要求估计尽量即要求估计尽量可靠可靠. .置信度即可靠度置信度即可靠度. .n区间的宽度反映了估计的精度区间的宽度反映了估计的精度. .显然显然, ,区间越小区间越小, ,精度越高精度越高. .n区间估计中的精确
5、性与可靠性是相互矛盾的区间估计中的精确性与可靠性是相互矛盾的. .当样本容量一定时当样本容量一定时, ,提高估计的可靠度,将降低提高估计的可靠度,将降低估计的精度,相反,提高估计的精度,将降低估计的精度,相反,提高估计的精度,将降低估计的可靠度估计的可靠度. .n在实际使用中在实际使用中, ,总是在保证一定的可靠度的情况总是在保证一定的可靠度的情况下尽可能地提高其精度下尽可能地提高其精度. .1P 12A9区间估计的步骤区间估计的步骤22211,)TP TTT 111(1)选取一个合适的随机变量 ,这个随机变量一方面包括了待估参数 ,另一方面,它的分布是已知的;(2)根据实际需要,选取合适的置
6、信度1- ;(3)根据相应分布的分位数概念,写出如下形式的概率表达式 (4)将上式表达式变形为P(5)写出参数 的置信区间( X , S 2 分别是其样本分别是其样本均值和样本方差均值和样本方差, X N( ( , 2/ /n), ), 求参数求参数 、 2 的置信水平为的置信水平为1- - 的置信区间的置信区间. 设设 X1, , Xn 是总体是总体 X N( ( , 2) )的样本的样本, nXU/ 确定未知参数的确定未知参数的估计量及其函数的分布估计量及其函数的分布 是是 的无偏估计量的无偏估计量, 由分布求分位数由分布求分位数 Z / 2即得置信区间即得置信区间( (一一) ) 单个正
7、态总体置信区间的求法单个正态总体置信区间的求法( (1) )已知方差已知方差 2 时时 故可用故可用 X 作为作为 EX 的一个估计量的一个估计量, niiXnX11 N( (0, 1), ), 对给定的置信度对给定的置信度 1- - , ,/2/2/2|/XZXZXZnnn/2|(|),ZP U 由由Z / 2确确定置信区间定置信区间/2/2(,) ,ZZXXnn 有了分布就可求出有了分布就可求出U 取值于任意区间的概率取值于任意区间的概率简记为简记为 2XZn由抽样分布定理知由抽样分布定理知 1. 均值均值 的置信区间的置信区间 故不能采用已知方差故不能采用已知方差的均值估计方法的均值估计
8、方法 由于由于 与与 有关有关, 但其解决的思路一致但其解决的思路一致. nSX 由于由于 S 2是是 2 的无偏估计量的无偏估计量, 查查 t 分布表确定分布表确定 / /2 分位数分位数令令 , 1)1(| 2ntTP T = ( (2) ) 未知方差未知方差/2/2(,)ZZXXnnnXU/ 用用 分布的分位数求分布的分位数求 的置信区间的置信区间. 故可用故可用 S 替代替代 的估计量的估计量: S t( (n- -1), ), ) )( ()1(, ) 1(22 ntnSXntnSX 即为即为 的置信度为的置信度为 1- - 的区间估计的区间估计. ) 1() 1(22 ntnSXn
9、tnSX 2 时时 由抽样分布定理知由抽样分布定理知 实用价值更大实用价值更大 ! )1(|2/ ntnSX t / 2( (n - -1), ), , )1()1(222 nSn ( (2) ) 未知时未知时 1)1()1(222221nnP,)1()1()1()1(22122222 nSnnSn 所以所以 2的置信水平为的置信水平为1- - 的区间估计为的区间估计为因为因为 2 的无偏估计为的无偏估计为 S 2 , 2. 方差方差 2 的的置信区间的求法置信区间的求法 由抽样分布定理知由抽样分布定理知 2 = 由由确定确定 2 分布的分布的 /2 分位数分位数.)1()1(,)1()1(2
10、212222 nSnnSn 找一个含找一个含 与与S, 但不含但不含 , 且分布已知的统计量且分布已知的统计量 为了计算简单为了计算简单, ,在概率密度不对称的情形下在概率密度不对称的情形下, ,如如 2 分布分布, ,F 分布分布, ,习惯上仍取习惯上仍取对称的分位点对称的分位点来计算未知参数的置信区间来计算未知参数的置信区间. . 并不是最短的置信区间并不是最短的置信区间 /2 /2)1()1()1(2222221 nSnn , )1(22 n , )1(221 n A13 ),90%.(1)0.01;(2) 222例:随机地从一批钉子中抽取6枚,测得长度为2.14 2.10 2.15 2
11、.10 2.13 2.12并设总体XN( ,试求下列情况下 的的置信区间未知;A14 0000.11.645,6,XnXXnnn 2200.05解:容易求出 x=2.123, (1) =已知时,选取 U=N(0,1) 置信区间为( Z ,Z )这里,Z代入得 的90%的置信区间为(2.056, 2.190)A15 (5)2.015,XtSnSSXXnn220.05 (2) 未知时,选取 T=(n-1) 置信区间为( t (n-1),t (n-1)这里,t代入得 的90%的置信区间为(2.106, 2.140)A16 注:两种不同的条件,得到两种不同的结果.其可靠性相同,而精度却不同, 已知时
12、的估计精度比 未知时 的估计精度差.但一般情况下,给定的信息越多,估计越精确,而本例能说明什么问题呢? 设设 X1, , Xm分别是总体分别是总体 X N( ( 1 1 , 1 12) )的样本的样本, Y1, , Yn分别分别是总体是总体 Y N( ( 2 2 , 2 22) )的样本的样本, X , Y 分别是总体分别是总体 X 和和 Y 的样本均值的样本均值, 求参数求参数 1- - 2 和和 12/ / 22 的的置信水平为置信水平为 1- - 的置信区间的置信区间. 由于由于X , Y 分别是分别是 1, , 2 的无偏估计量的无偏估计量, 即得置信区间即得置信区间( (二二) )
13、两个正态总体两个正态总体( (1) )已知方差已知方差 12, , 22 时时 故可用故可用 X - -Y 作为作为 1- - 2 的一个估计量的一个估计量, N( (0, 1), ), 对给定的置信度对给定的置信度 1- - , ,nuYXmuYXuU222/21212/2/| ,21)(2/ u令令查正态分布表可得查正态分布表可得 u / 2 , 由抽样分布定理知由抽样分布定理知 1. 均值均值 1- - 2 的置信区间的置信区间 SX2 , SY2分别是总体分别是总体 X 和和 Y 的样本方差的样本方差, 置信区间的求法置信区间的求法 nmYXU222121)( ),(222/212/n
14、uYXmuYX 设设 X1, , Xm分别是总体分别是总体 X N( ( 1 1 , 1 12) )的样本的样本, Y1, , Yn分别分别是总体是总体 Y N( ( 2 2 , 2 22) )的样本的样本, X , Y 分别是总体分别是总体 X 和和 Y 的样本均值的样本均值, 求参数求参数 1- - 2 和和 12/ / 22 的的置信水平为置信水平为 1- - 的置信区间的置信区间. 即得置信区间即得置信区间( (二二) ) 两个正态总体置信区间的求法两个正态总体置信区间的求法 ( (2) )未知方差未知方差 12, , 22 , 但但 12 = 22 = 2时时 仍用仍用 X - -
15、Y 作为作为 1- - 2 的一个估计量的一个估计量, t( (n+ +m- -2), ), 对给定的置信度对给定的置信度 1- - , ,1111)2(|2/212/2/nmStYXnmStYXmntT 查查 t 分布表可得分布表可得 由抽样分布定理知由抽样分布定理知 1. 均值差均值差 1- - 2 的置信区间的置信区间 SX2 , SY2分别是总体分别是总体 X 和和 Y 的样本方差的样本方差, nmSYXT11)(21 2)1()1(22 nmSnSmYX)1111(2/2/nmStYXnmStYX ,t / 2( (n+ +m- -2),), 设同上设同上, 求参数求参数 12/ /
16、 22 的置信水平为的置信水平为 1- - 的置信区间的置信区间. 即得即得 12/ / 22 的置信区间的置信区间 ( (二二) ) 两个正态总体置信区间的求法两个正态总体置信区间的求法 ( (2) )未知未知 1 , 2 时时 F( (m- -1, n- -1), ), 对给定的置信度对给定的置信度 1- - , ,) 11(1) 11(1) 1, 1(|2/1222122212/22212/ n,mFSSn,mFSSnmFF 查查 F 分布表可得分位数分布表可得分位数由抽样分布定理知由抽样分布定理知 2. 方差比方差比 12/ / 22 的置信区间的置信区间 222212 YXSSF )
17、 11(1,) 11(1(2/122212/2221 n,mFSSn,mFSS F / 2( (m- -1, n- -1),), F1- - / 2( (m- -1, n- -1), ), 主要根据主要根据抽样分布抽样分布Th( (二二) )两个总体两个总体 由由 的概率分布和置信水平的概率分布和置信水平 1- - , 确定其相应的确定其相应的分位数分位数 x / /2 ; 小结小结正态总体置信区间的求法正态总体置信区间的求法 ( (一一) )单个总体单个总体均值均值 已知方差已知方差 2 均值差均值差 1- - 2 已知方差已知方差 12, , 22 方差方差 2 未知方差未知方差 2 .
18、),( 解得解得所求的置信区间所求的置信区间 根据未知参数的无偏估计量根据未知参数的无偏估计量, 确定其某个估计量确定其某个估计量 ; 由不等式由不等式 ,| x 已知均值已知均值 未知均值未知均值 未知方差未知方差 12, , 22 方差比方差比 12/ / 22 已知均值已知均值 1, 2 未知均值未知均值 1, 2 但相等但相等! ! ; ),(2nNX . ) 1(1222 nSn )1( ntnSX ; )1,0 ()()(21222121NnmYX ,)1, 1(222212 nmFSSYX , )2()11()(2121 nmtnmSYX A216.4 分布参数的区间估计一、置信
19、区间公式一、置信区间公式二、典型例题二、典型例题)10( A22一、置信区间公式置信区间是置信区间是的的的置信度为的置信度为则则为未知参数为未知参数其中其中的分布律为的分布律为的总体的总体分布分布它来自它来自的大样本的大样本设有一容量设有一容量 1, 1, 0,)1();( ,)10(,501ppxpppxfXXnxx,24,2422 aacbbaacbb, 22/ zna 其中其中),2(22/ zXnb .2Xnc A23推导过程如下推导过程如下:因为因为(01)分布的均值和方差分别为分布的均值和方差分别为),1(,2ppp , , 21是是一一个个样样本本设设nXXX因为容量因为容量n较
20、大较大,由由中心极限定理中心极限定理知知)1()1(1pnpnpXnpnpnpXnii , )1 , 0( 分布分布近似地服从近似地服从 N,1)1(2/2/ zpnpnpXnzPA242/2/)1( zpnpnpXnz 不等式不等式, 0)2()( 222/222/ XnpzXnpzn 等价于等价于,24,242221aacbbpaacbbp 令令, 22/ zna 其中其中),2(22/ zXnb .2Xnc 的的置置信信区区间间是是的的近近似似置置信信水水平平为为则则 1p).,(21ppA25二、典型例题 设从一大批产品的设从一大批产品的100个样品中个样品中, 得一级品得一级品60个
21、个, 求这批产品的一级品率求这批产品的一级品率 p 的置信水平为的置信水平为0.95的的置信区间置信区间.解解一级品率一级品率 p 是是(0-1)分布的参数分布的参数,100 n, 6 . 010060 x,95. 01 ,96. 1025. 02/ zz ,84.103 22/ zna则则例例1A26)2(22/ zXnb )2(22/ zxn ,84.123 22xnXnc ,36 aacbbp2421 于是于是aacbbp2422 ,50. 0 ,69. 0 p 的置信水平为的置信水平为0.95的置信区间为的置信区间为).69. 0,50. 0(A27 设从一大批产品的设从一大批产品的1
22、20个样品中个样品中, 得次品得次品9个个, 求这批产品的次品率求这批产品的次品率 p 的置信水平为的置信水平为0.90的置信的置信区间区间.解解,120 n,09. 01009 x,90. 01 例例222 zna 则则,71.122 )2(22 zXnb )2(22 zxn ,31.24 2Xnc 2xn ,972. 0 A28p 的置信水平为的置信水平为0.90的置信区间为的置信区间为).143. 0,056. 0(aacbbp2421 于于是是,056. 0 aacbbp2422 ,143. 0 A29n例:在某次选举前的一次民意测验中,随机地抽取了400名选取民进行民意测验,结果有240人支持个指定的候选人。求在所有的选民中,这位候选人的支持率95%的置信区间 A30 222233(0,1)(1)1()()0.5513,0.6468)pmnpUNmmnZUZmm nmmm nmnnnn 解:这是大样本情况下事件概率 的置信区间 选用 对给定的1- 由P 得 ( -Z ,+Z )这里:n=400,m=240 =0.05 代入得:支持率p的95%的置信区间为(