1、数理统计数理统计参数估计假设检验点估计区间估计6 参数估计参数估计一、参数的点估计一、参数的点估计 定义定义1 设总体的分布函数已知但含未知参数设总体的分布函数已知但含未知参数 , 为来自总体的样本,相应的样本值为来自总体的样本,相应的样本值是是 .由样本构造一个统计量由样本构造一个统计量 ,用它的观测值用它的观测值 来估计未知参数来估计未知参数 ,称称 为为 的点估计量的点估计量,称称 为为 的点估计值的点估计值.12,nXXX12,nx xx12(,)nXXX12( ,)nx xx12(,)nXXX12( ,)nx xx 为来自总体为来自总体 的一个样本,观测值的一个样本,观测值为为 :
2、用样本均值用样本均值 作为总体均值作为总体均值 的点估计量的点估计量,即即 从而从而 为为 的点估计值的点估计值.X11niiXXn1.数字特征法数字特征法用样本的数字特征估计用样本的数字特征估计总体的数字特征总体的数字特征12,nXXX12,nx xx()E X11niiXXn11niixxn 用样本方差用样本方差 作为总体作为总体方差方差 的点估计量的点估计量,即即 从而从而 为为 的点估计值的点估计值.22211()1niiSXXn2211()1niiSXXn2()D X22211()1niisxxn2 例例1 1 在一批某种零件中在一批某种零件中, ,随机地取随机地取8 8个个, ,测
3、得它测得它们的重量们的重量( (单位单位:g):g)为为: : 801,804,799,794,802,800,803,805. 801,804,799,794,802,800,803,805.试用数字特征法估计总体均值试用数字特征法估计总体均值 和方差和方差 . .解解 1(801 804799794802800803805)801828118iixx 822211()8 1iisxx22221(801 801)(804801)(799801)(794801)72222(802801)(800801)(803 801)(805801) 12 例例2 2 已知乘客在某公交汽车站等车的时间已知乘
4、客在某公交汽车站等车的时间 ( (单位:单位:min)min)服从服从 上的均匀分布上的均匀分布, ,现随机抽测现随机抽测了了1010位乘客的等车时间位乘客的等车时间, ,数据如下数据如下: : 2,4,5,8,3,6,5,6,10,1. 2,4,5,8,3,6,5,6,10,1.试用数字特征法估计试用数字特征法估计 的值的值, ,并求乘客等车时间不并求乘客等车时间不超过超过5min5min的概率的概率. .解解 设设 是抽得的样本是抽得的样本, ,由于由于 , ,密度函数为密度函数为X0, 12,nXXX0, XU1,0( )0,xf x其他总体的均值为总体的均值为由数字特征法有由数字特征法
5、有因此因此代入数据得代入数据得从而等车时间不超过从而等车时间不超过5min5min的概率为的概率为 112niiXn2000()( )22xxE Xxf x dxdx12niiXn10121(24583656 10 1)10510iix 5550001(5)( )0.5.1010 xP Xf x dxdx 对于同一个未知参数对于同一个未知参数, ,不同的方法得到的估不同的方法得到的估计量可能不同计量可能不同, ,应该选用哪一个估计量?应该用应该选用哪一个估计量?应该用什么标准评价一个估计量的好坏?什么标准评价一个估计量的好坏? 常用的标准有三个:常用的标准有三个: (1 1)无偏性;)无偏性;
6、 (2 2)有效性;)有效性; (3 3)一致性)一致性. .2.估计量的评价标准估计量的评价标准 设设 是参数是参数 的估计量的估计量,若若 ,则称则称 是是 的无偏估计量的无偏估计量. 注注:1.估计量估计量 的值不一定就是的值不一定就是 的真值的真值 ,因为因为它是一个随机变量它是一个随机变量,若若 是是 的无偏估计的无偏估计,则尽管则尽管 的值随样本值的不同而变化的值随样本值的不同而变化,但平均来说它会等于但平均来说它会等于 的真值的真值. 2.一般说来无偏估计量的函数并不是未知参数一般说来无偏估计量的函数并不是未知参数相应函数的无偏估计量相应函数的无偏估计量.例如,当例如,当 时,时
7、, 是是的无偏估计量,但的无偏估计量,但 不是不是 的无偏估计量,事的无偏估计量,事实上:实上:( )E2( ,)XN X2X222222()()().E XD XE Xn 例例3 3 证明样本均值证明样本均值 为总体为总体 均值均值 的无偏估计的无偏估计. .样本方差样本方差 为总为总体方差体方差 的无偏估计的无偏估计. .而而 不是不是总体方差总体方差 的无偏估计的无偏估计. . 证明证明 1因为随机变量 与总体 同分布,故所以样本均值所以样本均值 为总体为总体 均值均值 的无偏估计的无偏估计.211niiXXnX2211()1niiSXXn211()niiBXXn2(1,2, )iX i
8、nX(),1,2,iE Xin()E X XX1111()()nniiiiEXE Xnn1nn2 2 2211()() 1niiE SEXXn211() 1niiEXXn2211(2)1niiiEXX XXn2211 ()2 ()()1niiiE XE X XE Xn22111()2()()1nniiiiE XE X XnE Xn221112()()()111nniiiinE XE X XE Xnnn222112()()()111niinE XE nXE Xnnn22111()2 ()()1nniiiiE XEX XnE Xn 222112 () () ()()111niiinnD XE XE
9、 XE Xnnn22 () () ()11nnD XE XE Xnn22 () () () () 11nnD XE XD XE Xnn22() () () () 11nnD XD XE XE Xnnn()()11nnD XD Xnnn2()D X所以样本方差所以样本方差 为总体方差为总体方差 的无偏估计的无偏估计. .2S23 3 211( )() niiE BEXXn2111() 1niinEXXnn221nn所以所以 不是总体方差不是总体方差 的无偏估计的无偏估计. .211()niiBXXn2 设设 和和 都是参数都是参数 的无偏估计量的无偏估计量,若若 ,则称则称 比比 更有效更有效.
10、 的所有估计量中的所有估计量中,方差最小的估计量方差最小的估计量 称为称为 的有效估计量的有效估计量.有效估计量有效估计量 偏离偏离 的真值的程的真值的程 度最小度最小.112( )()DD212 例例4 4 设设 是来自总体是来自总体 的样本的样本, ,且且 试验证估计量试验证估计量都是都是 的无偏估计量,并比较哪一个更有效的无偏估计量,并比较哪一个更有效. .2()D XX123,XXX(),E X1121()2XX2123111632XXX 证明证明 因为11212111( ) () ()()()222EEXXE XE X2123123111111()()()()()632632EEXX
11、XE XE XE X111632所以所以 和和 都是都是 的无偏估计量的无偏估计量. .1222211()42123111()()()3694D XD XD X2222111143694361121211( ) ()()()24DDXXD XD X 由于由于因此因此 所以所以 比比 更有效更有效.2123111()()632DDXXX12( )()DD21 无偏性、有效性都是在样本容量无偏性、有效性都是在样本容量n一定的条件一定的条件下进行讨论的,然而下进行讨论的,然而 不仅与样本值有关,不仅与样本值有关,而且与样本容量而且与样本容量n有关,很自然,我们希望有关,很自然,我们希望n越大时,越大
12、时,n对对 的估计应该越精确的估计应该越精确. n0 |1limnnPn12,nXXX 如果如果 依概率收敛于依概率收敛于 ,即即 ,有有 则称则称 是是 的一致估计量的一致估计量.选择题:选择题:以下说法以下说法不正确不正确的有的有_(A)只有总体服从正态分布,样本均值才是总体均)只有总体服从正态分布,样本均值才是总体均值的无偏估计量值的无偏估计量(B)无论总体服从什么分布,样本均值一定是总体)无论总体服从什么分布,样本均值一定是总体均值的无偏估计量均值的无偏估计量(C)当总体服从正态分布时,样本方差必为总体方)当总体服从正态分布时,样本方差必为总体方差的无偏估计量差的无偏估计量(D)无论总
13、体服从什么分布,样本方差一定是总体)无论总体服从什么分布,样本方差一定是总体方差的无偏估计量方差的无偏估计量A 定义定义1 设设 是自总体是自总体 的一个未知参数的一个未知参数 ,对于给定对于给定值值 ,若由来自若由来自 的样本的样本 确定的两确定的两个统计量个统计量 和和 使得使得 成立成立,则称则称 为置信水平为置信水平(或置信度或置信度),称随机区间称随机区间 是参数是参数 的置信水平为的置信水平为 的置信区间的置信区间, 和和 分别为分别为置信下限和置信上限置信下限和置信上限. 注注:1.区间区间 包含未知参数包含未知参数 的真值的概率为的真值的概率为 ; 2.置信区间的长度置信区间的
14、长度 反映了精确要求反映了精确要求,区间越短越区间越短越精确;精确; 3. 置信水平反应了区间估计的可靠性要求置信水平反应了区间估计的可靠性要求, 越小越越小越可靠可靠.XX12,.,nXXX(01)1112(,.,)nXXX2212(,.,)nXXX12()1P 112( ,) 11212( ,) 121 下面讨论正态总体下面讨论正态总体 的均值的均值 和方差和方差 的的置信区间的计算方法置信区间的计算方法.2( ,)XN 21.均值均值 的区间估计的区间估计 (1)方差)方差 已知已知 设设 是来自总体是来自总体 的的一个样本一个样本,其中其中 为已知为已知, 为未知为未知. 由于由于 ,
15、所以所以 故有统计量故有统计量 211( ,)niiXXNnn12,nXXX22( ,)XN 22( ,)XN (0,1)XUNn 对于给定的置信水平对于给定的置信水平 ,可选择可选择 使得使得 (1) 成立成立,即即 故故 由此得由此得 由标准正态分布表可得临界值由标准正态分布表可得临界值 .2(|)1P Uu 22()()1uu 12u22()1PuUu 2()12u 2u 再由(再由(1)式得)式得 即即 故故 的一个置信水平为的一个置信水平为 的置信区间:的置信区间:122()1XPuun 22()1P XuXunn 22(,)XuXunn 例例5 5 设总体设总体 , ,从总体从总体
16、 中抽取中抽取一个样本值如下一个样本值如下: : 12.6,13.4,12.8,13.2 12.6,13.4,12.8,13.2求总体均值求总体均值 的置信水平为的置信水平为0.950.95的置信区间的置信区间. .解解 由题意知,样本均值的观测值为由查表得4111(12.6 13.4 12.8 13.2) 13.044iixx( ,0.09)XNX4,0.3,10.95,0.05n20.05()110.97522u 21.96u从而总体均值 的置信水平为的置信水平为0.95的置信区间为:的置信区间为: 22(,)xuxunn0.30.3(13.019.6,13.019.6)(12.71,13
17、.29)44 若若 且方差且方差 已知时已知时,求求 的置的置信区间的步骤如下信区间的步骤如下: (1)从总体)从总体 中随机抽取容量为中随机抽取容量为 的样本的样本 ,其观测值为其观测值为 (2)计算样本均值的观测值)计算样本均值的观测值 (3)根据)根据 由由 查标准正态分查标准正态分布表布表,查得临界值查得临界值 (4)求出总体均值)求出总体均值 的置信水平为的置信水平为 的置信区间的置信区间 11niixxn12,nXXXn22( ,)XN X22(,)xuxunn12,nx xx2()12u 2u1 (2)方差)方差 未知未知 考虑考虑T统计量统计量 2 (1)XTt nSn 对于给
18、定的置信水平对于给定的置信水平 ,可选择可选择t分布的分布的双侧临界值双侧临界值 使得使得 (2) 成立成立,即即 查自由度为查自由度为 的的t分布表得双侧临界值分布表得双侧临界值 从而由(从而由(2)得)得2(|(1)1P Ttn 12(1)tn2(|(1)P Ttn1n2(1)tn22(1)(1)1XPtntnSn 即即 故故 的一个置信水平为的一个置信水平为 的置信区间:的置信区间:122(1)(1)1SSP XtnXtnnn 22(1),(1)SSXtnXtnnn 例例6 6 已知某地初生婴儿的体重服从正态分布已知某地初生婴儿的体重服从正态分布, ,随机抽取随机抽取1212名初生婴儿名
19、初生婴儿, ,测得其体重(单位:测得其体重(单位:g g)为为 : : 3100,2520,3000,3000,3600,3160 3100,2520,3000,3000,3600,3160, 3560,3320,2880,2600,3400,2540.3560,3320,2880,2600,3400,2540.试以试以0.950.95的置信水平估计该地初生婴儿的平均体重的置信水平估计该地初生婴儿的平均体重. .解解 由 ,得样本均值的观测值为10.951211305712iixx20.025,1 11,(11)2.2012nt 12211()375.312 1iisxx从而总体均值 的置信水
20、平为的置信水平为0.95的置信区间为:的置信区间为: 22(1),(1)ssxtnxtnnn375.3375.3(30572.201,30572.201)1212(2818.5,3295.5)( )g 若若 且方差且方差 未知时未知时,求求 的置的置信区间的步骤如下信区间的步骤如下: (1)从总体)从总体 中随机抽取容量为中随机抽取容量为 的样本的样本 ,其观测值为其观测值为 (2)计算样本均值和样本标准差的观测值)计算样本均值和样本标准差的观测值 (3)根据)根据 和样本容量和样本容量 查标查标t分布表分布表,查查得临界值得临界值 (4)求出总体均值)求出总体均值 的置信水平为的置信水平为
21、的置信区间的置信区间 11niixxn12,nXXXn22( ,)XN X22(1),(1)ssxtnxtnnn12,nx xx2(1)tn1211()1niisxxnn2.方差方差 的区间估计的区间估计 设设 是来自总体是来自总体 的的一个样本一个样本,其中其中 为未知为未知. 考虑考虑12,nXXX22( ,)XN 2222(1)(1)nSn 对于给定的置信水平对于给定的置信水平 ,选取区间选取区间 使得使得 于是于是 即即 亦即亦即2212(1)12Pn 122122(1),(1)nn222(1)2Pn(1)122 2222122(1)(1)PnPn222122(1)(1)Pnn2222
22、122(1)(1)(1)1nSPnn 22222122(1)(1)()1(1)(1)nSnSPnn 故方差故方差 的一个置信水平为的一个置信水平为 的置信区间:的置信区间: 标准差标准差 的一个置信水平为的一个置信水平为 的置信区间:的置信区间:1122222122(1)(1)(,)(1)(1)nSnSnn22122(1)(1)(,)(1)(1)nSnSnn 例例7 7 已知某地初生婴儿的体重服从正态分布已知某地初生婴儿的体重服从正态分布, ,随机抽取随机抽取1212名初生婴儿名初生婴儿, ,测得其体重(单位:测得其体重(单位:g g)为为 : : 3100,2520,3000,3000,36
23、00,3160 3100,2520,3000,3000,3600,3160, 3560,3320,2880,2600,3400,2540.3560,3320,2880,2600,3400,2540.试以试以0.950.95的置信水平估计该地初生婴儿体重的方差的置信水平估计该地初生婴儿体重的方差. .解解 由 ,得查 分布表得10.950.025,10.975,1 11,22n 220.025(11)21.92020.975(11)3.816 又由例6知 从而该地初生婴儿体重方差 以0.95为置信为置信 水平的置信区间为:水平的置信区间为: 2140850s 22222122(1)(1)(,)(
24、1)(1)nsnsnn(12 1) 140850 (12 1) 140850(,)21.9203.816(70682,406014) 若若 且且 未知时未知时,求求 的置信区的置信区间的步骤如下间的步骤如下: (1)从总体)从总体 中随机抽取容量为中随机抽取容量为 的样本的样本 ,其观测值为其观测值为 (2)计算样本均值和样本标准差的观测值)计算样本均值和样本标准差的观测值 (3)根据)根据 和样本容量和样本容量 查标查标 分布表分布表,查查得临界值得临界值 (4)求出总体均值)求出总体均值 的置信水平为的置信水平为 的的置信区间置信区间 11niixxn12,nXXXn22( ,)XN X1
25、2,nx xx22122(1),(1)nn1211()1niisxxnn222222122(1)(1)(,)(1)(1)nSnSnn 选择题:选择题: (1) 设总体 ,其中 已知.若置信水平不变,则总体均值 的置信区间的长度l与样本容量n的关系是_ (A)当n增大,l变大 (B)当n增大,l变小 (C)当n增大,l不变 (D)当n增大,l可能变大,可能变小,可能不变2( ,)XN 2B (2) 设总体 ,其中 未知.若置信水平和样本容量都不变,则对于不同的样本观测值, 的置信区间的长度_ (A)变长 (B)变短 (C)不变 (D)不能确定2( ,)XN 22D习题习题5-62. 设总体设总体
26、X服从参数为服从参数为的指数分布,即其密度函数的指数分布,即其密度函数为为 其中其中0, X1 ,X2 ,Xn是来自是来自X的一个样本,试的一个样本,试用数字特征法求用数字特征法求的估计量的估计量. ,0( ; )0,xexf x其他5. 某彩色电视机的使用寿命服从正态分布某彩色电视机的使用寿命服从正态分布N(,2),现现随机抽取随机抽取25台进行测试,测得平均使用寿命为台进行测试,测得平均使用寿命为6720h,样本标准差为,样本标准差为200h,给定置信水平为,给定置信水平为0.90,求:求: (1)使用寿命均值使用寿命均值的置信区间的置信区间; (2)使用寿命方差使用寿命方差2的置信区间的置信区间 .