1、概率统计概率统计李芳凤李芳凤email:数理统计学研究过程示意图 从群体中抽出部分样本从群体中抽出部分样本 待考察现象群体待考察现象群体对样本数据进行整理、描述对样本数据进行整理、描述 对群体现象特对群体现象特征进行推断征进行推断抽样抽样整理整理 统统计计推推断断参数估计在统计方法中的地位参数估计假设检验n统计方法描述统计推断统计 数理统计问题:如何由样本数据来对总体的种种统计特征作出判断。参数估计问题:知道随机变量(总体)的分布类型,但确切的形式不知道,根据样本来估计总体的参数,这类问题称为参数估计。参数估计的类型点估计、区间估计 第第4章章 参数估计参数估计第一节第一节 点估计点估计 点估
2、计的含义 点估计点估计(point estimate),就是用来自于样本中的一个具体的统计量的值,作为总体参数的一个估计值。5参数参数 的点估计的点估计 设总体的分布函数为F(x,)(未知),X1,X2,Xn为样本,构造一个统计量 来估计参数,则称 为参数的点估计量。12(,)nXXX12(,)nXXX将样本观测值 代入 ,得到的值 称为参数的点估计值。12,nx xx12(,)nx xx12(,)nX XX例 某炸药制造厂,一天中发生着火现象的次数X是一个随机变量,假设它服从参数为的泊松分布,参数未知。设有以下的样本值,试估计参数.(),XP解:由着火次数着火次数0123456发生X次着火的
3、天数n125 901511621总天数:250则11=X=,niiXn又11=1=(0 125 1 90 2 15 3 11 4 6 5 2 6 1)0.772250niiXn 则点估计量的评价准则点估计量的评价准则 对于总体的同一未知参数,用不同的估计方对于总体的同一未知参数,用不同的估计方法求出的估计量可能不同,原则上任何统计量都法求出的估计量可能不同,原则上任何统计量都可以作为未知参数的估计量,采用哪一个估计量可以作为未知参数的估计量,采用哪一个估计量更好?更好?下面介绍几种常用下面介绍几种常用 的评价标准:无偏性、有的评价标准:无偏性、有效性和一致性。效性和一致性。点估计量的评价准则点
4、估计量的评价准则 无偏估计量无偏估计量:设设 是是 的估计量,如果的估计量,如果则称则称 是是 的一个的一个无偏估计量。无偏估计量。(),E估计量的无偏性是说对于某些样本值,由这一估计估计量的无偏性是说对于某些样本值,由这一估计量得到的估计值应围绕参数的真值上下波动。反复量得到的估计值应围绕参数的真值上下波动。反复将这一估计量使用多次,就将这一估计量使用多次,就“平均平均”来说其偏差为来说其偏差为零。零。)31()(311iiXEE X1例例 设(X1,X2,X3)是来自总体X的一个样本,证明下面估计量是总体均值E(X)的无偏估计量证明证明)(3131iiXE)(3131iiXE)(3131X
5、Ei因为E(Xi)=E(X)1(1nikiXnE证明证明所以,证明样本的k阶矩是E(Xk)的无偏估计.因为)(kXE)(11nikiXEn)(11nikXEn)(11nikXEn221111()()()nniiiiEXXEXXnn 证明证明2211()()niiE XE Xn11()()niiD XD Xn11()()niiD XDXn211()()niiE XE Xn 1()nD Xn221111()(1)1nniiiiEXXEnnnXXnniiXDXXnS122.)()(11的无偏估计是证明证明所以,所以,221111()(1)1nniiiinXXXXnnn2111()niiEXXnnn1
6、1()nnXnDn()D X点估计点估计一个基本结果一个基本结果 设总体设总体X的数学期望为的数学期望为 ,方差为,方差为 ,为取自总体为取自总体X的样本,则的样本,则1)为为 的无偏估计量的无偏估计量2)为为 的无偏估计量的无偏估计量X2S212,nXXX2有有 效效 性性 设设 、都是都是 的无偏估计量,若的无偏估计量,若则称则称 比比 有效。有效。12例例1212()()DD12111,(1,2,)1)(1,2,),nnniiiiiiniiiiXXXXXXina XaXXina X设为来自总体 的样本,则、(都为 的无偏估计,但 比有效.,321都有效较且)()()(321EEE显然有1
7、332121;613121;XXXXX练习练习 设(X1,X2,X3)是来自总体X的一个样本,证明下面的三个估计量都是总体均值E(X)的无偏估计量证明证明3/)()()(1XDXDD且21237()(/2/3/6)()18DD XXXD X)()()(13XDXDD.,),()()(321321有效较所以故有DDD一致性一致性 一致性:即样本容量趋于无穷大时,估计量依概率收敛于待估参数。0,lim1,nP即对任意有则称 为 的一致估计量。知识点回顾知识点回顾)1()1(222nsnP71 定理定理 设设X1,X2,Xn是取自正态总体是取自正态总体),(2 N的样本的样本,2Xs和分别为样本均值
8、和样本方差分别为样本均值和样本方差,则有则有(1)Xtt nsn知识点回顾知识点回顾知识点回顾知识点回顾点估计的一个基本结果点估计的一个基本结果 设总体设总体X的数学期望为的数学期望为 ,方差为,方差为 ,为取自总体为取自总体X的样本,则的样本,则1)为为 的无偏估计量的无偏估计量2)为为 的无偏估计量的无偏估计量X2s212,nXXX2点估计量的评价准则点估计量的评价准则 无偏估计量无偏估计量:设设 是是 的估计量,如果的估计量,如果则称则称 是是 的一个的一个无偏估计量。无偏估计量。(),E有效性有效性:设:设 、都是都是 的无偏估计量,若的无偏估计量,若则称则称 比比 有效。有效。121
9、212()()DD一致性:一致性:即样本容量趋于无穷大时,估计量依即样本容量趋于无穷大时,估计量依概率收敛于待估参数。概率收敛于待估参数。知识点回顾知识点回顾212(,),nXNXXX 设总体为样本 则(1)X(2)/Xn(3)/XSn小样本,方差未知时随堂测试2(,)Nn(0,1)N(1)t n参数的区间估计参数的区间估计引例引例 已知已知X N(,1),x1,x2,xn 是一组样本值是一组样本值不同的样本值算得的不同的样本值算得的 的估计值不同,因此的估计值不同,因此除了给出未知参数的点估计外,还希望根据所除了给出未知参数的点估计外,还希望根据所给的样本确定一个随机区间,使其包含参数真给的
10、样本确定一个随机区间,使其包含参数真值的概率达到指定的要求值的概率达到指定的要求 的无偏点估计为的无偏点估计为随机变量随机变量常数常数X们求出一个尽可能小的区间 ,使根据一个实际样本,由给定的置信水平,我置信区间.121P 称区间 为,21 1的置信水平为 的,21 2 称为置信上限.1 称为置信下限,由样本统计量所构造的总体参数的估计区间称为置信区间置信区间(confidence interval)置信水平(confidence level)置信水平表示为(1-(显著性水平是总体参数未在未在区间内的比例 常用的置信水平值有 99%,95%,90%相应的相应的 为0.01,0.05,0.101
11、1221212:(,.,),(,.,)1,.nnXXXXXX 参数 的区间估计的意义可以解释为 随机区间包含参数的真值的概率为因此若认为 区间包含着参数 的真值则犯错误的概率为1122,1,1.由于 不是随机变量 所以不能说参数 以的概率落入随机区间而只能区间以的概率包含说反复100次抽取容量为n的样本,则可得到100个区间,这些区间可能包含未知参数的真值,也可能不包含未知参数的真值,包含真值的区间大约有个95个置信水平的意义(置信水平的意义()195%(95%的置信区间)区间估计区间估计2212(,),.,(1)nXNXXXX 设总体已知,未知,是来自 的样本,求 的置信水平为的例置信区间。
12、0/2u/2/2u/2解:由总体服从正态分布可得)1,0(/NnXU/21,u对于给定的置信度查分位点使得/2|1P Uu/21/XPun 得到 从而/2/21P XuXunn 置信区间为的这样得到了置信度为1/2/2(,)XuXunn0/2u/2/2u/2例例 设轴承内环的锻压零件的平均高度设轴承内环的锻压零件的平均高度X服从正态分布服从正态分布N(,0.42).现在从中抽取现在从中抽取20只内环只内环,其平均高度为其平均高度为32.3毫毫米米.求内环平均高度的置信度为求内环平均高度的置信度为95%的置信区间的置信区间./20.02510.95,(0.975)1.96uu 查表得解解算得又,
13、20,4.0,3.32nx/20.432.3 1.9632.1220 xun/20.432.3 1.9632.4820 xun)48.32,12.32(%95 的置信区间为的一个置信度为所以区间估计的基本步骤 确定待估参数和置信水平 确定估计量,找出估计量的抽样分布 利用估计量的抽样分布给出置信区间样本均值的分布正态分布正态分布非正态分布非正态分布样本均值样本均值服从正态服从正态分布分布样本均值样本均值非正态分布非正态分布样本均值样本均值服从正态服从正态分布分布样本均值样本均值t t分布分布总体均值的区间估计1.假定条件q总体服从正态分布,且方差()已知2.使用正态分布统计量 z样本均值样本均
14、值分位数值分位数值样本均值的标准差样本均值的标准差2(,)XNn25袋食品的重量袋食品的重量 112.5101.0103.0102.0 100.5102.6107.5 95.0108.8 115.6100.0123.5102.0101.6 102.2116.6 95.4 97.8108.6 105.0136.8102.8101.5 98.4 93.3解解 06.06n经计算可得 95.14x,96.1025.02/uz查表得 从而 75.1496.1606.095.142/znx15.1596.1606.095.142/znx故所求置信区间为(14.75,15.15试求该批零件长度的置信度为0
15、.95置信区间.总体均值的区间估计n1.假定条件q总体服从正态分布,但方差()未知2.使用 t 分布统计量分析:方差未知时均值的区间估计.1,),(),.,(2221的置信区间的置信度为要求为未知常数的样本是取自正态总体设NXXXn221/2(1)/1(),1,1(1),niiXTt nSnSXXtntn由于这时其中对给定的置信由 分布表查出使得/2|(1)1/XPtnSn 0/2/2t/2(n1)t/2(n1)1)1()1(2/2/nSntXnSntXP经过变形得/2/21(1),(1)SSXtnXtnnn这样得到了 的置信度为的置信区间为例例 有一大批糖果,现从中随机地取16袋,称得重量(
16、单位:g)如下设袋装糖果的质量近似服从正态分布,试求总体均值 置信度为0.95的置信区间。16袋糖果的重量 506508499503504510497512514505493496506502509496总体均值的区间估计(大样本)总体均值的区间估计(大样本)n1.假定条件q在大样本情况下,如果总体不是正态分布,可用正态分布来近似(n 50)2.使用正态分布统计量 z2(,)XNn例例 某市参加英语四级考试的考生中,随机抽取64人,笔试平均得分为71.3,标准差为10.3。求该市考生笔试得分总体均值的置信度为0.95的置信区间。解解 依题意有71.3,x,96.1025.02/uz查表得 从而
17、/210.371.3 1.9668.7864xzn故所求置信区间为(68.78,73.8210.364,0.05sn,/210.371.3 1.9673.8264xzn不同情况下总体均值的区间估计总体分布样本量 已知 未知正态分布大样本小样本非正态分布 大样本【练习练习】16灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470niixxnS12)(11niiixxxxn122)2(11)2(1112112niniiniixxxxn)2(112212xnxnxnnii)(11212x
18、nxnnii正态总体方差的分布(未知))1()1(222nsnP71定理定理3.2.7分析分析2222(1)(1)nSn 由于这时222/21/21,(1)(1),nn对于给定的置信度查分布表得两个分位点和使得2221/2/2(1)(1)1Pnn 1)1()1()1()1(22/12222/2nSnnSnP经过变形得/2)1(22/n )1(22/1 n /22222/21/22(1)(1)(,)(1)(11)nSnSnn这样得到了的置信度为的置信区间为总体方差的区间估计1.估计一个总体的方差或标准差2.假设总体服从正态分布3.总体方差 2 的点估计量为s2,且总体方差的区间估计总体方差的区间估计25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3293.21s 4011.12)24()1(2975.0221n3641.39)24()1(2025.022n22120.95(1)(14)6.5706n2220.05(1)(14)23.6848n解:作业P918