数理统计与随机过程7参数估计课件.ppt

上传人(卖家):晟晟文业 文档编号:4288020 上传时间:2022-11-26 格式:PPT 页数:39 大小:563.53KB
下载 相关 举报
数理统计与随机过程7参数估计课件.ppt_第1页
第1页 / 共39页
数理统计与随机过程7参数估计课件.ppt_第2页
第2页 / 共39页
数理统计与随机过程7参数估计课件.ppt_第3页
第3页 / 共39页
数理统计与随机过程7参数估计课件.ppt_第4页
第4页 / 共39页
数理统计与随机过程7参数估计课件.ppt_第5页
第5页 / 共39页
点击查看更多>>
资源描述

1、1兰州大学信息科学与工程学院主讲主讲:路永刚路永刚E-mail:ylulzu.edu非正态总体非正态总体的区间估计的区间估计 7.6 非正态总体非正态总体的区间估计的区间估计 前面两节讨论了正态总体分布参数的区间估计。前面两节讨论了正态总体分布参数的区间估计。但是在实际应用中,我们有时不能判断手中的数据但是在实际应用中,我们有时不能判断手中的数据是否服从正态分布,或者有足够理由认为它们不服是否服从正态分布,或者有足够理由认为它们不服从正态分布从正态分布。但是,只要样本大小。但是,只要样本大小 n 比较大,总体比较大,总体均值均值 的置信区间仍可用正态总体情形的公式的置信区间仍可用正态总体情形的

2、公式 或或,znXznX22 ,.,2/2/znSXznSX2已知时已知时2未知时未知时所不同的是:所不同的是:这时的这时的置信区间是近似的置信区间是近似的。这是求一般总体均值的一种简单有效的这是求一般总体均值的一种简单有效的方法,其理论依据是方法,其理论依据是中心极限定理中心极限定理,它要求,它要求样本大小样本大小 n 比较大比较大。因此,这个方法称为。因此,这个方法称为大大样本方法样本方法。设总体均值为设总体均值为,方差为方差为2,X1,X2,Xn 为来自总体的样本。因为这些样本为来自总体的样本。因为这些样本独立同独立同分布的分布的,根据,根据中心极限定理中心极限定理,对充分大的,对充分大

3、的 n,下式近似成立下式近似成立(1),)1 ,0(/1NnnXnXnii因而,因而,近似地近似地有有 于是,于是,的置信系数约为的置信系数约为1-的置信的置信区间为区间为.1/2/znXP.22znXznX,当2未知时未知时,用用2的的估计估计S2 来代替来代替2,得得(2).22znSXznSX,只要只要 n 很大,很大,(2)式所提供的置信区间在应用式所提供的置信区间在应用上是令人满意的。上是令人满意的。那么,那么,n 究竟多大才算很大呢?究竟多大才算很大呢?显然,对于相同的显然,对于相同的 n,(2)式所给出的置式所给出的置信区间的近似程度随总体分布与正态分布的信区间的近似程度随总体分

4、布与正态分布的接近程度而变化接近程度而变化,因此,因此,理论上很难给出理论上很难给出 n 很大的一个界限很大的一个界限。但许多应用实践表明:但许多应用实践表明:当当 n30时,时,近似程度近似程度是是可以接受可以接受的;的;当当 n50时,时,近似程度近似程度是是很好很好的。的。例例1:某公司欲估计自己生产的电池寿命某公司欲估计自己生产的电池寿命。现从其产。现从其产品中随机抽取品中随机抽取 50 只电池做寿命试验。这些电池寿命只电池做寿命试验。这些电池寿命的平均值为的平均值为 2.261 (单位:单位:100小时小时),标准差,标准差 S=1.935。求该公司生产的电池平均寿命的置信系数为求该

5、公司生产的电池平均寿命的置信系数为 95%的的置信区间。置信区间。解:解:查正态分布表,得查正态分布表,得 z/2=z0.025=1.96,由公式,由公式(2),得电池平均寿命的置信系数为得电池平均寿命的置信系数为 95%的置信区间为的置信区间为2.802.1.730 96.150935.1261.2 96.150935.1261.2 ,设事件设事件 A 在一次试验中发生的概率为在一次试验中发生的概率为 p,现在做现在做 n 次试验,以次试验,以Yn记事件记事件 A 发生的次数发生的次数,则则 Yn B(n,p)。依。依中心极限定理中心极限定理,对充分大,对充分大的的 n,近似地有,近似地有

6、7.6.1 二项分布二项分布 (3).1 ,0()1(/)1(NpnpnpYnpppXn(3)式是式是(1)式的特殊情形。式的特殊情形。/(3)npXYn记,式变为(4).)/(1)/(122nppzpnppzp,(4)式就是式就是二项分布二项分布参数参数 p 的置信系数约为的置信系数约为1-的置信区间的置信区间。例例2:商品检验部门随机抽查了某公司生产的产品商品检验部门随机抽查了某公司生产的产品100件,发现其中合格产品为件,发现其中合格产品为84件,试求该产品合格件,试求该产品合格率的置信系数为率的置信系数为0.95的置信区间。的置信区间。解:解:n=100,Yn=84,=0.05,z/2

7、=1.96,将这些将这些结果代入到结果代入到(4)式,得式,得 p 的置信系数为的置信系数为0.95的近的近似置信区间为似置信区间为 0.77,0.91。例例3:在环境保护问题中在环境保护问题中,饮水质量研究占有重要地饮水质量研究占有重要地位,位,其中一项工作是检查饮用水中是否存在某种类其中一项工作是检查饮用水中是否存在某种类型的微生物。型的微生物。假设在随机抽取的假设在随机抽取的100份份一定容积的水样品中有一定容积的水样品中有20份份含有这种类型的微生物。试求同样容积的这种水含含有这种类型的微生物。试求同样容积的这种水含有这种微生物的概率有这种微生物的概率 p 的置信系数为的置信系数为0.

8、90的的置信区间置信区间。解:解:n=100,Yn=20,=0.10,z/2=1.645,将这些结果将这些结果代入到代入到(4)式,得式,得 p 的置信系数为的置信系数为0.90的近似置信区的近似置信区间为间为 0.134,0.226。7.6.2 泊松分布泊松分布 =D X1 XX参估计,利用,得到的置信系数约为 的并用数置信区间:设设 X1,X2,Xn 为抽自具有泊松分布为抽自具有泊松分布P()的总的总体的样本,因为体的样本,因为 E(X)=D(X)=,由:(5)./22nXzXnXzX,.22znXznX,例例4:公共汽车站在一单位时间内公共汽车站在一单位时间内(如半小时如半小时,或或1小

9、时小时,或一天等或一天等)到达的乘客数服从泊松分布到达的乘客数服从泊松分布 P(),对不同对不同的车站的车站,不同的仅是参数不同的仅是参数 的取值不同。的取值不同。现对某城市某公共汽车站进行现对某城市某公共汽车站进行100个单位时间的调查。个单位时间的调查。这里单位时间是这里单位时间是20分钟。计算得到每分钟。计算得到每 20 分钟内来到分钟内来到该车站的乘客数平均值为该车站的乘客数平均值为 15.2 人。试求参数人。试求参数 的置信的置信系数为系数为95%的置信区间。的置信区间。解解:n=100,=0.05,z/2=1.96,将这些结果将这些结果代入到代入到(5)式式,得得 的置信系数为的置

10、信系数为0.95的近似置信区的近似置信区间为间为 14.44,15.96。,2.15X讨论讨论要对非正态分布的参数进行区间估计,主要需要哪些条件?14当密度函数的形式未知时,只能用当密度函数的形式未知时,只能用非参数方法。它能处理它能处理任意的概率分布。在在参数估计中中,密度函数的密度函数的参数形式是单模的 (单单个局部极大值个局部极大值),然而在现实中,所遇到的却常常,然而在现实中,所遇到的却常常是是多模的情况。的情况。基于基于直方图直方图的的概率密度估计概率密度估计就是一种典型的非参数估计就是一种典型的非参数估计概率密度函数的估计概率密度函数的估计基本思想基本思想:设有样本设有样本x x的

11、概率密度函数为的概率密度函数为 p(x),则,则x x 落在区域落在区域 R 中中的概率为的概率为:(1)dx)x(pP(2)1(knkkPPknP设 n 个抽取样本为独立同分布样本,其概率密度函数为 p(x),则其中 k 个样本落在区域 R 的概率为:二项式分布(Binomial Distribution)k 的期望值为的期望值为:E(k)=nP )1(knkkPPknPnPkE)()(1)D knPPPictire From:en.wikipedia.org/即比值 k k/n n 就是概率概率 P P 的一个很好的估计.若概率密度p(x)是连续的,并且区域R足够小,以致于在这个区间中p

12、几乎没有变化,那么近似地有:()()(4)Pp x dxp x V,)|P(Maxk )3(nkP所包含的体积Vn/k)x(p 由二项式分布的性质得:当由二项式分布的性质得:当 k nP 时时Pk 最大最大,所以这种情况这种情况毫无意义!毫无意义!区域区域 R 中含有样本中含有样本:fixed)n (if 0)x(plim0k ,0V )x(plim0k ,0VR 中不含有任何样本中不含有任何样本所以要求:所以要求:n为有限值,为有限值,V 不能趋于零不能趋于零Vn/k)x(p 0n/klim)3klim)20Vlim)1nnnnnn )()(xpxpnn有有两种两种经常采用的满足以上三种条件

13、的途径经常采用的满足以上三种条件的途径:(1)体积体积Vn是是N的确定函数,比如的确定函数,比如 VN=,来来逐渐收缩逐渐收缩一个给定的一个给定的初始区间初始区间“Parzen 窗法窗法”N/124(2)k kn n 是是 N N 的一个确定函数的一个确定函数,比如比如 k kN N=,这样体积这样体积 V VN N 就必须逐渐生长,就必须逐渐生长,直到最后能包含进直到最后能包含进 x x 的的 k kN N 个相邻点个相邻点.“K-近邻估计”NParzen 窗法窗法K-近邻估计近邻估计Parzen Parzen 窗法窗法根据某一个确定的体积函数,比如 ,来逐渐收缩逐渐收缩一个给定的初始区间初

14、始区间。Vnkxp/)(NVVN/1Parzen Parzen 窗法窗法Parzen Parzen 窗方法估计概率密度函数,我们假设区间窗方法估计概率密度函数,我们假设区间Vn 是一个是一个 d d 维的超立方体维的超立方体其中其中h hn n为为Vn的边长的边长令窗函数为:令窗函数为:dnnVhj11 u j1,.,d(u)20 otherwiseniininhxxk1niniinnhxxVnxp1 11)(超立方体中的样本个数:将将 k kn n 代入代入 p pn n(x x)=(k kn n/n/n)/V/Vn n ,得:得:p p(x x)的估计的估计p pn n(x x)是一系列关

15、于是一系列关于 x x 和和 x xi i (i=1,ni=1,n)的函数的平均的函数的平均.推广:推广:窗函数窗函数 可以是可以是满足概率容许条件的容许条件的任意函数任意函数窗函数的选择窗函数的选择考虑考虑一维 N N(0,0,=1=1)正态概率密度函数令令(h h1 1:随意选取的一个参数随意选取的一个参数)则则:表示表示P Pn n(x x)就是就是以各个以各个样本点xi为中心的的正态概率密度函数的的平均。举例说明211()exp(),(1)22nuunhhn nini1innhxx h1n1)x(p 如果如果 n=n=10 10、h=h=0.1,0.1,那么每个样本点各自的贡献那么每个

16、样本点各自的贡献能够清楚的观察到能够清楚的观察到 。)1,()()(1)(211121xNexxxpxx21 nini1innhxx h1n1)x(p h1=1h1=0.5h1=0.1在二维情况下有类似的结果:K-K-近邻估计近邻估计K Nearest Neighbor Density Estimation 在 Parzen窗法中:体积由 先确定 体积内的点数不确定 在K-近邻估计中:体积内的点数 kN 先确定 体积再由包含 kN 个最近邻点来确定VN 基本公式仍然为:1/NVVNNNNVkxp)(K-K-近邻估计近邻估计如果设如果设 ,随着,随着N增大,增大,KN增增大,所以体积也就增大。大,所以体积也就增大。如果如果x x点附近密度低,体积增大速度就快;点附近密度低,体积增大速度就快;如果如果x x点附近密度高,体积增大速度就慢。点附近密度高,体积增大速度就慢。可以克服可以克服Pazzen窗对于初值窗对于初值V1的依耐性的依耐性NKN 基本公式:NNNVkxp)(K-K-近邻估计近邻估计0n/klim)3klim)20Vlim)1nnnnnn 假设条件:假设条件:一个较好的确定一个较好的确定kN的方法:的方法:NkkN1K-K-近邻估计举例近邻估计举例讨论讨论用用直方图估计概率密度函数,和用概率密度函数,和用 Parzen 窗估计概率密度函数有什么概率密度函数有什么联系和区别

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(数理统计与随机过程7参数估计课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|