统计学ppt课件-PPT课件.ppt

上传人(卖家):三亚风情 文档编号:3525767 上传时间:2022-09-11 格式:PPT 页数:80 大小:1.05MB
下载 相关 举报
统计学ppt课件-PPT课件.ppt_第1页
第1页 / 共80页
统计学ppt课件-PPT课件.ppt_第2页
第2页 / 共80页
统计学ppt课件-PPT课件.ppt_第3页
第3页 / 共80页
统计学ppt课件-PPT课件.ppt_第4页
第4页 / 共80页
统计学ppt课件-PPT课件.ppt_第5页
第5页 / 共80页
点击查看更多>>
资源描述

1、第七章第七章 参数估计参数估计 本章估计都是在本章估计都是在的条的条 件下来讨论的。件下来讨论的。7.1.1:用来估计总体参数的统计量的名称。如样本均值,样本比例、样本方差等n例如:样本均值就是总体均值 的一个估计量2)参数用 表示,估计量用 表示:估计参数时计算出来的统计量计算出来的统计量的具体值n如果样本均值 x=80,则80就是的估计值:1).通过样本获取一些基本的统计量,然后利用这些基本统计量与总体参数之间的联系,(获得统计量的分布)利用有关统计方法,估计总体参数。2).由此可以看出,统计量与总体参数、估计量的不同:总体参数通常是未知的定数,是待估计定数,是待估计量量;统计量是根据样本

2、计算的函数,通常是随机变量(对于总体而言);估计量用来对总体参数进行估计的统计量。参数估计的方法参数估计的方法7.1.2.n点估计与区间估计是统计估计的两种具体的方法。二者的基本出发点是不同的。n点估计主要是想利用统计量来估计总体参数的一个定值定值。n区间估计则是利用统计量的相应分布,估计包含总体参数的随机区间随机区间。n共同的是二者都是对总体参数的一种估计。1.用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计2.没有给出估计值接近总体参数程度的信息3.点估计的方法有矩估计法、最大似然法、最小二乘法等7.1.2评价估

3、计量的标准评价估计量的标准(一般含义)1、无偏性无偏性:,称是 的无偏估计量 。2、有效性有效性。一个具有较小变异的统计量的意义在于将有更多的机会产生一个更接近于总体参数的量。3、一致性一致性。随着样本容量的增大,点估计量的值越来越接近被估计总体参数。)(E无偏性无偏性(unbiasedness)n无偏性:无偏性:估计量抽样分布的数学期望等于被 估计的总体参数 有效性有效性(efficiency)12一致性一致性(consistency)n一致性:一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;为的无偏、有效、一致估计量

4、为的无偏、有效、一致估计量 为的无偏、有效、一致估计量为的无偏、有效、一致估计量。x21ns2p7.1.3区间估计区间估计(interval estimate)在点估计的基础上,给出总体参数估计的一个区间区间范围范围,该区间由样本统计量加减估计误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量n比如,某班级平均分数在7585之间,置信水平是95%置信水平=1-当总体服从正态分布当总体服从正态分布N(,2)时,(时,(2已知已知)来自来自该总体的所有容量为该总体的所有容量为n的样本的均值的样本的均值 x也服从正态也服从正态分布,分布,x 的数学期望为的数学期

5、望为,方差为,方差为2/n即即 xN(,2/n)1)(2znxp/2 1)(2nxpz1ULP区间估计的数学表达方式:区间估计的数学表达方式:122ZxZPx区间估计基本表达区间估计基本表达(以估计(以估计 为例):为例):STATSTAT区间估计的图示区间估计的图示xxzx2将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 表示为(1-n 为是总体参数未在区间内的比例 常用的置信水平值置信水平值有 99%,95%,90%n相应的相应的 为:0.01,0.05,0.10n 的值:2.58,1.96,1.645(记住记住)z2 xxx影响区间宽度的因素影响区间

6、宽度的因素 p2071.总体数据的离散程度,总体数据的离散程度,用用 来测度来测度2.样本容量,样本容量,3.置信水平置信水平(1-),影响,影响 z 的大小的大小nx1.置信水平为置信水平为95%的置信区间,意思是在构造的置信区间,意思是在构造的所有置信区间当中,包含总体参数真值的区间的所有置信区间当中,包含总体参数真值的区间占占95%。2.总体参数的真值是固定的、未知的,而用样总体参数的真值是固定的、未知的,而用样本构造的置信区间是不固定的。一个样本构造一本构造的置信区间是不固定的。一个样本构造一个区间,不同样本构造不同的区间,因此置信区个区间,不同样本构造不同的区间,因此置信区间是随机区

7、间。置信水平是针对随机区间而言,间是随机区间。置信水平是针对随机区间而言,不是所有区间都包含总体参数的真值。不是所有区间都包含总体参数的真值。3.在实际问题中,进行估计时,往往只抽取一在实际问题中,进行估计时,往往只抽取一个样本。由该样本所构造的区间是一个特定的区个样本。由该样本所构造的区间是一个特定的区间,而不再是随机区间,因此该区间是否包含总间,而不再是随机区间,因此该区间是否包含总体参数的真值,我们是不知道的。体参数的真值,我们是不知道的。7.2 一个总体参数的区间估计一个总体参数的区间估计p211n7.2.1.总体均值的区间估计总体均值的区间估计n7.2.2.总体比例的区间估计总体比例

8、的区间估计n7.2.3.总体方差的区间估计总体方差的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值均值比例比例方差方差2xp2s7.2.1总体均值的区间估计总体均值的区间估计(大样本大样本)1.假定条件假定条件n总体服从正态分布总体服从正态分布,且方差且方差()已知或者未知已知或者未知n如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似(n 30)2.使用正态分布统计量使用正态分布统计量 z(标准化标准化)1,0(Nnxz)(22未知或nszxnzx边际误差总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例】一家食品生产企业以生产袋装食品为主

9、,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分分布服从正态分布,布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3已知已知N(,102),n=25,1-=95%,z/

10、2=1.96。根。根据样本数据计算得:据样本数据计算得:总体均值总体均值 在在1-置信水平下的置信区间为置信水平下的置信区间为28.109,44.10192.336.105251096.136.1052nzx该食品平均重量的置信区间为101.44g109.28g36.105x36个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532已知已知n=36,1-=90%,z/2=1.645。根据样本数据。根据样本数据计算得:计算得:,总体均值总体均值 在在1-置信水平下的置信

11、区间为置信水平下的置信区间为63.41,37.3713.25.393677.7645.15.392nszx投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.37岁岁41.63岁岁5.39x77.7s计算样计算样本统计本统计量量确定样确定样本统计本统计量分布量分布确定临确定临界值保界值保证概率证概率确定置确定置信区间信区间xxxZxZxxxZxZx,区间估计步骤区间估计步骤(以估计(以估计 为例):为例):STATSTAT其中:xnSTATSTAT例:由例:由532名名商业周刊商业周刊订阅者订阅者组成的样本表明,其每周使用因特网的组成的样本表明,其每周使用因特网的平均时间为平均时间为6.

12、7小时。如果总体标准差为小时。如果总体标准差为5.8小时,求该周刊订阅者总体每周平均小时,求该周刊订阅者总体每周平均花费在因特网上时间的花费在因特网上时间的95置信区间。置信区间。均值的区间估计均值的区间估计nx96.12Z则:该置信区间为:则:该置信区间为:5328.596.17.62nZx19.7,21.6正态总体或非正态总体但大正态总体或非正态总体但大样本,总体方差未知样本,总体方差未知均值的区间估计均值的区间估计11212nSZxnSZxPnnnSZxnSZxnn1212,STATSTAT使用使用 t 分布统计量分布统计量)1(ntnsxtnstx2 正态总体小样本,总体方差未知正态总

13、体小样本,总体方差未知 p214均值的区间估计均值的区间估计11212nStxnStxPnnnStxnStxnn1212,t 统计量统计量16灯泡使用寿命的数据灯泡使用寿命的数据 15101520148015001450148015101520148014901530151014601460147014702.1503,8.14762.1314901677.24131.214902nstx1490 x77.24s均值推断方法的选择均值推断方法的选择 p217n是否为大样本是否为大样本 是否已知是否已知是否正态总体是否正态总体 是否已知是否已知用用S 估估计计 用用S 估估计计 增大样本增大样本

14、容量到容量到30以上以上是是是是是是是是否否否否否否否否nZx2nZx2nSZx2nStx2查教材查教材P155)1,0()1(Nnpppz)()-1()1(22未知时或nppzpnzp【例】【例】某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间%35.74%,65.55%35.9%65100%)651%(6596.1%65)1(2nppzp11222nsn111122122222nsnnsn25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5

15、95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3401.12)24()1(2975.0212n364.39)24()1(2025.022n39.18083.56401.1221.93125364.3921.93125227.2.4正态总体未来观察值的预测区间估计正态总体未来观察值的预测区间估计p220预测随机变量未来的观察值,并希望求出各某个未来观察预测随机变量未来的观察值,并希望求出各某个未来观察值的取值范围,这个范围就是对某个未来观察值的预测区值的取值范围,这个

16、范围就是对某个未来观察值的预测区间估计间估计n以7.3为例,估计一个新灯泡使用寿命的区间预测误差的期望为,预测误差的方差为未来观察值经标准化后服从标准正态分布,当用样本方差未来观察值经标准化后服从标准正态分布,当用样本方差s2代替总体方差代替总体方差 2后,则服从后,则服从t分布分布新观察值新观察值95%的预测区间为的预测区间为0)(1xxEnn11nxxD2221nnstx112未来观察值的预测区间估计未来观察值的预测区间估计p222【例】【例】利用例利用例7.3的数据,假定你要购买一只新的灯的数据,假定你要购买一只新的灯,以,以95%的置信水平建立该只灯泡的预测区间的置信水平建立该只灯泡的

17、预测区间149054.4=(1435.6,1544.4),该只新灯泡使用,该只新灯泡使用寿命寿命95%的预测区间为的预测区间为1435.6h1544.4h时之间时之间。与总体均值的置信区间。与总体均值的置信区间(1476.8,1503.2)相比,相比,新灯泡的预测区间要长得多新灯泡的预测区间要长得多161177.24131.21490解:根据已知结果得解:根据已知结果得区间估计练习区间估计练习一、假定容量一、假定容量n=100的一个随机样本的一个随机样本 产生均值为产生均值为81和标准差和标准差s=12。要求:。要求:构造总体均值构造总体均值95.45%置信水平下的置信区间;置信水平下的置信区

18、间;构造总体均值构造总体均值99.73%置信水平下的置信区间。置信水平下的置信区间。二、一个容量为二、一个容量为400的随机样本取自均值和标准差的随机样本取自均值和标准差均未知的总体。已经计算出下列值:均未知的总体。已经计算出下列值:=14592要求:要求:构造总体均值构造总体均值95%置信水平下的置信区间;置信水平下的置信区间;构造总体均值构造总体均值99%置信水平下的置信区间。置信水平下的置信区间。8121.2;8131.2;(5.71.962/20)xx2280 xixi2两个总体参数的区间估计两个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量2121222121

19、xx 21pp 2221ss)1,0()()(2221212121Nnnxxz 222121221)(nnzxx222121221)(nsnszxx 两个样本的有关数据两个样本的有关数据 中学中学1中学中学2n1=46n1=33S1=5.8 S2=7.2861x782x)97.10,03.5(97.28332.7468.596.1)7886()(22222121221nsnszxx2)1()1(212222112nnsnsnsp21221211nnsnsnsppp)2(11)()(21212121 nntnnsxxtp 21221221112nnsnntxxp两个方法组装产品所需的时间两个方法

20、组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.55.321x996.1521s8.282x358.1922s677.1721212358.19)112(996.15)112(2ps56.37.3121121677.170739.2)8.285.32()()()(2221212121vtnsnsxxtn两个总体均值之差1-2在1-置信水平下的置信区间为222121221)(nsnsvtxx1222221121212

21、222121nnsnnsnsnsv两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.25.321x996.1521s875.272x014.2322s13188.13188014.2311212996.158014.2312996.15222v433.4625.48014.2312996.151604.2)875.275.32(例题分析)10名学生两套试卷的得分名学生两套试卷的得分 学生编号学生编号试卷试卷A试卷试

22、卷B差值差值d17871726344193726111489845691741754951-27685513876601698577810553916222111221)1()1(nppnppzpp在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以90%的置信水平估计城市与农村收视率差别的置信区间%32.19,%68.6%32.6%13400%)321(%32500%)451(%4596.1%32%451.比较两个总体的方差比2.用两个样本的方差比来判断如果S12/S22接近于1,说明两个总体方差很接近如果S1

23、2/S22远离1,说明两个总体方差之间存在差异3.总体方差比在1-置信水平下的置信区间为212221222122221FssFss),(1),(1222121nnFnnF5201x26021s4802x28022s505.028026098.12802602221(P234)估计总体均值时样本容量的确定估计总体均值时样本容量的确定2.估计总体比例时样本容量的确定估计总体比例时样本容量的确定3.估计两个总体均值之差时样本容量的估计两个总体均值之差时样本容量的确定确定4.估计两个总体比例之差时样本容量的估计两个总体比例之差时样本容量的确定确定估计总体均值时样本容量估计总体均值时样本容量n为为样本容

24、量样本容量n与总体方差与总体方差 2、边际误差、边际误差E、可、可靠性系数靠性系数Z或或t之间的关系为之间的关系为与总体方差成正比与总体方差成正比与边际误差成反比与边际误差成反比与可靠性系数成正比与可靠性系数成正比2222)(Ezn拥有工商管理学士学位的大学毕业生拥有工商管理学士学位的大学毕业生年薪的标准差大约为年薪的标准差大约为2000元,假定想要估计元,假定想要估计年薪年薪95%的置信区间,希望边际误差为的置信区间,希望边际误差为400元,应抽取多大的样本容量?元,应抽取多大的样本容量?9704.964002000)96.1()(2222222Ezn222)1()(EznnzE)1(2根据

25、以往根据以往的生产统计,某的生产统计,某种产品的合格率种产品的合格率约为约为90%,现要,现要求 边 际 误 差 为求 边 际 误 差 为5%,在求,在求95%的置信区间时,的置信区间时,应抽取多少个产应抽取多少个产品作为样本?品作为样本?1393.13805.0)9.01(9.0)96.1()1()(22222Ezn:n1、n2、总体方差不知时,可用历史方差、总体方差不知时,可用历史方差、样本方差代替。如有多个方差共选用,样本方差代替。如有多个方差共选用,一般选取最大的方差;一般选取最大的方差;n3、设设n1和和n2为来自两个总体的样本,并假定为来自两个总体的样本,并假定n1=n2根据均值之

26、差的区间估计公式可得两个样根据均值之差的区间估计公式可得两个样本的容量本的容量n为为222212221)()(EznnnnzE212一所中学的教务处想要估计试验班和普通一所中学的教务处想要估计试验班和普通班考试成绩平均分数差值的置信区间。要求置信班考试成绩平均分数差值的置信区间。要求置信水平为水平为95%,预先估计两个班考试分数的方差分,预先估计两个班考试分数的方差分别为:试验班别为:试验班 12=90,普通班,普通班 22=120。如果。如果要求估计的误差范围要求估计的误差范围(边际误差边际误差)不超过不超过5分,在分,在两个班应分别抽取多少名学生进行调查?两个班应分别抽取多少名学生进行调查?17464.165)12090(96.1)()(22222212221Eznn设n1和n2为来自两个总体的样本,并假定n1=n2根据比例之差的区间估计公式可得两个样本的容量n为nzE)1()1(22112222112221)1()1()(Eznn08.1921.0)5.01(5.0()5.01(5.096.1)1()1()(22222112221Eznn

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(统计学ppt课件-PPT课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|