抽样分布与参数估计总结课件.ppt

上传人(卖家):晟晟文业 文档编号:4292307 上传时间:2022-11-26 格式:PPT 页数:65 大小:1.11MB
下载 相关 举报
抽样分布与参数估计总结课件.ppt_第1页
第1页 / 共65页
抽样分布与参数估计总结课件.ppt_第2页
第2页 / 共65页
抽样分布与参数估计总结课件.ppt_第3页
第3页 / 共65页
抽样分布与参数估计总结课件.ppt_第4页
第4页 / 共65页
抽样分布与参数估计总结课件.ppt_第5页
第5页 / 共65页
点击查看更多>>
资源描述

1、统计学原理第六章 抽样分布与参数估计抽样分布、参数估计和抽样分布、参数估计和假设检验是推断统计的假设检验是推断统计的三个中心内容三个中心内容统计学原理第一节 抽样分布统计学原理基本概念统计量:由样本构造出来,不依赖于任何总体参数的函数。参数:描述总体分布状况的数。统计学原理抽样分布抽样分布:统计量的分布形式统计量的分布依赖于总体的分布,同时与抽样方式也存在相关。一般讨论统计量的抽样分布时,总是基于有放回的简单随机抽样。o 有放回简单随机抽样:从总体中抽出一个单位后,将其放回总体,再抽选下一个单位。o 有放回简单随机抽样的各个样本单位之间是相互独立的。统计学原理抽样分布的实验使用1999年中国2

2、159个县级行政区人口数资料进行实验。从所有县中,分别随机抽选10、30、100、200个县,计算其人口数的平均数。将同一实验反复进行200次,观察平均数的分布规律。o 说明:为简化实验起见,在此进行的是无放回实验,结果与有放回的情况略有差异。统计学原理N=1072.767.762.657.652.547.542.537.432.427.322.3N=10时的抽样分布80706050403020100Std.Dev=10.08 Mean=46.0N=200.00N=3072.569.666.663.760.757.854.951.949.046.043.140.137.234.231.328.

3、425.422.5N=30时的抽样分布80706050403020100Std.Dev=6.47 Mean=46.6N=200.00N=10072.770.067.464.762.159.456.854.151.548.846.243.540.938.235.632.930.327.625.022.3N=100时的抽样分布80706050403020100Std.Dev=3.14 Mean=46.1N=200.00N=20070.6966.2761.8557.4453.0248.6044.1939.7735.3530.9426.5222.10N=200时的抽样分布806040200Std.De

4、v=2.23 Mean=46.24N=200.00统计学原理样本均值的抽样分布特征N30时,样本均值服从正态分布。样本均值以总体均值为期望值样本均值的标准差为总体标准差除以样本量的平方根。n,XxEx )(统计学原理样本均值分布与中心极值定理正态总体中,样本均值的分布仍为正态分布。非正态总体,根据中心极值定理统计学原理样本均值抽样特征的推导统计学原理统计学原理统计学原理抽样标准误在任何一项抽样中,统计量的标准差称为抽样标准误。在利用样本平均数估计总体平均数时,抽样标准误即为样本平均数的标准差,即前文中推导出来的x统计学原理无放回条件下的简单随机抽样统计学原理无放回条件下抽样公式的简化)1(12

5、2222fnNnNnNnNnxxf=n/N,称为抽样比,称为抽样比nNnfnxx2222)()1(若由上述的推导可见,在总体单位数特别大的情况下,由上述的推导可见,在总体单位数特别大的情况下,有放回与无放回抽样的效果是相同的。有放回与无放回抽样的效果是相同的。统计学原理例题:关于扑克牌的游戏 从一副扑克牌(52张)中,有放回地抽出30张,其平均点数的分布规律如何?如果以点数来赌胜负,什么区间的胜率是95%?统计学原理统计学原理第二节 参数估计主要讨论总体平均数的主要讨论总体平均数的参数估计参数估计统计学原理参数估计的一般问题参数估计:用样本统计量去估计总体的参数。估计量与估计值o 用于估计总体

6、参数的样本统计量的名称叫估计量;o 根据一个具体样本计算出来的估计量的数值叫估计值。统计学原理点估计与区间估计点估计是用样本统计量的某个取值直接作为总体参数的估计值。区间估计(Interval Estimate)是在点估计的基础上给出总体参数估计的一个区间范围。总体参数的估计区间,称为置信区间。统计学原理置信度如果将构造置信区间的步骤重复多次,置信区间中包含总体真值的次数所占的比例称为置信水平(Confidence Level)。也称为置信度或置信系数(Confidence Coefficient)。统计学原理置信度与置信区间的关系以正态分布为例,当置信度为P时,置信区间为-t,+t其中,为期

7、望值,为标准差。T称为概率度,以下为对应关系概率度(t)概率值(p)概率度(t)概率值(p)1.28 80%1 68.27%1.64 90%2 95.45%1.96 95%3 99.73%2.58 99%统计学原理评价估计量的标准无偏性(Unbiasedness)o 估计量的期望值等于总体参数值。有效性(Efficiency)o 估计量的标准差最小。一致性(Consistency)o 大样本获得的估计量比小样本更接近总体参数值。统计学原理有放回条件下的简单随机抽样依据:样本平均数的分布特征o 1样本量n30时,样本平均数服从正态分布o 2样本平均数以总体平均数为期望值o 3样本平均数的方差为

8、nx22统计学原理导入:估计样本平均数的范围某总体方差为100,平均值为40,抽出一个36个单位构成的样本,试在95的置信度水平下,估计样本平均数的范围。统计学原理统计学原理从前例逆推已知某总体方差为100,其一个由36个单位组成的样本的平均数为50,试在95的置信度水平下,估计总体平均数的置信区间。统计学原理统计学原理统计学原理总体标准差的替代对总体均值进行估计时,需要使用到总体标准差的数值。当总体标准差未知时,可以使用样本标准差作为总体标准差的替代。1)(2nxxsi统计学原理例题:估计总体平均数一次调查中获得了36个样本的数据如下23 35 39 27 36 44 36 42 46 43

9、 31 3342 53 45 54 47 24 34 28 39 36 44 4039 49 38 34 48 50 34 39 45 48 45 32试在95%的置信度水平下,估计总体平均数的置信区间。统计学原理计算结果计算样本平均数:X=39.5计算样本标准差:s=7.7736令:总体标准差=样本标准差,计算抽样误差为 1.295695%置信度对应的T值为1.96得总体平均数的置信区间为:o 上限:39.5+1.961.2956=42.04o 下限:39.5-1.961.2956=36.96统计学原理对计算结果的说明严格地说,在这个例子中,不应当根据正态分布进行估计,而应当使用T分布进行估

10、计。如果使用T分布,自由度为35,95%置信度的概率度(t)是2.03,而非1.96。计算出来的置信区间比正态分布的情况要略大一些。置信区间略大的原因,在于使用S替代总体标准差时,本身也包含了一定的误差。实践中,社会调查的样本量一般都比较大,正态分布与T分布的差异不明显,因此可以用正态分布进行近似分析。例如,当样本量为200时,T分布的95%概率度为1.9719,与正态分布的1.96已经没有太大区别了。统计学原理第三节 常见的参数估计题型本章为选修内容,涉及到数本章为选修内容,涉及到数理统计中较多知识,需要通理统计中较多知识,需要通过习题来加以掌握。过习题来加以掌握。统计学原理估计中的要点参数

11、估计是从统计量的抽样分布入手,利用统计量的分布特征,倒推出总体参数的置信区间。o 所有分布特征,都是基于统计量的抽样分布o 总体参数是常数,统计量是随机变量。统计学原理一个总体参数总体均值正态总体,方差已知;o 或非正态总体,大样本,方差已知。22(0,1)(,)XXXaaxzNnxzxznn置信区间:注意:Z取a/2的原因在于此时置信区间是最小的。统计学原理一个总体参数总体均值正态总体,方差未知2(1):axtt nsnsxtn置信区间t分布以正态分布为渐近分布,一般当n大于30时,t分布与正态分布已经十分接近,可以使用正态分布来进行处理统计学原理T分布概率密度函数统计学原理T分布曲线统计学

12、原理例题:T分布已知某产品的使用寿命服从正态分布,现随机抽取16件,计算平均寿命为1490小时,样本标准差为24.77小时,试估计这批产品寿命的95%置信区间由设产品平均寿命为,由题意可知查表,15个自由,双侧概率0.05的T值为2.13=TINV(0.05,15)由-2.13t2.13,可以求出的置信区间为(1476.8,1503.2)1ntnsxt统计学原理总体比例的区间估计在大样本的情况下,样本比例P的抽样分布为正态分布。可以利用正态分布进行区间估计。统计学原理比例估计的标准差比例估计的情况下,如果未知总体方差,可以用样本方差替代。严格的计算公式应当为 在实践中,经常直接使用p(1-p)

13、作为近似。2(1)1nsppn统计学原理一个总体总体方差当总体为正态分布时,样本方差与总体方差之比以以下的方式服从n-1个自由的卡方分布1)1(222nSnX统计学原理卡方分布的密度函数统计学原理卡方分布统计学原理例题:卡方分布已知一批食品的重量服从正态分布,从总体中抽选25袋,计算样本方差为93.21,试在95%的置信度水平下,估计总体的方差假定总体方差为2,可知查表,24个自由度的卡方值分别为CHIINV(0.025,24)=39.36CHIINV(0.975,24)=12.40由12.40K39.36,可得2的置信区间为(56.83,180.39)11222nsnK统计学原理两个总体参数

14、均值之差两个总体均值之差:独立样本,大样本统计学原理两个总体参数均值之差两个总体均值之差:独立样本,小样本o 两个总体的方差未知,但相等;o 两个总体的方差未知,不相等,但样本量相等;o 两个总体的方差未知,不相等,样本量不相等。均使用T分布,主要区别在于方差的计算方法和自由度(略)。统计学原理两个总体均值之差:匹配样本一个样本中的数据与另一样本相对应,可以直接计算对应样本的差的分布。大样本情况下:两总体均值之差服从正态分布。小样本情况下:假定均值之差服从正态分布,使用样本标准差代替总体标准差,计算T分布。统计学原理两个总体参数比例之差比例之差:大样本下,服从正态分布。在估计时使用样本标准差替

15、代。统计学原理两个总体的方差比样本方差比的抽样分布为F分布其中第一自由度为n1-1,第二自由度为n2-11,12121222221nnFss统计学原理F分布的密度函数统计学原理F分布统计学原理第四节 样本量的计算统计学原理样本量的确定估计总体均值时样本量的确定统计学原理总体标准差的确定根据以往的经验数值推算通过试访问推算采用序贯抽样方法在比例估计时,使用p(1-p)的最大值替代。o 比例估计时,方差为:p(1-p)o 可知,p(1-p)的最大值为0.25。统计学原理序贯抽样Sequential Sampling 在抽样时不预先指定子样容量,而是要求给出一组停止采样的规则,每新抽一个子样后立即按

16、此规则考察一下,是停止采样还是继续采样。如果采样一旦停止,就按此时所给出的观察值作为一个固定子样容量进行统计推断。统计学原理比例估计时的方差推导定义X如下:o X=1,当样本具有某项属性时;o X=0,当样本不具有某些属性时可以证明,具有某项属性的样本比例P满足)1()1()1()1()1()0()1(01222221221ppppppppppnpnpnpnnnxx统计学原理比例估计时的样本量推算n在校园内估计学生拥有手机的比例,希望在95%的置信水平下,估计的绝对误差不超过5个百分点(5%),求样本量22221.96,0.250.05385nMaxn取则有统计学原理思考题:收视率估计某电视台

17、欲在95%的置信度水平下,对电视节目的收视率作为有效的估计,试考虑样本量应当为多少?问题:若确定估计绝对误差为5%,则样本为385户,是否可行?若考虑估计相对误差为10%,则样本量应当为多少?统计学原理其他样本量估计的情况估计样本比例时样本量的确定估计两个总体均值之差时样本量的确定估计两个总体比例之差时样本量的确定以上问题,均可通过参数估计的公式进行逆推求得。统计学原理第五节 其他抽样方式的误差统计学原理分层抽样 kiiiinWx12W:各层单位数所占比重:各层单位数所占比重2:层内方差:层内方差统计学原理整群抽样 12RrRrxR与与r:群的总数和样本群数量:群的总数和样本群数量2:群间方差:群间方差统计学原理多阶段抽样F:抽样比:抽样比 N和和M:一级和二级单位的单位数:一级和二级单位的单位数S2:一级与二级单位的方差:一级与二级单位的方差 22221111SmnfSnfx统计学原理设计效应机抽样的方差相同样本无放回简单随的方差所考虑抽样设计估计量deff 当当deff因子小于因子小于1 1时,说明抽样设计的效率高于时,说明抽样设计的效率高于SRSSRS。如果一个复杂抽样的如果一个复杂抽样的deff因子可以估计,对应相同精度因子可以估计,对应相同精度的简单随机抽样样本量的简单随机抽样样本量n n,复杂抽样设计的样本量,复杂抽样设计的样本量n n为:为:N=ndeff

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(抽样分布与参数估计总结课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|