第5章抽样及参数估计课件.ppt

上传人(卖家):晟晟文业 文档编号:3859221 上传时间:2022-10-19 格式:PPT 页数:94 大小:808.17KB
下载 相关 举报
第5章抽样及参数估计课件.ppt_第1页
第1页 / 共94页
第5章抽样及参数估计课件.ppt_第2页
第2页 / 共94页
第5章抽样及参数估计课件.ppt_第3页
第3页 / 共94页
第5章抽样及参数估计课件.ppt_第4页
第4页 / 共94页
第5章抽样及参数估计课件.ppt_第5页
第5页 / 共94页
点击查看更多>>
资源描述

1、第 5 章 抽样及参数估计统计学第 5 章 抽样与参数估计5.1 抽样及其分布5.2 抽样方法5.3 参数估计5.4 样本量的确定学习目标1 了解抽样和抽样分布的基本概念2 了解点估计的概念和估计量的优良标准3 掌握总体均值、总体比例和总体方差的区间估计4.掌握样本量的确定5.掌握Excel的应用5.1 抽样及其分布1 统计推断2 几个基本概念 总体个体 样本 统计量3 抽样分布统计推断参数估计在统计方法中的地位参数估计参数估计假设检验假设检验统计方法统计方法描述统计描述统计推断统计推断统计统计推断1统计学描述统计学:研究如何全面收集被研究客观事物的数据资料并 进行简缩处理,描述其群体特征和数

2、量规律性。推断统计学:研究如何有效地收集和使用被研究客观事物的不 完整并且带有随机干扰的数据资料,以对其群体特征 和数量规律性给出尽可能精确、可靠的推断性结论。2推断统计参数估计:由对部分进行观测取得的数据对研究对象整体的数 量特征取值给出估计方法。假设检验:由对部分进行观测取得的数据对研究对象的数量规 律性是否具有某种指定特征进行检验。统计推断的过程几个基本概念总体和个体(概念要点)1具体含义 总体(Population):调查研究的事物或现象的全体 个体(Item unit):组成总体的每个元素2抽象含义 总体(Population):调查研究中所关心的作为随机变量的统计指标 个体(Ite

3、m unit):统计指标所取得每个可能值样本(Sample)1样本(Sample):从总体中所抽取的部分个体2样本量(Sample size):样本中所含个体的数量3简单随机样本:满足代表性和独立性的样本4简单随机抽样:获得简单随机样本的方法统计量统计量:不含任何未知参数的样本的函数例:设 是总体 容量为n的样本,则),(21nXXXX样本均值(Sample mean):样本方差(Sample variance):niixnx11niixxns122)(11nikikxnA11k阶原点矩(Moment of order ):k都是统计量抽样分布抽样分布(sampling distributio

4、n)1.样本统计量的概率分布,是一种理论分布n在重复选取容量为的样本时,由该统计量的所有可能取值形成的相对频数分布 2.样本统计量样本统计量是随机变量是随机变量n样本均值,样本比例,样本方差等3.结果来自容量相同容量相同的所有所有可能样本4.提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布的形成过程(sampling distribution)样本均值的抽样分布样本均值的抽样分布1.在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2.一种理论概率分布3.推断总体均值的理论基础样本均值的抽样分布(例题分析)5.21NxNii25

5、.1)(122NxNii样本均值的抽样分布(例题分析)现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2 的样本(共的样本(共16个)个)样本均值的抽样分布(例题分析)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值

6、观察值16个样本的均值(个样本的均值(x)样本均值的分布与总体分布的比较(例题分析)5.2x625.02x样本均值的抽样分布与中心极限定理x5x50 x5.2x中心极限定理(central limit theorem)当样本容量足够大时(n 30),样本均值的抽样分布逐渐趋于正态分布nx中心极限定理:中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布一个任意分布的总体x中心极限定理(central limit theorem)x 的分布趋于正态分布的过程抽样分布与总体分布的关系正态分布正态分布非正态分布

7、非正态分布正态分布正态分布正态分布正态分布非正态分布非正态分布1.样本均值的数学期望2.样本均值的方差n重复抽样n不重复抽样样本均值的抽样分布(数学期望与方差)(xEnx22122NnNnx样本均值的抽样分布(数学期望与方差)比较及结论:比较及结论:1.样本均值的均值(数学期望)等于总体均值 2.样本均值的方差等于总体方差的1/n为样本数目MnMxnixix222122625.016)5.20.4()5.20.1()(5.2160.45.10.11Mxniix样本比例的抽样分布1.总体(或样本)中具有某种属性的单位与全部单位总数之比n不同性别的人与全部人数之比n合格品(或不合格品)与全部产品总

8、数之比2.总体比例可表示为3.样本比例可表示为4.比例(proportion)NNNN101或nnpnnp101或1.在重复选取容量为的样本时,由样本比例的所有可能取值形成的相对频数分布2.一种理论概率分布3.当样本容量很大时,样本比例的抽样分布可用正态分布近似 4.推断总体比例的理论基础样本比例的抽样分布1.样本比例的数学期望2.样本比例的方差n重复抽样n不重复抽样样本比例的抽样分布(数学期望与方差)(pEnp)1(21)1(2NnNnp5.2 抽样方法1.抽样调查2.抽样单元与抽样框3.抽样方法分类4.抽样调查设计抽样调查抽样调查1.抽样调查:通过对有限总体实施抽样,利用样本调查数据对总体

9、参数进行估计。2.概率抽样:根据一个已知的概率来抽取样本单位,也称随机抽样。3.概率抽样的特点:n能够确切地区分不同的样本;n对每个可能的样本都赋予一个被抽到的概率;n按照事先赋予的概率通过某种随机形式抽取样本;n利用样本调查数据估计目标量时仍需与抽样概率相联系 抽样单元与抽样框抽样单元与抽样框1.抽样单元(Sampling unit):将总体划分成互不重迭且又穷尽的若干部分,每个部分称为一个抽样单元每个抽样单元都是由若干个体组成的集合只由一个个体组成就称为最小抽样单元 抽样单元可以是自然形成的,也可以是人为划定的 2.抽样框(Sampling frame):关于抽样单元的名册或清单上一级别的

10、某个抽样单元被抽中,必须在下一级别抽样框中连续抽样有效的抽样框所包含的抽样单元应既无遗漏又无重复抽样方法抽样方法简 单 随 机 抽 样分 层 抽 样整 群 抽 样系 统 抽 样二 阶 抽 样 与 多 阶 段 抽 样概 率 抽 样方 便 抽 样判 断 抽 样自 愿 样 本滚 雪 球 抽 样配 额 抽 样非 概 率 抽 样抽 样 方 式简单随机抽样(simple random sampling)1.从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为n样本都有相同的机会(概率)被抽中 2.抽取元素的具体方法有重复抽样和不重复抽样3.特点n简单、直观,在抽样框完整时,可直接从中抽取样本n用样

11、本统计量对目标量进行估计比较方便4.局限性n当N很大时,不易构造抽样框n抽出的单位很分散,给实施调查增加了困难n没有利用其他辅助信息以提高估计的效率分层抽样(stratified sampling)1.将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本2.优点n保证样本的结构与总体的结构比较相近,从而提高估计的精度n组织实施调查方便n既可以对总体参数进行估计,也可以对各层的目标量进行估计二阶抽样与多阶段抽样(two&multi-stage sampling)1.先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查n群是初

12、级抽样单位,第二阶段抽取的是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样2.不需要对每个高级别的抽样单元建立关于低级别抽样单元的抽样框,节约调查费用3.需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开4.在大规模的抽样调查中,经常被采用的方法 整群抽样(cluster sampling)1.将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查2.特点n抽样时只需群的抽样框,可简化工作量n调查的地点相对集中,节省调查费用,方便调查的实施n缺点是估计的精度较差系统抽样(systematic samplin

13、g)1.将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位n先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位2.优点:操作简便,可提高估计的精度3.缺点:对估计量方差的估计比较困难抽样调查设计抽样调查设计1.抽样方案设计抽样方法的选择和组合 样本容量的确定2.调查方法确定3.例:问卷调查、座谈会调查、电话调查等3.估计量的构造建立由所得数据能够给出目标量估计值的估计方法估计量具有较好的概率性质,例如无偏性、方差小 构造估计量方差的估计量采用自加权估计量 5.3 参数估计1.参数估计

14、概述2.参数估计的基本方法3.总体均值的区间估计4.总体比例的区间估计5.总体方差的区间估计参数估计概述参数估计概述1.统计估计:研究由样本估计总体的未知分布或 2.分布中的未知参数3.2.非参数估计:直接对总体未知分布的估计4.3.参数估计:总体分布类型已知,仅需对分布的5.未知参数进行的估计参数估计的基本方法1.估计量:用于估计总体参数的随机变量n如样本均值,样本比例、样本方差等n例如:样本均值就是总体均值 的一个估计量2.参数用 表示,估计量用 表示3.估计值:估计参数时计算出来的统计量的具体值n如果样本均值 x=80,则80就是的估计值估计量与估计值(estimator&estimat

15、ed value)参数估计的方法估估 计计 方方 法法点点 估估 计计区间估计区间估计点估计(point estimate)1.点估计量:设总体 的分布类型已知,但包含未知参数,从总体中抽取一个简单随机样本 ,构造一个适当的统计量 作为的估计,称 为未知参数的点估计量 2.用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估例如:用两个样本均值之差直接作为总体均值之差的估计3.没有给出估计值接近总体未知参数程度的信息),(21nXXXX),(21nXXXT区间估计(interval estimate)1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量

16、加减抽样误差而得到的2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量n比如,某班级平均分数在7585之间,置信水平是95%区间估计的图示xxzx21.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2.表示为(1-n 为是总体参数未在区间内的比例 3.常用的置信水平值有 99%,95%,90%n相应的相应的 为0.01,0.05,0.10置信水平 置信区间(confidence interval)1.设是未知参数,是来自总体的2.样本,构造两个统计量 ,3.,对于给定的 (0 1,4.若 、满足:5.),(21nXXX),(

17、2111nXXXT),(2122nXXXT12121P,21,21122.区间长度为随机变量,置信区间为随机区间3.置信水平描述了估计的可靠度,区间长度描述4.了估计的精度 4.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值n我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个置信区间(confidence interval)置信区间与置信水平 均值的抽样分布xxx影响区间宽度的因素1.总体数据的离散程度,用 来测度2.样本容量,3.3.置信水平(1-),影响 z 的大小nx评价估计量

18、的标准无 偏 性有 效 性一 致 性均 方 误 差 准 则评 价 点 估 计 的 标 准无偏性(unbiasedness),(21nXXXTE有效性(efficiency)有效性:的抽样分布 的抽样分布12P()一致性(consistency)一致性:一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数较小的样本容量较大的样本容量P()均方误差准则(Mean square error)122221)()(EE12一个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值均值比例比例方差方差2xp2s总体均值的区间估计总体均值的区间估计(正态总体且 已知或非正态

19、总体、未知、大样本)1.假定条件n总体服从正态分布,且方差()已知n如果不是正态分布,可由正态分布来近似(n 30)2.使用正态分布统计量 z)1,0(NnXz)(22未知或nszXnzX总体均值的区间估计(例题分析)5.39X(58.42,41.36362.7575.25.392nzx总体均值的区间估计(例题分析)25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总

20、体均值的区间估计(例题分析)(2741.109,4459.10118000258000251096.136.10512NnNnzx36.105x12NnNnzx总体均值的区间估计(例题分析)36个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532总体均值的区间估计(例题分析)(63.41,37.3713.25.393677.7645.15.392nszx5.39x77.7s总体均值的区间估计(正态总体、方差未知、小样本)1.假定条件n总体服从正态分布,且方差()未知

21、n小样本(n 30)2.使用 t 分布统计量)1(ntnsxtnstx2t 分布 t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布 总体均值的区间估计(例题分析)16灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470总体均值的区间估计(例题分析)(2.1503,8.14762.1314901677.24131.214902ntx1490 x77.24s总体比例的区间估计总体比例的区

22、间估计1.假定条件:大样本条件下,样本比例的抽样分布可以由正态分2.布来近似2.使用正态分布统计量 z)1,0()1(Nnpppz)(1)-1()()1(22不重复抽样或重复抽样NnNnppzpnppzp总体比例的区间估计(例题分析)解:解:已知 n=100,p65%,1-=95%,z/2=1.96(%35.74%,65.55%35.9%65100%)651%(6596.1%65)1(2nppzp该城市下岗职工中女性比例的置信区间为55.65%74.35%总体比例的区间估计(例题分析)95的置信水平下估计赞成改革的人数比例的置信区间为69.63%80.37%(%37.80%,63.69%37.

23、5%75110002001000100%)751%(7596.1%751)1(2NnNnppzp总体方差的区间估计总体方差的区间估计1.估计一个总体的方差或标准差2.假设总体服从正态分布3.总体方差 2 的点估计量为S2,且(11222nsn(111122122222nsnnsn总体方差的区间估计(图示)总体方差的区间估计(例题分析)685.23)1(22n571.6)1(212n(8.561.1571.665.1115685.2365.111522225.4 样本容量的确定1 影响样本容量的因素2 估计总体均值时样本容量的确定3 估计总体比例时样本容量的确定 样本量的确定估计总体均值时样本容

24、量n为估计总体均值时样本容量的确定 条件下重复抽样2222dun条件下不重复抽样2222222)1(udNNun估计总体均值时样本容量的确定(例题分析)估计总体均值时样本容量的确定 (例题分析)4368.42310)96.1()(2222222dun根据比例区间估计公式可得样本容量n为估计总体比例时样本容量的确定 重复抽样222)1()(dunnppud)1(2不重复抽样)1()()1()1()(22222udNuNn估计总体比例时样本容量的确定(例题分析)1393.13805.0)9.01(9.0)96.1()1()(22222dzn5.5 Excel的应用本章小结1.抽样分布抽样分布2.总体参数的区间估计总体参数的区间估计3.样本量的确定样本量的确定4.Excel的应用的应用结结 束束第五章 抽样与参数估计

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第5章抽样及参数估计课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|