数学抽样估计课件.pptx

上传人(卖家):ziliao2023 文档编号:6839466 上传时间:2023-08-11 格式:PPTX 页数:101 大小:980.73KB
下载 相关 举报
数学抽样估计课件.pptx_第1页
第1页 / 共101页
数学抽样估计课件.pptx_第2页
第2页 / 共101页
数学抽样估计课件.pptx_第3页
第3页 / 共101页
数学抽样估计课件.pptx_第4页
第4页 / 共101页
数学抽样估计课件.pptx_第5页
第5页 / 共101页
点击查看更多>>
资源描述

1、 1了解抽样推断的概念和特点,明确在哪些场合适合了解抽样推断的概念和特点,明确在哪些场合适合运用抽运用抽 样推断的方法;样推断的方法;2理解抽样平均误差、抽样极限误差及概率度的概念理解抽样平均误差、抽样极限误差及概率度的概念和三者之间的相互关系,和三者之间的相互关系,以及明确如何确定一定误差范围以及明确如何确定一定误差范围内的置信度;内的置信度;3理解抽样估计的优良标准是什么,掌握估计总体平理解抽样估计的优良标准是什么,掌握估计总体平均指标和成数指标的基本原理和基本方法;均指标和成数指标的基本原理和基本方法;4掌握简单随机抽样、等距抽样、类型抽样、整群抽掌握简单随机抽样、等距抽样、类型抽样、整

2、群抽样等抽样组织方式的特点,样等抽样组织方式的特点,以及各种组织形式的抽样平均以及各种组织形式的抽样平均误差计算方法及抽样推断方法。误差计算方法及抽样推断方法。学习目的和要求学习目的和要求:2023-8-11第七章 抽样估计2 抽样估计是在抽样调查的基础上,利用样本的实抽样估计是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。征的一种统计分析方法。(一)抽样估计的概念(一)抽样估计的概念2023-8-11第七章 抽样估计3 统计分析的主要任务,就是要反映现象总体统计分析的主要任务,就是要反映现象总体的

3、数量特征。的数量特征。但在实际工作中,我们不可能、也没有必要但在实际工作中,我们不可能、也没有必要每次都对总体的所有单位进行全面调查。在很多情每次都对总体的所有单位进行全面调查。在很多情况下,我们只需抽取总体的一部分单位作为样本,况下,我们只需抽取总体的一部分单位作为样本,通过分析样本的实际资料,来估计和推断总体的数通过分析样本的实际资料,来估计和推断总体的数量特征,以达到对现象总体的认识。量特征,以达到对现象总体的认识。2023-8-114第七章 抽样估计 1抽样推断是由部分推算整体的一种认识方法;抽样推断是由部分推算整体的一种认识方法;2抽样推断是建立在随机取样的基础之上的;抽样推断是建立

4、在随机取样的基础之上的;3抽样推断运用的是概率估计的方法;抽样推断运用的是概率估计的方法;4抽样推断的误差是可以事先计算并加以控制的。抽样推断的误差是可以事先计算并加以控制的。(二)抽样推断的特点(二)抽样推断的特点2023-8-115第七章 抽样估计 (一)参数估计(一)参数估计 虽然我们不知道总体的数量特征,但我们可以依据所获得的样虽然我们不知道总体的数量特征,但我们可以依据所获得的样本观察资料,对所研究对象总体的水平、结构、规模等数量特征进本观察资料,对所研究对象总体的水平、结构、规模等数量特征进行估计,这种推断方法称为总体参数估计。行估计,这种推断方法称为总体参数估计。(二)假设检验(

5、二)假设检验 由于我们对总体的变化情况不了解,不妨先对总体的状况作某由于我们对总体的变化情况不了解,不妨先对总体的状况作某种假设,然后根据抽样推断的原理,依据样本观察资料对所作假设种假设,然后根据抽样推断的原理,依据样本观察资料对所作假设进行检验,来判断这种假设的真伪,以决定我们行动的取舍,这种进行检验,来判断这种假设的真伪,以决定我们行动的取舍,这种推断方法称为总体参数的假设检验。推断方法称为总体参数的假设检验。2023-8-116第七章 抽样估计 (一)总体和样本(一)总体和样本 总体也称全及总体或母体,是指所要认识研究对象的全体。它是总体也称全及总体或母体,是指所要认识研究对象的全体。它

6、是由所研究范围内具有某种共同性质的全体单位所组成的集合体。总体由所研究范围内具有某种共同性质的全体单位所组成的集合体。总体的单位数通常较大,甚至是无限的,一般用的单位数通常较大,甚至是无限的,一般用N表示全及总体的单位数。表示全及总体的单位数。一个全及总体的指标数值是确定的、唯一的,所以称为参数。一个全及总体的指标数值是确定的、唯一的,所以称为参数。样本又称样本总体或子样,它是从全及总体中随机抽取出来的一样本又称样本总体或子样,它是从全及总体中随机抽取出来的一部分单位组成的集合体,样本的单位数是有限的,一般用部分单位组成的集合体,样本的单位数是有限的,一般用n表示样本总表示样本总体的单位数。体

7、的单位数。样本总体的指标数值是个随机变量,所以称为样本统计样本总体的指标数值是个随机变量,所以称为样本统计量或样本估计量。量或样本估计量。2023-8-117第七章 抽样估计总体平均数和总体方差为:总体平均数和总体方差为:XXNXFXF22()XXXN22()XXXFF总体成数及方差为:总体成数及方差为:1NPN2(1)PPP(二)总体参数和样本统计量(二)总体参数和样本统计量2023-8-118第七章 抽样估计样本统计量是用来估计总体参数的,因此和总体参数相对样本统计量是用来估计总体参数的,因此和总体参数相对应,有样本平均数及方差、样本成数及方差。应,有样本平均数及方差、样本成数及方差。样本

8、成数及方差为:样本成数及方差为:xxnxfxf22()xxxsn22()xxxfsf1npn2(1)pspp样本平均数和方差为:样本平均数和方差为:2023-8-119第七章 抽样估计 样本容量样本容量是指一个样本包含的单位数。一个样本应包含多少单是指一个样本包含的单位数。一个样本应包含多少单位较合适,这是抽样设计必须考虑的问题。样本容量的大小不但关位较合适,这是抽样设计必须考虑的问题。样本容量的大小不但关系到抽样调查的效果,而且关系到抽样方法的应用。我们通常将单系到抽样调查的效果,而且关系到抽样方法的应用。我们通常将单位数小于位数小于30的样本称为小样本,单位数等于或大于的样本称为小样本,单

9、位数等于或大于30的样本称为大的样本称为大样本。社会经济统计的抽样调查一般都采用大样本调查。样本。社会经济统计的抽样调查一般都采用大样本调查。样本个数样本个数又称样本可能数目,是指从一个总体可能抽取的样本又称样本可能数目,是指从一个总体可能抽取的样本个数。一个总体可以抽取多少个样本和样本容量以及抽样方法有关。个数。一个总体可以抽取多少个样本和样本容量以及抽样方法有关。从一个总体中能抽取多少个样本,则样本统计量就有多少种取值,从一个总体中能抽取多少个样本,则样本统计量就有多少种取值,从而形成了该统计量的分布。研究所有可能抽取的样本及其统计量从而形成了该统计量的分布。研究所有可能抽取的样本及其统计

10、量的分布,是抽样推断的基础。的分布,是抽样推断的基础。(三)样本容量和样本个数(三)样本容量和样本个数2023-8-1110第七章 抽样估计 重复抽样重复抽样也称回置抽样,它是指每次抽取一个样本也称回置抽样,它是指每次抽取一个样本登记后再将它放回总体中参加下一次抽取。登记后再将它放回总体中参加下一次抽取。也就是说也就是说每一个样本单位都有被重复抽取的可能。每一个样本单位都有被重复抽取的可能。重复抽样的特点是重复抽样的特点是:每次抽取样本是在完全相同的条件下进行的,每次抽取样本是在完全相同的条件下进行的,总总体中每个单位中选的机会在各次都完全相等。体中每个单位中选的机会在各次都完全相等。(四)重

11、复抽样和不重复抽样(四)重复抽样和不重复抽样2023-8-1111第七章 抽样估计例如:总体有例如:总体有A、B、C共共3个单位,要从中以重复抽样个单位,要从中以重复抽样的方法抽取的方法抽取2个单位构成样本,个单位构成样本,则可能抽取的样本数目为则可能抽取的样本数目为Nn=32=9个个,它们是:它们是:从总体从总体N个单位中,用重复抽样的方法,个单位中,用重复抽样的方法,随机抽取一个容量为随机抽取一个容量为n的样本,共可抽取的样本,共可抽取Nn个样本。个样本。AA、AB、AC BA、BB、BC CA、CB、CC2023-8-1112第七章 抽样估计 不重复抽样不重复抽样也称不回置抽样,它是指每

12、次抽取一也称不回置抽样,它是指每次抽取一个样本登记后不再放回总体中参加下一次抽取。也就个样本登记后不再放回总体中参加下一次抽取。也就是说每一个样本单位只有一次被抽取的可能。是说每一个样本单位只有一次被抽取的可能。不重复抽样时,每个样本的抽取不独立的,因为不重复抽样时,每个样本的抽取不独立的,因为每个样本在抽取前总体单位数不一样。每个样本在抽取前总体单位数不一样。在实际操作中,大多数抽样都是不重复抽样。在实际操作中,大多数抽样都是不重复抽样。不重复抽样的特点:不重复抽样的特点:2023-8-1113第七章 抽样估计例如:总体有例如:总体有3个单位个单位A、B、C,要从中以不重复抽,要从中以不重复

13、抽样的方法抽取样的方法抽取2个单位构成样本,个单位构成样本,则全部可能抽取的样本数目为则全部可能抽取的样本数目为32=6个,它们是:个,它们是:AB、AC、BA、BC、CA、CB从总体从总体N个单位中,采用不重复抽样的方法,随机抽取一个个单位中,采用不重复抽样的方法,随机抽取一个容量为容量为n的样本,则全部可能抽取的样本数目为:的样本,则全部可能抽取的样本数目为:N(N1)()(N2)()(Nn+1)个)个2023-8-11第七章 抽样估计14 抽样误差抽样误差是指由于随机抽样的偶然因素使样本各是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽单位的结构不足以代表

14、总体各单位的结构,而引起抽样指标和全及指标的绝对离差。样指标和全及指标的绝对离差。抽样误差不同于登记误差:抽样误差不同于登记误差:登记误差是人为差错所引起的误差,所有统计调登记误差是人为差错所引起的误差,所有统计调查都可能发生。抽样误差不是人为失误所引起的,而查都可能发生。抽样误差不是人为失误所引起的,而是随机抽样是随机抽样所特有的误差所特有的误差。2023-8-11第七章 抽样估计15 抽样误差是一种代表性误差。抽样误差是一种代表性误差。用样本统计量来代用样本统计量来代表总体参数,必然会有误差。因此,抽样误差是已表总体参数,必然会有误差。因此,抽样误差是已遵遵循了随机原则循了随机原则,由,由

15、偶然因素偶然因素引起的误差,它是抽样推引起的误差,它是抽样推断所断所固有误差固有误差,是,是无法消除无法消除的,但能的,但能事先计算并加以事先计算并加以控制控制。有时抽样过程中可能会产生另一种代表性误差,有时抽样过程中可能会产生另一种代表性误差,即系统性误差。系统性误差是由于违反了随机原则而即系统性误差。系统性误差是由于违反了随机原则而产生的数据偏大或偏小的情况,因此也叫做系统偏差。产生的数据偏大或偏小的情况,因此也叫做系统偏差。系统偏差不是抽样误差,它是人为原因产生的误差,系统偏差不是抽样误差,它是人为原因产生的误差,是可以采取措施避免或加以消除的。是可以采取措施避免或加以消除的。抽样误差的

16、特点:抽样误差的特点:2023-8-11第七章 抽样估计161.总体各单位标志值的差异程度;总体各单位标志值的差异程度;2.样本单位数;样本单位数;3.抽样方法;抽样方法;4.抽样组织方式。抽样组织方式。影响抽样误差大小的因素影响抽样误差大小的因素2023-8-11第七章 抽样估计17 抽样平均误差抽样平均误差是反映抽样误差一般水平的指标,是反映抽样误差一般水平的指标,它是所有可能抽取的样本平均数或成数的标准差。它是所有可能抽取的样本平均数或成数的标准差。由于所有样本平均数的平均数等于总体平均数,由于所有样本平均数的平均数等于总体平均数,所有样本成数的平均数等于总体成数,因此,抽样平所有样本成

17、数的平均数等于总体成数,因此,抽样平均数或成数的标准差反映了抽样平均数或成数与总体均数或成数的标准差反映了抽样平均数或成数与总体平均数或成数的平均离差程度。平均数或成数的平均离差程度。2023-8-11第七章 抽样估计18(一)重复抽样条件下平均数的抽样平均误差(一)重复抽样条件下平均数的抽样平均误差定义公式为:定义公式为:2xnn2()xxXM由定义公式导出的计算公式为:由定义公式导出的计算公式为:2023-8-11第七章 抽样估计19重复抽样平均误差计算公式的推导:重复抽样平均误差计算公式的推导:设总体变量为设总体变量为X1,X2,XN,样本变量为,样本变量为x1,x2,xn,根据平均数的

18、定义和它的数学性质,有:根据平均数的定义和它的数学性质,有:12()nxxxE xEn121()()()nE xE xE xn在重复抽样条件下,由于在重复抽样条件下,由于x1,x2,xn是相互独立的随机变量,是相互独立的随机变量,每一个变量在总体中都有每一个变量在总体中都有N种选择,中选机会相等,概率都是种选择,中选机会相等,概率都是1/N。即:即:12()()()nE xE xE xX 121()()()()nE xE xE xE xn11XXXnXXnn2023-8-11第七章 抽样估计20根据方差的定义和它的数学性质,不重复抽样平均误差的计根据方差的定义和它的数学性质,不重复抽样平均误差

19、的计算公式可按其定义推导如下:算公式可按其定义推导如下:2222()()xxE xE xE xX212nxxxEXn21221()()()nExXxXxXn(1)2211()()()n nniijiijExXxXxXn(1)2211()()()n nniijiijE xXE xXxXn22101()niXn2221()()XnXnn2023-8-11第七章 抽样估计21所以平均数的抽样平均误差为:所以平均数的抽样平均误差为:其中:其中:22211()()()NiikkE xXxXXN()()ijE xXxX11()()NNikjlklxXxX110()()NNikjlklxXxX2xnnxn式

20、中:式中:表示平均数的抽样平均误差;表示平均数的抽样平均误差;表示总体标准差;表示总体标准差;表示样本容量。表示样本容量。2023-8-11第七章 抽样估计22重复抽样平均误差计算公式的特性:重复抽样平均误差计算公式的特性:从抽样平均误差的计算公式可以看出:从抽样平均误差的计算公式可以看出:1.抽样平均误差的大小和总体标准差成正比,而与样抽样平均误差的大小和总体标准差成正比,而与样本容量的平方根成反比变化;本容量的平方根成反比变化;2.抽样平均误差比总体标准差小,仅为总体标准差的抽样平均误差比总体标准差小,仅为总体标准差的1/n2023-8-11第七章 抽样估计23(二)不重复抽样平均数的抽样

21、平均误差(二)不重复抽样平均数的抽样平均误差定义公式为:定义公式为:2()xxXM定义公式导出的计算公式:定义公式导出的计算公式:21xNnnN当当N较大时,有较大时,有:21xnnN2023-8-11第七章 抽样估计24不重复抽样平均误差计算公式的推导:不重复抽样平均误差计算公式的推导:设总体变量为设总体变量为X1,X2,XN,样本变量为,样本变量为x1,x2,xn,根据平均数的定义和它的数学性质,有:根据平均数的定义和它的数学性质,有:12()nxxxE xEn121()()()nE xE xE xn在不重复抽样条件下,由于在不重复抽样条件下,由于x1,x2,xn不是相互独立的,不是相互独

22、立的,其中其中x1 是抽取的第是抽取的第1个变量,它可以在个变量,它可以在x1,x2,xn 中选择,而总体中每中选择,而总体中每个单位中选的概率都为个单位中选的概率都为1/N,因此:,因此:11()E xXXN2023-8-11第七章 抽样估计25 x2 是抽取的第是抽取的第2个变量,它可以在个变量,它可以在N 1个总体单位中选择,而个总体单位中选择,而N 1个总体单位的组合可以有个总体单位的组合可以有N种选择,所以总体中每个单位中选的概率种选择,所以总体中每个单位中选的概率还是都为还是都为1/N,即:,即:21111()NE xXXXNNN依此类推:依此类推:3121112()NNE xXX

23、XNNNN 121111()nNNE xXXXNNNnN2023-8-11第七章 抽样估计26所以有:所以有:121()()()()nE xE xE xE xn11XXXnXXnn按照抽样平均误差的定义:按照抽样平均误差的定义:2222()()xxE xE xE xX212nxxxEXn21221()()()nExXxXxXn(1)2211()()()n nniijiijE xXE xXxXn2023-8-11第七章 抽样估计27由于在不重复抽样条件下,样本变量由于在不重复抽样条件下,样本变量x不是互相独立的,不是互相独立的,因此共有因此共有n(n 1)项的)项的 2()iE xX()()ij

24、E xXxX和和的讨论的讨论:0()()ijE xXxX22211()()()NiikkE xXxXXN(1)11()()()()()N Nijikjlk lE xXxXxXxXN N式中:k、l=1,2,N。2023-8-11第七章 抽样估计28又由于又由于:2(1)211()()()()N NNNikikikjlkkk lxXxXxXxX(1)2210()()()()N NNikjlikk lkxXxXxXNX 2211()()()()()ijNXXE xXxXN NN所以所以:可得:可得:(1)22211()()()n nniijxiijE xXE xXxXn222221111()()(

25、)()xXXNnnXn nnNnN21xNnnN2023-8-11第七章 抽样估计29(三)成数的抽样平均误差(三)成数的抽样平均误差成数的方差为:成数的方差为:在重复抽样条件下,成数的抽样平均误差为在重复抽样条件下,成数的抽样平均误差为:或21()pPP1()pPPn在不重复抽样条件下,成数的抽样平均误差为在不重复抽样条件下,成数的抽样平均误差为:11()pPPNnnN11()pPPnnN2023-8-11第七章 抽样估计30例例7 1 假设总体有假设总体有3个单位个单位A、B、C,它们的某标志值分别为,它们的某标志值分别为3、5、7,样本容量为样本容量为2个单位,个单位,试计算在重复抽样条

26、件下和不重复抽样条件下的抽试计算在重复抽样条件下和不重复抽样条件下的抽样平均误差。样平均误差。重复抽样重复抽样不重复抽样不重复抽样样本样本样本样本ixixxx2()xX2()xX合计合计合计合计AAABACBABBBCCACBCCABACBABCCACB3、33、53、75、35、55、77、37、57、7 3、53、75、3 5、77、37、5 345456567 4 5 4 6 5 6 4 1 0 1 0 1 0 1 412 1 0 1 1 0 1 4本例本例N=3,n=2,易知,总体变量的平均数为,易知,总体变量的平均数为5,样本平均数的平均也等于,样本平均数的平均也等于5,即:,即:5

27、xX重复抽样与不重复抽样条件下的样本组合及计算表重复抽样与不重复抽样条件下的样本组合及计算表2023-8-11第七章 抽样估计31根据抽样平均误差的根据抽样平均误差的定义公式定义公式,重复抽样时有,重复抽样时有2121.15479()xxXM根据抽样平均误差的根据抽样平均误差的计算公式计算公式,重复抽样时有:,重复抽样时有:22222(35)(55)(75)833()XXN28 31.15472/xn两种方法计算结果是一样的。两种方法计算结果是一样的。2023-8-11第七章 抽样估计32不重复抽样时根据抽样平均误差的不重复抽样时根据抽样平均误差的定义公式定义公式,有,有不重复抽样时根据抽样平

28、均误差的不重复抽样时根据抽样平均误差的计算公式计算公式,有:,有:22222(35)(55)(75)833()XXN两种方法计算结果是一样的。两种方法计算结果是一样的。240.81656()xxXM28 3320.8165231/1xNnnN2023-8-11第七章 抽样估计33例例7 2 某大学调查学生某公共基础课程的学习情况,现采用不重复抽样的方法某大学调查学生某公共基础课程的学习情况,现采用不重复抽样的方法抽取了抽取了5%的学生组成一个的学生组成一个200人的样本。对样本的统计结果为:平均成绩为人的样本。对样本的统计结果为:平均成绩为75分,标准差为分,标准差为17分;及格率为分;及格率

29、为90%。试计算平均成绩和及格率的抽样平均误差。试计算平均成绩和及格率的抽样平均误差。本例采用样本方差代替总体方差,现分别计算如下:本例采用样本方差代替总体方差,现分别计算如下:2217115%1.17200()xxsnnN(分)(分)10.9 10.915%2.07%200()()1()pppnnN2023-8-11第七章 抽样估计34 (一)无偏性(一)无偏性 无偏性标准就是要求在总体中所有可能抽取的样本统计量的平无偏性标准就是要求在总体中所有可能抽取的样本统计量的平均数应等于被估计的总体参数。均数应等于被估计的总体参数。(二)一致性(二)一致性 一致性标准就是要求当样本容量充分大时,样本

30、统计量也充分一致性标准就是要求当样本容量充分大时,样本统计量也充分靠近总体参数。靠近总体参数。(三)有效性(三)有效性 有效性标准就是要求作为优良估计量的方差应该比其他估计量有效性标准就是要求作为优良估计量的方差应该比其他估计量的方差小。的方差小。2023-8-11第七章 抽样估计35 点估计点估计又称定值估计,它是直接以样本统计量作为相应总体参数又称定值估计,它是直接以样本统计量作为相应总体参数的估计量。例如,用样本平均数的实际值直接估计总体平均数,用样的估计量。例如,用样本平均数的实际值直接估计总体平均数,用样本成数的实际值直接估计总体成数等。本成数的实际值直接估计总体成数等。在抽样调查中

31、,我们所抽取样本的结构与总体结构应该是一致的,在抽样调查中,我们所抽取样本的结构与总体结构应该是一致的,样本统计量的计算方法与总体参数的计算方法是相同的,只是总体参样本统计量的计算方法与总体参数的计算方法是相同的,只是总体参数未知,要用样本统计量来估计它。无论从总体中抽取一个什么样的数未知,要用样本统计量来估计它。无论从总体中抽取一个什么样的样本,用它的统计量来估计总体参数必然会有误差。样本,用它的统计量来估计总体参数必然会有误差。但只要这个统计量符合无偏性、一致性和有效性三个标准,我们但只要这个统计量符合无偏性、一致性和有效性三个标准,我们仍然可以认为它是优良估计。仍然可以认为它是优良估计。

32、2023-8-11第七章 抽样估计36例例7 3 某地对股民的资金帐户余额及盈亏情况进行调查,现按随机原则抽某地对股民的资金帐户余额及盈亏情况进行调查,现按随机原则抽取了一个取了一个100人的样本,对样本的调查结果是:资金帐户平均余额为人的样本,对样本的调查结果是:资金帐户平均余额为10万元,万元,盈利股民比重为盈利股民比重为30%。试对该地全部股民的资金帐户平均余额和盈利股民比。试对该地全部股民的资金帐户平均余额和盈利股民比重进行点估计。重进行点估计。进行点估计就是直接用样本统计量估计总体参数:进行点估计就是直接用样本统计量估计总体参数:(万元)(万元)即该地全部股民的资金帐户平均余额为即该

33、地全部股民的资金帐户平均余额为10万元,万元,即盈利股民比重为即盈利股民比重为30%。点估计的优点:在于它能提供对于总体参数一个确定的估计值。点估计的优点:在于它能提供对于总体参数一个确定的估计值。点估计的不足:是这个确定的估计值有多大的误差是未知的。点估计的不足:是这个确定的估计值有多大的误差是未知的。10Xx30%Pp2023-8-11第七章 抽样估计37 我们沿用例我们沿用例7 3的资料。的资料。假如我们不是直接用样本统计量资金帐户平均余假如我们不是直接用样本统计量资金帐户平均余额额10万元来估计总体参数,而是给定一个区间,采用万元来估计总体参数,而是给定一个区间,采用10万元左右万元左

34、右这么一个幅度来估计该地全部股民的资金这么一个幅度来估计该地全部股民的资金帐户平均余额,就可以计算出相应的帐户平均余额,就可以计算出相应的可靠性程度可靠性程度。(一)允许误差范围与估计区间(一)允许误差范围与估计区间 2023-8-11第七章 抽样估计38例如,我们在例如,我们在10万元的左右都放宽万元的左右都放宽2万元,万元,即允许误差范围为即允许误差范围为 2万元,从而可以形成一个估计区间万元,从而可以形成一个估计区间812万元,如下图所示:万元,如下图所示:X下限xX上限x 10 8 x 12 显然,平均数的抽样极限误差显然,平均数的抽样极限误差 为:为:xxXx2023-8-11第七章

35、 抽样估计39估计区间的上限和下限分别为:估计区间的上限和下限分别为:xXx上限xXx下限综合起来,总体平均数的估计区间为:综合起来,总体平均数的估计区间为:xxXxx显然,本例有显然,本例有:8(万元)(万元)12(万元)(万元)X 2023-8-11第七章 抽样估计40对于成数,根据例对于成数,根据例7 3的资料,若不是用样本统计量盈利股民比的资料,若不是用样本统计量盈利股民比重重30%来直接估计该地全部股民的盈利股民比重,而是给定一个来直接估计该地全部股民的盈利股民比重,而是给定一个允许误差范围允许误差范围2%。如估计区间为。如估计区间为28%32%,如下图所示:,如下图所示:则成数的抽

36、样极限误差可表达为:则成数的抽样极限误差可表达为:P下限pP上限ppPp估计区间为估计区间为:ppppP本例有:本例有:28%32%P 30%28%32%p2023-8-11第七章 抽样估计41引例:引例:若总体有若总体有3个单位个单位A、B、C,其变量值分别为,其变量值分别为3、5、7,样本容量为,样本容量为2,所有样本平均数的分布状况为:,所有样本平均数的分布状况为:样本平均数样本平均数3 4 5 6 71 2 3 2 1x次数次数 概率概率 fff1929391929由概率的完备性原理,有:由概率的完备性原理,有:12321199999fPf(二)区间估计的基本公式(二)区间估计的基本公

37、式样本平均数的分布样本平均数的分布 2023-8-11第七章 抽样估计421.对称性,近似正态分布;对称性,近似正态分布;2.样本平均数的分布中心就是总体平均数。样本平均数的分布中心就是总体平均数。所有样本平均数的分布特点:所有样本平均数的分布特点:35753X 3 1 4 25 36 27 159x xX本例有:本例有:即:即:2023-8-11第七章 抽样估计43现在我们引申出正态分布理论。在大样本的条件下,样本平现在我们引申出正态分布理论。在大样本的条件下,样本平均数的分布接近于正态分布均数的分布接近于正态分布:68.27%95.45%99.73%x()xXix正态概率分布图正态概率分布

38、图2023-8-11第七章 抽样估计44168.27%()F t例如:例如:分布中心两侧各一个单位的标准差所限定的区间,分布中心两侧各一个单位的标准差所限定的区间,对应的概率为对应的概率为68.27%;分布中心两侧各二个单位的标准差所限定的区间,分布中心两侧各二个单位的标准差所限定的区间,对应的概率为对应的概率为95.45%;分布中心两侧各三个单位的标准差所限定的区间,分布中心两侧各三个单位的标准差所限定的区间,对应的概率为对应的概率为99.73%。可表达为:可表达为:295.45%()F t399.73%()F t式中:式中:F(t)表示估计区间的概率;)表示估计区间的概率;t 表示概率度。

39、表示概率度。根据正态分布理论:根据正态分布理论:无论一组变量的平均数和标准差大小如何,分布中心两侧以无论一组变量的平均数和标准差大小如何,分布中心两侧以标准差为单位标准差为单位度量的区间与这一区间的概率是一一对应的。度量的区间与这一区间的概率是一一对应的。2023-8-11第七章 抽样估计45概率度又是一个确定估计区间的度量值。概率度又是一个确定估计区间的度量值。抽样平均误差抽样平均误差 是样本平均数的标准差,以是样本平均数的标准差,以 为单位,若给定为单位,若给定一个区间一个区间,则可以表达为,则可以表达为有有 t 个个 那么宽。那么宽。xxt ppt 概率度与区间估计的基本公式概率度与区间

40、估计的基本公式概率度是测量估计可靠性程度的一个参数。概率度是测量估计可靠性程度的一个参数。概率度概率度 t 的大小与概率的大小是一一对应的,可通过给定的的大小与概率的大小是一一对应的,可通过给定的 t 值,查阅值,查阅“正态分布概率表正态分布概率表”,查得相应的概率。,查得相应的概率。由此可得总体平均数和成数区间估计的基本公式:由此可得总体平均数和成数区间估计的基本公式:例如,在总体中随机抽到了某个样本,其平均数为例如,在总体中随机抽到了某个样本,其平均数为 ,若它,若它落在分布中心落在分布中心 右侧右侧2个个 宽度的位置,宽度的位置,则其对应的概率则其对应的概率为为47.725%,即:,即:

41、2023-8-11第七章 抽样估计46Xix(iP xX)(ixxP x47.725%)X(iP Xx)(xP X47.725%)ixx 虽然分布中心是总体平均数,但其数值大小是未知的。因虽然分布中心是总体平均数,但其数值大小是未知的。因此,该样本平均数也有可能落在分布中心左侧此,该样本平均数也有可能落在分布中心左侧2个个 宽度的宽度的位置,则其对应的概率也为位置,则其对应的概率也为47.725%,即:,即:2023-8-11第七章 抽样估计47(iPxX)(ixxP x)ixx X一般可表达为:一般可表达为:(iPxX)(xP xX(xP xt()F tX考虑到对称性,综合有:考虑到对称性,

42、综合有:47.725%47.725%95.45%)xt)xxt2023-8-11第七章 抽样估计48(三)区间估计的方法(三)区间估计的方法 总体参数区间估计的三要素包括样本统计量、抽样允许误差总体参数区间估计的三要素包括样本统计量、抽样允许误差范围,以及概率保证程度(置信度)。范围,以及概率保证程度(置信度)。样本统计量样本统计量由抽取样本获得;由抽取样本获得;抽样误差范围抽样误差范围决定了估计的准确性;决定了估计的准确性;概率保证程度概率保证程度则决定了估计的可靠性。则决定了估计的可靠性。在已知样本统计量的情况下,抽样估计时只能对其中的一个在已知样本统计量的情况下,抽样估计时只能对其中的一

43、个要素提出要求。如果要对两个要素都要提出一定的要求,只能通要素提出要求。如果要对两个要素都要提出一定的要求,只能通过增加样本容量来解决。过增加样本容量来解决。1.区间估计应具备的三要素区间估计应具备的三要素 2023-8-11第七章 抽样估计49 (1)在一定的样本条件下,给定概率保证程度,在一定的样本条件下,给定概率保证程度,计算抽样极限误差;计算抽样极限误差;(2)在一定的样本条件下,给定抽样极限误差,)在一定的样本条件下,给定抽样极限误差,计算概率保证程度;计算概率保证程度;(3)给定抽样极限误差和概率保证程度,推算出)给定抽样极限误差和概率保证程度,推算出样本容量。样本容量。总体参数区

44、间估计的方法总体参数区间估计的方法2023-8-11第七章 抽样估计502.给定概率保证程度求抽样极限误差给定概率保证程度求抽样极限误差 给定概率保证程度求抽样极限误差,就是根据给定概率保证程度求抽样极限误差,就是根据区间估计的基本公式:区间估计的基本公式:在已知在已知 t、的条件下,求的条件下,求 。下面我们通过举例来说明具体计算步骤。下面我们通过举例来说明具体计算步骤。t 2023-8-11第七章 抽样估计51例例7 4 某镇对居民人均月生活费支出进行抽样调查,在全镇某镇对居民人均月生活费支出进行抽样调查,在全镇10万户居万户居民中用不重复抽样方法随机抽取了一个民中用不重复抽样方法随机抽取

45、了一个630户的样本,抽查资料如下表户的样本,抽查资料如下表所列,试以所列,试以95%(t=1.96)的置信度对该地人均月生活费支出进行区)的置信度对该地人均月生活费支出进行区间估计。间估计。某地居民人均生活费支出抽查资料某地居民人均生活费支出抽查资料 人均月生活费支出人均月生活费支出 (元)(元)组中值(元)组中值(元)x户数(户)户数(户)f x f2()xxf300以下以下300400400500500600600700700800800900900以上以上 250350450550650750850950 合计合计 12 55 92 117 134 106 85 29 6301 696

46、 782.734 190 590.852 850 763.60 676 325.63 76 991.161 629 067.464 263 817.683 043 740.27 3 000 19 250 41 400 64 350 87 100 79 500 72 250 27 550 394 40018 428 079.382023-8-11第七章 抽样估计52第一步,第一步,计算样本平均数和方差:计算样本平均数和方差:394 400626.03630 xfxf2218 428 079.3829 250.92630()sxxff(元)(元)第二步,第二步,计算抽样平均误差:计算抽样平均误差:

47、229 250.926.81630 xsn2023-8-11第七章 抽样估计53第三步,第三步,计算抽样极限误差:计算抽样极限误差:(元)(元)第四步,第四步,计算估计区间的限和下限:计算估计区间的限和下限:1.96 6.8113.35xxt626.03 13.35639.38xx 上限=626.03 13.35612.68xx 下限=即在即在95%的概率保证程度下,估计该地居民人均月生活费支出的概率保证程度下,估计该地居民人均月生活费支出在在612.68639.38元之间。元之间。估计精度=1 误差率 1xx 13.35112.13%97.87%626.03 (元)(元)(元)(元)2023

48、-8-11第七章 抽样估计54第一步,第一步,计算成数和方差:计算成数和方差:第二步,第二步,计算抽样平均误差:计算抽样平均误差:例例7 5 根据例根据例7 4的资料,试以的资料,试以95%(t=1.96)的可靠)的可靠性程度,对该地居民人均月生活费支出在性程度,对该地居民人均月生活费支出在500元以下的户元以下的户数比重进行区间估计。数比重进行区间估计。112559225.24%630npn0.2524(10.2524)0.1887(1)pp0.18871.73%630(1)pppn2023-8-11第七章 抽样估计55第三步,第三步,计算抽样极限误差:计算抽样极限误差:第四步,第四步,计算

49、估计区间的限和下限:计算估计区间的限和下限:即在即在95%的概率保证程度下,该地居民人均月生活费支出在的概率保证程度下,该地居民人均月生活费支出在500元元以下户数比重的估计区间为以下户数比重的估计区间为21.85%28.63%。1.96 1.73%3.39%ppt25.24%3.39%28.63%pp上限=25.24%3.39%21.85%pp下限=2023-8-11第七章 抽样估计563.给定抽样极限误差求概率保证程度给定抽样极限误差求概率保证程度 给定抽样极限误差求概率保证程度,就是根据区间估计的给定抽样极限误差求概率保证程度,就是根据区间估计的基本公式:基本公式:在已知在已知 、的条件

50、下,求的条件下,求 t,然后根据,然后根据t 查表得概率保查表得概率保证程度。证程度。下面我们通过举例来说明具体计算步骤。下面我们通过举例来说明具体计算步骤。t 2023-8-11第七章 抽样估计57例例7 6 根据例根据例7 4的资料,若允许误差范围为的资料,若允许误差范围为16元,试对元,试对该地居民人均月生活费支出进行区间估计,并通过计算概率该地居民人均月生活费支出进行区间估计,并通过计算概率度和查阅概率表,求出可靠性程度。度和查阅概率表,求出可靠性程度。626.03x6.81x第三步,第三步,计算估计区间的限和下限:计算估计区间的限和下限:626.03 16642.03xx 上限=62

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(数学抽样估计课件.pptx)为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|