第5章-抽样分布与参数估计教学课件.ppt

上传人(卖家):晟晟文业 文档编号:5177606 上传时间:2023-02-16 格式:PPT 页数:83 大小:1.79MB
下载 相关 举报
第5章-抽样分布与参数估计教学课件.ppt_第1页
第1页 / 共83页
第5章-抽样分布与参数估计教学课件.ppt_第2页
第2页 / 共83页
第5章-抽样分布与参数估计教学课件.ppt_第3页
第3页 / 共83页
第5章-抽样分布与参数估计教学课件.ppt_第4页
第4页 / 共83页
第5章-抽样分布与参数估计教学课件.ppt_第5页
第5页 / 共83页
点击查看更多>>
资源描述

1、第五章第五章抽样分布与参数估计抽样分布与参数估计5-2第五章第五章 抽样分布与参数估计抽样分布与参数估计 n第一节第一节 抽样的基本概念与数学原理抽样的基本概念与数学原理 n第二节第二节 抽样分布抽样分布 n第三节第三节 参数估计参数估计n第四节第四节 样本容量的确定样本容量的确定 n第五节第五节 EXCEL在参数估计中的应用在参数估计中的应用 5-3第一节第一节 抽样的基本概念与数学原理抽样的基本概念与数学原理一、有关抽样的基本概念一、有关抽样的基本概念二、大数定理与中心极限定理二、大数定理与中心极限定理5-4一、有关抽样的基本概念一、有关抽样的基本概念(一)样本容量与样本个数(一)样本容量

2、与样本个数 1.样本容量样本容量。样本是从总体中抽出的部分单位。样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用的集合,这个集合的大小称为样本容量,一般用n表示,它表明一个样本中所包含的单位数。表示,它表明一个样本中所包含的单位数。一般地,样本单位数大于一般地,样本单位数大于30个的样本称为大个的样本称为大样本,不超过样本,不超过30个的样本称为小样本。个的样本称为小样本。2.样本个数样本个数。样本个数又称样本可能数目,它。样本个数又称样本可能数目,它是指从一个总体中可能抽取多少个样本。是指从一个总体中可能抽取多少个样本。5-5(二)总体参数与样本统计量(二)总体参数与样

3、本统计量 1.总体参数总体参数。总体分布的数量特征就是总体的。总体分布的数量特征就是总体的参数,也是抽样统计推断的对象。参数,也是抽样统计推断的对象。常见的常见的总体总体参数有:总体的参数有:总体的平均数平均数指标,总指标,总体体成数成数(比例比例)指标,总体分布的指标,总体分布的方差方差、标准差标准差等等。等等。它们都是反映总体分布特征的重要指标。它们都是反映总体分布特征的重要指标。2.样本统计量样本统计量。样本统计量是样本的一个函数。样本统计量是样本的一个函数。它们是随机变量。我们利用统计量来估计和推断它们是随机变量。我们利用统计量来估计和推断总体的有关参数。总体的有关参数。常见的常见的样

4、本样本统计量有:样本统计量有:样本平均数平均数,样本,样本比比例例,样本的,样本的方差方差、标准差标准差。5-6(三)概率抽样及其组织形式(三)概率抽样及其组织形式 所谓所谓概率抽样概率抽样,就是要求对总体的每一次,就是要求对总体的每一次观察(每一次抽取)都是一次随机试验,并且有观察(每一次抽取)都是一次随机试验,并且有和总体相同的分布。按这样的要求对总体观测和总体相同的分布。按这样的要求对总体观测(抽取)(抽取)n次,可得到容量为次,可得到容量为n的样本。的样本。5-7 显然,(显然,(1)和()和(2)的抽取行为都不是随机)的抽取行为都不是随机试验。因而不属于概率抽样。只有(试验。因而不属

5、于概率抽样。只有(3)的抽取)的抽取行为是随机试验。总体的分布可用表行为是随机试验。总体的分布可用表5-1的分布列的分布列来描述,而(来描述,而(3)的随机试验中所观测的随机变)的随机试验中所观测的随机变量也有与表量也有与表5-1有相同的分布。所以,(有相同的分布。所以,(3)的抽)的抽取行为是概率抽样。取行为是概率抽样。5-8(四)放回抽样与不放回抽样(四)放回抽样与不放回抽样 1.放回抽样放回抽样。放回抽样的放回抽样的具体做法具体做法是:从总体中抽出一个样是:从总体中抽出一个样本单位,记录其标志值后,又将其放回总体中继续本单位,记录其标志值后,又将其放回总体中继续参加下一轮单位的抽取。参加

6、下一轮单位的抽取。放回抽样的放回抽样的特点特点是:是:一,一,n个单位的样本是由个单位的样本是由n次试验的结果构成的。次试验的结果构成的。二,每次试验是独立的,即其试验的结果与前次、二,每次试验是独立的,即其试验的结果与前次、后次的结果无关。后次的结果无关。三,每次试验是在相同条件下进行的,每个单位在三,每次试验是在相同条件下进行的,每个单位在多次试验中选中的机会多次试验中选中的机会(概率概率)是相同的。是相同的。在放回抽样中,样本可能的个数是在放回抽样中,样本可能的个数是 ,N为为总体单位数,总体单位数,n为样本容量。为样本容量。nN5-9 不放回抽样的不放回抽样的具体做法具体做法是:每次从

7、总体抽取一个单是:每次从总体抽取一个单位,记录其标志值后不放回原总体,不参加下一轮抽样。位,记录其标志值后不放回原总体,不参加下一轮抽样。下一次继续从总体中余下的单位中抽取。下一次继续从总体中余下的单位中抽取。不放回抽样的不放回抽样的特点特点是:是:一,一,n个单位的样本由个单位的样本由 n 次试验结果构成,但由于每次次试验结果构成,但由于每次抽出不放回,所以实质上相当于从总体中同时抽取抽出不放回,所以实质上相当于从总体中同时抽取n个个样本单位。样本单位。二,每次试验结果不是独立的,上次中选情况影响下次二,每次试验结果不是独立的,上次中选情况影响下次抽选结果。抽选结果。三,每个单位在多次三,每

8、个单位在多次(轮轮)试验中中选的机会是不等的。试验中中选的机会是不等的。不放回抽样,如果考虑顺序,其样本可能个数为不放回抽样,如果考虑顺序,其样本可能个数为 如果不考虑顺序,其样本可能个数为如果不考虑顺序,其样本可能个数为 5-10)!(!nNN 2.不放回抽样不放回抽样。!)!(!nnNN5-11(五)抽样分布(五)抽样分布 从总体中可以随机地抽取许多样本,由每一个从总体中可以随机地抽取许多样本,由每一个样本都可以计算样本统计量的观测值,所有可能的样本都可以计算样本统计量的观测值,所有可能的样本观测值及其所对应的概率便是所谓的样本观测值及其所对应的概率便是所谓的抽样分布抽样分布。因此,抽样分

9、布也可以称为样本统计量的因此,抽样分布也可以称为样本统计量的概率分布概率分布。抽样分布可能是精确地服从某种已知分布(所谓抽样分布可能是精确地服从某种已知分布(所谓已知分布,例如我们在第四章介绍过的各种常见分已知分布,例如我们在第四章介绍过的各种常见分布),也可能是以某种已知分布为极限分布。在实布),也可能是以某种已知分布为极限分布。在实际应用中,后者更为多见。际应用中,后者更为多见。5-125-135-14第第 二二 次次 抽抽 取取 可可 能能 被被 抽抽 中中 的的 人人 员员12345678910第第 一一 次次 抽抽 取取 可可 能能 被被 抽抽 中中 的的 人人 员员 11,1(1)

10、1,2(1.5)1,3(2)1,4(2.5)1,5(3)1,6(3.5)1,7(4)1,8(4.5)1,9(5)1,10(5.5)22,1(1.5)2,2(2)2,3(2.5)2,4(3)2,5(3.5)2,6(4)2,7(4.5)2,8(5)2,9(5.5)2,10(6)33,1(2)3,2(2.5)3,3(3)3,4(3.5)3,5(4)3,6(4.5)3,7(5)3,8(5.5)3,9(6)3,10(6.5)44,1(2.5)4,2(3)4,3(3.5)4,4(4)4,5(4.5)4,6(5)4,7(5.5)4,8(6)4,9(6.5)4,10(7)55,1(3)5,2(3.5)5,3(

11、4)5,4(4.5)5,5(5)5,6(5.5)5,7(6)5,8(6.5)5,9(7)5,10(7.5)66,1(3.5)6,2(4)6,3(4.5)6,4(5)6,5(5.5)6,6(6)6,7(6.5)6,8(7)6,9(7.5)6,10(8)77,1(4)7,2(4.5)7,3(5)7,4(5.5)7,5(6)7,6(6.5)7,7(7)7,8(7.5)7,9(8)7,10(8.5)88,1(4.5)8,2(5)8,3(5.5)8,4(6)8,5(6.5)8,6(7)8,7(7.5)8,8(8)8,9(8.5)8,10(9)99,1(5)9,2(5.5)9,3(6)9,4(6.5)9,

12、5(7)9,6(7.5)9,7(8)9,8(8.5)9,9(9)9,10(9.5)1010,1(5.5)10,2(6)10,3(6.5)10,4(7)10,5(7.5)10,6(8)10,7(8.5)10,8(9)10,9(9.5)10,10(10)表表5-310人中有放回抽二人的全部可能样本人中有放回抽二人的全部可能样本5-15 表表5-4任职年限样本均值分布数列任职年限样本均值分布数列5-165-17二、大数定理与中心极限定理二、大数定理与中心极限定理5-19 大数定理大数定理:尽管个别现象受偶然因素影:尽管个别现象受偶然因素影响,有各自不同的表现。但是,对总体的大量观响,有各自不同的表现

13、。但是,对总体的大量观察后进行平均,就能使偶然因素的影响相互抵消,察后进行平均,就能使偶然因素的影响相互抵消,消除由个别偶然因素引起的极端性影响,从而使消除由个别偶然因素引起的极端性影响,从而使总体平均数稳定下来,反映出事物变化的一般规总体平均数稳定下来,反映出事物变化的一般规律。律。5-205-21 从从正态分布的再生定理正态分布的再生定理可以可以:只要总体变只要总体变量服从正态分布,则从中抽取的样本,不管量服从正态分布,则从中抽取的样本,不管 n n 是是多少,样本平均数都服从正态分布。多少,样本平均数都服从正态分布。但是在客观实际中,总体并非都是正态分布。但是在客观实际中,总体并非都是正

14、态分布。对于从非正态分布的总体中抽取的样本平均数的分对于从非正态分布的总体中抽取的样本平均数的分布问题,需要由布问题,需要由中心极限定理中心极限定理来解决。来解决。5-225-235-24第二节第二节 抽样分布抽样分布一、样本平均数的抽样分布一、样本平均数的抽样分布二、样本比率的抽样分布二、样本比率的抽样分布5-25一、样本平均数的抽样分布一、样本平均数的抽样分布(一)样本平均数的期望值与方差(一)样本平均数的期望值与方差5-265-275-285-29(二)样本平均数的分布规律(二)样本平均数的分布规律5-305-315-32二、样本比率的抽样分布二、样本比率的抽样分布(一一)样本比率的期望

15、值与方差样本比率的期望值与方差5-335-345-355-36(二)样本比率的分布规律(二)样本比率的分布规律5-37表5-5 用正态分布来近似时对样本量的要求总 体参 数0.500.450.400.350.300.250.200.150.1010.500.550.600.650.700.750.800.850.90样本量至少为n36373840434857711005-38(三)样本方差的抽样分布(三)样本方差的抽样分布5-395-40第三节第三节 参数估计参数估计 一、参数估计概述一、参数估计概述二、总体均值的估计二、总体均值的估计三、总体比率的估计三、总体比率的估计四、总体方差的估计四、

16、总体方差的估计5-41一、参数估计概述一、参数估计概述(一)参数估计的定义与种类(一)参数估计的定义与种类 所谓所谓参数估计参数估计,就是用样本统计量去估计总,就是用样本统计量去估计总体的未知参数(或参数的函数)。例如,估计总体的未知参数(或参数的函数)。例如,估计总体均值,估计总体比率和总体方差等等。体均值,估计总体比率和总体方差等等。参数估计有参数估计有两种基本形式两种基本形式:点估计点估计和和区间估区间估计计。前者是用一个数值作为未知参数。前者是用一个数值作为未知参数的估计值,的估计值,后者则是给出具体的上限和下限,把后者则是给出具体的上限和下限,把 包括在这包括在这个区间内。下面分别介

17、绍点估计与区间估计的有个区间内。下面分别介绍点估计与区间估计的有关概念。关概念。5-42(二)点估计(二)点估计 点估计点估计,主要有,主要有矩估计法矩估计法和和最大似然估计法最大似然估计法。矩估计矩估计法是用样本矩去估计总体矩(或是用样法是用样本矩去估计总体矩(或是用样本矩的函数去估计总体矩的相应函数)的一种估计本矩的函数去估计总体矩的相应函数)的一种估计方法,由此获得的估计量称作矩估计量;方法,由此获得的估计量称作矩估计量;最大似然估计最大似然估计法是把待估计的总体参数看作一个法是把待估计的总体参数看作一个可以取不同数值的变量,计算当总体参数取上述不可以取不同数值的变量,计算当总体参数取上

18、述不同数值的时候,发生我们当前所得到的样本观测值同数值的时候,发生我们当前所得到的样本观测值的不同概率,总体参数取哪一个数值的时候这种概的不同概率,总体参数取哪一个数值的时候这种概率最大,便把这个数值作为对总体参数的估计结果。率最大,便把这个数值作为对总体参数的估计结果。5-43(三)估计量的优良标准(三)估计量的优良标准2.有效性有效性。又称最小方差性。又称最小方差性。5-44 4.充分性充分性。估计量包含了样本中关于。估计量包含了样本中关于的全部的全部信息。信息。5-45(四)区间估计与估计的精度和可靠性(四)区间估计与估计的精度和可靠性5-465-475-48二、总体均值的估计二、总体均

19、值的估计5-495-505-515-525-535-545-56(二)总体方差(二)总体方差2未知的情形未知的情形5-572.区间估计区间估计5-585-595-61 【例例5-8】在例在例5-7中,若总体方差未知,但通过抽中,若总体方差未知,但通过抽取的取的6个样本测得的样本方差为个样本测得的样本方差为0.0025,试在,试在0.95的置信度下,求该产品直径的均值置信区间。的置信度下,求该产品直径的均值置信区间。5-62三、总体比率的估计三、总体比率的估计5-63(二)区间估计(二)区间估计 由于总体的分布是由于总体的分布是0-1分布,只有在大样本的情况分布,只有在大样本的情况下,才服从正态

20、分布。总体比率可以看成是一种特殊下,才服从正态分布。总体比率可以看成是一种特殊的平均数,类似于总体均值的区间估计,总体比率的的平均数,类似于总体均值的区间估计,总体比率的区间估计是:区间估计是:5-64【例例5-9】在某市区随机调查了在某市区随机调查了300个居民户,其中个居民户,其中6户拥有等离子电视机。试求该区(按户计算的)等离户拥有等离子电视机。试求该区(按户计算的)等离子电视机拥有率的子电视机拥有率的0.95置信区间。置信区间。解:本例总体单位数解:本例总体单位数N很大,故采用放回抽样的有关很大,故采用放回抽样的有关公式计算。公式计算。n=300,p=0.02,n P=65,可以认为户

21、可以认为户数数n充分大,充分大,=0.05,。0.02521.96zz5-65四、总体方差的估计四、总体方差的估计5-66(二)区间估计(二)区间估计5-672(9)0.953.332(9)0.0516.92221122212(1)(1),nnnSnS9 9.2 9 9.2,(5.28,26.81)16.923.33【例例5-10】某公司生产一种健康食品,对每罐食品某公司生产一种健康食品,对每罐食品的重量有一定规定,不允许有过大的差异。设每罐的重量有一定规定,不允许有过大的差异。设每罐食品的重量服从正态分布。现从生产线上抽查了食品的重量服从正态分布。现从生产线上抽查了10个样本,求得其样本方差

22、为个样本,求得其样本方差为9.2,试对总体方差进行,试对总体方差进行置信度为置信度为0.90的区间估计。的区间估计。解:解:,置信度为置信度为0.90的置信区间为:的置信区间为:=5-68第四节第四节 样本容量的确定样本容量的确定一、问题的提出一、问题的提出二、估计总体均值时样本容量的确定二、估计总体均值时样本容量的确定三、估计总体比例时样本容量的确定三、估计总体比例时样本容量的确定四、使用上述公式应注意的问题四、使用上述公式应注意的问题5-69 由前面的论述,我们已知参数估计中的精度由前面的论述,我们已知参数估计中的精度要求与可靠性要求常常是一对矛盾,但是,通过要求与可靠性要求常常是一对矛盾

23、,但是,通过增加样本容量增加样本容量n有可能降低样本平均数的标准差,有可能降低样本平均数的标准差,从而实现既保证一定的估计精度,又具有较高的从而实现既保证一定的估计精度,又具有较高的置信度的目的。这时,需要考虑在给定的置信度置信度的目的。这时,需要考虑在给定的置信度与极限误差的前提下,样本容量与极限误差的前提下,样本容量n究竟取多大合究竟取多大合适?这就是所谓样本容量的确定问题。适?这就是所谓样本容量的确定问题。一、问题的提出一、问题的提出5-70二、估计总体均值时样本容量的确定二、估计总体均值时样本容量的确定5-715-725-73三、估计总体比率时样本容量的确定三、估计总体比率时样本容量的

24、确定5-74四、使用上述公式应注意的问题四、使用上述公式应注意的问题 1计算样本容量时,总体的方差与成数常常计算样本容量时,总体的方差与成数常常是未知的,这时可用有关资料替代:一是用历史资是未知的,这时可用有关资料替代:一是用历史资料已有的方差与成数代替;二是在进行正式抽样调料已有的方差与成数代替;二是在进行正式抽样调查前进行几次试验性调查,用试验中方差的最大值查前进行几次试验性调查,用试验中方差的最大值代替总体方差;三是比率方差在完全缺乏资料的情代替总体方差;三是比率方差在完全缺乏资料的情况下,就用比率方差的最大可能值况下,就用比率方差的最大可能值0.25代替。代替。2.如果进行一次抽样调查

25、,需要同时估计总体如果进行一次抽样调查,需要同时估计总体均值与比率,可用上面的公式同时计算出两个样本均值与比率,可用上面的公式同时计算出两个样本容量,取其中较大的结果,同时满足两方面的需要。容量,取其中较大的结果,同时满足两方面的需要。3.上面的公式计算结果如果带小数,这时样本上面的公式计算结果如果带小数,这时样本容量不按四舍五入法则取整数,取比这个数大的最容量不按四舍五入法则取整数,取比这个数大的最小整数代替。例如计算得到:小整数代替。例如计算得到:n=56.03,那么,样本,那么,样本容量取容量取57,而不是,而不是56。5-755-765-775-785-79第五节第五节 Excel在参

26、数估计中的应用在参数估计中的应用 【例例5-13】用用Excel完成本章思考与练习计算题的完成本章思考与练习计算题的第第1题。题。解:操作步骤如下。解:操作步骤如下。1构造工作表。如图构造工作表。如图5-3所示,所示,A、B列为原始列为原始输入数据,输入数据,A2:A16存放的是关于最大飞行速度存放的是关于最大飞行速度的数据,图中未完全显示出来。的数据,图中未完全显示出来。C、D列为计算列为计算结果,分别在结果,分别在C2、D2单元格存放置信下限和上单元格存放置信下限和上限。限。2定义变量名。将定义变量名。将A列命名为列命名为“x”,将,将B2单元单元格命名为格命名为“置信水平置信水平”。5-

27、80 3计算置信上、下限。计算置信上、下限。分别在分别在C2、D2中输入如下的公式:中输入如下的公式:=AVERAGE(x)-TINV(1-置信水平置信水平,COUNT(x)-1)*STDEV(x)/SQRT(COUNT(x)=AVERAGE(x)+TINV(1-置信水平置信水平,COUNT(x)-1)*STDEV(x)/SQRT(COUNT(x)5-81本章小结本章小结5-825-83 5 5所谓估计就是构造适当的样本统计量,来所谓估计就是构造适当的样本统计量,来充当总体参数的估计量。好的统计量的理想性质包充当总体参数的估计量。好的统计量的理想性质包括:无偏性、有效性、一致性和充分性。括:无偏性、有效性、一致性和充分性。6 6估计包括点估计与区间估计。估计包括点估计与区间估计。7 7在给定的置信度与极限误差的前提下,样在给定的置信度与极限误差的前提下,样本容量本容量n n可利用极限误差、临界值与抽样标准差三可利用极限误差、临界值与抽样标准差三者间的数量关系去计算。者间的数量关系去计算。8 8在在ExcelExcel中可使用各种函数按照有关公式实中可使用各种函数按照有关公式实现区间估计的运算。现区间估计的运算。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第5章-抽样分布与参数估计教学课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|