抽样误差的概率度课件.ppt

上传人(卖家):三亚风情 文档编号:2911225 上传时间:2022-06-10 格式:PPT 页数:84 大小:1.90MB
下载 相关 举报
抽样误差的概率度课件.ppt_第1页
第1页 / 共84页
抽样误差的概率度课件.ppt_第2页
第2页 / 共84页
抽样误差的概率度课件.ppt_第3页
第3页 / 共84页
抽样误差的概率度课件.ppt_第4页
第4页 / 共84页
抽样误差的概率度课件.ppt_第5页
第5页 / 共84页
点击查看更多>>
资源描述

1、抽样估计在统计方法中的地位抽样估计在统计方法中的地位统计方法统计方法描述统计描述统计推断统计推断统计抽样理论抽样理论假设检验假设检验参数估计参数估计概率理论概率理论回归分析回归分析第一节第一节 抽样调查的意义及基本概念抽样调查的意义及基本概念 一、抽样调查的意义一、抽样调查的意义一一般所讲的抽样调查,即指狭义的抽样调般所讲的抽样调查,即指狭义的抽样调查查( (随机抽样随机抽样) ):按照随机原则按照随机原则从总体中抽取一从总体中抽取一部分单位进行观察,并运用数理统计的原理,部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,以被抽取的那部分单位的数量特征为代表,对对总

2、体作出数量上的推断分析。总体作出数量上的推断分析。二、抽样调查的特点二、抽样调查的特点 1、只抽取总体中的一部分单位作样本进行调查;、只抽取总体中的一部分单位作样本进行调查; 2、它是由样本的指标数值去推断总体的指标数值;、它是由样本的指标数值去推断总体的指标数值; 3、抽选样本单位时要遵循随机原则;、抽选样本单位时要遵循随机原则; 4、抽样推断会产生抽样误差,抽样误差可以计、抽样推断会产生抽样误差,抽样误差可以计 算、并且可以事先加以控制。算、并且可以事先加以控制。 登登记记误误差差系系统统性性误误差差统统计计误误差差代代表表性性误误差差实实际际误误差差随随机机误误差差抽抽样样平平均均误误差

3、差 登记性误差登记性误差也叫调查误差或工作误差,是指在调查登记、汇总计算过程中发生的误差(应设法避免)。 代表性误差代表性误差这是指用部分单位的统计数据去推算总体数据时所产生的误差(即样本不足以代表总体产生的误差)。(随意)(随意)三、抽样调查的适用范围三、抽样调查的适用范围 抽抽样调查方法是市场经济国家在调样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用具有准确度高、成本低、速度快、应用面广等优点。面广等优点。1.1.实实际工作不可能进行全面调查观察,而又需要了解际工作不可能进行全面调查观察,而又需要了解其全面

4、资料的事物;其全面资料的事物;2.2.虽虽可进行全面调查观察,但比较困难或并不必要;可进行全面调查观察,但比较困难或并不必要;3.3.对对普查或全面调查统计资料的质量进行检查和修正;普查或全面调查统计资料的质量进行检查和修正;4.4.抽抽样方法适用于对大量现象的观察,即组成事物样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;总体的单位数量较多的情况;5.5.利利用抽样推断的方法,可以对于某种总体的假设用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。进行检验,判断这种假设的真伪,以决定取舍。一般适用于以下范围:一般适用于以下范围: 第二节第二节

5、 抽样推断的基本概念及理论依据抽样推断的基本概念及理论依据一、全及总体和样本总体一、全及总体和样本总体( (总体和样本总体和样本) )全全及总体及总体:它是指所要研究对象的全体它是指所要研究对象的全体 。 总体单位数用总体单位数用N N表示。表示。样本样本总体总体:是从全及总体中随机抽选出来、是从全及总体中随机抽选出来、 代表全及总体接受调查的那部分代表全及总体接受调查的那部分 单位的集合体。单位的集合体。 样本总体的单位数用样本总体的单位数用n n表示。表示。 n 30 n 30 大样本大样本 n 30 n 30 小样本小样本 二、总体指标和样本指标二、总体指标和样本指标总体总体指标:反映总

6、体数量特征的综合指标,又称总体指标:反映总体数量特征的综合指标,又称总体参数。(唯一)参数。(唯一)样本样本指标:反映样本数量特征的综合指标,又称样本指标:反映样本数量特征的综合指标,又称样本统计量。(随机)统计量。(随机)抽样推断:抽样推断:就是用已知的样本指标,对总体指就是用已知的样本指标,对总体指标及其变化范围进行科学的估计和推算。标及其变化范围进行科学的估计和推算。 成数的概念成数的概念 若总体单位的某种标志只有两种表现,若总体单位的某种标志只有两种表现,总体成数总体成数是指具是指具有某种特征和属性的单位在全部总体单位重所占比重。记为有某种特征和属性的单位在全部总体单位重所占比重。记为

7、p。 以以 代表个总体单位中具有某种特征的单位数,代表个总体单位中具有某种特征的单位数, 代表代表总体单位中不具有某种特征的单位数,总体单位中不具有某种特征的单位数,N=N1+N0。有。有1N0NNNP1 从总体中随机抽出容量为从总体中随机抽出容量为n的样本,具有某的样本,具有某种特征的单位数为种特征的单位数为 n1,则,则样本的成数:样本的成数: 。 例如,某工厂生产某种电子元件,某批产品例如,某工厂生产某种电子元件,某批产品共共10000件,其中不合格品件,其中不合格品100件,则不合格品所占件,则不合格品所占的成数的成数 。若从中按随机的原则抽。若从中按随机的原则抽100件,其中件,其中

8、有有3件不合格品,则样本的成数为件不合格品,则样本的成数为 。nnp1%1P%3p指标名称指标名称 参数参数 统计量统计量 平平 均均 数数成成 数数 N1/N p n1/n = 1P q = 1p方方 平均数方差 差差 成数方差 2 = P(1- P) s2 = p(1p) 总体指标和样本指标的比照总体指标和样本指标的比照NXXFXFXnxxfxfxF2F)-(21f)(s22fxx三、抽样方式及其可能的样本数目三、抽样方式及其可能的样本数目1、抽样方式、抽样方式 考虑顺序 重复抽样 不考虑顺序 不重复抽样 2、样本的可能数目、样本的可能数目(1)考虑顺序考虑顺序的的不重复抽样不重复抽样样本

9、数目样本数目 AnN=N(N1)(N2)(Nn1)N!/(N-n)!(2)考虑顺序考虑顺序的的重复抽样重复抽样样本数目()样本数目() BnNNn(3)不考虑顺序不考虑顺序的的不重复抽样不重复抽样样本数目()样本数目()CnNN(N1)(N2) )(N Nn n1 1)/n! /n! )!( !nNnN(4)不考虑顺序的重复抽样样本数目)不考虑顺序的重复抽样样本数目 DnNCnNn1 )!1( !)!1(NnnN3、抽样推断的理论依据、抽样推断的理论依据 (1)大数定律大数定律 。 大数法则论证了抽样平均数趋近于总体平均大数法则论证了抽样平均数趋近于总体平均数的趋势,这为抽样推断提供了重要的依

10、据。但数的趋势,这为抽样推断提供了重要的依据。但是,抽样平均数和总体平均数的离差究竟有多大?是,抽样平均数和总体平均数的离差究竟有多大?离差不超过一定范围的概率究竟有多少?这个离离差不超过一定范围的概率究竟有多少?这个离差的分布怎样?这个问题要利用另一重要定理差的分布怎样?这个问题要利用另一重要定理即中心极限定理来研究。即中心极限定理来研究。1)(limnXpxiN (2)中心极限定律中心极限定律 中心极限定理是研究随机变量和的分布序列中心极限定理是研究随机变量和的分布序列的极限定理,的极限定理,论证:论证:如果总体变量存在有限的如果总体变量存在有限的平均数和方差,那么,平均数和方差,那么,不

11、论这个总体变量的分不论这个总体变量的分布如何,随着抽样单位数(样本容量布如何,随着抽样单位数(样本容量n)的增加)的增加,抽样平均数的分布便趋近于正态分布。抽样平均数的分布便趋近于正态分布。这个结这个结论对于抽样推断是十分重要的,因为在经济现论对于抽样推断是十分重要的,因为在经济现象中变量和的分布是普遍存在的。象中变量和的分布是普遍存在的。 1(0,1)niinnXN1/1(0,1)niinXnN 第三节第三节 抽样误差抽样误差 一、抽样误差的概念及其影响程度一、抽样误差的概念及其影响程度抽样误差抽样误差是指样本统计量和总体参数之间数量上是指样本统计量和总体参数之间数量上的差别。以数学符号表示

12、,即为:的差别。以数学符号表示,即为: 、 pP 。注意不是样本个体与总体之间的差别。注意不是样本个体与总体之间的差别。xiX 抽样误差的理解:抽样误差的理解: 抽样误差是指由于抽样的随机性而产生的那一部分代表抽样误差是指由于抽样的随机性而产生的那一部分代表性误差性误差; 随机误差有两种:实际误差和抽样平均误差。随机误差有两种:实际误差和抽样平均误差。 二、抽样平均误差二、抽样平均误差1、抽样平均误差的概念、抽样平均误差的概念 抽样平均误差是指抽样平均数(或成数)的抽样平均误差是指抽样平均数(或成数)的标准差。即它反映了抽样指标与总体参数的平均标准差。即它反映了抽样指标与总体参数的平均离差程度

13、。通常用离差程度。通常用表示(样本统计量与总体参表示(样本统计量与总体参数间的数间的标准差标准差)。)。 KXxi)2( xXpP抽抽样样误误差差就就是是指指样样本本指指标标和和总总体体指指标标之之间间数数量量上上的的差差别别,即即、。抽样平均误差抽样平均误差是所有可能出现的样本指标的标准是所有可能出现的样本指标的标准差。差。它是由于抽样的随机性而产生的样本指标与它是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。总体指标之间的平均离差。 抽样实际误差是无法知道的,而抽样平均误差是可以计算的。在讨论抽样误差时,一般指的是抽样平均误差。抽样误差与抽样平均误差的区别抽样误差与抽样平均误差

14、的区别 :2、抽样平均误差的实际计算、抽样平均误差的实际计算(中心极限定理的启发)(中心极限定理的启发)推断指标重复抽样不重复抽样平均数成数nx )1 (2Nnnxnp)1 ( )1 (1 (Nnnp取得取得的途径有:的途径有: 1.1.用用过去全面调查或抽样调查的资料,若同时有过去全面调查或抽样调查的资料,若同时有n n个个的资料,应选用数值较大的那个;的资料,应选用数值较大的那个;2.2. 用用样本标准差样本标准差S S代替全及标准差代替全及标准差;3. 3. 在在大规模调查前,先搞个小规模的试验性的调查来大规模调查前,先搞个小规模的试验性的调查来确定确定S S,代替,代替;x2202()

15、100小时 某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(设为重复抽样),根据以往资料:=20小时,根据以往资料,产品质量不太稳定,若=200小时,)(20 1002002小时则:x例例%1374. 1)150001501 (150)98. 01 (98. 0)1 ()1 ( %14. 1150)98. 01 (98. 0)1 (%98150147 150 15000NnnppnpppnNpp若按不重复抽样方式: 某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方式从中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这

16、批印花玻璃杯合格率(成数)的抽样平均误差。例例三、影响抽样平均误差的因素:三、影响抽样平均误差的因素: 1. 1. 全全及总体标志变异程度及总体标志变异程度正比关系正比关系2. 2. 抽抽样单位数目的多少样单位数目的多少反比关系反比关系3. 3. 抽抽样方式样方式4. 4. 抽抽样调查的组织形式样调查的组织形式(一)抽样极限误差(一)抽样极限误差抽样极限误差抽样极限误差是指用绝对数形式表示的样本是指用绝对数形式表示的样本指标与总体指标偏差的可允许的最大范围。指标与总体指标偏差的可允许的最大范围。 x 设 与 分别表示抽样平均数与抽样成数的抽样极限误差,则有: xxXx四、抽样误差范围及其可靠程

17、度四、抽样误差范围及其可靠程度 将上式变换,可得: xXxXppPpP将上式再作变换,可得:xxxXxpppPp二、抽样误差的概率度二、抽样误差的概率度t与置信度与置信度F(t) 基于理论上的要求,抽样极限误差需要用抽样平均误差x 或p为标准单位来衡量。即把极限误差 或px相应除以 x 或 p ,得出相对的误差程度t 倍,t被称之为抽样误差的概率度抽样误差的概率度。 xxt或ppt 于是,有xtppt 抽样误差的概率度(抽样误差的概率度(t)是计量估计可靠程度)是计量估计可靠程度的一个参数;抽样估计的置信度的一个参数;抽样估计的置信度F(t)是表明样本是表明样本统计量和总体参数的误差不超过一定

18、范围的概统计量和总体参数的误差不超过一定范围的概率保证程度。二者的关系是:率保证程度。二者的关系是:概率度越大,表明抽样误差范围越大,则概率度越大,表明抽样误差范围越大,则概率保证程度(置信度)越大;反之,概率度概率保证程度(置信度)越大;反之,概率度越小,表明抽样误差范围越小,则概率保证程越小,表明抽样误差范围越小,则概率保证程度(置信度)越小。度(置信度)越小。 在大样本(n30)条件下,样本平均数的分布接近于正态分布,这时可根据概率度t和置信度F(t)的对应函数关系通过正态分布概率表互相查找。参数估计参数估计就是用样本统计量去推断总体的参数。第四节第四节 参数估计参数估计 估计量:用于估

19、计总体参数的随机变量如样本均值,样本比例、样本方差等例如: 样本均值就是总体均值的一个估计量参数用 表示,估计量用 表示估计值:估计参数时计算出来的统计量的具体值如果样本均值 x =80,则80就是的估计值估计量与估计值 (estimator & estimated value)估计量的优良性准则(无偏性)无偏性:无偏性:估计量的数学期望等于被估计的总体参数。用数学式表示为:问题: 是总体平均值的无偏估计量吗?x估计量的优良性准则(有效性)有效性:一个有效性:一个方差方差较小的无偏估计量称为一个更有效的估计量较小的无偏估计量称为一个更有效的估计量。如下图。如下图:与其他估计量相比,样本均值是一

20、个度量总体均值的与其他估计量相比,样本均值是一个度量总体均值的更有效的估计量更有效的估计量估计量的优良性准则(一致性)一致性:随着样本容量的增大,估计量越来越接近被估计的总体参数如果一估计量是一致的,则采用大样本更可靠,否则会不必要的浪费。参数估计的方法参数估计的方法一一、总体参数的点估计总体参数的点估计二二、总体参数的区间估计总体参数的区间估计点估计(概念要点)点估计(概念要点)1.从总体中抽取一个样本,根据该样本的统计量对总体的从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计未知参数作出一个数值点的估计l 例如例如: 用样本均值用样本均值作为作为总体未知均值的估

21、计值就是总体未知均值的估计值就是一个点估计一个点估计2.点估计没有给出估计值点估计没有给出估计值接近总体未知参数程度的信息接近总体未知参数程度的信息3.点估计的方法有矩估计法、顺序统计量法、最大似然法、点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等最小二乘法等100 x 1002p98%X 1002P98% 在在全全部部产产品品中中,抽抽取取件件进进行行仔仔细细检检查查,得得到到平平均均重重量量克克,合合格格率率,我我们们直直接接推推断断全全部部产产品品的的平平均均重重量量克克,合合格格率率。总体参数的区间估计1. 置信区间包含总体参数真值的次数所占的比例称为置信区间包含总体参

22、数真值的次数所占的比例称为置信置信度(置信水平)(度(置信水平)( 1-a )* 例如例如:为了估计总体的平均值,我们抽取了为了估计总体的平均值,我们抽取了100个样本,个样本,必然能得到必然能得到100个区间,置信水平说的是在这个区间,置信水平说的是在这100个个区间中,包含总体平均值的区间有(区间中,包含总体平均值的区间有(1-a)%,有有a%不包含总体平均值!不包含总体平均值!*所以并不是所有的置信区间都包括待估计的总体参数!所以并不是所有的置信区间都包括待估计的总体参数!*所以置信区间是一个随机区间所以置信区间是一个随机区间2. 常用的置信度有常用的置信度有 99%, 95%, 90%

23、相应的显著性水平相应的显著性水平 为为0.01,0.05,0.10X1. 由样本统计量所构造的总体参数的估计区间称为置由样本统计量所构造的总体参数的估计区间称为置信区间。信区间。2. 统计学家在某种程度上确信这个区间会包含真正的统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为总体参数,所以给它取名为置信区间置信区间。3. 用一个具体的样本所构造的区间是一个特定的区间,用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体我们无法知道这个样本所产生的区间是否包含总体参数的真值参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间我们只

24、能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个中的一个落在总体均值某一区间内的样本落在总体均值某一区间内的样本 抽样极限误差的实际意义是要求被估计的全抽样极限误差的实际意义是要求被估计的全及指标及指标 或或 P P 落在抽样指标一定范围内,即落落在抽样指标一定范围内,即落在在 或或 的范围内。的范围内。 置信度决定抽样推断的可靠性,置信区间大置信度决定抽样推断的可靠性,置信区间大小决定抽样推断的准确性,两者是一对矛盾体。小决定抽样推断的准确性,两者是一对矛盾体。Xxx pp 点区间估计与区

25、间估计的关点区间估计与区间估计的关系系在点估计的基础上,给出总体参数估计的一个区间范围,在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差该区间由样本统计量加减抽样误差(极限误差极限误差)而得到的而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量的接近程度给出一个概率度量比如,某班级平均分数在比如,某班级平均分数在7585之间,置信水平是之间,置信水平是95% ( (三)总体参数(全及指标)的推断方法三)总体参数(全及指标)的推断方法 区间估计的一般步骤:区间估计的一般步骤:确定抽

26、样指标;计算抽样平均误差;根据给定的概率置信度查表得到概率度;计算抽样极限误差;然后再利用样本指标求出要估计的总体指标的上、下限;根据给出的概率保证程度进行总体指标的区间估计。xxppF(t)xX xpP p()() t 在在概概率率的的保保证证下下:即即:全全及及平平均均数数 成成数数抽抽样样平平均均数数 成成数数区间估计的最终结果:区间估计的最终结果:已知抽样误差范围,求概率保证度已知抽样误差范围,求概率保证度 对某型号的电子元件进行耐用性能重复抽样检查,对某型号的电子元件进行耐用性能重复抽样检查,抽查的资料分组列表如下,要求耐用时数的允许误差范抽查的资料分组列表如下,要求耐用时数的允许误

27、差范围围x=10.5x=10.5小时,试估计该批电子元件的平均耐用时数小时,试估计该批电子元件的平均耐用时数及其可能性。及其可能性。已知抽样误差范围,求概率保证度已知抽样误差范围,求概率保证度(应用应用)例例1 1 解题思路 根据tx,由于10.5=t*s/10,因此概率度t=10.5/5.191=2.02。查正态分布表得F(2.02)=0.9566。已知给定的置信度要求,已知给定的置信度要求,推算极限误差的可能范围推算极限误差的可能范围 最后,根据概率度最后,根据概率度t t和抽样平均误差来推算抽样极限误和抽样平均误差来推算抽样极限误差的可能范围,再根据抽样极差求出被估计总体措标的差的可能范

28、围,再根据抽样极差求出被估计总体措标的上下限,对总体参数作区间估计。上下限,对总体参数作区间估计。)403.57( 100003)99.73%(t (3)402.38( 100002)95.45%(t 千克亩产量的可能范围为:亩小麦的平均保证,该农场若以概率千克亩产量的可能范围为:亩小麦的平均保证,该农场若以概率千克43.39619.1340062.39719.12400)2()(19.1)100001001(10012)1()1(22XxXNnnxx 某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩

29、产量为400千克,样本标准差为12千克。则: 例例1 1pp380p100%95%400P(1P)95%(195%)1.09%n40095.45%Pp95%21.09% 92.82% 97.18% 在概率的保证下,全及一级品率: 某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率: 例例2 2某电子产品使用寿命在3000小时以下为不合格品。现在用简单随机抽样方法从5000各产品中抽取100个对其使用寿命进行调查。结果如下:使用

30、寿命(小时)使用寿命(小时) 产品数量(个)产品数量(个)f x xf xf x xf xx (xx (xx)x)2 2f f 30003000以下以下 2 2500 5000 2 2500 5000 -1840 6771200 -1840 6771200 300030004000 30 3500 4000 30 3500 105000 -840 21168000 105000 -840 21168000 40005000 50 4500 225000 160 1280000 5000以上以上 18 5500 99000 1160 24220800 合计合计 100 _ 434000 _ 53

31、440000 要求:.按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差; .按重复抽样和不重复抽样计算该产品合格率的抽样平均误差; .根据重复抽样计算的抽样平均误差,以68.27的概率保证程度对该产品平均使用寿命和合格率进行区间估计。例例3 3解:由样本资料计算得出: 样本平均数 4340(小时) 样本标准差 731.03(小时) 样本合格率 0.9898 (1)平均寿命的抽样平均误差: 重复抽样 x 73.1(小时)不重复抽样 x =72.37(小时)(2)样本合格率的抽样平均误差 重复抽样 p 0.014不重复抽样 p 0.01386xn)1(2Nnnnpp)1()1 ()1 (Nn

32、npp(3)区间估计 F(t)=68.27% t=1tx =73.1(小时)平均寿命的置信区间: 下限: 434073.14266.9(小时) 上限: + 434073.14413.1(小时)合格率的置信区间: 下限: p0.980.0140.966 上限: p0.980.0140.994 即以68.27的概率保证程度估计该产品的平均使用寿命约在4266.94413.1小时之间,合格率在96.699.4之间。xxxx总体总量指标的推断总体总量指标的推断总体平均数总体平均数( (成数成数) )总体单位数总体单位数= =总体标志总量总体标志总量1.1.如如果采用点估计方法:上例果采用点估计方法:上

33、例1 1中:中:40040010000=400(10000=400(万千克万千克) ) 如果用区间估计方法:上例如果用区间估计方法:上例1 1中该农场小麦总产量的范围为:中该农场小麦总产量的范围为: t=2: (397.62 t=2: (397.62 402.38)402.38)10000=397.62 10000=397.62 402.38(402.38(万千克万千克) ) t=3: (396.43 t=3: (396.43 403.57)403.57)10000=396.43 10000=396.43 403.57(403.57(万千克万千克) ) 2.2.上上例例2 2中,全部一级品数量

34、的范围为:中,全部一级品数量的范围为: (92.82% (92.82% 97.18%)97.18%)8000=7425.68000=7425.6 7774.4(7774.4(件件) )对总体总量指标的推算对总体总量指标的推算 必要样本容量的确定必要样本容量的确定一、确定必要样本容量的意义一、确定必要样本容量的意义过大:成本过高过大:成本过高过小:准确度低过小:准确度低二、确定必要样本容量的原则:二、确定必要样本容量的原则:在保证抽样推断能达到预期的在保证抽样推断能达到预期的可靠程度可靠程度和和精确程度精确程度的要求下,确定一个恰当的样本的要求下,确定一个恰当的样本容量数目。容量数目。 简单随机

35、抽样简单随机抽样三、必要样本容量的计算公式三、必要样本容量的计算公式: 重重复复抽抽样样222t n 22t P(1P)n 不不重重复复抽抽样样:22222Nt nNt 222N P(1P)tnNt P(1P) 建筑工地打土方工人4000人,需测定平均每人工作量,要求误差范围不超过0.2M3,并需有99.73%保证程度。根据过去资料=1.5,在不重复抽样条件下,求样本数应是多少?)(1344)5 . 1 (34000) 1 . 0(4000)5 . 1 (3 )1 . 0(21 )(450)5 . 1 (34000)2 . 0(4000)5 . 1 (3 5 . 132 . 04000 222

36、2232222222222人则,保证程度不变即若误差范围缩小人,解:nMtNNtntN例例1 1)(8267 .825)9 . 01 (9 . 0210000)02. 0(10000)9 . 01 (9 . 02 P)-P(1tP)N-P(1tn )(900)02. 0()9 . 01 (9 . 02P)-P(1tn )2( %45.95)( %2%9010000 22222p2222p2支在不重复抽样条件下:支在重复抽样条件下:,解:NttFPNp某金笔厂月产10000支金笔,以前多次抽样调查一等品率为90%,现在要求误差范围在2%之内,可靠程度达95.45%,问必须抽取多少单位数?例例2

37、2例例3 3某鞋厂对某种类型的鞋子进行耐穿时间的抽样检验,经过二次小型抽样检验,结果知道标准差是18天与20天,试问在抽样平均误差为1天(概率为0.9011)的要求下,至少应抽查多少双鞋子?已知: 181 202 1 651. t解:12 2 应取)(.双400651206512222222 tn即至少应抽查即至少应抽查400400双鞋子双鞋子 某市质量技术监督部门拟对市场上某类牛奶制品的质量(合格率)进行检查,要求在95%的可靠性之下(t=1.96),合格率的误差范围不超过1%。根据最近三次同类检查,这类产品的合格率分别为98.9%、98.2%、97.8%。问至少应该抽多少件产品进行检验?若

38、允许误差扩大1倍,则应该抽取多少件进行检验? 已知t=1.96,p=1%, P=97.8%件2077 .20602. 0022. 0978. 096. 1)1 (2222pPPtn件样本容量8276 .82601. 0022. 0978. 096. 1)1 (2222pPPtn例例4 4当允许误差扩大1倍时,即p=2%,于是样本容量:四、影响必要样本容量的因素四、影响必要样本容量的因素21. P(1P)() 体体各各单单位位的的标标志志变变异异程程度度,即即或或的的大大小小 正正比比总总2. () 许许误误差差 的的大大小小 反反比比允允3. t()率率度度 的的数数值值 正正比比概概4. 样

39、样方方式式和和组组织织形形式式抽抽 第六节第六节 抽样方案设计抽样方案设计 一、抽样方案设计的一、抽样方案设计的基本原则基本原则 1、保证实现抽样随机性的原则、保证实现抽样随机性的原则因为随机性是概率抽样的基础,只有保证了抽样随机性原则,才能应用概率论的原理对总体作出正确的判断。2、保证实现最大的抽样效果原则、保证实现最大的抽样效果原则就是如何以较少的费用支出取得一定准确程度的数据。准确度(精度)与置信度是矛盾的。二、抽样组织方式二、抽样组织方式常用的抽样组织方式有: 简单随机抽样 类型抽样 等距抽样 整群抽样 多阶段抽样、简单随机抽样、简单随机抽样( (纯随机抽样纯随机抽样) )即对总体单位

40、不加任何分组、排队,完全按照即对总体单位不加任何分组、排队,完全按照随机原则直接从总体中抽取调查单位(样本)。随机原则直接从总体中抽取调查单位(样本)。随机抽选可有各种不同的具体做法,如:随机抽选可有各种不同的具体做法,如:(1 1)直接抽选法)直接抽选法(2 2)抽签法)抽签法(3 3)随机数码表法)随机数码表法简单随机抽样的简单随机抽样的适用情形适用情形对调查对象的情况很少了解;总体单位的排列没有秩序;抽到的单位比较分散时也不影响调查工作。 2 2、类型抽样、类型抽样( (分类抽样分类抽样) )先对总体各单位按一定标志加以分先对总体各单位按一定标志加以分类类( (层层) ),然后再从各类,

41、然后再从各类( (层层) )中按随机中按随机原则抽取样本,组成一个总的样本。原则抽取样本,组成一个总的样本。 类型抽样的作用:类型抽样的作用:一一是利用已知的信息提高抽样效率;是利用已知的信息提高抽样效率;二二是抽样的组织工作比较方便;是抽样的组织工作比较方便;三三是利于深入了解总体中各个子总体的情况。是利于深入了解总体中各个子总体的情况。类型抽样的好处是:类型抽样的好处是:样样本代表性高、抽样误差小、抽样调本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的查成本较低。如果抽样误差的要求相同的话则抽样数目可以减少。话则抽样数目可以减少。两种类型:两种类型:(1)(1)等等比例类

42、型抽样比例类型抽样( (类型比例抽样类型比例抽样) );(2)(2)不不等比例类型抽样等比例类型抽样( (类型适宜抽样类型适宜抽样) )。3 3、机械抽样、机械抽样( (等距抽样等距抽样) )先先将全及总体的所有单位按某一将全及总体的所有单位按某一标志顺序排队,然后按相等的距离标志顺序排队,然后按相等的距离抽取样本单位。抽取样本单位。机械抽样机械抽样,实际上是一种特殊的类,实际上是一种特殊的类型抽样。因为,如果在类型抽样中,把型抽样。因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只总体划分为若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽抽一个样本,在这种情况下,则类型抽

43、样就成了机械抽样。样就成了机械抽样。机械抽样按排队所依据的标志不同机械抽样按排队所依据的标志不同, ,分:分:(1) (1) 选选择标志与抽样调查所研究内容无关,择标志与抽样调查所研究内容无关, 称无关标志排队。称无关标志排队。(2) (2) 选选择标志与抽样调查所研究的内容有择标志与抽样调查所研究的内容有关,关, 称有关标志排队。称有关标志排队。研究工人的平均收入水平时,按工号排队。研究工人的平均收入水平时,按工号排队。例例研究工人的生活水平,按工人月工资额高研究工人的生活水平,按工人月工资额高低排队。低排队。例例 机械抽样按样本单位抽选的方法不同,机械抽样按样本单位抽选的方法不同,可分为二

44、种:可分为二种:(1)(1)随随机起点等距抽样机起点等距抽样k k k k+a 2k+a (n-1)k+aak(k为抽取间隔)示意图:示意图:(2)(2)半半距起点等距抽样距起点等距抽样k k kk(k为抽取间隔)2k2kk 22kk 2) 1(kkn示意图:示意图:机械抽样的好处:机械抽样的好处: 可可以使抽样过程大大简化,减轻抽样的以使抽样过程大大简化,减轻抽样的工作量;工作量; 如如果用有关标志排队,还可以缩小抽样果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。误差,提高抽样推断效果。4 4、整群抽样、整群抽样 整群抽样整群抽样即从全及总体中成群地抽取样本即从全及总体中成群地抽取

45、样本单位,对抽中的群内的所有单位都进行观察。单位,对抽中的群内的所有单位都进行观察。整群抽样的作用:整群抽样的作用: 当总体缺乏包括全部总体单位的抽样框当总体缺乏包括全部总体单位的抽样框, , 无法进行抽选时需采用整群抽样无法进行抽选时需采用整群抽样; ; 比较方便和节约费用比较方便和节约费用. .5 5、多阶段抽样、多阶段抽样 即把抽样本单位的过程分为两个或两个以即把抽样本单位的过程分为两个或两个以上阶段来进行上阶段来进行。(如果一次就直接抽选出具体样(如果一次就直接抽选出具体样本单位,这叫单阶段抽样)本单位,这叫单阶段抽样) 具体讲:具体讲: 先抽大单位先抽大单位( (可以用类型抽样或机械

46、抽样可以用类型抽样或机械抽样) ), 再在大单位中抽小单位再在大单位中抽小单位( (可用整群抽样或简单随机可用整群抽样或简单随机抽样抽样) ),小单位中再抽更小的单位;而不是一次就,小单位中再抽更小的单位;而不是一次就直接抽取基层的调查单位。直接抽取基层的调查单位。作业1.某地三种商品销售情况如下:某地三种商品销售情况如下:试根据上述资料计算:试根据上述资料计算:(1)销售量总指数及因销售量变动而增减的销售额;)销售量总指数及因销售量变动而增减的销售额;(2)销售价格总指数及因销售价格变动而增减的销售额;)销售价格总指数及因销售价格变动而增减的销售额;(3)销售额指数及销售额增减总额;)销售额

47、指数及销售额增减总额;(4)从相对数和绝对数两方面验证销量、销价和销售额三个指数)从相对数和绝对数两方面验证销量、销价和销售额三个指数 的相互关系。的相互关系。2.2010年和年和2009年,某省社会商品总额分别是年,某省社会商品总额分别是1851.36亿元和亿元和1371.02亿元,全省零售物价亿元,全省零售物价2010年年比比2009年下降年下降1.2%。请据此计算:。请据此计算:(1)2010年比年比2009年该省因零售价格变动而增减的年该省因零售价格变动而增减的零售额;零售额;(2)2010年比年比2009年该省社会商品零售量总指数及年该省社会商品零售量总指数及因零售量变动而增减的零售

48、额;因零售量变动而增减的零售额;(3)从相对数和绝对性方面验证零售价格、零售量和)从相对数和绝对性方面验证零售价格、零售量和零售额三个指数的相互关系。零售额三个指数的相互关系。3.某灯管厂生产某灯管厂生产10万只日光灯管,先采取简单随机不重复抽样方式万只日光灯管,先采取简单随机不重复抽样方式抽取抽取1灯管进行质量检验,测试结果如下:灯管进行质量检验,测试结果如下:(1)计算抽样总体灯管的平均耐用时间;)计算抽样总体灯管的平均耐用时间;(2)在)在99.73%的概率保证程度下,估计的概率保证程度下,估计10万只灯管平均耐用时间的万只灯管平均耐用时间的区间范围;区间范围;(3)按质量规定,凡耐用时间不及)按质量规定,凡耐用时间不及800小时的灯管为不合格品,试计小时的灯管为不合格品,试计算抽样总体灯管的合格率,并按算抽样总体灯管的合格率,并按95.45%的概率保证程度,估计的概率保证程度,估计10万只灯管的合格率区间范围;万只灯管的合格率区间范围;(4)若上述条件不变,只是抽样极限误差放宽到)若上述条件不变,只是抽样极限误差放宽到40小时,在小时,在99.73%的概率保证程度下,作下一次抽样调查,需抽多少只灯管检验?的概率保证程度下,作下一次抽样调查,需抽多少只灯管检验?

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(抽样误差的概率度课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|