1、1统统 计计 学学 原原 理理 抽样推断抽样推断 2第四章第一节第四章第一节第一节第一节 抽样调查的意义抽样调查的意义一、抽样调查的概念一、抽样调查的概念广义抽样调查:凡是抽取一部分单位进行观察,并广义抽样调查:凡是抽取一部分单位进行观察,并根据观察结果来推断全体的都是抽样调查,可分为根据观察结果来推断全体的都是抽样调查,可分为随机抽样随机抽样和和非随机抽样非随机抽样两种。两种。狭义的抽样调查:仅指根据狭义的抽样调查:仅指根据大数定律和概率论大数定律和概率论的要的要求,求,随机抽样,随机抽样,保证总体中各个单位都有同样的机保证总体中各个单位都有同样的机会被抽中。会被抽中。概念:按照概念:按照随
2、机抽样随机抽样的原则从总体中抽取一部分单的原则从总体中抽取一部分单位进行观察,并运用位进行观察,并运用数理统计的原理数理统计的原理,以被抽取的,以被抽取的那部分单位的数量特征为代表,对总体作出数量上那部分单位的数量特征为代表,对总体作出数量上的推断分析。的推断分析。3第四章第一节第四章第一节 二、抽样调查的特点二、抽样调查的特点按随机原则抽取调查单位;按随机原则抽取调查单位;要抽取足够多的调查单位;要抽取足够多的调查单位;可从数量上推断总体可从数量上推断总体要运用概率估计的方法要运用概率估计的方法抽样调查中所产生的抽样误差可以事先计算抽样调查中所产生的抽样误差可以事先计算并加以控制。并加以控制
3、。基本原则基本原则基本目的及任务基本目的及任务科学性体现科学性体现4第四章第一节第四章第一节 三、抽样调查的使用范围三、抽样调查的使用范围有些事情在测量或实验时有破坏性,不可能进行有些事情在测量或实验时有破坏性,不可能进行全面调查全面调查有些总体从理论上讲可以进行全面调查,但是实有些总体从理论上讲可以进行全面调查,但是实际上办不到际上办不到和全面调查相比较,抽样调查能节省人力、费用和全面调查相比较,抽样调查能节省人力、费用和时间,而且比较灵活和时间,而且比较灵活在有些情况下,抽样调查的结果比全面调查要准在有些情况下,抽样调查的结果比全面调查要准确确用抽样调查的资料修正和补充全面调查资料用抽样调
4、查的资料修正和补充全面调查资料抽样调查方法可以用于工业生产过程中的质量控抽样调查方法可以用于工业生产过程中的质量控制制利用抽样推断的方法,可以对于某种总体的假设利用抽样推断的方法,可以对于某种总体的假设进行检验,来判断这种假设的真伪,以决定取舍进行检验,来判断这种假设的真伪,以决定取舍5第四章第一节第四章第一节 四、抽样估计的一般步骤四、抽样估计的一般步骤1、设计抽样方案、设计抽样方案2、抽取样本单位、抽取样本单位3、搜集样本资料、搜集样本资料4、整理样本资料、整理样本资料5、推断总体指标、推断总体指标6第四章第二节第四章第二节第二节第二节 调样调查的基本概念及理论依据调样调查的基本概念及理论
5、依据 一、全及总体和抽样总体(一、全及总体和抽样总体(教材没有教材没有)全及总体简称总体(全及总体简称总体(N):研究对象的全):研究对象的全体体(唯一确定)变量总体变量总体:各单位可用数量标志计量各单位可用数量标志计量 A 有限总体:变量值有限有限总体:变量值有限 B 无限总体:变量值无限,分为可列或连续无限总体:变量值无限,分为可列或连续 属性总体属性总体:各单位用品质标志描述:各单位用品质标志描述 7第四章第二节第四章第二节抽样总体,简称样本(抽样总体,简称样本(n):将从总体中抽将从总体中抽取的部分单位称为样本取的部分单位称为样本大样本:样本数达到或超过大样本:样本数达到或超过30小样
6、本:样本数在小样本:样本数在30以下以下 注意:对于全及总体单位数注意:对于全及总体单位数N来说,样本来说,样本n是是一个很小的数,它可以是一个很小的数,它可以是N的几十分之一,的几十分之一,几百分之一、几千分之一、几万分之一。几百分之一、几千分之一、几万分之一。8第四章第二节第四章第二节 二、全及指标和抽样指标二、全及指标和抽样指标全及指标(总体指标)全及指标(总体指标)定义:根据全及总体各个单位的标志值或标定义:根据全及总体各个单位的标志值或标志特征计算的,反映总体某种属性的综合指志特征计算的,反映总体某种属性的综合指标,称为全及指标(总体指标)。标,称为全及指标(总体指标)。9第四章第二
7、节第四章第二节全及指标的运用及计算全及指标的运用及计算 变量总体的平均数:变量总体的平均数:属性总体:计算结构相对指标,即总体成数,用属性总体:计算结构相对指标,即总体成数,用P表示,表明总体中具有某一属性的单位数占总体单表示,表明总体中具有某一属性的单位数占总体单位数的比重。位数的比重。设总体中有设总体中有N个单位,有个单位,有N1个单位具有某种属性,个单位具有某种属性,N0个单位不具有某种属性,个单位不具有某种属性,N1+N0=N,P为总体为总体中具有某种属性的单位数所占的比重,中具有某种属性的单位数所占的比重,Q为不具有为不具有某种属性的单位数所占的比重,则总体成数为:某种属性的单位数所
8、占的比重,则总体成数为:XXFXXNF或1NPN011NNNQPNN10第四章第四章 第二节第二节 属性总体的平均数属性总体的平均数成数成数 属性总体的平均数属性总体的平均数变量值变量值X频数频数F频率频率F/F具有某一属性具有某一属性不具有某一属性不具有某一属性10N1N0P=N1/N1-P=N0/N合计合计N110(1)FXXPPPF 11第四章第二节第四章第二节 变量总体标准差和总体方差,它们都是测量变量总体标准差和总体方差,它们都是测量总体标志值分散程度的指标总体标志值分散程度的指标 注意:总体的参数是一个确定的值注意:总体的参数是一个确定的值2222()()XXXXFNF或22()(
9、)XXXXfNf或12第四章第二节第四章第二节 属性总体的方差和标准差属性总体的方差和标准差注意:总体的统计量是一个确定的值注意:总体的统计量是一个确定的值2222()()(1)(0)(1)(1)XXFFXXFFPPPPPP(1)PP13第四章第二节第四章第二节抽样指标抽样指标 样本统计量样本统计量 定义:由抽样总体各个标志值或标志特征计算的综定义:由抽样总体各个标志值或标志特征计算的综合指标称为抽样指标合指标称为抽样指标抽样指标的运用及计算抽样指标的运用及计算 变量总体变量总体:属性总体:属性总体:设样本中有设样本中有n个单位,有个单位,有n1个单位具有某种属性,个单位具有某种属性,n0个单
10、位不具有某种属性,个单位不具有某种属性,n1+n0=n,p为总体中具为总体中具有某种属性的单位数所占的比重,有某种属性的单位数所占的比重,q为不具有某种为不具有某种属性的单位数所占的比重,则抽样成数为属性的单位数所占的比重,则抽样成数为 :xxfxxnf或1npn011nnnqpnn 14第四章第四章 第二节第二节 属性样本的平均数属性样本的平均数成数成数 属性样本的平均数属性样本的平均数变量值变量值x频数频数f频率频率f/f具有某一属性具有某一属性不具有某一属性不具有某一属性10n1n0p=n1/n1-p=n0/n合计合计n110(1)fxxpppf 15第四章第二节第四章第二节 样本标准差
11、样本标准差 和样本方差和样本方差 ,它们都是测量,它们都是测量样本标志值分散程度的指标样本标志值分散程度的指标 注意:样本统计量不含未知参数,它是随样注意:样本统计量不含未知参数,它是随样本不同而不同的随机变量(见教材本不同而不同的随机变量(见教材34页)页)S2S2222()()11xxxxfSSnf或2()1xxfSf16第四章第二节第四章第二节 属性样本的方差和标准差属性样本的方差和标准差 注意:样本统计量不含未知参数,它是随样注意:样本统计量不含未知参数,它是随样本不同而不同的随机变量本不同而不同的随机变量2222()()(1)(0)(1)(1)XXffSXXffpppppp(1)Sp
12、p17第四章第二节第四章第二节统计抽样过程统计抽样过程 根据样本的平均数、成数(也称比率)来推断总体的平根据样本的平均数、成数(也称比率)来推断总体的平均数,成数或所在的范围,只要总体的平均数或成数均数,成数或所在的范围,只要总体的平均数或成数掌握了,那么总体的标志总量也就可以推断出来。掌握了,那么总体的标志总量也就可以推断出来。总体总体N样本样本n,x p,X P(抽取方式方法)(抽取方式方法)计计算算抽抽样样指指标标推推断断总总量量指指标标(抽样估计)(抽样估计)(计算抽样误差)(计算抽样误差)18第四章第二节第四章第二节三、抽样方法和样本的可能数目三、抽样方法和样本的可能数目 样本的容量
13、(样本的容量(n)样本的可能数目样本的可能数目 抽样的方法抽样的方法 取样方式:重复、不重复取样方式:重复、不重复抽样的方法抽样的方法 对样本的要求:考虑顺序、不考对样本的要求:考虑顺序、不考 虑顺序虑顺序19第四章第二节第四章第二节考虑顺序的不重复抽样数目考虑顺序的不重复抽样数目考虑顺序的重复抽样数目考虑顺序的重复抽样数目不考虑顺序的不重复抽样数目不考虑顺序的不重复抽样数目不考虑顺序的重复抽样数目不考虑顺序的重复抽样数目!(1)(2).(1)()!nNNAN NNNnNnnnNBN(1)(2).(1)!()!nNN NNNnNCnn Nn1nnNNnDC 20第四章第二节第四章第二节四、抽样
14、调查的理论依据四、抽样调查的理论依据大数法则:随着抽样单位数大数法则:随着抽样单位数n的增加,抽样的增加,抽样平均数有接近总体平均数的趋势,几乎具有平均数有接近总体平均数的趋势,几乎具有实际的必然性。实际的必然性。中心极限定理:如果总体变量存在有限的平中心极限定理:如果总体变量存在有限的平均数和方差,则不论这个总体变量的分布如均数和方差,则不论这个总体变量的分布如何,随着抽样单位数何,随着抽样单位数n的增加,抽样平均数的增加,抽样平均数的分布便趋于正态分布。的分布便趋于正态分布。21五、抽样分布(教材五、抽样分布(教材98页)页)概念概念由样本由样本n个观察值计算的统计量个观察值计算的统计量的
15、概率分布。的概率分布。抽样分布的形式抽样分布的形式样本比率的抽样分布样本比率的抽样分布样本方差的抽样分布样本方差的抽样分布x22样本统计量样本统计量样本均值样本均值x样本比率样本比率p样本方差样本方差s2正态总体或非正态总体或非正态总体大正态总体大样本样本非正态总体非正态总体(小样本)(小样本)正态分布正态分布t分布分布大样本大样本正态分布正态分布分布分布223第四章第三节第四章第三节第三节第三节 抽样平均误差抽样平均误差(样本平均数的方差与标准差样本平均数的方差与标准差)一、抽样误差的概念一、抽样误差的概念是指样本指标和总体指标之间数量上的差别。是指样本指标和总体指标之间数量上的差别。统统计
16、计调调查查误误差差登记性误差登记性误差代表性误差代表性误差系统误差(偏差)系统误差(偏差)随机性误差随机性误差24第四章第三节1xX2xX1pP2pP随机误差随机误差实际误差实际误差 平均误差平均误差21()MiixxXuM21()niippPuM(指一个样本指标与总体指标之间的差别)(指一个样本指标与总体指标之间的差别)(指所有可能出现的样本指标的标准差,即所有实际误差的平均值)(指所有可能出现的样本指标的标准差,即所有实际误差的平均值)25第四章第三节第四章第三节二、抽样平均误差的意义二、抽样平均误差的意义抽样误差是一个随机变量;抽样误差是一个随机变量;抽样误差是反映抽样指标对全及指标代表
17、性程度;抽样误差是反映抽样指标对全及指标代表性程度;不能用一次抽样得到的抽样误差来衡量抽样指标对不能用一次抽样得到的抽样误差来衡量抽样指标对于全及指标的代表性大小;于全及指标的代表性大小;抽样平均误差概括地反映了所有可能抽样指标与全抽样平均误差概括地反映了所有可能抽样指标与全及指标之间的误差的一般水平。及指标之间的误差的一般水平。因此:抽样平均误差是实际可以运用于衡量抽样指标因此:抽样平均误差是实际可以运用于衡量抽样指标对于全及指标代表性程度的一个尺度;也是计算抽对于全及指标代表性程度的一个尺度;也是计算抽样指标与全及指标之间变异范围的一个根据。样指标与全及指标之间变异范围的一个根据。26第四
18、章第三节三、抽样平均误差的计算(三、抽样平均误差的计算(p103)1、原理公式:、原理公式:2、运用公式、运用公式A平均数的抽样平均误差平均数的抽样平均误差B成数的抽样平均误差成数的抽样平均误差21()MiixxXuM)(重复重复nux 或或)1(2 NnNnux)()1(2不重复不重复Nnnux )()1(重复重复nPPup )()1()1()1()1(不重复不重复或或NnnPPuNnNnpPupp 21()MiippPuM27第四章第三节第四章第三节注意:注意:在上述公式中,在上述公式中,或或 总体标准差,但是总体标准差,但是实际中这两个数据却是未知的。计算抽样平均误差实际中这两个数据却是
19、未知的。计算抽样平均误差时通常采用以下替代方法。时通常采用以下替代方法。1、用样本标准差替代总体标准差。大、用样本标准差替代总体标准差。大样本情况下,可样本情况下,可以直接用样本标准差以直接用样本标准差S代表代表总体标准差;在小样代表代表总体标准差;在小样本的情况下,则采用样本修正标准差本的情况下,则采用样本修正标准差 来代替。来代替。2、用以前(近期)的总体标准差或同类地区的总体标、用以前(近期)的总体标准差或同类地区的总体标准差来代表所研究的标准差。若同时有多个可供参准差来代表所研究的标准差。若同时有多个可供参考的数值时,应选择其中最大者。对于成数考的数值时,应选择其中最大者。对于成数P,
20、应选,应选最接近最接近0.5的比率。的比率。(1)PP*S*2()11SxixnSn n28第四章第三节第四章第三节四、影响抽样平均误差的因素四、影响抽样平均误差的因素1、全及总体标志的变动程度、全及总体标志的变动程度全及总体标志变动程度越大,抽样平均误差就越大;全及总体标志变动程度越大,抽样平均误差就越大;反之,全及总体标志变动程度越小,则抽样平均误差反之,全及总体标志变动程度越小,则抽样平均误差越小。两者成正比关系的变化。越小。两者成正比关系的变化。2、抽样单位数的多少、抽样单位数的多少在其他条件不变的情况下,抽取的单位数越多,抽样在其他条件不变的情况下,抽取的单位数越多,抽样平均误差越小
21、;样本单位数越少,抽样平均误差越大。平均误差越小;样本单位数越少,抽样平均误差越大。抽样平均误差的大小和样本单位数成相反关系的变化。抽样平均误差的大小和样本单位数成相反关系的变化。4、抽样方法(重复或者不重复)、抽样方法(重复或者不重复)3、抽样的组织方式、抽样的组织方式29第四章第三节例题:某冷库冻鸡平均每只重例题:某冷库冻鸡平均每只重12001200克,标准差克,标准差7070克,克,如果重复随机抽取如果重复随机抽取100100只和只和200200只,分别计算只,分别计算抽样平抽样平均误差。均误差。该该冷库冻鸡合格率为冷库冻鸡合格率为97%97%,如果重复随机抽取,如果重复随机抽取1001
22、00只只和和200200只,分别计算只,分别计算抽样平均误差。抽样平均误差。)(710070克克 nuxx)95420070(克克 xu%71100%)971%(971(nPPup)%21200%)971%(97 pu30第五章第三节第五章第三节例题:某灯泡厂对例题:某灯泡厂对10000个产品进行使用寿命检验,随个产品进行使用寿命检验,随机抽取机抽取2%样本进行测试,所得资料如下表:样本进行测试,所得资料如下表:按照质量规定,电灯泡使用寿命在按照质量规定,电灯泡使用寿命在1000小时以上的为合小时以上的为合格品,计算灯泡使用时间抽样平均误差和灯泡合格率的格品,计算灯泡使用时间抽样平均误差和灯泡
23、合格率的抽样平均误差?抽样平均误差?使用时间(小使用时间(小时)时)抽样检查电灯抽样检查电灯泡数(个)泡数(个)使用时间(小使用时间(小时)时)抽样检查电灯泡数抽样检查电灯泡数(个)(个)900以下以下9009509501000100010502411711050110011001150115012001200以上以上841873合计合计20031第四章第四节第四章第四节第四节全及指标的推断第四节全及指标的推断一、抽样推断要求(教材一、抽样推断要求(教材126页)页)1、无偏性、无偏性2、一致性、一致性3、有效性、有效性32第四章第四节第四章第四节二、抽样推断的方法二、抽样推断的方法(一)点估
24、计(一)点估计也叫定值估计(或直接估计),就是把样本平也叫定值估计(或直接估计),就是把样本平均数或样本成数直接作为总体平均数或总体均数或样本成数直接作为总体平均数或总体成数的估计值。成数的估计值。(二)区间估计(二)区间估计1、区间估计的意义、区间估计的意义在一定概率的保证下,用样本指标去推断总体在一定概率的保证下,用样本指标去推断总体指标,在考虑抽样误差的前提下,使得总体指标,在考虑抽样误差的前提下,使得总体指标落到某一范围之内,即根据抽样指标定指标落到某一范围之内,即根据抽样指标定出置信区间和置信度。出置信区间和置信度。33第四章第四节第四章第四节2、抽样极限误差、抽样极限误差概念:抽样
25、极限误差是指总体指标和抽样指标概念:抽样极限误差是指总体指标和抽样指标之间误差的可能范围。之间误差的可能范围。(1)抽样平均数的抽样极限误差)抽样平均数的抽样极限误差(2)抽样成数的抽样极限误差)抽样成数的抽样极限误差xxXppP 34第四章第四节第四章第四节总体范围的估计总体范围的估计若有了抽样极限误差,则总体平均数和总体若有了抽样极限误差,则总体平均数和总体成数的可能范围可以用下式估计:成数的可能范围可以用下式估计:(1)抽样平均数的范围)抽样平均数的范围(2)抽样成数的极限误差)抽样成数的极限误差xxxXxpppPp35第四章第四节第四章第四节例:要估计一批产品的合格率,从例:要估计一批
26、产品的合格率,从1000件产件产品中抽取品中抽取200件,其中有件,其中有10件不合格品,件不合格品,如果确定抽样极限误差的范围为如果确定抽样极限误差的范围为2%,试,试估计产品合格率的范围。估计产品合格率的范围。样本成数样本成数p=190/200=95%总体成数下限总体成数下限=95%-2%=93%总体成数上限总体成数上限=95+2%=97%即该产品合格率在即该产品合格率在93%97%之间。之间。36第四章第四节第四章第四节抽样极限误差与抽样平均误差的关系抽样极限误差与抽样平均误差的关系抽样极限误差通常用抽样平均误差的倍数表示,即抽样极限误差通常用抽样平均误差的倍数表示,即t称为概率度。称为
27、概率度。2ppZpptxxt或或2xxZ或或37第五章第四节第五章第四节3、可信程度、可信程度可信程度是表示估计的可靠程度可信程度是表示估计的可靠程度如果估计区间越大,则可靠程度越大;估计区间越小,则如果估计区间越大,则可靠程度越大;估计区间越小,则可靠程度越小。可靠程度越小。而估计区间又与抽样极限误差有关,在一定的抽样方式下,而估计区间又与抽样极限误差有关,在一定的抽样方式下,抽样极限误差又是由概率度抽样极限误差又是由概率度t决定的。因而可靠程度与决定的。因而可靠程度与t之间有一定正比关系。之间有一定正比关系。概率度概率度t与概率保证程度(可靠程度)之间的关系见下表。与概率保证程度(可靠程度
28、)之间的关系见下表。例:若概率为例:若概率为0.95,查表得,查表得t=1.96概率度概率度t误差范围()误差范围()概率概率F(t)概率度概率度t误差范围()误差范围()概率概率F(t)0.51.001.500.51.001.500.38290.68270.86641.962.003.001.962.003.000.95000.95450.99733839第四章第四节第四章第四节三、抽样推断三、抽样推断抽样推断的步骤如下:抽样推断的步骤如下:计算抽样平均误差计算抽样平均误差给定概率保证程度,查表得概率度给定概率保证程度,查表得概率度t计算抽样极限误差计算抽样极限误差估计总体指标区间估计总体指
29、标区间xxtxxxXx40第四章第四节第四章第四节接前面灯泡例题:接前面灯泡例题:灯泡样本平均使用时间灯泡样本平均使用时间 为为1057小时,合格率小时,合格率为为91.5%,重复抽样下,灯泡的使用时间抽样,重复抽样下,灯泡的使用时间抽样平均误差为平均误差为 小时,合格率的平均误差小时,合格率的平均误差为为 ,计算在不同概率保证下,平均,计算在不同概率保证下,平均数和成数的抽样极限误差?数和成数的抽样极限误差?当当t=1?当当t=2?当当t=3?x3.7922x1.972%p41第四章第五节第四章第五节第五节第五节 抽样方案设计抽样方案设计一、抽样方案设计的基本原则一、抽样方案设计的基本原则保
30、证实现抽样随机性的原则保证实现抽样随机性的原则(保证消除代表性误差中的偏差)(保证消除代表性误差中的偏差)保证实现最大的抽样效果原则保证实现最大的抽样效果原则 42注意:注意:调查费用取决很多因素,其中最重要的是调查费用取决很多因素,其中最重要的是抽抽样单位数目样单位数目,要确定适当的抽样单位数目,要确定适当的抽样单位数目,取决于抽样的取决于抽样的精度精度和和可靠性可靠性的要求;的要求;精度是指希望估计区间的长度越短越好,可精度是指希望估计区间的长度越短越好,可靠性是指估计区间包含参数的概率越大越好靠性是指估计区间包含参数的概率越大越好;在样本容量确定的条件下二者是在样本容量确定的条件下二者是
31、矛盾矛盾的,因的,因此抽样设计的原则是此抽样设计的原则是在一定的误差和可靠性在一定的误差和可靠性的要求下选择费用最少的样本设计。的要求下选择费用最少的样本设计。第四章第五节第四章第五节43第四章第五节第四章第五节二、简单随机抽样(既不分组也不排队)二、简单随机抽样(既不分组也不排队)简单随机抽样又称纯随机抽样,是按照随机简单随机抽样又称纯随机抽样,是按照随机的原则直接从的原则直接从N个总体单位中抽取个总体单位中抽取n个单位作个单位作为样本。为样本。注意:简单随机抽样最符合随机原则注意:简单随机抽样最符合随机原则 直接抽选法直接抽选法抽签法抽签法随机数码表法随机数码表法44第四章第五节第四章第五
32、节三、类型抽样三、类型抽样(分层抽样)类型抽样又称分类抽样,是先对总体各单位按一定类型抽样又称分类抽样,是先对总体各单位按一定标志加以分类,然后再从各类中按随机原则抽取样标志加以分类,然后再从各类中按随机原则抽取样本,由各类内的样本组成一个总样本。本,由各类内的样本组成一个总样本。将总体将总体N分成分成N1、N2、Nm,从从N1中抽取中抽取n1个单位、个单位、N2中抽取中抽取n2个单位、个单位、Nm中抽取中抽取nm个单位组成样本。个单位组成样本。总体单位数总体单位数N=N1+N2+Nm 样本单位数样本单位数n=n1+n2+nm注意:注意:在类型抽样的情况下,因为从各类型组都抽取了样本单在类型抽
33、样的情况下,因为从各类型组都抽取了样本单位,所以,对各类型组来说是全面调查,因此,组间方差是位,所以,对各类型组来说是全面调查,因此,组间方差是可以不考虑的。影响抽样误差的总方差是组内方差。可以不考虑的。影响抽样误差的总方差是组内方差。45第四章第五节第四章第五节四、机械抽样四、机械抽样机械抽样又称等距抽样,它是对总体按一定机械抽样又称等距抽样,它是对总体按一定的顺序排列,每隔一定的间隔抽取一个或若的顺序排列,每隔一定的间隔抽取一个或若干个单位,并把这些单位组成样本的一种抽干个单位,并把这些单位组成样本的一种抽样方法。样方法。等距抽样按排队的标志不同,分为无关标志等距抽样按排队的标志不同,分为
34、无关标志排队和有关标志排队的等距抽样排队和有关标志排队的等距抽样。随机起点等距抽样随机起点等距抽样半距起点等距抽样半距起点等距抽样对称等距抽样对称等距抽样46第四章第五节第四章第五节五、整群抽样五、整群抽样整群抽样是将总体划分为由总体单位的组成整群抽样是将总体划分为由总体单位的组成的若干群,然后以群为抽样单位,的若干群,然后以群为抽样单位,抽取若干抽取若干群作为样本,对群内所有单位进行全面调查群作为样本,对群内所有单位进行全面调查的抽样方法。的抽样方法。影响整群抽样误差大小的是群间方差。影响整群抽样误差大小的是群间方差。47第四章第五节第四章第五节六、多阶段抽样六、多阶段抽样在抽样调查抽选样本
35、时并不是一次直接从总在抽样调查抽选样本时并不是一次直接从总体中抽取,而是分成两个或者两个以上的阶体中抽取,而是分成两个或者两个以上的阶段来进行。段来进行。多阶段抽样的前几个阶段类似整群抽样多阶段抽样的前几个阶段类似整群抽样两阶段抽样和类型抽样、整群抽样的联系两阶段抽样和类型抽样、整群抽样的联系48第四章第六节第四章第六节第六节第六节 必要必要抽样单位数的确定(抽样单位数的确定(p142-144)一、确定抽样单位数的意义和原则一、确定抽样单位数的意义和原则在选定了抽样方式后,必须确定样本容量在选定了抽样方式后,必须确定样本容量n。n的大小同抽样推断的效果成正比,同抽样组的大小同抽样推断的效果成正
36、比,同抽样组织需要耗费的人力、物力、财力等也成正比。织需要耗费的人力、物力、财力等也成正比。在组织抽样调查的时候,需要在确保抽样推在组织抽样调查的时候,需要在确保抽样推断的可靠程度和精确程度的要求下,力求抽断的可靠程度和精确程度的要求下,力求抽样组织工作更简单。样组织工作更简单。49第四章第六节第四章第六节二、确定抽样单位数的依据二、确定抽样单位数的依据总体各单位标志变异程度总体各单位标志变异程度:即总体方差或即总体方差或p(1-p)的大小。总体标志变异程度大,要求样本容量大一些;的大小。总体标志变异程度大,要求样本容量大一些;反之,总体标志变异程度小,样本容量可以小些。反之,总体标志变异程度
37、小,样本容量可以小些。允许的极限误差允许的极限误差 或或 的大小的大小:允许的极限误差允许的极限误差越大,样本容量越小;反之,极限误差越小,样本容越大,样本容量越小;反之,极限误差越小,样本容量越大量越大 抽样方法:抽样方法:在其它条件相同的情况下,重置抽样比在其它条件相同的情况下,重置抽样比不重置抽样要抽取多一些样本单位。不重置抽样要抽取多一些样本单位。抽样方式:抽样方式:采用类型抽样的样本容量要小于简单随采用类型抽样的样本容量要小于简单随机抽样的样本容量机抽样的样本容量。xp50第四章第六节第四章第六节三、确定抽样单位数的计算公式三、确定抽样单位数的计算公式(只要求掌握简单(只要求掌握简单
38、随机抽样)随机抽样)简单随机重复抽样平均指标的必要抽样单位数公式简单随机重复抽样平均指标的必要抽样单位数公式简单随机不重复抽样平均指标的必要抽样单位数公式简单随机不重复抽样平均指标的必要抽样单位数公式222222xxxxtttnn 222222222(1)xxxxnNtNttnnNNtN 51第四章第六节第四章第六节简单随机重复抽样成数的必要抽样单位数公式简单随机重复抽样成数的必要抽样单位数公式简单随机不重复抽样成数的必要抽样单位数公简单随机不重复抽样成数的必要抽样单位数公式式222(1)(1)(1)ppppppt ppppttnn 2222(1)(1)(1)(1)(1)(1)ppppppnN
39、t ppNppttnnNNt ppNpp 52第四章第六节第四章第六节注意:注意:公式的运用要求事先取得全及总体的标准差公式的运用要求事先取得全及总体的标准差 或或 ,这往往无法知道,所以一般用,这往往无法知道,所以一般用抽抽样指标的标准差样指标的标准差 或或 来代替。来代替。如果缺少成数资料,可以直接假定如果缺少成数资料,可以直接假定P=0.5来来计算,这样计算,这样P(1P)取得最大值为取得最大值为0.25在同一个抽样调查中,如果既需要推断全及在同一个抽样调查中,如果既需要推断全及平均数,也需要推断全及成数,依据成数和平均数,也需要推断全及成数,依据成数和平均数计算出来的必要抽样单位数不一致的平均数计算出来的必要抽样单位数不一致的时候,时候,取较大的取较大的n作为统一的抽样单位数。作为统一的抽样单位数。(1)PP(1)pp53第四章第六节第四章第六节例题:详见教材例题:详见教材143页例页例6.19、6.20做题时,做题时,如果没有指出时重复抽样还是不重复抽样,如果没有指出时重复抽样还是不重复抽样,需要计算两种情况下的抽样单位数。需要计算两种情况下的抽样单位数。注意,注意,不重复抽样单位数一定比重复抽样单位数要不重复抽样单位数一定比重复抽样单位数要小。小。54第四章第六节第四章第六节本章结束!本章结束!