1、 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 教学目的与要求:抽样估计是抽样调查的继续,它提供了一套利用抽样资料来估计总体数量特征的方法。通过本章的学习,要理解和掌握抽样估计的概念、特点,抽样误差的含义、计算方法,抽样估计的置信度,推断总体参数的方法,能结合实际资料进行抽样估计。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础本本 章章 主主 要要 内内 容容抽样推断概述抽样推断概述抽样误差抽样误差抽样估计的
2、方法抽样估计的方法样本容量的确定样本容量的确定 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础一、抽样推断的概念和特点一、抽样推断的概念和特点 概概 念念 抽样推断是在抽样调查的基础上,用样抽样推断是在抽样调查的基础上,用样本实际资料计算样本指标,并据以推算总本实际资料计算样本指标,并据以推算总体相应的数量特征的一种统计分析方法。体相应的数量特征的一种统计分析方法。第一节第一节 抽样推断概述抽样推断概述 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础特特 点点 它是由部分推断整体的一种认识方法它是由部分
3、推断整体的一种认识方法。抽样推断建立在随机取样的基础上抽样推断建立在随机取样的基础上。抽样推断运用概率估计的方法抽样推断运用概率估计的方法。抽样推断的误差可以事先计算并加以控制。抽样推断的误差可以事先计算并加以控制。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础二、抽样推断的一些基本概念二、抽样推断的一些基本概念(一)(一)总总 体体 和和 样样 本本总体总体:又称全及总体。指所要认识的研究对象全体。总又称全及总体。指所要认识的研究对象全体。总体单位总数用体单位总数用“N N”表示,表示,N总是很大的数总是很大的数。对于一个总体来说,若被研究的标志
4、系品质标志,对于一个总体来说,若被研究的标志系品质标志,则将这个总体称为属性总体;若被研究的标志系数则将这个总体称为属性总体;若被研究的标志系数量标志,则将这个总体称为变量总体。量标志,则将这个总体称为变量总体。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础样本样本:又称子样或抽样总体,简称样本。是从全及又称子样或抽样总体,简称样本。是从全及总体中随机抽取出来,作为代表这一总体的那总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。样本单位总数用部分单位组成的集合体。样本单位总数用“n n”表示。表示。相对相对N来说,来说,n是很小的数,
5、它可以是是很小的数,它可以是N的几十分之的几十分之一、几百分之一、几千分之一、几万分之一。(一般来一、几百分之一、几千分之一、几万分之一。(一般来说,样本单位数达到或超过说,样本单位数达到或超过30个称为大样本,而在个称为大样本,而在30个以下称为小样本。社会经济现象的抽样调查多取大样个以下称为小样本。社会经济现象的抽样调查多取大样本本)第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础(二)(二)总体指标总体指标 和和 样本指标样本指标 总体指标总体指标是根据总体中各单位的标志值或标志属性计是根据总体中各单位的标志值或标志属性计算的,反映总体数量特征
6、的综合指标。算的,反映总体数量特征的综合指标。参数参数研究总体中研究总体中的数量标志的数量标志总体平均数总体平均数总体标准差总体标准差X=X NX=XF F研究总体中研究总体中的品质标志的品质标志总体成数总体成数成数标准差成数标准差P=N1N(只有两种表现)NXX2ffXX2PPp1 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础样本指标样本指标是根据样本各单位标志值或标志属性是根据样本各单位标志值或标志属性计算的综合指标。计算的综合指标。研究数研究数量标志量标志 样本平均数样本平均数 x=xnx=xff样本标准差样本标准差研究品研究品质标志质标志
7、样本成数样本成数 成数标准差成数标准差 np=nnxx2ffxxx2ppp1 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础(三)(三)样本容量样本容量和和样本个数样本个数样本容量:样本容量:一个样本包含的单位数。用一个样本包含的单位数。用 “n n”表示。表示。一般要求一般要求 n 30n 30样本个数:样本个数:从一个全及总体中可能抽取的样本数目。从一个全及总体中可能抽取的样本数目。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础(四)(四)重复抽样重复抽样和和不重复抽样不重复抽样重复抽样重复抽样:又
8、称回置抽样。又称回置抽样。不重复抽样不重复抽样:又称不回置抽样。又称不回置抽样。可能组成的样本数目:可能组成的样本数目:N N(N-1N-1)()(N-2N-2)(N-n+1N-n+1)可能组成的样本数目:可能组成的样本数目:nN 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础从从A A、B B、C C、D D四个单位中,抽出两个单位构成四个单位中,抽出两个单位构成一个样本,问可能组成的样本数目是多少?一个样本,问可能组成的样本数目是多少?重复抽样重复抽样AAACADBABBBCBDABCACBCCCDDADBDCDDNn=42=16(个样本)例如
9、例如 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础不重复抽样不重复抽样N(N-1)(N-2).43=12(个样本)第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础一、抽样误差的含义一、抽样误差的含义 抽样误差抽样误差是指按随机原则抽样时,在没有登记误是指按随机原则抽样时,在没有登记误差和系统性误差的条件下,单纯由于随机抽样的偶然因差和系统性误差的条件下,单纯由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,素使样本各单位的结构不足以代表总体各单位的结构,而引起的样本指标与总体指标之间的
10、离差。而引起的样本指标与总体指标之间的离差。在抽样中误在抽样中误差的来源有许多方面。差的来源有许多方面。第二节第二节 抽抽 样样 误误 差差 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 另一类是代表性误差,即样本各单位的结构不足以另一类是代表性误差,即样本各单位的结构不足以代表总体而引起的误差。代表总体而引起的误差。其中一类是登记性误差,即在调查过程中由于观察、其中一类是登记性误差,即在调查过程中由于观察、测量、登记、计算上的差错所引起的误差,这类误差测量、登记、计算上的差错所引起的误差,这类误差是所有统计调查都可能发生的。是所有统计调查都可能
11、发生的。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 另一种情况是,即使遵守随机原则,由于被抽选的样本有另一种情况是,即使遵守随机原则,由于被抽选的样本有各种各样,只要被抽中的样本其内部各单位被研究标志的各种各样,只要被抽中的样本其内部各单位被研究标志的构成比例和总体有所出入,就会出现或大或小的偶然性代构成比例和总体有所出入,就会出现或大或小的偶然性代表性误差。表性误差。代表性误差的发生有以下两种情况:代表性误差的发生有以下两种情况:一种是由于违反抽样调查的随机原则,如有意地多选较好的一种是由于违反抽样调查的随机原则,如有意地多选较好的单位或较坏
12、的单位进行调查。这样做,所据以计算的抽样指标单位或较坏的单位进行调查。这样做,所据以计算的抽样指标必然出现偏高或偏低现象,造成系统性的误差。系统性误差和必然出现偏高或偏低现象,造成系统性的误差。系统性误差和登记性误差都是不应当发生的,是可以也应该采取措施避免发登记性误差都是不应当发生的,是可以也应该采取措施避免发生或将其减小到最小限度。生或将其减小到最小限度。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 我们所讲的抽样误差就是指这种偶然性代表性误差。我们所讲的抽样误差就是指这种偶然性代表性误差。即按随机原则抽样时,在没有登记性误差和系统性误即按随
13、机原则抽样时,在没有登记性误差和系统性误差的条件下单纯由于不同的随机样本得出不同估计量差的条件下单纯由于不同的随机样本得出不同估计量而产生的误差。抽样误差是抽样调查所固有的,是无而产生的误差。抽样误差是抽样调查所固有的,是无法避免与消除的,但可以运用数学方法计算其数量界法避免与消除的,但可以运用数学方法计算其数量界限,并通过抽样设计程序控制其范围,所以这种抽样限,并通过抽样设计程序控制其范围,所以这种抽样误差也称为可控制误差。误差也称为可控制误差。需要指出,抽样误差不是需要指出,抽样误差不是固定不变的数,它的数值是随样本不同而变化的,所固定不变的数,它的数值是随样本不同而变化的,所以它也是随机
14、变量。以它也是随机变量。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础二、二、抽样误差的表现形式抽样误差的表现形式(一)(一)抽样实际误差 抽样实际误差抽样实际误差是指在一次具体的抽样调查中,由随是指在一次具体的抽样调查中,由随机因素引起的样本指标与总体指标之间的离差。机因素引起的样本指标与总体指标之间的离差。如样本平均数与总体平均数之间的绝对离差,样本如样本平均数与总体平均数之间的绝对离差,样本成数与总体成数之间的绝对离差。但是,在抽样中,由于成数与总体成数之间的绝对离差。但是,在抽样中,由于总体指标数值是未知的,因此,抽样实际误差是无法计算总体
15、指标数值是未知的,因此,抽样实际误差是无法计算的。同时,抽样实际误差仅仅是一系列可能出现的误差数的。同时,抽样实际误差仅仅是一系列可能出现的误差数值之一,因此,抽样实际误差没有概括所有可能产生的抽值之一,因此,抽样实际误差没有概括所有可能产生的抽样误差。样误差。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础(二)抽样平均误差(二)抽样平均误差 抽样平均误差抽样平均误差是抽样平均数或抽样成数的标准是抽样平均数或抽样成数的标准差,反映了抽样指标与总体指标的平均误差程度。差,反映了抽样指标与总体指标的平均误差程度。第六章第六章 抽样推断抽样推断Funda
16、mentals of Statistics统计学基础 抽抽 样样 平平 均均 误误 差差 的的 计计 算算 公公 式式抽样平均数的平均误差抽样成数平均误差MXxx2MPpp2实际上,利用上述两个公式是计算不出实际上,利用上述两个公式是计算不出抽样平均误差的。抽样平均误差的。想一想,为什么?想一想,为什么?均误差。表示样本成数的抽样平平均误差,表示样本平均数的抽样pxM表示全部可能的样本数目 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 该公式表明了抽样平均误差的意义。但是当总体单位该公式表明了抽样平均误差的意义。但是当总体单位数较大,而抽取的样本
17、单位数也较大时,样本可能数数较大,而抽取的样本单位数也较大时,样本可能数目就非常大。即使求出样本可能数目,上述公式仍然目就非常大。即使求出样本可能数目,上述公式仍然不适用,这是因为,在该公式中出现了总体平均数。不适用,这是因为,在该公式中出现了总体平均数。这也正是抽样调查所要推算出的数值,实践中是不知这也正是抽样调查所要推算出的数值,实践中是不知道的。道的。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础抽样平均数平均误差的计算方法抽样平均数平均误差的计算方法采用重复抽样:采用重复抽样:nx采用不重复抽样:采用不重复抽样:Nnnx12我们把式子叫做修
18、正因子。不难看出当N较大时,与 的计算结果是十分接近。因此,当N较大时在不重复抽样条件计算抽样平均误差的公式可采用时)1(NnN)1(NnN)1(Nn)1(2NnNnx 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 随机抽选某校学生随机抽选某校学生100100人,调查他们的人,调查他们的体重。得到他们的平均体重为体重。得到他们的平均体重为5858公斤,标公斤,标准差为准差为1010公斤。问抽样推断的平均误差公斤。问抽样推断的平均误差是多少?是多少?)(110010公斤nx即即:当根据样本学生的平均体重估计全部当根据样本学生的平均体重估计全部学生的
19、平均体重时学生的平均体重时,抽样平均误差为抽样平均误差为1 1公斤。公斤。已知:已知:则:则:n=100=10 x=58例题例题1 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础)(15400300小时nxNnnx12)(42.13200040014003002小时已知:已知:则:则:N=2000n=400=300=4800 某厂生产一种新型灯泡共某厂生产一种新型灯泡共20002000只,随只,随机抽出机抽出400400只作耐用时间试验,测试结果只作耐用时间试验,测试结果平均使用寿命为平均使用寿命为48004800小时,样本标准差小时,样本标准差为
20、为300300小时,求抽样推断的平均误差?小时,求抽样推断的平均误差?x重复抽样重复抽样不重复抽样不重复抽样 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础抽样成数平均误差的计算方法抽样成数平均误差的计算方法采用重复抽样采用重复抽样:采用不重复抽样:采用不重复抽样:nppp1Nnnppp11 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 某校随机抽选某校随机抽选400400名学生,发现戴眼镜名学生,发现戴眼镜的学生有的学生有8080人。根据样本资料推断全部学人。根据样本资料推断全部学生中戴眼镜的学生所
21、占比重时,抽样误差生中戴眼镜的学生所占比重时,抽样误差为多大?为多大?已知:已知:400n801n则:样本成数则:样本成数%20400801nnp02.04008.02.01nppp例题例题3 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 一批食品罐头共一批食品罐头共6000060000桶,随机抽查桶,随机抽查300300桶,发现有桶,发现有6 6桶不合格,求合格品率的抽样平桶不合格,求合格品率的抽样平均误差?均误差?已知:已知:60000N300n61n98.030063001nnnp例题例题3 第六章第六章 抽样推断抽样推断Fundament
22、als of Statistics统计学基础则:样本合格率则:样本合格率(%)808.030002.098.01npppNnnppp11(%)806.060000300130002.098.0 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础(二)影响抽样误差大小的因素(二)影响抽样误差大小的因素 1、样本单位数的多少、样本单位数的多少 2、受总体标准差的影响、受总体标准差的影响3、抽样方法、抽样方法 4、抽样调查的组织形式、抽样调查的组织形式 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础含义含义:抽样
23、极限误差是指样本指标和总体指标之间抽抽样极限误差是指样本指标和总体指标之间抽样误差的可能范围。样误差的可能范围。由于总体指标是一个确定的由于总体指标是一个确定的数,而样本指标则是围绕着总体指标左右变动的数,而样本指标则是围绕着总体指标左右变动的量,它与总体指标可能产生正离差,也可能产生量,它与总体指标可能产生正离差,也可能产生负离差,样本指标变动的上限或下限与总体指标负离差,样本指标变动的上限或下限与总体指标之差的绝对值就可以表示抽样误差的可能范围,之差的绝对值就可以表示抽样误差的可能范围,我们将这种以绝对值形式表示的抽样误差可能范我们将这种以绝对值形式表示的抽样误差可能范围称为抽样极限误差。
24、围称为抽样极限误差。计算方法计算方法:它等于样本指标可允许变动的上限或下限与它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。总体指标之差的绝对值。(三)抽样极限误差 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础=pp -Pp P pP p抽样平均数极限误差抽样平均数极限误差:抽样成数极限误差:抽样成数极限误差:XxxxxXxx差样本成数的抽样极限误分别表示样本平均数和和px 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 什什 么么 是是 抽抽 样样 估估 计计 的的 置置 信信 度?度?
25、抽样估计的置信度就是表明抽样指标和总体指标抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。的误差不超过一定范围的概率保证程度。由于抽样指标值随着样本的变动而变动,它本身是由于抽样指标值随着样本的变动而变动,它本身是一个随机变量,因而抽样指标和总体指标的误差仍然是一个随机变量,因而抽样指标和总体指标的误差仍然是一个随机变量,并不能保证误差不超过一定范围这个事一个随机变量,并不能保证误差不超过一定范围这个事件是必然事件,而只能给以一定程度的概率保证。因此,件是必然事件,而只能给以一定程度的概率保证。因此,就有必要来计算抽样指标和总体指标的误差不超过一定就有必要来计算抽
26、样指标和总体指标的误差不超过一定范围的概率大小,即计算抽样指标落在一定区间范围内范围的概率大小,即计算抽样指标落在一定区间范围内的概率,这种概率称之为抽样估计的概率度。的概率,这种概率称之为抽样估计的概率度。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 抽样误差的概率度是测量抽样估计可抽样误差的概率度是测量抽样估计可靠程度的一个参数。用符号靠程度的一个参数。用符号“Z Z”表示。表示。公式表示:公式表示:什什 么么 是是 抽抽 样样 估估 计计 的的 概概 率率 度?度?xxzxxz或 第六章第六章 抽样推断抽样推断Fundamentals of
27、 Statistics统计学基础正正 态态 概概 率率 分分 布布 图图Xx+1x-168.27%x+2x-295.45%由此可知由此可知,误差范围愈大误差范围愈大,抽样估计的置信度愈高抽样估计的置信度愈高,但抽样估计但抽样估计的精确度愈低;反之,误差范围愈小,则抽样估计的置信度的精确度愈低;反之,误差范围愈小,则抽样估计的置信度愈低,但抽样估计的精确度愈高。愈低,但抽样估计的精确度愈高。因为扩大或缩小以后因为扩大或缩小以后的平均误差,就是极的平均误差,就是极限误差:限误差:=Z所以,抽样平均误所以,抽样平均误差的系数就是概差的系数就是概率度率度t。数理统计已经证明,抽样数理统计已经证明,抽样
28、误差的概率就是概率度的误差的概率就是概率度的 函数,二者对应的函数函数,二者对应的函数 关系已编成关系已编成“正态分布正态分布 概率表概率表”。(P225)第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础一、点估计一、点估计 抽样估计是用抽样资料来估计相应的总体指标的数值,抽样估计是用抽样资料来估计相应的总体指标的数值,而总体指标是表明总体数量特征的参数,所以这种估计也而总体指标是表明总体数量特征的参数,所以这种估计也可以称为参数估计。总体参数的估计有点估计和区间估计可以称为参数估计。总体参数的估计有点估计和区间估计两种方法。两种方法。点估计是以抽样
29、指标数值直接作为总体指标估计值点估计是以抽样指标数值直接作为总体指标估计值的一种估计方法的一种估计方法。例如从某地区的例如从某地区的1000000亩小麦中随机抽取亩小麦中随机抽取100亩亩进行抽样调查,测得平均亩产量进行抽样调查,测得平均亩产量=300千克,我们就千克,我们就说,全地区说,全地区1000000亩小麦的平均亩产量为亩小麦的平均亩产量为300千克。千克。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础总体参数优良估计的标准总体参数优良估计的标准 无偏性无偏性一致性一致性有效性有效性 点估计的方法优点是简便易行,原理直观,常为实际点估计的方
30、法优点是简便易行,原理直观,常为实际工作采用。但不足之处是没有表明抽样估计的误差,更工作采用。但不足之处是没有表明抽样估计的误差,更没有表明误差在一定范围内的概率保证程度有多大。没有表明误差在一定范围内的概率保证程度有多大。在参数估计中,要有合适的样本指标作为估计量。这在参数估计中,要有合适的样本指标作为估计量。这里的样本指标是样本数据的函数。如从一个样本可以计里的样本指标是样本数据的函数。如从一个样本可以计算样本算术平均数,中位数、众数等。应当用那一种指算样本算术平均数,中位数、众数等。应当用那一种指标作为参数估计量才是最优的,这便是样本指标的优良标作为参数估计量才是最优的,这便是样本指标的
31、优良标准问题。作为优良的估计指标应该符合以下标准。标准问题。作为优良的估计指标应该符合以下标准。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 区间估计就是根据概率保证程度的要求,选定概率度区间估计就是根据概率保证程度的要求,选定概率度t,以及极限抽样误差以及极限抽样误差 (),再利用抽样),再利用抽样指标指标 或或p,定出估计上限,定出估计上限 或(或()和)和估计下限估计下限 (或(或 ),即指出总体指标可),即指出总体指标可能存在的区间范围。我们把区间(能存在的区间范围。我们把区间(,或或 ,)称为置信区间,概率保证程)称为置信区间,概率保证
32、程度称为置信程度。度称为置信程度。xxtppt或xxxppxxppxxxxpppp二、区间估计二、区间估计 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础区间估计三要素区间估计三要素估计值估计值抽样误差范围抽样误差范围抽样估计的置信度抽样估计的置信度px,px,zFpx,第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础2、区间估计与点估计的区别、区间估计与点估计的区别 一是区间估计不像点估计那样用一个数值对总体指标进一是区间估计不像点估计那样用一个数值对总体指标进行估计,而是用一个范围对总体指标进行估计;
33、行估计,而是用一个范围对总体指标进行估计;二是点估计是一个确切的估计值,而区间估计的是区间,二是点估计是一个确切的估计值,而区间估计的是区间,根据概率度的要求可宽可窄;根据概率度的要求可宽可窄;三是点估计无法回答估计值的把握程度,而区间估计可三是点估计无法回答估计值的把握程度,而区间估计可以回答估计区间的把握程度。以回答估计区间的把握程度。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础区间估计的方法一区间估计的方法一 根据给定的概率根据给定的概率F F(z z),推算抽样极限误差的可能范围。),推算抽样极限误差的可能范围。分析步骤分析步骤:1.1.
34、抽取样本,计算样本指标。抽取样本,计算样本指标。即计算样本平均数和抽样成数即计算样本平均数和抽样成数p,作为总体指标的估计值,并计算样本标准差作为总体指标的估计值,并计算样本标准差以推算抽样平均误差。以推算抽样平均误差。2.2.根据给定的根据给定的F F(z z)查表求得概率度)查表求得概率度 z z。3.3.根据概率度根据概率度t t和抽样平均误差和抽样平均误差计算极限误差计算极限误差。4.4.计算被估计值的上、下限,对总体参数作出区间估计。计算被估计值的上、下限,对总体参数作出区间估计。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础例例6、某企
35、业生产一种新型电子元件,用简单随机抽样方法抽取、某企业生产一种新型电子元件,用简单随机抽样方法抽取100只作耐用时间实验,测试结果,平均寿命只作耐用时间实验,测试结果,平均寿命6000小时,标准差小时,标准差是是300小时,试在小时,试在95.45%概率保证下,估计这种新电子元件平均概率保证下,估计这种新电子元件平均寿命区间。寿命区间。解:已知n=100,x=6000小时,=300小时(1)根据已知资料计算抽样平均误差)根据已知资料计算抽样平均误差(小时)30100300nx(2)根据给定的置信度)根据给定的置信度F(Z)=95.45%,查查正态分布表正态分布表得得Z=2(3)计算抽样极限误差
36、:)计算抽样极限误差:(小时)60302XxZ据此估计这种新型电子元件平均寿命的区间为据此估计这种新型电子元件平均寿命的区间为(小时)上限(小时)下限60606060005940606000 xxxx结论:以结论:以95.45%的概率保证程度,估计该电子元件的平均寿命区间的概率保证程度,估计该电子元件的平均寿命区间为为59406060小时之间。小时之间。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础例例7、某纱厂某时期内生产了、某纱厂某时期内生产了10万个单位的纱,按纯随机不重复抽样万个单位的纱,按纯随机不重复抽样的方式抽取的方式抽取2000个单位
37、检验,检验结果,合格率为个单位检验,检验结果,合格率为95%,试以,试以95%的把握程度,估计合格率的区间范围。的把握程度,估计合格率的区间范围。解:已知N=100000,n=2000,p=95%(1)根据已知资料计算抽样平均误差)根据已知资料计算抽样平均误差%48.010000020001(200005.095.0)1()1(Nnnppp(2)根据给定的置信度)根据给定的置信度F(Z)=95%,查查正态分布表正态分布表得得Z=1.96(3)计算抽样极限误差:)计算抽样极限误差:%94.0%48.096.1ppZ该厂生产的全部纱合格率的上下限为:该厂生产的全部纱合格率的上下限为:%94.95%
38、94.0%95%46.94%94.0%95pppp上限下限 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础结论:以95%的置信度估计该厂全部合格品率在94.06%95.95%之间。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 根据给定的抽样误差范围,求概率保证程度根据给定的抽样误差范围,求概率保证程度.分析步骤:分析步骤:1.1.抽取样本,计算抽样指标。抽取样本,计算抽样指标。即计算样本平均数即计算样本平均数 和和抽样成数抽样成数p,作为总体指标的估计值,并计算样本标准差,作为总体指标的估计值,并计算
39、样本标准差s以推算抽样年均差。以推算抽样年均差。2.2.根据给定的极限误差范围根据给定的极限误差范围估计算总体参数的上限和下估计算总体参数的上限和下限。限。3.3.计算概率度计算概率度。将抽样极限误将抽样极限误差除以抽样平均误差差除以抽样平均误差,求出概率度,求出概率度t 4.4.查表求出概率查表求出概率F F(z z),并对总体参数作出区间估计。),并对总体参数作出区间估计。区间估计的方法二区间估计的方法二x 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础例例8、某校从该校学生中随机抽取、某校从该校学生中随机抽取100人,调查到他们平均每天参加体
40、人,调查到他们平均每天参加体育锻炼的时间为育锻炼的时间为30分钟,标准差为分钟,标准差为20分钟,若要求抽样估计的允许误分钟,若要求抽样估计的允许误差不超过差不超过5分钟,试求这一估计相应的置信度,并写出该校学生平均每分钟,试求这一估计相应的置信度,并写出该校学生平均每天参加体育锻炼时间的估计区间。天参加体育锻炼时间的估计区间。解:已知解:已知n=100,=30,=20,则,则x(1)根据已知资料计算抽样平均误差为)根据已知资料计算抽样平均误差为210020nx(2)根据给定的极限误差)根据给定的极限误差5x5.225xxZ可求出查正态分布概率表得置信度查正态分布概率表得置信度F(Z)=98.
41、76%第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础(3)该校学生平均每天参加体育锻炼时间的上下限该校学生平均每天参加体育锻炼时间的上下限:)(上限)(下限min35530min25530 xxxx结论:该校同学平均每天参加体育锻炼的时间在结论:该校同学平均每天参加体育锻炼的时间在2535之间,这之间,这一区间的置信度为一区间的置信度为98.76%第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础例例9、某食品加工厂从生产的一批食品中随机抽取、某食品加工厂从生产的一批食品中随机抽取200袋进行检查,袋进行检
42、查,其中其中188袋合格,若给定抽样极限误差为袋合格,若给定抽样极限误差为3.4%,试求这一估计相应,试求这一估计相应的置信度,并写出该厂食品合格率的估计区间。的置信度,并写出该厂食品合格率的估计区间。解:已知解:已知n=200 合格品数合格品数%4.31881p n(1)计算样本合格品率及抽样平均误差为:)计算样本合格品率及抽样平均误差为:%94%100200188%1001nnp%7.120006.094.0%100)1(nppp 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础(2)根据给定的极限误差)根据给定的极限误差%4.3p可计算可计算2
43、%7.1%4.3ppZ查正态分布概率表得置信度查正态分布概率表得置信度F(Z)=95.45%(3)计算该厂食品合格率的上下限)计算该厂食品合格率的上下限%4.97%4.3%94%6.90%4.3%94pppp上限下限结论:估计该厂食品的合格率在结论:估计该厂食品的合格率在90.6%97.4%之间。之间。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础一、一、确定样本容量应考虑的因素确定样本容量应考虑的因素 组织抽样调查的一项重要工作就是要确定合适的样本容量。样组织抽样调查的一项重要工作就是要确定合适的样本容量。样本容量直接关系到调查的精度、调查费用、
44、调查时间、需要配备的本容量直接关系到调查的精度、调查费用、调查时间、需要配备的人力物力等许多方面。那么样本容量多大才合适呢?样本容量多了人力物力等许多方面。那么样本容量多大才合适呢?样本容量多了会造成不必要的浪费,但样本容量太少又不能有效的反应情况,直会造成不必要的浪费,但样本容量太少又不能有效的反应情况,直接影响推断的效果。接影响推断的效果。1、要考虑调查目的。2、要考虑总体的性质和特点3、要考虑调查项目的多少4、要考察调查质量的控制因素5、要考虑调查的条件 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础二、二、样本容量的确定样本容量的确定 (一
45、)用经验法确定样本容量(一)用经验法确定样本容量 用经验法确定样本容量是调查者根据多次成功的抽样调查经验总结出来用经验法确定样本容量是调查者根据多次成功的抽样调查经验总结出来的,在不同规模的总体中应该抽取的样本单位数占总体比重的经验数,供的,在不同规模的总体中应该抽取的样本单位数占总体比重的经验数,供抽样调查抽取样本时参考。需要注意的是,这个比重只是为调查者提供了抽样调查抽取样本时参考。需要注意的是,这个比重只是为调查者提供了一个抽取样本单位数的范围,但实际应用时,还必须考虑前述的各种应考一个抽取样本单位数的范围,但实际应用时,还必须考虑前述的各种应考虑的因素来最后确定。不同规模总体单位数占总
46、体比重如表所示虑的因素来最后确定。不同规模总体单位数占总体比重如表所示总体规总体规模模100以下以下100-10001000-50005000-1000010000-10000001000000以上以上样本占样本占总体的总体的比重比重%50以上以上50203020153511以下以下表表6-3 确定样本容量经验值确定样本容量经验值 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础重复抽样:不重复抽样:抽样平均数抽样成数22222xxxzNNznppzNpNpznp11222222xxzn221pppzn(二)用公式法确定样本容量 根据研究问题的性质确
47、定允许误差和相应的置信度,然后根据历史资料或其他试点资料确定总体的标准差,再通过抽样误差的计算公式来推算必要的样本单位数。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础例例10、假定某统计总体被研究标志的标准差为、假定某统计总体被研究标志的标准差为30,若要求抽样极,若要求抽样极限误差不超过限误差不超过3,概率保证程度为,概率保证程度为99.73%,试问采用重复抽样应抽,试问采用重复抽样应抽取多多少个样本?取多多少个样本?解:解:9003303222222xzn计算结果表明,应抽取计算结果表明,应抽取900个样本进行抽查,才能满足研究个样本进行抽查
48、,才能满足研究问题的需要问题的需要。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础例例11、某市妇联拟对该市妇女每天的家务劳动时间进行调查,根据、某市妇联拟对该市妇女每天的家务劳动时间进行调查,根据历史资料知道他们每天家务劳动时间超过历史资料知道他们每天家务劳动时间超过2小时的人占小时的人占90%,现在用,现在用重估抽样的方法,要求在重估抽样的方法,要求在95.45%de 概率保证下,劳动时间超过概率保证下,劳动时间超过2小小时的人的比重的极限误差不超过时的人的比重的极限误差不超过3%,求样本的必要单位数。,求样本的必要单位数。解:样本成数的必要单
49、位数:解:样本成数的必要单位数:40003.01.9.02)1(2222pppzn计算结果表明,应抽取计算结果表明,应抽取400个人进行调查,才能满足研究问个人进行调查,才能满足研究问题的需要题的需要。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础一判断题部分一判断题部分 1.1.从全部总体单位中按照随机原则抽取从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本部分单位组成样本,只可能组成一个样本。()第六章第六章 抽样推断抽样推断Fun
50、damentals of Statistics统计学基础 2.2.在抽样推断中,全及指标值是确定在抽样推断中,全及指标值是确定的、唯一的,而样本指标值是一个随机的、唯一的,而样本指标值是一个随机变量。(变量。()第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 3.3.抽样成数的特点是:样本成数越大,抽样成数的特点是:样本成数越大,则抽样平均误差越大。(则抽样平均误差越大。()第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础 4.4.抽样平均误差总是小于抽样极抽样平均误差总是小于抽样极限误差。(限误差。()