1、第八章第八章 抽样推断抽样推断第一节抽样推断的基本概念第一节抽样推断的基本概念 一、抽样推断的特点一、抽样推断的特点 抽样推断是在抽样调查的基础上,根据抽样推断是在抽样调查的基础上,根据样本的实际资料推断全及总体数量特征的样本的实际资料推断全及总体数量特征的一种统计方法。它具有以下特点:一种统计方法。它具有以下特点:(一一)按随机的原则抽取样本。按随机的原则抽取样本。(二二)在数量上,以样本推断总体。在数量上,以样本推断总体。(三三)抽样推断的误差可以事先计算和控制。抽样推断的误差可以事先计算和控制。二、抽样推断的几个基本概念二、抽样推断的几个基本概念(一一)全及总体和样本总体全及总体和样本总
2、体。(二二)总体指标和样本指标总体指标和样本指标。1.总体指标。总体指标。总体指标也称总体特征数。总体指标也称总体特征数。它是说明总体数量特征或规律性的数字。它是说明总体数量特征或规律性的数字。(1)设总体单位数为)设总体单位数为N (2)X为标志总量为标志总量(3)XXN称为总体平均数。称为总体平均数。(4)PMN为总体成数为总体成数(5)2(XX)2N 总体方总体方差差 (XX)2N 总体标准差总体标准差。2.样本指标(1)样本容量为)样本容量为n(2)x 称为样本标志总量;称为样本标志总量;(3)xxn 称为总体平均数称为总体平均数(4)pmn 称为具有该特征单位称为具有该特征单位的样本
3、成数。的样本成数。(5)样本方差)样本方差S2(xx)2n 1(6)样本标准差)样本标准差 S(xx)2n -1第 二节抽 样 误 差一、抽样误差的概念一、抽样误差的概念抽样误差是指抽样估计值与被估计的抽样误差是指抽样估计值与被估计的未知的真实参数未知的真实参数(总体特征值总体特征值)之差。之差。抽样误差不包括下面两类误差:一类抽样误差不包括下面两类误差:一类是调查误差,即在调查过程中由于观是调查误差,即在调查过程中由于观察、测量、登记、计算上的差错而引察、测量、登记、计算上的差错而引起的误差;另一类是系统性误差,即起的误差;另一类是系统性误差,即由于违反抽样调查的随机原则,有意由于违反抽样调
4、查的随机原则,有意抽选较好单位或较坏单位进行调查,抽选较好单位或较坏单位进行调查,这样造成样本的代表性不足所引起的这样造成样本的代表性不足所引起的误差。误差。二、抽样误差大小的影响因素二、抽样误差大小的影响因素1.总体各单位标志值的变异程度总体各单位标志值的变异程度。在其他条件不变。在其他条件不变的情况下,总体各单位标志值的变异程度愈大,的情况下,总体各单位标志值的变异程度愈大,抽样误差也愈大,反之则愈小。抽样误差也愈大,反之则愈小。2.样本单位数的多少样本单位数的多少。在其他条件不变的情况下,。在其他条件不变的情况下,样本单位数愈多,抽样误差就愈小,反之则愈样本单位数愈多,抽样误差就愈小,反
5、之则愈大。大。3.抽样方法抽样方法。抽样方法不同,抽样误差也不同。一。抽样方法不同,抽样误差也不同。一般说来,重复抽样的误差比不重复抽样的误差般说来,重复抽样的误差比不重复抽样的误差要大。要大。4.抽样的组织形式抽样的组织形式。选择不同的抽样组织形式,也。选择不同的抽样组织形式,也会有不同的抽样误差。会有不同的抽样误差。二、抽样平均误差二、抽样平均误差(一一)样本平均数的平均误差样本平均数的平均误差 以以 x表示样本平均数的平均误差,表示样本平均数的平均误差,表示总体表示总体的标准差。的标准差。1.当抽样方式为当抽样方式为重复抽样重复抽样时时 xn它说明在重复抽样的条件下,抽样平均它说明在重复
6、抽样的条件下,抽样平均误差与总体标准差成正比,与样本容量误差与总体标准差成正比,与样本容量的平方根成反比。的平方根成反比。(二二)样本成数的平均误差。样本成数的平均误差。总体成数总体成数P 可以表现为总体是非标志的平均数。可以表现为总体是非标志的平均数。即即E(X)P 它的标准差它的标准差P(1P)根据样本平均误差和总体标准差的关系,可以得到样本根据样本平均误差和总体标准差的关系,可以得到样本成数的平均误差的计算公式。成数的平均误差的计算公式。1.在重复抽样下:p =2.在不重复抽样下:p)1(2NnNnnnpp)1(三、抽样极限误差三、抽样极限误差抽样极限误差是指样本和总体指标之间误抽样极限
7、误差是指样本和总体指标之间误差的可能范围。由于总体指标是一个确定的差的可能范围。由于总体指标是一个确定的数,而样本指标则是围绕总体指标上下波动数,而样本指标则是围绕总体指标上下波动的,它与总体指标之间既有正离差,也有负的,它与总体指标之间既有正离差,也有负离差,样本指标变动的上限或下限与总体指离差,样本指标变动的上限或下限与总体指标之差的绝对值就可以表示抽样误差的可能标之差的绝对值就可以表示抽样误差的可能范围,我们将这种以绝对值形式表示的抽样范围,我们将这种以绝对值形式表示的抽样误差可能范围称为抽样极限误差。误差可能范围称为抽样极限误差。设设x与与p分别表示样本平均数与分别表示样本平均数与样本
8、成数的抽样极限误差,则样本成数的抽样极限误差,则有:有:xXx,pPp 上述不等式也可表示成上述不等式也可表示成:xxXxx,ppPpp例如,根据样本计算得某产品耐用的平均例如,根据样本计算得某产品耐用的平均时数为时数为6000小时,抽样极限差为小时,抽样极限差为600小时,小时,则相对误差限则相对误差限 x 600 x0.1 x 6000 估计的精度:估计的精度:Ax1x0.990第三节参第三节参 数数 估估 计计参数估计就是以参数估计就是以所计算的样本所计算的样本指标来估计相指标来估计相应的总体指标。应的总体指标。参数估计参数估计有点有点估计估计和和区间估区间估计计两种形式。两种形式。一、
9、点估计一、点估计通常评选估计优通常评选估计优良有三个标准,良有三个标准,即即 无偏性无偏性 有效性有效性 一致性一致性二、区间估计二、区间估计对于总体的未知指标对于总体的未知指标X,根据样本构造的根据样本构造的两个统计量两个统计量x1、x2(x1x2),使随机区,使随机区间间(x1,x2)包含包含X的概率等于给定值的概率等于给定值1(01),即即 P(x1Xx2)1 则称则称1为置信概率,为置信概率,为显著水平,为显著水平,(x1,x2)称为称为X的置信区间,的置信区间,x1,x2分别分别称为置信下限和置信上限。称为置信下限和置信上限。(一一)总体平均数总体平均数X的区间估计的区间估计1.重复
10、抽样重复抽样。在重复抽样条件下,估计量在重复抽样条件下,估计量x服从或近似服从或近似服从服从 N(X,2),所以统计量,所以统计量 xX U n服从或近似服从服从或近似服从N(0,1),根据附录正态分布表得:根据附录正态分布表得:P(ut)1式中,式中,t称为可靠性指标,或概率度,它与称为可靠性指标,或概率度,它与1有关,可有关,可通过查表求得。通过查表求得。2.不重复抽样不重复抽样在不重复抽样条件下,在不重复抽样条件下,统计量统计量 x 总体平均数总体平均数X在可靠性为在可靠性为1的置信区间是:的置信区间是:(xtx,xtx)1(2NnNnXxunNnNt2)11(二二)总体成数的区间估计。
11、总体成数的区间估计。1.在在重复抽样重复抽样条件下,估计量条件下,估计量p的误的误差限为:差限为:_ ptptP(1P)n2.在在不重复抽样不重复抽样条件下,估计量条件下,估计量P的误差的误差限为:限为:当当N很大时,有:很大时,有:ptp三、样本容量的确定三、样本容量的确定 样本容量的确定,可根据抽样极限误差的计算公样本容量的确定,可根据抽样极限误差的计算公式来求得:式来求得:在在重复抽样重复抽样条件下:条件下:xt n 可以解得所需抽取的最低样本单位数可以解得所需抽取的最低样本单位数n0为:为:t n0()2 x 在在不重复抽样不重复抽样条件下条件下:2 nx tn(1)n N第四节第四节
12、 假设检验假设检验一、一、假设检验的意义和程序假设检验的意义和程序1.设立假设。设立假设。2.作检验统计量。作检验统计量。3.确定显著性水平确定显著性水平及相应的及相应的t值。值。4.确定拒绝域。确定拒绝域。5.作出决策。作出决策。二、假设检验的内容二、假设检验的内容 (一一)双侧检验双侧检验(二二)单侧检验单侧检验三、假设检验的两类错误三、假设检验的两类错误 经常性的错误是一类错误是,经常性的错误是一类错误是,当原假设成立时,样本观测当原假设成立时,样本观测值落在拒绝域中,因而被拒绝值落在拒绝域中,因而被拒绝了。二类错误是,当原假设不了。二类错误是,当原假设不成立时,样本观测值却不在拒成立时
13、,样本观测值却不在拒绝域中,因而被接受了。绝域中,因而被接受了。第五节第五节 抽样调查的组织形式抽样调查的组织形式一、简单随机抽样一、简单随机抽样对于有限总体,从对于有限总体,从N个总体单位中个总体单位中抽出抽出n个单位组成样本,所有可能个单位组成样本,所有可能的不同样本数为的不同样本数为CNn,如果使得其,如果使得其中任何一个样本,中任何一个样本,都以相同的概率都以相同的概率1CNn被抽取,这种抽样方法,即被抽取,这种抽样方法,即为简单随机抽样。为简单随机抽样。二、等距抽样二、等距抽样等距抽样也称系统抽样或机械抽样,等距抽样也称系统抽样或机械抽样,是在全部单位已排有一定顺序的总体是在全部单位
14、已排有一定顺序的总体中,每隔相等的距离抽取一个单位组中,每隔相等的距离抽取一个单位组成样本的方法。所抽样本称为等距样成样本的方法。所抽样本称为等距样本。本。三、类型抽样三、类型抽样 类型抽样又称分层抽样,是应用最为类型抽样又称分层抽样,是应用最为广泛的一种抽样组织形式。其基本方法广泛的一种抽样组织形式。其基本方法是,在总体各单位的性质或标志值大小是,在总体各单位的性质或标志值大小明显地呈现出层次时,按其层次将总体明显地呈现出层次时,按其层次将总体划分为若干子总体,每一子总体即为一划分为若干子总体,每一子总体即为一层,而使每层内部总体单位的差异较小,层,而使每层内部总体单位的差异较小,使差异主要
15、存在于各层之间。然后,在使差异主要存在于各层之间。然后,在每一层都进行随机抽样。每一层都进行随机抽样。四、整群抽样四、整群抽样从全部总体单位中,抽取一部分组成从全部总体单位中,抽取一部分组成样本,进行调查,这在实际中,有时是很样本,进行调查,这在实际中,有时是很难进行的。将全部总体分为若干部分,每难进行的。将全部总体分为若干部分,每一部分称为一个群,把每一群作为一个抽一部分称为一个群,把每一群作为一个抽样单位,整群地进行抽样,然后,在被抽样单位,整群地进行抽样,然后,在被抽中的群中做全面调查,这种抽样叫整群抽中的群中做全面调查,这种抽样叫整群抽样。样。五、抽样方案的检查五、抽样方案的检查(一一
16、)准确性检查准确性检查 所谓准确性检查,所谓准确性检查,看是否超过了方案所允许的误差的范看是否超过了方案所允许的误差的范围。若误差限小于或等于允许的误差,围。若误差限小于或等于允许的误差,即:即:x允许误差,则说明方案的设允许误差,则说明方案的设计符合准确性的要求,可以实施。若,计符合准确性的要求,可以实施。若,x允许误差,则说明方案不符合准允许误差,则说明方案不符合准确性的要求,就要对方案进行检查和确性的要求,就要对方案进行检查和修正,直至符合准确性的要求为止。修正,直至符合准确性的要求为止。(二二)代表性检查代表性检查所谓代表性检查,是将方案中的样本指标与所谓代表性检查,是将方案中的样本指标与过去已掌握的总体同一指标进行对比,看其过去已掌握的总体同一指标进行对比,看其比率是否超过所规定的要求。比率是否超过所规定的要求。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。