1、武汉科技学院工商学院武汉科技学院工商学院v教学目的要求教学目的要求:通过学习,掌握抽样推断的:通过学习,掌握抽样推断的基本原理,熟练运用误差公式进行抽样估计,基本原理,熟练运用误差公式进行抽样估计,并能结合实际加以灵活应用。并能结合实际加以灵活应用。v重难点重难点:重点是抽样误差的计算原理、区间:重点是抽样误差的计算原理、区间估计及简单随机抽样的基本原理;难点是抽估计及简单随机抽样的基本原理;难点是抽样误差的基本原理。样误差的基本原理。v计划讲授课时计划讲授课时:8学时学时.本章主要内容抽样调查的一般问题总体指标的推断必要抽样数目的确定抽样误差第一节 抽样调查的一般问题v本节主要介绍了抽样调查
2、概念、优本节主要介绍了抽样调查概念、优点、作用、组织方式等基本理论问点、作用、组织方式等基本理论问题。题。v重点掌握抽样调查的概念、优点及重点掌握抽样调查的概念、优点及其组织方式其组织方式.(一)抽样调查的概念所谓抽样调查是指从总体中按随机原则所谓抽样调查是指从总体中按随机原则抽取一部分单位构成样本进行观测,抽取一部分单位构成样本进行观测,然后根据这一部分单位的资料推断总然后根据这一部分单位的资料推断总体数量特征的一种方法体数量特征的一种方法.(二)抽样调查的特点(三)抽样调查的优点节省费用节省费用时效性强时效性强实用性强实用性强准确度高准确度高(四)抽样调查的作用v用于不可能进行全面调查的无
3、限总体;用于不可能进行全面调查的无限总体;v用于不可能进行全面调查而又需要了解其全用于不可能进行全面调查而又需要了解其全面情况的现象;面情况的现象;v用于不必要进行全面调查的现象;用于不必要进行全面调查的现象;v用于对全面调查资料的评价与修正;用于对全面调查资料的评价与修正;v用于工业生产过程的控制,等等。用于工业生产过程的控制,等等。上述作用也可以说是抽样调查的应用范围上述作用也可以说是抽样调查的应用范围.(五)抽样调查的理论基础1.大数法则:它论证了样本平均数趋近它论证了样本平均数趋近于总体平均数的趋势,从而为抽样推断提供于总体平均数的趋势,从而为抽样推断提供了重要的理论依据。了重要的理论
4、依据。2.中心极限定理:它论证了在大样本的情况下,它论证了在大样本的情况下,抽样误差服从于正态分布,从而为抽样误差抽样误差服从于正态分布,从而为抽样误差的概率估计提供了理论基础及使用的方便。的概率估计提供了理论基础及使用的方便。(注意:注意:本部分内容重在逻辑思维上的理解即可,深本部分内容重在逻辑思维上的理解即可,深层次的内容可参看有关数理统计方面的书籍层次的内容可参看有关数理统计方面的书籍).二、抽样调查中的几个基本概念(一)总体与样本1.总体:指要调查研究对象的全体,通常指要调查研究对象的全体,通常称为全及总体或母体。称为全及总体或母体。2.样本:指在全及总体中按随机原则抽取指在全及总体中
5、按随机原则抽取的那部分单位所构成的集合体,通常称的那部分单位所构成的集合体,通常称为抽样总体或样本总体或子体为抽样总体或样本总体或子体.(二)总体指标与样本指标1.总体指标:指根据全及总体各单位标志值计算的有指根据全及总体各单位标志值计算的有关综合指标。由于全及总体是唯一确定的,故根据关综合指标。由于全及总体是唯一确定的,故根据全及总体计算的总体指标也是全及总体计算的总体指标也是唯一确定唯一确定的。常用的的。常用的总体指标有总体单位数、平均数、总体指标有总体单位数、平均数、成数成数、标准差及、标准差及方差等,常用各种大写符号表示。方差等,常用各种大写符号表示。2.样本指标:是根据抽样总体各单位
6、标志值计算的综是根据抽样总体各单位标志值计算的综合指标。由于从一个全及总体中可以抽取许多个不合指标。由于从一个全及总体中可以抽取许多个不同的样本,故样本指标是一个同的样本,故样本指标是一个不确定的随机变量不确定的随机变量。常用的样本指标有样本单位数、平均数、成数、标常用的样本指标有样本单位数、平均数、成数、标准差及方差等,常用小写符号表示准差及方差等,常用小写符号表示.关于成数P的有关概念及计算问题v在抽样调查中,成数是针对交替(或是非)在抽样调查中,成数是针对交替(或是非)标志而言的。标志而言的。v所谓所谓交替标志交替标志,是指只有两种可能结果的标,是指只有两种可能结果的标志(是否,或是非)
7、。如性别要么是男性,志(是否,或是非)。如性别要么是男性,要么是女性;再如考试成绩要么及格,要么要么是女性;再如考试成绩要么及格,要么是不及格,等等。是不及格,等等。v所谓所谓成数成数,就是指交替标志中具有某种特征,就是指交替标志中具有某种特征的单位数占全部总体单位数的比重的单位数占全部总体单位数的比重.(1)成数的平均数v下面以以总体成数为例说明。下面以以总体成数为例说明。v设:设:N表示总体单位数;表示总体单位数;0表示不具有某种特征;表示不具有某种特征;1表示具有某种特征。则:表示具有某种特征。则:0Nv 表示不具有某种特征的单位数;表示不具有某种特征的单位数;1Nv 表示具有某种特征的
8、单位数;表示具有某种特征的单位数;NNN10v显然有:显然有:QPQPNNQNNP1;1:;01故v则:则:NNPQPPQfxfx110v则成数的平均数为:则成数的平均数为:v即,即,成数成数就是指总体中具有某种特征的单位数占就是指总体中具有某种特征的单位数占全部总体单位数的比重。全部总体单位数的比重。(2)成数的标准差xfxf01QP0Q 1P0-P1-P=Q合计P+Qpxx 2)(xx fxx2)(2P2QQP2PQ2PQQP22则:则:)1()(22PPPQQPQPPQQPPQQPP故:故:)1(2PPP各种抽样基本公式一览表;)1(:)(;)(:)1(:)(;)(:;:22222221
9、PQPPFFXXNXXPQPPFFXXNXXNNPFXFXNXXNpxxpxx成数的方差平均数的方差成数的标准差平均数的标准差成数平均数单位数全及总体pqppSffxxSnxxSpqppSffxxSnxxSnnpfxfxnxxnpxxpxx)1()(;)()1()(;)(;22222221样本总体(三)重复抽样与不重复抽样1.重复抽样:是指把从总体中抽中的单位,经登记调是指把从总体中抽中的单位,经登记调查后,再将其放回去,重新参加下一次的抽选,直查后,再将其放回去,重新参加下一次的抽选,直到抽取到抽取n个总体单位。又称为重置抽样或有放回抽个总体单位。又称为重置抽样或有放回抽样。显然,采用此方法
10、抽取样本时,某个总体单位样。显然,采用此方法抽取样本时,某个总体单位有重复抽中的可能,故其名。有重复抽中的可能,故其名。2.不重复抽样:是指把从总体中抽中的单位,经调查是指把从总体中抽中的单位,经调查登记后,不再放回去参加下一次的抽选,直到抽取登记后,不再放回去参加下一次的抽选,直到抽取n个总体单位。显然,采用此法抽取样本时,某个个总体单位。显然,采用此法抽取样本时,某个总体单位不可能被重复抽中,故其名。总体单位不可能被重复抽中,故其名。(四)考虑顺序与不考虑顺序1.考虑顺序:指抽取样本单位时,要考虑抽指抽取样本单位时,要考虑抽中单位出现的先后顺序,如中单位出现的先后顺序,如ABAB与与BAB
11、A是两种是两种不同的抽样组合。不同的抽样组合。2.不考虑顺序:指抽取样本单位时,不考虑指抽取样本单位时,不考虑抽中单位出现的先后顺序,如抽中单位出现的先后顺序,如ABAB与与BABA只算只算一种一种可能的样本组合。可能的样本组合。注意:v由于在社会经济统计中,抽中的样本单位由于在社会经济统计中,抽中的样本单位的先后顺序,对所研究现象的数量计算结的先后顺序,对所研究现象的数量计算结果没有影响,故通常采用不考虑顺序的抽果没有影响,故通常采用不考虑顺序的抽样方法,而考虑顺序的抽样方法则在自然样方法,而考虑顺序的抽样方法则在自然科学研究中采用较多。科学研究中采用较多。v考虑顺序与不考虑顺序抽样所得到的
12、样本考虑顺序与不考虑顺序抽样所得到的样本组合是不同的。组合是不同的。各种抽样方法下可能的样本组合计算公式!)!(!:)!(!:1nnNNCCDnNNANBnNnnNnNnNnnN不考虑顺序考虑顺序不重复抽样重复抽样(五)单阶段抽样与多阶段抽样v所谓所谓单阶段抽样单阶段抽样是指某次抽样时一次是指某次抽样时一次就抽出样本单位的抽样。就抽出样本单位的抽样。v所谓所谓多阶段抽样多阶段抽样是指需经两次或两次是指需经两次或两次以上的抽样,最后才抽样具体样本单以上的抽样,最后才抽样具体样本单位的抽样。如我国职工家计抽样调查位的抽样。如我国职工家计抽样调查采用省抽采用省抽县市县市区(街)区(街)居民家居民家庭
13、户三阶段抽样技术庭户三阶段抽样技术.三、抽样调查的组织方式(一)简单随机抽样1、简单随机抽样的概念和特点(1)概念:是从总体全部单位中不加任何排是从总体全部单位中不加任何排队或分类,完全按照随机原则抽取样本单位队或分类,完全按照随机原则抽取样本单位进行调查的方式。也叫做单纯随机抽样或纯进行调查的方式。也叫做单纯随机抽样或纯随机抽样。随机抽样。(2)基本特点:按随机原则的定义直接从总按随机原则的定义直接从总体中抽取样本单位体中抽取样本单位.(3)适用条件:简单随机抽样适宜于总体简单随机抽样适宜于总体单位数不多且各单位之间差异不大时使用。单位数不多且各单位之间差异不大时使用。(4)优缺点:简单随机
14、抽样优点是最符合简单随机抽样优点是最符合随机抽样原则;不足是编号做签的工作量随机抽样原则;不足是编号做签的工作量较大,总体单位数较多时无法使用且误差较大,总体单位数较多时无法使用且误差往往较大往往较大.2、简单随机抽样抽取样本单位的方法v简单随机抽样抽取样本单位的具体方法主简单随机抽样抽取样本单位的具体方法主要有:要有:(1)抽签法(抓阄法)(抓阄法)。具体作法是:当给。具体作法是:当给总体各个单位编号后,把号码写在结构均总体各个单位编号后,把号码写在结构均匀的签(如同等大小的纸片等)上,将签匀的签(如同等大小的纸片等)上,将签混合均匀后即可以从中抽取。抽签法简便混合均匀后即可以从中抽取。抽签
15、法简便易行,然而对于较大的总体来说,编号、易行,然而对于较大的总体来说,编号、做签条的工作量很大,且不易做到混合均做签条的工作量很大,且不易做到混合均匀。因此,抽签法的应用有一定的局限性匀。因此,抽签法的应用有一定的局限性.(2)机械摇号法v它是先对全部总体单位编号,然后再它是先对全部总体单位编号,然后再利用某种特制的机械,通过机械震动利用某种特制的机械,通过机械震动产生需要抽取调查样本单位号码的方产生需要抽取调查样本单位号码的方法。此法抽取的样本单位随机性高,法。此法抽取的样本单位随机性高,但购置设备的费用较高,只适宜于经但购置设备的费用较高,只适宜于经常开展抽样调查的单位使用常开展抽样调查
16、的单位使用.(3)随机数字表法v所谓所谓随机数字随机数字,就是指用某种机械方法或,就是指用某种机械方法或电子计算机产生的数字序列,数中的电子计算机产生的数字序列,数中的0 0,1 1,2 2,9 9这这1010个数字出现的机会是等概率的,个数字出现的机会是等概率的,但排列顺序则是随机的。将随机产生的数但排列顺序则是随机的。将随机产生的数字用表格的形式表现出来,就是随机数字字用表格的形式表现出来,就是随机数字表。表。v所谓所谓随机数字表法随机数字表法,就是利用随机数字表,就是利用随机数字表随机抽取样本单位的方法。随机抽取样本单位的方法。v有关随机数字表法的具体内容,详见教材有关随机数字表法的具体
17、内容,详见教材(略)(略).(二)类型抽样1、类型抽样的概念和特点(1)概念:是先将总体中所有单位按某一标志分成是先将总体中所有单位按某一标志分成若干组(或类),然后再在各组中随机抽取样本单若干组(或类),然后再在各组中随机抽取样本单位的方式。位的方式。(2)基本特点:先分组,再在各组中随机抽取样本先分组,再在各组中随机抽取样本单位。单位。(3)适用条件:适宜于总体单位多、情况复杂、差适宜于总体单位多、情况复杂、差异较大时使用。异较大时使用。(4)优缺点:优点是样本代表性较高、误差较小;优点是样本代表性较高、误差较小;不足是误差的计算较麻烦不足是误差的计算较麻烦.2、抽取样本单位的具体方法v由
18、于类型抽样是在分组后从各组中抽取样由于类型抽样是在分组后从各组中抽取样本单位,因此,类型抽样条件下抽取样本本单位,因此,类型抽样条件下抽取样本单位主要问题是,在总的样本容量确定后,单位主要问题是,在总的样本容量确定后,样本数目如何在各个组之间分配的问题。样本数目如何在各个组之间分配的问题。类型抽样中,常用以下两种方法确定各层类型抽样中,常用以下两种方法确定各层间样本单位的分配比例。间样本单位的分配比例。(1)等比例抽样:即各组按相同的比例抽取即各组按相同的比例抽取样本单位。样本单位。(2)不等比例抽样:即各组抽取样本单位的即各组抽取样本单位的比例不完全相同。比例不完全相同。(三)等距抽样1、等
19、距抽样的概念和特点(1)概念:是指先按有关或无关标志将总体单位按一是指先按有关或无关标志将总体单位按一定顺序排列,然后再按相等的距离或间隔抽取样本定顺序排列,然后再按相等的距离或间隔抽取样本单位的方式,又叫单位的方式,又叫机械抽样机械抽样。(2)基本特点:先排队,再等距抽选样本。具体特点先排队,再等距抽选样本。具体特点有二:一是有二:一是抽取样本单位的方法简便易行抽取样本单位的方法简便易行;二是;二是估估计量的方差小,样本的代表性较高。计量的方差小,样本的代表性较高。(3)适用条件:适用面广,特别适宜于连续、大批量适用面广,特别适宜于连续、大批量生产的现象的调查。生产的现象的调查。(4)优缺点
20、:优点是通常能保证样本均匀分布,减少优点是通常能保证样本均匀分布,减少误差,提高样本的代表性;不足是有时可能有系统误差,提高样本的代表性;不足是有时可能有系统(周期)性误差(周期)性误差.2、抽取样本单位的具体方法v只有不重复抽样方法。关键是第一个样本只有不重复抽样方法。关键是第一个样本单位的抽选。先按单位的抽选。先按N/n=K求出抽样间隔;求出抽样间隔;再在第一组中按简单随机抽样的方法,抽再在第一组中按简单随机抽样的方法,抽出第一个样本单位;然后再按抽样间隔出第一个样本单位;然后再按抽样间隔K随随之确定其余样本单位。具体又可分为两种:之确定其余样本单位。具体又可分为两种:(1 1)按)按有关
21、标志有关标志排队的等距抽样;排队的等距抽样;(2 2)按)按无关标志无关标志排队的等距抽样排队的等距抽样.(四)整群抽样1、整群抽样的概念和特点(1)概念:是先将总体全部单位划分为若干是先将总体全部单位划分为若干群群(组组),然后以群为单位随机抽取若干群,然后以群为单位随机抽取若干群,对抽中群内的所有单位全部进行调查的方式。对抽中群内的所有单位全部进行调查的方式。(2)基本特点:先分群,再以群为单位抽取样先分群,再以群为单位抽取样本。本。(3)适用条件:适宜于群内差异较小而群与群适宜于群内差异较小而群与群之间差异较大现象的调查。之间差异较大现象的调查。(4)优缺点:优点是抽样组织工作较方便;不
22、优点是抽样组织工作较方便;不足是有时误差较大,样本代表性较低足是有时误差较大,样本代表性较低.2、抽取样本单位的具体方法v在整群抽样中,为避免抽样误差过大,一在整群抽样中,为避免抽样误差过大,一般采用不重复抽样的方法;般采用不重复抽样的方法;v抽选群的方法与简单随机抽样相同抽选群的方法与简单随机抽样相同.第二节 抽样误差v抽样理论是在研究误差的基础上逐步发展抽样理论是在研究误差的基础上逐步发展和完善起来的,误差理论是抽样理论的核和完善起来的,误差理论是抽样理论的核心。心。v本节介绍了抽样误差的概念、影响因素、本节介绍了抽样误差的概念、影响因素、抽样平均误差的概念及其计算原理。抽样平均误差的概念
23、及其计算原理。v重点掌握简单随机抽样方式下抽样平均误重点掌握简单随机抽样方式下抽样平均误差的计算方法差的计算方法.一、抽样误差的概念v抽样误差抽样误差是指随机抽样所得的样本指标与是指随机抽样所得的样本指标与总体指标的随机误差。总体指标的随机误差。抽样平均误差抽样平均误差抽样极限误差抽样极限误差抽样实际误差抽样实际误差(一)登记性误差与代表性误差v所谓所谓登记性误差登记性误差,又称为调查误差或工作,又称为调查误差或工作误差,它是指调查人员在调查过程中,由误差,它是指调查人员在调查过程中,由于工作不认真(如粗心大意抄错、写错、于工作不认真(如粗心大意抄错、写错、写漏等)或计量工具不准确而形成的调查
24、写漏等)或计量工具不准确而形成的调查结果与实际结果之间的差别。这种误差是结果与实际结果之间的差别。这种误差是可以尽量加以克服或避免的。可以尽量加以克服或避免的。v所谓所谓代表性误差代表性误差,是指根据部分(少数),是指根据部分(少数)单位调查的结果去代表(或推断)全部单单位调查的结果去代表(或推断)全部单位的数量特征时,两者之间的差别。这种位的数量特征时,两者之间的差别。这种误差通常是不可避免的误差通常是不可避免的.(二)偏差与随机误差v所谓所谓偏差偏差,是指在随机抽样中调查人员,是指在随机抽样中调查人员(有意识地)破坏了随机原则抽样(即不(有意识地)破坏了随机原则抽样(即不按随机原则抽样),
25、由此形成的样本指标按随机原则抽样),由此形成的样本指标与总体指标之间的差别。在抽样调查中,与总体指标之间的差别。在抽样调查中,通常所说的抽样误差是不包括偏差的,又通常所说的抽样误差是不包括偏差的,又称为系统性误差。称为系统性误差。v所谓所谓随机误差随机误差,是指由于随机抽样的随机,是指由于随机抽样的随机性由此而形成的样本指标与总体指标之间性由此而形成的样本指标与总体指标之间的差别,通常也叫做的差别,通常也叫做抽样误差抽样误差.(三)抽样误差v所谓所谓抽样误差抽样误差,就是指在随机抽样中按随,就是指在随机抽样中按随机原则从总体中抽取一部分单位构成样本,机原则从总体中抽取一部分单位构成样本,并计算
26、出有关样本指标(如样本平均数或并计算出有关样本指标(如样本平均数或成数),再通过样本指标去推断总体有关成数),再通过样本指标去推断总体有关指标(如总体平均数或成数)时两者之间指标(如总体平均数或成数)时两者之间存在着的差别。简而言之,抽样误差就是存在着的差别。简而言之,抽样误差就是样本指标与总体指标之间的差别。样本指标与总体指标之间的差别。v抽样误差是抽样调查不可避免的误差。因抽样误差是抽样调查不可避免的误差。因为部分单位与全部单位的数量特征通常是为部分单位与全部单位的数量特征通常是不可能完全一致的不可能完全一致的.(四)抽样实际误差v所谓所谓抽样实际误差抽样实际误差,是指在对某现象实际,是指
27、在对某现象实际进行抽样时,其样本指标与总体指标之间进行抽样时,其样本指标与总体指标之间的差别。如对某校大学生随机抽取的差别。如对某校大学生随机抽取100人进人进行身高调查,得知这行身高调查,得知这100人的平均身高为人的平均身高为168公分;又知该校全部大学生的平均身高公分;又知该校全部大学生的平均身高为为169公分,两者之间相差公分,两者之间相差1公分,这就是公分,这就是抽样实际误差。抽样实际误差。v抽样实际误差实际上是未知的。因为总体抽样实际误差实际上是未知的。因为总体指标通常是未知的,如果总体指标已知,指标通常是未知的,如果总体指标已知,也就没有必要进行抽样调查了!也就没有必要进行抽样调
28、查了!.二、抽样平均误差1.抽样平均误差的概念:是指所有可能的样本是指所有可能的样本的样本指标与总体指标之间的平均误差(标的样本指标与总体指标之间的平均误差(标准差)。准差)。2.抽样平均误差计算方法(1)抽样平均误差的定义公式:根据抽样平均根据抽样平均误差的定义,其平均数与成数的计算公式分误差的定义,其平均数与成数的计算公式分别为:别为:可能的样本数式中mmPpmXxnipniix:)(,)(1212(2)抽样平均误差的应用公式nx2重复抽样重复抽样不重复抽样不重复抽样1.测定平均数测定平均数时时2.测定成数时测定成数时12NnNnxnPPp)1(1)1(NnNnPPp关于应用公式的几点说明
29、:关于应用公式的几点说明:修正系数的处理问题:当当N较大时可用较大时可用 代替代替重复抽样与不重复抽样误差的关系问题:在其它条件相同的在其它条件相同的情况下不重复抽样的误差比重复的误差小。情况下不重复抽样的误差比重复的误差小。总体方差未知的处理问题:当总体方差当总体方差()未知时,可)未知时,可用样本方差(用样本方差()、历史方差或试验方差代替)、历史方差或试验方差代替.1NnNNn122S(根据定义公式计算根据定义公式计算)设有设有A A、B B、C C三个小孩的年三个小孩的年龄分别为龄分别为1 1、2 2、3 3岁。现从三个中随机抽二个进行调岁。现从三个中随机抽二个进行调查。试根据抽样平均
30、误差的定义计算抽样平均误差。查。试根据抽样平均误差的定义计算抽样平均误差。93223BBmnN解解:(1 1)计算可能的样本数)计算可能的样本数:考虑顺序重复抽样时:考虑顺序重复抽样时:即:即:1、2;2、1;1、3;3、1;2、3;3、2;1、1;2、2;3、3;考虑顺序不重复抽样时:考虑顺序不重复抽样时:6)!23(!323AAmnN即:即:1、2;2、1;1、3;3、1;2、3;3、2;不考虑顺序不重复抽样时:不考虑顺序不重复抽样时:不考虑顺序重复抽样时:不考虑顺序重复抽样时:3!2)!23(!323CCmnN即:即:1、2;1、3;2、3;6!2!2)123()!123(21231CC
31、DmnnNnN即:即:1、2;1、3;2、3;1、1;2、2;3、3;(2 2)下面以不考虑顺序不重复抽样为例说)下面以不考虑顺序不重复抽样为例说明其计算方法:明其计算方法:;5.2232;2231;5.1221321xxx23321X41.03)25.2()22()25.1(222x总体平均数:总体平均数:三个可能样本的样本平均数分别为:三个可能样本的样本平均数分别为:由于三个样本的样本平均数与总体平均数的离差之和等于由于三个样本的样本平均数与总体平均数的离差之和等于0,故不能用离差的算术平均数的方法计算其平均离差,故不能用离差的算术平均数的方法计算其平均离差,为避免离差的总和等于为避免离差
32、的总和等于0,其方法之一就是将离差平方,其方法之一就是将离差平方,再求其平均的离差,由于分子平方了,故需再开方还原,再求其平均的离差,由于分子平方了,故需再开方还原,即:即:(根据应用公式计算根据应用公式计算)从某乡从某乡10001000亩稻亩稻田中随机抽取田中随机抽取5050亩,经秤重量得平均亩产量亩,经秤重量得平均亩产量为为560560公斤,标准差为公斤,标准差为5050公斤。试计算抽样平公斤。试计算抽样平均误差。均误差。)(89.6)1000501(5050)1(22公斤Nnnx解解:由于总体方差未知,故用样本方差代替。由于总体方差未知,故用样本方差代替。则:则:即抽样平均误差为即抽样平
33、均误差为6.89公斤公斤.(根据应用公式计算根据应用公式计算)某公司从购买某公司从购买的的10001000件产品中随机抽取件产品中随机抽取160160件进行检验,发件进行检验,发现其中有现其中有144144件合格。试求合格产品成数的抽件合格。试求合格产品成数的抽样平均误差。样平均误差。%17.2)10001601(160)9.01(9.0)1()1(%,901601441Nnnppnnpp解解:因总体方差未知,故用样本方差代替。则:因总体方差未知,故用样本方差代替。则:即合格品成数的抽样平均误差为即合格品成数的抽样平均误差为2.17%.3.其它方式下抽样平均误差的计算公式(1)类型抽样重复抽样
34、重复抽样不重复抽样不重复抽样测定平均数时测定平均数时测定成数时测定成数时 nx2)1(2NnnxnPP)1()1()1(NnnPP即即 =式中:式中:称为总体平均组内方差,称为总体平均组内方差,2xNNiix22表示总体成数平均组内方差,表示总体成数平均组内方差,)1(PP)1(PPNNPPiii)1((2)等距抽样平均误差的计算方法v一般认为,如果总体是按一般认为,如果总体是按无关标志排队无关标志排队的机械抽的机械抽样,其实质样,其实质与简单随机抽样类似与简单随机抽样类似,它的抽样误差,它的抽样误差就十分接近简单随机抽样的误差。就十分接近简单随机抽样的误差。v为简便起见,实际中常采用简单随机
35、抽样误差公为简便起见,实际中常采用简单随机抽样误差公式来近似计算。如果是按式来近似计算。如果是按有关标志排队有关标志排队的机械抽的机械抽样,其实质又样,其实质又与类型抽样相接近与类型抽样相接近。因此,从理论。因此,从理论上讲,其抽样误差可以借助类型抽样误差公式近上讲,其抽样误差可以借助类型抽样误差公式近似计算。似计算。v但在实际中也可按简单随机抽样误差公式来近似但在实际中也可按简单随机抽样误差公式来近似计算计算.(3)整群抽样平均误差的计算方法 设:总体单位数为设:总体单位数为N,将总体的全部单位数划分为,将总体的全部单位数划分为R群,现从群,现从R个群中随机抽取个群中随机抽取r个群组成样本,
36、并对中个群组成样本,并对中选的选的r个群内的全部单位进行全面调查。则其估计个群内的全部单位进行全面调查。则其估计与推断的公式分别为:与推断的公式分别为:测定平均数时测定平均数时测定成数时测定成数时重复抽样重复抽样)1(2Rrrx)1(2Rrrp表示群间方差表示群间方差.2式中:式中:三、影响抽样误差的因素样本单位数样本单位数(n)总体方差(总体方差()抽样方式抽样方式抽样方法抽样方法影响因素影响因素2四、抽样极限误差由于总体指标是一个确定的量,而样本指标由于总体指标是一个确定的量,而样本指标是一个围绕着总体指标上下波动的随机变是一个围绕着总体指标上下波动的随机变量,即它可能与总体指标发生正、负
37、离差,量,即它可能与总体指标发生正、负离差,这就产生了抽样极限误差的概念。这就产生了抽样极限误差的概念。1.概念:是在一定概率保证条件下,样本指是在一定概率保证条件下,样本指标与总体指标之间抽样实际误差的最大可标与总体指标之间抽样实际误差的最大可能范围。能范围。2.计算方法(或极限误差与平均误差、概率度的关系或极限误差与平均误差、概率度的关系)3.作用:为抽样推断及其可靠性判断提供为抽样推断及其可靠性判断提供依据依据.:,等于则概率度tPpXxpxppt,xxxXxt;xxt,pppPpt五、抽样误差的分布v所谓所谓抽样误差分布抽样误差分布,是指总体全部可能样,是指总体全部可能样本的抽样误差的
38、分布状况。本的抽样误差的分布状况。v数理统计证明数理统计证明:大样本(:大样本(n30)的抽样误)的抽样误差分布为正态分布。这就为抽样极限误差差分布为正态分布。这就为抽样极限误差的计算提供了理论上的依据。如果我们把的计算提供了理论上的依据。如果我们把全部可能样本的样本平均数编制成变量数全部可能样本的样本平均数编制成变量数列并绘制成图形,就可得到一个钟形的光列并绘制成图形,就可得到一个钟形的光滑曲线,即正态分布曲线。滑曲线,即正态分布曲线。v从正态分布曲线图可总结两个特点:一是样本指标高于或低于总体指标的概率分布是一是样本指标高于或低于总体指标的概率分布是完全对称的;二是样本指标接近于总体指标的
39、概完全对称的;二是样本指标接近于总体指标的概率越大(小)出现的可能性也就越大(小)。率越大(小)出现的可能性也就越大(小)。v在抽样中概率在抽样中概率F(t)是指抽样估计的可靠性,即)是指抽样估计的可靠性,即把握程度。概率随概率度(把握程度。概率随概率度(t)的变化而变化,故)的变化而变化,故概率是概率度的函数。为了便于实际使用,通常概率是概率度的函数。为了便于实际使用,通常可按事先编制好的正态分布概率表,来根据事先可按事先编制好的正态分布概率表,来根据事先给定的给定的t值查找出相应的概率值查找出相应的概率F(t).-1 -0.67 -0.33 0 0.33 0.67 1Xx 60%80%10
40、0几个常用的正态分布概率tF(t)1.960.9520.954530.9973第三节 总体指标的推断v抽样调查的目的在于用样本指标去推断抽样调查的目的在于用样本指标去推断总体指标。总体指标。v抽样推断的方法有点估计和区间估计两抽样推断的方法有点估计和区间估计两种。重点掌握区间估计的基本原理种。重点掌握区间估计的基本原理.一.点估计v点估计点估计就是用样本指标直接代替(估计)总体指就是用样本指标直接代替(估计)总体指标的方法。标的方法。例如例如:从某班全部同学抽出:从某班全部同学抽出10人进行人进行调查得知其平均身高为调查得知其平均身高为170公分,男生占公分,男生占60%;则在点估计条件下,可
41、以说该班全部学生的身高则在点估计条件下,可以说该班全部学生的身高为为170公分,男生所占比重为公分,男生所占比重为60%。v点估计的优点点估计的优点是直观、简单、方便。是直观、简单、方便。不足不足是没有是没有考虑估计的误差问题及估计的可靠性。考虑估计的误差问题及估计的可靠性。v评价优良估计量的三大标准评价优良估计量的三大标准:一致性;无偏性;一致性;无偏性;有效性有效性.二.区间估计v区间估计区间估计是根据根据样本指标确定总体指标的是根据根据样本指标确定总体指标的置信区间和置信度。利用抽样所得的样本平均置信区间和置信度。利用抽样所得的样本平均数数 (或成数(或成数p)。)。v即可确定估计的上限
42、即可确定估计的上限 (或(或 )和估)和估计的下限计的下限 (或(或 )。上限和下限之间的)。上限和下限之间的范围称为置信区间;而落在这个范围的可靠程度范围称为置信区间;而落在这个范围的可靠程度叫做置信度叫做置信度t。XxppXx pp pppPp:成数的区间估计公式xXxXx:平均数的区间估计公式v区间估计必备的三要素:抽样估计值(抽样估计值(或或 p)、估计的误差范围即极限误差)、估计的误差范围即极限误差、估计的概、估计的概率率F(t)。xv区间估计的基本公式:区间估计的基本公式:区间估计的一般步骤xXxXxpppPp或xv根据给定的抽样资料,计算样本指标(样本平均根据给定的抽样资料,计算
43、样本指标(样本平均数数 或样本成数或样本成数p););px或v计算抽样极限误差(计算抽样极限误差(););px 或v计算抽样平均误差(计算抽样平均误差(););v计算确定总体平均数或总体成数的区间:计算确定总体平均数或总体成数的区间:22Sv如果总体方差(如果总体方差()资料未知,则根据抽样资)资料未知,则根据抽样资料,计算样本方差料,计算样本方差 (或标准差(或标准差S););某大学有某大学有45004500名学生。现采用不重复简单随机抽样方式名学生。现采用不重复简单随机抽样方式从中随机抽取从中随机抽取10%10%的学生,调查其每月生活费用支出情况。抽样的学生,调查其每月生活费用支出情况。抽
44、样结果显示:学生平均每人每月生活费用支出结果显示:学生平均每人每月生活费用支出350350元,标准差元,标准差8080元,元,生活费用支出在生活费用支出在500500元以上的学生占元以上的学生占20%20%。要求:在要求:在95.45%95.45%的概率保证下估计全部学生月平均生活费用支的概率保证下估计全部学生月平均生活费用支出的可能范围,以及月生活费用在出的可能范围,以及月生活费用在500500元以上的学生所占比重的元以上的学生所占比重的可能范围。可能范围。解:解::%20,80,350,450%104500,4500:则已知pSxnN%79.1)45004501(450%)201%(20)
45、,(58.3)45004501(450802px元2%,45.95)(ttF故查表得又知),(16.758.32:元则x之间至即在16.35784.342,16.735016.7350X:,用的可能范围为全部学生月平均生活费故%58.3%79.12p之间至即在%58.23%42.16%,58.3%20%58.3%20P:500的可能范围为元以上的学生所占比重在全部学生中月生活费用对某企业对某企业100100名职工的工资进行抽样调查得下表资料。名职工的工资进行抽样调查得下表资料。试以试以0.95450.9545的概率估计该企业全部职工月平均工资(元)的可的概率估计该企业全部职工月平均工资(元)的
46、可能范围。能范围。月平均工资月平均工资职工人职工人数(数(f f)组中值组中值(x x)800800以下以下80080090090090090010001000100010001100110011001100以上以上15152020505010105 57507508508509509501050105011501150合计合计100100解解:有关计算如下:有关计算如下:则以则以0.9545的概率估计该企业全部职工的月平均工资在的概率估计该企业全部职工的月平均工资在899.9元元940.1元之间元之间.,92010092000fxfx50.100)(2ffxxSx1.2005.102,05.
47、102xxxxtnS:,:即估计区间xxxXx1.209201.20920X对某批商品按不重复抽样方法抽取对某批商品按不重复抽样方法抽取200200件进行检验件进行检验,其其中合格品为中合格品为160160件。又知道所抽检商品件数占总件数的件。又知道所抽检商品件数占总件数的1/201/20。试以试以99.73%99.73%的概率估计该批商品合格率的区间范围的概率估计该批商品合格率的区间范围。16.0)8.01(8.0)1(%,8020016021ppSnnpp解解:有关计算如下:有关计算如下:%76.2)2011(20016.0)1()1(NnnPpp%28.8%76.23ppt%28.8%8
48、0%28.8%80:P则%28.88%72.71:P即v 故以故以99.73%的概率估计全部商品合格率在的概率估计全部商品合格率在71.72%88.28%之间之间.第四节 必要抽样数目的确定v必要抽样数目的确定,也叫做样本容量必要抽样数目的确定,也叫做样本容量的确定。所谓必要,是指以最少的人财的确定。所谓必要,是指以最少的人财物,取得最好的抽样推断效果。物,取得最好的抽样推断效果。v抽样数目的多少与抽样费用、抽样估计抽样数目的多少与抽样费用、抽样估计精确度相关精确度相关.一、必要抽样数目的影响因素 主要因素有:二、必要抽样数目的计算方法在抽样调查之前,调查者通常要根据调查对象在抽样调查之前,调
49、查者通常要根据调查对象的特点和研究目的,提出以下两条主要要求:的特点和研究目的,提出以下两条主要要求:1.1.抽样调查的误差范围或允许误差不得大于多抽样调查的误差范围或允许误差不得大于多少,这是规定了误差范围少,这是规定了误差范围的值;的值;2.2.抽样推断的结果要有多大的保证(可靠)程抽样推断的结果要有多大的保证(可靠)程度,这是规定了概率度度,这是规定了概率度t t的值。的值。v由此可见,必要抽样数目的计算公式,是从由此可见,必要抽样数目的计算公式,是从 这个公式中推导出来的:这个公式中推导出来的:tntn22222tnv两边平方并移项,得:两边平方并移项,得:v其它公式,均可依此类推(参
50、见教材)其它公式,均可依此类推(参见教材).假定某乡有农户假定某乡有农户1800018000户户,在某次抽样调查中拟采用重在某次抽样调查中拟采用重复的纯随机抽样方式。现要求人均收入的允许误差控制在复的纯随机抽样方式。现要求人均收入的允许误差控制在150150元之内,保证概率为元之内,保证概率为95.45%95.45%,问应抽多少户进行调查?如果,问应抽多少户进行调查?如果要求允许误差控制在要求允许误差控制在7575之内,则至少应抽多少户进行调查?之内,则至少应抽多少户进行调查?(注:根据以往调查知全乡人均收入的标准差为(注:根据以往调查知全乡人均收入的标准差为15001500元)元))(400