1、统计学统计学课件课件4/16/2022浙江财经学院1本本 章章 要要 求求1、基本概念、基本概念2、抽样指标计算、抽样指标计算3、抽样平均误差的影响因素及计算、抽样平均误差的影响因素及计算4、全及指标推断:抽样极限误差计算、置、全及指标推断:抽样极限误差计算、置信区间计算信区间计算5、简单随机抽样重复抽样的必要抽样单位、简单随机抽样重复抽样的必要抽样单位数计算数计算掌握掌握统计学统计学课件课件4/16/2022浙江财经学院21、抽样调查分类、抽样调查分类2、抽样调查特点、抽样调查特点3、全及总体分类及全及指标、全及总体分类及全及指标4、抽样方式分类、抽样方式分类5、抽样误差概念及分类、抽样误差
2、概念及分类6、抽样平均误差影响因素、抽样平均误差影响因素7、可信程度、概率度、可信程度、概率度8、抽样方案设计基本原则、抽样方案设计基本原则9、主要的抽样组织方式种类、主要的抽样组织方式种类理解理解统计学统计学课件课件4/16/2022浙江财经学院31、抽样调查的意义、抽样调查的意义2、抽样调查的适用范围、抽样调查的适用范围3、不同抽样方式的可能样本数目、不同抽样方式的可能样本数目4、抽样调查的理论依据、抽样调查的理论依据5、抽样平均误差的意义、抽样平均误差的意义6、各种抽样组织方式介绍、各种抽样组织方式介绍7、不重复抽样的必要抽样单位数计算、不重复抽样的必要抽样单位数计算了了 解解统计学统计
3、学课件课件4/16/2022浙江财经学院4第一节第一节 概述概述第二节第二节 基本概念及理论依据基本概念及理论依据第三节第三节 抽样平均误差抽样平均误差第四节第四节 全及指标推断全及指标推断第五节第五节 抽样方案设计抽样方案设计练练 习习 题题人均教育支出抽样调查案例人均教育支出抽样调查案例统计学统计学课件课件54/16/2022浙江财经学院第一节第一节 概概 述述统计学统计学课件课件4/16/2022浙江财经学院61、抽样调查概念、抽样调查概念广义:抽取部分单位观察,并根据观察结果推断全体。广义:抽取部分单位观察,并根据观察结果推断全体。随机抽样:随机抽样:保证总体中各单位具有同等机会被抽中
4、,保证总体中各单位具有同等机会被抽中,客观地抽取样本,并推断总体。客观地抽取样本,并推断总体。狭义:按照随机原则抽取部分单位观察,并运用数理狭义:按照随机原则抽取部分单位观察,并运用数理统计方法,由部分对总体做出数量上的推断分析。统计方法,由部分对总体做出数量上的推断分析。 统计学统计学课件课件4/16/2022浙江财经学院72 2、特、特 点点1 1)只抽取部分单位;)只抽取部分单位;2 2)用部分推断总体;)用部分推断总体;3 3)抽样遵循随机原则;)抽样遵循随机原则;4 4)会产生抽样误差,但误差可以计算和控制。)会产生抽样误差,但误差可以计算和控制。3 3、统计误差、统计误差统计数字与
5、各种实际数量之间的差别。统计数字与各种实际数量之间的差别。登记误差:登记误差:代表性误差:代表性误差:调查误差或工作误差,指在登记、汇总计调查误差或工作误差,指在登记、汇总计算过程中产生的误差。(可以避免的)算过程中产生的误差。(可以避免的)用部分去推断总体产生的误差。用部分去推断总体产生的误差。(一般不可避免)(一般不可避免)返回目录返回目录统计学统计学课件课件84/16/2022浙江财经学院第二节第二节 基本概念及理论依据基本概念及理论依据统计学统计学课件课件4/16/2022浙江财经学院9一、基一、基 本本 概概 念念1 1、全及总体:、全及总体:所要认识对象的全体。所要认识对象的全体。
6、变量总体:变量总体:属性总体:属性总体:总体中总体单位的标志为品质标志总体中总体单位的标志为品质标志2 2、抽样总体:、抽样总体:从全及总体随机抽取得部分单位的集合体。从全及总体随机抽取得部分单位的集合体。一个全及总体中,可以抽取多个抽样总体,即抽样总体一个全及总体中,可以抽取多个抽样总体,即抽样总体不是唯一的。一般认为,样本容量大于不是唯一的。一般认为,样本容量大于30的称为大样本,的称为大样本,小于小于30个单位数的称为小样本。个单位数的称为小样本。总体中总体单位的标志为数量标志总体中总体单位的标志为数量标志( (一一) )全及总体和抽样总体全及总体和抽样总体统计学统计学课件课件4/16/
7、2022浙江财经学院101 1、全及指标:、全及指标:根据全及总体中的各单位标志值或标志特征根据全及总体中的各单位标志值或标志特征 计算的、反映总体某种属性的综合指标。计算的、反映总体某种属性的综合指标。变量总体:变量总体:属性总体:属性总体:11(1)NPQNPPPQ N N1 1 具有某种属性的单位数具有某种属性的单位数 , N N0 0 不具有某种属性的单位数不具有某种属性的单位数 10QPNNQNXXNXX2)(称为总体标准差(二二)全及指标和抽样指标全及指标和抽样指标统计学统计学课件课件4/16/2022浙江财经学院11属性总体成数方差公式推导:属性总体成数方差公式推导:则属性总体的
8、平均数则属性总体的平均数PNNNNNNFXFX1010101XF及格1N1不及格0N00102122)0()1 ()(NNNPNPffXXPPQPPPPPP)1 ()1 ()1 (22统计学统计学课件课件4/16/2022浙江财经学院122 2、抽样指标:、抽样指标:根据抽样总体中的各单位标志值或标志特征根据抽样总体中的各单位标志值或标志特征 计算的综合指标。计算的综合指标。变量总体:变量总体:1)(2nxxSnxx称为样本标准差S属性总体:属性总体:01nqnpq n n1 1 具有某种属性的单位数具有某种属性的单位数 , n n0 0 不具有某种属性的单位数不具有某种属性的单位数 pqpp
9、Snnp)1 (1统计学统计学课件课件4/16/2022浙江财经学院13(三三)抽样方法和样本可能数目抽样方法和样本可能数目1 1、抽样方法:从全及总体随机抽取得部分单位的集合体。、抽样方法:从全及总体随机抽取得部分单位的集合体。样本数目与样本容量有关,也与抽样方法有关,样本容量样本数目与样本容量有关,也与抽样方法有关,样本容量既定,则样本数目取决于抽样的方法。既定,则样本数目取决于抽样的方法。抽样方式不同抽样方式不同重复抽样重复抽样不重复抽样不重复抽样样本要求不同样本要求不同考虑顺序抽样考虑顺序抽样不考虑顺序抽样不考虑顺序抽样以上结合为四种抽样方法:考虑顺序的重复抽样、考虑以上结合为四种抽样
10、方法:考虑顺序的重复抽样、考虑顺序的不重复抽样、不考虑顺序的重复抽样和不考虑顺顺序的不重复抽样、不考虑顺序的重复抽样和不考虑顺序的不重复抽样。序的不重复抽样。统计学统计学课件课件4/16/2022浙江财经学院142 2、不同抽样方法的样本可能数目、不同抽样方法的样本可能数目2)考虑顺序的不重复抽样)考虑顺序的不重复抽样)!(!)1()1(nNNnNNNAnN3)不考虑顺序的不重复抽样)不考虑顺序的不重复抽样)!( !)1()1(nNnNnnNNNCnNnnNNB1)考虑顺序的重复抽样)考虑顺序的重复抽样nnNnNCD14)不考虑顺序的重复抽样)不考虑顺序的重复抽样统计学统计学课件课件4/16/
11、2022浙江财经学院15例如:一个盒子里有三个球,标号分别为例如:一个盒子里有三个球,标号分别为1 1、2 2、3 3,现从中,现从中随机抽取两个。即随机抽取两个。即N=3N=3,n=2n=2:1)考虑顺序的重复抽样)考虑顺序的重复抽样123111121322122233313233932nNB2)考虑顺序的不重复抽样)考虑顺序的不重复抽样6)!23(! 3nNA62123CDnN3)不考虑顺序的重复抽样)不考虑顺序的重复抽样4)不考虑顺序的不重复抽样)不考虑顺序的不重复抽样3)!23( !2! 3nNC统计学统计学课件课件4/16/2022浙江财经学院16二、抽样调查的理论依据二、抽样调查的
12、理论依据1 1、大数定律:、大数定律:该定律表明,当样本单位数该定律表明,当样本单位数n n足够大时,抽样平均数足够大时,抽样平均数趋近于总体平均数,抽样成数趋近于总体平均数,抽样成数p p趋近于总体成数趋近于总体成数P P。这。这为抽样推断提供了重要依据。为抽样推断提供了重要依据。2 2、中心极限定律:、中心极限定律:该定律证明,不论总体服从何种分布,只要它的数学该定律证明,不论总体服从何种分布,只要它的数学期望和方差存在,从中抽取容量为期望和方差存在,从中抽取容量为n n的样本,当的样本,当n n足够大,足够大,则这个样本的平均数趋于正态分布。这为抽样误差的概则这个样本的平均数趋于正态分布
13、。这为抽样误差的概率估计提供了依据。率估计提供了依据。xXx返回目录返回目录统计学统计学课件课件174/16/2022浙江财经学院第三节第三节 抽样平均误差抽样平均误差统计学统计学课件课件4/16/2022浙江财经学院18一、抽样误差的概念和理解一、抽样误差的概念和理解1 1、抽样误差:、抽样误差:来源于登记性误差和代表性误差。来源于登记性误差和代表性误差。调查误差或工作误差,指在调查、编调查误差或工作误差,指在调查、编辑、编码、汇总过程中由于观察、测辑、编码、汇总过程中由于观察、测量、登记、计算上的差错或被调查者量、登记、计算上的差错或被调查者提供虚假资料而引起的误差。提供虚假资料而引起的误
14、差。 这种误差的直接表现就是没有真实客观地搜集或记这种误差的直接表现就是没有真实客观地搜集或记录被调查单位的标志值或标志特征,从而使所计算的统录被调查单位的标志值或标志特征,从而使所计算的统计量偏离其真实值。计量偏离其真实值。 登记性误差存在于所有的统计调查中,而且调查的登记性误差存在于所有的统计调查中,而且调查的范围越大、调查单位越多,产生误差的可能性越大。范围越大、调查单位越多,产生误差的可能性越大。 登记性误差与测量工具的精度、测量技术、调查人登记性误差与测量工具的精度、测量技术、调查人员的责任心、被调查者的合作态度等密切相关。员的责任心、被调查者的合作态度等密切相关。登记性误差:登记性
15、误差:统计学统计学课件课件4/16/2022浙江财经学院19代表性误差:代表性误差:抽样过程中产生的以及用部分去推断总体过抽样过程中产生的以及用部分去推断总体过程中产生的误差。(一般不可避免)程中产生的误差。(一般不可避免)代表性误差又分为两种:代表性误差又分为两种:偏差:系统性误差偏差:系统性误差 由非随机因素(违背随机原则)造成样本代表性不足而产由非随机因素(违背随机原则)造成样本代表性不足而产生的误差。表现为样本统计量的值系统性偏高或偏低。这种生的误差。表现为样本统计量的值系统性偏高或偏低。这种误差也属于工作态度、水平、技术等的问题。应尽量避免。误差也属于工作态度、水平、技术等的问题。应
16、尽量避免。随机误差:偶然性误差随机误差:偶然性误差 遵循了随机原则的原则,由偶然因素引起样本结构不能遵循了随机原则的原则,由偶然因素引起样本结构不能完全代表总体结构而产生的误差。偶然误差不可避免,即完全代表总体结构而产生的误差。偶然误差不可避免,即使没有登记误差和系统性误差,仍会存在误差。使没有登记误差和系统性误差,仍会存在误差。 虽然不虽然不可避免,但可以估计和控制。偶然误差总和等于可避免,但可以估计和控制。偶然误差总和等于0 0。 全面调查不存在偶然误差。全面调查不存在偶然误差。统计学统计学课件课件4/16/2022浙江财经学院20抽样中的抽样中的总误差总误差登记性误差登记性误差代表性误差
17、代表性误差系统性误差系统性误差随机误差:偶然误差随机误差:偶然误差偏差:偏差:实际误差实际误差抽样平均误差抽样平均误差随机误差又可以分为实际误差和抽样平均误差。随机误差又可以分为实际误差和抽样平均误差。 实际误差:样本指标与总体指标之间的实际差别,无法直实际误差:样本指标与总体指标之间的实际差别,无法直接计算。接计算。 抽样平均误差:所有可能抽取的样本的指标的标准差,代抽样平均误差:所有可能抽取的样本的指标的标准差,代表了所有样本平均数(成数)与总体平均数(成数)的差距表了所有样本平均数(成数)与总体平均数(成数)的差距的平均,可以计算,我们讨论的就是这种误差。的平均,可以计算,我们讨论的就是
18、这种误差。统计学统计学课件课件4/16/2022浙江财经学院21二、抽样平均误差的计算二、抽样平均误差的计算1 1、理论公式、理论公式kPpkikXxipix22(), 2 , 1()()属性总体变量总体 实际上,全及指标是未知的,而且实践中只会实际上,全及指标是未知的,而且实践中只会抽样一个样本。所以这个公式实践中不采用。抽样一个样本。所以这个公式实践中不采用。统计学统计学课件课件4/16/2022浙江财经学院222 2、实际使用公式、实际使用公式nnx2变量总体:公式说明了,抽样平均误差仅为全及总体标准差的公式说明了,抽样平均误差仅为全及总体标准差的 。n1为总体标准差为总体标准差(1 1
19、)重复抽样:)重复抽样:nPPP)1 ( 属性总体:P P为总体成数为总体成数统计学统计学课件课件4/16/2022浙江财经学院23(2)不重复抽样:)不重复抽样:很大时)当NNnnNnNnx()1 ()1(22当抽样比大大小于当抽样比大大小于1时,不重复抽样的抽时,不重复抽样的抽样平均误差与重复抽样的很接近。样平均误差与重复抽样的很接近。)1()1(NnnPPP统计学统计学课件课件4/16/2022浙江财经学院24前面公式中用的是总体标准差和总体成数,前面公式中用的是总体标准差和总体成数,而总体标准差和总体成数是未知的,实际运用中,而总体标准差和总体成数是未知的,实际运用中,常采用以下方法估
20、计:常采用以下方法估计:1、用过去的取得的资料;、用过去的取得的资料;2、用样本方差和成数代替总体方差和成数;、用样本方差和成数代替总体方差和成数;3、用小规模的调查资料;、用小规模的调查资料;4、用预估的资料。、用预估的资料。 一般采用第二种方法,即用样本方差和一般采用第二种方法,即用样本方差和成数代替总体方差和成数。成数代替总体方差和成数。统计学统计学课件课件4/16/2022浙江财经学院251 1、抽样平均误差计算总结、抽样平均误差计算总结变量总体变量总体重复抽样重复抽样不重复抽样不重复抽样nxNnnx1属性总体属性总体重复抽样重复抽样不重复抽样不重复抽样nPPp)1( )1()1(Nn
21、nPPp 现实中,总体标准差往往是未知的,此时采用样本标准差现实中,总体标准差往往是未知的,此时采用样本标准差和样本成数作为总体标准差和总体成数的估计值。当总体单位和样本成数作为总体标准差和总体成数的估计值。当总体单位总数未知时,则默认采用重复抽样的计算公式。总数未知时,则默认采用重复抽样的计算公式。例例统计学统计学课件课件4/16/2022浙江财经学院262 2、抽样平均误差的影响因素:、抽样平均误差的影响因素:1)全及总体标志变动程度。总体标志变动越大,)全及总体标志变动程度。总体标志变动越大,抽样平均误差越大,反之则越小。抽样平均误差越大,反之则越小。2)抽样单位数的多少。其他条件不变,
22、抽取的)抽样单位数的多少。其他条件不变,抽取的单位数越多,抽样平均误差越小,反之越大。单位数越多,抽样平均误差越小,反之越大。3)抽样方法。重复抽样的平均误差大,不)抽样方法。重复抽样的平均误差大,不重复抽样的平均误差小。重复抽样的平均误差小。返回目录返回目录4)抽样的组织方式。)抽样的组织方式。 统计学统计学课件课件274/16/2022浙江财经学院第四节第四节 全及指标的推断全及指标的推断统计学统计学课件课件4/16/2022浙江财经学院28一、概述一、概述 抽样调查的目的是为了用样本指标推断总抽样调查的目的是为了用样本指标推断总体指标。对总体指标的估计方法有两种,一体指标。对总体指标的估
23、计方法有两种,一种是点估计,一种是区间估计。种是点估计,一种是区间估计。 点估计不能说明误差大小,意义不大。点估计不能说明误差大小,意义不大。区间估计,可以将误差控制在一定的范区间估计,可以将误差控制在一定的范围内(即说明总体指标在某一范围内的可能围内(即说明总体指标在某一范围内的可能性大小)性大小) 。统计学统计学课件课件4/16/2022浙江财经学院29二、抽样极限误差二、抽样极限误差XxxPpp 由于存在误差,而且抽样指标会随着样本的不同由于存在误差,而且抽样指标会随着样本的不同而而 变动。这样,可以在统计意义上,推断总体指标在变动。这样,可以在统计意义上,推断总体指标在一定范围内。样本
24、指标与总体指标的离差绝对值就是一定范围内。样本指标与总体指标的离差绝对值就是抽样极限误差抽样极限误差 。由于离差可正可负,整个变动的。由于离差可正可负,整个变动的范围区间称为置信区间。范围区间称为置信区间。变量总体变量总体属性总体属性总体统计学统计学课件课件4/16/2022浙江财经学院30置信区间:置信区间:,xxxxX,ppppP对上式去掉绝对值符号,并且移项可得到:对上式去掉绝对值符号,并且移项可得到:pppPpxxxXx置信区间是统计意义上的,即一定概率下,置信区间是统计意义上的,即一定概率下,总体指标所落在的区间。总体指标所落在的区间。统计学统计学课件课件4/16/2022浙江财经学
25、院31 抽样平均误差说明估计的准确抽样平均误差说明估计的准确 程度,因此可以程度,因此可以将抽样平均误差作为误差单位(当然在不同的条件将抽样平均误差作为误差单位(当然在不同的条件下,这个单位的具体值是不同的),抽样极限误差下,这个单位的具体值是不同的),抽样极限误差可以表示为多少个误差单位(即抽样平均误差的多可以表示为多少个误差单位(即抽样平均误差的多少倍),表示为:少倍),表示为:xxtXx 抽样极限误差为抽样极限误差为t个抽样平均误差,或者是抽样个抽样平均误差,或者是抽样平均误差的平均误差的t倍。这个倍。这个t就称为概率度或置信度。就称为概率度或置信度。 显然,概率度与抽样极限误差成正比。
26、显然,概率度与抽样极限误差成正比。pptPp统计学统计学课件课件4/16/2022浙江财经学院32t)(tFP Px%27.68%45.95%73.99112233(概率)(概率)统计学统计学课件课件4/16/2022浙江财经学院33四、全及平均指标的区间估计计算步骤四、全及平均指标的区间估计计算步骤 根据上面的讨论,全及平均指标推断的最终结根据上面的讨论,全及平均指标推断的最终结果表现为一定概率保证程度下的置信区间。果表现为一定概率保证程度下的置信区间。 2、根据概率保证要求,查表得出、根据概率保证要求,查表得出 值,然后计算值,然后计算 出抽样极限误差出抽样极限误差 。t 3、得出置信区间
27、、得出置信区间,xxxx 显然:当置信区间已知时,可以根据已知条件倒显然:当置信区间已知时,可以根据已知条件倒推,计算抽样平均误差、样本容量、概率度等。推,计算抽样平均误差、样本容量、概率度等。1、根据调查资料计算出抽样平均误差、根据调查资料计算出抽样平均误差,pppp例例统计学统计学课件课件4/16/2022浙江财经学院34nttxx2222xtn重复抽样:重复抽样:不重复抽样:不重复抽样:)1(2Nnnttxx22222tNNtnx五、简单随机抽样的必要样本容量的确定五、简单随机抽样的必要样本容量的确定( (一)计算公式:一)计算公式:nppttpp)1( 22)1(ppptn)1()1(
28、222pptNppNtnp例例统计学统计学课件课件4/16/2022浙江财经学院35(二)确定抽样单位数的依据(二)确定抽样单位数的依据1、推断可靠程度和精确度要求;高则抽样单、推断可靠程度和精确度要求;高则抽样单位多,反之少。位多,反之少。2、总体变异程度,大则多,小则少。、总体变异程度,大则多,小则少。3、采用何种抽样组织方法。简单随机抽样所、采用何种抽样组织方法。简单随机抽样所需要的抽样单位数一般大与其他抽样方法,需要的抽样单位数一般大与其他抽样方法,不重复抽样学要的单位数少于重复抽样。不重复抽样学要的单位数少于重复抽样。4、根据成本效益原则。、根据成本效益原则。返回目录返回目录统计学统
29、计学课件课件364/16/2022浙江财经学院第五节第五节 抽样方案设计抽样方案设计统计学统计学课件课件4/16/2022浙江财经学院37一、抽样方案设计的原则一、抽样方案设计的原则1)保证实现抽样随机性的原则;)保证实现抽样随机性的原则;2)保证实现最大抽样效果原则。)保证实现最大抽样效果原则。1)直接抽选法;)直接抽选法;2)抽签法)抽签法3)随机数码表法)随机数码表法统计学统计学课件课件4/16/2022浙江财经学院38(二)类型抽样(分类抽样、分层抽样)(二)类型抽样(分类抽样、分层抽样) 类型抽样是先对总体各单位按一定标志加类型抽样是先对总体各单位按一定标志加以分类,然后再从各类中按
30、随机原则抽取样本,以分类,然后再从各类中按随机原则抽取样本,由各类中的样本组成一个总的样本。由各类中的样本组成一个总的样本。 确定各类型组的抽样单位数:确定各类型组的抽样单位数: (1)标志差异大的组多抽一些,标志差异小标志差异大的组多抽一些,标志差异小的组少抽一些;的组少抽一些; (2)按各组的单位数占总体单位数的比例来按各组的单位数占总体单位数的比例来确定各组的抽样单位数,称为类型比例抽样,确定各组的抽样单位数,称为类型比例抽样,这是通常采用的方法。这是通常采用的方法。适用于各组组间单位标志差异较大,而组适用于各组组间单位标志差异较大,而组内差异较小的情况。内差异较小的情况。统计学统计学课
31、件课件4/16/2022浙江财经学院39(三)机械抽样(等距抽样、系统抽样)(三)机械抽样(等距抽样、系统抽样)机械抽样是对研究的总体按一定的顺序机械抽样是对研究的总体按一定的顺序排列,每隔一定的间隔抽取一个或若干个单排列,每隔一定的间隔抽取一个或若干个单位,将这些抽取的单位组成样本。位,将这些抽取的单位组成样本。方法有:方法有:(1)随机起点等距抽样)随机起点等距抽样(2)半距起点等距抽样)半距起点等距抽样(3)对称等距抽样)对称等距抽样机械抽样是一种简单易行的,在大规模机械抽样是一种简单易行的,在大规模抽样调查中常用的方法。抽样调查中常用的方法。统计学统计学课件课件4/16/2022浙江财
32、经学院40(四)整群抽样(四)整群抽样整群抽样是将总体划分为由总体单位所整群抽样是将总体划分为由总体单位所组成的若干群,然后以群为抽样单位,从总组成的若干群,然后以群为抽样单位,从总体中抽取若干个群体作为样本,对选中群内体中抽取若干个群体作为样本,对选中群内的所有单位进行全面调查的抽样方式。的所有单位进行全面调查的抽样方式。当群间差异较小,而群内差异较大时适当群间差异较小,而群内差异较大时适合采用。或者说,在分群时应使群内方差尽合采用。或者说,在分群时应使群内方差尽可能大,而使群间方差尽可能小。可能大,而使群间方差尽可能小。统计学统计学课件课件4/16/2022浙江财经学院41多阶段抽样是先从
33、总体中抽取部分群,多阶段抽样是先从总体中抽取部分群,再从抽中的群内抽取部分群或单位进行调查。再从抽中的群内抽取部分群或单位进行调查。比如对某省农户进行调查,先从全省抽取部比如对某省农户进行调查,先从全省抽取部分县作为第一阶段抽取的样本,再从抽中的分县作为第一阶段抽取的样本,再从抽中的县内,抽取部分乡或村作为第二阶段抽取的县内,抽取部分乡或村作为第二阶段抽取的样本,再从抽中的乡或村内,抽取部分农户样本,再从抽中的乡或村内,抽取部分农户进行调查。进行调查。多阶段抽样在组织技术上是整群抽样和多阶段抽样在组织技术上是整群抽样和类型抽样的综合。类型抽样的综合。(五)多阶段抽样(五)多阶段抽样返回总目录返
34、回总目录返回目录返回目录统计学统计学课件课件424/16/2022浙江财经学院例例 题题统计学统计学课件课件4/16/2022浙江财经学院43例例1 1、某地对、某地对1 1万亩粮食耕地进行粮食产量调查,根据去万亩粮食耕地进行粮食产量调查,根据去年的资料,去年亩产年的资料,去年亩产10001000公斤,方差为公斤,方差为500500,此次抽取,此次抽取100100亩耕地调查,平均亩产亩耕地调查,平均亩产10501050公斤,请问在重复和不重复抽公斤,请问在重复和不重复抽样条件下,调查平均亩产的抽样平均误差分别为多少?样条件下,调查平均亩产的抽样平均误差分别为多少?(公斤)22.21000010
35、011005001Nnnx重复抽样:重复抽样:(公斤)236.25100500nx不重复抽样:不重复抽样:统计学统计学课件课件4/16/2022浙江财经学院44例例2某公司进口一批电子器件某公司进口一批电子器件5000件,为了检测其寿命,件,为了检测其寿命,抽取了抽取了500件进行检验,结果如下:件进行检验,结果如下:分别计算重复抽样和不重复抽样方式下电子器件的抽样分别计算重复抽样和不重复抽样方式下电子器件的抽样平均误差。平均误差。寿命寿命千小时千小时器件数器件数(只)(只)8以下以下208-9709-1034010-114011以上以上30合合 计计500组中值组中值xffx2fxfxx2)
36、( 1505953230420345474011255057.53068544103967.54524578.4167.230.13641.62122.41309.87.58.59.510.511.5统计学统计学课件课件4/16/2022浙江财经学院45千小时)(48.95004740fxfx千小时)(79. 048. 950045245222xffxS重复抽样下:重复抽样下:千小时)(04.050079.0nSnx不重复抽样下:不重复抽样下:(千小时)03.05000500150079.01NnnSx统计学统计学课件课件4/16/2022浙江财经学院46例例3:如果寿命低于如果寿命低于900
37、0小时的产品是不合格品,计算小时的产品是不合格品,计算不合格率的抽样平均误差。不合格率的抽样平均误差。%18500901nnpx不合格率:不合格率:%42.38)18.01(18.0)1(ppSp重复抽样下:重复抽样下:%72.15003842.0nSpp不重复抽样下:不重复抽样下:%71.1500050015003842.01NnnSpp返回返回统计学统计学课件课件4/16/2022浙江财经学院47例例4 某公司对一批新产品的使用寿命进行测试。随机某公司对一批新产品的使用寿命进行测试。随机收取了收取了400个产品,测得其平均寿命为个产品,测得其平均寿命为2800小时,标小时,标准差准差100
38、小时,不合格产品数为小时,不合格产品数为80个。个。要求(要求(1)以)以95.45的可靠程度估计这批新产品的平的可靠程度估计这批新产品的平均使用寿命均使用寿命(2 2)以)以95%95%的可靠程度估计这批新产品的不合格率;的可靠程度估计这批新产品的不合格率;(3 3)若要将这批产品的使用寿命范围控制在)若要将这批产品的使用寿命范围控制在2788278828122812小时之间,其他条件不变,则应该抽取多少个零小时之间,其他条件不变,则应该抽取多少个零件进行测试?件进行测试?(4 4)若要将这批产品的不合格率控制在)若要将这批产品的不合格率控制在15%15%25%25%之间,之间,并保证有并保
39、证有9595的置信度,则至少应该抽取多少个产品的置信度,则至少应该抽取多少个产品进行测试?进行测试?答案答案1答案答案2统计学统计学课件课件4/16/2022浙江财经学院48小时)(5400100nSnx小时)(1052xxt则这批新产品在则这批新产品在95.45%95.45%的可靠程度上的置信区间的可靠程度上的置信区间为(为(27902790,28102810)小时。)小时。(1)2%45.95)(ttFxxxXx28102790102800102800XX统计学统计学课件课件4/16/2022浙江财经学院49%2400)2.01(2.0)1(nppp(2)%92. 3%296. 1ppt9
40、6. 1%95)(ttF%92.23%08.16%92.3%20%92.3%20PP在在95%95%的可靠程度下这批新产品的不合格率为的可靠程度下这批新产品的不合格率为 (16.0816.08,23.9223.92)%20400/80p不合格率:返回返回统计学统计学课件课件4/16/2022浙江财经学院50(3)122788280028002812122/ )27882812(xx或个)(8 .277121002222222222xxSttn在在95.45%95.45%的可靠程度的可靠程度, ,至少需要抽取至少需要抽取278278个产品,个产品,才能满足可靠性和准确度要求。才能满足可靠性和准确
41、度要求。统计学统计学课件课件4/16/2022浙江财经学院51%5%20%25%52/%)15%25(pp或个)(9 .24505. 08 . 02 . 096. 1)1 (2222ppptn在在95%95%的可靠程度的可靠程度, ,至少需要抽取至少需要抽取246246个产品,才能个产品,才能满足可靠性和准确度要求。满足可靠性和准确度要求。(4)返回返回统计学统计学课件课件524/16/2022浙江财经学院练练 习习 题题统计学统计学课件课件4/16/2022浙江财经学院531 1、某企业对某批产品抽取、某企业对某批产品抽取6060件进行稳定性检验,检验结件进行稳定性检验,检验结果如下:果如下
42、:稳定时间稳定时间(分钟)(分钟)件数件数1以下以下51-2172-3203-4164以上以上2合合 计计60组中值组中值xffx2fx2.525.5505691431.2538.512519640.5401.250.51.52.53.54.51)1)计算稳定时间的抽样平均误差。计算稳定时间的抽样平均误差。2)2)若若1 1分钟以上为合格,计算合格率的抽样平均误差。分钟以上为合格,计算合格率的抽样平均误差。统计学统计学课件课件4/16/2022浙江财经学院54小时)(38.260143fxfx1)小时)(01. 138. 26025.401222xffxS小时)(130.06001.1nSnx
43、2)%67.9160551nnp%6.27)9167.01(9167.0)1(ppSp%6.360276.0nSpp统计学统计学课件课件4/16/2022浙江财经学院551、某公司进口一批电子器件,为了检测其寿命,抽、某公司进口一批电子器件,为了检测其寿命,抽取了取了500件进行检验,结果其平均寿命为件进行检验,结果其平均寿命为9.48千小时,标准千小时,标准差为差为0.787千小时,不合格的产品有千小时,不合格的产品有20件。件。1) 在在95.45%的概率保证程度下,计算该批产品的平均耐用的概率保证程度下,计算该批产品的平均耐用时间和不合格率的置信区间时间和不合格率的置信区间3)在其他条件
44、不变的情况下,倘若不合格率的置信区间减在其他条件不变的情况下,倘若不合格率的置信区间减少一倍,则最少应抽取多少件产品进行检验?少一倍,则最少应抽取多少件产品进行检验?2) 其他条件不变的情况下,若平均耐用时间的置信区间增其他条件不变的情况下,若平均耐用时间的置信区间增加一倍,则至少需要抽取多少件产品进行检验。加一倍,则至少需要抽取多少件产品进行检验。4)在其他条件不变的情况下,倘若对平均耐用时间的估计在其他条件不变的情况下,倘若对平均耐用时间的估计置信度提高到置信度提高到99.73,则最少应抽取多少件产品进行检验,则最少应抽取多少件产品进行检验?统计学统计学课件课件4/16/2022浙江财经学
45、院56%4500201nnp%876. 0500%)41 (%4)1 (nppp1)千小时)(070. 0035. 02xxt%752. 1%876. 02ppt不合格率的置信区间为不合格率的置信区间为(4%-1.752%4%-1.752%,4%+1.752%4%+1.752%)= =(2.248%2.248%,5.752%5.752%)千小时)(035.0500787.0nSnx则平均耐用时间的置信区间为(则平均耐用时间的置信区间为(9.48-0.079.48-0.07,9.48+0.079.48+0.07)= =(9.419.41,9.559.55)千小时)千小时统计学统计学课件课件4/16/2022浙江财经学院572)4 .12614. 0787. 0422222xStn3)6 .2001)2/%752. 1 (%)4%96(4)1 (222ppptn至少需要抽取至少需要抽取127127件产品。件产品。至少需要抽取至少需要抽取20022002件产品。件产品。4)至少需要抽取至少需要抽取11381138件产品。件产品。6 .113707. 0787. 0922222xStn