第5章抽样调查34课件.ppt

上传人(卖家):晟晟文业 文档编号:3859303 上传时间:2022-10-19 格式:PPT 页数:87 大小:475.36KB
下载 相关 举报
第5章抽样调查34课件.ppt_第1页
第1页 / 共87页
第5章抽样调查34课件.ppt_第2页
第2页 / 共87页
第5章抽样调查34课件.ppt_第3页
第3页 / 共87页
第5章抽样调查34课件.ppt_第4页
第4页 / 共87页
第5章抽样调查34课件.ppt_第5页
第5页 / 共87页
点击查看更多>>
资源描述

1、.第三节第三节 抽样误差与参数估计抽样误差与参数估计一、抽样误差的概念一、抽样误差的概念 二、抽样平均误差二、抽样平均误差 三、抽样极限误差三、抽样极限误差 四、抽样估计的概率度和置信度四、抽样估计的概率度和置信度 五、参数估计方法五、参数估计方法 六、样本容量的确定六、样本容量的确定2022-10-4一、抽样误差的概念一、抽样误差的概念 (一)抽样调查误差的种类(一)抽样调查误差的种类 (二)抽样误差的概念(二)抽样误差的概念 (三)抽样实际误差(三)抽样实际误差 (四)抽样平均误差的概念(四)抽样平均误差的概念2022-10-4(一)抽样调查误差的种类(一)抽样调查误差的种类抽样调查误差抽

2、样调查误差登记性误差登记性误差代表性误差代表性误差随机误差随机误差系统误差系统误差(可以计算)(可以计算)抽样误差抽样误差(随机误差)(随机误差)抽样实际误差抽样实际误差 .抽样平均误差抽样平均误差 (无法计算)(无法计算)10/4/2022 抽样误差的性质:抽样误差的性质:1、随机误差:样本产生的随机性、随机误差:样本产生的随机性 2、代表性误差:、代表性误差:样本结构样本结构不足以代表不足以代表总体结构总体结构 xXxPPp(二)抽样误差(二)抽样误差抽样误差概念:抽样误差(随机误差)是指由于抽样误差概念:抽样误差(随机误差)是指由于抽样的随机性而产生的样本指标与总体指标之间抽样的随机性而

3、产生的样本指标与总体指标之间的离差。的离差。抽样误差表达形式:抽样误差表达形式:10/4/2022 即是指每次抽样调查所得的即是指每次抽样调查所得的样本指标样本指标与与总体指标总体指标之间的之间的离差离差。抽样实际误差抽样实际误差 :它随着样本的不同而不同,是一个随机变量。它随着样本的不同而不同,是一个随机变量。(三)抽样实际误差(三)抽样实际误差它无法计算。它无法计算。2022-10-4 即是指所有可能出现的样本即是指所有可能出现的样本指标与总体指标之间的平均离差,即所有指标与总体指标之间的平均离差,即所有可能出现的样本指标与总体指标的标准差。可能出现的样本指标与总体指标的标准差。抽样平均误

4、差抽样平均误差 :对于一个特定的总体来说,抽样平均误差可对于一个特定的总体来说,抽样平均误差可以根据数理统计方法在调查之前计算出来,还以根据数理统计方法在调查之前计算出来,还可以通过设计调查方案控制其大小。可以通过设计调查方案控制其大小。(四)抽样平均误差的概念(四)抽样平均误差的概念2022-10-4 (一)抽样平均误差的定义公式(一)抽样平均误差的定义公式 (二)抽样平均误差的应用公式(二)抽样平均误差的应用公式 (三)影响抽样(平均)误差大小的因素(三)影响抽样(平均)误差大小的因素二、抽样平均误差二、抽样平均误差2022-10-4MPpp2)(M:全部可能的样本个数全部可能的样本个数M

5、Xxx2)(1.1.样本平均数的抽样平均误差样本平均数的抽样平均误差 2.2.样本成数的抽样平均误差样本成数的抽样平均误差 MXxpp2)((一)(一)抽样平均误差的定义公式抽样平均误差的定义公式2022-10-4平均误差的定义公式只能用来解释平均误差的概念,在平均误差的定义公式只能用来解释平均误差的概念,在实际问题中无法应用。因为:实际问题中无法应用。因为:首先,总体的平均数或成数通常未知;首先,总体的平均数或成数通常未知;其次,也很难给出全部样本的平均数或成数。其次,也很难给出全部样本的平均数或成数。在实际工作中,用根据数理统计理论证明推导出来的公式。在实际工作中,用根据数理统计理论证明推

6、导出来的公式。2022-10-4(1 1)重复抽样:)重复抽样:nnx2总总体体标标准准差差:样样本本容容量量:n(2 2)不重复抽样:)不重复抽样:1NnNnx2Nnn1总总体体单单位位数数:N注意:注意:在实际计算在实际计算抽样平均误差抽样平均误差时,当时,当总体标准差总体标准差未知未知时,可以用时,可以用样本标准差样本标准差s来代替。即:来代替。即:nxxs2)(nx1)(nxxs2ns(大样本)(大样本)(小样本)(小样本)1.1.样本平均数的抽样平均误差样本平均数的抽样平均误差(二)(二)抽样平均误差的应用公式抽样平均误差的应用公式2022-10-4 例:例:现有现有A、B、C、D四

7、个四个工人构成的总体,他们所生产某种产工人构成的总体,他们所生产某种产品的日产量分别为品的日产量分别为2222、2424、2626、2828件,若按重复抽样方法,从工人件,若按重复抽样方法,从工人总体中随机抽取两个工人组成一个样本,用其样本平均日产量来估总体中随机抽取两个工人组成一个样本,用其样本平均日产量来估计总体平均日产量。计总体平均日产量。总体平均数总体平均数为:为:2 25 5(件件)4 41 10 00 0NXXNXX2)(所有可能样本个数:所有可能样本个数:M =4 44 4 =1616 样本样本 22 24 26 2822242628 22 23 24 25 23 24 25 2

8、6 24 25 26 27 25 26 27 28 试计算样本平均日产量的抽样平均误差。试计算样本平均日产量的抽样平均误差。(N=4 4 n=2 2)总体总体标准差标准差为:为:(件件)5 54 42 20 0 在重复抽样条件下,所有可能在重复抽样条件下,所有可能的样本及样本平均日产量如的样本及样本平均日产量如右表右表2022-10-4 重复抽样的样本平均数及其离差(抽样误差)重复抽样的样本平均数及其离差(抽样误差)样本序号样本序号样本单位样本单位 样本平均数样本平均数 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9101011111212131314141515161

9、6 AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DD2222232324242525232324242525262624242525262627272525262627272828合计合计400400离差离差 离差平方离差平方 -3-3-2-2-1-1 0 0-2-2-1-1 0 0 1 1-1-1 0 0 1 1 2 2 0 0 1 1 2 2 3 3 0 0 9 94 41 10 04 41 10 01 11 10 01 14 40 01 14 49 94040 xXx25X2)(Xx 2022-10-4.样本平均样本平均数的抽样数的抽样平均误

10、差平均误差MXxx2)((用定义公式计算)(用定义公式计算)nnx2(用应用公式计算)(用应用公式计算)结论:结论:第一,所有可能样本平均数的平均数等于总体平均数第一,所有可能样本平均数的平均数等于总体平均数 Mxx2 25 5(件件)NXX Mxx 第二,样本平均数的标准差(抽样平均误差)仅为总体第二,样本平均数的标准差(抽样平均误差)仅为总体标准差标准差的的n11 1.5 58 81 1(件件)2 25 52 2.5 51 16 64 40 01 1.5 58 81 1(件件)X即:即:1 16 64 40 00 02 25 5(件件)2022-10-4.其所有可能样本及样本平均日产量其所

11、有可能样本及样本平均日产量如下:如下:在不重复抽样条件下,所有可能样本个数:在不重复抽样条件下,所有可能样本个数:M =4 43 3 =1212 样本样本 22 24 26 2822242628 23 24 25 23 25 26 24 25 27 25 26 27 重复抽样的样本平均数及其离差(抽样误差)重复抽样的样本平均数及其离差(抽样误差)样本序号样本序号样本单位样本单位 样本平均数样本平均数 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9101011111212 AB AC AD BA BC BD CA CB CD DA DB DC 23232424252523

12、2325252626242425252727252526262727合计合计 离差离差 -2-2-1-1 0 0-2-2 0 0 1 1-1-1 0 0 2 2 0 0 1 1 2 2 0 0 300300离差平方离差平方 4 41 10 04 40 01 11 10 04 40 01 14 42020Xx2)(Xx 25Xx10/4/2022.Nnn11样本平均样本平均数的抽样数的抽样平均误差平均误差MXxx2)((用定义公式计算)(用定义公式计算)1 12 22 20 01 1.2 29 91 1(件件)1NnNnx2(用应用公式计算)(用应用公式计算)1 1.2 29 91 1(件件)1

13、 14 42 24 42 25 5结论:结论:第一,所有可能样本平均数的平均数等于总体平均数第一,所有可能样本平均数的平均数等于总体平均数,Mxx2 25 5(件件)NXX Mxx 第二,样本平均数的标准差(抽样平均误差)仅为总体标准差第二,样本平均数的标准差(抽样平均误差)仅为总体标准差的的X即:即:1 12 23 30 00 02 25 5(件件)2022-10-42.2.样本成数的抽样平均误差样本成数的抽样平均误差p 由于总体成数可以表现为是非标志(,)分布的平均由于总体成数可以表现为是非标志(,)分布的平均数,而且它的标准差也可以从总体成数推算出来,数,而且它的标准差也可以从总体成数推

14、算出来,因此,可以从样本平均数的抽样平均误差和总体标准差的因此,可以从样本平均数的抽样平均误差和总体标准差的关系推出样本成数的抽样平均误差的计算公式。关系推出样本成数的抽样平均误差的计算公式。PXp)1(PPP(1 1)重复抽样:)重复抽样:nPPnPp)1((2 2)不重复抽样:)不重复抽样:NnnPPp1)1(注意:注意:在实际计算在实际计算抽样平均误差时抽样平均误差时,当当总体成数总体成数P未知未知时,可用时,可用样本成数样本成数 p 来代替。即来代替。即:2022-10-4.nnPPnppPp)1()1(例例:要估计某高校要估计某高校1000010000名在校生的近视率,现随机从中名在

15、校生的近视率,现随机从中抽取抽取400400名,检查有近视眼的学生名,检查有近视眼的学生320320名,试计算样本近视名,试计算样本近视率的抽样平均误差。率的抽样平均误差。(1 1)在重复抽样条件下,)在重复抽样条件下,样本近视率样本近视率的抽样平均的抽样平均误差为:误差为:解:根据已知条件:解:根据已知条件:%18 80 00 0.8 84 40 00 03 32 20 0nnpnnPPppp)1()1(0 0.0 02 24 40 00 00 0.2 20 0.8 8%2 22022-10-4(2 2)在不重复抽样条件下,)在不重复抽样条件下,样本近视率样本近视率的抽样平均的抽样平均误差为

16、:误差为:)(1)1(Nnnppp)1 10 00 00 00 04 40 00 0(1 14 40 00 00 0.2 20 0.8 8 计算结果表明,用样本的近视率来估计总体的近视率其计算结果表明,用样本的近视率来估计总体的近视率其抽样平均误差为抽样平均误差为2 2左右(即用样本的近视率来估计总体的左右(即用样本的近视率来估计总体的近视率其误差的绝对值平均说来在近视率其误差的绝对值平均说来在2 2左右)。左右)。%1 1.9 96 62022-10-4(三)影响抽样(平均)误差大小的因素(三)影响抽样(平均)误差大小的因素nnx2Nnnx11.1.总体标准差总体标准差(总体标志变异程度)(

17、总体标志变异程度)2.2.样本单位数样本单位数3.3.抽样方法抽样方法4.4.抽样的组织方式抽样的组织方式 例如:例如:要使要使抽样误差减少为原来的抽样误差减少为原来的一半一半,则样本容量将为原来的,则样本容量将为原来的4 4倍倍。它与它与成正比例变化。成正比例变化。它与它与成反比例变化成反比例变化。重复抽样的重复抽样的总是大于不重复抽样的总是大于不重复抽样的。抽样的组织方式不同,抽样误差也不同。抽样的组织方式不同,抽样误差也不同。2022-10-4抽样极限误差抽样极限误差是指在一定概率下是指在一定概率下样本指标样本指标与与总体指标总体指标之间之间抽样误差的可允许范围。抽样误差的可允许范围。三

18、、抽样极限误差三、抽样极限误差 抽样极限误差是从另外一个角度来考虑抽样误差的问题。抽样极限误差是从另外一个角度来考虑抽样误差的问题。或或的的误误差差绝绝对对值值不不超超过过或或相相应应总总体体指指标标与与或或本本指指标标在在一一定定概概率率下下可可认认为为样样上上式式表表示示 pxPXpx)(:(xXxpPp一般情况下只进行一次具体的抽样。所以,不能只研究一般情况下只进行一次具体的抽样。所以,不能只研究抽样平均误差,还必须研究某一次具体抽样的抽样误差抽样平均误差,还必须研究某一次具体抽样的抽样误差的可能范围,即抽样极限误差。的可能范围,即抽样极限误差。2022-10-4 样本平均数的抽样极限误

19、差样本平均数的抽样极限误差xXx 样本成数的抽样极限误差样本成数的抽样极限误差pPpxxxXx)(xxxx,ppppP)(pppp,在参数估计时,由于实际误差无法计算,只能用抽样在参数估计时,由于实际误差无法计算,只能用抽样平均误差来反映抽样误差的大小。平均误差来反映抽样误差的大小。而某一次抽样的实际误差可能为正,也可能为负,其而某一次抽样的实际误差可能为正,也可能为负,其绝对值可能大于或小于抽样平均误差。绝对值可能大于或小于抽样平均误差。抽样极限误差抽样极限误差是是抽样误差抽样误差的的可能范围可能范围而非完全肯定的而非完全肯定的范围。故这个可能范围的大小与概率是紧密联系的。范围。故这个可能范

20、围的大小与概率是紧密联系的。2022-10-4 粮食总产量在粮食总产量在2000020000(4004005 5)公斤,即)公斤,即在在790790810810万公斤之间。万公斤之间。例如例如,要估计某乡粮食亩产量和总产量,从该要估计某乡粮食亩产量和总产量,从该乡乡2 2万亩万亩粮食作物中抽取粮食作物中抽取400400亩亩,求得其平均亩,求得其平均亩产量为产量为400400公斤公斤。如果确定抽样极限误差为。如果确定抽样极限误差为5 5公公斤斤,试估计该乡粮食亩产量和总产量所在的置试估计该乡粮食亩产量和总产量所在的置信区间。信区间。即该乡粮食亩产量的区间落在即该乡粮食亩产量的区间落在400400

21、5 5公斤公斤的范围内,即在的范围内,即在395395405405公斤之间。公斤之间。4 40 00 0 x5 5 x2022-10-4 又如又如,要估计某高校,要估计某高校1000010000名名在校生的近视率,在校生的近视率,现随机从中抽取现随机从中抽取400400名名,计算的,计算的近视率为近视率为8080,如果确定允许误差范围为如果确定允许误差范围为4 4,试估计该高校在,试估计该高校在校生近视率所在的置信区间。校生近视率所在的置信区间。即该校学生近视率的区间将落在即该校学生近视率的区间将落在80804 4的范围内,即在的范围内,即在76768484之间。之间。%4 48 80 0 x

22、p2022-10-4四、抽样估计的概率度和置信度四、抽样估计的概率度和置信度 抽样估计时,抽样估计时,基于基于概率估计概率估计要求,要求,抽样极限误差抽样极限误差为为标标准准单单位位来来衡衡量量。或或px得相对数得相对数t t,表示误差范围为抽样平均误差的,表示误差范围为抽样平均误差的t t倍。倍。px或或,通常需要以通常需要以抽样平均误差抽样平均误差ppxx或或,分分别别除除以以或或所所以以,把把抽抽样样极极限限误误差差(一)抽样估计的概率度(一)抽样估计的概率度2022-10-4;xxtxxt;pptppt t 是测量抽样估计可靠程度的一个参数,称为是测量抽样估计可靠程度的一个参数,称为抽

23、抽样误差的概率度样误差的概率度,即临界值即临界值2/zt2/zxxz2/ppz2/2022-10-4 如上例,如上例,已知某乡粮食亩产量的标准差为已知某乡粮食亩产量的标准差为=8080公斤,总体单位数公斤,总体单位数N=2000020000亩,样本单位亩,样本单位数数 n=400400亩,求得其抽样平均误差为亩,求得其抽样平均误差为。(公公斤斤)4 44 40 00 08 80 0nx 如果确定抽样极限误差为如果确定抽样极限误差为5 5公斤,则,我们可以用概公斤,则,我们可以用概率度:率度:xxt1 1.2 25 54 45 5 表示抽样极限的误差范围,即用表示抽样极限的误差范围,即用1.25

24、1.25x 来规定误差范围来规定误差范围的大小。的大小。2022-10-4(二)抽样估计的置信度(二)抽样估计的置信度样本指标随着样本的变动而变动,是个随机变量,样本指标与样本指标随着样本的变动而变动,是个随机变量,样本指标与总体指标的误差也是个随机变量,并不能保证误差不超过一定总体指标的误差也是个随机变量,并不能保证误差不超过一定范围这件事是必然的,而只能给以一定程度的概率保证范围这件事是必然的,而只能给以一定程度的概率保证,一般一般用用 F(t F(t)表示,)表示,)(tFXxxProb)(tFtxXtxxxProb 总体平均数总体平均数抽样估计的置信度(可靠程度):抽样估计的置信度(可

25、靠程度):总体成数总体成数抽样估计的置信度:抽样估计的置信度:)(tFPppProb)(tFtpPtpppProb表示。表示。或1或11 11 11 12022-10-4在进行抽样估计时,我们既希望抽样估计的误差尽可能小。在进行抽样估计时,我们既希望抽样估计的误差尽可能小。置信区间越小,说明估计的精确性越高;置信区间越大,置信区间越小,说明估计的精确性越高;置信区间越大,说明估计的精确性较低。说明估计的精确性较低。同时又希望抽样估计的把握程同时又希望抽样估计的把握程度(概率)尽可能大。但事实上着两者往往是矛盾的度(概率)尽可能大。但事实上着两者往往是矛盾的。注意:注意:)(tFXxxProb)

26、(tFtxXtxxxProb(置(置 信信 区区 间)间)(概率)(概率)用下图表示:用下图表示:或或2022-10-468.2768.2795.4595.4599.7399.73Xxxxx2 2xx3 3xxxx2 2xx3 3当当 t=1 1xx6 68 8.2 27 7xxxXxProb当当 t=2 2xx2 2当当 t=3 3xx3 39 95 5.4 45 52 22 2xxxXxProb9 99 9.7 73 33 33 3xxxXxProb概率用曲线下的面积表示2022-10-4常用的概率度常用的概率度t t与相应的概率与相应的概率 F(t)F(t)对应数值如下:对应数值如下:概

27、率度概率度t t11.651.9622.583概率概率F(t)F(t)0.68270.90000.95000.95450.990.9973可以看出:当确定的抽样极限误差愈大,则可以看出:当确定的抽样极限误差愈大,则概率度概率度t t也就愈大,相应的概率也愈大,即也就愈大,相应的概率也愈大,即样本指标落在指定范围的可能性也愈大;反样本指标落在指定范围的可能性也愈大;反之,则相应的概率就减少。之,则相应的概率就减少。正态分布概率表正态分布概率表(双侧双侧)2022-10-4五、参数估计方法五、参数估计方法(一)(一)点估计点估计1 1、概念:点估计也称定值估计,就是把样本、概念:点估计也称定值估计

28、,就是把样本统计量直接作为总体参数的估计值。统计量直接作为总体参数的估计值。例:抽样调查的方法调查某校学生的平均体重,从例:抽样调查的方法调查某校学生的平均体重,从全部学生中随机抽取的全部学生中随机抽取的400400名学生,测得他们的平均名学生,测得他们的平均体重为体重为5858公斤,这时就把公斤,这时就把5858公斤作为该校全部公斤作为该校全部80008000名学生的平均体重。名学生的平均体重。2 2、优点:简单、直观、可得到总体参数的具、优点:简单、直观、可得到总体参数的具体估计值体估计值。2022-10-43 3、点估计量的优良标准、点估计量的优良标准(1)无偏性无偏性如果样本统计量的数

29、学期望等于所估计的总如果样本统计量的数学期望等于所估计的总体参数的值,该样本统计量称作总体参数体参数的值,该样本统计量称作总体参数的无偏估计量。也就是说:的无偏估计量。也就是说:的无偏估计量。为则若,)(E2022-10-4(2 2)一致性)一致性:要求用样本估计量估计和推断总体参数时要达到:要求用样本估计量估计和推断总体参数时要达到:样本容量样本容量n n充分大时,样本估计量充分靠近总体充分大时,样本估计量充分靠近总体参数,即随着参数,即随着n n的无限增大,样本估计量与未知的无限增大,样本估计量与未知的总体参数之间的绝对离差小于任意给定的正数的总体参数之间的绝对离差小于任意给定的正数的可能

30、性趋近于的可能性趋近于1 1的概率,即几乎是一定发生的。的概率,即几乎是一定发生的。根据概率论中的大数定律可知:对于任意给定的根据概率论中的大数定律可知:对于任意给定的正数有:正数有:1;1limlimpPxPnn2022-10-4(3 3)有效性有效性有效性要求样本估计量估计和推断总体参数时,有效性要求样本估计量估计和推断总体参数时,作为估计量的标准差比其它估计量的标准差小。作为估计量的标准差比其它估计量的标准差小。即:即:设 是参数参数 的两个无偏估计量,若 的方差比 的方差小,则称 比 有效。1212212022-10-44.常用的总体参数的点估计量常用的总体参数的点估计量(1)总体平均

31、数(均值)的点估计量是样本均值)总体平均数(均值)的点估计量是样本均值 (2)总体标准差的点估计量是样本标准差)总体标准差的点估计量是样本标准差(3)总体成数的点估计量是样本成数)总体成数的点估计量是样本成数xspP 2022-10-4(二)区间估计(二)区间估计区间估计就是根据样本统计量和抽样极限误差,以区间估计就是根据样本统计量和抽样极限误差,以一定的概率保证程度估计总体参数的所在区间一定的概率保证程度估计总体参数的所在区间。概率保证程度称为置信度、置信水平、置信概率:概率保证程度称为置信度、置信水平、置信概率:表达了参数区间估计的可靠性。表达了参数区间估计的可靠性。)(tFtxXtxxx

32、Prob)(tFxXxxxProb1 11 1为为显显著著性性水水平平:表达了参数区间估计的不:表达了参数区间估计的不可靠性。可靠性。2022-10-4一般说来,在样本容量一定的前提下,精确度与置一般说来,在样本容量一定的前提下,精确度与置信度往往是相互矛盾的:若置信度增加,则区间信度往往是相互矛盾的:若置信度增加,则区间必然增大,降低了精确度;若精确度提高,则区必然增大,降低了精确度;若精确度提高,则区间缩小,置信度必然减小。要同时提高估计的置间缩小,置信度必然减小。要同时提高估计的置信度和精确度,就要增加样本容量。信度和精确度,就要增加样本容量。置信区间的直观意义:若作为多次同样的抽样,置

33、信区间的直观意义:若作为多次同样的抽样,将得到多个置信区间,其中有的区间包含了总将得到多个置信区间,其中有的区间包含了总体参数的真值,有的区间没有包含总体参数的体参数的真值,有的区间没有包含总体参数的真值。真值。)(xxtxtx,为置信区间。为置信区间。2022-10-4【例】某公司有职工【例】某公司有职工30003000人,从中随机抽取人,从中随机抽取6060人调查其工人调查其工资收入情况。调查结果表明,职工的月平均工资为资收入情况。调查结果表明,职工的月平均工资为23502350元,标准差为元,标准差为193193元,月收入在元,月收入在20002000元及以上职工元及以上职工4040人。

34、人。试以试以95.45%95.45%的置信水平推断的置信水平推断:(1 1)该公司职工月平均工资所在的范围;该公司职工月平均工资所在的范围;(2 2)月收入在)月收入在20002000元及以上职工在全部职工中所占的比重。元及以上职工在全部职工中所占的比重。统计量(估计量、样本指标)统计量(估计量、样本指标)抽样极限误差(最大允许误差)抽样极限误差(最大允许误差)置信度置信度(概率保证程度)(概率保证程度)区间估区间估计要素计要素2022-10-4解解(1 1)依题意计算如下:依题意计算如下:67.24300060160193122Nnnsx F(z)=95.45%F(z)=95.45%,查表得

35、查表得 z=2 z=2 34.4967.242xxz?34.239966.230034.49235034.492350 xxxx计算结果表明,有计算结果表明,有95.45%95.45%的把握说该公司职工的把握说该公司职工月平均工资在月平均工资在2300.662300.66到到2399.342399.34元之间。元之间。2022-10-4(2 2)月收入在)月收入在20002000元及以上职工在全部职工元及以上职工在全部职工中所占的比重为:中所占的比重为:%02.63000601606667.016667.011%67.666040Nnnpppp%04.12%02.62ppz%71.78%63.

36、54%04.12%67.66%04.12%67.66pppp计算结果表明,有计算结果表明,有95.45%95.45%的把握说该公司月收入在的把握说该公司月收入在20002000元及以上职工占全部职工的比重在元及以上职工占全部职工的比重在54.63%54.63%到到78.71%78.71%之间。之间。2022-10-4小结:区间估计的基本步骤:小结:区间估计的基本步骤:第一第一:根据样本资料,计算出根据样本资料,计算出样本平均数样本平均数或样或样本本成数成数、标准差等标准差等;第二第二:计算抽样平均误差;计算抽样平均误差;第三第三:根据给定的置信度(概率),查正态根据给定的置信度(概率),查正态

37、分布概率表得到相应的临界值(概率度);分布概率表得到相应的临界值(概率度);第四第四:计算抽样极限误差;计算抽样极限误差;第五第五:给出置信区间并说明其置信度。给出置信区间并说明其置信度。2022-10-4课堂练习课堂练习1 1:从某厂生产的从某厂生产的50005000只灯泡中,随机不重复抽只灯泡中,随机不重复抽取取100100只,对其使用寿命进行调查,调查结果如下只,对其使用寿命进行调查,调查结果如下表表:又知该厂质量又知该厂质量规定使用寿命在规定使用寿命在30003000小时以下为小时以下为不合格品。不合格品。使用寿命使用寿命(小时)(小时)产品数量产品数量(只)(只)3000 3000以

38、下以下30004000300040004000500040005000 5000 5000以上以上2 2303050501818合合 计计100100(1 1)按不重复抽样方法,以)按不重复抽样方法,以95.4595.45%的概率保证程度估计的概率保证程度估计该批灯泡的平均使用寿命;该批灯泡的平均使用寿命;(2 2)按不重复抽样方法,以)按不重复抽样方法,以68.2768.27%的置信度估计该批灯的置信度估计该批灯泡的合格率。泡的合格率。2022-10-4(1 1)N =50005000 n=100100 F(t)=95.4595.45%t=2 2使用寿命(小时)使用寿命(小时)组中值组中值产

39、量产量 3000 3000以下以下3000 40003000 40004000 50004000 5000 5000 5000以上以上25002500350035004500450055005500 2 2303050501818 5000 5000105000105000225000225000 99000 99000-1480-1480-840-840 160 160 1160 1160 6771200 67712002116800021168000 1280000 12800002422080024220800合合 计计1001004340004340005344000053440000

40、 x解:解:fxfx(小小时时)4 43 34 40 0ffxxs2)((小小时时)7 73 31 1.0 02 26 67 7xfxxfxx2)(72.3772.37500050001001001 1100100731.0276731.0276Nnnsx1fxxt7 72 2.3 37 72 2总体平均寿命所总体平均寿命所在的置信区间为在的置信区间为:上限:上限:xtx(小小时时)4 44 48 84 4.7 71 14 44 4.7 74 43 34 40 0下限:下限:xtx(小小时时)4 41 19 95 5.3 31 14 44 4.7 74 43 34 40 0-(小小时时)1 1

41、4 44 4.7 7 即可以即可以95.4595.45%的概率估计该批灯泡平均使用寿命在的概率估计该批灯泡平均使用寿命在4195.34195.34484.74484.7小时之间。小时之间。2022-10-4)(5 50 00 00 01 10 00 01 11 10 00 00 0.0 02 20 0.9 98 80 0.0 01 14 4)(1)1(NnnPPp样本合格率:样本合格率:(2 2).n1 =9898 n =100100 F(t)=68.2768.27 t =1 1nnp10 0.9 98 81 10 00 09 98 8样本合格率的抽样平均误差:样本合格率的抽样平均误差:0 0

42、.0 01 14 40 0.0 01 14 41 1ppt总体合格率所在的置信区间为总体合格率所在的置信区间为:上限:上限:ptp下限:下限:ptp0 0.9 99 94 40 0.0 01 14 40 0.9 98 80 0.9 96 66 60 0.0 01 14 40 0.9 98 8 即可以即可以68.2768.27%的概率保证程度估计该批灯泡的合格率在的概率保证程度估计该批灯泡的合格率在96.696.699.499.4之间。之间。2022-10-4课堂练习课堂练习2 2:对某批成品按不重复抽样方法抽选对某批成品按不重复抽样方法抽选200200件件检查,其中废品检查,其中废品8 8件,

43、又知样本容量为成品总量的件,又知样本容量为成品总量的(1(120)20)。以。以9595的把握程度估计该批成品的废品率范围。的把握程度估计该批成品的废品率范围。解:解:N=40004000 n =200200 n1 =8 8 F(t)=9595 t=1.961.96 0 0.0 04 42 20 00 08 8 废废品品率率nnp1)(1)1(NnnPPp0 0.0 01 13 35 52 20 00 00 0.9 96 60 0.0 04 4)2 20 01 1(1 10 0.0 02 26 65 56 60 0.0 01 13 35 51 1.9 96 6ppt 总体成数所在区间的上下限为

44、:总体成数所在区间的上下限为:上限:上限:6 6.6 65 52 2.6 65 54 4ptp1 1.3 35 52 2.6 65 54 4ptp下限:下限:即可以即可以9595的把握程度估计该批成品的废品率范围在的把握程度估计该批成品的废品率范围在1.351.356.656.65之间。之间。2022-10-4六、样本容量的确定六、样本容量的确定(一)影响必要样本容量的因素(一)影响必要样本容量的因素1.各单位标志变异程度的大小。总体标志变异程度各单位标志变异程度的大小。总体标志变异程度越大,要求样本容量要大些;反之则相反。越大,要求样本容量要大些;反之则相反。3.抽样方法。在其他条件相同时,

45、重复抽样比不重复抽样方法。在其他条件相同时,重复抽样比不重复抽样要求样本容量大些。抽样要求样本容量大些。2.抽样极限误差的大小。抽样极限误差越大,要求抽样极限误差的大小。抽样极限误差越大,要求样本容量越小;反之则相反。样本容量越小;反之则相反。4.抽样的组织方式。抽样的组织方式。5.抽样推断的概率保证程度的大小。概率越大,要求抽样推断的概率保证程度的大小。概率越大,要求样本容量越大;反之则相反。样本容量越大;反之则相反。2022-10-4(二)平均数的必要样本容量(二)平均数的必要样本容量 1.重复抽样重复抽样nzzxx2由公式由公式得:得:222xzn 2.不重复抽样不重复抽样Nnnzzxx

46、12由公式由公式得:得:22222zNNznx2022-10-4(三)成数的必要样本容量(三)成数的必要样本容量1.重复抽样重复抽样nppzzpp1由公式可得:221pppzn2.不重复抽样不重复抽样 Nnnppzzpp11由公式可得:ppzNppNznp112222022-10-4:重重复复抽抽样样222t n 22t P(1P)n 不不重重复复抽抽样样:22222Nt nNt 222N P(1P)tnNt P(1P)概率度如用概率度如用t表示,则四个公式如下表示,则四个公式如下:2022-10-4【例】【例】某批发站欲估算零售商贩的平均每次进货额,根据历某批发站欲估算零售商贩的平均每次进货

47、额,根据历史资料进货额的标准差为史资料进货额的标准差为1000元,假定到批发站进货的商元,假定到批发站进货的商贩有贩有2000人,若要求置信水平为人,若要求置信水平为99.73%,抽样极限误差,抽样极限误差不超过不超过250元,应该抽取多大的样本?元,应该抽取多大的样本?解:没有说明采用的抽样方法,可按上述两个公式分别计算解:没有说明采用的抽样方法,可按上述两个公式分别计算其必要样本容量,其必要样本容量,F(z)=99.73.%,z=3 重复抽样条件下的必要样本容量:重复抽样条件下的必要样本容量:?14425010003222222xzn不重复抽样条件下的必要样本容量:不重复抽样条件下的必要样

48、本容量:?13533.1341000325020001000320002222222222zNNznx2022-10-4【例】某社区想通过抽样调查了解居民参加体育活动的【例】某社区想通过抽样调查了解居民参加体育活动的比率,如果把误差范围设定在比率,如果把误差范围设定在5%,问如果以,问如果以95%的的置信度进行参数估计,需要多大的样本?置信度进行参数估计,需要多大的样本?解:解:F(z)=95%,z=1.96 根据公式得:根据公式得:2222%55.05.096.11pppzn=384.16385(人)(人)注意:题目中为什么用注意:题目中为什么用0.5来替代来替代p?p(1-p)在在p=0.

49、5时取得极大值,证明很容易,当时取得极大值,证明很容易,当p未知未知时,就可以用时,就可以用0.5来替代。来替代。2022-10-42 2)()1(pppptn2(户户)5 56 69 90 0.0 05 50 0.3 35 50 0.6 65 52 222即应抽取即应抽取625625户家庭进行调查。户家庭进行调查。注意:注意:小数只入不舍,对同一总体进行多项调查时,选小数只入不舍,对同一总体进行多项调查时,选n最大者最大者以满足共同需要。以满足共同需要。课堂练习课堂练习3 3:某市开展职工家计调查,根据历史资料该市职工家庭某市开展职工家计调查,根据历史资料该市职工家庭平均每人年收入的标准差为

50、平均每人年收入的标准差为250250元,而家庭消费的恩格尔系数(即元,而家庭消费的恩格尔系数(即家庭食品支出占消费总支出的比重)为家庭食品支出占消费总支出的比重)为6565 。现在用重复抽样的。现在用重复抽样的方法,要求方法,要求95.4595.45的概率保证下,平均收入的极限误差不超过的概率保证下,平均收入的极限误差不超过2020元,恩格尔格系数的极限误差不超过元,恩格尔格系数的极限误差不超过4 4,求必要的样本单位数。,求必要的样本单位数。解:解:t =2 2 2 20 0 x0 0.0 04 4p2 25 50 00 0.6 65 5P222)(xxtn(户户)6 62 25 52 20

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第5章抽样调查34课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|