第七章-抽样推断-(《统计学》课件).pptx

上传人(卖家):晟晟文业 文档编号:5177262 上传时间:2023-02-16 格式:PPTX 页数:50 大小:680.85KB
下载 相关 举报
第七章-抽样推断-(《统计学》课件).pptx_第1页
第1页 / 共50页
第七章-抽样推断-(《统计学》课件).pptx_第2页
第2页 / 共50页
第七章-抽样推断-(《统计学》课件).pptx_第3页
第3页 / 共50页
第七章-抽样推断-(《统计学》课件).pptx_第4页
第4页 / 共50页
第七章-抽样推断-(《统计学》课件).pptx_第5页
第5页 / 共50页
点击查看更多>>
资源描述

1、第七章第七章 抽样推断抽样推断主要内容主要内容n抽样推断的基本概念抽样推断的基本概念n区间估计区间估计n必要样本容量的确定必要样本容量的确定n抽样误差的计算抽样误差的计算n抽样组织方式的特点抽样组织方式的特点2引例引例 “2017“2017年高校毕业生满意度年高校毕业生满意度”、“37“37个城市平均月个城市平均月薪出炉薪出炉”、“大学生平均月消费大学生平均月消费”等等,相信大部分同等等,相信大部分同学都或多或少看过这类的新闻,那么这些新闻所公布的学都或多或少看过这类的新闻,那么这些新闻所公布的数据可信度到底是多少呢?例如大学生平均月消费为数据可信度到底是多少呢?例如大学生平均月消费为1 1

2、080080元,有人就笑了,说他明明才元,有人就笑了,说他明明才800800元左右,也有人说元左右,也有人说他一个月他一个月2 0002 000多元。为什么会出现这种情况呢?多元。为什么会出现这种情况呢?相信大家都知道,相信大家都知道,“2017“2017年高校毕业生满意度年高校毕业生满意度”、“37“37个城市平均月薪出炉个城市平均月薪出炉”、“大学生平均月消费大学生平均月消费”中中所研究的都是总体,例如高校毕业生、所研究的都是总体,例如高校毕业生、3737个城市和大学个城市和大学生,即是针对所有高校毕业生、生,即是针对所有高校毕业生、3737个城市所有的劳动力、个城市所有的劳动力、所有大学

3、生,但是所描述的指标如满意度、平均月薪和所有大学生,但是所描述的指标如满意度、平均月薪和平均月消费的计算却是来自于样本。这是出现了矛盾吗?平均月消费的计算却是来自于样本。这是出现了矛盾吗?3第一节第一节 抽样推断概述抽样推断概述n一、抽样推断一、抽样推断 1.1.统计抽样法统计抽样法按照随机原则从全部研究对象中抽取按照随机原则从全部研究对象中抽取部分单位进行观察,获得各项数据的调查方法;部分单位进行观察,获得各项数据的调查方法;运用数理统计的原理,根据抽样调查运用数理统计的原理,根据抽样调查所得的非全面调查资料来推算总体情况的一种统计所得的非全面调查资料来推算总体情况的一种统计研究方法。研究方

4、法。2.2.抽样推断的特点抽样推断的特点n由部分推算整体;由部分推算整体;遵循遵循随机原则;随机原则;n运用运用概率估计法;概率估计法;n抽样推断的误差可以事先计算并加以控制。抽样推断的误差可以事先计算并加以控制。4第一节第一节 抽样推断概述抽样推断概述n一、抽样推断一、抽样推断 3.3.抽样推断的抽样推断的作用:作用:n在无法或很难进行全面调查的场合下,可以运用抽在无法或很难进行全面调查的场合下,可以运用抽样法来了解全面情况;样法来了解全面情况;n运用抽样法可以对全面调查的结果加以补充或订正;运用抽样法可以对全面调查的结果加以补充或订正;n运用抽样法可以对生产过程中产品质量进行检查和运用抽样

5、法可以对生产过程中产品质量进行检查和控制;控制;n运用抽样法可以对总体的某种假设进行检查,来判运用抽样法可以对总体的某种假设进行检查,来判断这种假设的真伪,决定行动的取舍。断这种假设的真伪,决定行动的取舍。5第一节第一节 抽样推断概述抽样推断概述n二、有关抽样的基本范畴二、有关抽样的基本范畴 1.总体总体N:研究对象,全及总体即统计总体,又:研究对象,全及总体即统计总体,又称母体,称母体,N总是很大的数;总是很大的数;品质标志品质标志属性总体;数量标志属性总体;数量标志变量总体。变量总体。n:观察对:观察对象,又称子样,简称样本,是象,又称子样,简称样本,是指从全及总体中随机抽取出来,用来代表

6、全及总体指从全及总体中随机抽取出来,用来代表全及总体的那部分单位构成的总体,的那部分单位构成的总体,n相对于相对于N则是很小的数。则是很小的数。注:对于一个确定的问题,全及总体是唯一的,注:对于一个确定的问题,全及总体是唯一的,样本总体不是唯一确定的。样本总体不是唯一确定的。6第一节第一节 抽样推断概述抽样推断概述n二、有关抽样的基本范畴二、有关抽样的基本范畴 2.指标指标:根据全及总体各个单位的标志值或标:根据全及总体各个单位的标志值或标志特征计算的,用来反映全及总体某种属性的综合志特征计算的,用来反映全及总体某种属性的综合指标;指标;:由样本总体各单位标志值或标志特征:由样本总体各单位标志

7、值或标志特征计算出的综合指标。计算出的综合指标。注:对于一个确定的问题,全及指标是唯一的,注:对于一个确定的问题,全及指标是唯一的,样本指标不是唯一确定的,即样本指标不是唯一确定的,即样本指标的随机变量样本指标的随机变量。7统计推断统计推断参数(未知量)参数(未知量)统统计量(已知量计量(已知量)第一节第一节 抽样推断概述抽样推断概述n二、有关抽样的基本范畴二、有关抽样的基本范畴 2.指标指标9全及指标全及指标样本指标样本指标单位数单位数Nn类别类别未加权加权未加权加权平均数平均数标准差标准差方差方差成数成数NXX_ FFXX_ nxx_ fxfx_ NXX2_ -)(FFXX2_ -)(1-

8、2_ 1nxxsn)(ffxxsn2_ 1-)(NXX2_ 2-)(FFXX2_ 2-)(1-2_ 21nxxsn)(ffxxsn2_ 2-1)(NNP1PNNQ10nnp1pnn1q0从总体从总体N个单位中随机抽取一个样本容个单位中随机抽取一个样本容量为量为n的样本,每次从总体中抽取一个,的样本,每次从总体中抽取一个,并把结果登记下来,又放回总体中重新并把结果登记下来,又放回总体中重新参加下一次的抽选。又称参加下一次的抽选。又称放回抽样放回抽样每次从总体中抽选一个单位后就不每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又再将其放回参加下一次的抽选。又称称不放回抽样不放回抽样.总体

9、单位数总体单位数N不变,同一单位可能不变,同一单位可能多次被抽中。多次被抽中。总体单位数减少总体单位数减少n,同一单位只可,同一单位只可能被抽中一次。能被抽中一次。根据取样方式不同,可分为:根据取样方式不同,可分为:第二节第二节 抽样分布抽样分布n一、抽样分布一、抽样分布 样本是随机变量,样本估计量即统计样本是随机变量,样本估计量即统计量是样本的已知函数,也是随机变量,因而有其概量是样本的已知函数,也是随机变量,因而有其概率分布。统计量的概率分布称为抽样分布,也称统率分布。统计量的概率分布称为抽样分布,也称统计量分布或随机变量函数分布。计量分布或随机变量函数分布。n样本均值的分布;样本均值的分

10、布;n 分布;分布;nt分布;分布;nF分布。分布。112第二节第二节 抽样分布抽样分布n二、样本均值的分布二、样本均值的分布 由总体中全部样本平均数的可能取值和与之相应的概率由总体中全部样本平均数的可能取值和与之相应的概率组成。组成。设总体变量为设总体变量为X,其平均数为,其平均数为 。在重复抽样条件下,。在重复抽样条件下,从总体中抽出的样本为从总体中抽出的样本为 ,并互相独立,而且每,并互相独立,而且每个个 (i=1,2,n)都是从总体中随机抽出的,所以变)都是从总体中随机抽出的,所以变量量 与总体与总体X是同分布的随机变量。因此,样本平均数的期是同分布的随机变量。因此,样本平均数的期望值

11、与方差分别为:望值与方差分别为:12nxxx,21ixix _1212.1()=()().()nnxxxE xEE xE xE xnn ()第二节第二节 抽样分布抽样分布n二、样本均值的分布二、样本均值的分布 可以看出,样本平均数的分布中心与总体可以看出,样本平均数的分布中心与总体X的分布中心的分布中心完全相同,样本平均数的方差是总体分布方差的完全相同,样本平均数的方差是总体分布方差的1/n。因此,。因此,样本平均数分布的集中趋势优于总体分布自身的集中趋势。样本平均数分布的集中趋势优于总体分布自身的集中趋势。由于样本平均数能由于样本平均数能“集中集中”分布于总体平均数附近,我们可分布于总体平均

12、数附近,我们可以考虑用样本平均数来估计总体的平均数。以考虑用样本平均数来估计总体的平均数。13第二节第二节 抽样分布抽样分布n三、三、分布分布设设 是来自总体是来自总体N(0,1)的样)的样本,则称统计量:本,则称统计量:服从自由度为服从自由度为n的的 分布,记为分布,记为 。分布的概分布的概率密度为:率密度为:式中的式中的 是是 函数在函数在n/2上的函数值。特别地,当上的函数值。特别地,当n=2时,时,分布为指数分布。分布为指数分布。142nxxx,21222212nxxx2)(n22)()()();(0 00 22121222xxexnnxxnn)(2n22第二节第二节 抽样分布抽样分布

13、n四、四、t分布分布设设 ,且且X,Y相互独立,相互独立,则称随机变量:则称随机变量:服从自由度为服从自由度为n的的t分布,记为分布,记为 。t分布的概率分布的概率密度为:密度为:t分布又称为学生氏(分布又称为学生氏(Student)分布。)分布。15),(1 0 NX)(nY2nYXt/)(ntt)()1(221)21(2xnxnnnnxtn)()();(第二节第二节 抽样分布抽样分布n五、五、F分布分布设设 ,且且U,V相互独立,则相互独立,则称随机变量:称随机变量:服从自由度为服从自由度为 的的F分布,记为分布,记为 。t分布分布的概率密度为:的概率密度为:注:上述分布都是在总体为正态分

14、布这一基本假定下得到的。注:上述分布都是在总体为正态分布这一基本假定下得到的。16)(12nU)(22nV21/nVnUF)(21,nn)(21,nnFF)()()()()()()();(0 00 1222n,2221122121212121211xxxnnnxnnnnnnnnnxFnnn第三节第三节 抽样误差抽样误差n一、抽样误差的含义一、抽样误差的含义 由于随机抽样的偶然因素使样本各单位由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起样本的结构不足以代表总体各单位的结构,而引起样本指标和全及指标之间的绝对离差。指标和全及指标之间的绝对离差。如:样本平均数与总体平均

15、数之间的绝对离差,样本成如:样本平均数与总体平均数之间的绝对离差,样本成数与总体成数之间的绝对离差,等等。数与总体成数之间的绝对离差,等等。在统计工作过程中由于观察测量、登在统计工作过程中由于观察测量、登记、计算上的差错所引起的误差,又称为工作误差,记、计算上的差错所引起的误差,又称为工作误差,它是所有统计工作都可能发生的;它是所有统计工作都可能发生的;样本指标值与总体指标值之间的离差。样本指标值与总体指标值之间的离差。17第三节第三节 抽样误差抽样误差n一、抽样误差的含义一、抽样误差的含义 3.代表性误差代表性误差由于调查人员违反随机抽样的原则,由于调查人员违反随机抽样的原则,有意地抽选较好

16、的单位或较差的单位进行调查,造有意地抽选较好的单位或较差的单位进行调查,造成样本指标值偏高或偏低。成样本指标值偏高或偏低。由抽取样本的随机性引起的误差,又分由抽取样本的随机性引起的误差,又分为:抽样实际误差:每次抽样调查所得的样本指为:抽样实际误差:每次抽样调查所得的样本指标与总指标之间的实际差数;标与总指标之间的实际差数;抽样平均误差抽样平均误差:所:所有可能出现的抽样实际误差的标准差有可能出现的抽样实际误差的标准差 注:系注:系统性误差和工作误差都属于思想、作风、技术问统性误差和工作误差都属于思想、作风、技术问题,可以防止和避免题,可以防止和避免;随机误差不可避免,但可以控制。;随机误差不

17、可避免,但可以控制。18第三节第三节 抽样误差抽样误差n二、抽样平均误差二、抽样平均误差 抽样平均误差抽样平均误差是是反映抽样误差一般水平反映抽样误差一般水平的指标。的指标。2.衡量尺度:衡量尺度:抽样平均数的平均数等于总体抽样平均数的平均数等于总体平均数;平均数;抽样成数的平均数等于总体成数。抽样成数的平均数等于总体成数。故:抽样标准差恰好反映了抽样指标和总体指标故:抽样标准差恰好反映了抽样指标和总体指标的平均离差程度。的平均离差程度。19第三节第三节 抽样误差抽样误差n二、抽样平均误差二、抽样平均误差 n总体标准差或方差的大小:抽样平均误差与总体标准总体标准差或方差的大小:抽样平均误差与总

18、体标准差或方差成正比;差或方差成正比;n样本单位数的多少:样本单位数的多少:抽样平均误差与样本单位数的平抽样平均误差与样本单位数的平方根成反比方根成反比;n抽样方法及抽样组织形式的差异。抽样方法及抽样组织形式的差异。(因总体标准差或方差未知)(因总体标准差或方差未知)n样本方差样本方差 或或 代替代替;n用估计标准差代替;用估计标准差代替;n用历史资料代替,若有几个方差,应选方差值最大的。用历史资料代替,若有几个方差,应选方差值最大的。2021sn)(pp1第三节第三节 抽样误差抽样误差n二、抽样平均误差二、抽样平均误差 (一)抽样平均数的平均误差:(一)抽样平均数的平均误差:注:由于修正因子

19、注:由于修正因子 总是小于总是小于1,因而不重复抽样误差总是小于重复,因而不重复抽样误差总是小于重复抽样误差,但当总体单位数抽样误差,但当总体单位数N很大的情况下,这个因子就十分接近很大的情况下,这个因子就十分接近1,因而,因而两种抽样误差就相差很小,抽样平均误差的公式可以表达为如下近似式:两种抽样误差就相差很小,抽样平均误差的公式可以表达为如下近似式:21n_x)(1-2_NnNnx1-NnN)(Nnnx-12_第三节第三节 抽样误差抽样误差n二、抽样平均误差二、抽样平均误差 (二)抽样成数的平均误差:(二)抽样成数的平均误差:同理:在总体单位数同理:在总体单位数N很大的情况下,抽样成数的平

20、均误差的公式可以很大的情况下,抽样成数的平均误差的公式可以表达为如下近似式:表达为如下近似式:22nppn)(1p)()()(1n-11-2NNnppNnNnp)()()(NnnppNnnp-11-12第三节第三节 抽样误差抽样误差n三、抽样极限误差三、抽样极限误差 在抽样推断中可允许的误差范围,等于样本指在抽样推断中可允许的误差范围,等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。标可允许变动的上限或下限与总体指标之差的绝对值。2.计算公式:计算公式:n抽样平均数极限误差:抽样平均数极限误差:或或 以总体平均数以总体平均数 为中心,在为中心,在 到到 之间变动,区间之间变动,区间

21、称为平均数的估计区间,区间的总长度为称为平均数的估计区间,区间的总长度为 ;n抽样平均数极限误差抽样平均数极限误差 或或以总体平均成数以总体平均成数P P为中心,在为中心,在 到到 之间变动,抽样之间变动,抽样成数在成数在 区间内,且与总体成数绝对离差不超区间内,且与总体成数绝对离差不超过过 。23Ppp_ X_ -_ xX _ _ xX),(_ _ _ _ -xxXX_ 2xpP-pP),(ppPP-ppppPp-_ _ -_ Xxx_ _ _ _ _ -xxxXx第三节第三节 抽样误差抽样误差n四、抽样误差的概率度四、抽样误差的概率度 把极限误差把极限误差 或或 ,分别除以,分别除以 或或

22、 得相对数得相对数t,表示误差范围为抽样平均误差的若干倍,表示误差范围为抽样平均误差的若干倍,t是测量估计可靠程是测量估计可靠程度的一个参数,称为抽样误差的概率度度的一个参数,称为抽样误差的概率度。2.计算公式:计算公式:或或 或或24_ xp_ xp_ _ txx_ _ txxptpptp第三节第三节 抽样误差抽样误差n五、抽样估计置信概率五、抽样估计置信概率 表明抽样指标和总体指标的误差不超过一定范表明抽样指标和总体指标的误差不超过一定范围的概率保证程度围的概率保证程度。n以总体平均数为中心,两边完全对称分布,即抽样平以总体平均数为中心,两边完全对称分布,即抽样平均数大于或小于总体平均数的

23、概率完全相等;均数大于或小于总体平均数的概率完全相等;n抽样平均数愈接近总体平均数,误差出现的可能性愈抽样平均数愈接近总体平均数,误差出现的可能性愈大,概率愈大;大,概率愈大;注:注:抽样误差范围和估计置信度是密不可分的,抽样误差范围和估计置信度是密不可分的,而且抽样误差范围愈小,则估计置信概率也愈小。而且抽样误差范围愈小,则估计置信概率也愈小。25_ xp_ xp第四节第四节 抽样估计抽样估计n一、抽样估计一、抽样估计 利用实际调查的抽样资料来估计相应总利用实际调查的抽样资料来估计相应总体全及指标的数值体全及指标的数值,也称参数估计,也称参数估计。2.种类:种类:根据抽样资料计算样本指标,并

24、以此直接作根据抽样资料计算样本指标,并以此直接作为相应全及指标的估计值;为相应全及指标的估计值;根据给定的概率保证程度的要求,利用实根据给定的概率保证程度的要求,利用实际抽样资料,求出总体被估计值的上限和下限,即给际抽样资料,求出总体被估计值的上限和下限,即给出总体参数可能存在的出总体参数可能存在的区间范围区间范围,而不是直接给出总,而不是直接给出总体参数的估计值。体参数的估计值。26第四节第四节 抽样估计抽样估计n二、总体参数的点估计二、总体参数的点估计 根据抽样资料计算样本指标,并以此直根据抽样资料计算样本指标,并以此直接作为相应全及指标的估计值接作为相应全及指标的估计值。2.定义:设定义

25、:设 表示总体平均数表示总体平均数 的估计值,的估计值,表示表示总体成数总体成数P的估计值,则有:的估计值,则有:或或27_ x_ X p_ _ xX pP第四节第四节 抽样估计抽样估计n二、总体参数的点估计二、总体参数的点估计 3.性质:性质:用抽样指标估计总体指标时,要求抽样指标用抽样指标估计总体指标时,要求抽样指标的平均数等于被估计的总体指标;的平均数等于被估计的总体指标;用抽样指标估计总体指标时,要求当样本容用抽样指标估计总体指标时,要求当样本容量量n充分大时抽样指标充分靠近总体指标充分大时抽样指标充分靠近总体指标;抽样指标估计总体指标时,要求作为优良估抽样指标估计总体指标时,要求作为

26、优良估计量的方差应该比其他估计量的方差小。计量的方差应该比其他估计量的方差小。28_ _ XxE)(PpE)(_ 第四节第四节 抽样估计抽样估计n三、总体参数的区间估计三、总体参数的区间估计 根据给定的概率保证程度的要求,利用根据给定的概率保证程度的要求,利用实际抽样资料,求出总体被估计值的上限和下限,即实际抽样资料,求出总体被估计值的上限和下限,即给出总体参数可能存在的区间范围,而不是直接给出给出总体参数可能存在的区间范围,而不是直接给出总体参数的估计值。总体参数的估计值。对于总体的被估计指标对于总体的被估计指标 ,找出样本的两个估计量,找出样本的两个估计量 和和 ,使被估计指标,使被估计指

27、标 落在区间落在区间 内的概率为内的概率为 ,是已知的,即是已知的,即 ,则称区间,则称区间 是总体指标是总体指标 的的置信区间,其置信概率为置信区间,其置信概率为 。称为显著性水平,称为显著性水平,是置信下是置信下限,限,为置信上限。为置信上限。29_ x_ X1x2x_ X),(21xx)(10-11)(2_ 1xXxP),(21xx_ X-11x2x第四节第四节 抽样估计抽样估计n三、总体参数的区间估计三、总体参数的区间估计 2.估计步骤估计步骤 根据已经给定的抽样极限误差范围要求推算概率保证程度根据已经给定的抽样极限误差范围要求推算概率保证程度:n抽取样本,计算样本指标,即计算样本平均

28、数或样本成抽取样本,计算样本指标,即计算样本平均数或样本成数,作为总体指标的估计值,并计算样本标准差以推算抽数,作为总体指标的估计值,并计算样本标准差以推算抽样平均误差样平均误差;n根据给定的抽样极限误差范围,估计总体指标的下限和根据给定的抽样极限误差范围,估计总体指标的下限和上限上限;n将抽样极限误差除以抽样平均误差求出概率度将抽样极限误差除以抽样平均误差求出概率度t值,再值,再根据根据t值查正态分布概率表,求出相应的置信概率值查正态分布概率表,求出相应的置信概率F(t)。)。30第四节第四节 抽样估计抽样估计n三、总体参数的区间估计三、总体参数的区间估计 2.估计步骤估计步骤 根据给定置信

29、概率要求推算抽样极限误差的可能范围根据给定置信概率要求推算抽样极限误差的可能范围:n抽取样本,计算样本指标,即计算样本平均数或样本成抽取样本,计算样本指标,即计算样本平均数或样本成数作为总体指标的估计值,并计算样本标准差以推算抽样数作为总体指标的估计值,并计算样本标准差以推算抽样平均误差平均误差;n根据给定的置信概率根据给定的置信概率F(t)的要求,查概率表求得概率)的要求,查概率表求得概率度度t值值;n根据概率度和抽样平均误差推算抽样极限误差的可能范根据概率度和抽样平均误差推算抽样极限误差的可能范围,并根据抽样极限误差求岀被估计总体指标的上、下限。围,并根据抽样极限误差求岀被估计总体指标的上

30、、下限。31第四节第四节 抽样估计抽样估计n四、必要样本容量四、必要样本容量 在一定置信概率下,为满足抽样极限误差所需要在一定置信概率下,为满足抽样极限误差所需要的最小样本容量的最小样本容量n,就是必要样本容量。,就是必要样本容量。2.目的:目的:n估计的精确度确定越大越好,即要有较小的估计的精确度确定越大越好,即要有较小的 或或 ;n估计的可靠性越大越好,即要有较大的置信概估计的可靠性越大越好,即要有较大的置信概率率 。和和虽然比较矛盾,虽然比较矛盾,但从理论上说,不管提出多高的置但从理论上说,不管提出多高的置信概率和多小的极限误差,都能计算出在这样的要求条件下所信概率和多小的极限误差,都能

31、计算出在这样的要求条件下所需要的必要样本容量需要的必要样本容量n。32_ xp-1第四节第四节 抽样估计抽样估计n四、必要样本容量四、必要样本容量 3.确定适当样本容量的意义确定适当样本容量的意义n若若n过大,调查工作量增大,体现不出抽样调查过大,调查工作量增大,体现不出抽样调查的优越性;的优越性;n若若n 过小,抽样误差会增大,抽样推断就会失去过小,抽样误差会增大,抽样推断就会失去价值。价值。33n30,为大样本;,为大样本;n 30,为小样本,为小样本第五节第五节 抽样方案设计及抽样组织形式抽样方案设计及抽样组织形式n一、抽样方案设计的基本原则一、抽样方案设计的基本原则 n保证实现抽样的随

32、机性原则保证实现抽样的随机性原则;n保证实现最大的抽样效果原则。保证实现最大的抽样效果原则。n纯随机抽样纯随机抽样n类型抽样类型抽样n等距抽样等距抽样n整群抽样整群抽样34第五节第五节 抽样方案设计及抽样组织形式抽样方案设计及抽样组织形式n二、纯随机抽样(二、纯随机抽样(简单随机抽样)简单随机抽样)直接从总体直接从总体N个单位中随机逐个地抽取样本单个单位中随机逐个地抽取样本单位位,又称,又称。主主要有抽签法和随机数表法要有抽签法和随机数表法。35第五节第五节 抽样方案设计及抽样组织形式抽样方案设计及抽样组织形式n三、类型抽样三、类型抽样(分层抽样)(分层抽样)先对总体各单位按主要标志加以分组,

33、然后先对总体各单位按主要标志加以分组,然后再从各组中按随机原则抽选一定单位构成样本。再从各组中按随机原则抽选一定单位构成样本。36总体总体N样本样本n等额抽取等额抽取等比例抽取等比例抽取第五节第五节 抽样方案设计及抽样组织形式抽样方案设计及抽样组织形式n三、类型抽样三、类型抽样 372ix2ii2ikii 1i nN N NNNNk ()在在重重复复抽抽样样情情况况下下:为为各各组组的的总总体体单单位位数数为为全全及及总总体体单单位位数数,即即为为分分类类数数目目平平均均组组内内方方差差第五节第五节 抽样方案设计及抽样组织形式抽样方案设计及抽样组织形式n三、类型抽样三、类型抽样 382ixn

34、(1)nN 在在不不重重复复抽抽样样情情况况下下:pp(1p)n 重重 复复 抽抽 样样:在在 成成 数数 情情 况况 下下:第五节第五节 抽样方案设计及抽样组织形式抽样方案设计及抽样组织形式n四四、等距抽样(、等距抽样(机械抽样或系统抽样)机械抽样或系统抽样)将总体单位按某一标志排序,而后按一定的间将总体单位按某一标志排序,而后按一定的间隔抽取样本单位隔抽取样本单位。39(总体单位按某一标志排序)(总体单位按某一标志排序)第五节第五节 抽样方案设计及抽样组织形式抽样方案设计及抽样组织形式n四四、等距抽样(等距抽样(机械抽样或系统抽样)机械抽样或系统抽样)n按无关标志排队按无关标志排队用纯随机

35、抽样的公式,采用不重复抽样公式:用纯随机抽样的公式,采用不重复抽样公式:40 xp2n (1)nNp(1 p)n (1)nN 为为简简便便起起见见,也也可可采采用用重重复复抽抽样样公公式式。第五节第五节 抽样方案设计及抽样组织形式抽样方案设计及抽样组织形式n四四、等距抽样(等距抽样(机械抽样或系统抽样)机械抽样或系统抽样)n按有关标志排队按有关标志排队用类型抽样的公式用类型抽样的公式412xp np(1p)n 第五节第五节 抽样方案设计及抽样组织形式抽样方案设计及抽样组织形式n五五、整群抽样、整群抽样 将总体全部单位分为若干将总体全部单位分为若干“群群”,然后随机抽取,然后随机抽取一部分一部分

36、“群群”,被抽中群体的所有单位构成样本,被抽中群体的所有单位构成样本。例:总体群数例:总体群数R=16 R=16 样本群数样本群数r=4r=442hlpdnnnnnABCDEFGHIJKLMNOPLHPD样本容量样本容量第五节第五节 抽样方案设计及抽样组织形式抽样方案设计及抽样组织形式n五五、整群抽样、整群抽样 4322x22x22p2priii 1riii 1riii 1(xx)x rx (xx)r x r x(pp)p rp 为为全全及及总总体体各各群群的的平平均均数数为为全全及及平平均均数数或或:为为抽抽样样各各群群的的平平均均数数为为抽抽样样各各群群的的总总平平均均数数为为全全及及总总

37、体体各各群群的的成成数数为为全全及及总总体体的的成成数数2riii 1(pp)rp r p 或或:为为抽抽样样各各群群的的成成数数为为抽抽样样各各群群的的总总成成数数第五节第五节 抽样方案设计及抽样组织形式抽样方案设计及抽样组织形式n五五、整群抽样、整群抽样 442x2pxpRrrR(1)R1Rr (1)rRr (1)rR 整整群群抽抽样样都都采采用用不不重重复复抽抽样样。所所以以在在计计算算抽抽样样误误差差时时要要使使用用修修正正系系数数,当当 的的数数目目较较大大时时,可可用用来来代代替替。整整群群抽抽样样的的抽抽样样平平均均误误差差计计算算公公式式为为:第五节第五节 抽样方案设计及抽样组

38、织形式抽样方案设计及抽样组织形式n六六、阶段抽样、阶段抽样 指分两个或两个以上的阶段来完成抽取样本单指分两个或两个以上的阶段来完成抽取样本单位的过程位的过程。例:在某省例:在某省100100多万农户抽取多万农户抽取10001000户调查农户生产户调查农户生产性投资情况。性投资情况。45第一阶段:从该省所有县中抽取第一阶段:从该省所有县中抽取5 5个县个县第二阶段:从被抽中的第二阶段:从被抽中的5 5个县中各抽个县中各抽4 4个乡个乡第三阶段:从被抽中的第三阶段:从被抽中的2020个乡中各抽个乡中各抽5 5个村个村第四阶段:从被抽中的第四阶段:从被抽中的100100个村中各抽个村中各抽1010户

39、户样本样本n=100n=10010=1000(10=1000(户户)第五节第五节 抽样方案设计及抽样组织形式抽样方案设计及抽样组织形式n六六、阶段抽样、阶段抽样 n第一段第一段:n第二段:第二段:46)(12_ RrRrxx)(1_2_ MmMnix修正后的抽样平均误差:第五节第五节 抽样方案设计及抽样组织形式抽样方案设计及抽样组织形式n七、抽样方案的检查七、抽样方案的检查 验证抽样结果能否获得最有代表性的数据,验证抽样结果能否获得最有代表性的数据,对所设计对所设计的的方案进行方案进行的的检查。检查。2.种类:种类:以方案所要求的允许误差为标准,以方案所要求的允许误差为标准,用已掌握的资料检查

40、其在一定概率保证下,极限用已掌握的资料检查其在一定概率保证下,极限误差是否超过方案所允许的误差范围。误差是否超过方案所允许的误差范围。将方案中的样本指标与过去已掌握将方案中的样本指标与过去已掌握的总体同一指标的总体同一指标 或或P进行对比,看其比率(一般进行对比,看其比率(一般用百分数表示)是否超过所规定的要求。用百分数表示)是否超过所规定的要求。47_ X小结小结n抽样推断是在抽样调查的基础上,利用样本的实际资料抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推断总体数量特征的一种统计方计算样本指标,并据以推断总体数量特征的一种统计方法。法。n抽样推断常用的概念:全及总体

41、和样本总体、全及指标抽样推断常用的概念:全及总体和样本总体、全及指标和样本指标、重复抽样和不重复指样、抽样平均误差和和样本指标、重复抽样和不重复指样、抽样平均误差和抽样极限误差、概率度和置信概率。其中抽样平均误差抽样极限误差、概率度和置信概率。其中抽样平均误差是最重要的概念。是最重要的概念。n影响抽样平均误差的因素是:总体标准差和方差、样本影响抽样平均误差的因素是:总体标准差和方差、样本单位数、抽样方法和抽样组织方式。单位数、抽样方法和抽样组织方式。48小结小结n抽样极限误差是指样本指标与总体指标之间可能的误差抽样极限误差是指样本指标与总体指标之间可能的误差范围,而这个可能范围是由一定的概率保

42、证程度来控制范围,而这个可能范围是由一定的概率保证程度来控制的。的。n抽样极限误差与概率保证程度成反比关系。抽样极限误抽样极限误差与概率保证程度成反比关系。抽样极限误差除以抽样平均误差得到的相对数差除以抽样平均误差得到的相对数概率度,表明了样概率度,表明了样本指标与总体指标之间的误差不超过允许误差范围的概本指标与总体指标之间的误差不超过允许误差范围的概率有多大。率有多大。n抽样估计有两种方法:点估计和区间估计。抽样估计有两种方法:点估计和区间估计。n介绍了五种抽样组织方式:介绍了五种抽样组织方式:纯随机抽样纯随机抽样、分层抽样、等、分层抽样、等距抽样、距抽样、整群抽样、阶段抽样整群抽样、阶段抽样。49本章完本章完

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第七章-抽样推断-(《统计学》课件).pptx)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|