1、第六章第六章 抽样方法抽样方法中国到底有多少人?这个怎么确定数字一直在变化。有一段时间说是十亿,过了一段时间,又说是十二亿。再过二年,说是十三亿了。人口数量,有什么意义?如果说,单个的人口数量没有多少意义,但是人口结构,意义就大了。男女性别。青年少年,老年人,婴儿。(还有一词叫人口红利)农村到底还剩下多少人?这个问题有什么意义?去年,全国兴起了农村普查。(房子、人口)我们的农村政策就围绕这个来制定。中国到底有多少未婚青年?女生平均体重多少?(好象隐私)有多少留守儿童?(三千万,六千万?)东北师大大二男生平均身高是多少?你们有哪些办法?第一节第一节 抽样的意义抽样的意义第二节第二节 非概率抽样非
2、概率抽样第三节第三节 概率抽样概率抽样第四节第四节 样本规模与抽样误差样本规模与抽样误差第一节第一节 抽样的意义抽样的意义一、抽样的概念一、抽样的概念二、抽样的作用二、抽样的作用三、抽样的类型三、抽样的类型一、抽样的概念一、抽样的概念1 1。总体:是构成它的所有元素的集合。是研究者感兴趣的群。总体:是构成它的所有元素的集合。是研究者感兴趣的群体,是研究者要将研究结果进行概化的目标。体,是研究者要将研究结果进行概化的目标。2 2。样本:是为研究提供信息的总体中的一部分。样本:是为研究提供信息的总体中的一部分。3 3。抽样:选择愿意参与研究的个体的过程。抽样:选择愿意参与研究的个体的过程。4 4。
3、抽样单位:一次直接抽样所使用的基本单位。抽样单位:一次直接抽样所使用的基本单位。5 5。抽样框:抽样范围,一次直接抽样时总体中所有抽样单位。抽样框:抽样范围,一次直接抽样时总体中所有抽样单位的名单。的名单。6 6。参数值:总体值,关于总体中某一变量的综合描述。参数值:总体值,关于总体中某一变量的综合描述。7 7。统计值:样本值,关于样本中某一变量的综合描述。统计值:样本值,关于样本中某一变量的综合描述。二、抽样的作用二、抽样的作用提供了一种实现提供了一种实现“由部分认识总体由部分认识总体”的途的途径和手段;径和手段;节省人力、时间、经费节省人力、时间、经费三、抽样的类型三、抽样的类型1 1。非
4、概率抽样。非概率抽样主要依据研究者的主观意愿、判断或是否方便等因素抽取样主要依据研究者的主观意愿、判断或是否方便等因素抽取样本;本;误差大,难以估计,代表性小,适合探索性研究。误差大,难以估计,代表性小,适合探索性研究。主要有:偶遇抽样、判断抽样、定额抽样、雪球抽样主要有:偶遇抽样、判断抽样、定额抽样、雪球抽样2 2。概率抽样。概率抽样依据概率论的基本原理,按照随机原则进行抽样;依据概率论的基本原理,按照随机原则进行抽样;主要有:简单随机抽样、系统抽样、分层抽样、整群抽样、主要有:简单随机抽样、系统抽样、分层抽样、整群抽样、多段抽样多段抽样第二节第二节 非概率抽样非概率抽样一、偶遇抽样一、偶遇
5、抽样方便抽样或自然抽样,指研究者根据现实情况,以自己方便的形式抽方便抽样或自然抽样,指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近、最容易找到取偶然遇到的人作为对象,或者仅仅选择那些离得最近、最容易找到的人作为对象。的人作为对象。或者说研究可以得到的一组个体或者说研究可以得到的一组个体.二、判断抽样二、判断抽样目的抽样,研究者根据研究目标和自己的主观分析来选择和确定他们目的抽样,研究者根据研究目标和自己的主观分析来选择和确定他们认为可以提供所需要信息的人作为样本。认为可以提供所需要信息的人作为样本。三、定额抽样三、定额抽样配额抽样,研究者根据可能影响研
6、究变量的因素对总体分层,并计算配额抽样,研究者根据可能影响研究变量的因素对总体分层,并计算出比例,然后取挑选对象。出比例,然后取挑选对象。检验理论、解释关系、比较不同群体时,抽样标准是适合性,不是代检验理论、解释关系、比较不同群体时,抽样标准是适合性,不是代表性表性四、雪球抽样四、雪球抽样在无法了解总体情况时,从少数成员入手调查并询问其他符合条件的在无法了解总体情况时,从少数成员入手调查并询问其他符合条件的人,在找这些人所知道的人。人,在找这些人所知道的人。第三节第三节 概率抽样概率抽样一、概率抽样的程序一、概率抽样的程序二、简单随机抽样二、简单随机抽样三、系统抽样三、系统抽样四、分层抽样四、
7、分层抽样五、整群抽样五、整群抽样六、多段抽样六、多段抽样一、概率抽样的程序一、概率抽样的程序随机抽取:总体中的每个个体都有同等的机会入选样本,随机抽取:总体中的每个个体都有同等的机会入选样本,而且每个个体的抽取都是独立的。而且每个个体的抽取都是独立的。1 1。界定总体:范围与界限。界定总体:范围与界限2 2。制定抽样框:收集总体中全部抽样单位的名单,并对。制定抽样框:收集总体中全部抽样单位的名单,并对名单统一编号。名单统一编号。分段、分层抽样时则要分别建立起几个不同的抽样框分段、分层抽样时则要分别建立起几个不同的抽样框3 3。决定抽样方案:确定抽样方法、样本规模、主要目标。决定抽样方案:确定抽
8、样方法、样本规模、主要目标量的精确程度量的精确程度4 4。实际抽取样本:按照选定方法从抽样框中抽取一个个。实际抽取样本:按照选定方法从抽样框中抽取一个个抽样单位,构成样本抽样单位,构成样本5 5。评估样本质量:质量、代表性、偏差。评估样本质量:质量、代表性、偏差将可得到的反映总体中某些重要特征及其分布的资料与样将可得到的反映总体中某些重要特征及其分布的资料与样本中的同类指标进行对比。本中的同类指标进行对比。二、简单随机抽样二、简单随机抽样单纯随机抽样:按照等概率原则直接从含单纯随机抽样:按照等概率原则直接从含有有N N个元素的总体中随机抽取个元素的总体中随机抽取n n个元素组成个元素组成样本(
9、样本(N Nn n)。)。常用的方法:抽签、随机数字表常用的方法:抽签、随机数字表优点优点:可能产生代表性样本可能产生代表性样本缺点缺点:不容易做不容易做1.1.编号难编号难2.2.必须能够接触到被选中的个体必须能够接触到被选中的个体3.3.成分比例难成分比例难三、系统抽样三、系统抽样等距抽样或机械抽样等距抽样或机械抽样,将总体的单位编号排序后将总体的单位编号排序后,按照固定的间隔抽取个体组成样本的方法按照固定的间隔抽取个体组成样本的方法.步骤步骤:1.1.制定抽样框制定抽样框2.2.计算抽样间隔计算抽样间隔:K=N/n:K=N/n3.3.在第一组在第一组K K个个体中随机抽取一个个体个个体中
10、随机抽取一个个体A.A.4.4.在抽样框中每隔在抽样框中每隔K K个个体抽取一个个体个个体抽取一个个体.5.5.将将N N个个体合起来构成样本个个体合起来构成样本.优点优点:简便易行简便易行条件条件:抽样框应该是随机排列的抽样框应该是随机排列的.注意注意2 2种情况种情况:1.1.抽样框中的个体排列具有某种次序或等级抽样框中的个体排列具有某种次序或等级2.2.抽样框中的个体排列具有与抽样间隔对应的周抽样框中的个体排列具有与抽样间隔对应的周期性分布期性分布.四、分层抽样四、分层抽样类型抽样类型抽样,将总体中的所有单位按照某种特征或标将总体中的所有单位按照某种特征或标志划分为若干类型或层次志划分为
11、若干类型或层次,在每个类型或层次中采在每个类型或层次中采用简单随机抽样或系统抽样的方法抽取一个子样用简单随机抽样或系统抽样的方法抽取一个子样本本,共同构成研究的样本共同构成研究的样本.优点优点:1.1.在不增加样本规模的前提下降低抽样误差在不增加样本规模的前提下降低抽样误差,提高提高抽样精度抽样精度,增大代表性增大代表性2.2.便于了解总体内不同层次的情况便于了解总体内不同层次的情况,以及对总体中以及对总体中的不同层次进行单独研究或者进行比较的不同层次进行单独研究或者进行比较.注意注意:1.1.分层的标准问题分层的标准问题2.2.分层的比例问题分层的比例问题五、整群抽样五、整群抽样从总体中随机
12、抽取一些小群体从总体中随机抽取一些小群体,将小群体的将小群体的所有元素构成样本所有元素构成样本.对小群体的抽取可采用简单随机抽样、系对小群体的抽取可采用简单随机抽样、系统抽样、分层抽样的方法。统抽样、分层抽样的方法。优点:优点:1 1。简化抽样过程。简化抽样过程2 2。降低收集资料的费用。降低收集资料的费用3 3。扩大抽样范围。扩大抽样范围缺点:代表性比较差缺点:代表性比较差六、多段抽样六、多段抽样多级抽样或分段抽样,按照抽样元素的隶属关系多级抽样或分段抽样,按照抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行。或层次关系,把抽样过程分为几个阶段进行。步骤:步骤:1 1。以大群为单位编
13、制抽样框。以大群为单位编制抽样框2 2。抽取若干大群。抽取若干大群3 3。以小群为单位给每个大群编制抽样框。以小群为单位给每个大群编制抽样框4 4。分别从每个大群中抽取小群。分别从每个大群中抽取小群5 5。根据需要重复。根据需要重复3 3、4 4步骤步骤6 6。得到基本元素,构成研究样本。得到基本元素,构成研究样本优点:方便易行优点:方便易行第四节第四节 样本规模与抽样误差样本规模与抽样误差一、样本规模一、样本规模二、影响样本规模确定的因素二、影响样本规模确定的因素三、抽样误差三、抽样误差一、样本规模一、样本规模样本容量,是指样本中所含个案的多少样本容量,是指样本中所含个案的多少合理的样本容量
14、应该是研究者在合理的时间和精合理的样本容量应该是研究者在合理的时间和精力消耗下能够获得的尽可能大的样本。力消耗下能够获得的尽可能大的样本。统计学中,通常以统计学中,通常以3030为界,为界,3030个个案及其以上为个个案及其以上为大样本,大样本,3030个个案以下为小样本。个个案以下为小样本。统计学中的大样本于教育研究中的大样本不是一统计学中的大样本于教育研究中的大样本不是一回事回事在教育研究中,最小样本容量是:在教育研究中,最小样本容量是:1 1。描述性研究中,。描述性研究中,n100n1002 2。相关研究中,。相关研究中,n50n503 3。实验研究中,。实验研究中,n30n30为了进行
15、不同类别之间的比较,必须扩大样本规为了进行不同类别之间的比较,必须扩大样本规模,至少在模,至少在100100个。个。二、影响样本规模确定的因素二、影响样本规模确定的因素1 1。总体规模。总体规模总体规模达到一定程度后,样本规模的改变很小总体规模达到一定程度后,样本规模的改变很小2 2。抽样的精确性。抽样的精确性其他条件一定的情况下,置信度越高,推论的把其他条件一定的情况下,置信度越高,推论的把握性越大,所要求的样本规模越大;握性越大,所要求的样本规模越大;置信区间越小,抽样的精确度越高,样本值与总置信区间越小,抽样的精确度越高,样本值与总体值之间的误差越小,所要求的样本规模就越大。体值之间的误
16、差越小,所要求的样本规模就越大。3 3。总体的异质性程度。总体的异质性程度异质性大,所需要的样本规模大。异质性大,所需要的样本规模大。4 4。研究者所拥有的经费、人力和时间。研究者所拥有的经费、人力和时间三、抽样误差三、抽样误差用样本值估计总体值时所出现的误差。用样本值估计总体值时所出现的误差。抽样误差是不可避免的,其大小可在抽样抽样误差是不可避免的,其大小可在抽样设计中加以控制设计中加以控制抽样误差取决于总体的分布方差和抽样规抽样误差取决于总体的分布方差和抽样规模模公司一般将规模控制在公司一般将规模控制在20002000以内以内现在研究,很多采取抽样,如农村中小学教师生活状况,农村留守儿童社会性(或情感)现状。找不同类型的省,然后在每个省找一、二个县。你们说,这是什么抽样?练习练习某市有300所小学,共有240000名学生。这些小学分布在全市5个行政区中。其中,重点小学有30所,一般小学有240所,比较差的小学有30所。现在要从全市小学生中抽取1200名进行调查,以了解全市小学生学习情况。请设计一个抽样方案。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。