1、抽样方法及技巧培训Powell2011/7/18一、抽样基本概念二、概率抽样三、非概率抽样四、案例讲解主要培训内容主要培训内容 抽样基本概念抽样基本概念抽样基本概念抽样基本概念抽样:就是从总体中抽取样本的过程。抽样的目的和作用:在于科学地挑选总体的部分作为总体的代表,以便通过对这局部的研究,取得能说明总体的足够可靠的资料,准确地推断总体的情况,从而认识总体的特征或规律性。为了使统计推断正确可靠,抽样的样本对于总体来说必须具有代表性。抽样方法抽样方法抽样方法非概率抽样概率抽样简单随机抽样系统抽样分层抽样整群抽样方便抽样定额抽样空间抽样立意(判断)抽样滚雪球抽样抽样基本概念抽样基本概念抽样误差抽样
2、误差因为在抽样研究中,只取总体中的一部分作为直接研究的对象,然后根据样本结果去推算总体的一般情况,而这样的推算与总体的实际有着偏差,这种偏差称为抽样误差。抽样偏差抽样偏差当一个样本未能代表它所要代表的总体时,偏差就进入了。偏差可能是由多种原因造成的。只要使用了非随机抽样,或者随机抽样使用的总体源有偏差时,抽样偏差就会发生。抽样偏差是一种歪曲,这种歪曲是由选择或形成样本的方式引起的,所以样本对于总体就不再有代表性。抽样基本概念抽样基本概念概率抽样概率抽样概率抽样概念概率抽样概念遵循随机化原则的抽样称为概率抽样。概率抽样应满足的要求概率抽样应满足的要求随机性 总体中的所有个体都有同样被抽出的机会。
3、可行性 抽样的方法在实际中是可实施的。信息性 抽得的样本尽可能反映出分析时所期望的各种 信息。简单随机抽样简单随机抽样简单随机抽样是一种一步抽样法,它要求在调查总体N中不加任何分组、划类、排队等,完全随机抽取n个调查单位作为样本。在简单随机抽样中,总体中的每个单位都有相同的被抽中的概率。此抽样方法可应用于下列包装方式(或产品类型):概率抽样概率抽样系统抽样(等距抽样)系统抽样(等距抽样)系统抽样方法是等间隔法的机械抽样。它把总体中所有个体按一定顺序编号,然后依固定间隔取样,间隔的大小视所需样本容量与总体中个体数目的比率而定,起始数字必须是随机决定的。等距抽样:有直线等距抽样,对称等距抽样和循环
4、等距抽样三种。注意:这种抽样方法在名单排列中,如果存在周期性部分,则会造成偏差。因此,在等距抽样间距确定以后,选择起点时,应根据掌握的信息,尽量避开总体可能存在周期的点。概率抽样概率抽样系统抽样(等距抽样)步骤系统抽样(等距抽样)步骤概率抽样概率抽样(1)设总体共有N个单位,现需要从中抽出n个单位作为样本。先将总体的N个单位按与总体特征标志无关的标志进行排队。(2)确定取样间隔,将N划分为n个单位相等的部分,每部分间隔为K=N/n(取整数部分)。(3)决定起点,抽样起点的选定有多种方式,通常是在第一部分顺序为1,2,3,i,K个单位中随机取一个单位i作为抽样的起点。对于总体单位N是奇数时,也可
5、按R=(K+1)/2算出R值,就按某一部分的第R个单位作为抽样起点。对于总体单位N是偶数时,则按R=(K+2)/2算出起点位置。(4)在第一部分中,随机以i为起点抽出第一个样本后,继续在第二部分中抽出第i+K单位为样本;如此类推,在第n部分则抽取第i+(n-1)K单位为样本。系统抽样(等距抽样)系统抽样(等距抽样)概率抽样概率抽样此抽样方法可应用于下列包装方式(或产品类型):系统抽样(等距抽样)系统抽样(等距抽样)概率抽样概率抽样实际操作中以下几种方式供参考:层次抽样:来货若为分层摆放或次序排列的,如电阻、电容等贴片料多卷摆放在一起,卡通箱等分层叠放等。对角抽样:来货摆放横竖分明、整齐一致的,
6、如使用托盘等盛装或平铺放置的来料等三角抽样:来货若摆放在同一平面时。S行抽样:来货若摆放在同一平面时。分层抽样(类型抽样)分层抽样(类型抽样)概率抽样概率抽样分层抽样是先把总体按一定标志分成不同类型或层次,然后从各种不同类型中随机抽取若干单位组成样本。以调查所要分析和研究的主要变量或相关的变量作为分层的标准。以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。以那些有明显分层区分的变量作为分层变量。分层标准分层标准分层抽样(类型抽样)步骤分层抽样(类型抽样)步骤概率抽样概率抽样(1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。(3)各层分别
7、按简单随机抽样或系统抽样的方法抽取。(4)综合每层抽样,组成样本。此抽样方法可应用于下列包装方式(或产品类型):一模多穴、一送货批有不同生产批什么是整群抽样什么是整群抽样 整群抽样又称聚类抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。整群抽样的优缺点整群抽样的优缺点整群抽样的优点是实施方便、节省经费;整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样整群抽样的实施步骤整群抽样的实施步骤先将总体分为i个群,然后从i个群
8、中随机抽取若干个群,对这些群内所有个体或单元均进行调查。抽样过程可分为以下几个步骤:一、确定分群的标注 二、总体(N)分成若干个互不重叠的部分,每个部分为一群。三、据各样本量,确定应该抽取的群数。四、采用简单随机抽样或系统抽样方法,从i群中抽取确定的群数。例如,调查中学生患近视眼的情况,抽某一个班做统计;进行产品检验;每隔8h抽1h生产的全部产品进行检验等。整群抽样与分层抽样的区别整群抽样与分层抽样的区别整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大;分层抽样的样本是从每个
9、层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。非概率抽样非概率抽样-非概率抽样的定义非概率抽样的定义非概率抽样,又称为不等概率抽样不等概率抽样或非随机非随机抽样抽样,就是调查者根据自己的方便或主观判断抽取样本的方法。它不是严格按随机抽样原则来抽取样本,所以失去了大数定律的存在基础,也就无法确定抽样误差,无法正确地说明样本的统计值在多大程度上适合于总体。虽然根据样本调查的结果也可在一定程度上说明总体的性质、特征,但不能从数量上推断总体。方便抽样方便抽样样本限于总体中易于抽到的一部分。最常见的方便抽样是偶遇抽样,即研究者将在某一时间和环境中所遇到的每一总体单位均作为样本
10、成员。“街头拦人法”就是一种偶遇抽样。某些调查对被调查者来说是不愉快的、麻烦的,这时为方便起见就采用以自愿被调查者为调查样本的方法。方便抽样是非随机抽样中最简单的方法,省时省钱,但样本代表性因受偶然因素的影响太大而得不到保证。定额抽样定额抽样定额抽样也称配额抽样,是将总体依某种标准分层(群);然后按照各层样本数与该层总体数成比例的原则主观抽取样本。定额抽样与分层概率抽样很接近,最大的不同是分层概率抽样的各层样本是随机抽取的,而定额抽样的各层样本是非随机的。总体也可按照多种标准的组合分层(群),例如,在研究自杀问题时,考虑到婚姻与性别都可能对自杀有影响,可将研究对象分为未婚男性、已婚男性、未婚女
11、性和已婚女性四个组,然后从各群非随机地抽样。定额抽样是通常使用的非概率抽样方法,样本除所选标识外无法保证代表性。立意抽样立意抽样立意抽样又称判断抽样,研究人员从总体中选择那些被判断为最能代表总体的单位作样本的抽样方法。当研究者对自己的研究领域十分熟悉,对研究总体比较了解时采用这种抽样方法,可获代表性较高的样本。这种抽样方法多应用于总体小而内部差异大的情况,以及在总体边界无法确定或因研究者的时间与人力、物力有限时采用。滚雪球抽样滚雪球抽样以若干个具有所需特征的人为最初的调查对象,然后依靠他们提供认识的合格的调查对象,再由这些人提供第三批调查对象,依次类推,样本如同滚雪球般由小变大。滚雪球抽样多用
12、于总体单位的信息不足或观察性研究的情况。这种抽样中有些分子最后仍无法找到,有些分子被提供者漏而不提,两者都可能造成误差。空间抽样空间抽样对非静止的、暂时性的空间相邻的群体的抽样方法。例如,游行与集会没有确定的总体,参加者从一地到另一地,一些人离去又有一些人进来,但这些事件是在一定范围内进行的。对这样的总体在同一时间内抽样十分重要,以便样本组成不会经历时间上的太大变化。具体作法是:若干调查员间隔均匀的距离,从某一方向开始,访问离他最近的人,然后每隔一定步数抽取一人为调查对象非概率抽样的优点非概率抽样的优点简单易行、成本低、省时间,在统计上也比概率抽样简单。但由于无法排除抽样者的主观性,无法控制和
13、客观地测量样本代表性,因此样本不具有推论总体的性质。非概率抽样多用于探索性研究和预备性研究,以及总体边界不清难于实施概率抽样的研究。在实际应用中,非概率抽样往往与概率抽样结合使用例题例题1例题例题问:工厂生产的某种产品用传输带将产品送入包装车间,检验人员从传送带上每隔5分钟抽一件产品进行检验,问这是一种什么抽样法?答:这是将总体分成均衡的若干部分,再从每一部分按照预先订出的规则抽取一个个体,得到所需要的样本,故它是系统抽样。例题例题2例题例题问:已知甲、乙、丙三个车间一天内生产的产品分别是150件、130件、120件,为了掌握各车间产品质量情况,从中取出一个容量为40的样本,该用什么抽样方法?
14、简述抽样过程?答:因总体来自三个不同车间,故适宜用分层抽样法,因抽取产品数与产品总数之比为40:400=1:10,所以,各车间抽取产品数量分别为15件、13件、12件。基本概念基本概念GB/T 2828.1-2003v批(lot):汇集在一起的一定数量的某种产品、材料或服务v批量(lot size):批中产品的数量v样本(sample):取自一个批并且提供有关该批信息的一个或一组产品v样本量(sample size):样品中产品的数量v检验水平(level):标志着检验量v接收质量限(acceptance quality limit):当一个连续批被提交验收抽样时,可允许的最差过程平均质量水平
15、vAc:接收数vRe:拒收数样本量字码表样本量字码表GB/T 2828.1-2003正常检验一次抽样计划正常检验一次抽样计划(主抽样表主抽样表)GB/T 2828.1-2003加严检验一次抽样计划加严检验一次抽样计划(主抽样表主抽样表)GB/T 2828.1-2003放宽检验一次抽样计划放宽检验一次抽样计划(主抽样表主抽样表)GB/T 2828.1-2003检索方法检索方法GB/T 2828.1-2003 由样本量字码表得到样本量字码后,在抽样方案中由该字码所在行向右,在样本量栏内读出样本量,再以样本量字码所在行和指定的AQL所在列相交处,读出Ac和Re,若在相交处是箭头,则沿着箭头方向读出箭头所指的第一个Ac和Re,然后由此接收数和拒收数所在行向左,在样本量内读出相应的样本量。例题例题1例题例题问:批量1000,level一般检验水平级,AQL0.065,正常检验一次抽样方案,查询样本量和Ac/Re答:样本量200,Ac/Re 0/1。例题例题2问:批量1000,level特殊检验水平S-1级,AQL4.0,正常检验一次抽样方案,查询样本量和Ac/Re答:样本量3,Ac/Re 0/1。