1、随机抽样方法随机抽样方法 (1)现代社会,是信息化社会,人们常常需要收集各现代社会,是信息化社会,人们常常需要收集各种各样的数据,根据所获得的数据提取有价值的信息,作种各样的数据,根据所获得的数据提取有价值的信息,作出合理的判断与选择。出合理的判断与选择。统计统计是研究如何合理收集、整理、是研究如何合理收集、整理、描绘和分析数据的学科,它可以为人们制定决策提供依据描绘和分析数据的学科,它可以为人们制定决策提供依据。统计学统计学在社会各行各业中有着广泛的应用,在我们的日在社会各行各业中有着广泛的应用,在我们的日常生活中也经常要用到统计学的知识。常生活中也经常要用到统计学的知识。例如,某校高中学生
2、有例如,某校高中学生有900人,医务室想对全校学生的身人,医务室想对全校学生的身高情况作一次调查,为了不影响正常教学,准备抽取高情况作一次调查,为了不影响正常教学,准备抽取50名作为调查对象。名作为调查对象。在这个问题中,调查对象的在这个问题中,调查对象的总体总体是某校全体学生的身高是某校全体学生的身高,个体个体是每个学生的身高,抽取的这是每个学生的身高,抽取的这50名学生的身高是名学生的身高是样本样本,样本容量为,样本容量为50。统计统计统计所要解决的问题如何根据样本来推断总体,首统计所要解决的问题如何根据样本来推断总体,首先要做的就是采集样本,然后才能作统计推断。先要做的就是采集样本,然后
3、才能作统计推断。(2)如何抽取样本,直接关系到对总体估计的准确程度,因如何抽取样本,直接关系到对总体估计的准确程度,因此在抽样时要保证此在抽样时要保证每个个体被抽到的机会是均等的每个个体被抽到的机会是均等的,满,满足这样条件的抽样叫做随机抽样。足这样条件的抽样叫做随机抽样。简单随机抽样、系统抽样、分层抽样简单随机抽样、系统抽样、分层抽样常用方法常用方法随机抽样随机抽样 一个布袋中有一个布袋中有6个同样质地的球,从中先后个同样质地的球,从中先后不放回地抽取三个球。不放回地抽取三个球。第一次抽取时,第一次抽取时,6个球中的每一个球被抽到个球中的每一个球被抽到的可能性都是的可能性都是_ ;第二次抽取
4、时,余下的第二次抽取时,余下的5个球中的每一个被个球中的每一个被抽到的可能性都是抽到的可能性都是_ ;第三次抽取时,余下的第三次抽取时,余下的4个球被抽到的可能个球被抽到的可能性都是性都是_ 。61引例引例 1也就是说,每次抽取时,每个球都也就是说,每次抽取时,每个球都有相同的可能性被抽到!有相同的可能性被抽到!5141注意注意(1)它要求被抽取样本的总体的个体数有限;)它要求被抽取样本的总体的个体数有限;(2)它是从总体中逐个进行抽取;)它是从总体中逐个进行抽取;(3)它是一种不放回抽样;)它是一种不放回抽样;(4)它是一种等概率抽样。它是一种等概率抽样。一般地,从元素个数为一般地,从元素个
5、数为N的总体中的总体中逐个逐个、不放回地不放回地抽取容量为抽取容量为n的样本,如果每次抽取时各个个体被抽到的样本,如果每次抽取时各个个体被抽到的的概率相等概率相等,这样的抽样方法叫做简单随机抽样,这样,这样的抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本抽取的样本,叫做简单随机样本。1、概念、概念(一)简单随机抽样(一)简单随机抽样抽签法、随机数表法抽签法、随机数表法2、简单随机抽样的方法简单随机抽样的方法:(1)抽签法)抽签法步步骤骤 将总体中的所有个体(共将总体中的所有个体(共N个)编号(号码可个)编号(号码可以从以从1到到N),对个体编号时,也可以利用已有的编号。例如),对个
6、体编号时,也可以利用已有的编号。例如学生的学号,座位号等。学生的学号,座位号等。把号码写在形状、大小相同的号签上(号签把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行一个箱子里,进行均匀搅拌均匀搅拌。抽签时,每次从中抽出抽签时,每次从中抽出1个号签,连续抽取个号签,连续抽取n次,就得到一个容量为次,就得到一个容量为n的样本。的样本。要从我们班要从我们班50名同学中随机抽取名同学中随机抽取3人参加心人参加心理测试,请设计抽样方法。理测试,请设计抽样方法。小试身手小试身手优缺点优缺点优点:
7、简单易行简单易行缺点:仅适用于个体数较少的总体仅适用于个体数较少的总体。当总体个数较多时,搅拌得有可当总体个数较多时,搅拌得有可能不均匀,导致抽样不公平。费能不均匀,导致抽样不公平。费时费力。时费力。(2 2)随机数表法)随机数表法(1)随机数表是统计工作者用计算机生成的随机数,并)随机数表是统计工作者用计算机生成的随机数,并保证表中的保证表中的每个位置上的数字是等可能出现的每个位置上的数字是等可能出现的。(2)随机数表并)随机数表并不是唯一的不是唯一的,因此可以任选一个数作为,因此可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等开始,读数的方向可以向左,也可以向右、向上
8、、向下等等。(3)用随机数表进行抽样的步骤:将总体中个体编号;)用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码。选定开始的数字;获取样本号码。(4)由于随机数表是等概率的,因此利用随机数表抽取)由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的。样本保证了被抽取个体的概率是相等的。随机抽样并不是随意或随便抽取,因为随随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素意或随便抽取都会带有主观或客观的影响因素注意注意 优缺点优缺点优点简单易行,很好地解决了当简单易行,很好地解决了当总体个数较多时抽签法制签总体个数较多时
9、抽签法制签难的问题。难的问题。缺点当总体个数很多,需要的样当总体个数很多,需要的样本容量也很大时,用此法很本容量也很大时,用此法很不方便不方便引例引例 2 为了了解高一年级为了了解高一年级12000名学生的数学成绩名学生的数学成绩,需要抽需要抽取容量为取容量为120的样本的样本,用简单随机抽样还方便吗?请用用简单随机抽样还方便吗?请用合适的方法抽取合适的方法抽取.解解:(1)对全体学生的数学成绩进行编号对全体学生的数学成绩进行编号:1,2,3,12000.(2)分段分段:由于样本容量与总体容量的由于样本容量与总体容量的 比是比是1:100,我们我们将总体平均分为将总体平均分为120个部分个部分
10、,其中每一部分包含其中每一部分包含100个个个体个体.(3)在第一部分即在第一部分即1号到号到100号用号用简单随机抽样简单随机抽样,抽取一个抽取一个号码号码,比如是比如是50.(4)以以50作为起始数作为起始数,然后顺序抽取然后顺序抽取150,250,350,.11950.这样就得到容量为这样就得到容量为120的一个样本的一个样本.当总体的个数较多时,采用简单随机抽样太麻烦,这当总体的个数较多时,采用简单随机抽样太麻烦,这时将总体分成均衡的部分,然后按照预先定出的规则,从时将总体分成均衡的部分,然后按照预先定出的规则,从每一部分中抽取每一部分中抽取1个个体,得到所需要的样本,这种抽样个个体,
11、得到所需要的样本,这种抽样称为系统抽样,也被称为等距抽样。称为系统抽样,也被称为等距抽样。1、概念、概念 系统抽样时,将总体中的个体均分后的每一段进行抽样系统抽样时,将总体中的个体均分后的每一段进行抽样时,采用简单随机抽样;时,采用简单随机抽样;系统抽样每次抽样时,总体中各个个体被抽取的概率也系统抽样每次抽样时,总体中各个个体被抽取的概率也是相等的是相等的;若总体的个体数不能被样本容量整除时,可以先用简单若总体的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行。随机抽样从总体中剔除几个个体,然后再按系统抽样进行。说明说明(二)系(二)系 统统 抽抽 样
12、样2、步骤、步骤(1)先将总体中的)先将总体中的N个体编号个体编号.有时可直接利用个体自身所有时可直接利用个体自身所带的号码带的号码.(2)根据样本容量)根据样本容量n把总体均分为把总体均分为n段,确定段,确定分段间隔分段间隔k。是整数时,是整数时,;不是整数时,先从不是整数时,先从N中随机剔除中随机剔除一些个体,使得其为整数为止。一些个体,使得其为整数为止。nNnNk nN(3)第一段用简单随机抽样确定起始号码)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:)按照规则抽取样本:l,lk,l2k,l(n-1)k3 3、适用情况、适用情况总体容量较大,并且个体之间无明显差异总体容量
13、较大,并且个体之间无明显差异4、强化练习、强化练习(1)、系统抽样适合的总体应是()、系统抽样适合的总体应是()A、容量较小的总体;、容量较小的总体;B、容量较大的总体;、容量较大的总体;C、个体数较多但均衡的总体;、个体数较多但均衡的总体;D、任何总体、任何总体C(2)、要从已编号()、要从已编号(150)的)的50件产品中随机抽取件产品中随机抽取5件进行件进行检查,用系统抽样可能的编号是(检查,用系统抽样可能的编号是()A、5,10,15,20,25 B、3,13,23,33,43C、1,2,3,4,5,D、2,4,8,16,32(3)、从)、从2005个编号中抽取个编号中抽取20个号码入
14、样,采用系统抽样个号码入样,采用系统抽样的方法,则抽样的间隔为(的方法,则抽样的间隔为()A、99 B、99.5 C、100 D、100.5BC(4)、为了解某地参加高中数学竞赛的)、为了解某地参加高中数学竞赛的3008名学生的成名学生的成绩,从中抽取了绩,从中抽取了100名学生的成绩进行统计分析,用系统名学生的成绩进行统计分析,用系统抽样方法抽取样本,每组的容量为抽样方法抽取样本,每组的容量为_ 305、系统抽样与简单随机抽样的比较、系统抽样与简单随机抽样的比较 类别类别特点特点相互联系相互联系适用范围适用范围共同点共同点简单随机抽简单随机抽样样从总体中逐个从总体中逐个抽取抽取系统抽样在系统
15、抽样在起始部分抽起始部分抽样时,采用样时,采用简单随机抽简单随机抽样。样。总体个数较总体个数较少少在抽样过程中在抽样过程中每个个体被抽每个个体被抽到的可能性相到的可能性相等等系统抽样系统抽样将总体平均分将总体平均分成几部分,按成几部分,按事先确定的规事先确定的规则分别在各部则分别在各部分抽取分抽取总体个数较总体个数较多且分布均多且分布均衡衡6、方法取舍、方法取舍(1)当总体个数较少,样本容量也较小时当总体个数较少,样本容量也较小时(2)当总体个数较多,样本容量较小时当总体个数较多,样本容量较小时(3)当总体个数较多,样本容量也较大时当总体个数较多,样本容量也较大时抽签法或随机数表法抽签法或随机
16、数表法随机数表法随机数表法系统抽样法系统抽样法1、下列抽样方法是简单随机抽样的是(、下列抽样方法是简单随机抽样的是()A 电影院调查观众的某一指标,通知每排(每排人数相等电影院调查观众的某一指标,通知每排(每排人数相等)座号为)座号为14的观众留下来座谈。的观众留下来座谈。B 某车间包装一种产品,在自动包装的传送带上,每隔某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其质量是否合格。分钟抽一包产品,称其质量是否合格。C 某学校分别从行政人员、教师、后勤人员中抽取某学校分别从行政人员、教师、后勤人员中抽取2人,人,14人,人,4人,了解职工对改革的意见。人,了解职工对改革的
17、意见。D 用抽签法从十件产品中选取三件进行质量检测。用抽签法从十件产品中选取三件进行质量检测。D2、总体容量为、总体容量为524,若采用系统抽样法,当抽样间隔,若采用系统抽样法,当抽样间隔为为_时,不需要提剔除个体。时,不需要提剔除个体。A 3 B 4 C 5 D 6 B3、用系统抽样的方法从个体数为、用系统抽样的方法从个体数为1003的总体中抽取一的总体中抽取一个容量为个容量为50的样本,在整个抽样过程中的样本,在整个抽样过程中 每个个体被抽每个个体被抽到的可能性是(到的可能性是()201 D 100350 C 10031 B 10001 AC4、下列抽样问题中最适合用系统抽样法的是(、下列
18、抽样问题中最适合用系统抽样法的是()A 从从48人中随机抽取人中随机抽取8人参加某项活动;人参加某项活动;B 一个城市有一个城市有210家百货商店,其中大型商店家百货商店,其中大型商店20家,中型家,中型商店商店40家,小型商店家,小型商店150家,为掌握各商店的营业情况,从家,为掌握各商店的营业情况,从中抽取一个容量为中抽取一个容量为21的样本;的样本;C 从参加模拟考试的从参加模拟考试的1200人中随机抽取人中随机抽取100人分析试题作人分析试题作答情况;答情况;D 从参加模拟考试的从参加模拟考试的1200人中随机抽取人中随机抽取10人了解某些情况人了解某些情况C小结小结类别类别特点特点相
19、互联系相互联系适用范围适用范围共同点共同点简单随机简单随机抽样抽样从总体中逐个从总体中逐个抽取抽取系统抽样在系统抽样在起始部分抽起始部分抽样时,采用样时,采用简单随机抽简单随机抽样。样。总体个数较总体个数较少少在抽样过程中在抽样过程中每个个体被抽每个个体被抽到的可能性相到的可能性相等等系统抽样系统抽样将总体平均分将总体平均分成几部分,按成几部分,按事先确定的规事先确定的规则分别在各部则分别在各部分抽取分抽取总体个数较总体个数较多且分布均多且分布均衡衡引例引例 2 为了了解高一年级为了了解高一年级12000名学生的数学成绩名学生的数学成绩,需要抽需要抽取容量为取容量为120的样本的样本,用简单随
20、机抽样还方便吗?请用用简单随机抽样还方便吗?请用合适的方法抽取合适的方法抽取.解解:(1)对全体学生的数学成绩进行编号对全体学生的数学成绩进行编号:1,2,3,12000.(2)分段分段:由于样本容量与总体容量的由于样本容量与总体容量的 比是比是1:100,我们我们将总体平均分为将总体平均分为120个部分个部分,其中每一部分包含其中每一部分包含100个个个体个体.(3)在第一部分即在第一部分即1号到号到100号用号用简单随机抽样简单随机抽样,抽取一个抽取一个号码号码,比如是比如是50.(4)以以50作为起始数作为起始数,然后顺序抽取然后顺序抽取150,250,350,.11950.这样就得到容
21、量为这样就得到容量为120的一个样本的一个样本.分层抽样分层抽样引例引例 3某中学有学生某中学有学生900名,已知高一有名,已知高一有400名学生,高二名学生,高二300名名,高三,高三200名。为了考察他们的体重情况,如何抽取容量名。为了考察他们的体重情况,如何抽取容量为为45的一个样本?的一个样本?分析:分析:“900名学生的体重名学生的体重”这一总体是由高一、高二、高这一总体是由高一、高二、高三学生的体重三部分组成,这三部分有明显的差别。我们可三学生的体重三部分组成,这三部分有明显的差别。我们可以把总体分成三以把总体分成三“层层”,在各层中按比例进行简单随机抽样,在各层中按比例进行简单随
22、机抽样或系统抽样!或系统抽样!20190045201400201300首先,计算样本容量首先,计算样本容量n与总体容量与总体容量N的比为的比为 所以在高一、高二、高三三个层面上取学生数为所以在高一、高二、高三三个层面上取学生数为 ,即分别抽取,即分别抽取20,15,10名学生,这一步可通过简单随机抽样达到。名学生,这一步可通过简单随机抽样达到。2012001、概念、概念 当总体由明显差别的几部分组成时,将当总体由明显差别的几部分组成时,将总体中各个个体按某种特征分成若干个互不总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做重叠的几部分,每一部分叫做层层,在各层中,在各层中按层在
23、总体中所占比例进行简单随机抽样或按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样系统抽样,这种抽样方法叫做分层抽样 分层抽样的一个重要问题是一个总体如何分分层抽样的一个重要问题是一个总体如何分层。分层抽样中分多少层,要视具体情况而层。分层抽样中分多少层,要视具体情况而定。总的原则是:层内样本的差异要小,而定。总的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,否则将失去层与层之间的差异尽可能地大,否则将失去分层的意义。分层的意义。2、分层抽样的抽取步骤:、分层抽样的抽取步骤:(1)样本容量与总体确定抽取的比例。)样本容量与总体确定抽取的比例。(2)由分层情况,
24、确定各层抽取的样本数)由分层情况,确定各层抽取的样本数。(3)各层的抽取数之和应等于样本容量)各层的抽取数之和应等于样本容量。(4)有些层面上除法算出的结果不是整数)有些层面上除法算出的结果不是整数时,求其近似整数值。时,求其近似整数值。例、例、一个单位的职工有一个单位的职工有500人,其中不到人,其中不到35岁的有岁的有125人,人,3549岁的有岁的有280人,人,50岁以上的有岁以上的有95人。为了了人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?名职工作为样本,应该怎样抽取?分析:分析:这总体具有
25、某些特征,它可以分成几个不同的部分:这总体具有某些特征,它可以分成几个不同的部分:不到不到35岁岁;3549岁岁;50岁以上岁以上,把每一部分称为一个层,因,把每一部分称为一个层,因此该总体可以分为此该总体可以分为3个层。由于抽取的样本为个层。由于抽取的样本为100,所以必须确,所以必须确定每一层的比例,在每一个层中实行简单随机抽样。定每一层的比例,在每一个层中实行简单随机抽样。解:抽取人数与职工总数的比是解:抽取人数与职工总数的比是100:5001:5,则,则各年龄段(层)抽取的职工人数依次是各年龄段(层)抽取的职工人数依次是25;56;19,然后,然后分别在各年龄段(层)运用简单随机抽样方
26、法抽取。分别在各年龄段(层)运用简单随机抽样方法抽取。答:在分层抽样时,不到答:在分层抽样时,不到35岁、岁、3549岁、岁、50岁以上岁以上的三个年龄段分别抽取的三个年龄段分别抽取25人、人、56人和人和19人。人。192BB2、某校有老师、某校有老师200人,男学生人,男学生1200人,女学生人,女学生1000人,现用人,现用分层抽样的方法从所有师生中抽取一个容量为分层抽样的方法从所有师生中抽取一个容量为n的样本,已知的样本,已知女学生中抽取的人数为女学生中抽取的人数为80,则,则n=_1、某单位有职工、某单位有职工160人,其中业务员有人,其中业务员有104人,管理人员人,管理人员32人,后勤人,后勤24人,现用分层抽样从中抽取一容量为人,现用分层抽样从中抽取一容量为20的样本,的样本,则抽取管理人员(则抽取管理人员()人)人A、3 B、4 C、7 D、123、某大学数学系共有本科生、某大学数学系共有本科生5000人,其中一、二、三、四年人,其中一、二、三、四年级的学生比为级的学生比为4:3:2:1,用分层抽样的方法抽取一个容量,用分层抽样的方法抽取一个容量为为200人的样本,则应抽取三年级的学生为(人的样本,则应抽取三年级的学生为()人。)人。A、80 B、40 C、60 D、20测一测测一测