1、9.1 随机抽样 第九章第九章 统计统计 9.1.1 简单随机抽样 本资料分享自千人教师本资料分享自千人教师QQQQ群群323031380 期待你的加入与分享期待你的加入与分享 学习目标:学习目标: 1.了解普查与抽样调查的概念,知道两种调查方法的优缺点,能结合实际问题 选择恰当的数据调查方法; 2.了解总体、样本、样本量的概念,了解抽样调查的随机性; 3.结合具体的实际问题情境,了解随机抽样的必要性和重要性; 4.在参与解决统计问题的过程中,学会用简单随机抽样方法从总体中抽取样本; 5.能从样本数据中提出基本的数字特征平均数,并给出合理的解释. 教学教学重点重点: 普查与抽样调查的意义,总体
2、与样本的意义,简单随机抽样及其应用,数据的 平均数的概念及意义. 教学难点:教学难点: 简单随机抽样的应用及平均数的意义. 全面调查(普查):对每一个调查对象都进行调查的方法. 总体:在一个调查中,把调查对象的全体称为总体. 个体:组成总体的每一个调查对象. 抽样调查:根据一定目的,从总体中抽取一部分个体进行调查,并 以此为依据对总体的情况作出估计和推断的调查方法. 样本:从总体中抽取的那部分个体称为样本. 样本量:样本中包含的个体数. 问题1 相对全面调查而言,抽样调查具有哪些优势? 花费少、效率高. 抽样调查主要有两种基本的抽样方法简单随机抽样和分层 随机抽样. 本节课学习简单随机抽样.
3、问题2 假设口袋中有红色和白色共1000个小球,除颜色外,小球的大 小、质地完全相同.总体、个体各是什么?你能通过抽样调查的方法估计袋 中红球所占的比例吗? 袋中所有小球是调查的总体,每一个小球是个体,小球的颜色 是所关心的变量. 从袋中随机地摸出一个球,记录颜色后放回,摇匀后再摸出一 个球,如此重复n次.根据初中的概率知识可知,随着摸球次数的增 加,摸到红球的频率会逐渐稳定于摸到红球的概率,即口袋中红球 所占的比例.因此,我们可以通过放回摸球,用频率估计出红球的比 例. 在有放回地摸球中,同一个小球有可能被摸中多次,极端情况是 每次摸到同一个小球,而被重复摸中的小球只能提供同一个小球的 颜色
4、信息.如果我们采用不放回摸球,即从袋中摸出一个球后不再放 回袋中,每次摸球都在余下的球中随机摸取,这样就可以避免同一 个小球被重复摸中.特别地,当样本量n=1000时,不放回摸球已经把 袋中的所有球取出,这就完全了解了袋中红球的比例,而有放回摸 球一般还不能对袋中红球的比例作出准确的判断. 问题3 一家家具厂要为树人中学高一年级制作课桌椅,他们事先 想了解全体高一年级学生的平均身高,以便设定可调节课桌椅的标 准高度.已知树人中学高一年级有712名学生,如果要通过简单随机抽 样的方法调查高一年级学生的平均身高,应该怎么抽取样本? 树人中学全部高一年级的学生构成调查的总体,每一位学生是 个体,学生
5、的身高是调查的变量. 对高一年级进行简单随机抽样,用抽出的样本的平均身高估计 高一年级学生的平均身高. 简单随机抽样比较常用的方法有抽签法和随机数法. 1.抽签法 先给712名学生编号,例如按1712进行编号.然后把所有编号写 在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为 号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒 中不放回地逐个抽取号签,使与号签上的编号对应的学生进入样本, 直到抽足样本所需要的人数. 抽签法简单易行,但当总体较大时,操作起来比较麻烦.因此, 抽签法一般适用于总体中个体数不多的情形. 2. 随机数法 先给712名学生编号,例如按1712进行编号
6、.用随机数工具产生 1712范围内的整数随机数,把产生的随机数作为抽中的编号,使 与编号对应的学生进入样本.重复上述过程,直到抽足样本所需要的 人数. 如果生成的随机数有重复,即同一编号被多次抽到,可以剔除 重复的编号并重新产生随机数,直到产生的不同编号个数等于样本 所需要的人数. (1)用随机试验生成随机数 准备 10 个大小、质地一样的小球,小球上分别写上数字 0,1, 2,9,把它们放入一个不透明的袋中.从袋中有放回摸取3次, 每次摸取前充分搅拌,并把第一、二、三次摸到的数字分别作为百、 十、个位数,这样就生成了一个三位随机数.如果这个三位数在 1712范围内,就代表对应编号的学生被抽中
7、,否则舍弃编号.这样 产生的随机数可能会有重复. (2)用信息技术生成随机数 用计算器生成随机数 进入计算器的计算模式(不同的计算器型号可能会有不同), 调出生成随机数的函数并设置参数,例如RandInt#(1,712),按 “=”键即可生成1712范围内的整数随机数.重复按“=”键,可以 生成多个随机数,这样产生的随机数可能会有重复. 用电子表格软件生成随机数 在电子表格软件的任一单元格中,输入“= RANDBETWEEN (1,712)”,即可生成一个1712范围内的整数随机数.再利用电 子表格软件的自动填充功能,可以快速生成大量的随机数(如图). 这样产生的随机数可能会有重复. 用R统计
8、软件生成随机数 在R软件的控制台中,输入“sample(1:712,50, replace=F)”,按回车键,就可以得到50个1712范围内的不重 复的整数随机数(如图). 问题4 用简单随机抽样方法抽取样本,样本量是否越大越好? 在重复试验中,试验次数越多,频率接近概率的可能性越大.与 此类似,用简单随机抽样的方法抽取学生,样本量越大,样本中不 同身高的比例接近总体中相应身高的比例的可能性也越大,样本的 平均身高接近总体的平均身高的可能性也越大.即对于样本的代表性, 一般说来,样本量大的会好于样本量小的.尤其是样本量不大时,增 加样本量可以较好地提高估计的效果.但是,在实际抽样中,样本量 的
9、增大会导致调查的人力、费用、时间等成本的增加.因此,抽样调 查中样本量的选择要根据实际问题的需要,并不一定是越大越好. 下面是用随机数法从树人中学高一年级学生中抽取的一个容量为 50的简单随机样本,他们的身高变量值(单位:cm)如下: 由这些样本观测数据,可以计算出样本的平均数为164.3. 据此, 可以估计树人中学高一年级学生的平均身高为164.3cm左右. 上面通过简单随机抽样得到部分学生的平均身高,并把样本平 均身高作为树人中学高一年级所有学生平均身高的估计值. 1 1 k ii i Yf Y N 12 1 1 N N i i YYY YY NN 问题5 小明想考察一下简单随机抽样的估计
10、效果.他从树人中学 医务室得到了高一年级学生身高的所有数据,计算出整个年级学生 的平均身高为165.0cm.然后,小明用简单随机抽样的方法,从这些 数据中抽取了样本量为50和100的样本各10个,分别计算出样本平 均数,如表所示,从小明多次抽样所得的结果中,你有什么发现? 为了更方便地观察数据,我们把这20次试验的平均数用图形表示 出来,如图所示,图中的红线表示树人中学高一年级全体学生身高的 平均数. 从试验结果看,不管样本量为50,还是为100,不同样本的平均 数往往是不同的.由于样本的选取是随机的,因此样本平均数也具有 随机性,这与总体平均数是一个确定的数不同.虽然在所有20个样本 平均数
11、中,与总体平均数完全一致的很少,但除了样本量为50的第 2个样本外,样本平均数偏离总体平均数都不超过1cm,即大部分样 本平均数离总体平均数不远,在总体平均数附近波动.比较样本量为 50和样本量为100的样本平均数,还可以发现样本量为100的波动幅 度明显小于样本量为50的,这与我们对增加样本量可以提高估计效 果的认识是一致的. 问题6 眼睛是心灵的窗口,保护好视力非常重要.树人中学在“全 国爱眼日”前,想通过简单随机抽样的方法,了解一下全校2174名学 生中视力不低于5.0的学生所占的比例,你觉得该怎么做? 从树人中学所有学生中抽取一个容量为50的简单随机样本,其 视力变量取值如下: 问题7
12、 总结简单随机抽样的优缺点. 简单随机抽样方法简单、直观,用样本平均数估计总体平均 数也比较方便.简单随机抽样是一种基本抽样方法,是其他抽样方 法的基础.但在实际应用中,简单随机抽样有一定的局限性.例如, 当总体很大时,简单随机抽样给所有个体编号等准备工作非常费 事,甚至难以做到;抽中的个体往往很分散,要找到样本中的个 体并实施调查会遇到很多困难;简单随机抽样没有利用其他辅助 信息,估计效率不是很高;等等.因此,在规模较大的调查中,直 接采用简单随机抽样的并不多,一般是把简单随机抽样和其他抽 样方法组合使用. 1.下列抽样方法是简单随机抽样的是() A从50个零件中一次性抽取5个做质量检验 B
13、从50个零件中有放回地抽取5个做质量检验 C从实数集中逐个抽取10个实数做奇偶性分析 D运动员从8个跑道中随机选取一个跑道 D 解析:选项A错在“一次性”抽取;选项B错在“有放回”抽取;选项C 错在总体容量无限故选D. 2. 现从100件产品中随机抽取20件进行质量检验,下面说法正确 的是( ). A.100件产品是总体 B.20件产品是样本 C.样本容量是100 D.样本容量是20 D 解析:根据统计的有关概念知,总体应为100件产品的质量,样本为抽 取20件产品的质量.故选D. 3. 下列抽样试验中,用抽签法方便的是() A从某工厂生产的3 000件产品中抽取600件进行质量检验 B从某工
14、厂生产的两箱(每箱15件)产品中抽取6件进行质量检验 C从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验 D从某厂生产的3 000件产品中抽取10件进行质量检验 B 解析:A总体容量较大,样本容量也较大,不适宜用抽签法;C中甲、乙两 厂生产的产品有差别,不能用抽签法;D总体容量较大,不适宜用抽签法故 选B. A 5. 某总体容量为M,其中带有标记的有N个,现用简单随机抽 样的方法从中抽取一个容量为m的样本,则抽取的m个个体中带 有标记的个数估计为()A 解析: 1. 普查与抽样调查的概念,能结合实际问题选择恰当的数据调 查方法; 2. 总体、样本、样本量的概念; 3. 简单随机抽样的概念; 4. 抽签法和随机数法的应用; 5. 总体均值和样本均值的概念及理解.