1、 一、知识回顾一、知识回顾 一一. .简单随机抽样简单随机抽样 (2)(2)不放回简单随机抽样不放回简单随机抽样 (1)(1)放回简单随机抽样放回简单随机抽样 2.2.方法方法 (1)(1)抽签法抽签法 (2)(2)随机数法随机数法 1.1.分类分类 二二. .平均数平均数 n n 1 12 2n n i i i i= =1 1 y y + + y y + + + y y1 1 y y = = =y y n nn n 二、探究新知二、探究新知 抽样调查最核心的问题是样本的代表性抽样调查最核心的问题是样本的代表性. .简单随机抽样是使总简单随机抽样是使总 体中每一个个体都有相等的机会被抽中体中每
2、一个个体都有相等的机会被抽中, ,但因为抽样的随机性,有但因为抽样的随机性,有 可能会出现比较可能会出现比较“极端极端”的样本的样本. .例如,在对树人中学高一年级学例如,在对树人中学高一年级学 生身高的调查中生身高的调查中, ,可能出现样本中可能出现样本中5050个个体大部分来自高个子或矮个个体大部分来自高个子或矮 个子的情形个子的情形, ,这种这种“极端极端”样本的平均数会大幅度地偏离总体平均样本的平均数会大幅度地偏离总体平均 数,从而使得估计出现较大的误差数,从而使得估计出现较大的误差. . 能否利用总体中的一些额外信息对抽样方法进行改进呢能否利用总体中的一些额外信息对抽样方法进行改进呢
3、? ? 二、探究新知二、探究新知 问题问题3 3 在树人中学高一年级的在树人中学高一年级的712712名学生中名学生中, ,男生有男生有326326名、女生有名、女生有 386 386名名. .能否利用这个辅助信息改进简单随机抽样方法能否利用这个辅助信息改进简单随机抽样方法, ,减少减少 “ “极端极端”样本的出现,从而提高对整个年级平均身高的估计样本的出现,从而提高对整个年级平均身高的估计 效果呢效果呢? ? 我们知道,影响身高因素有很多我们知道,影响身高因素有很多, ,性别是其中的一个主要因素性别是其中的一个主要因素. . 高中男生的身高普遍高于女生的身高高中男生的身高普遍高于女生的身高,
4、 ,而相同性别的身高差异相对而相同性别的身高差异相对 较小较小. .我们可以利用性别和身高的这种关系,把高一年级学生分成我们可以利用性别和身高的这种关系,把高一年级学生分成 男生和女生两个身高有明显差异的群体男生和女生两个身高有明显差异的群体, ,对两个群体分别进行简单对两个群体分别进行简单 随机抽样,然后汇总作为总体的一个样本随机抽样,然后汇总作为总体的一个样本. .由于在男生和女生两个由于在男生和女生两个 群体中都抽取了相应的个体群体中都抽取了相应的个体, ,这样就能有效地避免这样就能有效地避免“极端极端”样本样本. . 对男生、女生分别进行简单随机抽样对男生、女生分别进行简单随机抽样,
5、,样本量在男生、女生中样本量在男生、女生中 应如何分配应如何分配? ? 自然地,为了使样本的结构与总体的分布相近自然地,为了使样本的结构与总体的分布相近, ,人数多的群体人数多的群体 应多抽一些,人数少的群体应少抽一些因此应多抽一些,人数少的群体应少抽一些因此, ,按男生、女生在全体按男生、女生在全体 学生中所占的比例进行分配是一种比较合理的方式,即学生中所占的比例进行分配是一种比较合理的方式,即 男生样本量男生样本量= = 总样本量总样本量 全全体体学学生生数数 男男生生人人数数 女生样本量女生样本量= = 总样本量总样本量 全全体体学学生生数数 女女生生人人数数 这样无论是男生还是女生,每
6、个学生抽到的概率都相等这样无论是男生还是女生,每个学生抽到的概率都相等. .当总当总 样本量为样本量为5050时,可以计算出从男生、女生中分别应抽取的人数为时,可以计算出从男生、女生中分别应抽取的人数为 n n男 男= = 5050 7 71 12 2 3 32 26 6 2323,n n女 女= = 5050 7 71 12 2 3 38 86 6 27.27. 我们按上述方法抽取了一个容量为我们按上述方法抽取了一个容量为5050的样本,其观测数据的样本,其观测数据( (单单 位位: cm): cm)如下如下: : 二、探究新知二、探究新知 男生男生 173.0 174.0 166.0 17
7、2.0 170.0 165.0 165.0 168.0 164.0 173.0 174.0 166.0 172.0 170.0 165.0 165.0 168.0 164.0 173.0 172.0 173.0 175.0 168.0 170.0 172.0 176.0 175.0 173.0 172.0 173.0 175.0 168.0 170.0 172.0 176.0 175.0 168.0 173.0 167.0 170.0 175.0168.0 173.0 167.0 170.0 175.0 女生女生 163.0 164.0 161.0 157.0 162.0 165.0 158.
8、0 155.0 164.0 163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0 通过计算,得出男生和女生身高的样本
9、平均数分别为通过计算,得出男生和女生身高的样本平均数分别为170.6170.6、 160.6. 160.6. 根据男生、女生身高的样本平均数以及他们各自的人数,根据男生、女生身高的样本平均数以及他们各自的人数, 可以估计总体平均数为可以估计总体平均数为 7 71 12 2 3 38 86 61 16 60 0. .6 63 32 26 61 17 70 0. .6 6 165.2165.2, 即估计树人中学高一年级学生的平均身高在即估计树人中学高一年级学生的平均身高在165.2cm165.2cm左右左右. . 这样我们按性别变量这样我们按性别变量, ,把高一学生划分为男生、女生两个身高把高一学
10、生划分为男生、女生两个身高 差异较小的子总体分别进行抽样,进而得到总体的估计差异较小的子总体分别进行抽样,进而得到总体的估计. . 二、探究新知二、探究新知 三、三、分层随机抽样分层随机抽样 一般地,按一个或多个变量把总体划分成若干个子总体一般地,按一个或多个变量把总体划分成若干个子总体, ,每每 个个体属于且仅属于一个子总体个个体属于且仅属于一个子总体, ,在每个子总体中独立地进行简在每个子总体中独立地进行简 单随机抽样,再把所有子总体中抽取的样本合在一起作为总样单随机抽样,再把所有子总体中抽取的样本合在一起作为总样 本本, ,这样的抽样方法称为这样的抽样方法称为分层随机抽样分层随机抽样.
11、. 每一个子总体称为每一个子总体称为层层, 在分层随机抽样中,如果每层样本量都与层的大小成比例,那在分层随机抽样中,如果每层样本量都与层的大小成比例,那 么称这种样本量的分配方式为么称这种样本量的分配方式为比例分配比例分配. . 1.1.分层随机抽样的概念:分层随机抽样的概念: 2.2.分层抽样的步骤:分层抽样的步骤: 将总体按一定标准进行分层将总体按一定标准进行分层. . 计算各层的各体数与总体的个数比计算各层的各体数与总体的个数比. . 按比例分配各层所要抽取的个体数按比例分配各层所要抽取的个体数. . 在每一层进行抽样在每一层进行抽样( (可用简单随机抽样可用简单随机抽样).). 在分层
12、随机抽样中,如果层数分为在分层随机抽样中,如果层数分为2 2层,第层,第1 1层和第层和第2 2层包含的层包含的 个体数分别为个体数分别为M M和和N N, ,抽取的样本量分别抽取的样本量分别m m和和n.n.我们用我们用X X1 1,X X2 2,X XM M 表示第表示第1 1层各个个体的变量值,用层各个个体的变量值,用x x1 1,x x2 2,x xm m表示第表示第1 1层被抽取层被抽取 样本的各个个体的变量值;用样本的各个个体的变量值;用Y Y1 1,Y Y2 2,, ,Y YN N表示第表示第2 2层各个个体的层各个个体的 变量值变量值, ,用用y y1 1,y y2 2,y y
13、n n表示第表示第2 2层被抽取样本的各个个体的变量层被抽取样本的各个个体的变量 值,这样:值,这样: 第第1 1层的总体平均数和样本平均数分别为层的总体平均数和样本平均数分别为 ,X X M M 1 1 M M X XX XX X X X M M 1 1i i i i M M2 21 1 . .x x m m 1 1 m m x xx xx x x x m m 1 1i i i i m m2 21 1 第第2 2层的总体平均数和样本平均数分别为层的总体平均数和样本平均数分别为 ,Y Y N N 1 1 N N Y YY YY Y Y Y N N 1 1i i i i N N2 21 1 .
14、n n 1 1i i i i n n2 21 1 y y n n 1 1 n n y yy yy y y y 总体平均数和样本平均数分别为总体平均数和样本平均数分别为 , N NM M Y YX X W W N N 1 1i i i i M M 1 1i i i i , n nm m y yx x w w n n 1 1i i i i m m 1 1i i i i 三、三、分层随机抽样分层随机抽样 三、三、分层随机抽样分层随机抽样 由于可以用第由于可以用第1 1层的样本平均数层的样本平均数 估计第估计第1 1层的总体平均数层的总体平均数 , , 可以用第可以用第2 2层的样本平均数层的样本平均
15、数 估计第估计第2 2层的总体平均数层的总体平均数 ,因此我,因此我 们可以用们可以用 x xX X y y Y Y y y N NM M N N x x N NM M M M N NM M y yN Nx xM M 估计总体平均数估计总体平均数 . .W W 在比例分配的分层随机抽样中,在比例分配的分层随机抽样中, , , N NM M n nm m N N n n M M m m 可得可得 因此,在比例分配的分层随机抽样中,我们可以直接用样本因此,在比例分配的分层随机抽样中,我们可以直接用样本 平均数平均数 估计总体平均数估计总体平均数 . .W Ww w w wy y n nm m n
16、n x x n nm m m m y y N NM M N N x x N NM M M M 三、三、分层随机抽样分层随机抽样 与考察简单随机抽样估计效果类似与考察简单随机抽样估计效果类似, ,小明也想通过多次抽样考小明也想通过多次抽样考 察一下分层随机抽样的估计效果察一下分层随机抽样的估计效果. .他用比例分配的分层随机抽样方他用比例分配的分层随机抽样方 法,从高一年级的学生中抽取了法,从高一年级的学生中抽取了1010个样本量为个样本量为5050的样本的样本, ,计算出样计算出样 本平均数如下表所示本平均数如下表所示, ,与上一小节与上一小节“探究探究”中相同样本量的简单随中相同样本量的简单
17、随 机抽样的结果比较机抽样的结果比较, ,小明有了一个重要的发现小明有了一个重要的发现. .你是否也有所发现你是否也有所发现? ? 抽样序号抽样序号 1 12 23 34 45 56 67 78 89 91010 男生样本的平均数男生样本的平均数170.0170.0170.7170.7169.8169.8171.7171.7172.7172.7171.9171.9171.6171.6170.6170.6172.6172.6170.9170.9 女生样本的平均数女生样本的平均数162.2162.2160.3160.3159.7159.7158.1158.1161.1161.1158.4158.4
18、159.7159.7160.0160.0160.6160.6160.2160.2 总样本的平均数总样本的平均数165.8165.8165.1165.1164.3164.3164.3164.3166.4166.4164.6164.6165.2165.2164.9164.9166.1166.1165.1165.1 我们把分层随机抽样的平均数与上一小节样本量为我们把分层随机抽样的平均数与上一小节样本量为5050的简单的简单 随机抽样的平均数用下图形进行表示随机抽样的平均数用下图形进行表示, ,其中粉红线表示整个年级学其中粉红线表示整个年级学 生身高的平均数生身高的平均数. . 从试验结果看,分层随机
19、抽样的样本平均数围绕总体平均数从试验结果看,分层随机抽样的样本平均数围绕总体平均数 波动,与简单随机抽样的结果比较,分层随机抽样并没有明显优波动,与简单随机抽样的结果比较,分层随机抽样并没有明显优 于简单随机抽样于简单随机抽样. .但相对而言,分层随机抽样的样本平均数波动幅但相对而言,分层随机抽样的样本平均数波动幅 度更均匀,简单随机抽样中出现了一个度更均匀,简单随机抽样中出现了一个( (第第2 2个个) )偏离总体平均数的偏离总体平均数的 幅度比较大的样本平均数,即出现了比较幅度比较大的样本平均数,即出现了比较“极端极端”的样本,而分的样本,而分 层随机抽样没有出现层随机抽样没有出现. .
20、抽样序号抽样序号 样本平均数样本平均数 三、三、分层随机抽样分层随机抽样 实际上,在个体之间差异较大的情形下实际上,在个体之间差异较大的情形下, ,只要选取的分层变量只要选取的分层变量 合适,使得各层间差异明显、层内差异不大合适,使得各层间差异明显、层内差异不大, ,分层随机抽样的效果分层随机抽样的效果 一般会好于简单随机抽样,也好于很多其他抽样方法一般会好于简单随机抽样,也好于很多其他抽样方法. .分层随机抽分层随机抽 样的组织实施也比简单随机抽样方便样的组织实施也比简单随机抽样方便, ,而且除了能得到总体的估计而且除了能得到总体的估计 外,还能得到每层的估计外,还能得到每层的估计. . 在
21、实际抽样调查中,由于实际问题的复杂性在实际抽样调查中,由于实际问题的复杂性, ,除了要考虑获得除了要考虑获得 的样本的代表性,还要考虑调查实施中人力、物力、时间等因素,的样本的代表性,还要考虑调查实施中人力、物力、时间等因素, 因此通常会把多种抽样方法组合起来使用因此通常会把多种抽样方法组合起来使用. . 例如,在分层抽样中,例如,在分层抽样中, 不同的层内除了用简单随机抽样外不同的层内除了用简单随机抽样外, ,还可以用其他的抽样方法,有还可以用其他的抽样方法,有 时层内还需要再进行分层,等等时层内还需要再进行分层,等等. . 如果要了解某电视节目在你所在地区如果要了解某电视节目在你所在地区(
22、 (城市、乡镇或村庄城市、乡镇或村庄) )的的 收视率,你能帮忙设计一个抽样方案吗收视率,你能帮忙设计一个抽样方案吗? ?结合你所在地区的实际情结合你所在地区的实际情 况,和同学展开讨论况,和同学展开讨论. . 三、三、分层随机抽样分层随机抽样 例例1 1 某中学有高中生某中学有高中生35003500人,初中生人,初中生15001500人人. .为了解学生的学习情为了解学生的学习情 况,用分层抽样的方法从该校学生中抽取一个容量为况,用分层抽样的方法从该校学生中抽取一个容量为n n的样本,的样本, 已知从高中生中抽取已知从高中生中抽取7070人,则人,则n n为为( () ) A A. .100
23、 B100 B. .150 C150 C. .200 D200 D. .250250 四、典型例题四、典型例题 A A 例例2 2 某大学为了解在校本科生对参加某项社会实践活动的意向某大学为了解在校本科生对参加某项社会实践活动的意向, ,拟拟 采用分层抽样的方法采用分层抽样的方法, ,从该校四个年级的本科生中抽取一个容从该校四个年级的本科生中抽取一个容 量为量为300300的样本进行调查的样本进行调查. .已知该校一年级、二年级、三年级、已知该校一年级、二年级、三年级、 四年级的本科生人数之比为四年级的本科生人数之比为45564556,则应从一年级本科,则应从一年级本科 生中抽取生中抽取_名学
24、生名学生6060 四、典型例题四、典型例题 解:解:(1)(1) 例例3 3 在下列问题中,各采用什么抽样方法抽取样本较好?在下列问题中,各采用什么抽样方法抽取样本较好? (1)(1)从从2020台电脑中抽台电脑中抽5 5台进行质量检查;台进行质量检查; (2)(2)某镇中学有某镇中学有216216名教职工,其中专职教师名教职工,其中专职教师168168名,管理人员名,管理人员 1818名,后勤服务人员名,后勤服务人员3030名,今从中抽取样本量为名,今从中抽取样本量为1515的样本的样本 进行校领导任职表现调查进行校领导任职表现调查. . 因为总体中个体数目较少,所以可采用因为总体中个体数目
25、较少,所以可采用简单随机抽样简单随机抽样; (2)(2)因为总体中个体差异较大,所以可采用因为总体中个体差异较大,所以可采用分层随机抽样分层随机抽样. . 五、课堂小结五、课堂小结 一般地,按一个或多个变量把总体划分成若干个子总体一般地,按一个或多个变量把总体划分成若干个子总体, ,每每 个个体属于且仅属于一个子总体个个体属于且仅属于一个子总体, ,在每个子总体中独立地进行简在每个子总体中独立地进行简 单随机抽样,再把所有子总体中抽取的样本合在一起作为总样单随机抽样,再把所有子总体中抽取的样本合在一起作为总样 本本, ,这样的抽样方法称为这样的抽样方法称为分层随机抽样分层随机抽样. . 每一个
26、子总体称为每一个子总体称为层层, 在分层随机抽样中,如果每层样本量都与层的大小成比例,那在分层随机抽样中,如果每层样本量都与层的大小成比例,那 么称这种样本量的分配方式为么称这种样本量的分配方式为比例分配比例分配. . 1.1.分层随机抽样的概念:分层随机抽样的概念: 2.2.分层抽样的步骤:分层抽样的步骤: 将总体按一定标准进行分层将总体按一定标准进行分层. . 计算各层的各体数与总体的个数比计算各层的各体数与总体的个数比. . 按比例分配各层所要抽取的个体数按比例分配各层所要抽取的个体数. . 在每一层进行抽样在每一层进行抽样( (可用简单随机抽样可用简单随机抽样).). 六、巩固提升六、巩固提升 课堂练习课堂练习: : 第第184184页练习第页练习第1 1、2 2、3 3、4 4题题 课堂作业课堂作业: : 第第188188页页习题习题9.19.1第第5 5、7 7题题