1、人 教 A 版 高 中 数 学 必 修 第 二 册第九章第九章 统计统计9.1.2 分层随机抽样分层随机抽样复习复习 一、简单随机抽样的概念一、简单随机抽样的概念二、简单随机抽样的特点二、简单随机抽样的特点一般地一般地, ,设一个总体有设一个总体有N N个个体个个体, , 从中逐个不放回地从中逐个不放回地抽取抽取n n个个体作为样本(个个体作为样本(nNnN), , 如果每次抽取时如果每次抽取时总体内的各个个体被抽到的机会都相等总体内的各个个体被抽到的机会都相等, , 则这种抽则这种抽样方法叫做样方法叫做简单随机抽样简单随机抽样. . 1、有限性:总体中个体数有限;、有限性:总体中个体数有限;
2、2、逐一性:从总体中逐一抽取,这样便于在抽样试验、逐一性:从总体中逐一抽取,这样便于在抽样试验中进行操作;中进行操作;3、等可能性:简单随机抽样是一种等可能抽样,在整、等可能性:简单随机抽样是一种等可能抽样,在整个抽样过程中每个个体被抽取到的可能性相等,从而保个抽样过程中每个个体被抽取到的可能性相等,从而保证了这种抽样方式的公平性证了这种抽样方式的公平性.复习复习 抽签法抽签法三、最常用的简单随机抽样三、最常用的简单随机抽样随机数法随机数法( (随机试验、信息技术随机试验、信息技术) )各有哪些优点和缺点?各有哪些优点和缺点? 一般地,总体中有一般地,总体中有N个个体个个体,它们的变量值分别为
3、它们的变量值分别为 ,则称则称12,NY YY总体平均数总体平均数为总体平均数为总体平均数.1211NNiiYYYYYNN1211nniiyyyyynn一般地,样本中有一般地,样本中有n个个体个个体,它们的变量值分别为它们的变量值分别为 ,则称则称12,ny yy样本平均数样本平均数为样本平均数为样本平均数复习复习 我们可以用样本平均数估计总体平均数,用样本中的比例我们可以用样本平均数估计总体平均数,用样本中的比例p估计总体中的比例估计总体中的比例P提出问题提出问题 问题问题3:在树人中学高一年级的在树人中学高一年级的712712名学生名学生中中, , 男生有男生有326326名、女生有名、女
4、生有386386名名. . 能否利用能否利用这个辅助信息改进简单随机抽样方法这个辅助信息改进简单随机抽样方法, ,减少减少 极端极端”样本的出现样本的出现, ,从而提高对整个年级平从而提高对整个年级平均身高的估计效果呢?均身高的估计效果呢?解决问题解决问题 思考思考对男生、女生分别进行简单随机抽样,样本对男生、女生分别进行简单随机抽样,样本量在男生、女生中应如何分配?量在男生、女生中应如何分配?按男生、女生在全体学生中所占的比例进行分配是一种按男生、女生在全体学生中所占的比例进行分配是一种比较合理的方式比较合理的方式女生样本量女生样本量=女生人数女生人数全体学生数全体学生数总样本量总样本量男生
5、样本量男生样本量=男生人数男生人数全体学生数全体学生数总样本量总样本量引入新课引入新课 这样无论男生还是女生,每个学生抽到的概率都相等。这样无论男生还是女生,每个学生抽到的概率都相等。当总体样本量为当总体样本量为5050时时, ,可以计算出从男生、女生中分别可以计算出从男生、女生中分别应抽取的人数为应抽取的人数为,男2350712326n.2750712386女n2 .1657123866 .1603266 .170 我们按上述方法抽取的一个容量为我们按上述方法抽取的一个容量为5050的样本,其观测的样本,其观测数据数据( (单位单位:cm):cm)如下如下: :173.0 174.0 166
6、.0 172.0 170.0 165.0 165.0 168.0 184.0 173.0172.0 173.0 175.0 168.0 170.0 172.0 176.0 175.0 168.0 173.0167.0 170.0 175.0男生163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0172.0 162.5 158.0 155.5 157.0 163.0 172.0女生男生身高的样本平均数为男生身高的样
7、本平均数为170.6女生身高的样本平均数为女生身高的样本平均数为160.6估计总体平均数为估计总体平均数为所以估计树人中学高一年级学生的平均身高在所以估计树人中学高一年级学生的平均身高在165.2 cm左右左右 引入新课引入新课 分层随机抽样的概念 一般地一般地, ,按一个或多个变量把总体划分成若干个子按一个或多个变量把总体划分成若干个子总体总体, ,每个个体属于且仅属于一个子总体每个个体属于且仅属于一个子总体, ,在每个子总在每个子总体中独立地进行简单随机抽样体中独立地进行简单随机抽样, ,再把所有子总体中抽取再把所有子总体中抽取的样本合在一起作为总样本的样本合在一起作为总样本, ,这样的抽
8、样方法称为这样的抽样方法称为分层分层随机抽样随机抽样, ,每一个子总体称为每一个子总体称为层层. . 在分层随机抽样中在分层随机抽样中, ,如果每层样本量都与层的大小成如果每层样本量都与层的大小成比例比例, ,那么称这种样本量的分配方式为那么称这种样本量的分配方式为比例分配比例分配. .引入新课引入新课 在分层随机抽样中在分层随机抽样中, ,如果层数分为如果层数分为2 2层,第层,第1 1层和层和第第2 2层包含的个体数分别为层包含的个体数分别为 和和 , ,抽取的样本量分抽取的样本量分别为别为 和和 ,我们用,我们用 表示第表示第1 1层各层各个个体的变量值个个体的变量值, ,用用 表示第表
9、示第1 1层样本的各层样本的各个个体的变量值个个体的变量值; ;用用 表示第表示第2 2层各层各个个 个体的变量值,用个体的变量值,用 表示第表示第1 1层样本的层样本的各个个体的变量值,各个个体的变量值,则第则第1 1层的总体平均数和样本平均数分别为层的总体平均数和样本平均数分别为12,nxxx12,ny yy12,MXXX12,NYYYMNmn1211mniixxxxxmm1211MMiiXXXXXMM引入新课引入新课 第第2 2层的总体平均数和样本平均数分别为层的总体平均数和样本平均数分别为1211NNiiYYYYYNN1211nniiyyyyynn总体平均数和样本平均数分别为总体平均数
10、和样本平均数分别为11MNiiiiXYMWN11mniiiixymwn引入新课引入新课 由于用第由于用第1层的样本平均数层的样本平均数 可以估计第可以估计第1层的总体平均数层的总体平均数 ,由于用第由于用第2层的样本平均数层的样本平均数 可以估计第可以估计第2层的总体平均数层的总体平均数 ,因此我们可以用因此我们可以用xXyYMxNyMNxyMNMNMN估计总体平均数估计总体平均数 W引入新课引入新课 在比例分配的分层随机抽样中在比例分配的分层随机抽样中NMnmNnMmMNmnxyxywMNMNmnmn因此,在比例分配的分层随机抽样中,我们可以直接用因此,在比例分配的分层随机抽样中,我们可以直
11、接用样本平均数样本平均数 估计总体平均数估计总体平均数Ww课堂探究课堂探究 探究: 与考察简单随机抽样估计效果类似与考察简单随机抽样估计效果类似, ,小明也想小明也想通过多次抽样考察一下分层随机抽样的估计效果通过多次抽样考察一下分层随机抽样的估计效果. .他用他用比例分配的分层随机抽样方法,从高一年级的学生中比例分配的分层随机抽样方法,从高一年级的学生中抽取了抽取了1010个样本量为个样本量为5050的样本,计算出样本平均数如的样本,计算出样本平均数如下表所示,与上一小节下表所示,与上一小节“探究探究”中相同样本量的简单中相同样本量的简单随机抽样的结果比较,小明有了一个重要发现随机抽样的结果比
12、较,小明有了一个重要发现. .你是否你是否也有所发现也有所发现? ?抽样序号12345678910男生样本平均数170.0170.7169.8171.7172.7171.9171.6170.6172.6170.9女生样本平均数162.2160.3159.7158.1161.118.4159.7160.0160.6160.2总样本的平均数165.8165.1164.3164.3166.4164.6165.2164.9166.1165.1引入新课引入新课 我们把分层随机抽样的平均数与上一小节样本容量为我们把分层随机抽样的平均数与上一小节样本容量为50的简单随机抽样的平均数用图形进行表示,其中红的简
13、单随机抽样的平均数用图形进行表示,其中红线表示整个年级学生身高的平均数。线表示整个年级学生身高的平均数。引入新课引入新课 从试验结果看,分层随机抽样的样本平均数围绕总体平均数从试验结果看,分层随机抽样的样本平均数围绕总体平均数波动,与简单随机抽样的结果比较,分层随机抽样并没有明波动,与简单随机抽样的结果比较,分层随机抽样并没有明显优于简单随机抽样。但相对而言,分层随机抽样的样本平显优于简单随机抽样。但相对而言,分层随机抽样的样本平均数波动幅度更均匀,简单随机抽样中出现了一个偏离总体均数波动幅度更均匀,简单随机抽样中出现了一个偏离总体平均数的幅度比较大的样本平均数,即出现了比较平均数的幅度比较大
14、的样本平均数,即出现了比较“极端极端”的样本,而分层随机抽样没有出现。的样本,而分层随机抽样没有出现。特点:特点:1 1、分层抽样是当总体由差异明显的几部分组成时采分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:用的抽样方法,进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,层与层之间而定,总的原则是,层内样本的差异要小,层与层之间的样本差异要大,且互不重叠。的样本差异要大,且互不重叠。(2)为了保证每个个体等可能入样,所有层应采用为了保证每个个体等可能
15、入样,所有层应采用同一抽样比等可能抽样。同一抽样比等可能抽样。(3)在每层抽样时,应采用简单随机抽样的方法进在每层抽样时,应采用简单随机抽样的方法进行抽样。行抽样。2、分层抽样的优点是:使样本具有较强的代表性,分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。样是一种实用、操作性强、应用比较广泛的抽样方法。分层抽样的具体步骤是什么分层抽样的具体步骤是什么? 步骤步骤1:根据已经掌握的信息,将总体分成互根据已经掌握的信息,将总体分成互不相交的层不相交的层步骤步骤
16、2:根据总体的个体数根据总体的个体数N和样本容量和样本容量n计算抽计算抽样比样比k= n:N步骤步骤3:确定每一层应抽取的个体数目确定每一层应抽取的个体数目,并使每一并使每一层应抽取的个体数目之和为样本容量层应抽取的个体数目之和为样本容量n步骤步骤4:按步骤按步骤3确定的数目在各层中随机抽取个确定的数目在各层中随机抽取个体,合在一起得到容量为体,合在一起得到容量为n样本样本分层分层计算抽样比计算抽样比定数定数抽样抽样引入新课引入新课 实际上,在个体之间差异较大的情形下,只要选实际上,在个体之间差异较大的情形下,只要选取的分层变量合适,使得各层间差异明显、层内差异取的分层变量合适,使得各层间差异
17、明显、层内差异不大,分层随机抽样的效果一般好于简单随机抽样,不大,分层随机抽样的效果一般好于简单随机抽样,也好于很多其他抽样方法。分层随机抽样的组织实施也好于很多其他抽样方法。分层随机抽样的组织实施也比简单随机抽样方便,而且除了能得到总体的估计也比简单随机抽样方便,而且除了能得到总体的估计外,还能得到每层的估计。外,还能得到每层的估计。 在实际抽样调查中,由于实际问题的复杂性,除了在实际抽样调查中,由于实际问题的复杂性,除了要考虑获得的样本的代表性,还要考虑调查实施中人力、要考虑获得的样本的代表性,还要考虑调查实施中人力、物力、时间等因素,因此通常会把多种抽样方法组合起物力、时间等因素,因此通常会把多种抽样方法组合起来使用。例如,在分层抽样中,不同的层内除了用简单来使用。例如,在分层抽样中,不同的层内除了用简单随机抽样外,还可以用其他的抽样方法,有时层内还需随机抽样外,还可以用其他的抽样方法,有时层内还需要再进行分层,等等。要再进行分层,等等。课堂练习课堂练习 课堂练习课堂练习 课堂练习课堂练习