1、9.1.2分层随机抽样 9.1.3获取数据的途径一、教学目标 1.理解分层随机抽样的概念2.掌握用分层随机抽样从总体中抽取样本3.掌握两种抽样的区别与联系4.了解获取数据的一些基本途径二、教学重点 正确理解分层抽样的定义,灵活应用分层抽样抽取样本掌握各层样本量比例分配的方法和样本均值教学难点 恰当的选择两种抽样方法解决现实生活中的抽样问题三、教学过程1、情境引入问题1:一家家具厂要为树人中学高一年级制作课桌椅,他们事先想了解全体高一年级学生的平均身高,以便设定可调节课桌椅的标准高度。已知树人中学高一年级有712名学生,其中男生有326名,女生有386名。如果要通过抽查的方法调查高一年级学生的平
2、均身高,你有什么办法?应该怎么抽取样本? 答:可以用简单随机抽样的抽签法或者随机数法 问题2:针对以上抽样方法,你发现了什么不足之处? 答:抽样调查最核心的问题就是样本的代表性。简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本。例如,在问题一的调查中,可能出现样本中50个个体大部分来自高个子或者矮个子的情形。这种“极端”样本的平均数会大幅度偏离总体平均数,从而使得估计出现误差问题3:在树人中学高一年级有712名学生,其中男生有326名,女生有386名。针对以上不足,能否利用这个额外信息改进简单随机抽样方法,减少“极端数据”,从而提高对整个
3、年级平均身高的估计? 答:我们知道,影响身高的因素有很多,性别是一个主要因素。高中男生普遍高于女生,而相同性别的身高差异相对较小。那我们就可以利用性别和身高的这种关系,把高一年级学生分成男生和女生两个身高有明显差异的群体,对两个群体分别进行简单随机抽样,然后汇总作为总体的一个样本。由于在男生和女生两个群体中都抽取了相应的个体,这样就能有效地避免“极端”样本。引出本节学习内容2、探索新知思考:对男生、女生分别进行简单随机抽样,样本量在男生、女生中应分别分配?答:显然,为了使样本的结构与总体的分布相近,人数多的群体应多抽一些,人数少的应少抽一些。 因此,按男生、女生在全体学生中所占的比例进行分配是
4、比较合理的方式。 即: 这样无论是男生还是女生,每个学生抽到的概率都相等。当总样本量为50时,可以计算出从男生、女生分别应抽取的人数为: 1)分层随机抽样 一般地,按一个或多个变量把总体划分为若干个子总体,每个个体属于且仅属于一个子总体,在每个字总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配2)分层抽样的步骤: 将总体按一定标准进行分层计算各层的各体数与总体的个数比按比例分配各层所要抽取的个体数在每一层进行抽样(可用简单随机抽样
5、)问题4:抽样比怎样计算?关于分层随机抽样,你认为还有那些需要特别注意的? 答: (1)分层通常是根据总体的差异来分层;将同类型的个体归为一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与抽样比相等或相近。由此可见:当总体是由差异明显的几个部分组成时,往往选用分层随机抽样的方法问题5:在分层随机抽样中,我们可以直接用样本平均数估计总体平均数吗? 答:在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别m和n.我们用X1,X2,X
6、M表示第1层各个个体的变量值,用x1,x2,xm表示第1层被抽取样本的各个个体的变量值;用Y1,Y2,,YN表示第2层各个个体的变量值,用y1,y2,yn表示第2层被抽取样本的各个个体的变量值,这样: 第1层的总体平均数和样本平均数分别为第2层的总体平均数和样本平均数分别为总体平均数和样本平均数分别为 在比例分配的分层随机抽样中: 可得 因此,我们可以用样本平均数估计总体平均数探究:与考察简单随机抽样估计效果类似,小明也想通过多次抽样考察一下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高一年级的学生中抽取了10个样本量为50的样本,计算出样本平均数如下表所示,与上一小节“探究”中
7、相同样本量的简单随机抽样的结果比较,小明有了一个重要的发现.你是否也有所发现?我们把分层随机抽样的平均数与上一小节样本量为50的简单随机抽样的平均数用下图形进行表示,其中粉红线表示整个年级学生身高的平均数 思考1:分层随机抽样的总体具有什么特性? 答:分层随机抽样的总体按一个或多个变量划分成若干个子总体,并且每一个个体属于且仅属于一个子总体思考2:简单随机抽样和分层随机抽样有什么区别和联系? 答:区别:简单随机抽样是从总体中逐个抽取样本;分层随机抽样则首先将总体分成几层,在各层中按比例分配抽取样本联系:(1)抽样过程中每个个体被抽到的可能性相等 (2)每次抽出个体后不再将它放回,即不放回抽样2
8、)获取数据的途径思考1:利用统计报表和年鉴属于那中获取数据的途径? 答:属于通过查询获取数据的途径思考2:要了解一种新型灯管的寿命,能通过观察获取数据吗? 答:不能,应该通过试验获取数据【例1】1某林场有树苗30 000棵,其中松树苗4 000棵为调查树苗的生长情况,采用分层随机抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为(C) A30 B25 C20 D15 2某校高三年级有男生500人,女生400人,为了解该年级学生的健康状况,从男生中任意抽取25人,从女生中任意抽取20人进行调查这种抽样方法是(D) A简单随机抽样 B抽签法 C随机数表法 D分层随机抽样3. 某政府机关在
9、编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适(D) A抽签法法 B随机数法 C简单随机抽样法 D分层随机抽样法 【例2】某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层随机抽样的方法抽取,写出抽样过程 方法规律:在分层随机抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体容量之比【例3】为了缓解城
10、市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果会怎样?解:一个城市交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机抽样调查,不要只关注到拥有私家车的市民方法规律:在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法和策
11、略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得到统计推断四、课堂练习1判断正误(1)在统计实践中选择哪种抽样方法关键是看总体容量的大小()(2)由于分层随机抽样是在各层中按比例抽取,故每个个体被抽到的可能性不一样()(3)从全班40名同学中抽取5人调查作业完成情况适合用分层随机抽样()答案:(1)(2)(3)2为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,且男女生视力情况差异不大在下面的抽样方法中,最合理的抽样方法是()A抽签法B按性别分层随机抽样C按学段分层随机抽样 D随机数法答案:C3为了保证分层随机抽样时每个个体被等可能地抽取,必须要求()A每层等可能抽取B每层抽取的个体数相等C按每层所含个体在总体中所占的比例抽样D只要抽取的样本容量一定,每层抽取的个体数没有限制答案:C4某校高三一班有学生54人,二班有学生42人,现在要用分层随机抽样的方法从两个班抽出16人参加军训表演,则一班和二班分别被抽取的人数是()A9,7 B10,6 C8,8 D12,4答案:A五、课堂小结1、分层随机抽样2、获取数据的途径六、课后作业习题9.1 5、6七、课后反思