1、随机抽样 用样本估计总体 考纲要求1会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法2了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点3理解样本数据标准差的意义和作用,会计算数据标准差,并能做出合理的解释4会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想会用统计思想解决一些简单的实际问题 统计的基本思想方法是用样本估计总体,即用局部推断整体,这就要求样本应具有很好的代表性,而样本良好客观的代表性,完全依赖抽样方法 知识梳理 一、抽样方法(简单随机抽样,系统抽样,分层抽样)逐个不
2、放回地 相等 抽签法 随机数法 编号 分段间隔k 分段 简单随机抽样(lk)(l2k)系统抽样又称等距抽样,所以抽取的号码依次为一个等差数列,首项为第一组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取样本号码 互不交叉 一定的比例 差异明显的几个部分 三种抽样方法的比较:类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率是相等的;均属于不放回抽样从总体中逐个抽取最基本的抽样方法总体中的个体数较少分层抽样将总体分成几层进行抽取各层抽样时采用简单随机抽样总体由差异明显的几部分组成系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起
3、始部分抽样时采用简单随机抽样总体中的个体数较多二、用样本估计总体(1 用样本的频率分布来估计总体分布 2 用样本数字特征估计总体数字特征)最大值 最小值 组距 组数 分组 频率分布表 频率分布直方图 中点 旁边 中间 组距 样本容量 所分的组数 2用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数。(2)中位数:将数据按大小顺序排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数。(3)平均数:x_,反映了一组数据的平均水平。(4)标准差:是样本数据到平均数的一种平均距离,s_ _。(5)方差:s2_ _(xn是样本数据,n 是样本容量,x
4、是样本平均数)。x1x2xnn 1n(x1 x)2(x2 x)2(xn x)2 1n(x1 x)2(x2 x)2(xn x)2 众数,中位数与平均数的异同:1 众数,中位数及平均数都是表示一组数据集中趋势的量2 由于平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的变化3 众数考察数据出现的频率,其大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题4 中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势。标准差与方差的异同 标准差,方差描述了一组数据围绕平均数的波动的大小;数
5、据的离散程度越大,标准差方差越大;数据的离散程度越小,标准差方差越小:典例通关 考点一:简单的随机抽样 .随机数表的运用 1总体由编号为01,02,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08 B07 C02 D01781678166572657208020802631463140702070243694369972897280198019832049234493582003623486969387481 答案D 解析从第1行的第5列和第6列组成的数65开始由左到
6、右依次选出的数为08,02,14,07,01,所以第5个个体的编号为01.22019福建模拟下面的抽样方法是简单随机抽样的是()A在某年明信片的销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2 709的为三等奖 B某车间包装一种产品,在自动传送带上,每隔5分钟抽一包产品,称其质量是否合格 C某校分别从行政、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见 D用抽签法从10件产品中选取3件进行质量检验 答案D 解析A,B不是简单随机抽样,因为抽取的个体间的间隔是固定的;C也不是,因为总体的个体有明显的层次;D是简单随机抽样中的抽签法故选D.考点二:系统
7、抽样 系统抽样又称等距抽样,所以抽取的号码依次为一个等差数列,首项为第一组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取样本号码 2从编号为001,002,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为()A480 B481 C482 D483 答案C 解析根据系统抽样的定义可知,样本的编号成等差数列,令a17,a232,d25,所以725(n1)500,所以n20,最大编号为72519482.42019山东临沂模拟某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为
8、4的样本,已知3号、29号、42号同学在样本中,那么样本中还有一个同学的学号是()A10 B11 C12 D16 答案D 解析因为29号、42号的号码差为13,所以31316,即另外一个同学的学号是16.考点三分层抽样 1交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()A101 B808 C1 212 D2 012 22017江苏卷某工厂生产甲、乙、丙、丁四种不同型号的产品,产量
9、分别为200,400,300,100件为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取_件 考点四:样本的数字特征的计算应用 22017全国卷为评估一种农作物的种植效果,选了n块地作试验田这n块地的亩产量(单位:kg)分别为x1,x2,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()Ax1,x2,xn的平均数 Bx1,x2,xn的标准差 Cx1,x2,xn的最大值 Dx1,x2,xn的中位数 答案B 解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差 故选B.甲
10、地的数据分布在26和31之间,且数据波动较大,而乙地数据分布在28与32之间,且数据波动较小.考点五:频率分布直方图 课堂小结:1 抽样的三种方法(简单随机抽样,系统抽样,分层抽样)类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率是相等的;均属于不放回抽样从总体中逐个抽取最基本的抽样方法总体中的个体数较少分层抽样将总体分成几层进行抽取各层抽样时采用简单随机抽样总体由差异明显的几部分组成系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多 2 统计图表(频率分布直方图,频率折线 图,茎叶图)3 用样本的数字特征来估计总体的数字特征(众数,中位数,平均数,方差)课后练习 配套练习(六十六)(六十七)谢 谢 大 家
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。