第九章 统计、统计案例.DOC

上传人(卖家):四川天地人教育 文档编号:1708344 上传时间:2021-09-08 格式:DOC 页数:21 大小:1.63MB
下载 相关 举报
第九章 统计、统计案例.DOC_第1页
第1页 / 共21页
第九章 统计、统计案例.DOC_第2页
第2页 / 共21页
第九章 统计、统计案例.DOC_第3页
第3页 / 共21页
亲,该文档总共21页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第九章第九章统计、统计案例统计、统计案例 第一节第一节随机抽样随机抽样 内容要求考题举例考向规律 1.理解随机抽样的必要性和 重要性 2 会用简单随机抽样方法从 总体中抽取样本 3 了解分层抽样和系统抽样 方法 2017江苏高 考T3(分层抽样) 2015湖南高 考T12(系统抽样) 2015湖北高 考T2(简单随机抽 样) 考情分析: 在抽样方法的考 查中,系统抽样、分层抽样 是考查的重点, 题型主要以 选择题和填空题为主, 属于 中低档题 核心素养:数据分析 教材回扣基础自测 自主学习知识积淀 1简单随机抽样 (1)定义:一般地,设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体

2、作为样本(nN),如果每 次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。这样抽取的样本, 叫做简单随机样本。 (2)常用方法:抽签法和随机数法。 2分层抽样 (1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将 各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样。 (2)分层抽样的应用范围 当总体是由差异明显的几个部分组成时,往往选用分层抽样。 3系统抽样 (1)定义:当总体中的个体数较多时,可以将总体分成均衡的几部分,然后按照预先制定的规则,从每一 部分抽取一个个体,得到所需的样本,这种抽样方法叫做系统抽样。

3、(2)系统抽样的步骤 假设要从容量为 N 的总体中抽取容量为 n 的样本。 先将总体的 N 个个体编号; 确定分段间隔 k,对编号进行分段。当N n(n 是样本容量)是整数时,取 k N n; 在第 1 段用简单随机抽样确定第一个个体编号 l(lk); 按照一定的规则抽取样本。 通常是将 l 加上间隔 k 得到第 2 个个体编号 lk,再加 k 得到第 3 个个体编 号 l2k,依次进行下去,直到获取整个样本。 1随机数法编号要求:应保证各号数的位数相同,而抽签法则无限制。 2不论哪种抽样方法,总体中的每一个个体入样的概率是相同的。 3系统抽样是等距抽样,入样个体的编号相差N n的整数倍。 4

4、分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比。 一、常规题 1为了保障人民群众的身体健康,在预防新型冠状病毒期间,贵阳市市场监督管理局加强了对市场的监 管力度,为了考察某工厂生产的 600 个口罩是否合格,利用随机数表进行抽样测试,先将 600 个口罩进行编 号,编号分别为 001,002,599,600,再从中抽取 60 个样本,如下提供随机数表的第 4 行到第 6 行: 32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42 84 42 12 53 31 34 57 86 07

5、 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04 32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45 若从表中第 6 行第 6 列开始向右依次读取 3 个数据,则得到的第 5 个样本编号为() A578B324 C535D522 解析第 6 行的第 6 个数开始的三位数分别为 808,436,789,535,577,348,994,837,522,符合条件的编 号分别为 436,535,577,348,522,第 5 个样本数据为 522。 答案D

6、2利用简单随机抽样从含有 8 个个体的总体中抽取一个容量为 4 的样本,则总体中每个个体被抽到的概 率是() A1 2 B1 3 C1 6 D1 4 解析总体个数为 N,样本容量为 M,则每一个个体被抽到的概率为 PM N 4 8 1 2。 答案A 3某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为 200,400,300,100 件。为检验产品的质 量,现用分层抽样的方法从以上所有的产品中抽取 60 件进行检验,则应从丙种型号的产品中抽取_ 件。 解析丙种型号的产品在所有产品中所占比例为 300 200400300100 3 10,所以应从丙种型号的产品中 抽取 60 3 1018(件

7、)。 答案18 二、易错题 4(忽视各种抽样的等可能性)某校要从高一、高二、高三共 2 019 名学生中选取 50 名组成志愿团,若先 用简单随机抽样的方法从 2 019 名学生中剔除 19 名, 再从剩下的 2 000 名学生中按分层抽样的方法抽取 50 名, 则每名学生入选的可能性() A都相等且为 50 2 019 B都相等且为 1 40 C不完全相等D均不相等 解析根据简单随机抽样及分层抽样的定义可得,每个个体被抽到的概率都相等,所以每个个体被抽到 的概率都等于 50 2 019。 答案A 5(忽视系统抽样中可以先剔除部分个体)某学校为了解高一年级 1 203 名学生对某项教改试验的意

8、见, 打算从中抽取一个容量为 40 的样本,若采用系统抽样,则分段间隔为_。 解析因为 1 203 除以 40 不是整数,所以需随机剔除 3 个个体,从而每一段有 30 个个体,则分段间隔 为 30。 答案30 考点例析对点微练 互动课堂考向探究 考点一简单随机抽样自主练习 1.下列抽样方法是简单随机抽样的是() A从 50 个零件中一次性抽取 5 个做质量检验 B从 50 个零件中有放回地抽取 5 个做质量检验 C从实数集中随意抽取 10 个数分析奇偶性 D运动员从 8 个跑道中随机地抽取一个跑道 解析简单随机抽样的特点:总体有限,逐个抽取,不放回抽样,等可能,选 D。 答案D 2用简单随机

9、抽样的方法从含有 10 个个体的总体中,抽取一个容量为 3 的样本,其中某一个体 a“第 一次被抽到”的可能性与“第二次被抽到”的可能性分别是() A 1 10, 1 10 B 3 10, 1 5 C 1 5, 3 10 D 3 10, 3 10 解析解法一:在抽样过程中,个体 a 每一次被抽中的概率是相等的,因为总体容量为 10,故个体 a“第 一次被抽到”的可能性与“第二次被抽到”的可能性均为 1 10。故选 A。 解法二:第一次被抽到,显然为 1 10;第二次被抽到,首先第一次不能被抽到,第二次抽才被抽到。可能 性为 9 10 1 9 1 10。故选 A。 答案A 3有一批计算机,其编号

10、分别为 001,002,003,112,为了调查计算机的质量问题,打算抽取 4 台入 样。现在利用随机数表法抽样,在随机数表中选第 10 行第 6 个数“0”作为开始,向右读,那么抽取的第 4 台 计算机的编号为() 附:随机数表中第 1012 行如下。 5 3797 0762 6942 9274 3995 5198 1068 501 9 2644 6072 0213 9207 7663 8173 2561 640 5 8587 7663 1700 5002 5930 5455 3707 814 A072B021 C077D058 解析结合所给部分随机数表以及读法规则即知,依次可得到需要的编号

11、分别是 076,068,072,021。故抽 取的第 4 台计算机的编号为 021。 答案B 1一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀。一般地,当总 体容量和样本容量都较小时可用抽签法。 2随机数表中共随机出现 0,1,2,9 十个数字,也就是说,在表中的每个位置上出现各个数字的机会 都是相等的。在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起, 每三个或每四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去。 考点二系统抽样 【例 1】(1)为了解 1 003 名学生的学习情况,采用系统抽样的方法,从中抽

12、取容量为 40 的样本,则分 段的间隔为() A50B40C25D20 解析先用简单随机抽样, 剔除 3 名学生, 再用系统抽样抽取样本。 由系统抽样的定义知, 分段间隔为1 000 40 25。故选 C。 答案C (2)某学校为了解 1 000 名新生的身体素质,将这些学生编号为 1,2,1 000,从这些新生中用系统抽样 方法等距抽取 100 名学生进行体质测验。若 46 号学生被抽到,则下面 4 名学生中被抽到的是() A8 号学生B200 号学生 C616 号学生D815 号学生 解析由系统抽样可知第一组学生的编号为 110,第二组学生的编号为 1120,最后一组学生的 编号为 991

13、1 000。设第一组取到的学生编号为 x,则第二组取到的学生编号为 x10,以此类推,所取的学 生编号为 10 的倍数加 x。因为 46 号学生被抽到,所以 x6,所以 616 号学生被抽到。故选 C。 答案C 用系统抽样法抽取样本,当N n 不为整数时,取 k N n ,即先从总体中用简单随机抽样的方法剔除(Nnk) 个个体,且剔除多余的个体不影响抽样的公平性。 【变式训练】 某学校采用系统抽样的方法, 从该校高一年级全体 800 名学生中抽 50 名学生做视力检查。 现将 800 名学生从 1 到 800 进行编号。已知从 3348 这 16 个数中抽到的数是 39,则在第 1 小组 11

14、6 中随 机抽到的数是() A5B7C11D13 解析把 800 名学生分成 50 组,每组 16 人,各小组抽到的数构成一个公差为 16 的等差数列,39 在第 3 组。所以第 1 组抽到的数为 39327。故选 B。 答案B 考点三分层抽样 【例 2】(1)(多选)对下面三个事件最适宜采用的抽样方法判断正确的是() 从某厂生产的 3 000 件产品中抽取 600 件进行质量检验; 一次数学竞赛中,某班有 10 人的成绩在 110 分以上,40 人的成绩在 90100 分,10 人的成绩低于 90 分,现在从中抽取 12 人的成绩了解有关情况; 运动会服务人员为参加 400 m 决赛的 6

15、名同学安排跑道。 A适宜采用分层抽样 B适宜采用分层抽样 C适宜采用分层抽样 D适宜采用简单随机抽样 解析从某厂生产的 3 000 件产品中抽取 600 件进行质量检验,不满足分层抽样的方法;总体由差 异明显且互不重叠的几部分组成,若要从中抽取 12 人的成绩了解有关情况,适合采用分层抽样的方法;运 动会服务人员为参加 400 m 决赛的 6 名同学安排跑道,具有随机性,适合用简单随机抽样。故选 CD。 答案CD (2)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有 40 种,10 种,30 种,20 种,现从中抽取一个容量为 20 的样本进行食品安全检测。若采用分层抽样的

16、方法抽取样本,则抽取的植物油 类与果蔬类食品种数之和是_。 解析抽样比为 20 40103020 1 5,则抽取的植物油类种数是 10 1 52,抽取的果蔬类食品种数是 201 54,所以抽取的植物油类与果蔬类食品种数之和是 246。 答案6 (3)某中学有高中生 3 000 人,初中生 2 000 人,男、女生所占的比例如图所示,为了解学生的学习情况, 用分层抽样的方法从该校学生中抽取一个容量为 n 的样本,已知从高中生中抽取女生 21 人,则从初中生中抽 取的男生人数是() A12B15C20D21 解析因为分层抽样的抽取比例为 21 3 0000.7 1 100, 所以初中生中抽取的男生

17、人数是 2 0000.6 100 12(人)。 故选 A。 答案A (1)分层抽样的操作步骤: 将总体按一定标准进行分层; 计算各层的个体数与总体数的比,按各层个体数占总体数的比确定各层应抽取的样本容量; 在每一层进行抽样(可用简单随机抽样或系统抽样)。 (2)进行分层抽样的相关计算时,常利用以下关系式巧解: 样本容量 n 总体的个数 N 该层抽取的个体数 该层的个体数 ; 总体中某两层的个体数之比等于样本中这两层抽取的个体数之比。 【变式训练】(1)(多选)某公司生产三种型号的轿车,产量分别为 1 500 辆、6 000 辆和 2 000 辆,为检 验该公司的产品质量,公司质监部门要抽取 5

18、7 辆进行检验,则下列说法正确的是() A应采用分层抽样抽取 B应采用抽签法抽取 C三种型号的轿车依次应抽取 9 辆、36 辆、12 辆 D这三种型号的轿车,每一辆被抽到的概率都是相等的 解析因为是三种型号的轿车,个体差异明显,所以选择分层抽样,A 正确;因为个体数目多,用抽签 法制签难,搅拌不均匀,抽出的样本不具有好的代表性,B 不正确;抽样比为 57 1 5006 0002 000 3 500,三 种型号的轿车依次应抽取 9 辆、36 辆、12 辆,C 正确;分层抽样中,每一个个体被抽到的可能性相同,D 正 确。故选 ACD。 答案ACD (2)如图,某学校共有教师 120 人,现用分层抽

19、样的方法从中选出一个 30 人的样本,则其中被选出的青年 女教师的人数为() A12B6 C4D3 解析青年教师的人数为 12030%36(人),所以青年女教师为 12 人,故青年女教师被选出的人数为 12 30 1203。故选 D。 答案D 考点四抽样方法的应用 【例 3】某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人 数分布)如下表: 学历35 岁以下3550 岁50 岁以上 本科803020 研究生x20y (1)用分层抽样的方法在 3550 岁年龄段的专业技术人员中抽取一个容量为 5 的样本, 将该样本看成一个 总体,从中任取 2 人,求至少有 1

20、 人学历为研究生的概率; (2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取 N 个人,其中 35 岁以下 48 人,50 岁 以上 10 人,再从这 N 个人中随机抽取 1 人,此人的年龄为 50 岁以上的概率为 5 39,求 x,y 的值。 解(1)用分层抽样的方法在 3550 岁年龄段的专业技术人员中抽取一个容量为 5 的样本, 设抽取学历为 本科的人数为 m,所以30 50 m 5 ,解得 m3。抽取的样本中有研究生 2 人,本科生 3 人,分别记作 S1,S2;B1, B2,B3。 记“至少有 1 人学历为研究生”为事件 A。 从中任取 2 人的所有等可能基本事件共有 1

21、0 个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2, B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3)。 其中至少有 1 人的学历为研究生的基本事件有 7 个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2, B2),(S2,B3),(S1,S2)。 所以从中任取 2 人,至少有 1 人学历为研究生的概率为 P(A) 7 10。 (2)由题意,得10 N 5 39,解得 N78。 所以 3550 岁中被抽取的人数为 78481020, 所以 48 80 x 20 50 10 20y, 解得 x40,y5,

22、即 x,y 的值分别为 40,5。 (1)在解答本题时有两点容易造成失分: 一是通过表格分析计算抽取的人数时发生审题或计算失误。 二是 用列举法写出基本事件总数及事件 A 所含的事件数,容易漏写,使概率错误。 (2)用分层抽样时,分成的各层标准要一致,互不重叠,各层抽取的比例都等于样本容量在总体中的比例, 即n N。 【变式训练】某初级中学共有学生 2 000 名,各年级男、女生人数如下表: 初一年级初二年级初三年级 女生373xy 男生377370z 已知在全校学生中随机抽取 1 名,抽到初二年级女生的概率是 0.19。 (1)求 x 的值; (2)现用分层抽样的方法在全校抽取 48 名学生

23、,问应在初三年级抽取多少名? 解(1)因为 x 2 0000.19,所以 x380。 (2)初三年级人数为 yz2 000(373377380370)500(名),现用分层抽样的方法在全校抽取 48 名学生,应在初三年级抽取的人数为 48 2 00050012(名)。 教师备用题 【例 1】 (配合例 2 使用)一个单位有职工 800 人, 其中具有高级职称的有 160 人, 具有中级职称的有 320 人,具有初级职称的有 200 人,其余人员有 120 人。为了解职工收入情况,决定按职称采用分层抽样的方法 从中抽取容量为 40 的样本,则从上述各层中依次抽取的人数分别是() A12,14,1

24、0,4B9,12,12,7 C8,15,12,5D8,16,10,6 解析由题意得,抽样比例为 40 800 1 20,所以从具有高级职称的职工中抽取的人数为 160 1 208,从具 有中级职称的职工中抽取的人数为 320 1 2016,从具有初级职称的职工中抽取的人数为 200 1 2010,从其 余人员中抽取的人数为 120 1 206,所以各层中抽取的人数依次是 8,16,10,6。故选 D。 答案D 【例 2】(配合例 3 使用)环保部门要对所有的新车模型进行广泛测试,以确定它的行车里程的等级,下 表是对 100 个新车模型在一个耗油单位内行车里程(单位:千米)的测试结果。 分组频数

25、 30,32)6 32,34)10 34,36)20 36,38)30 38,40)18 40,42)12 42,444 (1)作出测试结果的频率分布直方图,并指出其中位数落在哪一组; (2)用分层抽样的方法从行车里程在区间38,40)与40,42)的新车模型中任取 5 个,并从这 5 个中随机抽取 2 个,求其中恰有一个新车模型行车里程在40,42)内的概率。 解(1)由题意画出频率分布直方图,如图所示: 由图可知,中位数在区间36,38)。 (2)由题意,从38,40)中选取的新车模型数为 18 5 303,设这 3 个新车模型分别为 A,B,C,从40,42) 中选取的新车模型数为 12

26、 5 302,设这 2 个新车模型分别为 a,b,则从这 5 个新车模型中抽取 2 个的所有 情况有 10 种,分别为 AB,AC,Aa,Ab,BC,Ba,Bb,Ca,Cb,ab,其中符合条件的有 6 种,分别为 Aa, Ab,Ba,Bb,Ca,Cb,所以所求事件的概率为3 5。 第二节第二节用样本估计总体用样本估计总体 内容要求考题举例考向规律 1.了解频率分布的意义和作用,会列频 率分布表,会画频率分布直方图、频率 分布折线图、茎叶图,理解它们各自的 特点 2理解样本数据标准差的意义和作用, 会计算数据标准差 3能从样本数据中提取基本的数字特 征(如平均数、标准差),并给出合理的 解释 4

27、会用样本的频率分布估计总体分布, 会用样本的数字特征估计总体的数字 特征,理解用样本估计总体的思想 2020全国卷T3(标准 差) 2019全国卷T5(中位 数) 2019全国卷T13(求平 均数) 2019全国卷T17(频率 分布直方图) 2018江苏高考T3(求平均 数) 考情分析:本节是用 样本估计总体,是统 计学的基础。以考查 频率分布直方图、茎 叶图、 平均数、 方差、 标准差为主,同时考 查对样本估计总体 的思想的理解 核心素养:数据分析 教材回扣基础自测 自主学习知识积淀 1频率分布直方图 (1)纵轴表示频率 组距,即小长方形的高 频率 组距。 (2)小长方形的面积组距频率 组距

28、频率; (3)各个小方形的面积总和等于 1。 2频率分布表的画法 第一步:求极差,决定组数和组距,组距极差 组数; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表。 3茎叶图 茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数。 4中位数、众数、平均数的定义 (1)中位数 将一组数据按大小依次排列, 处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中 位数。 (2)众数 一组数据中出现次数最多的数据叫做这组数据的众数。 (3)平均数 一组数据的算术平均数即为这组数据的平均数,

29、n 个数据 x1,x2,xn的平均数 x 1 n(x 1x2xn)。 5样本的数字特征 如果有 n 个数据 x1,x2,xn,那么这 n 个数的 标准差 s 1 nx 1 x 2x2 x2xn x2; 方差 s21 n(x 1 x )2(x2 x)2(xn x)2。 1频率分布直方图中的常见结论 (1)众数的估计值为最高矩形的中点对应的横坐标。 (2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。 (3)中位数的估计值的左边和右边的小矩形的面积和是相等的。 2平均数、方差的公式推广 (1)若数据 x1,x2,xn的平均数为 x ,那么 mx1a,mx2a,m

30、x3a,mxna 的平均数是 m x a。 (2)数据 x1,x2,xn的方差为 s2。 数据 x1a,x2a,xna 的方差也为 s2; 数据 ax1,ax2,axn的方差为 a2s2。 一、常规题 1某便利店记录了 100 天某商品的日需求量(单位:件),整理得下表: 日需求量 n/件1415161820 频率0.10.20.30.20.2 试估计该商品日平均需求量为() A16 件B16.2 件 C16.6 件D16.8 件 解析由题意可知,日平均需求量为 140.1150.2160.3180.2200.216.8(件)。 答案D 2 为了解某校今年准备报考飞行员的学生的体重情况, 将所

31、得的数据整理后, 画出了频率分布直方图(如 图),已知图中从左到右的前 3 个小组的频率之比为 123,第 1 个小组的频数为 6,则报考飞行员的学生 人数是() A36B40 C48D50 解析设报考飞行员的人数为 n, 根据前 3 个小组的频率之比为 1 2 3, 可设前三小组的频率分别为 x,2x, 3x;由题意可知所求频率和为 1,即 x2x3x(0.0370.013)51,解得 x0.125,则 0.1256 n,解得 n 48。 答案C 3样本中共有五个个体,其值分别为 0,1,2,3,m。若该样本的平均值为 1,则其方差为() A 10 5 B 30 5 C 2D2 解析依题意得

32、 m51(0123)1,则样本方差 s21 5(1) 2021222(2)22,即 所求的样本方差为 2。 答案D 二、易错题 4(样本数字特征意义不清)为评估一种农作物的种植效果,选了 n 块地作试验田。这 n 块地的亩产量(单 位:kg)分别为 x1,x2,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是() Ax1,x2,xn的平均数 Bx1,x2,xn的标准差 Cx1,x2,xn的最大值 Dx1,x2,xn的中位数 解析评估这种农作物亩产量稳定程度的指标是标准差。 答案B 5(方差的性质不熟致误)若数据 x1,x2,x3,xn的平均数 x 5,方差 s22,则数据 3x1

33、1,3x21,3x3 1,3xn1 的方差为_。 解析因为 x1,x2,x3,xn的方差为 2,所以 3x11,3x21,3x31,3xn1 的方差是 32218。 答案18 考点例析对点微练 互动课堂考向探究 考点一样本的频率分布直方图 【例 1】(多选)空气质量指数 AQI 是反映空气质量状况的指数,AQI 指数越小,表明空气质量越好,如 表是空气质量指数与空气质量的对应关系,如图是经整理后的某市 2019 年 2 月与 2020 年 2 月的空气质量指 数频率分布直方图,下列叙述正确的是() 空气质量指数(AQI) 优(AQI50) 良(50AQI100) 轻度污染(100AQI150)

34、 中度污染(150AQI200) 重度污染(200300) A该市 2020 年 2 月份的空气质量为优的天数的频率为 0.032 B该市 2020 年 2 月份的空气质量整体上优于 2019 年 2 月份的空气质量 C该市 2020 年 2 月份空气质量指数的中位数大于 2019 年 2 月份空气质量指数的中位数 D该市 2020 年 2 月份空气质量指数的方差小于 2019 年 2 月份空气质量指数的方差 解析由图中数据可得,该市 2020 年 2 月份的空气质量为优的天数的频率为(0.0130.019)250.8, 故 A 错;由图中数据可得,该市 2020 年 2 月份空气质量为优的天

35、数明显多于 2019 年 2 月份的空气质量为优 的天数,且 2020 年 2 月份的空气质量为优的天数的频率为 0.8,2019 年 2 月份的空气质量为优的天数的频率 仅为(0.0010.012)250.325,所以该市 2020 年 2 月份的空气质量整体上优于 2019 年 2 月份的空气质量, 故 B 正确; 因为 2020 年 2 月份的空气质量为优的天数的频率为 0.8, 所以 2020 年 2 月份空气质量的中位数必 然小于 50,而 2019 年 2 月份的空气质量为优的天数的频率为 0.325,故 2019 年 2 月份空气质量的中位数必 然大于 50,故 C 错误;由题中

36、图象可得,2020 年 2 月份的空气质量指数主要集中在0,75),而 2019 年 2 月份 空气质量指数较分散,故该市 2020 年 2 月份空气质量指数的方差小于 2019 年 2 月份空气质量指数的方差。 故 D 正确。故选 BD。 答案BD 频率分布直方图是表达和分析数据的重要工具,破解此类频率分布直方图与数列相交汇题的关键:一是 会求频率,即会观图、读数据,利用频率分布直方图中每一个小矩形的高乘以组距求出这一组的频率;二是 会求频数,利用频率乘以样本容量,即可求出样本数据落在对应区间上的频数。 【变式训练】(1)(2020天津高考)从一批零件中抽取 80 个,测量其直径(单位:mm

37、),将所得数据分为 9 组:5.31,5.33),5.33,5.35),5.45,5.47),5.47,5.49,并整理得到如下频率分布直方图,则在被抽取的 零件中,直径落在区间5.43,5.47)内的个数为() A10B18C20D36 解析由题图知5.43,5.45)与5.45,5.47)所对应的小矩形的高分别为 6.25,5.00,所以5.43,5.47)内的频率 为(6.255.00)0.020.225,所以直径落在区间5.43,5.47)内的个数为 800.22518。故选 B。 答案B (2)为了解学生在课外活动方面的支出情况,某校抽取了 n 个学生进行调查,结果显示这些学生的支出

38、金 额(单位: 元)都在10,50, 其中支出金额在30,50的学生有 117 人, 频率分布直方图如图所示, 则 n_。 解析由题图可得,支出金额在10,30)的频率为 100.01100.0250.35,所以支出金额在30,50的 频率为 10.350.65。由 1170.65180,得 n180。 答案180 考点二茎叶图 【例 2】(多选)为比较甲、乙两名篮球运动员的近期竞技状态,选取这两名球员最近五场比赛的得分制 成如图所示的茎叶图。则下列结论正确的是() A甲最近五场比赛得分的中位数高于乙最近五场比赛得分的中位数 B甲最近五场比赛得分的平均数低于乙最近五场比赛得分的平均数 C从最近

39、五场比赛的得分看,乙比甲更稳定 D从最近五场比赛的得分看,甲比乙更稳定 解析由茎叶图可得甲的中位数是 29,低于乙的中位数 30,A 错误;甲得分的平均数是 29,低于乙得分 的平均数 30,B 正确;甲的方差为16149 5 6,乙的方差为4114 5 2,则乙比甲稳定,C 正确,D 错误。 答案BC 茎叶图的应用 1茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据。通过茎叶图 可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等。 2给定两组数据的茎叶图,比较数字特征时,“重心”下移者平均数较大,数据集中者方差较小。 【变式训练】

40、(1)在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数 据的极差与中位数之和为 61,则被污染的数字为() A1B2 C3D4 解析由图可知该组数据的极差为 482028,则该组数据的中位数为 612833,易得被污染的数字 为 2。故选 B。 答案B (2)甲、乙两名篮球运动员 5 场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为 x 甲, x 乙,则下列结论正确的是( ) A x 甲 x 乙;甲比乙得分稳定 C x 甲 x 乙;乙比甲得分稳定 D x 甲 x 乙;甲比乙得分稳定 解析因为 x 甲2781622 5 11, x 乙812182125 5

41、 16.8,所以 x 甲 x 乙且乙比甲成绩稳 定。 答案A 考点三样本的数字特征微专题 微考向 1:样本方差的计算 【例 3】(1)甲、乙两组各四名工人 1 天加工的零件数为甲:22,19,21,18;乙:20,m,19,20。且甲、乙 两组工人平均每人加工零件的个数相同,则 m_;甲、乙两组工人加工零件数方差较大的一组的方 差为_。 解析x 甲1 4(18192122)20, x 乙1 4(192020m),由 x 甲 x 乙,求得 m21。甲的方 差为 s2 甲1 4(1820) 2(1920)2(2120)2(2220)22.5,乙的方差为 s2 乙1 4(1920) 2(2020)2

42、 (2020)2(2120)20.5,所以加工零件数方差较大的一组的方差为 2.5。 答案212.5 (2)已知一组数据 x1,x2,x3,x4,x5的方差是 2,则数据 2x1,2x2,2x3,2x4,2x5的标准差为_。 解析由 s21 n 错误错误!(xi x )22,则数据 2x1,2x2,2x3,2x4,2x5 的方差为 22s2428,标准差为 2 2。 答案2 2 1样本方差的计算依据是方差的计算公式 s21 n(x 1 x )2(x2 x)2(xn x)2。 2注意方差性质的应用:若 x1,x2,xn的方差是 s2,则 mx1a,mx2a,mxna 的方差是 m2s2。 微考向

43、 2:用样本的数字特征估计总体 【例 4】新冠肺炎疫情期间,为了减少外出聚集,“线上买菜”很受追捧。某电商平台在 A 地区随机 抽取了 100 位居民进行调研,获得了他们每个人近七天“线上买菜”的消费总金额(单位:元),整理得到如图 所示的频率分布直方图。 (1)求 m 的值; (2)从“线上买菜”消费总金额不低于 500 元的被调研居民中随机抽取 2 位,求这 2 位“线上买菜”消费 总金额均低于 600 元的概率; (3)若 A 地区有 100 万居民,该平台为了促进消费,拟对消费总金额不到平均水平一半的居民投放每人 10 元的电子补贴,假设每组中的数据用该组区间的中点值代替,试根据上述频

44、率分布直方图,估计该平台在 A 地区拟投放的电子补贴总金额。 解(1)由(0.001 10.002 4m0.002 00.001 00.000 40.000 1)1001, 得 m0.003 0。 (2)设事件 M 为“这 2 位线上买菜消费总金额均低于 600 元”, 被调研的居民“线上买菜”消费总金额在500,600)的有 0.000 41001004(人),分别记为 a1,a2,a3, a4, 被调研的居民“线上买菜”消费总金额在600,700的有 0.000 11001001(人),记为 b, 从“线上买菜”消费总金额不低于 500 元的被调研居民中随机抽取 2 人共包含 10 个基本

45、事件, 分别为 a1a2,a1a3,a1a4,a1b,a2a3,a2a4,a2b,a3a4,a3b,a4b, 事件 M 包含 6 个基本事件, 分别为 a1a2,a1a3,a1a4,a2a3,a2a4,a3a4, 则这 2 位“线上买菜”消费总金额均低于 600 元的概率 P(M) 6 10 3 5。 (3)由题意,可得 A 地区每位居民“线上买菜”消费总金额的平均数约为 500.001 11001500.002 41002500.003 01003500.002 01004500.001 01005500.000 41006500.000 1100260。 低于平均水平一半的频率为 260

46、2 100 0.002 40.110.182, 所以估计该平台在 A 地区拟投放电子补贴总金额为 1 000 0000.182101 820 000(元)。 1用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值。实际应用时,需先 计算样本数据的平均数,分析平均水平,再计算方差(标准差)分析稳定情况。 2若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可 以从图形直观分析样本数据的分布情况, 大致判断平均数的范围, 并利用数据的波动性大小比较方差(标准差) 的大小。 【题组对点练】 1(多选)某赛季甲乙两名篮球运动员各 6 场比赛得分情

47、况如下表: 场次123456 甲得分31162434189 乙得分232132113510 则下列说法正确的是() A甲运动员得分的极差小于乙运动员得分的极差 B甲运动员得分的中位数小于乙运动员得分的中位数 C甲运动员得分的平均值大于乙运动员得分的平均值 D甲运动员的成绩比乙运动员的成绩稳定 解析由题意甲的极差为 34925,中位数是 21,均值为 22,方差为 s275,同样乙的极差为 3510 25,中位数是 22,均值为 22,方差为 s2 乙891 3。故选 BD。 答案BD 2(微考向 2)由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,造成了一定的经济损 失,现将 A

48、地区 200 家实体店该品牌洗衣机的月经济损失统计如图所示。 (1)求 a 的值; (2)求 A 地区 200 家实体店该品牌洗衣机的月经济损失的众数以及中位数; (3)不经过计算,直接给出 A 地区 200 家实体店月经济损失的平均数 x 与 6 000 的大小关系。 解(1)依题意,(0.000 150.000 20a0.000 06)2 0001, 解得 a0.000 09。 (2)由题图可知,A 地区 200 家实体店该品牌洗衣机的月经济损失的众数为 3 000, 第一个小矩形的面积 S10.3,第二个小矩形的面积 S20.4,故所求中位数在2 000,4 000)内,故所求中 位数为

49、 2 0000.50.3 0.000 203 000。 (3) x 6 000。 教师备用题 【例 1】(配合例 1 使用)由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,承受了一 定的经济损失,现将 A 地区 200 家实体店该品牌洗衣机的月经济损失统计如图所示,估算月经济损失的平均 数为 m,中位数为 n,则 mn_。 解析第一个小矩形的面积 S10.3,第二个小矩形的面积 S20.4,故 n2 0000.50.3 0.000 2 3 000。由图 中数据计算可得 a0.000 09,而 m1 0000.33 0000.45 0000.18(7 0009 000)0.063 3

50、60,故 mn360。 答案360 【例 2】(配合例 4 使用)党的十九大明确把精准脱贫作为决胜全面建成小康社会必须打好的三大攻坚战 之一,为坚决打赢脱贫攻坚战,某帮扶单位帮助定点扶贫村脱贫。此帮扶单位为了了解某地区贫困户对其所 提供的帮扶的满意度,随机调查了 40 个贫困户,得到贫困户的满意度评分如下: 贫困户 编号 评分 贫困户 编号 评分 贫困户 编号 评分 贫困户 编号 评分 178118821793193 273128622833278 381139523723375 492147624743481 586158025933589 685167826663677 779178827

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中 > 数学 > 高考专区 > 一轮复习
版权提示 | 免责声明

1,本文(第九章 统计、统计案例.DOC)为本站会员(四川天地人教育)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|