1、INNOVATIVE DESIGN 第九章 第2节数据的数字特征及直观表示、 用样本估计总体 知识分类落实 考点分层突破 课后巩固作业 内 容 索 引 / 1 2 3 / / 知识分类落实 夯实基础回扣知识1 索引 知识梳理 / 1.数据的数字特征数据的数字特征 索引 xi0 xn xn+1 索引 (5)众数众数 一组数据中,某个数据出现的次数称为这个数据一组数据中,某个数据出现的次数称为这个数据的的_,出现出现次数次数_的的数数 据称为这组数据的众数据称为这组数据的众数. (6)极差、方差与标准极差、方差与标准差差 极差:一组数的极差指的是这组数极差:一组数的极差指的是这组数的的_减去减去
2、所得所得的差的差. 极极差反映了一组数的变化范围差反映了一组数的变化范围. 方差方差 频数最多 最大值 a2s2 最小值 索引 算术平方根算术平方根 索引 2.数据的直观表示数据的直观表示 (1)柱形图柱形图 柱形图柱形图(也称为条形图也称为条形图)可以形象地比较各种数据之间的数量关系可以形象地比较各种数据之间的数量关系. (2)折线图折线图 一般地,如果数据是随时间变化的,想了解数据一般地,如果数据是随时间变化的,想了解数据的的_情况情况,可将数据用,可将数据用 折线图来表示折线图来表示. (3)扇形图扇形图 扇形图可以形象地表示出各部分数据在全部数据中所占扇形图可以形象地表示出各部分数据在
3、全部数据中所占的的_情况情况. (4)茎叶图茎叶图 一般来说,茎叶图中,所有的茎一般来说,茎叶图中,所有的茎都都_排列排列,而叶,而叶沿沿_排列排列. 变化 比例 竖直水平方向 索引 (5)频数、频率分布直方图频数、频率分布直方图 作频数、频率分布直方图的步骤作频数、频率分布直方图的步骤 ()找出最值,计算极差:即一组数据中最大值与最小值的差;找出最值,计算极差:即一组数据中最大值与最小值的差; ()合理分组,确定区间:根据数据的多少,一般分合理分组,确定区间:根据数据的多少,一般分59组;组; ()整理数据:整理数据: 逐个检查原始数据,统计每个区间内数的个数逐个检查原始数据,统计每个区间内
4、数的个数(称为区间对应的频数称为区间对应的频数),并求出频数,并求出频数 与数据个数的比值与数据个数的比值(称为区间对应的频率称为区间对应的频率),各组均为左闭右开区间,最后一组是闭,各组均为左闭右开区间,最后一组是闭 区间;区间; ()作出有关图示:作出有关图示: 索引 频数频数 频率频率 1 1 索引 频数分布折线图和频率分布折线图频数分布折线图和频率分布折线图 作图的方法都是:把每个矩形上面一边的中点用线段连接起来作图的方法都是:把每个矩形上面一边的中点用线段连接起来.为了方便看图,为了方便看图, 折线图都画成与横轴相交,所以折线图与横轴的左右两个交点是没有实际意义折线图都画成与横轴相交
5、,所以折线图与横轴的左右两个交点是没有实际意义 的的. 不难看出,虽然作频数分布直方图与频率分布直方图过程中,原有数据被不难看出,虽然作频数分布直方图与频率分布直方图过程中,原有数据被“压压 缩缩”了,从这两种图中也得不到所有原始数据了,从这两种图中也得不到所有原始数据.但是,由这两种图可以清楚地看但是,由这两种图可以清楚地看 出数据分布的总体态势,而且也可以得出有关数字特征的大致情况出数据分布的总体态势,而且也可以得出有关数字特征的大致情况.比如,估计比如,估计 出平均数、中位数、百分位数、方差出平均数、中位数、百分位数、方差.当然,利用直方图估计出的这些数字特征当然,利用直方图估计出的这些
6、数字特征 与利用原始数据求出的数字特征一般会有差异与利用原始数据求出的数字特征一般会有差异. 索引 3.用样本估计总体用样本估计总体 (1)用样本的数字特征估计总体的数字特征,如果样本的容量恰当,抽样方法用样本的数字特征估计总体的数字特征,如果样本的容量恰当,抽样方法 又合理的话,样本的数字特征能够反映总体的数字特征又合理的话,样本的数字特征能够反映总体的数字特征. (2)用样本的分布估计总体的分布用样本的分布估计总体的分布 如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不 多多. 索引 索引 索引 3.如果一
7、组数中,各数据值都相等,则标准差为如果一组数中,各数据值都相等,则标准差为0,表明数据没有波动,数据没,表明数据没有波动,数据没 有离散性;若各数的值与平均数的差的绝对值较大,则标准差也较大,表明数据有离散性;若各数的值与平均数的差的绝对值较大,则标准差也较大,表明数据 的波动幅度也较大,数据的离散程度较高,因此标准差的波动幅度也较大,数据的离散程度较高,因此标准差(或方差或方差)描述了数据相对描述了数据相对 于平均数的离散程度于平均数的离散程度. 诊断自测 / 索引 1判断下列结论正误判断下列结论正误(在括号内打在括号内打“”或或“”) (1)平均数、众数与中位数从不同的角度描述了一组数据的
8、集中趋势平均数、众数与中位数从不同的角度描述了一组数据的集中趋势 () (2)数据:数据:68,69,71,63,70,68,69,71,69,72的的25%分位数为分位数为69. () (3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越 大大 () (4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数在频率分布直方图中,最高的小长方形底边中点的横坐标是众数 () 索引 2一个容量为一个容量为32的样本,已知某组样本的频率为的样本,已知某组样本的频率为0.25,则该组样本的频数为,则该组样本的频数
9、为 () A4 B8 C12 D16 B 索引 3若某校高一年级若某校高一年级8个班参加合唱比赛的得分分别为个班参加合唱比赛的得分分别为87,89,90,91,92,93, 94,96,则这组数据的中位数和平均数分别是,则这组数据的中位数和平均数分别是 () A91.5和和91.5B91.5和和92 C91和和91.5D92和和92 解析解析这组数据由小到大排列为这组数据由小到大排列为87,89,90,91,92,93,94,96, A 索引 4(2020全国全国卷卷)在新在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天冠肺炎疫情防控期间,某超市开通网上销售业务,每天 能完成能完成1200
10、份订单的配货,由于订单量大幅增加,导致订单积压为解决困份订单的配货,由于订单量大幅增加,导致订单积压为解决困 难,许多志愿者踊跃报名参加配货工作已知该超市某日积压难,许多志愿者踊跃报名参加配货工作已知该超市某日积压500份订单未配份订单未配 货,预计第二天的新订单超过货,预计第二天的新订单超过1600份的概率为份的概率为0.05.志愿者每人每天能完成志愿者每人每天能完成50 份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95, 则至少需要志愿者则至少需要志愿者 () A10名名 B18名名 C24名名 D32
11、名名 解析解析由题意,第二天完成积压订单及当日订单的配货的概率不小于由题意,第二天完成积压订单及当日订单的配货的概率不小于0.95, 即第二天确保完成新订单即第二天确保完成新订单1600份,减去超市每天能完成的份,减去超市每天能完成的1200份,再加上积份,再加上积 压的压的500份,共有份,共有16001200500900(份份),至少需要志愿者,至少需要志愿者90050 18(名名) B 索引 5(2020全国全国卷卷)设设一组样本数据一组样本数据x1,x2,xn的方差为的方差为0.01,则数据,则数据10 x1, 10 x2,10 xn的方差为的方差为 () A0.01 B0.1 C1
12、D10 解析解析10 x1,10 x2,10 xn的方差为的方差为1020.011.故选故选C. C 索引 6(2020新高考海南卷新高考海南卷)某中某中学的学生积极参加体育锻炼,其中有学的学生积极参加体育锻炼,其中有96%的学生喜的学生喜 欢足球或游泳,欢足球或游泳,60%的学生喜欢足球,的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜的学生喜欢游泳,则该中学既喜 欢足球又喜欢游泳的学生数占该校学生总数的比例是欢足球又喜欢游泳的学生数占该校学生总数的比例是 () A62% B56% C46% D42% 解析解析如图,用如图,用Venn图表示该中学喜欢足球和游泳的学生所占的比例之间的图表示该
13、中学喜欢足球和游泳的学生所占的比例之间的 关系,关系, 设既喜欢足球又喜欢游泳的学生占该中学学生总数的比例为设既喜欢足球又喜欢游泳的学生占该中学学生总数的比例为x, 则则(60%x)(82%x)x96%,解得,解得x46%. 故选故选C. C 考点分层突破 题型剖析考点聚焦2 索引 【例例1】 (1)演讲比演讲比赛共有赛共有9位评委分别给出某选手的原始评分,评定该选手的成位评委分别给出某选手的原始评分,评定该选手的成 绩时,从绩时,从9个原始评分中去掉个原始评分中去掉1个最高分、个最高分、1个最低分,得到个最低分,得到7个有效评分个有效评分.7个有个有 效评分与效评分与9个原始评分相比,不变的
14、数字特征是个原始评分相比,不变的数字特征是 () A中位数中位数B平均数平均数 C方差方差D极差极差 解析解析中位数是将中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,个数据从小到大或从大到小排列后,处于中间位置的数据, 因而去掉因而去掉1个最高分和个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受个最低分,不变的是中位数,平均数、方差、极差均受 影响影响 故选故选A. 考点一数据的数字特征 / 师生共研师生共研 A 索引 【例例1】 (2)(多选题多选题)(2021武汉调研武汉调研)甲甲、乙两人在一次射击比赛中各射靶、乙两人在一次射击比赛中各射靶5次,次, 两人成绩
15、的统计表如下表所示,两人成绩的统计表如下表所示, 下列说法正确的有下列说法正确的有 ( ) A甲成绩的平均数小于乙成绩的平均数甲成绩的平均数小于乙成绩的平均数 B甲成绩的中位数等于乙成绩的中位数甲成绩的中位数等于乙成绩的中位数 C甲成绩的方差小于乙成绩的方差甲成绩的方差小于乙成绩的方差 D甲成绩的极差等于乙成绩的极差甲成绩的极差等于乙成绩的极差 甲甲乙乙 环数环数456 7 8 5 6 9 频数频数111 1 1 3 1 1 CD 索引 索引 1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均 数波动的大
16、小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、 方差越小,数据的离散程度越小,越稳定方差越小,数据的离散程度越小,越稳定 2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征用样本估计总体就是利用样本的数字特征来描述总体的数字特征 感悟升华 索引 C 索引 解析解析由题意知,由题意知,20152019年我国年我国GDP增长量之和为增长量之和为99.0968.8930.2(万亿万亿 元元), 索引 甲甲 索引 角度角度1扇形图扇形图 考点二数据数字特征直观表示及应用 / 多维探究多维探究 【例例2】某地某地区
17、经过一年的新农村建设,农村的经济收入增加了一倍,实现翻区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻 番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建 设前后农村的经济收入构成比例,得到如图所示的饼图:设前后农村的经济收入构成比例,得到如图所示的饼图: 则下面结论中不正确的是则下面结论中不正确的是() A新农村建设后,种植收入减少新农村建设后,种植收入减少 B新农村建设后,其他收入增加了一倍以上新农村建设后,其他收入增加了一倍以上 C新农村建设后,养殖收入增加了一倍新农村建设后,养殖收入增加了一倍 D新农
18、村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 解析解析法一法一设新农村建设前经济收入为设新农村建设前经济收入为a, 则新农村建设后经济收入为则新农村建设后经济收入为2a, 则由饼图可得新农村建设前种植收入为则由饼图可得新农村建设前种植收入为0.6a,其他收入为,其他收入为0.04a,养殖收入为,养殖收入为 0.3a. A 索引 新农村建设后种植收入为新农村建设后种植收入为0.74a,其他收入为,其他收入为0.1a,养殖收入为,养殖收入为0.6a,养殖收入与,养殖收入与 第三产业收入的总和为第三产业收入的总和为1.16a
19、, 所以新农村建设后,种植收入减少是错误的所以新农村建设后,种植收入减少是错误的 法二法二因为因为0.6”连接连接) s1s2s3 索引0112131407080910110203040506 解析解析根据频率分布直方图知,甲的数据绝大部分都处在两端,离平均值较远,根据频率分布直方图知,甲的数据绝大部分都处在两端,离平均值较远, 表现的最分散,标准差最大,乙的数据分布均匀,不如甲组中偏离平均值大,表现的最分散,标准差最大,乙的数据分布均匀,不如甲组中偏离平均值大, 标准差比甲的小;丙的数据大部分数都在平均值左右,数据表现的最集中,方标准差比甲的小;丙的数据大部分数都在平均值左右,数据表现的最集
20、中,方 差最小,差最小, 索引0112131407080910110203040506 三、解答题三、解答题 10共共享单车入住泉州一周年以来,因其享单车入住泉州一周年以来,因其“绿色出行,低碳环保绿色出行,低碳环保”的理念而备的理念而备 受人们的喜爱,值此周年之际,某机构为了了解共享单车使用者的年龄段、受人们的喜爱,值此周年之际,某机构为了了解共享单车使用者的年龄段、 使用频率、满意度等三个方面的信息,在全市范围内发放使用频率、满意度等三个方面的信息,在全市范围内发放5000份调查问卷,份调查问卷, 回收到有效问卷回收到有效问卷3125份,现从中随机抽取份,现从中随机抽取80份,分别对使用者
21、的年龄段、份,分别对使用者的年龄段、 2635岁使用者的使用频率、岁使用者的使用频率、2635岁使用者的满意度进行汇总,得到如下岁使用者的满意度进行汇总,得到如下 三个表格:三个表格: 表表(一一) 使用者年龄段使用者年龄段 25岁以下岁以下26岁岁35岁岁36岁岁45岁岁45岁以上岁以上 人数人数20401010 索引0112131407080910110203040506 索引0112131407080910110203040506 (1)依据上述表格完成下列三个统计图形:依据上述表格完成下列三个统计图形: 索引0112131407080910110203040506 索引01121314
22、07080910110203040506 (2)某城区现有常住人口某城区现有常住人口30万,请用样本估计总体的思想,估计年龄在万,请用样本估计总体的思想,估计年龄在26岁岁35 岁之间,每月使用共享单车在岁之间,每月使用共享单车在714次的人数次的人数 解解由表由表(1)可知:年龄在可知:年龄在2635岁之间的有岁之间的有40人,占总抽取人数的一半,用样人,占总抽取人数的一半,用样 本估计总体的思想可知,本估计总体的思想可知, 索引0112131407080910110203040506 11某市民用水拟实行阶梯水价,每人月用水量中不超过某市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的
23、部分按立方米的部分按4元元 /立方米收费,超出立方米收费,超出w立方米的部分按立方米的部分按10元元/立方米收费,从该市随机调查了立方米收费,从该市随机调查了 10000位居民,获得了他们某月的用水量数据,位居民,获得了他们某月的用水量数据, 整理得到如下频率分布直方图:整理得到如下频率分布直方图: (1)如果如果w为整数,那么根据此次调查,为使为整数,那么根据此次调查,为使80%以上居民在该月的用水价格以上居民在该月的用水价格 为为4元元/立方米,立方米,w至少定为多少?至少定为多少? 解解如题图所示,用水量在如题图所示,用水量在0.5,2)的频率的和为的频率的和为(0.20.30.4)0.
24、50.45, 用水量在用水量在0.5,3)的频率的和为的频率的和为(0.20.30.40.50.3)0.50.85. 用水量小于等于用水量小于等于2立方米的频率为立方米的频率为0.45,用水量小于等于,用水量小于等于3立方米的频率为立方米的频率为 0.85,又,又w为整数,为整数, 为使为使80%以上的居民在该月的用水价格为以上的居民在该月的用水价格为4元元/立方米,立方米,w至少定为至少定为3. 索引0112131407080910110203040506 (2)假设同组中的每个数据用该组区间的右端点值代替,当假设同组中的每个数据用该组区间的右端点值代替,当w3时,估计该市居时,估计该市居
25、民该月的人均水费民该月的人均水费 解解当当w3时,该市居民该月的人均水费估计为时,该市居民该月的人均水费估计为 (0.110.151.50.220.252.50.153)40.15340.05(3.5 3)0.05(43)0.05(4.53)107.21.81.510.5(元元) 即当即当w3时,该市居民该月的人均水费估计为时,该市居民该月的人均水费估计为10.5元元 B级 能力提升 / 索引0112131407080910110203040506 12(多选题多选题)(2021淄博模拟淄博模拟)区域区域经济变化影响着人口的流动,下图为过去某经济变化影响着人口的流动,下图为过去某 连续连续5年
26、各省、自治区及直辖市年各省、自治区及直辖市(不含港澳台不含港澳台)人口增长统计图人口增长统计图 某连续某连续5年各省、自治区及直辖市年各省、自治区及直辖市(不含港澳台不含港澳台)人口增长统计图人口增长统计图 根据图中的信息,下面结论中正确的是根据图中的信息,下面结论中正确的是 ( ) A广东人口增量最多,天津增幅最高广东人口增量最多,天津增幅最高 B黑龙江无论是增量还是增幅均居末尾黑龙江无论是增量还是增幅均居末尾 C天津、北京、重庆和上海四大直辖市增幅均超过天津、北京、重庆和上海四大直辖市增幅均超过5% D人口增量超过人口增量超过200万的省、自治区或直辖市共有万的省、自治区或直辖市共有7个个
27、 解析解析对于对于A,由图知广东,由图知广东5年人口增加超过年人口增加超过400万,增量最多,天津增幅达万,增量最多,天津增幅达 到了到了19.2%,增幅最高,增幅最高,A正确;对于正确;对于B, 由图易知正确;对于由图易知正确;对于C,上海的人口增幅为,上海的人口增幅为4.9%,未超过,未超过5%,不正确;对于,不正确;对于 D,人口增量超过,人口增量超过200万的省或直辖市有天津、北京、重庆、广东、河北、湖万的省或直辖市有天津、北京、重庆、广东、河北、湖 南和山东,正确综上,选南和山东,正确综上,选ABD. ABD 索引0112131407080910110203040506 解析解析x1
28、,x2,x3,xn的平均数为的平均数为5, 35116, x1,x2,x3,xn的方差为的方差为2, 3x11,3x21,3x31,3xn1的方差是的方差是32218. 16,18 索引0112131407080910110203040506 14(2020石家庄模拟石家庄模拟)“一带一一带一路路”是是“丝绸之路经济带丝绸之路经济带”和和“21世纪海上丝世纪海上丝 绸之路绸之路”的简称某市为了了解人们对的简称某市为了了解人们对“一带一路一带一路”的认知程度,对不同年的认知程度,对不同年 龄和不同职业的人举办了一次龄和不同职业的人举办了一次“一带一路一带一路”知识竞赛,满分为知识竞赛,满分为10
29、0分分(90分及分及 以上为认知程度高以上为认知程度高)现从参赛者中抽取了现从参赛者中抽取了x人,按年龄分成人,按年龄分成5组,第一组:组,第一组: 20,25),第二组:,第二组:25,30),第三组:,第三组:30,35),第四组:,第四组:35,40),第五,第五 组:组:40,45,得到如图所示的频率分布直方图,已知第一组有,得到如图所示的频率分布直方图,已知第一组有6人人 (1)求求x; 解解 根据频率分布直方图得第一组的频率为根据频率分布直方图得第一组的频率为0.0150.05, x120. 索引0112131407080910110203040506 索引011213140708
30、0910110203040506 (3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽 取取6人,人,42人,人,36人,人,24人,人,12人,分别记为人,分别记为15组,从这组,从这5个按年龄分的组和个按年龄分的组和5个按个按 职业分的组中每组各选派职业分的组中每组各选派1人参加人参加“一带一路一带一路”知识竞赛,分别代表相应组的成绩,知识竞赛,分别代表相应组的成绩, 年龄组中年龄组中15组的成绩分别为组的成绩分别为93,96,97,94,90,职业组中,职业组中15组的成绩分别为组的成绩分别为93, 98,94,95,90. 分别求分别求5个年龄组和个年龄组和5个职业组成绩的平均数和方差;个职业组成绩的平均数和方差; 以上述数据为依据,评价以上述数据为依据,评价5个年龄组和个年龄组和5个职业组对个职业组对“一带一路一带一路”的认知程度,并谈的认知程度,并谈 谈你的感想谈你的感想 从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定 (感想合理即可感想合理即可) INNOVATIVE DESIGN THANKS本节内容结束