第2节 数据的数字特征及直观表示、用样本估计总体.docx

上传人(卖家):四川天地人教育 文档编号:1755627 上传时间:2021-09-25 格式:DOCX 页数:23 大小:896.19KB
下载 相关 举报
第2节 数据的数字特征及直观表示、用样本估计总体.docx_第1页
第1页 / 共23页
第2节 数据的数字特征及直观表示、用样本估计总体.docx_第2页
第2页 / 共23页
第2节 数据的数字特征及直观表示、用样本估计总体.docx_第3页
第3页 / 共23页
亲,该文档总共23页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第第 2 节节数据的数字特征及直观表示、用样本估计总体数据的数字特征及直观表示、用样本估计总体 知识梳理 1.数据的数字特征 (1)最值 一组数据的最值指的是其中的最大值与最小值, 最值反映的是这组数最极端的情 况. (2)平均数 定义:如果给定的一组数是 x1,x2,xn,则这组数的平均数为x 1 n(x 1x2 xn). 这一公式在数学中常简记为x 1 n n i1xi, 性质:一般地,利用平均数的计算公式可知,如果 x1,x2,xn的平均数为 x ,且 a,b 为常数,则 ax1b,ax2b,axnb 的平均数为 ax b. (3)中位数 有奇数个数,且按照从小到大排列后为 x1,x2,

2、x2n1,则称 xn1为这组数的 中位数;如果一组数有偶数个数,且按照从小到大排列后为 x1,x2,x2n,则 称xnxn 1 2 为这组数的中位数. (4)百分位数 定义:一组数的 p%(p(0,100)分位数指的是满足下列条件的一个数值:至 少有 p%的数据不大于该值,且至少有(100p)%的数据不小于该值. 确定方法:设一组数按照从小到大排列后为 x1,x2,xn,计算 inp%的值, 如果 i 不是整数,设 i0为大于 i 的最小整数,取 xi0为 p%分位数;如果 i 是整数, 取xixi 1 2 为 p%分位数.特别地,规定:0 分位数是 x1(即最小值),100%分位数是 xn(

3、即最大值). (5)众数 一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称 为这组数据的众数. (6)极差、方差与标准差 极差:一组数的极差指的是这组数的最大值减去最小值所得的差.极差反映了 一组数的变化范围. 方差 定义: 如果 x1, x2, ,xn的平均数为x , 则方差可用求和符号表示为 s21 n n i1_(xi x )21 n n i1x 2 ix 2. 性质:如果 a,b 为常数,则 ax1b,ax2b,axnb 的方差为 a2s2. 标准差 定义:方差的算术平方根称为标准差.一般用 s 表示,即样本数据 x1,x2,xn 的标准差为 s 1 n n i1

4、 (xix )2.性质: 如果 a, b 为常数, 则 ax1b, ax2b, , axnb 的标准差为|a|s. 2.数据的直观表示 (1)柱形图 柱形图(也称为条形图)可以形象地比较各种数据之间的数量关系. (2)折线图 一般地,如果数据是随时间变化的,想了解数据的变化情况,可将数据用折线图 来表示. (3)扇形图 扇形图可以形象地表示出各部分数据在全部数据中所占的比例情况. (4)茎叶图 一般来说,茎叶图中,所有的茎都竖直排列,而叶沿水平方向排列. (5)频数、频率分布直方图 作频数、频率分布直方图的步骤 ()找出最值,计算极差:即一组数据中最大值与最小值的差; ()合理分组,确定区间:

5、根据数据的多少,一般分 59 组; ()整理数据: 逐个检查原始数据,统计每个区间内数的个数(称为区间对应的频数),并求出频 数与数据个数的比值(称为区间对应的频率),各组均为左闭右开区间,最后一组 是闭区间; ()作出有关图示: 根据上述整理后的数据,可以作出频数分布直方图与频率分布直方图,分别如图 (1)(2)所示.值得注意的是,频数分布直方图的纵坐标是频数,每一组数对应的矩 形高度与频数成正比;频率分布直图的纵坐标是频率 组距,每一组数对应的矩形高度 与频率成正比,而且每个矩形的面积等于这一组数对应的频率,从而可知频率分 布直方图中,所有矩形的面积之和为 1. 频数分布折线图和频率分布折

6、线图 作图的方法都是:把每个矩形上面一边的中点用线段连接起来.为了方便看图, 折线图都画成与横轴相交,所以折线图与横轴的左右两个交点是没有实际意义 的. 不难看出,虽然作频数分布直方图与频率分布直方图过程中,原有数据被“压缩” 了,从这两种图中也得不到所有原始数据.但是,由这两种图可以清楚地看出数 据分布的总体态势,而且也可以得出有关数字特征的大致情况.比如,估计出平 均数、中位数、百分位数、方差.当然,利用直方图估计出的这些数字特征与利 用原始数据求出的数字特征一般会有差异. 3.用样本估计总体 (1)用样本的数字特征估计总体的数字特征,如果样本的容量恰当,抽样方法又 合理的话,样本的数字特

7、征能够反映总体的数字特征. (2)用样本的分布估计总体的分布 如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多. 1.频率分布直方图与众数、中位数、平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的. (3)平均数是频率分布直方图的“重心” ,等于频率分布直方图中每个小长方形的 面积乘以小长方形底边中点的横坐标之和. 2.平均数、方差的公式推广 (1)若数据 x1,x2,xn的平均数为x ,那么 mx1a,mx2a,mx3a,mxn a 的平均数是 mx a. (2)若数据 x1,x2,xn的方差为 s2,那么 数

8、据 x1a,x2a,xna 的方差也为 s2; 数据 ax1,ax2,axn的方差为 a2s2. 3.如果一组数中,各数据值都相等,则标准差为 0,表明数据没有波动,数据没 有离散性;若各数的值与平均数的差的绝对值较大,则标准差也较大,表明数据 的波动幅度也较大,数据的离散程度较高,因此标准差(或方差)描述了数据相对 于平均数的离散程度. 诊断自测 1.判断下列结论正误(在括号内打“”或“”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.() (2)数据:68,69,71,63,70,68,69,71,69,72 的 25%分位数为 69.() (3)频率分布直方图中,小矩

9、形的面积越大,表示样本数据落在该区间的频率越 大.() (4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.() 答案(1)(2)(3)(4) 2一个容量为 32 的样本,已知某组样本的频率为 0.25,则该组样本的频数为 () A4B8C12D16 答案B 解析设频数为 n,则 n 320.25,n32 1 48. 3若某校高一年级 8 个班参加合唱比赛的得分分别为 87,89,90,91,92,93, 94,96,则这组数据的中位数和平均数分别是() A91.5 和 91.5B91.5 和 92 C91 和 91.5D92 和 92 答案A 解析这组数据由小到大排列为 87,8

10、9,90,91,92,93,94,96, 中位数是9192 2 91.5, 平均数x 8789909192939496 8 91.5. 4(2020全国卷)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天 能完成 1200 份订单的配货,由于订单量大幅增加,导致订单积压为解决困难, 许多志愿者踊跃报名参加配货工作已知该超市某日积压 500 份订单未配货,预 计第二天的新订单超过 1600 份的概率为 0.05.志愿者每人每天能完成 50 份订单 的配货,为使第二天完成积压订单及当日订单的配货的概率不小于 0.95,则至少 需要志愿者() A10 名B18 名C24 名D32 名 答案B 解

11、析由题意,第二天完成积压订单及当日订单的配货的概率不小于 0.95,即第 二天确保完成新订单 1600 份,减去超市每天能完成的 1200 份,再加上积压的 500 份,共有 16001200500900(份),至少需要志愿者 9005018(名) 5(2020全国卷)设一组样本数据 x1,x2,xn的方差为 0.01,则数据 10 x1, 10 x2,10 xn的方差为() A0.01B0.1C1D10 答案C 解析10 x1,10 x2,10 xn的方差为 1020.011.故选 C. 6(2020新高考海南卷)某中学的学生积极参加体育锻炼,其中有 96%的学生喜 欢足球或游泳,60%的学

12、生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足 球又喜欢游泳的学生数占该校学生总数的比例是() A62%B56%C46%D42% 答案C 解析如图,用 Venn 图表示该中学喜欢足球和游泳的学生所占的比例之间的关 系,设既喜欢足球又喜欢游泳的学生占该中学学生总数的比例为 x,则(60%x) (82%x)x96%,解得 x46%.故选 C. 考点一数据的数字特征 【例 1】 (1)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选手的 成绩时,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个原始评分相比,不变的数字特征是() A中位

13、数 B平均数 C方差 D极差 (2)(多选题)(2021武汉调研)甲、乙两人在一次射击比赛中各射靶 5 次,两人成绩 的统计表如下表所示, 甲乙 环数45678569 频数11111311 下列说法正确的有() A甲成绩的平均数小于乙成绩的平均数 B甲成绩的中位数等于乙成绩的中位数 C甲成绩的方差小于乙成绩的方差 D甲成绩的极差等于乙成绩的极差 答案(1)A(2)CD 解析(1)中位数是将 9 个数据从小到大或从大到小排列后,处于中间位置的数 据,因而去掉 1 个最高分和 1 个最低分,不变的是中位数,平均数、方差、极差 均受影响故选 A. (2)由表中数据,得x 甲1 5(45678)6,

14、x 乙1 5(5369)6, 所以x 甲x 乙,A 错误; 甲成绩的中位数是 6,乙成绩的中位数是 5, 所以甲成绩的中位数大于乙成绩的中位数,B 错误; s2 甲1 5(46) 2(56)2(66)2(76)2(86)22, s2 乙1 53(56) 2(66)2(96)22.4, 所以 s2 甲s 2 甲,甲更稳定,故 最佳人选应是甲 考点二数据数字特征直观表示及应用 角度 1扇形图 【例 2】某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻 番 为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前 后农村的经济收入构成比例,得到如图所示的饼图: 则下面结论中不正

15、确的是() A新农村建设后,种植收入减少 B新农村建设后,其他收入增加了一倍以上 C新农村建设后,养殖收入增加了一倍 D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 答案A 解析法一设新农村建设前经济收入为 a,则新农村建设后经济收入为 2a,则 由饼图可得新农村建设前种植收入为 0.6a,其他收入为 0.04a,养殖收入为 0.3a. 新农村建设后种植收入为 0.74a,其他收入为 0.1a,养殖收入为 0.6a,养殖收入 与第三产业收入的总和为 1.16a,所以新农村建设后,种植收入减少是错误的 法二因为 0.6 1 4,所以 正确故选 C. 6(多选题)(2021青岛调

16、研)为了解户籍、性别对生育二胎选择倾向的影响,某 地从育龄人群中随机抽取了容量为 100 的样本,其中城镇户籍与农村户籍各 50 人;男性 60 人,女性 40 人,绘制不同群体中倾向选择生育二胎与倾向选择不生 育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比 例,则下列叙述中正确的是() A是否倾向选择生育二胎与户籍有关 B是否倾向选择生育二胎与性别无关 C倾向选择生育二胎的人员中,男性人数与女性人数相同 D倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数 答案ABD 解析由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关,倾向选择 不生育二胎的人员中,农

17、村户籍人数少于城镇户籍人数,倾向选择生育二胎的人 员中, 男性人数为 6060%36, 女性人数为 4060%24, 不相同 故选 ABD. 二、填空题 7我国高铁发展迅速,技术先进经统计,在经停某站的高铁列车中,有 10 个车次的正点率为 0.97,有 20 个车次的正点率为 0.98,有 10 个车次的正点率为 0.99,则经停该站高铁列车所有车次的平均正点率的估计值为_ 答案0.98 解 析经 停 该 站 高 铁 列 车 所 有 车 次 的 平 均 正 点 率 的 估 计 值 为 x 100.97200.98100.99 102010 0.98. 8若样本数据 x1,x2,x10的标准差

18、为 8,则数据 2x11,2x21,2x10 1 的标准差为_ 答案16 解析依题意,x1,x2,x3,x10的方差 s264.则数据 2x11,2x21, 2x101 的方差为 22s22264,所以其标准差为 22642816. 9为了解本市居民的生活成本,甲、乙、丙三名同学利用假期分别对三个社区 进行了“家庭每月日常消费额”的调查 他们将调查所得到的数据分别绘制成频 率分布直方图(如图所示),记甲、乙、丙所调查数据的标准差分别为 s1,s2,s3, 则它们的大小关系为_(用“”连接) 答案s1s2s3 解析根据频率分布直方图知,甲的数据绝大部分都处在两端,离平均值较远, 表现的最分散,标

19、准差最大,乙的数据分布均匀,不如甲组中偏离平均值大,标 准差比甲的小;丙的数据大部分数都在平均值左右,数据表现的最集中,方差最 小,故 s1s2s3. 三、解答题 10共享单车入住泉州一周年以来,因其“绿色出行,低碳环保”的理念而备受 人们的喜爱,值此周年之际,某机构为了了解共享单车使用者的年龄段、使用频 率、满意度等三个方面的信息,在全市范围内发放 5000 份调查问卷,回收到有 效问卷 3125 份,现从中随机抽取 80 份,分别对使用者的年龄段、2635 岁使 用者的使用频率、2635 岁使用者的满意度进行汇总,得到如下三个表格: 表(一) 使用者 年龄段 25 岁以 下 26 岁 35

20、 岁 36 岁 45 岁 45 岁以 上 人数20401010 表(二) 使用06 次71415222331次 频率/月次/月次/月/月 人数510205 表(三) 满意度 非常满意 (910) 满意 (89) 一般 (78) 不满意 (67) 人数1510105 (1)依据上述表格完成下列三个统计图形: (2)某城区现有常住人口 30 万,请用样本估计总体的思想,估计年龄在 26 岁 35 岁之间,每月使用共享单车在 714 次的人数 解(1)补全三个统计图如图: (2)由表(1)可知:年龄在 2635 岁之间的有 40 人,占总抽取人数的一半,用样 本估计总体的思想可知, 某城区 30 万

21、人口中年龄在 2635 岁之间的约有 301 215(万人); 又年龄在 2635 岁之间每月使用共享单车在 714 次之间的有 10 人, 占总抽取 人数的1 4, 用样本估计总体的思想可知, 城区年龄在 2635 岁之间的 15 万人中每月使用共 享单车在 714 次之间的约有 151 4 15 4 (万人), 所以年龄在 2635 岁之间,每月使用共享单车在 714 次之间的约有15 4 万人 11某市民用水拟实行阶梯水价,每人月用水量中不超过 w 立方米的部分按 4 元/立方米收费,超出 w 立方米的部分按 10 元/立方米收费,从该市随机调查了 10000 位居民,获得了他们某月的用

22、水量数据,整理得到如下频率分布直方图: (1)如果 w 为整数,那么根据此次调查,为使 80%以上居民在该月的用水价格为 4 元/立方米,w 至少定为多少? (2)假设同组中的每个数据用该组区间的右端点值代替,当 w3 时,估计该市居 民该月的人均水费 解(1)如题图所示,用水量在0.5,2)的频率的和为(0.20.30.4)0.50.45, 用水量在0.5,3)的频率的和为(0.20.30.40.50.3)0.50.85. 用水量小于等于 2 立方米的频率为 0.45,用水量小于等于 3 立方米的频率为 0.85,又 w 为整数, 为使 80%以上的居民在该月的用水价格为 4 元/立方米,w

23、 至少定为 3. (2)当 w3 时,该市居民该月的人均水费估计为 (0.110.151.50.220.252.50.153)40.15340.05(3.5 3)0.05(43)0.05(4.53)107.21.81.510.5(元) 即当 w3 时,该市居民该月的人均水费估计为 10.5 元 B 级能力提升 12(多选题)(2021淄博模拟)区域经济变化影响着人口的流动,下图为过去某连 续 5 年各省、自治区及直辖市(不含港澳台)人口增长统计图 某连续 5 年各省、自治区及直辖市(不含港澳台)人口增长统计图 根据图中的信息,下面结论中正确的是() A广东人口增量最多,天津增幅最高 B黑龙江无

24、论是增量还是增幅均居末尾 C天津、北京、重庆和上海四大直辖市增幅均超过 5% D人口增量超过 200 万的省、自治区或直辖市共有 7 个 答案ABD 解析对于 A,由图知广东 5 年人口增加超过 400 万,增量最多,天津增幅达到 了 19.2%,增幅最高,A 正确;对于 B,由图易知正确;对于 C,上海的人口增 幅为 4.9%,未超过 5%,不正确;对于 D,人口增量超过 200 万的省或直辖市有 天津、北京、重庆、广东、河北、湖南和山东,正确综上,选 ABD. 13若数据 x1,x2,x3,xn的平均数x 5,方差 s22,则数据 3x11,3x2 1,3x31,3xn1 的平均数和方差分

25、别为_ 答案16,18 解析x1,x2,x3,xn的平均数为 5, x1x2x3xn n 5, 3x13x23x33xn n 1 35116, x1,x2,x3,xn的方差为 2, 3x11,3x21,3x31,3xn1 的方差是 32218. 14(2020石家庄模拟)“一带一路”是“丝绸之路经济带”和“21 世纪海上丝 绸之路”的简称某市为了了解人们对“一带一路”的认知程度,对不同年龄和 不同职业的人举办了一次“一带一路”知识竞赛,满分为 100 分(90 分及以上为 认知程度高)现从参赛者中抽取了 x 人,按年龄分成 5 组,第一组:20,25), 第二组:25,30),第三组:30,3

26、5),第四组:35,40),第五组:40,45, 得到如图所示的频率分布直方图,已知第一组有 6 人 (1)求 x; (2)求抽取的 x 人的年龄的中位数(结果保留整数); (3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法 依次抽取 6 人,42 人,36 人,24 人,12 人,分别记为 15 组,从这 5 个按年 龄分的组和 5 个按职业分的组中每组各选派 1 人参加“一带一路”知识竞赛, 分 别代表相应组的成绩,年龄组中 15 组的成绩分别为 93,96,97,94,90,职 业组中 15 组的成绩分别为 93,98,94,95,90. 分别求 5 个年龄组和 5

27、 个职业组成绩的平均数和方差; 以上述数据为依据, 评价5个年龄组和5个职业组对“一带一路”的认知程度, 并谈谈你的感想 解(1)根据频率分布直方图得第一组的频率为 0.0150.05,6 x0.05,x 120. (2)设中位数为 a,则 0.0150.075(a30)0.060.5, a95 3 32,则中位数为 32. (3)5 个年龄组成绩的平均数为 x 11 5(9396979490)94, 方差为 s 2 1 1 5(1) 2223202(4)26. 5 个职业组成绩的平均数为 x 21 5(9398949590)94,方差为 s 2 2 1 5(1) 2420212(4)26.8. 从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感 想合理即可)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中 > 数学 > 其他
版权提示 | 免责声明

1,本文(第2节 数据的数字特征及直观表示、用样本估计总体.docx)为本站会员(四川天地人教育)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|