1、9.1随机抽样、用样本估计总体随机抽样、用样本估计总体 考试要求1.理解随机抽样的必要性和重要性,会用简单随机抽样方法从总体中抽取样本, 了解分层抽样和系统抽样的方法.2.会用样本的频率分布估计总体分布,会用样本的基本数字 特征估计总体的基本数字特征,理解用样本估计总体的思想 1随机抽样 (1)简单随机抽样:一般地,设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为 样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫 做简单随机抽样 (2)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层 独立地抽取一定数量的个体,将各
2、层取出的个体合在一起作为样本,这种抽样方法是一种分 层抽样 2用样本的频率分布估计总体分布 (1)在频率分布直方图中, 纵轴表示频率/组距, 数据落在各小组内的频率用各小长方形的面积 表示各小长方形的面积的总和等于 1. (2)频率分布折线图和总体密度曲线 频率分布折线图: 连接频率分布直方图中各小长方形上端的中点, 就得到频率分布折线图 总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折 线图会越来越接近于一条光滑曲线,即总体密度曲线 (3)茎叶图 茎是指中间的一列数,叶是从茎的旁边生长出来的数 3用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数
3、最多的数 (2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数, 则中间两数的平均数是中位数 (3)平均数: x x1x2xn n ,反映了一组数据的平均水平 (4)标准差:是样本数据到平均数的一种平均距离,s 1 nx 1 x 2x2 x 2xn x 2 . (5)方差:s21 n(x 1 x )2(x2 x )2(xn x )2(xn是样本数据,n 是样本容量, x 是 样本平均数) 微思考 1三种抽样方法有什么共同点和联系? 提示(1)抽样过程中每个个体被抽取的机会均等 (2)系统抽样中在起始部分抽样时采用简单随机抽样;分层抽样中各层抽样时采用简单随机抽 样
4、或系统抽样 2平均数、标准差与方差反映了数据的哪些特征? 提示平均数反映了数据取值的平均水平,标准差、方差反映了数据对平均数的波动情况, 即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定 题组一思考辨析 1判断下列结论是否正确(请在括号中打“”或“”) (1)简单随机抽样中,每个个体被抽到的机会不一样,与先后有关() (2)分层抽样中,每个个体被抽到的可能性与层数及分层有关() (3)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论() (4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变() 题组二教材改编 2某公司有员工 500 人
5、,其中不到 35 岁的有 125 人,3549 岁的有 280 人,50 岁以上的有 95 人,为了调查员工的身体健康状况,从中抽取 100 名员工,则应在这三个年龄段分别抽取 人数为() A33,34,33B25,56,19 C20,40,30D30,50,20 答案B 解析设在不到 35 岁的员工中抽取 x 人,则100 500 x 125,所以 x25,同理可得这三个年龄段 抽取人数分别为 25,56,19. 3某射击小组有 20 人,教练将他们某次射击的数据绘制成如下表格,则这组数据的众数和 中位数分别是() 环数5678910 人数127631 A7,7B8,7.5 C7,7.5D8
6、,6 答案C 解析从表中数据可知 7 环有 7 人,人数最多,所以众数是 7; 中位数是将数据从小到大排列,第 10 个与第 11 个数据的平均数,第 10 个数是 7,第 11 个 数是 8,所以中位数是78 2 7.5. 4如图是 100 位居民月均用水量的频率分布直方图,则月均用水量在2,2.5)范围内的居民有 _人 答案25 解析0.50.510025. 题组三易错自纠 5已知一组数据的频率分布直方图如图,则众数是_,平均数是_ 答案6567 解析因为最高小长方形中点的横坐标为 65, 所以众数为 65; 平均数 x (550.030650.040750.015850.010950.0
7、05)1067. 6若数据 x1,x2,x3,xn的平均数 x 5,方差 s22,则数据 3x11,3x21,3x31, 3xn1 的平均数和方差分别为_ 答案16,18 解析x1,x2,x3,xn的平均数为 5, x1x2x3xn n 5, 3x13x23x33xn n 135116, x1,x2,x3,xn的方差为 2, 3x11,3x21,3x31,3xn1 的方差是 32218. 题型一 抽样方法 1(2020吉安模拟)总体由编号为 00,01,02,48,49 的 50 个个体组成,利用下面的随机数 表选取 6 个个体, 选取方法是从随机数表第 6 行的第 9 列和第 10 列数字开
8、始从左到右依次选 取两个数字,则选出的第 3 个个体的编号为() 附:第 6 行至第 9 行的随机数表如下: 2635 7900 3370 9160 1620 3882 7757 4950 3211 4919 7306 4916 7677 8733 9974 6732 2748 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 A33B16C38D20 答案D 解析按随机数法, 从随机数表第 6 行的第 9 列和第 10 列数字开始从左到右依次选取两个数 字,超出 49 及重复的不选,则编号依次
9、为 33,16,20,38,49,32,则选出的第 3 个个体的编 号为 20,故选 D. 2用简单随机抽样的方法从含有 10 个个体的总体中,抽取一个容量为 3 的样本,其中某一 个体 a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是() A. 1 10, 1 10 B. 3 10, 1 5 C.1 5, 3 10 D. 3 10, 3 10 答案A 解析在抽样过程中, 个体a每一次被抽中的概率是相等的, 因为总体容量为10, 故个体a“第 一次被抽到”的可能性与“第二次被抽到”的可能性均为 1 10.故选 A. 3为了调查城市 PM2.5的情况,按地域把 48 个城市分成大型、中
10、型、小型三组,相应的城 市数分别为 24,16,8.若用分层抽样的方法抽取 12 个城市,则应抽取的中型城市数为() A3B4C5D6 答案B 解析根据分层抽样的特点可知,抽样比为12 48 1 4,则应抽取的中型城市数为 16 1 44. 思维升华 (1)简单随机抽样是分层抽样的基础,是一种等概率的抽样,由定义应抓住以下特 点:它要求总体个数较少;它是从总体中逐个抽取的;它是一种不放回的抽样.(2)分层 抽样适用于总体中个体差异较大的情况. 题型二 统计图表及应用 命题点 1扇形图 例 1 (2018全国)某地区经过一年的新农村建设, 农村的经济收入增加了一倍, 实现翻番 为 更好地了解该地
11、区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入 构成比例,得到如下饼图: 则下面结论中不正确的是() A新农村建设后,种植收入减少 B新农村建设后,其他收入增加了一倍以上 C新农村建设后,养殖收入增加了一倍 D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 答案A 解析设新农村建设前,农村的经济收入为 a,则新农村建设后,农村的经济收入为 2a.新农 村建设前后,各项收入的对比如下表: 新农村建设前新农村建设后新农村建设后变化情况结论 种植收入60%a37%2a74%a增加A 错 其他收入4%a5%2a10%a增加了一倍以上B 对 养殖收入30%a30%2a
12、60%a增加了一倍C 对 养殖收入第 三产业收入 (30% 6%)a 36%a (30% 28%)2a 116%a 超过经济收入 2a 的一半D 对 故选 A. 命题点 2折线图 例 2 下面两个图是 2020 年 6 月 25 日由国家卫健委发布的全国疫情累计趋势图, 每图下面横 向标注日期,纵向标注累计数量现存确诊为存量数据,计算方法为:累计确诊数累计死 亡数累计治愈数 则下列对新冠肺炎叙述错误的是() A自 1 月 20 日以来一个月内,全国累计确诊病例属于快速增长时期 B自 4 月份以来,全国累计确诊病例增速缓慢,疫情扩散势头基本控制 C自 6 月 16 日至 24 日以来,全国每日现
13、存确诊病例平缓增加 D自 6 月 16 日至 24 日以来,全国每日现存确诊病例逐步减少 答案D 解析由图 1 可知 A,B 均正确;由图 2 数据计算得 16 日的现存确诊病例为 84 86779 926 4 645296,同理可计算 18,20,22,24 日现存确诊分别为 346,383,441,473. 命题点 3茎叶图 例 3 如图所示的茎叶图记录了甲,乙两组各 5 名工人某日的产量数据(单位:件)若这两组 数据的中位数相等,且平均数也相等,则 x 和 y 的值分别为() A3,5B5,5C3,7D5,7 答案A 解析甲组数据的中位数为 65,由甲,乙两组数据的中位数相等,得 y5.
14、又甲、乙两组数 据的平均数相等, 1 5(5665627470 x) 1 5(5961676578),x3.故选 A. 命题点 4频率分布直方图 例 4 (2020天津)从一批零件中抽取 80 个,测量其直径(单位:mm),将所得数据分为 9 组: 5.31,5.33),5.33,5.35),5.45,5.47),5.47,5.49,并整理得到如下频率分布直方图,则 在被抽取的零件中,直径落在区间5.43,5.47内的个数为() A10B18C20D36 答案B 解析因为直径落在区间5.43,5.47内的频率为 0.02(6.255.00)0.225, 所以个数为 0.2258018. 思维升
15、华 (1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系 (2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相 等时间间隔下数据的趋势 (3)由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似它优于频率分 布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于 记录和表示其缺点是当样本容量较大时,作图较烦琐 (4)准确理解频率分布直方图的数据特点: 频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据 是各组的频率,不要和条形图混淆 频率分布直方图中各小长方形的面积之和为 1,这是解
16、题的关键,常利用频率分布直方图 估计总体分布 跟踪训练 (1)由于受疫情的影响,学校停课,同学们通过三种方式在家自主学习,现学校想 了解同学们对假期学习方式的满意程度,收集如图 1 所示的数据;教务处通过分层抽样的方 法抽取 4%的同学进行满意度调查,得到的数据如图 2.下列说法错误的是() A样本容量为 240 B若 m50,则本次自主学习学生的满意度不低于四成 C总体中对方式二满意的学生约为 300 人 D样本中对方式一满意的学生为 24 人 答案B 解析选项 A,样本容量为 6 0004%240,该选项正确;选项 B,根据题意得自主学习的 满意率为6003001 250 6 000 0.
17、3580.4,该选项错误;选项 C,样本可以估计总体,但会有一 定的误差,总体中对方式二满意人数约为 1 50020%300,该选项正确;选项 D,样本中 对方式一满意人数为 2 0004%30%24,该选项正确 (2)(2021贵阳模拟)某网站为了了解某“跑团”每月跑步的平均里程, 收集并整理了 2019 年 1 月至 2019 年 11 月期间该“跑团”每月跑步的平均里程(单位:公里)的数据,绘制了下面的 折线图根据折线图,下列结论正确的是() A月跑步平均里程的中位数为 6 月份对应的里程数 B月跑步平均里程逐月增加 C月跑步平均里程高峰期大致在 8,9 月份 D1 月至 5 月的月跑步
18、平均里程相对于 6 月至 11 月波动性更小,变化比较平稳 答案D 解析由折线图可知月跑步平均里程比 6 月份高的只有 9,10,11,共 3 个月,比 6 月份低的有 1,2,3,4,5,7,8,共 7 个月,故 6 月份对应里程数不是中位数,因此 A 不正确 ; 月跑步平均里程在 1 月到 2 月,6 月到 7 月,7 月到 8 月,10 月到 11 月都是减少的,故不是 逐月增加,因此 B 不正确; 月跑步平均里程高峰期大致在 9,10,11 三个月,8 月份是相对较低的,因此 C 不正确; 从折线图来看, 1 月至 5 月的跑步平均里程相对于 6 月至 11 月, 波动性更小, 变化比
19、较平稳, 因此 D 正确 (3)(2020成都模拟)如图是某赛季甲、乙两名篮球运动员 9 场比赛所得分数的茎叶图,则下列 说法错误的是() A甲所得分数的极差为 22 B乙所得分数的中位数为 18 C两人所得分数的众数相等 D甲所得分数的平均数低于乙所得分数的平均数 答案D 解析甲所得分数的极差为 331122,A 正确;乙所得分数的中位数为 18,B 正确;甲所 得分数的众数为 22,乙所得分数的众数为 22,C 正确,故选 D. (4)如图是某班 50 名学生期中考试数学成绩的频率分布直方图,其中成绩分组区间为40,50), 50,60),60,70),70,80),80,90),90,1
20、00,则图中 x 的值为_ 答案0.018 解析由题图可知纵轴表示频率 组距, 故 x0.10.0540.0100.00630.018. 题型三 用样本的数字特征估计总 体的数字特征 1(2019全国)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选手的成绩时, 从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个原 始评分相比,不变的数字特征是() A中位数B平均数 C方差D极差 答案A 解析记 9 个原始评分分别为 a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知 e 为 7 个有效评分与 9 个原始评分的中位数,故
21、不变的数字特征是中位数,故选 A. 2某项测试成绩满分为 10 分,现随机抽取 30 名学生参加测试,得分情况如图所示,假设得 分值的中位数为 me,平均数为 x ,众数为 m0,则() Amem0 x Bmem0 x Cmem0 x Dm0me5.5, 所以 m0mes 2 甲, 甲更稳定,故最佳人选应是甲 思维升华 (1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似 值实际应用时,需先计算样本数据的平均数,分析平均水平,再计算方差(标准差)分析稳 定情况(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准 差);另一方面,可以从图形直观分析
22、样本数据的分布情况,大致判断平均数的范围,并利用 数据的波动性大小比较方差(标准差)的大小 课时精练课时精练 1要完成下列两项调查:(1)某社区有 100 户高收入家庭,220 户中等收入家庭,80 户低收 入家庭,从中抽取 100 户调查购买力的某项指标;(2)从某中学高二年级的 10 名体育特长生 中抽取 3 人调查学习负担情况应采取的抽样方法是() A(1)(2)都用简单随机抽样法 B(1)用分层抽样法,(2)用简单随机抽样法 C(1)用简单随机抽样法,(2)用分层抽样法 D(1)(2)都用分层抽样法 答案B 解析(1)中收入差距较大,采用分层抽样法较合适;(2)中总体容量较小,采用简单
23、随机抽样 法较合适 2某中学有高中生 3 500 人,初中生 1 500 人,为了解学生的学习情况,用分层抽样的方法 从该校学生中抽取一个容量为 n 的样本,已知从高中生中抽取 70 人,则 n 为() A100B150C200D250 答案A 解析方法一由题意可得 70 n70 3 500 1 500,解得 n100. 方法二由题意,得抽样比为 70 3 500 1 50,总体容量为 3 5001 5005 000,故 n5 000 1 50 100. 3(2021四川双流中学检测)某调研机构随机调查了 2020 年某地区 n 名业主物业费的缴费情 况,发现缴费金额(单位:万元)都在区间0.
24、5,1.1内,其频率分布直方图如图所示,若第五组 的频数为 32,则样本容量 n 等于() A200B400C800D1 600 答案B 解析根据频率分布直方图,第五组的频率为 0.80.10.08, 又第五组的频数为 32,所以样本容量为 n 32 0.08400. 4.如图是某样本数据的茎叶图,则该样本的中位数、众数、极差分别是() A323432B334535 C344532D333635 答案B 解析从茎叶图中知共 16 个数据,按照从小到大排序后中间的两个数据为 32,34,所以这组 数据的中位数为 33; 45 出现的次数最多,所以这组数据的众数为 45; 最大值是 47,最小值是
25、 12,故极差是 35. 5(多选)下表为 2020 年某煤炭公司 110 月份的煤炭生产量: 月份12345678910 产量(单位:万吨)23252417.517.52126293027 则下列结论正确的是() A极差为 12.5 万吨 B平均数为 24 万吨 C中位数为 24 万吨 D众数为 17.5 万吨 答案ABD 解析将表格中的数据由小到大排列依次为 17.5,17.5,21,23,24,25,26,27,29,30. 极差为 3017.512.5(万吨),A 正确; 平均数为17.522123242526272930 10 24(万吨),B 正确; 中位数为2524 2 24.5
26、(万吨),C 错误; 众数为 17.5(万吨),D 正确 6(多选)(2021江苏省南通市启东中学模拟)某学校为了调查学生在一周生活方面的支出情 况,抽出了一个容量为 n 的样本,其频率分布直方图如图所示,其中支出在50,60)元的学生 有 60 人,则下列说法正确的是() A样本中支出在50,60)元的频率为 0.03 B样本中支出不少于 40 元的人数为 132 Cn 的值为 200 D若该校有 2 000 名学生,则一定有 600 人支出在50,60)元 答案BC 解析样本中支出在50,60)元的频率为 1(0.010.0240.036)100.3,故 A 错误;样本 中支出不少于 40
27、 元的人数为0.036 0.03 6060132,故 B 正确; n60 0.3200,故 n 的值为 200,故 C 正确; 若该校有 2 000 名学生,则可能有 0.32 000600 人支出在50,60)元,故 D 错误 7若数据 x1,x2,xn的平均数为 x ,方差为 s2,则 2x13,2x23,2xn3 的平均 数和方差分别为_ 答案2 x 3 和 4s2 解析方法一平均数为1 n(2x 132x232xn3)1 n2(x 1x2xn)3n2 x 3;方差为1 n(2x 13)(2 x 3)2(2x23)(2 x 3)2(2xn3)(2 x 3)2 1 n4(x 1 x )24
28、(x2 x )24(xn x )24s2. 方法二原数据乘以 2 加上 3 得到一组新数据,则由平均数、方差的性质可知得到的新数据 的平均数和方差分别是 2 x 3 和 4s2. 8(2021惠州调研)某高校调查了 320 名学生每周的自习时间(单位:小时)制成了下图所示的 频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20,(20,22.5, (22.5,25,(25,27.5,(27.5,30根据频率分布直方图,这 320 名学生中每周的自习时间不足 22.5 小时的人数是_ 答案72 解析由频率分布直方图可得,320 名学生中每周的自习时间不足 22.5 小
29、时的人数是 320(0.020.07)2.572(人) 9某校为了解学生的身体素质情况,采用按年级分层抽样的方法,从高一、高二、高三学生 中抽取一个 300 人的样本进行调查,已知高一、高二、高三学生人数之比为 k54,抽取 的样本中高一学生为 120 人,则 k 的值为_ 答案6 解析由题意可知,120 300 k k54,解得 k6. 10(2019江苏)已知一组数据 6,7,8,8,9,10,则该组数据的方差是_ 答案 5 3 解析数据 6,7,8,8,9,10 的平均数是6788910 6 8,则方差是410014 6 5 3. 11如图,从参加环保知识竞赛的学生中抽出 60 名,将其
30、成绩(均为整数)整理后画出的频率 分布表和频率分布直方图如下,回答下列问题: 分组人数频率 39.5,49.5)a0.10 49.5,59.5)9x 59.5,69.5)b0.15 69.5,79.5)180.30 79.5,89.5)15y 89.5,99.530.05 合计601.00 (1)分别求出 a,b,x,y 的值,并补全频率分布直方图; (2)估计这次环保知识竞赛的平均分 解(1)a6,b9,x0.15,y0.25, 补全频率分布直方图如图 (2)用组中值估计平均分: 4450.154.50.1564.50.1574.50.384.50.2594.50.0570.5. 故这次环保
31、知识竞赛的平均分约为 70.5. 12(2020西安质检)某中学举行电脑知识竞赛,现将参赛学生的成绩进行整理后分成五组绘 制成如图所示的频率分布直方图 (1)求参赛学生的成绩的众数、中位数; (2)求参赛学生的平均成绩 解(1)因为频率分布直方图中最高小长方形所在的区间的中点值为 65,所以众数为 65, 又因为第一个小长方形的面积为 0.3, 第二个小长方形的面积为 0.4,0.30.40.5 ,所以中位数在第二组, 设中位数为 x,则 0.3(x60)0.040.5, 解得 x65, 所以中位数为 65. (2)依题意, 可得平均成绩为(550.03650.04750.015850.010
32、950.005)1067, 所以参赛学生的平均成绩为 67 分 13某校高二年级共有 800 名学生参加了数学测验(满分 150 分),已知这 800 名学生的数学 成绩均不低于 90 分,将这 800 名学生的数学成绩分组为90,100),100,110),110,120), 120,130),130,140),140,150),得到的频率分布直方图如图所示,则下列说法中正确的序 号是_ a0.045; 这 800 名学生中数学成绩在 110 分以下的人数为 160; 这 800 名学生数学成 绩的中位数约为 121.4;这 800 名学生数学成绩的平均数为 125. 答案 解析由题意得(0
33、.0050.010.010.0150.025a)101,解得 a0.035,错;110 分以下的人数为(0.010.01)10800160,正确;120 分以下的频率是(0.010.01 0.025)100.45,设中位数为 x,则x120 10 0.005 0.035,x121.4,正确;平均分为 950.1 1050.11150.251250.351350.151450.05120,错 14气象意义上从春季进入夏季的标志为:连续 5 天每天日平均温度不低于 22 .现有甲、 乙、丙三地连续 5 天的日平均温度的记录数据(记录数据都是正整数,单位: ) 甲地:5 个数据的中位数为 24,众数
34、为 22; 乙地:5 个数据的中位数为 27,平均数为 24; 丙地:5 个数据中有一个数据是 32,平均数为 26,方差为 10.2. 则肯定进入夏季的地区有_个 答案2 解析甲地肯定进入夏季,因为众数为 22,所以 22 至少出现两次,若有一天低于 22 , 则中位数不可能为 24;丙地肯定进入,10.25(3226)2(26x)2,所以 15(26x)2, 所以 x22 不成立;乙地不一定进入,如 13,23,27,28,29,肯定进入夏季的地区有 2 个 15汽车的“燃油效率”是指汽车每消耗 1 升汽油行驶的里程,下图描述了甲、乙、丙三辆 汽车在不同速度下的燃油效率情况下列叙述中正确的
35、是() A消耗 1 升汽油,乙车最多可行驶 5 千米 B以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多 C甲车以 80 千米/小时的速度行驶 1 小时,消耗 10 升汽油 D某城市机动车最高限速 80 千米/小时相同条件下,在该市用丙车比用乙车更省油 答案D 解析对于 A,由图象可知当速度大于 40 km/h 时,乙车的燃油效率大于 5 km/L,所以当速 度大于 40 km/h 时,消耗 1 升汽油,乙车的行驶距离大于 5 km,故 A 错误;对于 B,由图象 可知当速度相同时,甲车的燃油效率最高,即当速度相同时,消耗 1 升汽油,甲车的行驶路 程最远,所以以相同速度行驶相同路程,三辆车
36、中,甲车消耗汽油最少,故 B 错误;对于 C, 由图象可知当速度为 80 km/h 时,甲车的燃油效率为 10 km/L,即甲车行驶 10 km 时,耗油 1 升,故行驶 1 小时,路程为 80 km,燃油为 8 升,故 C 错误;对于 D,由图象可知当速度 小于 80 km/h 时,丙车的燃油效率大于乙车的燃油效率,所以用丙车比用乙车更省油,故 D 正确 16某工厂甲、乙两名工人参加操作技能培训现分别从他们在培训期间参加的若干次测试 成绩中随机抽取 8 次,数据如下(单位:分): 甲9582888193798478 乙8375808090859295 (1)请你计算这两组数据的平均数、中位数
37、; (2)现要从中选派一人参加操作技能比赛,从统计学的角度考虑,你认为选派哪名工人参加合 适?请说明理由 解(1) x 甲1 8(9582888193798478)85(分), x 乙1 8(8375808090859295)85(分) 甲、乙两组数据的中位数分别为 83 分,84 分 (2)由(1)知 x 甲 x 乙85 分, 所以 s2 甲1 8(9585) 2(8285)2(7885)235.5, s2 乙1 8(8385) 2(7585)2(9585)241.从平均数看,甲、乙均为 85 分,平均水 平相同; 从中位数看,乙的中位数大于甲的中位数,乙的成绩好于甲; 从方差来看,因为 x 甲 x 乙,s2甲s2乙,所以甲的成绩较稳定; 从数据特点看,获得 85 分以上(含 85 分)的次数,甲有 3 次,而乙有 4 次,故乙的成绩好 些; 从数据的变化趋势看,乙后几次的成绩均高于甲,且呈上升趋势,因此乙更具潜力 综上分析可知,甲的成绩虽然比乙稳定,但从中位数、获得好成绩的次数及发展势头等方面 分析,乙具有明显优势,所以应派乙参赛更有望取得好成绩