1、强化训练强化训练 11统计中的综合问题统计中的综合问题 1为确保食品安全,某市质检部门检查了 1 000 袋方便面的质量,抽查总量的 2%,在这个 问题中,下列说法正确的是() A总体是指这 1 000 袋方便面 B个体是 1 袋方便面 C样本是按 2%抽取的 20 袋方便面 D样本容量为 20 答案D 解析总体是指这 1 000 袋方便面的质量,A 中说法错误;个体是指 1 袋方便面的质量,B 中说法错误;样本是指按照 2%抽取的 20 袋方便面的质量,C 中说法错误;样本容量为 20, D 中说法正确 2总体由编号为 01,02,39,40 的 40 个个体组成利用下面的随机数表选取 5
2、个个体, 选取方法是从随机数表第 1 行的第 6 列和第 7 列数字开始由左到右依次选取两个数字,则选 出来的第 5 个个体的编号为() 5044664421660658056261655435024235489632 1452415248226622158626637541995842367224 58375218510337183911 A23B21C35D32 答案B 解析随机数表第 1 行的第 6 列和第 7 列数字为 6,4, 所以从这两个数字开始, 由左向右依次 选取两个数字如下,64,42,16,60,65,80,56,26,16,55,43,50,24,23,54,89,63,
3、21,45,其中落在编 号 01,02,39,40 内的有 16,26,24,23,21,故第 5 个编号为 21. 3设样本数据 x1,x2,x3,x19,x20的平均数和方差分别为 2 和 8,若 yi2xim(m 为非 零常数,i1,2,3,19,20),则 y1,y2,y3,y19,y20的平均数和标准差为() A2m,32B4m,4 2 C2m,4 2D4m,32 答案B 解析设样本数据 xi的平均数为 x ,方差为 s2,标准差为 s,则新样本 yi2xim 的平均数 为 2 x m,方差为 22s2,标准差为 2s,所以 y 2 x m4m,s28,所以标准差为 s 2 2,所以
4、 2s22 24 2. 4为检测某药品服用后的多长时间开始有药物反应,现随机抽取服用了该药品的 1 000 人, 其服用后开始有药物反应的时间(分钟)与人数的数据绘成的频率分布直方图如图所示若将 直方图中分组区间的中点值设为解释变量 x(分钟), 这个区间上的人数为 y(人), 易见两变量 x, y 线性相关,那么一定在其线性回归直线上的点为() A(1.5,0.10)B(2.5,0.25) C(2.5,250)D(3,300) 答案C 解析由频率分布直方图可知,第一个区间中点坐标,x11.0,y10.101 000100,第二个 区间中点坐标,x22.0,y20.211 000210,第三个
5、区间中点坐标,x33.0,y30.301 000 300, 第四个区间中点坐标, x44.0, y40.391 000390, 则 x 1 4(x 1x2x3x4)2.5, y 1 4(y 1y2y3y4)250,则一定在其线性回归直线上的点为( x , y )(2.5,250) 5(多选)每年的台风都对泉州地区的渔业造成较大的经济损失某保险公司为此开发了针对 渔船的险种,并将投保的渔船分为,两类,两类渔船的比例如图所示经统计,2019 年 ,两类渔船的台风遭损率分别为 15%和 5%.2020 年初,在修复遭损船只的基础上,对 类渔船中的 20%进一步改造保险公司预估这些经过改造的渔船 20
6、20 年的台风遭损率将降 为 3%,而其他渔船的台风遭损率不变假设投保的渔船不变,则下列叙述中错误的是() A2019 年投保的渔船的台风遭损率为 10% B2019 年所有因台风遭损的投保的渔船中,类渔船所占的比例不超过 80% C预估 2020 年类渔船的台风遭损率会小于类渔船的台风遭损率的两倍 D预估 2020 年经过进一步改造的渔船因台风遭损的数量少于类渔船因台风遭损的数量 答案ABC 解析设全体投保的渔船为 t 艘.2019 年投保的渔船的台风遭损率为 60%15%40%5% 11%,故 A 错;2019 年所有因台风遭损的投保的渔船中,类渔船所占的比例为 60%15% 60%15%
7、40%5% 9 11 8 10,故 B 错;预估 2020 年类渔船的台风遭损率为 20%3% 80%15%12.6%25%,故 C 错;预估 2020 年经过进一步改造的渔船因台风遭损的数量 t60%20%3%少于类渔船因台风遭损的数量 t40%5%,故 D 正确 6(多选)某产品的广告费用 x 与销售额 y 的统计数据如下表: 广告费用 x(万元)23456 销售额 y(万元)1925343844 根据上表可得线性回归方程为y 6.3xa ,下列说法错误的是() A回归直线y 6.3xa 必经过样本点(2,19),(6,44) B这组数据的样本点中心( x , y )未必在回归直线y 6.
8、3xa 上 C回归系数 6.3 的含义是广告费用每增加 1 万元,销售额实际增加 6.3 万元 D据此模型预报广告费用为 7 万元时销售额为 50.9 万元 答案ABC 解析回归直线y 6.3xa ,不一定经过任何一个样本点,故 A 错;由最小二乘法可知,这 组数据的样本点中心( x , y )一定在回归直线y 6.3xa 上,故 B 错;回归系数 6.3 的含义 是广告费用每增加 1 万元,预测销售额增加 6.3 万元,故 C 错; x 1 5(23456)4, y 1 5(1925343844)32,将(4,32)代入y 6.3xa 可得a 6.8,则回归方程为y 6.3x 6.8,当 x
9、7 时,y 6.376.850.9,故 D 正确 7 登山族为了了解某山高 y(km)与气温 x()之间的关系, 随机统计了 4 次山高与相应的气温, 并制作了对照表: 气温 x()1813101 山高 y(km)24343864 由表中数据,得到线性回归方程y 2xa (a R),由此估计出山高为 72(km)处的气温为 _ . 答案6 解析由题意可得 x 10,y40,所以a y 2 x 4021060,所以y 2x60, 当y 72 时,2x6072,解得 x6. 8检测 600 个某产品的质量(单位:g),得到的频率分布直方图中,前三组的长方形的高度 成等差数列,后三组所对应的长方形的
10、高度成公比为 0.5 的等比数列,已知检测的质量在 100.5105.5 之间的产品数为 150,则质量在 115.5120.5 的长方形高度为_ 答案 1 60 解析由题意知, 产品质量在 100.5105.5 之间的频率为150 600 1 4, 则前 3 个矩形的面积和为 3 4, 后两个矩形的面积和为1 4.设中间矩形的面积为 x,则后两个矩形的面积为 1 2x, 1 4x,则 1 2x 1 4x 1 4,所以 x 1 3,最后一个矩形的面积为 1 12,所以长方形的高度为 1 60. 9已知一组数据 10,5,4,2,2,2,x,且这组数据的平均数与众数的和是中位数的 2 倍,则 x
11、 所 有可能的取值为_ 答案11 或 3 或 17 解析由题意可得这组数据的平均数为1054222x 7 25x 7 , 众数为 2,若 x2,可得25x 7 24,可得 x11; 若 2x4,则中位数为 x,可得 2x25x 7 2,可得 x3; 若 x4,则中位数为 4,可得 2425x 7 2,可得 x17. 10某一电视台对年龄高于 40 岁和不高于 40 岁的人是否喜欢西班牙队进行调查,40 岁以上 调查了 50 人,不高于 40 岁调查了 50 人,所得数据制成如下列联表: 不喜欢西班牙队喜欢西班牙队总计 40 岁以上pq50 不高于 40 岁153550 总计ab100 已知工作
12、人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为3 5,则有超过 _的把握认为年龄与西班牙队的被喜欢程度有关 参考公式与临界值表:K2 nadbc2 abcdacbd. P(K2k0)0.150.100.050.0250.0100.0050.001 k02.0722.7063.8415.0246.6357.87910.828 答案95% 解析设“从所有人中任意抽取一个取到喜欢西班牙队的人”为事件 A, 由已知得 P(A)q35 100 3 5, 所以 p25,q25,a40,b60, K210025352515 2 40605050 25 6 4.1673.841, 故有超过 95%
13、的把握认为年龄与西班牙队的被喜欢程度有关 11成都是全国闻名的旅游城市,有许多很有特色的旅游景区某景区为了提升服务品质, 对过去 100 天每天的游客数进行了统计分析, 发现这 100 天每天的游客数都没有超出八千人, 统计结果见下面的频率分布直方图: (1)估计该景区每天游客数的中位数和平均数; (2)为了研究每天的游客数是否和当天的最高气温有关,从这一百天中随机抽取了 5 天,统计 出这 5 天的游客数(千人)分别为 0.8,3.7,5.1,5.6,6.8,已知这 5 天的最高气温()依次为 8,18,22,24,28. ()根据以上数据,求游客数 y 关于当天最高气温 x 的线性回归方程
14、(系数保留一位小数); ()根据()中的回归方程, 估计该景区这 100 天中最高气温在 2026 内的天数(保留整数) 参考公式:由最小二乘法所得回归直线的方程是y b xa ; 其中,b 错误错误!错误错误!,a y b x . 参考数据:错误错误!(xi x )(yi y )70,错误错误!(xi x )2232. 解(1)左边三个矩形的面积之和为 0.32,左边四个矩形的面积之和大于 0.5,故中位数在第 四个矩形中, 所以中位数为 30.18 0.2413.75. 平均数为 0.50.071.50.092.50.163.50.244.50.185.50.146.50.07 7.50.
15、053.82, 所以,该景区这一百天中每天游客数的中位数约为 3 750 人,平均数约为 3 820 人 (2)() x 20, y 4.4,b 70 2320.3,a y b x 4.40.3201.6, 所以y 0.3x1.6. ()当最高气温在 2026 内时, 当 x20 时,y 0.3201.64.4; 当 x26 时,y 0.3261.66.2. 根据y 0.3x1.6 得游客数在 4.46.2 内, 直方图中这个范围内方块的面积为(54.4)0.180.14(6.26)0.070.262, 天数为 0.26210026, 所以,这 100 天中最高气温在 2026 内的天数约为
16、26 天 12在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应 或开始呈现该疾病对应的相关症状的这一阶段称为潜伏期各种传染疾病的潜伏期不同,数 小时、数天、甚至数月不等某市疾病预防控制中心统计了该市 200 名传染病患者的相关信 息,得到如下表格: 潜伏期(单位:天)0,2(2,4(4,6(6,8(8,10(10,12(12,14 人数174360502631 (1)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,根据上表数据将 如下列联表补充完整,并根据列联表判断是否有 99%的把握认为该传染病的潜伏期与患者年 龄有关 潜伏期6 天潜伏期6 天总计
17、 50 岁以上(含 50 岁)100 50 岁以下55 总计200 (2)将 200 名患者的潜伏期超过 6 天的频率视为该市每名患者潜伏期超过 6 天发生的概率,每 名患者的潜伏期是否超过 6 天相互独立为了深入研究,该市疾病预防控制中心随机调查了 该地区 30 名患者,其中潜伏期超过 6 天的人数为 X,求随机变量 X 的均值和方差 附: P(K2k0)0.050.0250.010 k03.8415.0246.635 K2 nadbc2 abcdacbd,其中 nabcd. 解(1)由题意得列联表: 潜伏期6 天潜伏期6 天总计 50 岁以上(含 50 岁)7525100 50 岁以下45
18、55100 总计12080200 由上表可得 K220075552545 2 12080100100 18.756.635, 所以有 99%的把握认为该传染病的潜伏期与患者年龄有关 (2)由题意可知,一名患者潜伏期超过 6 天的概率为 P 80 200 2 5, 随机变量服从 XB 30,2 5 , 所以 E(X)302 512. D(X)302 5 12 5 36 5 . 13如图是 2020 年 2 月 15 日至 3 月 2 日武汉市新冠肺炎新增确诊病例的折线统计图则下 列说法不正确的是() A武汉市新冠肺炎疫情防控取得了阶段性的成果,但防控要求不能降低 B2020 年 2 月 19 日
19、武汉市新增新冠肺炎确诊病例大幅下降至三位数 C2020 年 2 月 15 日到 3 月 2 日武汉市新冠肺炎新增确诊病例最多的一天比最少的一天多 1 549 人 D2020 年 2 月 19 日至 3 月 2 日武汉市新增新冠肺炎确诊病例低于 400 人的有 8 天 答案C 解析由折线图数据分析得知 ABD 正确,1 6901111 579,故 C 不正确 14邢台市物价部门对市区的天一城、北国商城、恒大城、家乐园、中北世纪城 5 家商场的 某件商品在 7 月 15 号一天销售量及其价格进行调查,5 家商场的售价 x 元和销售量 y 件之间 的一组数据如下表所示: 售价 x8.59m1111.
20、5 销售量 y12n675 已知销售量 y 与售价 x 之间有较强的线性相关关系,其线性回归方程是y 3.2x40,且 m n20,则其中的 m_. 答案10 解析依题意得 x 40m 5 , y 30n 5 , 代入线性回归方程得30n 5 3.240m 5 40, 根据题意知 mn20, 解组成的方程组得 mn10. 15已知一组数据丢失了其中一个,另外六个数据分别是 10,8,8,11,16,8,若这组数据的平均 数、中位数、众数依次成等差数列,则丢失数据的所有可能值的和为() A12B20C25D27 答案D 解析设这个数字是 x,则平均数为61x 7 ,众数是 8, 若 x8,则中位数为 8,此时 x5, 若 8xE(Y),所以该县城选择购买一台甲款垃圾处理机器更划算