1、=【 ;精品教育资源文库 】 = 10.4 变量间的相关关系统计案例 课 时 跟 踪 检 测 基 础 达 标 1 (2017 届南昌市第一次模拟 )为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 5 次试验,得到 5 组数据 (x1, y1), (x2, y2), (x3, y3), (x4, y4), (x5, y5)根据收集到的数据可知 x1 x2 x3 x4 x5 150,由最小二乘法求得回归直线方程为 y 0.67x 54.9,则 y1 y2 y3 y4 y5的值为 ( ) A 75 B 115.4 C 375 D 466.2 解析:由 x1 x2 x3 x4 x5 150
2、,得 x 30,代入回归直线方程 y 0.67x 54.9,得y 75,则 y1 y2 y3 y4 y5 375. 答案: C 2四名同学根据各自的样本数据研究变量 x, y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论: y 与 x 负相关且 y 2.347x 6.423; y 与 x 负相关且 y 3.476x 5.648; y 与 x 正相关且 y 5.437x 8.493; y 与 x 正相关且 y 4.326x 4.578. 其中一定不正确的结论的序号是 ( ) A B C D 解析:正相关指的是 y 随 x 的增大而增大,负相关指的是 y 随 x 的增大而减小,故不正确
3、的为 . 答案: D 3甲、乙、丙、丁四位同学各自对 A、 B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数 r 与残 差的平方和 m 如下表: 甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m 106 115 124 103 则哪位同学的试验结果体现 A、 B 两变量有更强的线性相关性 ( ) A甲 B乙 =【 ;精品教育资源文库 】 = C丙 D丁 解析:相关系数 r 越接近于 1 和残差平方 m 越小,两变量 A, B 的线性相关性越强故选 D. 答案: D 4某产品生产厂家的市场部在对 4 家商场进行调研时,获得该产品售价 x(单位:元 )和销售量 y(单位
4、:件 )之间的四组数据如下表: 售价 x 4 4.5 5.5 6 销售量 y 12 11 10 9 为决策产品的市场指导价,用最小二乘法求得销售量 y 与售价 x 之间的线性回归方程为y 1.4x a,那么方程中的 a值为 ( ) A 17 B 17.5 C 18 D 18.5 解析: x 4 4.5 5.5 64 5, y 12 11 10 94 10.5, a 10.5 1.45 17.5. 答案: B 5某考察团对 10 个城市的职工人均工资 x(千元 )与居民人均消费 y(千元 )进行调查统计,得出 y 与 x 具有线性相关关系,且回归方程为 y 0.6x 1.2.若某城市职工人均工资
5、为5 千元,估计该城市人均消费额占人均工资收入的百分比为 ( ) A 66% B 67% C 79% D 84% 解析:因为 y 与 x 具有线性相关关系,满足回归方程 y 0.6x 1.2,该城市居民人均工资为 x 5,所以可以估计该城市 的职工人均消费 y 0.65 1.2 4.2,所以可以估计该城市人均消费额占人均工资收入的百分比为 4.25 84%. 答案: D 6春节期间, “ 厉行节约,反对浪费 ” 之风悄然吹开,某市通过随机询问 100 名性别不同的居民是否能做到 “ 光盘 ” 行动,得到如下的列联表: 做不到 “ 光盘 ” 能做到 “ 光盘 ” 男 45 10 女 30 15
6、则下面的正确结论是 ( ) =【 ;精品教育资源文库 】 = A有 90%以上的把握认为 “ 该市居民能否做到 光盘 与性别有关 ” B在犯错误的概率不超过 1%的前提下,认为 “ 该市居民能否做到 光盘 与性别无关 ” C在犯错误的概率不超过 1%的前提下,认为该市居民能否做到 光盘 与性别有关 D有 90%以上的把握认为 “ 该市居民能否做到 光盘 与性别无关 ” 解析:由 22 列联表得到 a 45, b 10, c 30, d 15,则 a b 55, c d 45, a c 75, b d 25, ad 675, bc 300, n 100,计算得 K2的观测值 k 25545752
7、53.030. 因为 2.706 3.030 3.841,所以有 90%以上的把握认为 “ 该市居民能否做到 光盘 与性别有关 ” 答案: A 7某单位为了了解用电量 y 千瓦 时与气温 x 之间的关系,随机统计了某 4 天的用电量与当天气温 . 气温 / 14 12 8 6 用电量 /千瓦 时 22 26 34 38 由表中数据得线性回归方程 y a bx 中 b 2,据此预测当地气温 5 时,用电量的千瓦 时数约为 _ 解析:因为回归直线经过样本中心点,故由已知数表可得 x 10, y 30,即 (10,30)在回当线上,代入方程可得 a 50,即回归直线方程为 y 50 2x,故可预测当
8、气温为 5 时,用电量的度数约为 50 25 40. 答案: 40 8经调查某地若干户家庭的年收入 x(万元 )和年饮食支出 y(万元 )具有线性相关关系,并得到 y 关于 x 的回归直线方程: y 0.245x 0.321,由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支出平均增加 _万元 解析: x 变为 x 1, y 0.245(x 1) 0.321 0.245x 0.321 0.245,因此家庭年收入每增加 1 万元,年饮食支出平均增加 0.245 万元 答案: 0.245 9 (2017 届唐山第一次模拟 )为了研究某种细菌在特定环境下随时间变化的繁殖情况,得如下实验数据:
9、天数 t(天 ) 3 4 5 6 7 繁殖个数 y(千个 ) 2.5 3 4 4.5 6 (1)求 y 关于 t 的线性回归方程; (2)利用 (1)中的回归方程,预测 t 8 时,细菌繁殖个数 =【 ;精品教育资源文库 】 = 解: (1)由表中数据计算得, t 5, y 4, ?i 15(ti t )(yi y ) 8.5, ?i 15(ti t )2 10, b?i 15ti t yi y?i 15ti t 2 0.85, a y b t 0.25. 所以回归方程方程为 y 0.85t 0.25. (2)将 t 8 代入 (1)的回归方程中得 y 0.858 0.25 6.55. 故预测
10、 t 8 时,细菌繁殖个数为 6.55 千个 10某学生对其亲属 30 人的 饮食习惯进行了一次调查,并用下图所示的茎叶图表示 30人的饮食指数 (说明:图中饮食指数低于 70 的人,饮食以蔬菜为主,饮食指数高于 70 的人,饮食以肉类为主 ) (1)根据以上数据完成下列 22 列联表 . 主食蔬菜 主食肉类 合计 50 岁以下 50 岁以上 合计 (2)能否有 99%的把握认为其亲属的饮食习惯与年龄有关?并写出简要分析 解: (1)22 列联表如下: 主食蔬菜 主食肉类 合计 50 岁以下 4 8 12 50 岁以上 16 2 18 合计 20 10 30 (2)因 为 K2 2121820
11、10 10 6.635, 所以有 99%的把握认为其亲属的饮食习惯与年龄有关 能 力 提 升 =【 ;精品教育资源文库 】 = 1 (2018 届郑州第二次质量预测 )某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据: 单价 x(元 ) 4 5 6 7 8 9 销量 y(件 ) 90 84 83 80 75 68 由表中数据,求得线性回归方程为 y 4x a.若在这些样本点中任取一点,则它在回归直线左下方的概率为 ( ) A.16 B 13 C 12 D 23 解析:由表中数据得 x 6.5, y 80,由 y 4 x a,得 a 106,故线性回归方程
12、为 y 4x 106.将 (4,90), (5,84), (6,83), (7,80), (8,75), (9,68)分别代入回归方程可知有 6个基本事件,因 84 45 106 86,68 49 106 70,故 (5,84)和 (9,68)在回归直线的左下方,满足条件的只有 2 个,故所求概率为 26 13. 答案: B 2 (2017 届梅州一模 )在 2016 年 1 月 15 日那天,某市物价部门对本市的 5 家商场的某商品的一天销售量及其价格进行调查, 5 家商场的售价 x 元和销售量 y 件之间的一组数据如下表所示: 价格 x 9 9.5 m 10.5 11 销售量 y 11 n
13、 8 6 5 由散点图可知,销售量 y 与价格 x 之间有较强的线性相关关系,其线性回归方程是 y 3.2x 40,且 m n 20,则其中的 n _. 解析: x 9 9.5 m 10.5 115 8 m5, y 11 n 8 6 55 6 n5,回归直线一定经过样本中心 ( x , y ),即 6 n5 3.2? ?8 m5 40, 即 3.2m n 42. 又因为 m n 20,即? 3.2m n 42,m n 20, 解得 ? m 10,n 10. 答案: 10 3 (2018 届邯郸质检 )最强大脑是大型科学竞技类真人秀节目,是专注传播脑科 学知识和脑力竞技的节目某机构为了了解大学生
14、喜欢最强大脑是否与性别有关,对某校的 100 名大学生进行了问卷调查,得到如下列联表: =【 ;精品教育资源文库 】 = 喜欢最强大脑 不喜欢最强大脑 合计 男生 15 女生 15 合计 已知在这 100 人中随机抽取 1 人抽到不喜欢最强大脑的大学生的概率为 0.4. (1)请将上述列联表补充完整;判断是否有 99.9%的把握认为喜欢最强大脑与性别有关,并说明理由; (2)已知在被调查的大学生中有 5 名是大一学生,其中 3 名喜欢最 强大脑,现从这 5名大一学生中随机抽取 2 人,抽到喜欢最强大脑的人数为 X,求 X 的分布列及数学期望 下面的临界值表仅供参考: P(K2 k0) 0.15
15、 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828 参考公式: K2 n ad bc2a b c d a c b d ,其中 n a b c d 解: (1)由题意知列联表为 喜欢最强 大脑 不喜欢最强大脑 合计 男生 45 15 60 女生 15 25 40 合计 60 40 100 K2 260406040 14.06310.828 , 有 99.9%的把握认为喜欢最强大脑与性别有关 (2)X 的可能取值为 0,1,2, P(X 0) C22C25110, P(X 1) C12C13C25 35, P(X 2) C23C25310, X 的分布列为 X 0 1 2 P 110 35 310 E(X) 0