(2022高考数学一轮复习(步步高))第3节 变量间的相关关系与统计案例.doc

上传人(卖家):四川天地人教育 文档编号:1654805 上传时间:2021-08-15 格式:DOC 页数:24 大小:683.50KB
下载 相关 举报
(2022高考数学一轮复习(步步高))第3节 变量间的相关关系与统计案例.doc_第1页
第1页 / 共24页
(2022高考数学一轮复习(步步高))第3节 变量间的相关关系与统计案例.doc_第2页
第2页 / 共24页
(2022高考数学一轮复习(步步高))第3节 变量间的相关关系与统计案例.doc_第3页
第3页 / 共24页
亲,该文档总共24页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第第 3 节节变量间的相关关系与变量间的相关关系与统计案例统计案例 考试要求1.了解样本相关系数的统计含义,了解样本相关系数与标准化数据变 量间的关系,会通过相关系数比较多组成对数据的相关性;2.了解一元线性回归 模型的含义,了解模型参数的统计意义,了解最小二乘法原理,掌握一元线性回 归模型参数的最小二乘法估计方法,会使用相关的统计软件,会用一元线性回归 模型进行预测;3.理解 22 列联表的统计意义,了解 22 列联表独立性检验及 其应用. 知 识 梳 理 1.相关关系与回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关 性的常用统计图是:散点图;统计量有相关系

2、数与相关指数. (1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关 系,我们将它称为正相关. (2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称 为负相关. (3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性 相关关系. 2.线性回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最 小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2), (xn,yn),其回归方程为y b xa _,则b n i1 (xix )(yiy ) n i1 (xix )2

3、 n i1xiyinx y n i1x 2 inx 2 , a y b x .其中,b 是回归方程的斜率,a 是在 y 轴上的截距. 回归直线一定过样本点的中心(x ,y ). 3.回归分析 (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn, yn),其中(x ,y )称为样本点的中心. (3)相关系数 当 r0 时,表明两个变量正相关; 当 rR22,故较大者为 R21. 答案 R21 考点一相关关系的判断 【例 1】(1)下列四个散点图中, 变量 x 与 y 之间具有负的线性相关关系的

4、是() (2)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相 等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线 y1 2x1 上, 则这组样本数据的样本相关系数为() A.1B.0C.1 2 D.1 解析(1)观察散点图可知, 只有 D 选项的散点图表示的是变量 x 与 y 之间具有负 的线性相关关系.故选 D. (2)完全的线性关系,且为负相关,故其相关系数为1,故选 A. 答案(1)D(2)A 规律方法判断相关关系的两种方法: (1)散点图法:如果样本点的分布从整体上看大致在某一曲线附近,变量之间就有 相关关系;如果样本点的分布

5、从整体上看大致在某一直线附近,变量之间就有线 性相关关系. (2)相关系数法:利用相关系数判定,|r|越趋近于 1,相关性越强. 【训练 1】 在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组 样本数据,并制成如图所示的人体脂肪含量与年龄的关系的散点图,下列结论中 正确的是_(填序号). 人体脂肪含量与年龄正相关,且脂肪含量的中位数等于 20%; 人体脂肪含量与年龄正相关,且脂肪含量的中位数小于 20%; 人体脂肪含量与年龄负相关,且脂肪含量的中位数等于 20%; 人体脂肪含量与年龄负相关,且脂肪含量的中位数小于 20%. 解析观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中

6、位数小于 20%. 答案 考点二回归分析多维探究 角度 1线性回归方程及应用 【例 21】 (2020长沙统考)某互联网公司为了确定下一季度的前期广告投入计 划,收集了近 6 个月广告投入量 x(单位:万元)和收益 y(单位:万元)的数据如下 表: 月份123456 广告投入量/万元24681012 收益/万元14.2120.3131.831.1837.8344.67 他们用两种模型y b xa ,yaebx分别进行拟合,得到相应的回归方程并进 行残差分析,得到如图所示的残差图及一些统计量的值: x y 6 i1xiyi 6 i1x 2 i 7301 464.24364 (1)根据残差图,比较

7、模型,的拟合效果,应选择哪个模型?并说明理由. (2)残差绝对值大于 2 的数据被认为是异常数据,需要剔除: ()剔除异常数据后,求出(1)中所选模型的回归方程; ()广告投入量 x18 时,(1)中所选模型收益的预报值是多少? 附:对于一组数据(x1,y1),(x2,y2),(xn,yn),其回归直线y b xa 的斜率和 截距的最小二乘估计分别为:b n i1 (xix )(yiy ) n i1 (xix )2 n i1xiyinx y n i1x 2 inx 2 ,a y b x . 解(1)应该选择模型,因为模型的残差点比较均匀地落在水平的带状区域 中,且模型的带状区域比模型的带状区域

8、窄,所以模型的拟合精度高,回 归方程的预报精度高. (2)()剔除异常数据,即 3 月份的数据后,得 x 1 5(766)7.2, y 1 5(30631.8)29.64. 5 i1xiyi1 464.24631.81 273.44, 5 i1x 2 i36462328. b 5 i1xiyi5x y 5 i1x 2 i5x 2 1 273.4457.229.64 32857.27.2 206.4 68.8 3, a y b x 29.6437.28.04. 所以 y 关于 x 的回归方程为y 3x8.04. ()把 x18 代入()中所求回归方程得y 3188.0462.04, 故预报值为

9、62.04 万元. 角度 2非线性回归方程及应用 【例 22】某公司为确定下一年度投入某种产品的宣传费, 需了解年宣传费 x(单 位:千元)对年销售量 y(单位:t)和年利润 z(单位:千元)的影响,对近 8 年的年宣 传费 xi和年销售量 yi(i1,2,8)数据作了初步处理,得到下面的散点图及一 些统计量的值. x y w 8 i1 (xix )2 8 i1 (wiw )2 8 i1 (xix )(yi y ) 8 i1 (wi w )(yiy ) 46.65636.8289.81.61 469108.8 表中 wi xi,w 1 8 8 i1wi. (1)根据散点图判断, yabx 与

10、ycdx哪一个适宜作为年销售量 y 关于年宣 传费 x 的回归方程类型(给出判断即可,不必说明理由)? (2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程; (3)已知这种产品的年利润 z 与 x,y 的关系为 z0.2yx.根据(2)的结果回答下列 问题: 年宣传费 x49 时,年销售量及年利润的预报值是多少? 年宣传费 x 为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线 vu 的斜率 和截距的最小二乘估计分别为: n i1 (uiu )(viv ) n i1 (uiu )2 , v u . 解(1)由散点图可以判

11、断,ycdx适宜作为年销售量 y 关于年宣传费 x 的回 归方程类型. (2)令 w x,先建立 y 关于 w 的线性回归方程,由于 d 8 i1 (wiw )(yiy ) 8 i1 (wiw )2 108.8 1.6 68, c y d w 563686.8100.6, 所以 y 关于 w 的线性回归方程为y 100.668w,因此 y 关于 x 的回归方程为y 100.668 x. (3)由(2)知,当 x49 时,年销售量 y 的预报值 y 100.668 49576.6, 年利润 z 的预报值z 576.60.24966.32. 根据(2)的结果知,年利润 z 的预报值 z 0.2(1

12、00.668 x)xx13.6 x20.12. 所以当 x13.6 2 6.8,即 x46.24 时,z 取得最大值. 故年宣传费为 46.24 千元时,年利润的预报值最大. 规律方法1.对于非线性回归分析问题,应先进行变量代换, 求出代换后的回归 直线方程,再求非线性回归方程. 2.回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于 1 时,两变量的 线性相关性越强. 【训练 2】 (2020广州模拟)某班的健康调查小组从所在学校共选取 15 名男同学, 其年龄、身高和体重数据如表所示(本题中身高单位:cm,体重单位:kg). 年龄(身高,体重)年龄(身高,体重) 15 (154,4

13、8),(161,65),(168, 64) 18 (166,64),(168,72),(182, 74) 16 (158,50),(162,59),(175, 80) 19 (160,51),(172,68),(178, 90) 17 (161,60),(167,62),(173, 68) 根据表中数据,设计了两种方案预测学生身高.方案:建立平均体重与年龄的线 性回归模型,表中各年龄的体重按三名同学的平均体重计算,数据整理如下表: i12345 年龄 ti1516171819 平均体重 si596363.37069.7 方案:建立平均体重与平均身高的线性回归模型,将所有数据按身高重新分成 6

14、组:153,158),158,163),163,168),168,173),173,178),178,183, 并将每组的平均身高依次折算为 155,160,165,170,175,180,各组的体重按 平均体重计算,数据整理如下表. i123456 平均身高 xi155160165170175180 平均体重 yi485763687482 (1)用方案预测 20 岁男同学的平均体重和用方案预测身高 168 cm 的男同学的 平均体重,你认为哪个更合理?请给出理由; (2)请根据方案建立平均体重 y 与平均身高 x 的线性回归方程 yb xa (数据精 确到 0.001). 附:b n i1

15、(xix )(yiy ) n i1 (xix )2 n i1xiyinx y n i1x 2 inx 2 ,a y b x , 6 i1xiyi66 225, 6 i1x 2 i 168 775,x 335 2 ,y 196 3 . 解(1)对比两种方案,用方案预测身高 168 cm 的男同学的平均体重更合理. 因为身高和体重的相关关系强于年龄与体重的相关关系. (2)b 6 i1xiyi6x y 6 i1x 2 i6x 2 66 2256335 2 196 3 168 7756 335 2 2 1.291, 又因为(x ,y )在回归直线上, 所以a y b x 196 3 1.291335

16、 2 150.909. 故平均体重 y 与平均身高 x 的线性回归方程为 y 1.291x150.909. 考点三独立性检验 【例 3】 (2020日照模拟)某企业生产的某种产品被检测出其中一项质量指标存在 问题.该企业为了检查生产该产品的甲、乙两条流水线的生产情况,随机地从这两 条流水线上生产的大量产品中各抽取 50 件产品作为样本, 测出它们的这一项质量 指标值.若该项质量指标值落在(195,210内,则为合格品,否则为不合格品.甲流 水线样本的频数分布表和乙流水线样本的频数分布直方图如下: 甲流水线样本的频数分布表 质量指标值频数 (190,1959 (195,20010 (200,20

17、517 (205,2108 (210,2156 乙流水线样本频率分布直方图 (1)根据乙流水线样本频率分布直方图,估计乙流水线生产产品的该项质量指标值 的中位数; (2)若将频率视为概率,某个月内甲、乙两条流水线均生产了 5 000 件产品,则甲、 乙两条流水线分别生产出不合格品约多少件? (3)根据已知条件完成下面 22 列联表,并回答是否有 85%的把握认为“该企业 生产的这种产品的该项质量指标值与甲、乙两条流水线的选择有关”? 甲生产线乙生产线合计 合格品 不合格品 合计 附: P(K2k0)0.150.100.050.0250.0100.0050.001 k02.0722.7063.8

18、415.0246.6357.87910.828 参考公式:K2 n(adbc)2 (ab)(cd)(ac)(bd), 其中 nabcd. 解(1)设乙流水线生产产品的该项质量指标值的中位数为 x, 因为(0.0120.0320.052)50.480.5 (0.0120.0320.0520.076)50.86, 则(0.0120.0320.052)50.076(x205)0.5, 解得 x3 900 19 . (2)由甲、乙两条流水线各抽取的 50 件产品可得: 甲流水线生产的不合格品有 15 件, 则甲流水线生产的产品为不合格品的概率为 P甲15 50 3 10; 乙流水线生产的产品为不合格品

19、的概率为 P乙(0.0120.028)51 5. 于是,若某个月内甲、乙两条流水线均生产了 5 000 件产品,则甲、乙两条流水 线生产的不合格品件数分别为 5 000 3 101 500,5 000 1 51 000. (3)22 列联表: 甲生产线乙生产线合计 合格品354075 不合格品151025 合计5050100 则 K2100(35104015) 2 50507525 4 31.32.072. 所以没有 85%的把握认为“该企业生产的这种产品的该项质量指标值与甲、乙两 条流水线的选择有关”. 规律方法1.在 22 列联表中,如果两个变量没有关系,则应满足 adbc0.|ad bc

20、|越小,说明两个变量之间关系越弱;|adbc|越大,说明两个变量之间关系越 强. 2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检 验的一般步骤: (1)根据样本数据制成 22 列联表: (2)根据公式 K2 n(adbc)2 (ab)(ac)(bd)(cd)计算 K 2的观测值 k; (3)比较观测值 k 与临界值的大小关系,作统计推断. 【训练 3】 为了判断高中三年级学生是否选修文科与性别的关系, 现随机抽取 50 名学生,得到如下 22 列联表: 理科文科 男1310 女720 已知 P(K23.841)0.05,P(K25.024)0.025.根据表中数据,

21、得到 K2的观测值 k50(1320107) 2 23272030 4.844.则认为选修文科与性别有关系出错的可能性 为_. 解析K2的观测值 k4.844,这表明小概率事件发生.根据假设检验的基本原理, 应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性 约为 5%. 答案5% A 级基础巩固 一、选择题 1.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确 的是() A.r2r40r3r1B.r4r20r1r3 C.r4r20r3r1D.r2r40r10,r30,图(2)与图(4)是负相关, 故 r20,r40,且图(1)与图(2)的样本点集中在一

22、条直线附近,因此 r2r40r3r1, 故选 A. 答案A 2.(组合选择题)有下列说法: 在残差图中, 残差点比较均匀地落在水平的带状区 域内,说明选用的模型比较合适;用相关指数 R2来刻画回归的效果,R2值越接 近于 1,说明模型的拟合效果越好;比较两个模型的拟合效果,可以比较残差 平方和的大小,残差平方和越小的模型,拟合效果越好.正确的是() A.B.C.D. 答案D 3.如表是 22 列联表: y x y1y2总计 x1a2173 x222527 总计b46 则表中 a,b 处的值分别为() A.94,96B.52,50C.52,54D.54,52 解析由 22 列联表知 a2173,

23、 a2b, 解得 a52, b54. 答案C 4.为考察高中生的性别与是否喜欢数学课程之间的关系, 利用 22 列联表进行检 验,经计算 K2的观测值 k7.069,参考下表,则认为“性别与是否喜欢数学课程 有关”犯错误的概率不超过() P(K2k0)0.1000.0500.0250.0100.001 k02.7063.8415.0246.63510.828 A.0.001B.0.01 C.0.99D.0.999 解析k7.0696.635,对照表格,则认为“性别与是否喜欢数学课程有关”犯 错误的概率不超过 0.01.故选 B. 答案B 5.(2020长沙调研)已知变量 x,y 之间的线性回归

24、方程为y 0.7x10.3,且变量 x,y 之间的一组相关数据如下表所示,则下列说法错误的是() x681012 y6m32 A.变量 x,y 之间呈负相关关系 B.可以预测,当 x20 时,y 3.7 C.m4 D.该回归直线必过点(9,4) 解析由0.70,得变量 x,y 之间呈负相关关系,故 A 正确;当 x20 时,y 0.72010.33.7,故 B 正确;由表格数据可知x 1 4(681012)9, y 1 4(6m32) 11m 4 ,则11m 4 0.7910.3,解得 m5,故 C 错;由 m5,得y 6532 4 4,所以该回归直线必过点(9,4),故 D 正确.故选 C.

25、 答案C 二、填空题 6.(多填题)某市居民 20152019 年家庭年平均收入 x(单位:万元)与年平均支出 y(单位:万元)的统计资料如下表所示: 年份20152016201720182019 收入 x11.512.11313.315 支出 y6.88.89.81012 根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与年平 均支出有_相关关系(填“正”或“负”). 解析中位数是 13.由相关性知识, 根据统计资料可以看出, 当年平均收入增多时, 年平均支出也增多,因此两者之间具有正相关关系. 答案13正 7.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到如下数据: 天

26、数 x/天34567 繁殖个数y/万个2.5344.5c 若已知回归直线方程为y 0.85x0.25,则表中 c 的值为_. 解析x 34567 5 5,y 2.5344.5c 5 14c 5 ,代入回归直线方程 中,得14c 5 0.8550.25,所以 c6. 答案6 8.某医疗研究所为了检验某种血清预防感冒的作用,把 500 名使用血清的人与另 外 500 名未使用血清的人一年中的感冒记录作比较,提出假设 H0:“这种血清不 能起到预防感冒的作用”,利用 22 列联表计算得 K23.918,经查临界值表知 P(K23.841)0.05.则下列结论中,正确结论的序号是_. 有 95%的把握

27、认为“这种血清能起到预防感冒的作用”;若某人未使用该血 清,那么他在一年中有 95%的可能性得感冒;这种血清预防感冒的有效率为 95%;这种血清预防感冒的有效率为 5%. 解析K23.9183.841,而 P(K23.814)0.05,所以有 95%的把握认为“这种 血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防 感冒的有效率是没有关系的,不是同一个问题,不要混淆. 答案 三、解答题 9.某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理 得到了第 x 年与年销售量 y(单位:万件)之间的关系如下表: x1234 y12284256 (1)在图中画出表

28、中数据的散点图; (2)根据散点图选择合适的回归模型拟合 y 与 x 的关系(不必说明理由); (3)建立 y 关于 x 的回归方程,预测第 5 年的销售量. 参考公式:回归直线 x 的斜率和截距的最小二乘估计分别为 b n i1 (xix )(yiy ) n i1 (xix )2 n i1xiyinx y n i1x 2 inx 2 ,a y b x . 解(1)作出的散点图如图: (2)根据散点图观察,可以用线性回归模型拟合 y 与 x 的关系. (3)观察(1)中散点图可知各点大致分布在一条直线附近,列出表格: ixiyix2ixiyi 1112112 2228456 33429126

29、445616224 1013830418 可得x 5 2,y 69 2 , 所以b 4 i1xiyi4x y 4 i1x 2 i4x 2 41845 2 69 2 304 5 2 2 73 5 , a y b x 69 2 73 5 5 22. 故回归直线方程为y 73 5 x2. 当 x5 时,y 73 5 5271. 故预测第 5 年的销售量大约为 71 万件. 10.某城市地铁将于 2020 年 6 月开始运营,为此召开了一个价格听证会,拟定价 格后又进行了一次调查,随机抽查了 50 人,他们的收入与态度如下: 月收入(单 位:百元) 15,25)25,35)35,45)45,55)55

30、,65)65, 75 赞成定价 者人数 123534 认为价格偏 高者人数 4812521 (1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价 者”与“认为价格偏高者”的月平均收入的差距是多少(结果保留 2 位小数); (2)由以上统计数据填下面 22 列联表,分析是否有 99%的把握认为“月收入以 55 百元为分界点对地铁定价的态度有差异”. 月收入不低于 55 百元的人数 月收入低于 55 百元的人数 总计 认为价格偏高者 赞成定价者 总计 附:K2 n(adbc)2 (ab)(cd)(ac)(bd) 解(1)“赞成定价者”的月平均收入为 x120130240350

31、5603704 123534 50.56. “认为价格偏高者”的月平均收入为 x22043084012505602701 4812521 38.75, “赞成定价者”与“认为价格偏高者”的月平均收入的差距是 x1x250.56 38.7511.81(百元). (2)根据条件可得 22 列联表如下: 月收入不低于 55 百元的人数 月收入低于 55 百元的人数 总计 认为价格偏高者32932 赞成定价者71118 总计104050 K250(311729) 2 10401832 6.276.635, 没有 99%的把握认为“月收入以 55 百元为分界点对地铁定价的态度有差异”. B 级能力提升

32、11.(2019黄山一模)在吸烟与患肺癌这两个分类变量的独立性检验的计算中, 下列 说法正确的是() A.若 K2的观测值为 k6.635,在犯错误的概率不超过 0.01 的前提下认为吸烟与 患肺癌有关系,那么在 100 个吸烟的人中必有 99 人患有肺癌 B.由独立性检验可知,在犯错误的概率不超过 0.01 的前提下认为吸烟与患肺癌有 关系时,我们说某人吸烟,那么他有 99%的可能患有肺癌 C.若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关 系,是指有 1%的可能性使得判断出现错误 D.以上三种说法都不正确 解析独立性检验得出的结论是带有概率性质的, 只能说结论成立

33、的概率有多大, 而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这 点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解 释.若从统计量中求出在犯错误的概率不超过 0.01 的前提下认为吸烟与患肺癌有 关系,是指有 1%的可能性使得判断出现错误.故选 C. 答案C 12.(多选题)(2020淄博调研)某城市收集并整理了该市 2019 年 1 月份至 10 月份各 月最低气温与最高气温(单位:)的数据,绘制了下面的折线图. 已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下 列结论正确的是() A.最低气温与最高气温为正相关 B.10 月

34、的最高气温不低于 5 月的最高气温 C.月温差(最高气温减最低气温)的最大值出现在 1 月 D.最低气温低于 0 的月份有 4 个 解析在 A 中,最低气温与最高气温为正相关,故 A 正确; 在 B 中,10 月的最高气温不低于 5 月的最高气温,故 B 正确; 在 C 中,月温差(最高气温减最低气温)的最大值出现在 1 月,故 C 正确; 在 D 中,最低气温低于 0 的月份有 3 个,故 D 错误. 答案ABC 13.在一组样本数据(x1,y1),(x2,y2),(x6,y6)的散点图中,若所有样本点(xi, yi)(i1,2,6)都在曲线 ybx21 2附近波动.经计算 6 i1xi12

35、, 6 i1yi14, 6 i1x 2 i 23,则实数 b 的值为_. 解析令 tx2, 则曲线的回归方程变为线性的回归方程, 即 ybt1 2, 此时t 6 i1x 2 i 6 23 6 ,y 6 i1yi 6 14 6 ,代入 ybt1 2,得 14 6 b23 6 1 2,解得 b 17 23. 答案 17 23 14.(2020天津和平区调研)某地级市共有 200 000 名中小学生,其中有 7%的学生 在 2017 年享受了“国家精准扶贫”政策, 在享受“国家精准扶贫”政策的学生中 困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为 532, 为进一步帮助这些学生,当地

36、市政府设立“专项教育基金”,对这三个等次的困 难学生每年每人分别补助 1 000 元、1 500 元、2 000 元.经济学家调查发现,当地 人均可支配收入较上一年每增加 n%,一般困难的学生中有 3n%会脱贫,脱贫后 将不再享受“国家精准扶贫”政策,很困难的学生中有 2n%转为一般困难,特别 困难的学生中有 n%转为很困难.现统计了该地级市 2013 年到 2017 年共 5 年的人 均可支配收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值, 其中年份 x 取 13 时代表 2013 年,x 与 y(万元)近似满足关系式 yC12C2x,其中 C1,C2为常数(2013 年至 2

37、019 年该市中小学生人数大致保持不变). y k 5 i1 (kik )2 5 i1 (yiy )2 5 i1 (xix )(yiy ) 5 i1 (xix )(kik ) 2.31.23.14.621 其中 kilog2yi,k 1 5 5 i1ki. (1)估计该市 2018 年人均可支配收入; (2)求该市 2018 年的“专项教育基金”的财政预算大约为多少. 附:对于一组具有线性相关关系的数据(u1,v1),(u2,v2),(un,vn),其回 归 直 线 方 程 v u 的 斜 率 和 截 距 的 最 小 二 乘 估 计 分 别 为 n i1 (uiu )(viv ) n i1 (

38、uiu )2 , v u . 2 0.7 2 0.3 20.121.721.821.9 0.60.81.13.23.53.73 解(1)因为x 1 5(1314151617)15,所以 5 i1 (xix )2(2)2(1)2 02122210. 由 klog2y 得 klog2C1C2x, 所以 C2 5 i1 (xix )(kik ) 5 i1 (xix )2 1 10, log2C1k C2x 1.2 1 10150.3, 所以 C12 0.30.8,所以 y0.82x 10. 当 x18 时,y0.821.80.83.52.8(万元). 即该市 2018 年人均可支配收入为 2.8 万

39、元. (2)由题意知 2017 年时该市享受“国家精准扶贫”政策的学生有 200 0007% 14 000 人, 一般困难、很困难、特别困难的中学生依次有 7 000 人、4 200 人、2 800 人,2018 年人均可支配收入比 2017 年增长0.82 1.80.821.7 0.821.7 20.110.110%, 所以 2018 年该市特别困难的中学生有 2 800(110%)2 520 人. 很困难的的学生有 4 200(120%)2 80010%3 640 人, 一般困难的学生有 7 000(130%)4 20020%5 740 人. 所以 2018 年的“专项教育基金”的财政预算

40、大约为 5 7401 0003 6401 500 2 5202 00016 240 000(元)1 624(万元). C 级创新猜想 15.(多选题)某运动制衣品牌为了成衣尺寸更精准, 现选择 15 名志愿者, 对其身高 和臂展进行测量(单位:厘米),上图为选取的 15 名志愿者身高与臂展的折线图, 下图为身高与臂展所对应的散点图,并求得其回归方程为y 1.16x30.75,以下 结论正确的为() A.15 名志愿者身高的极差小于臂展的极差 B.15 名志愿者身高和臂展成正相关关系 C.可估计身高为 190 厘米的人臂展大约为 189.65 厘米 D.身高相差 10 厘米的两人臂展都相差 11

41、.6 厘米 解析对于 A,身高极差小于 20,臂展极差大于等于 20,故 A 正确;对于 B, 很明显根据散点图以及回归方程得到,身高矮展臂就会短一些,身高高一些,展 臂就会长一些,故 B 正确;对于 C,身高为 190 厘米,代入回归方程可得展臂等 于 189.65 厘米,但不是准确值,故 C 正确;对于 D,身高相差 10 厘米的两人展 臂的估计值相差 11.6 厘米,但不是准确值,回归方程上的点并不都是准确的样本 点,故 D 错误. 答案ABC 16.(多填题)从某居民区随机抽取 10 个家庭,获得第 i 个家庭的月收入 xi(单位:千 元)与月储蓄 yi(单位:千元)的数据资料,计算得

42、 10 i1xi80, 10 i1yi20, 10 i1xiyi184, 10 i1x 2 i720.已知家庭的月储蓄 y 关于月收入 x 的线性回归方程为y b xa , 则变量 x 与 y_(填“正相关”或“负相关”);若该居民区某家庭月收入 7 千元, 预测该家庭月储蓄_千元. 解析由题意,知 n10,x 1 10 10 i1xi 80 108, y 1 10 10 i1yi 20 102, b 10 i1xiyi10 x y 10 i1x 2 i10 x 2 1841082 7201082 0.3, a y b x 20.380.4, y 0.3x0.4. 0.30,变量 x 与 y 正相关. 当 x7 时,y 0.370.41.7(千元). 答案正相关1.7

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高中 > 数学 > 高考专区 > 一轮复习
版权提示 | 免责声明

1,本文((2022高考数学一轮复习(步步高))第3节 变量间的相关关系与统计案例.doc)为本站会员(四川天地人教育)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|