2022年旧高考(人教版)数学一轮教学案:第九章第四讲 变量间的相关关系、统计案例 (含解析).doc

上传人(卖家):小豆芽 文档编号:1305596 上传时间:2021-04-20 格式:DOC 页数:13 大小:394.50KB
下载 相关 举报
2022年旧高考(人教版)数学一轮教学案:第九章第四讲 变量间的相关关系、统计案例 (含解析).doc_第1页
第1页 / 共13页
2022年旧高考(人教版)数学一轮教学案:第九章第四讲 变量间的相关关系、统计案例 (含解析).doc_第2页
第2页 / 共13页
2022年旧高考(人教版)数学一轮教学案:第九章第四讲 变量间的相关关系、统计案例 (含解析).doc_第3页
第3页 / 共13页
2022年旧高考(人教版)数学一轮教学案:第九章第四讲 变量间的相关关系、统计案例 (含解析).doc_第4页
第4页 / 共13页
2022年旧高考(人教版)数学一轮教学案:第九章第四讲 变量间的相关关系、统计案例 (含解析).doc_第5页
第5页 / 共13页
点击查看更多>>
资源描述

1、第四讲第四讲 变量间的相关关系、统计案例变量间的相关关系、统计案例 知识梳理 双基自测 知 识 梳 理 知识点一 回归分析 (1)相关关系:当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关 系叫做相关关系与函数关系不同,相关关系是一种_非确定性关系_ (2)散点图:表示具有_相关_关系的两个变量的一组数据的图形叫做散点图,它可直观 地判断两变量的关系是否可以用线性关系表示 若这些散点有 y 随 x 增大而增大的趋势, 则称 两个变量_正相关_;若这些散点有 y 随 x 增大而减小的趋势,则称两个变量_负相关_ (3)回归方程:y b xa ,其中b n i1xiyin x y

2、n i1x 2 in x 2 ,a _ yb x _,它主要用来估计和预 测取值,从而获得对这两个变量之间整体关系的了解 (4)相关系数:r n i1xiyin x y n i1x 2 in x 2 n i1y 2 in y 2 它主要用于相关量的显著性检验,以衡量它们之间的线性相关程度当 r0 时表示两个 变量正相关,当 r0 时表示两个变量负相关|r|越接近 1,表明两个变量的线性相关性_越强 _;当|r|接近 0 时,表明两个变量间几乎不存在相关关系,相关性_越弱_ 知识点二 独立性检验 (1)22 列联表 设 X,Y 为两个分类变量,它们的取值分别为x1,x2和y1,y2,其样本频数列

3、联表(22 列联表)如下: y1 y2 总计 x1 a b ab x2 c d cd 总计 ac bd abcd (2)独立性检验 利用随机变量 K2(也可表示为 X2) nadbc2 abcdacbd(其中 nabcd 为样本容量)来判断“两个变量有关系”的 方法称为独立性检验 (3)独立性检验的一般步骤 根据样本数据列出 22 列联表; 计算随机变量 K2的观测值 k,查表确定临界值 k0: 如果 kk0, 就推断“X 与 Y 有关系”, 这种推断犯错误的概率不超过 P(K2k0); 否则, 就认为在犯错误的概率不超过 P(K2k0)的前提下不能推断“X 与 Y 有关” 归 纳 拓 展 1

4、回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线 性分布时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义根据 回归方程进行预报,仅是一个预报值,而不是真实发生的值 2 独立性检验是对两个变量的关系的可信程度的判断, 而不是对其是否有关系的判断 根 据 K2的值可以判断两个分类变量有关的可信程度,并用来指导科研和实际生活 双 基 自 测 题组一 走出误区 1判断下列结论是否正确(请在括号中打“”或“”) (1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系( ) (2)两个随机变量的线性相关性越强,相关系数的绝对值越接近于 0( )

5、(3)只有两个变量有相关关系,所得到的回归模型才有预测价值( ) (4)某同学研究卖出的热饮杯数 y 与气温 x()之间的关系,得回归方程y 2.352x 147.767,则气温为 2 时,一定可卖出 143 杯热饮( ) (5)事件 x,y 关系越密切,则由观测数据计算得到的 K2的观测值越大( ) (6)由独立性检验可知, 在犯错误的概率不超过 1%的前提下认为物理成绩优秀与数学成绩 有关,某人数学成绩优秀,则他有 99%的可能物理优秀( ) 题组二 走进教材 2(P97T2)为调查中学生近视情况,测得某校男生 150 名中有 80 名近视,在 140 名女生 中有 70 名近视在检验这些

6、学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力 ( C ) A回归分析 B均值与方差 C独立性检验 D概率 解析 “近视”与“性别”是两类变量,其是否有关,应用独立性检验判断 3(P81例 1)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 5 次试验根据收集到的数据(如下表),由最小二乘法求得回归方程y 0.67x54.9 零件数 x(个) 10 20 30 40 50 加工时间 y(min) 62 75 81 89 现发现表中有一个数据看不清,请你推断出该数据的值为_68_ 解析 由 x 30,得 y0.673054.975 设表中的“模糊数字”为 a, 则 62

7、a758189755,a68 题组三 走向高考 4(2017 山东高考)为了研究某班学生的脚长 x(单位:厘米)和身高 y(单位:厘米)的关系, 从该班随机抽取 10 名学生,根据测量数据的散点图可以看出 y 与 x 之间有线性相关关系,设 其回归直线方程为y b xa ,已知 10 i1xi225, 10 i1yi1 600,b 4该班某学生的脚长为 24, 据此估计其身高为( C ) A160 B163 C166 D170 解析 由题意知y 4xa 又 x 22.5, y 160,因此 16022.54a ,a70,因此y4x70,当 x24 时, y 42470166,故选 C 5 (2

8、019 高考全国卷)某商场为提高服务质量, 随机调查了 50 名男顾客和 50 名女顾客, 每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表: 满意 不满意 男顾客 40 10 女顾客 30 20 (1)分别估计男、女顾客对该商场服务满意的概率; (2)能否有 95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K2 nadbc2 abcdacbd P(K2k) 0.050 0.010 0.001 k 3.841 6.635 10.828 解析 (1)由调查数据,男顾客中对该商场服务满意的比率为40 500.8, 因此男顾客对该商场服务满意的概率的估计值为 0.8 女顾客中对

9、该商场服务满意的比率为30 500.6, 因此女顾客对该商场服务满意的概率的估计值为 0.6 (2)由题可得 K210040203010 2 50507030 4.762 由于 4.7623.841,故有 95%的把握认为男、女顾客对该商场服务的评价有差异 考点突破 互动探究 考点一 相关关系的判断自主练透 例 1 (1)(2021 四川资阳模拟)在一次对人体脂肪含量和年龄关系的研究中,研究人 员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图根据该图, 下列结论中正确的是( B ) A人体脂肪含量与年龄正相关,且脂肪含量的中位数等于 20% B人体脂肪含量与年龄正相关,且

10、脂肪含量的中位数小于 20% C人体脂肪含量与年龄负相关,且脂肪含量的中位数等于 20% D人体脂肪含量与年龄负相关,且脂肪含量的中位数小于 20% (2)对四组数据进行统计,获得以下关于其相关系数的比较,正确的是( A ) Ar2r40r3r1 Br4r20r1r3 Cr4r20r3r1 Dr2r40r1r3 解析 (1)观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于 20%, 故选 B (2)由相关系数的定义及散点图所表达的含义,可知 r2r40r3r1故选 A 名师点拨 判断两个变量正、负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左

11、上角到右下 角,两个变量负相关 (2)相关系数:r0 时,正相关;r0 时,负相关 (3)线性回归直线方程中:b 0 时,正相关;b 0 时负相关 考点二 线性回归分析师生共研 例 2 (1)(2021 湖湘名校教育联合体联考)2020 年 3 月 15 日, 某市物价部门对 5 家商 场的某商品一天的销售量及其价格进行调查,5 家商场的售价 x(元)和销售量 y(件)之间的一组 数据如表所示: 价格 x 9 9.5 10 10.5 11 销售量 y 11 10 8 6 5 按公式计算,y 与 x 的回归直线方程是:y 3.2xa,相关系数|r|0.986,则下列说法 不正确 的是( D )

12、A变量 x,y 线性负相关且相关性较强 Ba 40 C当 x8.5 时,y 的估计值为 12.8 D相应于点(10.5,6)的残差约为 0.4 (2)(2020 全国)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增 加为调查该地区某种野生动物的数量,将其分成面积相近的 200 个地块,从这些地块中用 简单随机抽样的方法抽取 20 个作为样区,调查得到样本数据(xi,yi)(i1,2,20),其中 xi 和 yi分别表示第 i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得 i1 20 xi 60, i1 20 yi1 200, i1 20 (xi x )280,

13、 i1 20 (yi y )29 000, i1 20 (xi x )(y i y )800 求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动 物数量的平均数乘以地块数); 求样本(xi,yi)(i1,2,20)的相关系数(精确到 0.01); 根据现有统计资料,各地块间植物覆盖面积差异很大为提高样本的代表性以获得该 地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由 附:相关系数 r i1 n xi x y i y i1 n xi x 2 i1 n yi y 2 , 21.414 解析 (1)对 A,由表可知 y 随 x 增大而减少,可

14、认为变量 x,y 线性负相关,且相关性 强,故 A 正确对 B,价格平均 x 1 5(99.51010.511)10,销售量 y 1 5(11108 65)8故回归直线恒过定点(10,8),故 83.210a a40,故 B 正确对 C,当 x8.5 时,y 3.28.54012.8,故 C 正确对 D,相应于点(10,8)的残差约为e6( 3.210.540)0.4,故 D 不正确故选 D (2)样区野生动物平均数为 1 20 i1 20 yi 1 201 20060, 地块数为 200,该地区这种野生动物的估计值为 2006012 000 样本(xi,yi)的相关系数为 r i1 20 x

15、i x y i y i1 20 xi x 2 i1 20 yi y 2 800 809 000 2 2 3 0.94 由于各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样, 先将植物覆盖面积按优中差分成三层,在各层内按比例抽取样本,在每层内用简单随机抽样 方法抽取样本即可 名师点拨 线性回归分析问题的类型及解题方法 (1)求线性回归方程: 利用公式,求出回归系数b ,a 待定系数法:利用回归直线过样本点中心求系数 (2)利用回归方程进行预测: 把回归直线方程看作一次函数,求函数值 (3)利用回归直线判断正、负相关:决定正相关还是负相关的是系数b 变式训练 1 (2021 安

16、徽六校教育研究会素质测试)某商场近 5 个月的销售额和利润额如表所示: 销售额 x/千万元 3 5 6 7 9 利润额 y/百万元 1 3 3 4 5 (1)画出散点图,观察散点图,说明两个变量有怎样的相关关系; (2)求出利润额 y 关于销售额 x 的回归直线方程; (3)当销售额为 4 千万元时,利用(2)的结论估计该商场的利润额(百万元) b i1 n xiyin x y i1 n x2in x 2 i1 n xi x y i y i1 n xi x 2 ,a yb x 解析 (1)散点图如图所示: 两个变量正相关,且具有线性相关关系 (2)易求 x 6, y3.2, 由公式有 b 32

17、.210.2010.831.8 32121232 13 200.65, 且a 3.20.6560.7, 则线性回归方程为y 0.65x0.7, (3)当 x4 时,由(1)可求得y 1.9,即利润额约为 1.9 百万元 考点三,独立性检验师生共研 例 3 (1)(2020 新高考,19)为加强环境保护,治理空气污染,环境监测部门对某 市空气质量进行调研,随机抽查了 100 天空气中的 PM2.5 和 SO2浓度(单位:g/m3),得下表: SO2 PM2.5 0,50 (50,150 (150,475 0,35 32 18 4 (35,75 6 8 12 (75,115 3 7 10 估计事件

18、“该市一天空气中 PM2.5 浓度不超过 75,且 SO2浓度不超过 150”的概率; 根据所给数据,完成下面的 22 列联表: SO2 PM2.5 0,150 (150,475 0,75 (75,115 根据中的列联表,判断是否有 99%的把握认为该市一天空气中 PM2.5 浓度与 SO2浓 度有关 附:K2 nadbc2 abcdacbd, P(K2k) 0.050 0.010 0.001 k 3.841 6.635 10.828 (2) (2021 四川大学附中期中)2020 年,全球爆发了新冠肺炎疫情,为了预防疫情蔓延,某 校推迟 2020 年的春季线下开学,并采取了“停课不停学”的线

19、上授课措施为了解学生对线 上课程的满意程度, 随机抽取了该校的 100 名学生(男生与女生的人数之比为 32)对线上课程 进行评价打分,若评分不低于 80 分视为满意,其得分情况的频率分布直方图如图所示,若根 据频率分布直方图得到的评分不低于 70 分的频率为 0.85 估计 100 名学生对线上课程评分的平均值;(每组数据用该组的区间中点值为代表) 结合频率分布直方图,请完成以下 22 列联表,并回答能否有 99%的把握认为对“线 上教学是否满意与性别有关”; 态度 性别 满意 不满意 合计 男生 女生 10 合计 100 K2 nadbc2 abcdacbd,其中 P(K2k0) 0.10

20、 0.05 0.025 0.010 0.005 k0 2.706 3.841 5.024 6.635 7.879 nabcd 解析 (1)根据抽查数据,该市 100 天的空气中 PM2.5 浓度不超过 75,且 SO2浓度不 超过 150 的天数为 32186864,因此,该市一天空气中 PM2.5 浓度不超过 75,且 SO2 浓度不超过 150 的概率的估计值为 64 1000.64 根据抽查数据,可得 22 列联表: SO2 PM2.5 0,150 (150,475 0,75 64 16 (75,115 10 10 根据的列联表得 K210064101610 2 80207426 7.4

21、84 由于 7.4846.635,故有 99%的把握认为该市一天空气中 PM2.5 浓度与 SO2浓度有关 (2)由已知得(0.015b0.03)100.85, 解得 b0.04, 又(0.005a)1010.85,解得 a0.01, 评分的平均值为 550.05650.1750.3850.4950.1580 完成 22 列联表如下表: 态度 性别 满意 不满意 合计 男生 25 35 60 女生 30 10 40 合计 55 45 100 K210010253530 55456040 10.7746.635, 有 99%的把握认为对“线上教学是否满意与性别有关” 名师点拨 解独立性检验的应用

22、问题的关注点 (1)两个明确: 明确两类主体明确研究的两个问题 (2)两个关键: 准确列出 22 列联表:准确理解 K2 注意:查表时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值, 再将该数值对应的 k 值与求得的 K2相比较另外,表中第一行数据表示两个变量没有关联的 可能性 p,所以其有关联的可能性为 1p 变式训练 2 (2021 广西钦州、崇左质检)某出租汽车公司决定更换一批新的小汽车以代替原来的报废 的出租车,现有 A,B 两款车型,根据以往这两种出租车车型的数据,得到两款出租车型使用 寿命频数表如下: 使用寿命年数 4 年 5 年 6 年 7 年 总计 A 型出租

23、车(辆) 10 20 45 25 100 B 型出租车(辆) 15 35 40 10 100 (1)填写下表,并判断是否有 99%的把握认为出租车的使用寿命年数与汽车车型有关? 使用寿命不高于 5 年 使用寿命不低于 6 年 总计 A 型 B 型 总计 (2)司机师傅小李准备在一辆开了 3 年的 A 型车和一辆开了 3 年的 B 型车中选择,为了尽 最大可能实现 3 年内(含 3 年)不换车,试通过计算说明,他应如何选择 参加公式:K2 nadbc2 abcdacbd, 其中 nabcd 参考数据: P(K2k0) 0.05 0.010 0.001 k0 3.841 6.635 10.828

24、解析 (1)根据题目所给数据得到如下 22 的列联考: 使用寿命不高于 5 年 使用寿命不低于 6 年 总计 A 型 30 70 100 B 型 50 50 100 总计 80 120 200 由列联表可知: K220030507050 2 10010080120 8.336.635, 所以有 99%的把握认为出租车的使用寿命年数与汽车车型有关; (2)记事件 A1,A2分别表示小李选择 A 型出租车和 B 型出租车时,3 年内(含 3 年)换车, 由表知 P(A1)102045 100 0.75, P(A2)153540 100 0.9, 因为 P(A1)P(A2),所以小李应选择 A 型出

25、租车 名师讲坛 素养提升 非线性回归问题 例 4 (2020 内蒙古乌兰察布等五市调研)一个调查学生记忆的研究团队从某中学 随机挑选 100 名学生进行记忆测试,通过讲解 100 个陌生单词后,相隔十分钟进行听写测试, 间隔时间 t(分钟)和答对人数 y 的统计表格如下: 时间 t(分钟) 10 20 30 40 50 60 70 80 90 100 答对人数 y 98 70 52 36 30 20 15 11 5 5 lg y 1.99 1.85 1.72 1.56 1.48 1.30 1.18 1.04 0.7 0.7 时间 t 与答对人数 y 的散点图如图: 附: n1 10 t2i38

26、 500, n1 10 yi342, n1 10 lg yi13.5, n1 10 tiyi10 960, n1 10 tilg yi620.9,对于一组 数据(u1,v1),(u2,v2),(un,vn),其回归直线 vu 的斜率和截距的最小二乘估计分 别为: i1 n uivin u v i1 n u2in u 2 , v u 请根据表格数据回答下列问题: (1)根据散点图判断,yatb 与 lg yctd,哪个更适宜作为线性回归类型?(给出判断 即可,不必说明理由) (2)根据(1)的判断结果,建立 y 与 t 的回归方程;(数据保留 3 位有效数字) (3)根据(2)请估算要想记住 7

27、5%的内容,至多间隔多少分钟重新记忆一遍(参考数据:lg 20.3,lg 30.48) 解析 (1)由图象可知,lg yctd 更适宜作为线性回归类型; (2)设 lg yctd,根据最小二乘法得 c i1 10 tilg yi10 t lg y i1 10 t2i10 t 2 620.910551.35 38 50010552 0.014 7,d lg y c t 2.16, 所以 lg y0.014 7t2.16, 因此 y10 0.014 7t2.16; (3)由题意知 y10 0.014 7t2.1675, 即0.014 7t 2.162lg 32lg 21.88, 解得 t19.05

28、,即至多 19.05 分钟,就需要重新复习一遍 名师点拨 非线性相关问题一般通过换元法转化为线性相关(线性回归分析)问题解决 变式训练 3 (2020 课标)某校一个课外学习小组为研究某作物种子的发芽率 y 和温度 x(单位:)的 关系,在 20 个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i1,2,20)得到 下面的散点图: 由此散点图, 在 10 至 40 之间, 下面四个回归方程类型中最适宜作为发芽率 y 和温度 x 的回归方程类型的是( D ) Ayabx Byabx2 Cyabex Dyabln x 解析 观察题中散点图可知,散点图用光滑曲线连接起来比较接近对数型函数的图象, 故选 D

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中 > 数学 > 高考专区 > 一轮复习
版权提示 | 免责声明

1,本文(2022年旧高考(人教版)数学一轮教学案:第九章第四讲 变量间的相关关系、统计案例 (含解析).doc)为本站会员(小豆芽)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|