ImageVerifierCode 换一换
格式:DOC , 页数:14 ,大小:561KB ,
文档编号:1640465      下载积分:1 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-1640465.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(大布丁)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文((2021新教材)人教B版高中数学选择性必修第二册第4章 4.3 4.3.1 第2课时 相关系数与非线性回归讲义.doc)为本站会员(大布丁)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

(2021新教材)人教B版高中数学选择性必修第二册第4章 4.3 4.3.1 第2课时 相关系数与非线性回归讲义.doc

1、第第 2 课时课时相关系数与非线性回归相关系数与非线性回归 学 习 目 标核 心 素 养 1了解两个变量间的线性相关系数 r,并能利用公式 求相关系数 r.(重点) 2 能利用相关系数 r 判断两个变量线性相关程度的大 小,从而判断回归直线方程拟合的效果(重点) 3掌握非线性回归转化为线性回归的方法,会求非 线性回归方程,并作出预测(难点) 1通过学习相关系数, 培养数学运算的素养 2借助非线性回归方程 的学习, 提升数据分析和 数学建模的素养. 据隆众资讯数据统计,20172019 年截止到 10 月底的数据显示,聚丙烯期 货价格及现货价格二者相关系数为 88.70%,其中 2017 年二者

2、相关系数高达 90.86%,2018 年降至 83.97%,2019 年截止到 10 月底二者相关系数为 65.23%. 问题:什么是相关系数,如何计算,它有什么作用? 1相关系数 (1)定义:统计学里一般用 r n i1 xi x yi y n i1 xi x 2 n i1 yi y 2 n i1xiyin x y n i1x 2 in x 2 n i1y 2 in y 2 来衡量 y 与 x 的线性相关性强弱, 这里的 r 称为线性相关系数(简称为相关系 数) (2)性质 |r|1,且 y 与 x 正相关的充要条件是 r0,y 与 x 负相关的充要条件是 r 0; |r|越小,说明两个变量

3、之间的线性相关性越弱,也就是得出的回归直线方 程越没有价值,即方程越不能反映真实的情况;|r|越大,说明两个变量之间的线 性相关性越强,也就是得出的回归直线方程越有价值; |r|1 的充要条件是成对数据构成的点都在回归直线上 2非线性回归方程 如果具有相关关系的两个变量 x,y 不是线性相关关系,那么称为非线性相 关关系,所得到的方程称为非线性回归方程(也简称为回归方程) 思考:如何猜测非线性回归方程的类型? 提示可以通过作出散点图,结合已学的函数模型进行猜测 1思考辨析(正确的打“”,错误的打“”) (1)若相关系数为 0,则说明两变量 x,y 之间没任何关系() (2)两个变量相关系数越大

4、,说明它们的相关性越强() (3)求回归方程时,最好用相关系数判断一下,两变量相关性的强弱 () (4)非线性回归方程可借助线性回归方程求得() 答案(1)(2)(3)(4) 2甲、乙、丙、丁四位同学各自对 A,B 两变量的线性相关性做试验,并 用回归分析方法分别求得相关系数 r 如下表: 甲乙丙丁 r0.820.780.690.85 则哪位同学的试验结果体现 A,B 两变量有更强的线性相关性() A甲B乙 C丙D丁 Dr 的绝对值越接近 1,相关性越强,故选 D. 3 在一项调查中有两个变量 x 和 y, 下图是由这两个变量近 8 年来的取值数 据得到的散点图,那么适宜作为 y 关于 x 的

5、回归方程的函数类型是() AyabxBycd x Cymnx2Dypqcx(q0) B散点图呈曲线,排除 A 选项,且增长速度变慢,排除选项 C、D,故选 B. 4在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,4),(1,6), 则 y 与 x 的相关系数为_ 1法一: x 1.5, y1, 4 i1x 2 i22, 4 i1y 2 i56, 4 i1xiyi20, 相关系数 r 2041.51 2241.52564121. 法二:观察四个点,发现其在一条单调递减的直线上,故 y 与 x 的相关系数 为1. 相关系数的性质 【例 1】(1)在一组数据为(x1,y1),

6、(x2,y2),(xn,yn)(n2,x1,x2, xn不全相等)的散点图中, 若这组样本数据的相关系数为1, 则所有的样本点(xi, yi)(i1,2,n)满足的方程可以是() Ay1 2x1 Byx1 Cyx1Dyx2 (2)设两个变量 x 和 y 之间具有线性相关关系, 它们的相关系数是 r, y 关于 x 的回归直线方程的回归系数为b ,回归截距是a ,那么必有( ) A.b 与 r 的符号相同 B.a 与 r 的符号相同 C.b 与 r 的符号相反 D.a 与 r 的符号相同 (1)A(2)A(1)这组样本数据的相关系数为1, 这一组数据(x1,y1),(x2,y2),(xn,yn)

7、线性相关,且是负相关, 可排除 D,B,C,故选 A. (2)由公式可知b 与 r 的符号相同 线性相关强弱的判断方法: 1散点图(越接近直线,相关性越强); 2相关系数(绝对值越大,相关性越强) 跟进训练 1如图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去 掉一个点使得余下的 5 个点所对应的数据的相关系数最大,则应当去掉的点是 () ADBE CFDA B因为相关系数的绝对值越大,越接近 1,则说明两个变量的相关性越 强因为点 E 到直线的距离最远,所以去掉点 E,余下的 5 个点所对应的数据的 相关系数最大 相关系数的计算及应用 【例 2】假设关于某种设备的使用年限 x(单

8、位:年)与所支出的维修费用 y(单位:万元)有如下统计资料: x23456 y2.23.85.56.57.0 已知 5 i1x 2 i90, 5 i1y 2 i140.8, 5 i1xiyi112.3, 798.9, 21.4. (1)计算 y 与 x 之间的相关系数(精确到 0.001),并求出回归直线方程; (2)根据回归方程,预测假设使用年限为 10 年时,维修费用约是多少万元? 解(1) x 23456 5 4, y 2.23.85.56.57.0 5 5. 5 i1xiyi5 x y 112.354512.3, 5 i1x 2 i5 x 29054210, 5 i1y 2 i5 y

9、2140.812515.8, 所以 r 12.3 1015.8 12.3 158 12.3 2 79 12.3 1.48.90.987. 又b 5 i1xiyi5 x y 5 i1x 2 i5 x 2 112.3545 90542 1.23. a yb x 51.2340.08. 所以回归直线方程为y 1.23x0.08. (2)当 x10 时,y 1.23100.0812.38(万元), 即假设使用 10 年时,维修费用约为 12.38 万元 跟进训练 2某厂的生产原料耗费 x(单位:百万元)与销售额 y(单位:百万元)之间有 如下的对应关系: x2468 y30405070 (1)计算 x

10、 与 y 之间的相关系数,并求其回归直线方程; (2)若实际销售额不少于 80 百万元,则原料耗费应该不少于多少? 解(1)画出(x,y)的散点图如图所示,由图可知 x,y 有线性关系 x 5, y47.5, 4 i1x 2 i120, 4 i1y 2 i9 900, 4 i1xiyi1 080, 故相关系数 r 4 i1xiyi4 x y 4 i1x 2 i4 x 2 4 i1y 2 i4 y 2 1 0804547.5 1204529 900447.520.982 7. b 4 i1xiyi4 x y 4 i1x 2 i4 x 2 1 0804547.5 120452 6.5, a yb

11、x 47.56.5515. 故回归直线方程为y 6.5x15. (2)由回归直线方程知, 当y 80,即 6.5x1580 时, x10. 故原料耗费应不少于 10 百万元 非线性回归方程 探究问题 已知x和y之间的一组数据, 则下列四个函数中, 哪一个作为回归模型最好? x123 y35.9912.01 y32x 1;ylog2x;y4x;yx2. 提示作出散点图(图略),观察散点图中样本点的分布规律可判断样本点 分布在曲线 y32x 1 附近作为回归模型最好 【例 3】某企业新研发了一种产品,产品的成本由原料成本及非原料成本 组成每件产品的非原料成本 y(元)与生产该产品的数量 x(千件)

12、有关,经统计得 到如下数据: x12345678 y1126144.53530.5282524 根据以上数据,绘制了散点图 观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型 y ab x和指数函数模型 yce dx分别对两个变量的关系进行拟合已求得用指数函 数模型拟合的回归方程为y 96.54e0.2x,ln y 与 x 的相关系数 r10.94. 参考数据 其中 ui1 xi: 8 i1uiyi u u 2 8 i1u 2 i 8 i1yi 8 i1y 2 i0.616 185.5e 2 183.40.340.1151.5336022 385.561.40.135 (1)用反比

13、例函数模型求 y 关于 x 的回归方程; (2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到 0.01),并用其 估计产量为 10 千件时每件产品的非原料成本; (3)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出)根 据市场调研数据,若该产品单价定为 100 元,则签订 9 千件订单的概率为 0.8, 签订 10 千件订单的概率为 0.2;若单价定为 90 元,则签订 10 千件订单的概率为 0.3,签订 11 千件订单的概率为 0.7.已知每件产品的原料成本为 10 元,根据(2) 的结果,企业要想获得更高利润,产品单价应选择 100 元还是 90 元,请说明理 由

14、参考公式:对于一组数据(u1,1),(u2,2),(un,n),其回归直线 u 的斜率和截距的最小二乘估计分别为: n i1uiin u n i1u 2 in u 2 ,a u , 相关系数 r n i1uiin u n i1u 2 in u 2 n i1 2 in 2 思路点拨(1)首先可令 u1 x并将 ya b x转化为 yabu, 然后根据题目 所给数据以及线性回归方程的相关公式计算出b 以及a ,即可得出结果; (2)计算出反比例函数模型的相关系数 r 并通过对比即可得出结果; (3)可分别计算出单价为 100 元和 90 元时产品的利润,通过对比即可得出结 果 解(1)令 u1 x

15、,则 ya b x可转化为 yabu,因为 y 360 8 45,所以 b 8 i1uiyi8 u y 8 i1u 2 i8 u 2 183.480.3445 1.5380.115 61 0.61100, 则a yb u 451000.3411, 所以y 11100u, 所以 y 关于 x 的回归方程为y 11100 x . (2)y 与1 x的相关系数为: r2 8 i1uiyin u y 8 i1u 2 i8 u 2 8 i1y 2 i8 y 2 61 0.616 185.50.99. 因为|r1|r2|,所以用反比例函数模型拟合效果更好, 当 x10 时,y100 10 1121(元),

16、 所以当产量为 10 千件时,每件产品的非原料成本为 21 元 (3)当产品单价为 100 元, 设订单数为 x 千件, 因为签订 9 千件订单的概率 为 0.8,签订 10 千件订单的概率为 0.2, 所以 E(x)90.8100.29.2, 所以企业利润为 1009.29.2 100 9.2 21 626.8(千元) 当产品单价为 90 元,设订单数为 y 千件, 因为签订 10 千件订单的概率为 0.3,签订 11 千件订单的概率为 0.7, 所以 E(y)100.3110.710.7, 所以企业利润为 9010.710.7 100 10.721638.3(千元) 故企业要想获得更高利润

17、,产品单价应选择 90 元 非线性回归问题有时并不给出经验公式, 这时我们可以画出已知数据的散点 图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图像作比较,挑选 一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性 回归分析问题,使之得到解决其一般步骤为: 跟进训练 3二手车经销商小王对其所经营的 A 型号二手汽车的使用年数 x 与销售价 格 y(单位:万元/辆)进行整理,得到如下数据: 使用年数 x234567 售价 y201286.44.43 zln y3.002.482.081.861.481.10 下面是 z 关于 x 的折线图: (1)由折线图可以看出,可

18、以用线性回归模型拟合 z 与 x 的关系,请用相关系 数加以说明; (2)求 y 关于 x 的回归方程并预测某辆 A 型号二手车当使用年数为 9 年时售 价约为多少?(b,a 小数点后保留两位有效数字) (3)基于成本的考虑, 该型号二手车的售价不得低于 7 118 元,请根据(2)求出 的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年? 参考数据: 6 i1xiyi187.4, 6 i1xizi47.64, 6 i1x 2 i139, 6 i1 xi x 24.18, 6 i1 yi y 213.96, 6 i1 zi z 21.53, ln 1.460.38,ln 0.711

19、 80.34. 参考公式:回归直线方程y b xa 中斜率和截距的最小二乘估计公式分别 为: b n i1 xi x yi y n i1 xi x 2 n i1xiyin x y n i1x 2 in x 2 ,a yb x . r n i1 xi x yi y n i1 xi x 2 n i1 yi y 2, x , y为样本平均值 解(1)由题意,计算 x 1 6(234567)4.5, z 1 6(32.482.081.861.481.10)2, 且 6 i1xizi47.64, 6 i1 xi x 24.18, 6 i1 zi z 21.53,所以 r n i1 xi x zi z n

20、 i1 xi x 2 n i1 zi z 2 47.6464.52 4.181.53 6.36 6.395 40.99. 所以 z 与 x 的相关系数大约为0.99,说明 z 与 x 的线性相关程度很高 (2)利用最小二乘估计公式计算 b n i1xizin x z n i1x 2 in x 2 47.6464.52 13964.52 6.36 17.50.36, 所以a zb x 20.364.53.62, 所以 z 关于 x 的线性回归方程是z 0.36x3.62, 又 zln y,所以 y 关于 x 的回归方程是y e0.36x3.62. 令 x9,解得 ye 0.3693.621.46

21、,即预测某辆 A 型号二手车当使用年数为 9 年时售价约 1.46 万元 (3)当 y0.711 8 时, e 0.36x3.620.711 8eln 0.711 8e0.34, 所以0.36x3.620.34,解得 x11,因此预测在收购该型号二手车时车 辆的使用年数不得超过 11 年 1判断变量的相关性通常有两种方式:一是散点图,二是相关系数 r,前者 只能粗略的说明变量间具有相关性,而后者从定量的角度分析变量相关性的强 弱 2只有当两变量间呈线性相关关系时,才可以求回归系数,得到回归直线 方程y b xa ;若两变量间的关系不是线性相关关系,应观察分析其散点图,找 出拟合函数,通过变量代

22、换把非线性回归问题转化为线性回归问题 1两个变量之间的线性相关程度越低,其线性相关系数的数值() A越接近于1B越接近于 0 C越接近于 1D越小 B由相关系数的含义可得:两个变量之间的线性相关程度越低,其线性相 关系数的数值越接近于 0.故选 B. 2如图所示,给出了样本容量均为 7 的 A,B 两组样本数据的散点图,已 知 A 组样本数据的相关系数为 r1,B 组数据的相关系数为 r2,则() Ar1r2Br1r2 Cr1r2D无法判定 C根据 A, B 两组样本数据的散点图知, A 组样本数据几乎在一条直线上, 且成正相关,相关系数为 r1应最接近 1,B 组数据分散在一条直线附近,也成

23、 正相关,相关系数为 r2,满足 r2r2,故选 C. 3对于线性相关系数 r,叙述正确的是() Ar(,),且 r 越大,相关程度越大 Br(,),且|r|越大,相关程度越大 Cr1,1,且 r 越大,相关程度越大 Dr1,1,且|r|越大,相关程度越大 D相关系数 r 是来衡量两个变量之间的线性相关程度的, 线性相关系数是 一个绝对值小于等于 1 的量,并且它的绝对值越大就说明相关程度越大故选 D. 4若回归直线方程中的回归系数b 0,则相关系数 r_. 0相关系数 r n i1 xi x yi y n i1 xi x 2 n i1 yi y 2与b n i1 xi x yi y n i1

24、 xi x 2 的分子 相同,故 r0. 5根据统计,某蔬菜基地西红柿亩产量的增加量 y(百千克)与某种液体肥料 每亩使用量 x(千克)之间的对应数据的散点图如图所示 (1)依据数据的散点图可以看出, 可用线性回归模型拟合 y 与 x 的关系, 请计 算相关系数 r 并加以说明(若|r|0.75,则线性相关程度很高,可用线性回归模型 拟合); (2)求 y 关于 x 的回归方程,并预测液体肥料每亩使用量为 12 千克时,西红 柿亩产量的增加量 y 约为多少? 附:相关系数公式r n i1 xi x yi y n i1 xi x 2 n i1 yi y 2 n i1xiyin x y n i1x

25、 2 in x 2 n i1y 2 in y 2,参考数据: 0.30.55, 0.90.95. 回归方程y b xa 中斜率和截距的最小二乘估计公式分别为:b n i1 xi x yi y n i1 xi x 2 n i1xiyin x y n i1x 2 in x 2 , a yb x . 解(1)由已知数据可得 x 24568 5 5, y 34445 5 4. 所以 5 i1 (xi x )(yi y)(3)(1)(1)00010316, 5 i1 xi x 2 32120212322 5, 5 i1 yi y 2 1202020212 2, 所以相关系数 r 5 i1 xi x yi y 5 i1 xi x 2 5 i1 yi y 2 6 2 5 2 9 100.95. 因为 r0.75,所以可用线性回归模型拟合 y 与 x 的关系 (2)b 5 i1 xi x yi y 5 i1 xi x 2 6 200.3. 那么a 450.32.5. 所以回归方程为y 0.3x2.5. 当 x12 时,y 0.3122.56.1, 即当液体肥料每亩使用量为 12 千克时,西红柿亩产量的增加量约为 6.1 百 千克

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|