1、1 4.3统计模型 4.3.1一元线性回归模型一元线性回归模型 课后篇巩固提升 基础达标练 1.设两个变量 x 和 Y 之间具有线性相关关系,它们的相关系数是 r,Y 关于 x 的回归直线方程的回归系 数为? ,回归截距是a ,那么必有( ) A.? 与 r的符号相同 B.? 与 r的符号相同 C.? 与 r的符号相反 D.? 与 r的符号相反 解析由公式可知? 与 r的符号相同. 答案 A 2.为了解儿子身高与其父亲身高的关系,随机抽取 5 对父子的身高数据如下: 父亲身高 x/cm 174176176176178 儿子身高 Y/cm 175175176177177 2 则 Y 对 x 的线
2、性回归方程为() A.? =x-1 B.y =x+1 C.? =88+1 2x D.? =176 解析设 Y 对 x 的线性回归方程为? ? ? ? ? x, 因为? ? -2(-1)?0(-1)?00?01?21 (-2)2?22 ? 1 2,? ? ? ? ? ?=176-1 2176=88,所以 Y 对 x 的回归直线方 程为? =88+1 2x. 答案 C 3.在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点 (xi,yi)(i=1,2,n)都在直线 y=1 2x+1 上,则这组样本数据的样本相关系数为( ) A.-
3、1B.0 C.1 2 D.1 解析因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为 1. 答案 D 4.从某高中随机选取 5 名高三男生,其身高和体重的数据如表所示: 身高 x/cm 160165170175180 体重 63 66 70 72 74 3 y/kg 根据上表可得回归直线方程? =0.56x+a,据此模型预报身高为 172 cm 的高三男生的体重约为( ) A.70.09 kg B.70.12 kg C.70.55 kg D.71.05 kg 解析? ? 160?165?170?175?180 5 =170, ? ? 63?66?70?72?74 5 =69. 因
4、为回归直线过点(?,?), 所以将点(170,69)代入? =0.56x+?中得?=-26.2,所以回归直线方程为?=0.56x-26.2, 代入 x=172,则其体重约为 70.12 kg. 答案 B 5.某商店为了了解热饮销售量 y(单位:杯)与气温 x(单位:)之间的关系,随机统计了某 4 天卖出的热 饮的杯数与当天气温,并制作了表格: 气温/ 181310-1 销售量/ 杯 24343864 4 由表中数据算得线性回归方程? ? b x+? 中的? -2,预测当气温为-5 时,热饮销售量大约为 杯.已知回归系数? ? ?1 ? ?-? ? ?1 ? ?2-?2 ,? ? ?-? ? 解
5、析根据表格中的数据可求得 ? ? 1 4(18+13+10-1)=10, ? ? 1 4(24+34+38+64)=40. 所以? ? ? ? ? ?=40-(-2)10=60. 所以? =-2x+60.当 x=-5 时, ? =-2(-5)+60=70(杯). 答案 70 6.若回归直线方程中的回归系数? =0,则相关系数 r=. 解析相关系数 r= i?1 n (?-?)(?-?) ?1 ? (xi-x)2 i?1 n (yi-y)2 与b ? ?1 ? (?-?)(?-?) ?1 ? (?-?)2 的分子相同,故 r=0. 答案 0 7.已知 x,Y 的取值如下表: x 2345 Y2.
6、23.85.56.5 从散点图分析,Y 与 x 线性相关,且回归直线方程为? =1.42x+a,则 a 的取值为 . 5 解析由已知得x ? 14 4 =3.5,y=4.5. 又因为回归直线过(x,y), 所以 4.5=3.51.42+a, 所以 a=-0.47. 答案-0.47 8.(2018 全国)下图是某地区 2000 年至 2016年环境基础设施投资额 y(单位:亿元)的折线图. 为了预测该地区 2018 年的环境基础设施投资额,建立了 y 与时间变量 t 的两个线性回归模型.根据 2000年至 2016 年的数据(时间变量 t 的值依次为 1,2,17)建立模型:? =-30.4+1
7、3.5t;根据 2010 年 至 2016 年的数据(时间变量 t 的值依次为 1,2,7)建立模型:y=99+17.5t. (1)分别利用这两个模型,求该地区 2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 解(1)利用模型,该地区 2018 年的环境基础设施投资额的预测值为 y =-30.4+13.519=226.1(亿元). 利用模型,该地区 2018 年的环境基础设施投资额的预测值为 ? =99+17.59=256.5(亿元). (2)利用模型得到的预测值更可靠. 6 理由如下: ()从折线图可以看出,2000 年至 2016 年的数据
8、对应的点没有随机散布在直线 y=-30.4+13.5t 上 下,这说明利用 2000 年至 2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的 变化趋势.2010 年相对 2009 年的环境基础设施投资额有明显增加,2010年至 2016 年的数据对应的点 位于一条直线的附近,这说明从 2010 年开始环境基础设施投资额的变化规律呈线性增长趋势,利用 2010年至 2016 年的数据建立的线性模型? =99+17.5t 可以较好地描述 2010年以后的环境基础设施 投资额的变化趋势,因此利用模型得到的预测值更可靠. ()从计算结果看,相对于 2016 年的环境基础设施投资额 22
9、0亿元,由模型得到的预测值 226.1 亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测 值更可靠. (以上给出了 2 种理由,答出其中任意一种或其他合理理由均可) 能力提升练 1.(2019 山东莒县第二中学高考模拟)相关变量 x,y 的散点图如图所示,现对这两个变量进行线性相关 分析,方案一:根据图中所有数据,得到线性回归方程? =b 1x+a1,相关系数为 r1;方案二:剔除点(10,21),根 据剩下数据得到线性回归直线方程y =b 2x+a2,相关系数为 r2.则() A.0r1r21 B.0r2r11 C.-1r1r20 D.-1r2r10 解析由散
10、点图得负相关,所以 r1,r20.因为剔除点(10,21)后,剩下点数据更具有线性相关性,|r|更接近 1, 所以-1r2r10. 7 答案 D 2.(2019 北京人大附中高考模拟)如图是具有相关关系的两个变量的一组数据的散点图和回归直线,若 去掉一个点使得余下的 5 个点所对应的数据的相关系数最大,则应当去掉的点是() A.DB.E C.FD.A 解析因为相关系数的绝对值越大,越接近 1,则说明两个变量的相关性越强.该图所表示的两个变量是 正相关,又因为点 E 到直线的距离最远,所以去掉点 E,余下的 5 个点所对应的数据的相关系数最大. 答案 B 3.(2019 河南高二月考)某工厂为了
11、对新研发的一种产品进行合理定价,将该产品事先拟定的价格进行 试销,得到如下数据. 单价 x/ 元 4 5 6 7 8 9 销量 y/ 件 908483807568 由表中数据求得线性回归方程? =-4x+a,则 a= ,当 x=10 元时预测销量为件. 解析由题得: x ? 1 6(4+5+6+7+8+9)= 13 2 , 8 y ? 1 6(90+84+83+80+75+68)=80, a=80+413 2 =106, x=10y =106-40=66. 答案 10666 4.(2019 内蒙古杭锦后旗奋斗中学高二月考)在研究两个变量的线性相关关系时,观察散点图发现样本 点集中于某一条曲线
12、y=ebx+a的周围,令 z=ln y,求得回归直线方程? =0.25x-2.58,则该模型的回归方程 为. 解析由回归直线方程z =0.25x-2.58 得 ln y=0.25x-2.58,整理得 y=e0.25x-2.58, 所以该模型的回归方程为? =e0.25x-2.58. 答案? =e0.25x-2.58 5.(2020 山东沂水模拟)随着智能手机的普及,使用手机上网成为人们日常生活的一部分,很多消费者 对手机流量的需求越来越大.某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包. 该通信公司选了 5 个城市(总人数、经济发展情况、消费能力等方面比较接近)采用不同的定价方
13、案 作为试点,经过一个月的统计,发现该流量包的定价 x(单位:元/月)和购买人数 y(单位:万人)的关系如 表: 流量包的定价/(元/ 月) 3035404550 购买人数/万人1814108 5 (1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合 y 与 x 的关系?并指出 是正相关还是负相关; 9 (2)求出 y 关于 x 的回归方程; 若该通信公司在一个类似于试点的城市中将这款流量包的价格定为 25 元/月,请用所求回归方程预 测该市一个月内购买该流量包的人数能否超过 20 万人. 参考数据: 25 000158, 26 000161, 27 000164. 参考
14、公式:相关系数 r= ?1 ? (xi-x)(yi-y) i?1 n (?-?)2 ?1 ? (?-?)2 ,回归直线方程? ? ? x+? ,其中? ? ?1 ? (?-?)(?-?) ?1 ? (?-?)2 ,? ? ? ? ? ?. 解(1)根据题意,得? ? 1 5(30+35+40+45+50)=40,? ? 1 5(18+14+10+8+5)=11. 可列表如下 i123 45 xi-x - 10 -5 0 510 yi-y73 - 1 -3 -6 (xi-x)(yi- y) - 70 - 15 0 - 15 - 60 根据表格和参考数据,得 ?1 5 (xi-x)(yi-y)=-
15、160, i?1 5 (?-?)2 ?1 5 (?-?)2?250 104 ?26 000161. 因而相关系数 r= ?1 5 (?-?)(?-?) ?1 5 (?-?)2 ?1 5 (?-?)2 ? -160 161-0.99. 由于|r|0.99 很接近 1,因而可以用线性回归方程模型拟合 y与 x 的关系. 由于 r0,故其关系为负相关. 10 (2)? ? ?1 5 (?-?)(?-?) ?1 5 (?-?)2 ? -160 250=-0.64,? =11+0.6440=36.6, 因而 y关于 x 的回归方程为? =-0.64x+36.6. 由知,若 x=25,则? =-0.642
16、5+36.6=20.6,故若将流量包的价格定为 25 元/月,可预测该市一 个月内购买该流量包的人数会超过 20 万人. 素养培优练 (2020 山东蒙阴实验中学高三期末)某企业新研发了一种产品,产品的成本由原料成本及非原料成本 组成.每件产品的非原料成本 y(单位:元)与生产该产品的数量 x(单位:千件)有关,经统计得到如下数据: x12 34 56 7 8 y1126144.53530.5282524 根据以上数据,绘制了散点图. 观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型 y=a+? ?和指数函数模型 y=ce dx 分别对两个变量的关系进行拟合.已求得用指数函数模型
17、拟合的回归方程为? =96.54e-0.2x,ln y 与 x 的 相关系数 r1=-0.94.参考数据 其中 ui=1 xi : 11 i?1 8 uiyiuu2 i?1 8 ui 2 i?1 8 yi i?1 8 yi 2 0.61 6 185.5e-2 183.4 0.340.1151.53 360 22 385.561.4 0.135 (1)用反比例函数模型求 y 关于 x 的回归方程; (2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到 0.01),并用其估计产量为 10 千件时每 件产品的非原料成本; (3)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出).根
18、据市场调研数据,若该产品 单价定为 100元,则签订 9 千件订单的概率为 0.8,签订 10 千件订单的概率为 0.2;若单价定为 90 元,则 签订 10 千件订单的概率为 0.3,签订 11 千件订单的概率为 0.7.已知每件产品的原料成本为 10 元,根 据(2)的结果,企业要想获得更高利润,产品单价应选择 100 元还是 90 元,请说明理由. 参考公式:对于一组数据(u1,1),(u2,2),(un,n),其回归直线=+u 的斜率和截距的最小二乘估计分 别为? ? i?1 n ?-? ? ?1 ? ?2-?2 ,? ? ? ? ? ?,相关系数 r= ?1 ? ?-? ? ( ?1
19、 ? ?2-?2)( ?1 ? ?2-?2) . 解(1)令 u=1 ?,则 y=a+ ? ?可转化为 y=a+bu, 因为? ? 360 8 =45, 所以? ? ?1 8 ?-8? ? ?1 8 ?2-8?2 ? 183.4-80.3445 1.53-80.115 ? 61 0.61=100, 则? ? ? ? ? ?=45-1000.34=11, 所以? =11+100u, 所以 y关于 x 的回归方程为? =11+100 ? . 12 (2)y与1 ?的相关系数为 r2= ?1 8 ?-? ? ( ?1 8 ?2-8?2)( ?1 8 ?2-8?2) ? 61 0.616 185.5
20、= 61 61.40.99, 因为|r1|r2|, 所以用反比例函数模型拟合效果更好, 当 x=10 时,y=100 10 +11=21(元), 所以当产量为 10 千件时,每件产品的非原料成本为 21 元. (3)()若产品单价为 100元,记企业利润为 X(千元),订单为 9 千件时,每件产品的成本为289 9 元,企 业的利润为 611(千元), 订单为 10 千件时,每件产品的成本为 31 元,企业的利润为 690(千元), 企业利润 X(千元)的分布列为 X611690 P0.8 0.2 所以 E(X)=6110.8+6900.2=626.8(千元). ()若产品单价为 90 元,记企业利润为 Y(千元), 订单为 10 千件时,每件产品的成本为 31 元,企业的利润为 590(千元), 订单为 11 千件时,每件产品的成本为331 11 元,企业的利润为 659(千元), 13 企业利润 Y(千元)的分布列为 Y590659 P0.3 0.7 所以 E(Y)=5900.3+6490.7=638.3(千元), 因为 626.8638.3,故企业要想获得更高利润,产品单价应选择 90 元.
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。