1、课时作业(六十二)变量间的相关关系、统计案例 基础过关组 一、单项选择题 1根据如表所示的样本数据: x345678 y4.02.50.50.52.03.0 得到了回归方程y b xa ,则() Aa 0,b 0Ba 0 Ca 0,b 0Da 0,b 0 解析由表中的数据可知,随着 x 的增长,y 逐渐减小,则b 0。 答案C 2对于相关系数 r,下列叙述正确的是() A|r|(0,),|r|越大,相关程度越大,反之相关程度越小 Br(,),r 越大,相关程度越大,反之相关程度越小 C|r|1,且|r|越接近于 1,相关程度越大,|r|越接近于 0,相关程度越小 D以上说法都不对 解析相关系数
2、 r 可以衡量两个变量之间的相关关系的强弱。r 的绝对值越接近于 1,两个变量的线性 相关性越强;r 的绝对值接近于 0 时,两个变量之间几乎不存在相关关系。故选 C。 答案C 3(2021揭阳模拟)随机询问 50 名大学生是否爱好某项运动,得到如下的 22 列联表,由 K2 nadbc2 abcdacbd得 K 2的观测值 k502015105 2 30202525 8.333,则下列结论正确的是() 爱好不爱好总计 男生20525 女生101525 总计302050 附: P(K2k0)0.0100.0050.001 k06.6357.87910.828 A有 99.5%的把握认为“是否爱
3、好该项运动与性别有关” B有 99.5%的把握认为“是否爱好该项运动与性别无关” C在犯错误的概率不超过 0.1%的前提下,认为“是否爱好该项运动与性别有关” D在犯错误的概率不超过 0.1%的前提下,认为“是否爱好该项运动与性别无关” 解析因为 8.3337.879,由附表知有 99.5%的把握认为“是否爱好该项运动与性别有关”,或在犯错 误的概率不超过 0.5%的前提下,认为“是否爱好该项运动与性别有关”。故选 A。 答案A 4(2021南昌市模拟)已知一组样本数据(x1,y1),(x2,y2),(x3,y3),(x6,y6),用最小二乘法得到 其线性回归方程为y 2x4,若 x1,x2,
4、x3,x6的平均数为 1,则 y1y2y3y6() A10B12 C13D14 解析回归直线过样本点的中心( x , y ),因为 x 1,所以 y 2142,所以 y1y2y3 y66212。故选 B。 答案B 5下表是鞋子的长度与对应码数的关系 长度/cm2424.52525.52626.5 码数383940414243 已知人的身高 y(单位:cm)与脚板长 x(单位:cm)线性相关且回归直线方程为y 7x7.6。若某人的身高 为 173 cm,据此模型,估计其穿的鞋子的码数为() A40B41 C42D43 解析当 y173 时,x1737.6 7 25.8,对照表格可估计码数为 42
5、。 答案C 二、多项选择题 6某种产品的广告支出费用 x(单位:万元)与销售量 y(单位:万件)之间的对应数据如下表所示: 广告支出费用 x2.22.64.05.35.9 销售量 y3.85.47.011.612.2 根据表中的数据可得回归直线方程y 2.27xa ,R20.96,以下说法正确的是() A第三个样本点对应的残差e 31 B在该回归模型对应的残差图中,残差点比较均匀地分布在倾斜的带状区域中 C销售量的多少有 96%是由广告支出费用引起的 D用该回归方程可以比较准确地预测广告支出费用为 20 万元时的销售量 解析由表可知, x 2.22.64.05.35.9 5 4, y 3.85
6、.47.011.612.2 5 8。所以样本中心 点为(4,8),将其代入线性回归方程y 2.27xa ,有 82.274a ,解得a 1.08,故线性回归方程为y 2.27x1.08。当 x4 时,y 2.2741.088,所以残差e 3yy 781,即选项 A 正确;当 x2.2 时,y 2.272.21.083.914,3.83.9140.114,当 x2.6 时,y 2.272.61.084.822,5.44.822 0.578,当 x5.3 时,y 2.275.31.0810.951,11.610.9510.649,当 x5.9 时,y 2.275.91.08 12.313,12.2
7、12.3130.113。可知在该回归模型对应的残差图中,残差点比较均匀地落在水平的带状区 域中,故 B 错误;因为 R20.96,所以销售量的多少有 96%是由广告支出费用引起的,故 C 正确;由于样 本的取值范围会影响回归方程的使用范围,而广告支出费用 20 万元远大于表格中广告支出费用值,故用该 回归方程不能准确地预测广告支出费用为 20 万元时的销售量,故 D 错误。故选 AC。 答案AC 7(2021德州期末)下列有关线性回归分析的问题中,正确的是() A线性回归方程y b xa 至少经过点(x1,y1),(x2,y2),(x3,y3),(xn,yn)中的一个点 B若两个具有线性相关关
8、系的变量的相关性越强,则线性相关系数|r|的值越接近于 1 C在研究母亲身高 x 与女儿身高 y 的相关关系时,若相关系数|r|r0.05,则表明有 95%的把握认为 x 与 y 之间具有显著线性相关关系 D设回归直线方程为y 5x8,变量 x 增加 1 个单位时,y 平均增加 5 个单位 解析线性回归方程y b xa 可能不经过(x1,y1),(x2,y2),(x3,y3),(xn,yn)中的任何一个点,故 A 错误;若两个具有线性相关关系的变量的相关性越强,则线性相关系数|r|的值越接近于 1,故 B 正确;在 研究母亲身高 x 与女儿身高 y 的相关关系时,若相关系数|r|越接近 1,则
9、线性相关关系越强,而不能根据|r| r0.05来判断线性相关的把握,故 C 错误;设回归直线方程为y 5x8,变量 x 增加 1 个单位时,y 平均增 加 5 个单位,故 D 正确。故选 BD。 答案BD 三、填空题 8为了考察某种流感疫苗的效果,某实验室随机抽取 100 只健康小鼠进行试验,得到如下列联表。 感染未感染总计 注射104050 未注射203050 总计3070100 参考附表,在犯错误的概率最多不超过_的前提下,可认为“注射疫苗与未感染流感有关系”。 参考公式及附表:K2 nadbc2 abcdacbd,其中 nabcd。 P(K2k0)0.100.050.0250.0100.
10、0050.001 k02.7063.8415.0246.6357.87910.828 解析由题意得 K2的观测值 k10010302040 2 30705050 4.762(3.841, 5.024), 所以在犯错误的概率 最多不超过 0.05 的前提下,可认为“注射疫苗与未感染流感有关系”。 答案0.05 9已知一组数据确定的回归直线方程为y 1.5x1,且 y 4,发现两组数据(1.7,2.9),(2.3,5.1) 误差较大,去掉这两组数据后,重新求得的回归直线的斜率为1,则当 x3 时,y _。 解析由题得原数据的样本点的中心为(2,4),去掉(1.7,2.9),(2.3,5.1)后,样
11、本点的中心不变,重 新求得的回归直线的斜率为1,新回归直线的方程设为y xa ,代入(2,4),求得a 2,所以新回归直 线的方程为y x2,将 x3 代入新回归直线方程求得y 5。 答案5 10在一组样本数据(x1,y1),(x2,y2),(x6,y6)的散点图中,若所有样本点(xi,yi)(i1,2,6) 都在曲线 ybx21 2附近波动,经计算 错误错误!i12,错误错误!i14,错误错误!2i23,则实数 b 的值为_。 解析令 tx2, 则曲线的回归方程变为线性的回归方程, 即 ybt1 2, 此时 t 错误错误!23 6 ,y 错误错误!14 6 , 代入 ybt1 2,得 14
12、6 b23 6 1 2,解得 b 17 23。 答案 17 23 四、解答题 11(2020海安市校级期中)某杂志刚刚上市销售,销售前对该杂志拟定了 5 种单价进行试销售,每本单 价 x(元)试销售 1 天,得到如表单价 x(元)与销量 y 的数据关系: 单价 x/元89101112 销量 y/本9892908882 (1)已知销量 y 与单价 x 具有线性相关关系,求 y 关于 x 的线性回归方程; (2)若该杂志每本的成本为 5 元,要使得售卖时利润最大,请利用所求的线性相关关系确定单价应该定 为多少元? 解(1)因为 x 1 5(89101112)10, y 1 5(9892908882
13、)90, 错误错误!iyi4 464,错误错误!2i510, 所以b 错误错误!4 46451090 5105102 3.6, a y b x 90(3.6)10126, 所以 y 关于 x 的回归直线方程为 y 3.6x126。 (2)设获得的利润为 W,则 W(x5)y3.6x2144x630, 因为二次函数 W3.6x2144x630 的开口向下, 所以当 x20 时,W 取最大值,故当单价定为 20 元时,可获得最大利润。 12世界互联网大会是由中华人民共和国倡导并每年在浙江省嘉兴市桐乡乌镇举办的世界性互联网盛 会, 大会旨在搭建中国与世界互联互通的国际平台和国际互联网共享共治的中国平
14、台, 让各国在争议中求共 识、在共识中谋合作、在合作中创共赢。2019 年 10 月 20 日至 22 日,第六届世界互联网大会如期举行,为 了大会顺利召开,组委会特招募了 1 000 名志愿者。某部门为了了解志愿者的基本情况,调查了其中 100 名 志愿者的年龄(单位:岁),得到他们年龄的中位数为 34,年龄在40,45)内的人数为 15,并根据调查结果画 出如图所示的频率分布直方图: (1)求 m,n 的值并估算出志愿者的平均年龄(同一组的数据用该组区间的中点值代表)。 (2)这次大会志愿者主要通过现场报名和登录大会官网报名,即现场和网络两种方式报名参加。这 100 名志愿者的报名方式部分
15、数据如下表所示, 完善下面的表格, 通过计算说明能否在犯错误的概率不超过 0.001 的前提下,认为“选择哪种报名方式与性别有关系”? 男性女性总计 现场报名50 网络报名31 总计50 参考公式及数据:K2 nadbc2 abcdacbd,其中 nabcd。 P(K2k0)0.050.010.0050.001 k03.8416.6357.87910.828 解(1)因为志愿者年龄在40,45)内的人数为 15,所以志愿者年龄在40,45)内的频率为 15 1000.15。 由频率分布直方图得,(0.0202m4n0.010)50.151,即 m2n0.07, 由中位数为 34 可得,0.02
16、052m52n(3430)0.5,即 5m4n0.2, 由解得 m0.020,n0.025。 所以志愿者的平均年龄为 (22.50.02027.50.04032.50.05037.50.05042.50.03047.50.010)534(岁)。 (2)根据题意得到列联表: 男性女性总计 现场报名193150 网络报名311950 总计5050100 所以 K2的观测值 k10019193131 2 50505050 219311931 2 505050 5.7610.828, 所以不能在犯错误的概率不超过 0.001 的前提下,认为“选择哪种报名方式与性别有关系”。 素养提升组 13(多选)给
17、出下列说法,正确的是() A线性回归直线y b xa 必过样本点的中心( x , y ) B命题“x1,x234”的否定是“x01,x2034” C相关系数 r 越小,表明两个变量的相关性越弱 D在一个 22 列联表中,由计算得 K2的观测值 k8.079,则有 99.5%的把握认为这两个变量间有关 系 附: P(K2k0)0.050.0250.0100.0050.001 k03.8415.0246.6357.87910.828 解析线性回归方程y b xa 必过样本点的中心( x , y ),故 A 正确;命题“x1,x234”的否 定是“x01,x2037.879, 则有 99.5%的把握
18、认为这两个变量间有关系, 故 D 正确。 答案AD 14(2021湖南师大附中模拟)2019 年,中国的国内生产总值(GDP)接近 100 万亿元人民币,位居世界第 二,实体经济的贡献功不可没,实体经济组织一般按照市场化原则运行。某生产企业一种产品的成本由原料 成本及非原料成本组成,每件产品的非原料成本 y(单位:元)与生产该产品的数量 x(单位:千件)有关,经统 计得到如下数据: x12345678 y1126144.53530.5282524 根据以上数据,绘制了如图所示的散点图。 现考虑用反比例函数模型y a b x和指数函数模型y c e d x 分别对两个变量的关系进行拟合。为此变换
19、如 下:令1 x,则y a b ,即 y 与满足线性关系;令 vln y,则 vln c d x,即 v 与 x 也满足线性关系。 这样就可以使用最小二乘法求得非线性回归方程。已求得用指数函数模型拟合的回归方程为y 96.54e d x,v 与 x 的相关系数 r10.94,其他参考数据如下表 其中i1 xi,v iln yi 。 错误错误!iyi 2 错误错误!2i错误错误!i错误错误!2i 0.6026 185.5e 2 ln 96.54 v 183.40.340.1161.5336022 385.561.020.1354.63.7 (1)求指数函数模型和反比例函数模型中 y 关于 x 的
20、回归方程。 (2)试计算 y 与的相关系数 r2,并用相关系数判断:选择反比例函数和指数函数两个模型中的哪一个拟 合效果更好(精确到 0.01)? 参考公式:对于一组数据(s1,t1),(s2,t2),(sn,tn),其回归直线t s 的斜率和截距的最小二 乘估计分别为 错误错误!, t s ,相关系数 r错误错误!。 解(1)因为y 96.54e d x, 所以 ln y ln 96.54d x, 令 vln y,则 v4.6d x, 将 v 3.7, x 4.5 代入 v4.6d x, 得 3.74.64.5d ,解得d 0.2, 所以y 96.54e 0.2x。 令1 x,则y a b , 因为 y 1 836045, 所以b 错误错误!183.480.3445 1.5380.116 101.3, 则a y b 45101.30.3410.558, 所以y 10.558101.3, 所以y 10.558101.3 x 。 综上,指数函数模型回归方程为y 96.54e 0.2x,反比例函数模型回归方程为y 10.558101.3 x 。 (2)y 与的相关系数为 r2错误错误! 61 0.6026 185.5 61 61.021, 因为 r10.94,所以|r1|r2|, 所以用反比例函数模型拟合效果更好。