1、第八章第八章成对数据的统计分析成对数据的统计分析 8.1成对数据的统计相关性成对数据的统计相关性 8.1.18.1.1变量的相关关系变量的相关关系 8.1.28.1.2样本相关系数样本相关系数 基础过关练基础过关练 题组一题组一变量的相关关系变量的相关关系 1.下列两个变量之间的关系是相关关系的是() A.正方体的棱长和体积 B.单位圆中角的度数和所对弧长 C.学生的学籍号与学生的数学成绩 D.日照时间与水稻的亩产量 2.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下: 月份123456 人均销售额658347 利润率(%)12.610.418.53.08.116.3 根据表
2、中数据,下列说法正确的是() A.利润率与人均销售额成正比例函数关系 B.利润率与人均销售额成反比例函数关系 C.利润率与人均销售额成正相关关系 D.利润率与人均销售额成负相关关系 3.(多选)下列各选项中的两个变量成正相关的是() A.某商品的销售价格与销售量 B.坚持每天吃早餐的人数与患胃病的人数 C.气温与冷饮销售量 D.电瓶车的质量和每行驶一千米的耗电量 4.某个男孩的年龄与身高的统计数据如下表所示. 年龄 x(岁)123456 身高 y(cm)788798108115120 (1)画出散点图; (2)判断 y 与 x 是否具有线性相关关系. 题组二题组二样本相关系数的应用样本相关系数
3、的应用 5.(2020 辽宁沈阳重点联合体高二上期中)对于样本相关系数 r,下列说法中正确 的是() A.r 越大,线性相关程度越强 B.|r|越小,线性相关程度越强 C.|r|越大,线性相关程度越弱 D.|r|1,且|r|越接近 1,线性相关程度越强,|r|越接近 0,线性相关程度越弱 6.如图 1,2 分别表示样本容量均为 7 的 A、B 两组成对数据的散点图,已知 A 组成 对数据的样本相关系数为 r1,B 组成对数据的样本相关系数为 r2,则 r1与 r2的大小 关系为() A.r1=r2B.r1r2D.无法判断 7.(2020 辽宁锦州高二下期末)若对甲、乙、丙 3 组不同的成对数据
4、作线性相关性 检验,得到这 3 组成对数据的样本相关系数依次为 0.83,0.72,-0.90,则线性相关 程度最强的一组是.(填“甲”“乙”或“丙”) 8.某生物小组为了研究温度对某种酶的活性的影响进行了一组实验,得到的实验 数据经整理后得到折线图如图: 由图可以看出,这种酶的活性指标值 y 与温度 x 具有较强的线性相关性,请用样本 相关系数 r 加以说明. 附: ?=1 6 (xi-?)(yi-?)=85, ?=1 6 (?-?)2=5.5, 72.65.样本相关系数 r= ?=1 ? (?-?)(?-?) ?=1 ? (?-?)2 ?=1 ? (?-?)2 . 能力提升练能力提升练 题
5、组一题组一变量的相关关系变量的相关关系 1.()对变量 x,y 有观测数据(xi,yi)(i=1,2,10),其散点图如图(1);对变量 u,v 有观测数据(ui,vi)(i=1,2,10),其散点图如图(2),由这两个散点图可以判 断() A.变量 x 与 y 成正相关,u 与 v 成正相关 B.变量 x 与 y 成正相关,u 与 v 成负相关 C.变量 x 与 y 成负相关,u 与 v 成正相关 D.变量 x 与 y 成负相关,u 与 v 成负相关 2.()对于任意给定的两个变量的统计数据,下列说法正确的是.(填序 号) 都可以分析出两个变量的关系; 都可以用一条直线近似地表示两者的关系;
6、 都可以作出散点图; 都可以用确定的表达式表示两者的关系. 3.()某校高三年级 267 名学生参加期末考试,其中某班 37 名学生的语文成绩, 数学成绩与总成绩在全年级的排名情况分别如图,图所示,甲、乙、丙为该班 三名学生.从这次考试成绩看, (1)在甲、乙两人中,语文成绩名次比其总成绩名次靠前的学生是; (2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是. 图图 题组二题组二样本相关系数的应用样本相关系数的应用 4.()变量 X 与 Y 相对应的一组数据为 (10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量 U 与 V 相对应的一组数据为 (1
7、0,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1为变量 Y 与 X 之间的样本相关系 数,r2为变量 U 与 V 之间的样本相关系数,则() A.r2r10B.r20r1 C.0r20.95,则 y 与 x 的线性相关 程度相当高. 参考数据: 1 33036.5. 6.(2020 陕西西安中学高二下期末,)某基地蔬菜大棚采用无土栽培的方式种植 各类蔬菜.过去 50 周的资料显示,该地周光照量 X 都在 30 小时以上,其中不足 50 小时的周数为 5,不低于 50 小时且不超过 70 小时的周数为 35,超过 70 小时的周 数为 10.根据统计,该基地的西
8、红柿增加量 y(百斤)与使用某种液体肥料 x(千克) 的对应数据如折线图所示. (1)依据折线图判断 y 与 x 是否具有线性相关关系,试计算样本相关系数 r 并加以 说明;(精确到 0.01,若|r|0.75,则线性相关程度很高) (2)蔬菜大棚对光照要求较高,某光照控制仪商家为该基地提供了部分光照控制仪, 但每周光照控制仪最多可运行台数受周光照量 X 限制,并有如下表关系: 周光照量 X(单位:小时)30X70 光照控制仪最多可运行台数321 若某台光照控制仪运行,则该台光照控制仪的周利润为 3 000 元;若某台光照控制 仪未运行,则该台光照控制仪的周亏损为 1 000 元.以过去 50
9、 周的周光照量的频 率作为周光照量发生的概率,商家欲使周总利润的均值达到最大,应安装光照控制 仪多少台? 参考公式:样本相关系数 r= ?=1 ? (?-?)(?-?) ?=1 ? (?-?)2 ?=1 ? (?-?)2 , 参考数据: ?=1 5 (xi-?)(yi- ?)=6, ?=1 5 (?-?)2=2 5, ?=1 5 (?-?)2= 2, 0.30.55, 0.90.95. 7.(2020 山东青岛五十八中高三期末,)互联网使我们的生活日益便捷,网络外卖 也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场 占有率较高的甲、乙两家网络外卖企业(以下称外卖甲、外卖乙
10、)的经营情况进行 了调查,调查结果如下表: 1 日2 日3 日4 日5 日 外卖甲日接单 x(百单)529811 外卖乙日接单 y(百单)2310515 (1)试根据表格中这五天的日接单量情况,从统计的角度说明这两家外卖企业的经 营状况; (2)据统计表明,y 与 x 之间具有线性相关关系,请用样本相关系数 r 对 y 与 x 之间 的相关性强弱进行判断.(若|r|0.75,则可认为 y 与 x 有较强的线性相关关系,r 的值精确到 0.001) 参考公式:样本相关系数 r= ?=1 ? (?-?)(?-?) ?=1 ? (?-?)2 ?=1 ? (?-?)2 . 答案全解全析答案全解全析 第
11、八章成对数据的统计分析 8.1成对数据的统计相关性 8.1.1变量的相关关系 8.1.2样本相关系数 基础过关练 1.D选项 A,B 中两个变量之间是确定的函数关系,不是相关关系;选项 C,学生的 学籍号与学生的数学成绩是不相关的;选项 D 中日照时间与水稻的亩产量是相关 的. 2.C根据题意,画出利润率与人均销售额的散点图,如图所示. 由散点图知,利润率与人均销售额成正相关关系.故选 C. 3.CD对于 A,一般情况下,某商品的销售价格与销售量成负相关关系; 对于 B,一般情况下,坚持每天吃早餐的人数与患胃病的人数成负相关关系; 对于 C,一般情况下,气温与冷饮销售量成正相关关系; 对于 D
12、,一般情况下,电瓶车的质量和每行驶一千米的耗电量成正相关关系. 故选 CD. 4.解析(1)散点图如图所示. (2)由图知,所有样本点接近一条直线排列,因此,认为 y 与 x 具有线性相关关系. 5.D对于选项 A,|r|越大,线性相关程度越强,A 错误; 对于选项 B,|r|越小,线性相关程度越弱,B 错误; 对于选项 C,|r|越大,线性相关程度越强,C 错误; 对于选项 D,|r|1,且|r|越接近 1,线性相关程度越强,|r|越接近 0,线性相关程 度越弱,D 正确. 故选 D. 6.C由题图 1 可知,散点几乎在一条直线上,且成正相关,r10,由题图 2 可知, 散点分散在一条直线附
13、近,也成正相关,r20.A 组成对数据的线性相关程度比 B 组强一些,r20; 由变量 U 与 V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1), 可得变量 U 与 V 之间成负相关,因此 r20. 故 r200.95, x 与 y 这两个变量成正相关,且相关程度相当高. 6.解析(1)由题图可知,y 与 x 具有线性相关关系. 由已知数据可得?=2+4+5+6+8 5 =5,?=3+4+4+4+5 5 =4, 所以样本相关系数 r= ?=1 5 (?-?)(?-?) ?=1 5 (?-?)2 ?=1 5 (?-?)2 = 6 2 5 2=
14、 9 100.95. 因为 r0.75,所以 y 与 x 具有很强的线性相关性. (2)记商家周总利润为 Y 元,由条件可知至少需要安装 1 台,最多安装 3 台光照控 制仪. 安装 1 台光照控制仪可获得周总利润 3 000 元; 安装 2 台光照控制仪的情形: 当 X70 时,只有 1 台光照控制仪运行,此时周总利润 Y=3 000-1 000=2 000(元),P(Y=2 000)=10 50=0.2; 当 3070 时,只有 1 台光照控制仪运行,此时周总利润 Y=13 000-21 000=1 000(元),P(Y=1 000)=10 50=0.2; 当 50X70 时,有 2 台光
15、照控制仪运行,此时周总利润 Y=23 000-11 000=5 000(元),P(Y=5 000)=35 50=0.7; 当 30X50 时,3 台光照控制仪都运行,此时周总利润 Y=33 000=9 000(元),P(Y=9 000)= 5 50=0.1. 故 Y 的分布列为 Y1 0005 0009 000 P0.20.70.1 所以 E(Y)=1 0000.2+5 0000.7+9 0000.1=4 600. 综上可知,为使商家周利润的均值达到最大,应该安装 2 台光照控制仪. 7.解析(1)由题可知,?=5+2+9+8+11 5 =7, ?=2+3+10+5+15 5 =7, 外卖甲的日接单量的方差?甲 2 = (5-7)2+(2-7)2+(9-7)2+(8-7)2+(11-7)2 5 =10, 外卖乙的日接单量的方差?乙 2 = (2-7)2+(3-7)2+(10-7)2+(5-7)2+(15-7)2 5 =23.6, 因为?=?,?甲 2 0.75, 所以可认为 y 与 x 有较强的线性相关关系.