1、第六节变量的相关关系、统计案例,总纲目录,教材研读,1.两个变量的线性相关,考点突破,2.回归分析,3.独立性检验,考点二线性回归方程的求解与应用,考点一相关关系的判断,考点三相关系数的意义,考点四独立性检验,1.两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关关系,我们将它称为负相关.,教材研读,(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(4)最小二
2、乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.(5)回归方程方程?=?x+?是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中?,?是待定参数.,2.回归分析(1)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),我们知道?=?(?,?)称为样本点的中心.(3)相关系数:?.当r0时,表明两个变量正相关;当r0,?0,?0C.?0,D,答案D由题图可知,回归直线的斜率是正数,即?0;回归直线在y轴上的截距是负
3、数,即?0时,y与x正相关;当?0时,y与x负相关.一定不正确.故选D.,4.已知x,y的对应取值如下表,从散点图可以看出y与x线性相关,且回归方程为?=0.95x+?,则?=?(),A.3.25B.2.6C.2.2D.0,B,答案B由题意知?=2,?=4.5,因为回归直线经过点(?,?),所以?=4.5-0.952=2.6,故选B.,5.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用22列联表进行独立性检验,经计算K2=7.069,则所得到的统计学结论是有的把握认为“学生性别与支持该活动有关系”.?()附:,A.0.1%B.1%C.99%D.99.9%,C,答
4、案C因为7.069与附表中的6.635最接近,所以得到的统计学结论是有1-0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”.,6.下面是一个22列联表,则表中a、b处的值分别为.,52、54,答案52、54,解析因为a+21=73,所以a=52.又因为a+2=b,所以b=54.,典例1(1)(2018湖南长沙质检)下列四个散点图中,变量x与y之间具有负的线性相关关系的是?(),考点一相关关系的判断,考点突破,答案(1)D(2)A,解析(1)观察散点图可知,只有D选项的散点图表示的是变量x与y之间具有负的线性相关关系.(2)由相关系数的意义,结合散点图可知r2r40r3r1,
5、故选A.,1-1在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,n)都在直线y=?x+1上,则这组样本数据的样本相关系数为?()A.-1B.0C.?D.1,D,答案D所有样本点均在同一条斜率为正数的直线上,则样本相关系数最大,为1,故选D.,1-2变量X与Y相应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数
6、,r2表示变量V与U之间的线性相关系数,则?()A.r2r10B.0r2r1C.r200;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r20,故选C.,典例2随着我国经济的发展,居民的储蓄存款逐年增长.某地区城乡居民人民币储蓄存款(年底余额)如下表:,(1)求y关于t的回归方程?=?t+?;(2)用所求回归方程预测该地区2017年(t=6)的人民币储蓄存款.附:回归方程?=?t+?中,?=?=?-?.,考点二线性回归方程的求解与应用,解析(1)列表计算如下:,这里n=5,?=?ti=?=3,?=?yi=?=7.2.,2-1从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(
7、单位:千元)与月储蓄yi(单位:千元)的数据资料,算得?xi=80,?yi=20,?xiyi=184,? =720.(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y=bx+a中,?其中?,?为样本平均值.线性回归方程也可写为?=?x+?.,典例3(2017课标全国,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:,考点三相关系数的
8、意义,经计算得?=?xi=9.97,s=?=?0.212,?18.439,?(xi-?)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,16.(1)求(xi,i)(i=1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(?-3s,?+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.,(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ii
9、)在(?-3s,?+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(xi,yi)(i=1,2,n)的相关系数r=?;?0.09.,解析(1)由样本数据得(xi,i)(i=1,2,16)的相关系数为r=?=?-0.18.由于|r|0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(i)由于?=9.97,s0.212,由样本数据可以看出抽取的第13个零件的尺寸在(?-3s,?+3s)以外,因此需对当天的生产过程进行检查.(ii)剔除离群值,即第13个数据,剩下数据的平均数为?(169.97-9
10、.22)=10.02,3-1(2016课标全国,18,12分)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.?(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;,(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:?yi=9.32,?tiyi=40.17,?=0.55,?2.646.参考公式:相关系数r=?,回归方程?=?+?t中斜率和截距最小二乘估计公式分别为?=?,?=?-?.,解析(1)由折线图中数据和附注中参考数据得?=4,?(ti-?)2=28,?=0.55,?(ti-?)(yi-?)=?tiyi-?yi=40.17-49.32=2.89,r?0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.,(2)由?=?1.331及(1)得?=?=?0.10,?=?-?=1.331-0.1040.93.所以y关于t的回归方程为?=0.93+0.10t.将2016年对应的t=9代入回归方程得:?=0.93+0.109=1.83.所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨.,典例4(2017课标全国,19,12分)海