1、变量之间的相关关系变量之间的相关关系(必修优秀课件必修优秀课件)_图文图文.ppt问题提出问题提出1.1.函数是研究两个变量之间的依存关系函数是研究两个变量之间的依存关系的一种数量形式的一种数量形式.对于两个变量,如果对于两个变量,如果当一个变量的取值一定时,另一个变量当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的取值被惟一确定,则这两个变量之间的关系就是一个函数关系的关系就是一个函数关系.2.2.在中学校园里,有这样一种说法:在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理如果你的数学成绩好,那么你的物理学习就不会有什么大问题学习就不会有什么大问题.”
2、.”按照这种说按照这种说法,似乎学生的物理成绩与数学成绩之法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?变量之间的关系是函数关系吗?1商品销售收入与广告支出经费之间的关系。商品销售收入与广告支出经费之间的关系。我们还可以举出现实生活中存在的许多相关我们还可以举出现实生活中存在的许多相关关系的问题。例如:关系的问题。例如:2粮食产量与施肥量之间的关系。粮食产量与施肥量之间的关系。3人体内脂肪含量与年龄之间的关系。人体内脂肪含量与年龄之间的关系。1
3、.下列关系中下列关系中,是带有随机性相关关系的是是带有随机性相关关系的是 .正方形的边长与面积的关系正方形的边长与面积的关系;水稻产量与施肥量之间的关水稻产量与施肥量之间的关系系;人的身高与年龄之间的关系人的身高与年龄之间的关系;降雪量与交通事故发生之降雪量与交通事故发生之间的关系间的关系.2.下列两个变量之间的关系哪个不是函数关系下列两个变量之间的关系哪个不是函数关系()()A角度和它的余弦值角度和它的余弦值B.正方形边长和面积正方形边长和面积C正边形的边数和它的内角和正边形的边数和它的内角和 D.人的年龄和身高人的年龄和身高D即学即用即学即用2.3.2 2.3.2 两个变量的线性相关关系两
4、个变量的线性相关关系.年龄年龄23273941454950脂肪9.517.8 21.2 25.9 27.5 26.3 28.2年龄年龄53545657586061脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6探究:探究:人体内脂肪含量与年龄之间有怎样的关系?人体内脂肪含量与年龄之间有怎样的关系?x0202530354550 5560年龄年龄510152025303540y脂肪含量脂肪含量4065下面我们以年龄为横轴下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标系脂肪含量为纵轴建立直角坐标系,作出各个点作出各个点,称该图为称该图为散点图散点图。年年龄龄2327394
5、1454950脂肪9.517.821.225.927.526.328.25354565758606129.630.231.430.833.535.234.6年龄年龄脂肪脂肪239.52717.83921.24125.9454927.526.35028.25329.65430.25631.45730.8年龄年龄脂肪脂肪5833.56035.26134.6探究探究O202530 354045 50 55 60 65年龄年龄脂肪含量脂肪含量510152025303540将各数据在平面将各数据在平面坐标系中的对应坐标系中的对应点画出来,得到点画出来,得到表示两个变量的表示两个变量的一组数据的图形,一组
6、数据的图形,这样的图形叫做这样的图形叫做散点图散点图。年龄年龄脂肪脂肪239.52717.83921.24125.9454927.526.35028.25329.65430.25631.45730.8年龄年龄脂肪脂肪5833.56035.26134.6探究探究O202530 354045 50 55 60 65年龄年龄脂肪含量脂肪含量510152025303540从散点图发现:年从散点图发现:年龄越大,体内脂肪龄越大,体内脂肪含量越高,点的位含量越高,点的位置散布在从左下角置散布在从左下角到右上角的区域。到右上角的区域。称它们成称它们成正相关正相关 如高原含氧量与海拔高如高原含氧量与海拔高度的
7、相关关系,海平面以上,度的相关关系,海平面以上,海拔高度越高,含氧量越少。海拔高度越高,含氧量越少。作出散点图发现,它们散作出散点图发现,它们散布在从左上角到右下角的区布在从左上角到右下角的区域内。又如汽车的载重和汽域内。又如汽车的载重和汽车每消耗车每消耗1升汽油所行使的升汽油所行使的平均路程,称它们成平均路程,称它们成负相关负相关.O 观察散点图可以发现散点图中的点大致分布在一观察散点图可以发现散点图中的点大致分布在一条直线附近条直线附近,像这样,像这样,如果散点图中点的分布从整体如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之上看大致在一条直线附近,我们就称这两个变量
8、之间具有间具有线性相关关系线性相关关系,这条直线叫做这条直线叫做回归直线回归直线,该直线叫该直线叫回归方程回归方程。202530 35 4045 50 55 60 65年龄年龄脂肪含量脂肪含量0510152025303540 那么,我们该那么,我们该怎样来求出这个怎样来求出这个回归方程?请同回归方程?请同学们展开讨论,学们展开讨论,能得出哪些具体能得出哪些具体的方案?的方案?.方案方案1、先画出一条直线,测量出各点与、先画出一条直线,测量出各点与它的距离,再移动直线,到达一个使距离的和它的距离,再移动直线,到达一个使距离的和最小时,测出它的斜率和截距,得回归方程。最小时,测出它的斜率和截距,得
9、回归方程。202530 35 4045 50 55 60 65年龄年龄脂肪含量脂肪含量0510152025303540.方案方案2、在图中选两点作直线,使直线、在图中选两点作直线,使直线两侧的点的个数基本相同。两侧的点的个数基本相同。202530 35 4045 50 55 60 65年龄年龄脂肪含量脂肪含量0510152025303540 方案方案3、如果多取几对点,确定多条直线,再、如果多取几对点,确定多条直线,再求出这些直线的斜率和截距的平均值作为回归直求出这些直线的斜率和截距的平均值作为回归直线的斜率和截距。而得回归方程。线的斜率和截距。而得回归方程。202530 35 4045 50
10、 55 60 65年龄年龄脂肪含量脂肪含量05101520253035400202530354550 5560 x年龄年龄510152025303540y脂肪含量脂肪含量4065我们上面给出的几种方案可靠性都不是很强我们上面给出的几种方案可靠性都不是很强 人们经过长期的实践与研究人们经过长期的实践与研究,已经找到了已经找到了计算回归方程的较为科学的方法计算回归方程的较为科学的方法:0202530354550 5560 x年龄年龄510152025303540y脂肪含量脂肪含量4065设回归方程为设回归方程为 人们经过长期的实践与研究人们经过长期的实践与研究,已经找到了已经找到了计算回归方程的较
11、为科学的方法计算回归方程的较为科学的方法:0202530354550 5560 x年龄年龄510152025303540y脂肪含量脂肪含量4065AB设回归方程为设回归方程为 0202530354550 5560 x年龄年龄510152025303540y脂肪含量脂肪含量4065AB距离之和:距离之和:越小越好越小越好设回归方程为设回归方程为 0202530354550 5560 x年龄年龄510152025303540y脂肪含量脂肪含量4065AB点到直线距离的平方和:点到直线距离的平方和:设回归方程为设回归方程为当当Q取最小值时,所有点到直线的取最小值时,所有点到直线的“整体距离整体距离”
12、最小。最小。经推导:当经推导:当 取最小值时:取最小值时:将将b、a代入即可求得回归方程为代入即可求得回归方程为 以上公式的推导较复杂,故不作推导,以上公式的推导较复杂,故不作推导,这种求回归方程的方法叫这种求回归方程的方法叫最小二乘法最小二乘法。设回归方程为设回归方程为年年龄龄23273941454950脂肪9.517.821.225.927.526.328.2年年龄龄53545657586061脂肪29.630.231.430.833.5 35.234.6例:人的年龄与体内脂肪含量具有线性相例:人的年龄与体内脂肪含量具有线性相关关系,如何求出回归直线的方程?关关系,如何求出回归直线的方程?
13、i1234567xi23273941454950yi9.517.821.225.927.526.328.2xiyi218.5480.6826.81061.91237.51288.71410i891011121314xi53545657586061yi29.630.231.430.833.535.234.6xiyi1568.81630.81758.41755.6194321122110.6解:解:1、设回归方程、设回归方程2、求平均数、求平均数3、求和、求和解:解:1、设回归方程、设回归方程3、求和、求和2、求平均数、求平均数5、写出回归直线的回归方程、写出回归直线的回归方程4、代入公式求、代入
14、公式求 的值的值用用“最小二乘法最小二乘法”求回归直线方程的步骤求回归直线方程的步骤2、求平均数、求平均数3、求和、求和4、代入公式求、代入公式求 的值的值5、写出回归直线的方程、写出回归直线的方程1、设回归方程、设回归方程例:有一个同学家开了一个小卖部,他为了研究气例:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:热饮杯数与当天气温的对比表:摄氏温度摄氏温度 -5 0 4 7 12 15 19 23 27 31 36热饮杯数热饮杯数 156 150 132 128 130 116 1
15、04 89 93 76 54(1)画出散点图;画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一从散点图中发现气温与热饮销售杯数之间关系的一 般规律;般规律;(3)求回归方程;求回归方程;(4)如果某天的气温是如果某天的气温是 C,预测这天卖出的热饮杯数。预测这天卖出的热饮杯数。三、利用线性回归方程对总体进行估计三、利用线性回归方程对总体进行估计解解:(1)散点图散点图(2)气温与热饮杯数成负相关气温与热饮杯数成负相关,即气温越高,即气温越高,卖出去的热饮杯数越少。卖出去的热饮杯数越少。温度温度热饮杯数热饮杯数(3)从散点图可以看出,这些点大致分布从散点图可以看出,这些点大致分布在
16、一条直线附近。在一条直线附近。接下来求出这条回归直线的方程接下来求出这条回归直线的方程(3)、求回归方程;)、求回归方程;摄氏温度摄氏温度-504712151923273136热饮杯数156 150 132 128 130 116 104899376543、求和、求和2、求平均数、求平均数解:解:1、设回归方程、设回归方程(3)解:解:1、设回归方程为:、设回归方程为:3、求和、求和5、写出回归直线的方程、写出回归直线的方程4、代入公式求、代入公式求 的值的值2、求平均数、求平均数样本中心点的概念:(3)、求回归方程;)、求回归方程;摄氏温度摄氏温度-504712151923273136热饮杯
17、数156 150 132 128 130 116 10489937654求出回归直线的方程为:求出回归直线的方程为:(4)当)当x=2时,时,y=143.063,因此,这天大约可以卖出因此,这天大约可以卖出143杯热饮。杯热饮。Y=-2.352x+147.767练习:练习:实验测得四组(实验测得四组(x,y)的值如下表所示)的值如下表所示:x1234y2345则则y与与x之间的回归直线方程为(之间的回归直线方程为()(参考数值:(参考数值:)A课堂检测:课堂检测:1、(、(09.宁夏海南理)对变量宁夏海南理)对变量x,y观测数据(观测数据(xi,yi)(i=1,2,.,10),得得散点图散点图
18、1;对变量;对变量u,v有观测数据有观测数据(ui,vi)(i=1,2,.,10),得散点图得散点图2,由这两个散点图可判断(由这两个散点图可判断()yxovou图1图2A、变量、变量x与与y 正相关,正相关,u与与v正相关;正相关;B、变量、变量x与与y 正相关,正相关,u与与v负相关;负相关;C、变量、变量x与与y 负相关,负相关,u与与v正相关;正相关;D、变量、变量x与与y 负相关,负相关,u与与v负相关;负相关;C课堂检测:课堂检测:2、(、(2010.广东文)某市居民广东文)某市居民2005-2009年家庭平均收入年家庭平均收入x(单(单位:万元位:万元)与年平均支出与年平均支出Y
19、(单位:万元)的统计资料如下表(单位:万元)的统计资料如下表:年份年份 2005 2006 2007 2008 2009收入收入x11.512.11313.315支出支出Y6.88.89.81012家庭年平均收入与年平均支出有家庭年平均收入与年平均支出有 线性相关关系?线性相关关系?正正课堂检测:课堂检测:3 3.假设关于某种设备的使用年限假设关于某种设备的使用年限x x和支出的维修费用和支出的维修费用y y(万元万元)有以下的统计资料有以下的统计资料使用年限使用年限23456维修费用维修费用2.23.85.56.57.0(1 1)求支出的维修费用)求支出的维修费用y y与使用年限与使用年限x
20、 x的回归方程;的回归方程;(2 2)估计使用年限为)估计使用年限为1010年时,维修费用是多少?年时,维修费用是多少?参考数值:参考数值:约为约为12.38课后作业课后作业1 1.设某种产品经过技术改造后生产产品设某种产品经过技术改造后生产产品x x吨需要吨需要y y吨标准煤吨标准煤 有以下的统计资料:有以下的统计资料:X吨产品吨产品3456Y吨标准煤吨标准煤2.5344.5(1 1)画散点图)画散点图(2 2)求回归方程)求回归方程(3 3)技改前)技改前100100吨产品需要吨产品需要9090吨标准煤,技改后,节约了吨标准煤,技改后,节约了多少煤?多少煤?课后作业:课后作业:2、已知变量、已知变量x与变量与变量y有下列对应有下列对应数据:数据:x1234y0.51.523则则y对对x的回归直线方程为的回归直线方程为