1、 2.3.2线性回归线性回归直直线线方程方程1 1、两、两个变量之间的相关关系的个变量之间的相关关系的含义含义自变量取值一定时,因变量的取值带有一定自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系随机性的两个变量之间的关系.正相关的散点图中的点散布在从左下角到右正相关的散点图中的点散布在从左下角到右上角的区域上角的区域,负相关负相关的散点图中的点散布在从左上角到右的散点图中的点散布在从左上角到右下角的区域下角的区域 复习回顾复习回顾:2 2、成正相关和负相关的两个相关变、成正相关和负相关的两个相关变量的散点图分别有什么特点?量的散点图分别有什么特点?:上节在上节在一次对人体脂肪
2、含量和年龄关系的研一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:究中,研究人员获得了一组样本数据:年龄年龄2323272739394141454549495050脂肪脂肪9.517.821.225.927.526.328.2年龄年龄5353545456565757585860606161脂肪脂肪29.629.6 30.230.2 31.431.4 30.830.8 33.533.535.235.234.634.6 探究探究:通过散点图我们发现人体通过散点图我们发现人体的脂肪含量与年龄的脂肪含量与年龄之间之间是是正相关正相关,那么当年龄增加时,体内脂肪含,那么当年龄增加时,体
3、内脂肪含量到底是以什么方式增加的呢?我们这一节就从量到底是以什么方式增加的呢?我们这一节就从理论上研究一下理论上研究一下 探究探究:1、散点图中样本点的中心怎么确定?样本数据的平均数样本数据的平均数1111,nniiiixx yyx ynn则是这组数据的中心点散点图中的点分布整体上看大致在散点图中的点分布整体上看大致在经经过散点中心过散点中心一条直线一条直线附近,附近,2、样本点的分布有什么规律?我们就称这两个变量之间具有我们就称这两个变量之间具有线性相关关系线性相关关系,这条直线叫做这条直线叫做回归直线回归直线,回归直线的方程回归直线的方程简称:简称:回归方程回归方程.2线性回归方程人教A版
4、必修三数学PPT课件2线性回归方程人教A版必修三数学PPT课件如何如何才能才能找到合适的回归直线?找到合适的回归直线?合作交流合作交流:方案方案1、在图中选取两点画直线,使得直线两侧的点在图中选取两点画直线,使得直线两侧的点的个数基本相同。的个数基本相同。2线性回归方程人教A版必修三数学PPT课件2线性回归方程人教A版必修三数学PPT课件方案方案2、在散点图中多取几组点,确定几条直线的方在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的斜率和截距的平均数,将这程,分别求出各条直线的斜率和截距的平均数,将这两个平均数作为回归方程的斜率和截距。两个平均数作为回归方程的斜率和截距。2线性回
5、归方程人教A版必修三数学PPT课件2线性回归方程人教A版必修三数学PPT课件方案方案3:先画一条直线,测量出各点到它的距离,然后先画一条直线,测量出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测量出移动直线,到达一个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程。此时直线的斜率和截距,就得到回归方程。2线性回归方程人教A版必修三数学PPT课件2线性回归方程人教A版必修三数学PPT课件 根据不同的标准可画出不同的直线来近似地表示这种线性关系,但让人感觉可靠性不强 这里在y的上方加记号“”,是为了区别实际值y,y对x的回归直线方程a,b叫做回归系数要确定回归直线方
6、程,只要确定回归系数a,b.2线性回归方程人教A版必修三数学PPT课件2线性回归方程人教A版必修三数学PPT课件),(11yx),(22yx),(iiyx),(nnyxiiyyxy2221122()()()nnQybxaybxaybxa由于含有绝对值,运算不方便,于是改用为由于含有绝对值,运算不方便,于是改用为则则 n 个距离之和可表达个距离之和可表达为:为:11|=|nniiiiiiyyybxa22yy()(1,2,)iiiiyyybxain代表代表 n 个点与回归直线的个点与回归直线的“整体距离整体距离(偏差)偏差)”2线性回归方程人教A版必修三数学PPT课件2线性回归方程人教A版必修三数
7、学PPT课件1122211()(),()nniiiiiinniiiixx yyxnxybxxxnxaybxy 以上以上公式的推导较复杂,故不作公式的推导较复杂,故不作推导推导。通过通过求的求的 Q最小值最小值而得到回归直线方程的方法,即而得到回归直线方程的方法,即求线性回归直线,使得样本数据的点到它的求线性回归直线,使得样本数据的点到它的距距离离(偏差偏差)的平方和的平方和最小的方法叫做最小的方法叫做最小二乘法。最小二乘法。2221122()()()nnQybxaybxaybxa问题问题归结归结为:为:求求当当 a,b取何值时取何值时Q最小值,最小值,整体距离整体距离最小最小2线性回归方程人教
8、A版必修三数学PPT课件2线性回归方程人教A版必修三数学PPT课件用最小二乘法的探索过程1niiiybxa21niiiybxa2221122,nnQybxaybxaybxaa b当取什么值时,Q的值最小,即“整体距离”最小.根据数学理论含绝对值,运算不方便xbyaxnxyxnxxxyyxxbniiniiiniiniiiy,)()(12211212线性回归方程人教A版必修三数学PPT课件2线性回归方程人教A版必修三数学PPT课件求样本数据的线性回归方程,可按下列步骤进行:求样本数据的线性回归方程,可按下列步骤进行:第一步,计算平均数第一步,计算平均数 ,xy1niiix y21niix第二步,求
9、和第二步,求和 ,1122211()(),()nniiiiiinniiiixx yyx ynx ybaybxxxxnx第三步,计算第三步,计算 ybxa第四步,写出回归方程第四步,写出回归方程 2线性回归方程人教A版必修三数学PPT课件2线性回归方程人教A版必修三数学PPT课件 利用利用计算器或计算机可求得年龄计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程为和人体脂肪含量的样本数据的回归方程为 ,由此由此我们可以根据一我们可以根据一个人个年龄预测其体内脂肪含量的百分比个人个年龄预测其体内脂肪含量的百分比的的回归值回归值.若某人若某人3737岁,则其体内脂肪含量岁,则其体内脂肪含量的
10、百分比约为多少?的百分比约为多少?0.5770.448yx=-20.87%20.87%例例1、下表提供了某厂节能降耗技术改造后生产下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量甲产品过程中记录的产量x(吨吨)与相应的生产能耗与相应的生产能耗y(吨标准吨标准煤煤)的几组对照数据:的几组对照数据:x3456y2.5344.5 例题精讲例题精讲:(1)散点图如图所示:散点图如图所示:1.下列说法:线性回归方程适用于一切样本和总体;线性回归方程一般都有局限性;样本取值的范围会影响线性回归方程的适用范围;线性回归方程得到的预测值是预测变量的精确值.其中正确的是_.练习练习:2.实验测得四组(
11、x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为().21.1.1.2C yxD yxA yxB yxA 例例2 2、有有一个同学家开了一个小卖部,他为了研究一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的饮气温对热饮销售的影响,经过统计,得到一个卖出的饮料杯数与当天气温的对比表:料杯数与当天气温的对比表:摄氏温度摄氏温度()-504712热饮杯数热饮杯数 15615013212813015192327313611610489937654(1)画出散点图;画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的从散
12、点图中发现气温与热饮销售杯数之间关系的一般一般规律;规律;(3)求回归方程;求回归方程;(4)如果某天的气温是如果某天的气温是2,预测这天卖出的热饮杯数。预测这天卖出的热饮杯数。解解:(1)散点图散点图(2)气温与热饮杯数成负相关气温与热饮杯数成负相关,即气温越高,即气温越高,卖出去的热饮杯数越少。卖出去的热饮杯数越少。温度温度热饮杯数热饮杯数(3)从散点图可以看出,这些点大致分布从散点图可以看出,这些点大致分布在一条直线附近。在一条直线附近。Y=-2.352x+147.767(4)当)当x=2时,时,y=143.063,因此,这天大因此,这天大约可以卖出约可以卖出143杯热饮。杯热饮。(1)回归直线是各数据点与此直线在回归直线是各数据点与此直线在整体上最接近的一条(最优拟合整体上最接近的一条(最优拟合),),(2)最小二乘法)最小二乘法(离差平方和为最小)(离差平方和为最小)求回归直线方程的求回归直线方程的公式。公式。(3)利用线性回归方程对总体进行估利用线性回归方程对总体进行估计进行预测。计进行预测。小结小结:xbyaxnxyxnxxxyyxxbniiniiiniiniiiy,)()(1221121