1、回归分析的基本思想及其初步应用回归分析的基本思想及其初步应用 预习课本预习课本 P8089,思考并完成以下问题思考并完成以下问题 1什么是回归分析?什么是回归分析? 2什么是线性回归模型?什么是线性回归模型? 3求线性回归方程的步骤是什么?求线性回归方程的步骤是什么? 新知初探新知初探 1回归分析回归分析 (1)回归分析回归分析 回归分析是对具有回归分析是对具有 的两个变量进行统计分析的一种的两个变量进行统计分析的一种 常用方法常用方法 (2)回归方程的相关计算回归方程的相关计算 对于两个具有线性相关关系的变量的一组数据对于两个具有线性相关关系的变量的一组数据(x1,y1),(x2, y2),
2、(xn,yn)设其回归直线方程为设其回归直线方程为y b x a ,其中 ,其中a , ,b 是待 是待 定参数,由最小二乘法得定参数,由最小二乘法得 相关关系相关关系 b i1 n xix yiy i1 n xix 2 i1 n xiyinx y i1 n x2 i nx 2 , a yb x (3)线性回归模型线性回归模型 线性回归模型线性回归模型 ybxae, E e 0,D e 2 ,其中,其中 a,b 为模型的未知为模型的未知 参数,通常参数,通常 e 为为 ,称为,称为 x 称为称为 变量,变量,y 称为称为 变量变量 随机变量随机变量 随机误差随机误差 解释解释 预报预报 点睛点
3、睛 对线性回归模型的三点说明对线性回归模型的三点说明 (1)非确定性关系:线性回归模型非确定性关系:线性回归模型 ybxae 与确定性函与确定性函 数数 yabx 相比,它表示相比,它表示 y 与与 x 之间是统计相关关系之间是统计相关关系(非确定非确定 性关系性关系), 其中的随机误差, 其中的随机误差 e 提供了选择模型的准则以及在模型提供了选择模型的准则以及在模型 合理的情况下探求最佳估计值合理的情况下探求最佳估计值 a,b 的工具的工具 (2)线性回归方程线性回归方程y b x a 中 中a , ,b 的意义是:以 的意义是:以a 为基数, 为基数, x 每增加每增加 1 个单位,个单
4、位,y 相应地平均增加相应地平均增加b 个单位 个单位 2线性回归分析线性回归分析 (1)残差:对于样本点残差:对于样本点(xi,yi)(i1,2,n)的随机误差的估计值的随机误差的估计值 称为相应于点 称为相应于点(xi,yi)的残差,的残差, 称为残差平方和称为残差平方和 (2)残差图: 利用图形来分析残差特性, 作图时纵坐标为残差图: 利用图形来分析残差特性, 作图时纵坐标为 , 横横 坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出 的图形称为残差图的图形称为残差图 (3)R21 i1 n yiy i 2 i1 n
5、 yiy 2 越接近越接近 1,表示回归的效果越好,表示回归的效果越好 e i yiy I i1 n (yiy i)2 残差残差 小试身手小试身手 1判断下列命题是否正确判断下列命题是否正确(正确的打正确的打“”“”,错误的打,错误的打“”“”) (1)残差平方和越小,残差平方和越小, 线性回归方程的拟合效果越好线性回归方程的拟合效果越好( ) (2)在画两个变量的散点图时,在画两个变量的散点图时, 预报变量在预报变量在 x 轴上,解释变轴上,解释变 量在量在 y 轴上轴上 ( ) (3)R2越小,越小, 线性回归方程的拟合效果越好线性回归方程的拟合效果越好 ( ) 2从散点图上看,点散布在从
6、左下角到右上角的区域内,从散点图上看,点散布在从左下角到右上角的区域内, 两个变两个变 量的这种相关关系称为量的这种相关关系称为_ 答案:答案:正相关正相关 3在残差分析中,在残差分析中, 残差图的纵坐标为残差图的纵坐标为_ 答案:答案:残差残差 4如果发现散点图中所有的样本点都在一条直线上,如果发现散点图中所有的样本点都在一条直线上, 则残差则残差 平方和等于平方和等于_, 解释变量和预报变量之间的相关系解释变量和预报变量之间的相关系 数等于数等于_ 答案:答案:0 1 或或1 典例典例 某研究机构对高三学生的记忆力某研究机构对高三学生的记忆力x和判断力和判断力y进行进行 统计分析,得下表数
7、据统计分析,得下表数据 x 6 8 10 12 y 2 3 5 6 (1)请画出上表数据的散点图;请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出请根据上表提供的数据,用最小二乘法求出 y 关于关于 x 的的 线性回归方程线性回归方程 y b x a ; ; (3)试根据求出的线性回归方程,预测记忆力为试根据求出的线性回归方程,预测记忆力为 9 的同学的的同学的 判断力判断力 求线性回归方程求线性回归方程 解解 (1)散点图如图:散点图如图: (2) i1 n xiyi6283105126158, x6 81012 4 9,y2 356 4 4, i1 n x2 i 62
8、82102122344 b 158 494 344492 14 20 0 7, a yb x 40 792 3, 故线性回归方程为故线性回归方程为y 07x23 (3)由由(2)中线性回归方程知,当中线性回归方程知,当 x9 时,时,y 079234, 故预测记忆力为故预测记忆力为 9 的同学的判断力约为的同学的判断力约为 4 求线性回归方程的三个步骤求线性回归方程的三个步骤 (1)画散点图: 由样本点是否呈条状分布来判断两个量是否画散点图: 由样本点是否呈条状分布来判断两个量是否 具有线性相关关系具有线性相关关系 (2)求回归系数:若存在线性相关关系,则求回归系数求回归系数:若存在线性相关关
9、系,则求回归系数 (3)写方程:写出线性回归方程,并利用线性回归方程进行写方程:写出线性回归方程,并利用线性回归方程进行 预测说明预测说明 活学活用活学活用 某工厂某工厂 18 月份某种产品的产量与成本的统计数据见下表:月份某种产品的产量与成本的统计数据见下表: 月份月份 1 2 3 4 5 6 7 8 产量产量 (吨吨) 56 60 61 64 70 75 80 82 成本成本 (万元万元) 130 136 143 149 157 172 183 188 以产量为以产量为 x,成本为,成本为 y (1)画出散点图;画出散点图; (2)y 与与 x 是否具有线性相关关系?若有,求出其回归方程是
10、否具有线性相关关系?若有,求出其回归方程 解:解:(1)由表画出散点图,如图所示由表画出散点图,如图所示 (2)从上图可看出,这些点基本上散布在一条直线附近,可以认从上图可看出,这些点基本上散布在一条直线附近,可以认 为为 x 和和 y 线性相关关系显著,下面求其回归方程,首先列出下表线性相关关系显著,下面求其回归方程,首先列出下表 xi yi x xiyi 1 56 130 3136 7280 2 60 136 3600 8160 3 61 143 3721 8723 4 64 149 4096 9536 5 70 157 4900 1 0990 6 75 172 5625 1 2900 7
11、 80 183 6400 1 4640 8 82 188 6724 1 5416 548 1 258 38202 8 7645 计算得计算得x685,y15725 b i1 8 xiyi8xy i1 8 x2 i 8x 2 8 764.5 86.85157.25 382.0286.852 2217, a yb x157252217685539, 故线性回归方程为故线性回归方程为y 2217x539 题点一:线性回归分析题点一:线性回归分析 1在一段时间内,某种商品的价格在一段时间内,某种商品的价格 x 元和需求量元和需求量 y 件之间的一组件之间的一组 数据为:数据为: x 14 16 18
12、20 22 y 12 10 7 5 3 求出求出 y 对对 x 的回归直线方程,并说明拟合效果的程度的回归直线方程,并说明拟合效果的程度 回归分析回归分析 解:解:x1 5(14 16182022)18, y1 5(12 10753)74 i1 5 x2 i 1421621822022221 660, i1 5 xiyi14121610187205223620, 可得回归系数可得回归系数b i1 5 xiyi5xy i1 5 x2 i 5x 2 620 5187.4 1 6605182 115 所以所以a 7411518281 所以回归直线方程所以回归直线方程:y 115x281 列出残差表列
13、出残差表: yiy i 0 03 04 01 02 yiy 46 26 04 24 44 则则 i1 5 (yiy i)2 03, i1 5 (yiy)2532 R21 i1 5 yiy i 2 i1 5 yiy 2 0994 所以回归模型的拟合效果很好所以回归模型的拟合效果很好 题点二:非线性回归分析题点二:非线性回归分析 2为了研究某种细菌随时间为了研究某种细菌随时间 x 变化繁殖个数变化繁殖个数 y 的变化,收集的变化,收集 数据如下数据如下 时间时间 x/天天 1 2 3 4 5 6 繁殖个数繁殖个数 y 6 12 25 49 95 190 (1)用时间作解释变量,繁殖个数作预报变量作
14、出这些数据用时间作解释变量,繁殖个数作预报变量作出这些数据 的散点图;的散点图; (2)求求 y 与与 x 之间的回归方程之间的回归方程 解:解:(1)散点图如图所示:散点图如图所示: (2)由散点图看出样本点分布在一条指数函数由散点图看出样本点分布在一条指数函数 y1c1ec2x 的周围,的周围, 于是令于是令 zln y,则,则 x 1 2 3 4 5 6 z 179 248 322 389 455 525 由计算器算得由计算器算得,z 069x1112,则有则有y e0.69x 1.112 (1)当两个变量已明显呈线性相关关系时,则无需作散点图,当两个变量已明显呈线性相关关系时,则无需作
15、散点图, 就可直接求回归直线方程,否则要先判定相关性再求回归方就可直接求回归直线方程,否则要先判定相关性再求回归方 程判断拟合效果的好坏需要利用程判断拟合效果的好坏需要利用 R2确定,确定,R2越接近越接近 1,说明,说明 拟合效果越好拟合效果越好 (2)非线性回归方程的求法非线性回归方程的求法 根据原始数据根据原始数据(x,y)作出散点图;作出散点图; 根据散点图,选择恰当的拟合函数;根据散点图,选择恰当的拟合函数; 作恰当的变换,将其转化成线性函数,求线性回归方程;作恰当的变换,将其转化成线性函数,求线性回归方程; 在在的基础上通过相应的变换,即可得非线性回归方程的基础上通过相应的变换,即可得非线性回归方程 “多练提能多练提能熟生巧熟生巧”见见“课时跟踪检测课时跟踪检测(十七十七)” ( (单击进入电子文档单击进入电子文档) )