1、3.1.1回归分析的基本思想及其初步应用人教A版选修2-3 第三章问题1:现实生活中两个变量间的关系有哪些呢?两个变量的关系不相关不相关相关关系相关关系函数关系函数关系线性相关非线性相关函数关系是一种确定性关系相关关系是一种非确定性关系回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.正相关负相关 问题问题2:研究线性相关的两个变量的基本步骤是什:研究线性相关的两个变量的基本步骤是什么?么?问题问题3:求线性回归直线的基本方法是什么?:求线性回归直线的基本方法是什么?画散点图求回归直线方程用回归直线方程进行预报-最小二乘法利用最小二乘法求回归直线的方程niiniiniiiyyxxy
2、yxxr12121r0时,表明两个变量正相关;r0.75时认为两个变量有很强的线性相关关系补充补充必修必修3 3第第9292页阅读材料页阅读材料如何刻画线性关系的强弱?【例例1 1】某产品的广告支出某产品的广告支出x x(单位:万元(单位:万元)与销售收入与销售收入y y(单(单位:万元)之间有下表所对应的数据:位:万元)之间有下表所对应的数据:一、求线性回归方程一、求线性回归方程 请问:广告费请问:广告费为为9万元时,销万元时,销售收入一定是售收入一定是129.4成元吗?成元吗?二、残差分析二、残差分析-刻画拟合效果的几种方式刻画拟合效果的几种方式1.残差2.残差图 可以通过残差发现原始数据
3、中的可以通过残差发现原始数据中的可疑数据可疑数据,判断所,判断所建立模型的拟合程度建立模型的拟合程度.(.(研究残差的意义研究残差的意义)可利用图形来分析残差特性可利用图形来分析残差特性.作图时以作图时以纵坐标为残差纵坐标为残差,横坐横坐标为样本的编号标为样本的编号.如残差比较均匀均匀地落在水平的带状区域带状区域中,说明选用的模型比较合适.带状区域宽度带状区域宽度越越窄窄,模型拟合精度模型拟合精度越高越高,回归方程的预报精度越高.3.相关指数利用相关指数R2来刻画回归的效果niiniiiyyyyR11221R2越接近于1,表示回归的效果越好.R2 是常用的选择模型指标之一,在实际应用中应该尽量
4、选择R2的回归模型。R2取值越大,表示残差平方和越小,模型的拟合效果越好.残差平方和相关指数相关指数R2是是相关系数相关系数r的平方的平方链接总体偏差平方和练一练1.1.判一判判一判(正确的打正确的打“”,错误的打错误的打“”)(1)(1)残差平方和越小残差平方和越小,线性回归方程的拟合效果越好线性回归方程的拟合效果越好.()(2)(2)在画两个变量的散点图时在画两个变量的散点图时,预报变量在预报变量在x x轴上轴上,解释变量在解释变量在y y轴上轴上.()(3)R(3)R2 2越接近于越接近于1,1,线性回归方程的拟合效果越好线性回归方程的拟合效果越好.()2.2.做一做做一做(请把正确的答
5、案写在横线上请把正确的答案写在横线上)(1)(1)从散点图上看从散点图上看,点散布在从左下角到右上角的区域内点散布在从左下角到右上角的区域内,两个两个变量的这种相关关系称为变量的这种相关关系称为.(2)(2)在残差分析中在残差分析中,残差图的纵坐标为残差图的纵坐标为.(3)(3)如果发现散点图中所有的样本点都在一条直线上如果发现散点图中所有的样本点都在一条直线上,则残差平则残差平方和等于方和等于,解释变量和预报变量之间的相关指数等解释变量和预报变量之间的相关指数等于于.答案答案:正相关正相关答案答案:残差残差3.3.在建立两个变量在建立两个变量y y与与x x的回归模型中,分别选择的回归模型中
6、,分别选择4 4个不同模个不同模型,求出它们相对应的型,求出它们相对应的R R2 2如表,则其中拟合效果最好的模型如表,则其中拟合效果最好的模型是是()()A.A.模型模型1 B.1 B.模型模型2 C.2 C.模型模型3 D.3 D.模型模型4 4模型模型1 12 23 34 4R R2 20.670.670.850.850.490.490.230.23B备用:某运动员训练次数与成绩之间的数据关系如下备用:某运动员训练次数与成绩之间的数据关系如下:作出散点图作出散点图.求出回归方程求出回归方程.作出残差图作出残差图,并说明选用的模型的拟合效果并说明选用的模型的拟合效果.计算计算R R2 2,
7、并说明选用的模型的拟合效果并说明选用的模型的拟合效果.次数次数x x30303333353537373939444446465050成绩成绩y y30303434373739394242464648485151练习册第练习册第47页例页例2解析:作出该运动员训练次数解析:作出该运动员训练次数(x)(x)与成绩与成绩(y)(y)之间的散之间的散点图点图,如图所示如图所示,由散点图可知由散点图可知,它们之间具有线性相关关它们之间具有线性相关关系系.所以所以所以回归方程为所以回归方程为 =1.041 5x-0.003 88.=1.041 5x-0.003 88.882iiii 1i 1x 39.25
8、,y 40.875,x12 656,xy13 180,8iii 1822ii 1xy8x yb1.041 5,ay bx0.003 88.x8x$y$作残差图如图所示作残差图如图所示,由图可知由图可知,残差点比较均匀地分布在水平带状区域中残差点比较均匀地分布在水平带状区域中,说明选用说明选用的模型比较合适的模型比较合适.计算得计算得R R2 20.9855,0.9855,说明了该运动员的成绩的差异有说明了该运动员的成绩的差异有98.55%98.55%是由训练次数引起的是由训练次数引起的.【延伸探究延伸探究】在题在题(2)(2)题设条件不变的情况下题设条件不变的情况下,试预测该运动员试预测该运动
9、员训练训练4747次及次及5555次的成绩次的成绩.【解析解析】由上述分析可知由上述分析可知,我们可用回归方程我们可用回归方程 =1.0415x-=1.0415x-0.003880.00388作为该运动员成绩的预报值作为该运动员成绩的预报值.将将x=47x=47和和x=55x=55分别代入该方程可得分别代入该方程可得y49y49和和y57.y57.故预测该运动员训练故预测该运动员训练4747次和次和5555次的成绩分别为次的成绩分别为4949和和57.57.y$【方法技巧方法技巧】刻画回归效果的两种方式刻画回归效果的两种方式(1)(1)残差图法残差图法:残差点比较均匀地落在水平的带状区域内说明选残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适用的模型比较合适.(2)R(2)R2 2法法:R:R2 2=1-=1-越接近越接近1,1,表明回归的效果越好表明回归的效果越好.n2iii 1n2ii 1yyyy$总结:建立回归模型的基本步骤总结:建立回归模型的基本步骤选变量选变量画散点图画散点图选模型选模型求参数求参数分析与预测分析与预测