1、创设情景创设情景 篮篮球明星的身高和体重球明星的身高和体重 乔乔丹丹身高:身高:198cm体重:体重:98kg 科比科比身高:身高:201cm体重:体重:100kg 安安东东尼尼身高:身高:203cm体重:体重:104kg 詹姆斯詹姆斯身高:身高:203cm体重:体重:113kg 加内特加内特身高:身高:211cm体重:体重:109kg 姚明姚明身高:身高:226cm体重:体重:134kg创设情景创设情景 篮篮球明星的身高和体重球明星的身高和体重1、身高和体重之、身高和体重之间间有怎有怎样样的关系的关系?2、如何来研究它、如何来研究它们们之之间间的的这这种关系?种关系?1、两个、两个变变量之量
2、之间间的关系分的关系分为为哪几哪几类类?并并举举例例说说明明2、进进行行线线性回性回归归分析的一般步分析的一般步骤骤是什么?是什么?两个变量的关系两个变量的关系不相关不相关相关关系相关关系函数关系函数关系线性相关线性相关非线性相关非线性相关相关关系相关关系:对于两个变量,当自变量取值一定时,因:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系变量的取值带有一定随机性的两个变量之间的关系.温故知新温故知新函数关系函数关系是一种确定性关系。是一种确定性关系。相关关系相关关系是一种非确定性关系。是一种非确定性关系。回回归归分析分析是是对对具有相关关系的两个具有相关关系
3、的两个变变量量进进行行统计统计分分析的一种常用方法析的一种常用方法问题呈现问题呈现例例1、当堂、当堂统计统计10名高名高二男二男生的身高体重数据生的身高体重数据,汇汇总总后求出根据身高后求出根据身高预报预报体重的回体重的回归归方程,并随机方程,并随机调查调查一名高一名高二男二男生的身高数据并生的身高数据并预测预测出体重。出体重。身高和体重的关系用线性回归模型身高和体重的关系用线性回归模型y=bx+a+e来表示来表示,其中其中a和和b为模型的为模型的 未知参数,未知参数,e称为称为随机误差随机误差。思考思考1产生随机误差项产生随机误差项e的原因是什么?的原因是什么?体重体重身高身高测量误差测量误
4、差模型选取模型选取饮食习惯饮食习惯遗传因素遗传因素其他因素其他因素一次函数模型和线性回归模型的区别一次函数模型和线性回归模型的区别和联系是什么?和联系是什么?思考思考2线性回归模型线性回归模型y=bx+a+e解解释变释变量量x(身高)(身高)随机随机误误差差e预报变预报变量量y(体重)体重)一次函数模型:一次函数模型:y=bx+ay=bx+a线性函数模型:线性函数模型:y=bx+a+ey=bx+a+e特殊特殊一般一般xy1x4x5x3x2x1 y5 y1y5y 在实际应用中,我们用回归方程中在实际应用中,我们用回归方程中 中的中的 来估计来估计y=bx+a+e中的中的bx+a,由于随机误差,由
5、于随机误差e=y-(bx+a),所以所以 axbyy yye是是e的估计量。的估计量。111yye555yye探究探究2在线性回归模型中,在线性回归模型中,e是是bx+a预报真实值预报真实值y的随的随机误差,它是一个不可观测量,那么应该怎样机误差,它是一个不可观测量,那么应该怎样研究随机误差呢?研究随机误差呢?称为相应点(xi,yi)的残差残差ie 思考思考3如何发现数据中的错误?如何衡量模型如何发现数据中的错误?如何衡量模型的拟合效果?的拟合效果?我我们们可以利用可以利用图图形来分析残差特性。形来分析残差特性。作作图时纵图时纵坐坐标为标为残差,横坐残差,横坐标标可以可以选为样选为样本本编编号
6、,号,或身高数据,或体重估或身高数据,或体重估计值计值等等,这样这样作出的作出的图图形称形称为为残差残差图图。1、找出残差、找出残差绝对值绝对值比比较较大的点。大的点。2、观观察残差点是否均匀地落在水平察残差点是否均匀地落在水平带带状区域中。状区域中。问题问题2、在、在某次某次考试中,高二年级的某同学因为突发事件,考试中,高二年级的某同学因为突发事件,物理考试缺考,已知他的语文成绩物理考试缺考,已知他的语文成绩70分,数学成绩分,数学成绩86分。分。你能想到什么方法来预测一下如果他参加物理考试,能你能想到什么方法来预测一下如果他参加物理考试,能考多少分?(其他同学的成绩已知)考多少分?(其他同
7、学的成绩已知)姓姓名名语语文文数数学学物物理理1 17171888889892 28282929276763 37070949488884 48383828268685 57777929280806 68282969676767 77676818168688 87070878781819 9767687878888424424 919188887878实例讲解实例讲解1、一项研究要确定是否能够根据施肥量预测作物的产量,这里的解释变量是()2、已知回归方程中,回归系数为1.23,样本点的中心为(4,5),则回归直线为()3、若一个样本的总偏差平方和为80,残差平方和为60,则相关指数 为()4、一位母亲记录了儿子39岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145.83cm;B.身高在145.83cm以上;C.身高在145.83cm以下;D.身高在145.83cm左右.2R施肥量施肥量08.023.1xy0.25D随堂练习随堂练习布置作业布置作业小结小结1、回、回归归分析的基本思想是什么?分析的基本思想是什么?2、如何建立回、如何建立回归归模型?模型?