1、,第 三 章,统计案例,3.1 回归分析的基本思想及其初步应用,自主学习 新知突破,1通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用 2了解线性回归模型与函数模型的差异,了解判断模型拟合效果的方法:相关指数和残差分析 3体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法,下列变量关系是相关关系的是 (1)学生的学习时间与学习成绩之间的关系; (2)某家庭的收入与支出之间的关系; (3)学生的身高与视力之间的关系; (4)球的体积与半径之间的关系,提示 对于(1),学习时间影响学生的学习成绩,但是学生学习的刻苦程度、学习方法、教师的
2、授课水平等其他因素也影响学习成绩,因此学生的学习时间与学习成绩之间具有相关关系; 对于(2),也是相关关系; 对于(3),身高与视力之间没有关系; 对于(4),球的体积与半径之间是函数关系,线性回归模型,2变量样本点中心:_,回归直线过样本点的中心 3线性回归模型y_,其中_和_是模型的未知参数,_称为随机误差自变量x又称为_,因变量y又称为_,bxae,a,b,e,解释变量,预报变量,4随机误差产生的原因,刻画回归效果的方式,残差,样本编号,身高数据,体重估计值,越小,解释,预报,残差图的缺点 (1)残差e受许多条件的影响,也受我们所选用的线性模型的影响 (2)作残差图有时不够精确,也难于区
3、分拟合效果的好坏,因此多数情况下,选用计算相关指数R2来说明拟合,1两个变量之间的相关关系是一种( ) A确定性关系 B线性关系 C非线性关系 D可能是线性关系也可能不是线性关系,解析: 变量之间的相关关系是一种非确定性的关系,如果所有数据点都在一条直线附近,那么它们之间就是一种线性相关关系,否则不是线性相关关系故选D. 答案: D,解析: 由于销售量y与销售价格x成负相关,故排除B,D.又当x10时,A中y100,而C中y300,C不符合题意,故选A. 答案: A,3下表是x和y之间的一组数据,则y关于x的线性回归方程必过点_.,4关于x与y有如下数据:,合作探究 课堂互动,线性回归分析,某
4、班5名学生的数学和物理成绩如下表: (1)画出散点图; (2)求物理成绩y对数学成绩x的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩,思路点拨,规律方法 1.求线性回归方程的基本步骤:,2需特别注意的是,只有在散点图大致呈直线时,求出的线性回归方程才有实际意义,否则求出的回归方程毫无意义,1某地最近十年粮食需求量逐年上升,下表是部分统计数据:,残差分析,某运动员训练次数与运动成绩之间的数据关系如下: (1)作出散点图; (2)求出回归方程; (3)作出残差图; (4)计算相关指数R2; (5)试预测该运动员训练47次及55次的成绩,解析: (1)作出该运动员训练次数(x)
5、与成绩(y)之间的散点图,如下图所示,由散点图可知,它们之间具有线性相关关系,(2)列表计算:,(3)残差分析 作残差图如下图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适,规律方法 1.对于建立的回归模型进行残差分析,一般从以下几方面进行:(1)残差图;(2)残差平方和;(3)相关指数 2相关指数R2的作用 利用相关指数R2可以刻画拟合效果的好坏在线性回归模型中,R2的取值越接近1,说明残差的平方和越小,即说明模型的拟合效果越好,2已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据: 求y对x的回归直线方程,并说明回归模型拟合效果的好坏,非线性回
6、归分析,某地区不同身高的未成年男性的体重平均值如下表:,(1)试建立y与x之间的回归方程; (2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高为175 cm,体重为82 kg的在校男生体重是否正常? (3)求相关指数R2.,思路点拨,(1)根据上表中数据画出散点图如下图 由图看出,样本点分布在某条指数函数曲线yc1ec2x的周围,于是令zln y.,作出散点图如下图 3分,(3),规律方法 解决非线性回归问题 (1)两个变量不具有线性相关关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如yc1ec2x,可通过
7、对数变换把指数关系变为线性关系:令zln y,则变换后样本点应分布在直线zbxa(aln c1,bc2)周围,(2)求非线性回归方程的步骤: 确定变量,作出散点图; 根据散点图,选择恰当的拟合函数; 变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程; 分析拟合效果:通过计算相关指数或画残差图来判断拟合效果; 根据相应的变换,写出非线性回归方程,3为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下: (1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数据的散点图; (2)描述解释变量x与预报变量y之间的关系; (3)计算相关指数,解析: (1)所作散点图如图所示,(2)由散点图看出样本点分布在一条指数函数yc1ec2x的周围,于是令zln y,则,在一次抽样调查中测得样本的5个样本点,数值如下表: 试建立y与x之间的回归方程,【错解】 由已知条件制成下表:,由散点图可以看出y与t呈近似的线性相关关系列表如下:,谢谢观看!,