1、1.1回归分析的基本思想及其初步应用 学习目标 1.了解随机误差、残差、残差图的概念.2.会通过分析残差判断线性回归模型的拟合效果.3.掌握建立线性回归模型的步骤.知识链接1.什么叫回归分析?答回归分析是对具有相关关系的两个变量进行统计分析的一种方法.2.回归分析中,利用线性回归方程求出的函数值一定是真实值吗? 答不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等.要点三非线性回归分析例3下表为收集到的一组数据:x21232527293235y711212466115325(
2、1)作出x与y的散点图,并猜测x与y之间的关系;解作出散点图如下图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线yc1e 的周围,其中c1,c2为待定的参数.2c x(2)建立x与y的关系,预报回归模型并计算残差;解对两边取对数把指数关系变为线性关系,令zln y,则有变换后的样本点应分布在直线zbxa(aln c1,bc2)的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为x21232527293235z1.9462.3983.0453.1784.1904.7455.784残差(3)利用所得模型,预报x40时y
3、的值.解当x40时,ye0.272403.8491 131.规律方法解决非线性回归问题的方法及步骤(1)确定变量:确定解释变量为x,预报变量为y;(2)画散点图:通过观察散点图并与学过的函数(幂、指数、对数函数、二次函数)作比较,选取拟合效果好的函数模型;(3)变量置换:通过变量置换把非线性回归问题转化为线性回归问题;(4)分析拟合效果:通过计算相关指数等来判断拟合效果;(5)写出非线性回归方程.跟踪演练3在试验中得到变量y与x的数据如下表:试求y与x之间的回归方程,并预测x40时,y的值.x1923273135y41124109325解作散点图如图所示,从散点图可以看出,两个变量x,y不呈线
4、性相关关系,根据学过的函数知识,样本点分布的曲线符合指数型函数yc1e ,通过对数变化把指数关系变为线性关系,令zln y,则zbxa(aln c1,bc2).列表:x1923273135z1.3862.3983.1784.6915.7842c x作散点图如图所示,从散点图可以看出,两个变量x,z呈很强的线性相关关系.由表中的数据得到线性回归方程为: 0.277x3.998.所以y关于x的指数回归方程为: e0.277x3.998.所以,当x40时,ye0.277403.9981 190.347.1.下列各组变量之间具有线性相关关系的是()A.出租车费与行驶的里程B.学习成绩与学生身高C.身高
5、与体重D.铁的体积与质量C2.若劳动生产率x(千元)与月工资y(元)之间的线性回归方程为 5080 x,则下列判断正确的是()A.劳动生产率为1 000元时,月工资为130元B.劳动生产率提高1 000元时,月工资平均提高80元C.劳动生产率提高1 000元时,月工资平均提高130元D.月工资为210元时,劳动生产率为2 000元B解析由于销售量y与销售价格x成负相关,故排除B、D.又当x10时,A中y100,而C中y300,C不符合题意,故选A.答案A4.对两个变量x,y取得4组数据(1,1)(2,1.2),(3,1.3),(4,1.37),甲、乙、丙三人分别求得数学模型如下:甲:y0.1x
6、1,乙:y0.05x20.35x0.7,丙:y0.80.5x1.4,试判断三人谁的数学模型更接近于客观实际.解对甲模型:y0.1x1,对丙模型:y0.80.5x1.4,显然丙的残差平方和最小,故丙模型更接近于客观实际.课堂小结回归分析的基本思路(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程 x );(4)按一定规则估计回归方程中的参数;(5)提出结果后分析残差图是否有异常(个别数据对应的残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是否合适等.