1、线性回归 简单线性回归模型有一个回归变量x,回归变量x与响应变量y之间存在直线关系,简单线性回归模型为:XY4.944.37-1.581.7-4.451.88-6.060.56-1.222.23-3.551.53样本数据集:regressor_data.csv样本散点图:0123456-10-50510线性回归实践(Linear Regression.py)岭回归(Ridge Regression)岭回归是一种改良的最小二乘估计法,以损失部分信息、降低精度为代价获得回归系数,它是更为符合实际、更可靠的回归方法。对存在离群点的数据的拟合要强于最小二乘法。多项式回归(Polynomial Regr
2、ession)有时候,线性回归并不适用于所有全部的数据,需要曲线来适应数据,比如二次模型,三次模型等。一元多项式回归可以表示成如下形式:多项式回归(PolynomialRegression.py)分析代码中如何构造多项式回归的模型?各个变量的含义。对变量进行的变换具有什么目的?作业:房屋价格预测数据文件:housing.data用散点图分析各个属性与房价的关系将数据划分为训练数据和测试数据分别建立linear regressor和ridge regressor分析两个模型的预测结果8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!数学数学统计内容统计内容1.
3、画散点图画散点图2.了解最小二乘法的思想了解最小二乘法的思想3.求回归直线方程求回归直线方程 ybxa4.用回归直线方程解决应用问题用回归直线方程解决应用问题8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!问题问题1:正方形的面积:正方形的面积y与正方形的边长与正方形的边长x之间之间 的的函数关系函数关系是是y=x2确定性关系确定性关系问题问题2:某水田水稻产量:某水田水稻产量y与施肥量与施肥量x之间是否之间是否 有一个确定性的关系?有一个确定性的关系?例如:在例如:在 7 块并排、形状大小相同的试验田上块并排、形状大小相同的试验田上 进行施肥量对水稻产量
4、影响的试验,得进行施肥量对水稻产量影响的试验,得 到如下所示的一组数据:到如下所示的一组数据:施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455复习复习 变量之间的两种关系变量之间的两种关系8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!10 20 30 40 50500450400350300施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455xy施化肥量施化肥量水稻产量水稻产量 自变量取值
5、一定时,因变量的取值带有一定自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做随机性的两个变量之间的关系叫做相关关系相关关系。1、相关关系的定义、相关关系的定义:1):相关关系是一种不确定性关系;):相关关系是一种不确定性关系;注注对具有相关关系的两个变量进行统计对具有相关关系的两个变量进行统计分析的方法叫分析的方法叫回归分析回归分析。2):):8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!现实生活中存在着大量的相关关系。现实生活中存在着大量的相关关系。探索:水稻产量探索:水稻产量y与施肥量与施肥量x之间大致有何规之间大致有何规律?律?
6、8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!10 20 30 40 50500450400350300发现:图中各点,大致分布在某条直线附近。发现:图中各点,大致分布在某条直线附近。探索探索2:在这些点附近可画直线不止一条,哪条直:在这些点附近可画直线不止一条,哪条直线最能代表线最能代表x与与y之间的关系呢?之间的关系呢?施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455xy散点图散点
7、图施化肥量施化肥量水稻产量水稻产量8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!10 20 30 40 50500450400350300 xy施化肥量施化肥量水稻产量水稻产量yx对于一组具有线性相关关系的数据对于一组具有线性相关关系的数据1122(,),(,),.,(,),nnx yxyxy我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:1122211()(),.(2)()nniiiiiinniiiixxyyxnxybxxxnxy,.(1)aybx1111,.nniiiixx yynn其中
8、(,)x y称为样本点的中心。称为样本点的中心。8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!1、所求直线方程叫做、所求直线方程叫做回归直线方程回归直线方程;相应的直线叫做相应的直线叫做回归直线回归直线。2、对两个变量进行的线性分析叫做、对两个变量进行的线性分析叫做线性回归分析线性回归分析。1122211()(),()nniiiiiinniiiixx yyxnxybxxxnxay bxy 1、回归直线方程、回归直线方程8.5 回归分析案例回归分析案例再冷的石头,坐上三年
9、也会暖再冷的石头,坐上三年也会暖!nn(x-x)(y-y)xy-n x yiiiii=1i=1b=,nn222(x-x)x-n xiii=1i=1 a=y-b x.nn11x=x,y=y.iinni=1i=1其其 中中2.求回归直线的方法求回归直线的方法最小二乘法:最小二乘法:ybxa(,)x y称为样本点的中心称为样本点的中心。8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!4、求回归直线方程的步骤:、求回归直线方程的步骤:1111(1),nniiiixxyynn求211(2),.nniiiiixx y求(3)代入公式)代入公式1122211()(),(
10、),.(1)nniiiiiinniiiixx yyxnxybxxxnxa y bxy(4)写出直线方程为)写出直线方程为y=bx+a,即为所求的回归直线方程。即为所求的回归直线方程。8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!应用:利用回归直线方程对总体进行线性相关性的检验应用:利用回归直线方程对总体进行线性相关性的检验 例例1 1、炼钢是一个氧化降碳的过程,钢水含碳量的多少、炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼钢水含碳量和冶炼时间的关系。如果已测得炉料熔化完毕时,钢
11、水的含碳时间的关系。如果已测得炉料熔化完毕时,钢水的含碳量量x与冶炼时间与冶炼时间y(从炉料熔化完毕到出刚的时间)的一(从炉料熔化完毕到出刚的时间)的一列数据,如下表所示:列数据,如下表所示:x(0.01%)104180190177147134150191204121y(min)100200210185155135170205235125(1 1)y y与与x x是否具有线性相关关系;是否具有线性相关关系;(2 2)如果具有线性相关关系,求回归直线方程;)如果具有线性相关关系,求回归直线方程;(3 3)预测当钢水含碳量为)预测当钢水含碳量为160160个个0.01%0.01%时,应冶炼多少分钟
12、?时,应冶炼多少分钟?8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!解:解:(1)(1)列出下表列出下表,并计算并计算i12345678910 xi104180190177147134150191204121yi100200210185155135170205235125xiyi1040036000399003274522785180902550039155479401512510101022111159.8,172,265448,312350,287640iiiiiiixyyyxx1011010222211100.9906.(10)(10)iiiiii
13、ix yx yrxxyy于是,8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!10110221101.26710iiiiix ybyxxx30.51.aybx 所以回归直线的方程为所以回归直线的方程为 =1.267x-30.51 y(3)(3)当当x=160 x=160时时,1.267.160-30.51=172,1.267.160-30.51=172 y(2)设所求的回归方程为设所求的回归方程为ybxa8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!5.如何描述两个变量之间线性相关关系的强弱?如何描述两个变量之间线性
14、相关关系的强弱?在在数学数学3中,我们学习了用相关系数中,我们学习了用相关系数r来衡量两个变量来衡量两个变量之间线性相关关系的方法。之间线性相关关系的方法。相关系数相关系数r12211()().()()niiinniiiixxyyxxyy0.751,1,0.75,0 25,0.25,rrr 当,表明两个变量正相关很强;当表明两个变量负相关很强;当.表明两个变量相关性较弱。评价回归模型的指标 评价回归模型的指标:平均绝对误差(Mean Absolute Error,MAE)均方误差(Mean Squared Error,MSE)中值绝对误差(Median Absolute Error)可释方差得
15、分(Explained Variance Score)R2决定系数(拟合优度,R2 Score)8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!小结:回归分析的内容与步骤:小结:回归分析的内容与步骤:统计检验通过后,最后是统计检验通过后,最后是利用回归模型,根据自变量去估计、利用回归模型,根据自变量去估计、预测因变量预测因变量。回归分析通过一个变量或一些变量的变化解释回归分析通过一个变量或一些变量的变化解释另一变量的变化。另一变量的变化。其主要内容和步骤是:其主要内容和步骤是:首先根据理论和对问题的分析判断,首先根据理论和对问题的分析判断,将变量分为自变量
16、和因变将变量分为自变量和因变量量;其次,设法其次,设法找出合适的数学方程式(即回归模型)找出合适的数学方程式(即回归模型)描述变量间描述变量间的关系;的关系;由于涉及到的变量具有不确定性,接着还要由于涉及到的变量具有不确定性,接着还要对回归模型进行对回归模型进行统计检验统计检验;8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!例例1 从某大学中随机选取从某大学中随机选取8名女大学生,其身高和体重数据如表名女大学生,其身高和体重数据如表1-1所示。所示。编号12345678身高/cm 165165 157 170 175 165 155 170体重/kg48
17、57505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。的女大学生的体重。案例案例1:女大学生的身高与体重:女大学生的身高与体重解:解:1、选取身高为自变量、选取身高为自变量x,体重为因变量,体重为因变量y,作散点图:,作散点图:2、由散点图知道身高和体重有比较、由散点图知道身高和体重有比较好的线性相关关系,因此可以用线性好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系。回归方程刻画它们之间的关系。8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再
18、冷的石头,坐上三年也会暖!172.85849.0 xy分析:由于问题中分析:由于问题中要求根据身高预报要求根据身高预报体重,因此选取身体重,因此选取身高为自变量,体重高为自变量,体重为因变量为因变量学学身身高高172cm女172cm女大大生生体体重重y=0.849y=0.849172-85.712=60.316(kg)172-85.712=60.316(kg)2.2.回归方程:回归方程:1.散点图;散点图;本例中本例中,r=0.7980.75这表明体重与身高有很强的线性相关关这表明体重与身高有很强的线性相关关系,从而也表明我们建立的回归模型是有意义的。系,从而也表明我们建立的回归模型是有意义的
19、。8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!探究:探究:身高为身高为172cm的女大学生的体重一定是的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?吗?如果不是,你能解析一下原因吗?答:身高为答:身高为172cm的女大学生的体重不一定是的女大学生的体重不一定是60.316kg,但一般可以认为她的体重接近于,但一般可以认为她的体重接近于60.316kg。即,用这个回归方程不能给出每个身高为即,用这个回归方程不能给出每个身高为172cm的女大学生的体重的预测值,只能给出她们平均的女大学生的体重的预测值,只能给出她们平均体重的值。体
20、重的值。8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!比数学3中“回归”增加的内容数学数学统计统计1.画散点图画散点图2.了解最小二乘法了解最小二乘法的思想的思想3.求回归直线方程求回归直线方程ybxa4.用回归直线方程用回归直线方程解决应用问题解决应用问题选修2-3统计案例5.引入线性回归模型引入线性回归模型ybxae6.了解模型中随机误差项了解模型中随机误差项e产产生的原因生的原因7.了解相关指数了解相关指数 R2 和模型拟和模型拟合的效果之间的关系合的效果之间的关系8.了解残差图的作用了解残差图的作用9.利用线性回归模型解决一类利用线性回归模型解决
21、一类非线性回归问题非线性回归问题10.正确理解分析方法与结果正确理解分析方法与结果1、线性回归模型:、线性回归模型:y=bx+a+e,(3)其中其中a和和b为模型的未知参数,为模型的未知参数,e称为随机误差称为随机误差。y=bx+a+e,E(e)=0,D(e)=(4)2.2、数据点和它在回归直线上相应位置的差异、数据点和它在回归直线上相应位置的差异 是随机误差的效应,称是随机误差的效应,称 为为残差残差。)iiyy(iiieyy=3、对每名女大学生计算这个差异,然后分别将所得、对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号表示为:的值平方后加起来,用数学符号表示为:称为
22、称为残差平方和残差平方和,它代表了随机误差的效应。它代表了随机误差的效应。21()niiiyy8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!4、两个指标:两个指标:(1)类比样本方差估计总体方差的思想,可以用作)类比样本方差估计总体方差的思想,可以用作 为为 的估计量,的估计量,越小,预报精度越高。越小,预报精度越高。22111(,)(2)22nieQ a b nnn22(2)我们可以用)我们可以用相关指数相关指数R2来刻画回归的效果,其来刻画回归的效果,其 计算公式是
23、:计算公式是:222112211()()1()()nniiiiinniiiiyyyyRyyyy 8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!表表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。列出了女大学生身高和体重的原始数据以及相应的残差数据。在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用回归模型来拟合数据。否线性相关,是否可以用回归模型来拟合数据。5、残差分析与残差图的定义:、残差分析与残差图的定义:然后,我们可以通过残差然后,我们可以通过残差
24、来判断模型拟合的效果,来判断模型拟合的效果,判断原始数据中是否存在可疑数据,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析这方面的分析工作称为残差分析。12,ne ee编号编号12345678身高身高/cm165165157170175165155170体重体重/kg4857505464614359残差残差-6.3732.6272.419-4.6181.1376.627-2.8830.382 我们可以利用图形来分析残差特性,作图时纵坐标为残差,我们可以利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这横坐标可以选为样本编号,或身高数
25、据,或体重估计值等,这样作出的图形称为样作出的图形称为残差图残差图。残差图的制作及作用残差图的制作及作用1 1、坐标纵轴为残差变量,横轴可以有不同的选择;、坐标纵轴为残差变量,横轴可以有不同的选择;2 2、若模型选择的正确,残差图中的点应该分布在以横、若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域;轴为心的带形区域;3 3、对于远离横轴的点,要特别注意。、对于远离横轴的点,要特别注意。身高与体重残差图异常点 错误数据 模型问题 几点说明:几点说明:第一个样本点和第第一个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为个样本点的残差比较大,需要确认在采集过程中是否有
26、人为的错误。如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数的错误。如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因。据;如果数据采集没有错误,则需要寻找其他的原因。另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三
27、年也会暖!8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!例例2 在一段时间内,某中商品的价格在一段时间内,某中商品的价格x元和需求量元和需求量Y件之间件之间的一组数据为:的一组数据为:求出求出Y对的回归直线方程,并说明拟合效果的好坏。对的回归直线方程,并说明拟合效果的好坏。价格价格x1416182022需求量需求量Y1210753解:解:18,7.4,xy555221111660,327,620,iiiiiiixyx y7.4 1.15 1828.1.a1.1528.1.yx 回归直线方程为:51522155iiiiix yxybxx26205 18 7
28、.41.15.16605 18 8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!例例2 在一段时间内,某中商品的价格在一段时间内,某中商品的价格x元和需求量元和需求量Y件之件之间的一组数据为:间的一组数据为:求出求出Y对的回归直线方程,并说明拟合效果的好坏。对的回归直线方程,并说明拟合效果的好坏。价格价格x1416182022需求量需求量Y1210753列出残差表为列出残差表为521()iiiyy0.3,521()iiyy53.2,5221521()1()iiiiiyyRyy 0.994因而,拟合效果较好。因而,拟合效果较好。iiyyiyy00.3-0.4
29、-0.10.24.62.6-0.4-2.4-4.48.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!练习:练习:关于关于x与与y有如下数据:有如下数据:有如下的两个线性模型:有如下的两个线性模型:(1);(;(2)试比较哪一个拟合效果更好。试比较哪一个拟合效果更好。x24568y30406050706.517.5yx717.yx8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!6 6、注意回归模型的适用范围:、注意回归模型的适用范围:(1)回归方程只适用于我们所研究的样本的总体。样本数据)回归方程只适用于我们所研究的样本的
30、总体。样本数据来自哪个总体的,预报时也仅适用于这个总体。来自哪个总体的,预报时也仅适用于这个总体。(2)模型的时效性。利用不同时间段的样本数据建立的模型,)模型的时效性。利用不同时间段的样本数据建立的模型,只有用来对那段时间范围的数据进行预报。只有用来对那段时间范围的数据进行预报。(3)建立模型时自变量的取值范围决定了预报时模型的适用)建立模型时自变量的取值范围决定了预报时模型的适用范围,通常不能超出太多。范围,通常不能超出太多。(4)在回归模型中,因变量的值不能由自变量的值完全确定。)在回归模型中,因变量的值不能由自变量的值完全确定。正如前面已经指出的,某个女大学生的身高为正如前面已经指出的
31、,某个女大学生的身高为172cm,我们,我们不能利用所建立的模型预测她的体重,只能给出身高为不能利用所建立的模型预测她的体重,只能给出身高为172cm的女大学生的平均体重的预测值。的女大学生的平均体重的预测值。8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!7、一般地,建立回归模型的基本步骤为:、一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解析变量,哪个变量是)确定研究对象,明确哪个变量是解析变量,哪个变量是预报变量。预报变量。(2)画出确定好的解析变量和预报变量的散点图,观察它们)画出确定好的解析变量和预报变量的散点图,观察它们之
32、间的关系(如是否存在线性关系等)。之间的关系(如是否存在线性关系等)。(3)由经验确定回归方程的类型(如我们观察到数据呈线性)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程关系,则选用线性回归方程y=bx+a).(4)按一定规则估计回归方程中的参数(如最小二乘法)。)按一定规则估计回归方程中的参数(如最小二乘法)。(5)得出结果后分析残差图是否有异常(个别数据对应残差)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性,等等),过存在异常,则过大,或残差呈现不随机的规律性,等等),过存在异常,则检查数据是否有误,或模型是否合适等。检查数据是
33、否有误,或模型是否合适等。8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!案例案例2 一只红铃虫的产卵数一只红铃虫的产卵数y和温度和温度x有关。现有关。现收集了收集了7组观测数据列于表中:组观测数据列于表中:(1 1)试建立产卵数)试建立产卵数y y与温度与温度x x之间的回归方程;并之间的回归方程;并预测温度为预测温度为2828o oC C时产卵数目。时产卵数目。(2 2)你所建立的模型中温度在多大程度上解释了)你所建立的模型中温度在多大程度上解释了产卵数的变化?产卵数的变化?温度温度xoC21232527293235产卵数产卵数y/个个71121246
34、61153258.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!选变量选变量 解:选取气温为解释变量解:选取气温为解释变量x x,产卵数,产卵数 为预报变量为预报变量y y。画散点图画散点图假设线性回归方程为假设线性回归方程为:=bx+a选选 模模 型型分析和预测分析和预测当当x=28时,时,y=19.8728-463.73 93估计参数估计参数由计算器得:线性回归方程为由计算器得:线性回归方程为y=y=19.8719.87x x-463.73-463.73 相关指数相关指数R R2 2=r r2 20.8640.8642 2=0.7464=0.7464所以
35、,二次函数模型中温度解释了所以,二次函数模型中温度解释了74.64%的产卵数变化。的产卵数变化。探索新知探索新知050100150200250300350036912151821242730333639方案1当当x=28时,时,y=19.8728-463.73 93一元线性模型一元线性模型8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!y=bx2+a 变换变换 y=bt+a非线性关系非线性关系 线性关系线性关系方案2问题问题选用选用y=bx2+a,还是,还是y=bx2+cx+a?问题问题3 产卵数产卵数气温气温问题问题2如何求如何求a、b?合作探究合作探究
36、 t=x2二次函数模型二次函数模型方案2解答平方变换平方变换:令令t=xt=x2 2,产卵数,产卵数y y和温度和温度x x之间二次函数模型之间二次函数模型y=bxy=bx2 2+a+a就转化为产卵数就转化为产卵数y y和温度的平方和温度的平方t t之间线性回归模型之间线性回归模型y=bt+ay=bt+a温度温度21232527293235温度的平方温度的平方t44152962572984110241225产卵数产卵数y/个个711212466115325作散点图,并由计算器得:作散点图,并由计算器得:y y和和t t之间的线性回归方程为之间的线性回归方程为y=y=0.3670.367t t-
37、202.54-202.54,相关指数,相关指数R R2 2=r r2 20.8960.8962 2=0.802=0.802将将t=xt=x2 2代入线性回归方程得:代入线性回归方程得:y=y=0.3670.367x x2 2-202.54-202.54当当x x=28=28时时,y y=0.367=0.36728282 2-202.5485202.5485,且,且R R2 2=0.802=0.802,所以,二次函数模型中温度解所以,二次函数模型中温度解释了释了80.2%80.2%的产卵数变化。的产卵数变化。t8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!
38、问题问题 变换变换 y=bx+a非线性关系非线性关系 线性关系线性关系2110c xyc问题问题如何选取指数函数的底如何选取指数函数的底?产卵数产卵数气温气温指数函数模型指数函数模型方案3合作探究合作探究对数对数8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!方案3解答温度温度xoC21232527293235z=lgy0.851.041.321.381.822.062.51产卵数产卵数y/个个711212466115325xz当当x=28x=28o oC C 时,时,y 44 y 44,指数回归,指数回归模型中温度解释了模型中温度解释了98.5%98.5
39、%的产卵数的的产卵数的变化变化由计算器得:由计算器得:z z关于关于x x的线性回归方程的线性回归方程为为z=0.118z=0.118x x-1.665-1.665,相关指数相关指数R R2 2=r r2 20.99250.99252 2=0.985=0.9850.118x-1.665 10y 对数变换:在对数变换:在 中两边取常用对数得中两边取常用对数得令令 ,则,则 就转换为就转换为z z=bx+a=bx+a22111221lglg(10)lglg10lglg10lgc xc xycccc xc xc2110c xyc12lg,lg,zy ac bc2110c xyc8.5 回归分析案例回
40、归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!用身高预报体重时,需要注意下列问题:用身高预报体重时,需要注意下列问题:1、回归方程只适用于我们所研究的样本的总体;、回归方程只适用于我们所研究的样本的总体;2、我们所建立的回归方程一般都有时间性;、我们所建立的回归方程一般都有时间性;3、样本采集的范围会影响回归方程的适用范围;、样本采集的范围会影响回归方程的适用范围;4、不能期望回归方程得到的预报值就是预报变量的精确值。、不能期望回归方程得到的预报值就是预报变量的精确值。事实上,它是预报变量的可能取值的平均值。事实上,它是预报变量的可能取值的平均值。这些问题也使用于其他问题。这
41、些问题也使用于其他问题。涉及到统计的一些思想:涉及到统计的一些思想:模型适用的总体;模型适用的总体;模型的时间性;模型的时间性;样本的取值范围对模型的影响;样本的取值范围对模型的影响;模型预报结果的正确理解。模型预报结果的正确理解。小结小结 8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!8.5 回归分析案例回归分析案例再冷的石头,坐上三年也会暖再冷的石头,坐上三年也会暖!作业:作业:假设关于某设备的使用年限假设关于某设备的使用年限x和所支出的维修费用和所支出的维修费用 y(万元),有如下的统计资料。(万元),有如下的统计资料。使用年限使用年限x 23456维修费用维修费用y 2.23.85.56.57.0若由资料知若由资料知,y对对x呈线性相关关系。试求:呈线性相关关系。试求:(1)线性回归方程)线性回归方程 的回归系数的回归系数 ;(2)求残差平方和;)求残差平方和;(3)求相关系数)求相关系数 ;(4)估计使用年限为)估计使用年限为10年时,维修费用是多少?年时,维修费用是多少?ybxa ab、2R
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。