1、数学建模回归分析模型Keep focusedFollow me Jiang 数学建模回归分析模型 回归分析概述 几类回归分析模型比较 一元线性回归模型 多元线性回归模型 注意点数学建模回归分析模型回归分析 名词解释:回归分析是确定两种或两种以上变数 间相互赖的定量关系的一种统计分析方法。解决问题:用于趋势预测、因果分析、优化问题等。几类常用的回归模型:一元线性回归线性回归 多元线性回归非线性回归有何区别与联系?数学建模回归分析模型自变量 (仅从形式上)线性回归一元线性回归一元一次多元线性回归多元一次非线性回归(暂不说明)多元多次及其他函数形式.eg,ykxb xR1 12201122.,2,n
2、niiiKKiiyk xk xk x nkRYXXXu1231 exp()()xYLogistic模型数学建模回归分析模型一元线性回归模型模型 随机变 量(因变量)与实际变 量(因变量)存在着某种相关关系。现对 做正态假设确定这种关系为:其中 为未知参数,与 无关。上式等价于这就是一元线性回归模型一元线性回归模型,为回归系数。是随机误差,是人们不可控制的。Yx2(,)YN abx2,a bx2,(0,)YabxN b2(0,)NY数学建模回归分析模型一元线性回归模型 估计方法:最小二乘法求解:对 取不全相同的值做独立实验,得到样本。记第 组实验的误差 ,使总误差尽量小,即下式有最小值:x112
3、2(,),(,),.,(,)nnx Yx Yx Yii2211()nniiiiiyabx2,a biyiiixbay数学建模回归分析模型一元线性回归模型 估计令其偏导数为零,求得最大似然估计为:这样我们就求得了未知参数 的值,我们记为关于的经验回归方程,简称回归方程,其图形为回归直线。上面右式为计算 公式,越小,用一次线性函数研究随机变量与的关系就越有效。121()()()niiiniixxyybxxaybx 2,a byabx,a b2niiiyyn211()222数学建模回归分析模型一元线性回归模型线性假设的显著性检验必要性:上面我们假设 关于 的回归形式是否为线性函数需要检验,称为拟合优
4、度检验方法:相关系数法(还有其他方法)样本相关系数如右式。为相关系数。与 无关系,不相关 存在相关关系 niiniiniiiXYyynxxnyyxxnR12121)(1)(1)(1 1,1yyxxxylllRR0,Rya1,yyxxlRbl yx线性相关关系显著线性相关关系不显著判别准则判别准则接近1接近0|R|R线性相关关系显著接近1接近0线性相关关系显著接近1接近0线性相关关系显著接近1线性相关关系不显著接近0线性相关关系显著接近1|R|R当当R R(n 2),(通常取(通常取0.80.8)认为认为X与与Y之间的线性相关关系显著,之间的线性相关关系显著,反之,则不显著反之,则不显著线性相关
5、关系不显著接近0线性相关关系显著接近1线性相关关系不显著接近0线性相关关系显著接近1Yx|R|R数学建模回归分析模型一元线性回归模型应用举例 在研究机器工作效应时,测得工作时间与出品率如下表所示,求出品率关于工作时间的回归方程并作拟合优度检验。工作时长10 1112 13141516 171819出品率45 5154 61667074 788589数学建模回归分析模型解:12110,14.5,67.3()()398.54.830382.5()67.34.8303 14.52.7394niiiniinxyxxyybxxaybx 4.83032.7394yx0.9981xyxxyylRll所以回归
6、方程为:相关系数值为:相关系数接近1,说明随机变量与x具有显著的相关性,线性回归的拟合度较高,检验通过请同学将结论与实际问题结合,分析工作时长与出品率的关系,并预测20小时和6小时时的出品率?时间趋于无限大呢?数学建模回归分析模型一元线性回归的Excel实现(1)将数据导入Excel工作表;(2)工具栏中选插入图表XY散点图;(3)选择数据区域,填写标题、图例等内容,完成;(4)右击散点图选添加趋势线线性(类型)在选项中选显示公式和R平方值。此时作出了回归图并求得方程;(5)在工具栏中选工具数据分析找到回归并确定选择数据区域、输出数据区域,勾选置信度残差、标准残差、线性拟合图。此时得到几个表格
7、,可查得回归系数、常数项及R平方值。请同学用Excel完成上面的例题Excel是做一元线性回归的其中一种软件,还有Spss,Matlab都可以做数学建模回归分析模型多元线性回归模型模型 现实生活中,一个变量往往受到多个因素的影响,假设有 个因素,称为解释变量,这种多个解释变量与因变量构成的这种关系称为多元线性关系,由这种关系构成的函数关系式称为多元线性回归模多元线性回归模型型,其一般式如下:称为回归系数。111211012122221212111kknnnknknYXXXuYXXXuYXXXu 矩阵形式(1,2,.,)jjkn01122,1,2,.,iiiKKiiYXXXin数学建模回归分析模
8、型多元线性回归模型 估计方法:最小二乘法基本思想:寻找实际值与拟合值的离差平方和最小的回归直线。由于参数未知,需要样本回归函数,如下所示:类比一元线性回归模型为使误差最小,这里称为残差,则下式取最小值,ikiKiiiiieXXXeYY221102110122)()(kikiiniiiiXXYYYeQ残差平方和j数学建模回归分析模型多元线性回归模型 估计 令上式 对 的偏导数为零,得到正规方程组,用线性代数的方法求解,求得值为:j其中 为矩阵形式,具体如下:Qj1()TTX XX Y11121012122221121.1.,.1.ppkkkkkpxxxyxxxyXYyxxx,X Y数学建模回归分
9、析模型多元线性回归模型线性假设的显著性检验必要性:与一元线性回归模型类似,多元线性回归模型也需要进行拟合优度检验。样本观测值和回归函数因变量满足关系:可决系数(判定系数)可决系数(判定系数)为为:可决系数可决系数越靠近1,模型对数据的拟合程度越好。通常可决 系数大于0.80即判定通过检验。模型检验还有很多方法,以后会逐步接触222()()()iiiiYYYYYYTSSESSRSS2R22211()iieESSRSSRTSSTSSYY 数学建模回归分析模型多元线性回归模型应用实例例2 某厂生产的一种电器的销售量与竞争对手的价格 和本厂的价格 有关。下表是该商品在10个城市的销售记录。1x2x1x
10、2xy 元120140190130155175125145180150 元 10011090150210150250270300250 个 10210012077469326696585请建立销售量与两个价格之间的关系,并进行检验数学建模回归分析模型解:分别画出y与x1,y与x2的散点图,判断关系,可以看出y与x2可以看出有线性关系,而y与x1关系较为复杂,现假设关系为:01 122yxx1301401501601701801902040608010012010015020025030020406080100120编写如下Matlab程序:x1=120 140 190 130 155 175
11、125 145 180 150;x2=100 110 90 150 210 150 250 270 300 250;y=102 100 120 77 46 93 26 69 65 85;x=ones(10,1),x1,x2;b,bint,r,rint,stats=regress(y,x);b,bint,stats 结果:stats=0.6527 6.5786 0.0247 R平方值为0.6527,不接近1,p=0.0247,在 时模型失效进一步讨论采用二次函数形式:0.012222211122110 xxxxy编写如下Matlab程序:x1=120 140 190 130 155 175 12
12、5 145 180 150;x2=100 110 90 150 210 150 250 270 300 250;y=102 100 120 77 46 93 26 69 65 85;x=x1 x2;rstool(x,y,purequadratic)得到回归系数为:beta=-312.5871 7.2701 -1.7337 -0.0228 0.0037rmse=16.6436 这时的剩余残差为16.6436,已经达到最小,所以此时回归方程可用。数学建模回归分析模型注 意回归分析模型主要用于分析几个变数之间的相关关系,定量的给出数学表达式,即回归方程,同时对未知量作出预测,因果分析或寻找最值情况,
13、根据变量个数灵活选取;由于模型最初是对变量关系的一种假设,必须要做显著性检验;用回归分析解决问题时不仅仅是得到方程式,要结合问题对结果进行分析,升华成结论。数学建模回归分析模型多元线性回归回归系数的确定(1)偏导数为零kjeQjij,20)(2(2)得到正规方程组011221111201112121111111101122111.nnnniikikiiiiinnnnniiiikiikiiiiiiinnnikikiikiiiikxxxyxxx xx xx yxx xx x2111knkikikiiixx y数学建模回归分析模型(3)用矩阵式求解111102111111111211111.nnniikiiiinnnniiiikiiiiiiknnnnikikiikipiiiiinxxyxxx xx yxx xxx yTTX XX Y1()TTX XX Y数学建模回归分析模型Thank you