[高等教育]8统计回归模型课件.ppt_163文库

资源描述

1、在工程问题中，常常需要根据两个变量的在工程问题中，常常需要根据两个变量的几组实验数值几组实验数值实验数据，来找出这两个变实验数据，来找出这两个变量的函数关系的近似表达式通常把这样得到量的函数关系的近似表达式通常把这样得到的函数的近似表达式叫做的函数的近似表达式叫做经验公式经验公式. .一、经验公式问题：问题：如何得到经验公式，常用的方法是什么？如何得到经验公式，常用的方法是什么？第六部分第六部分统计回归模型统计回归模型二、最小二乘法例例1 1为了测定刀具的磨损速度，我们做这样的为了测定刀具的磨损速度，我们做这样的实验：经过一定时间实验：经过一定时间( (如每隔一小时如每隔一小时) )，测量

2、一，测量一次刀具的厚度次刀具的厚度, ,得到一组试验数据如下：得到一组试验数据如下：顺序编号顺序编号i01234567时间时间it(小时小时)01234567刀具厚度刀具厚度iy(毫米毫米)27.0 26.8 26.5 26.3 26.1 25.7 25.3 24.3试根据上面的试验数据建立试根据上面的试验数据建立 y 和和 t 之间的经验公之间的经验公式式)(tfy= =. . 观观察察可可以以认认为为)(tfy = =是是线线性性函函数数, ,并并设设,)(battf = =其其中中a和和b是是待待定定常常数数. .tyo1 247356824252627如图，在坐标纸上画出如图，在坐标纸

3、上画出这些点，这些点，因为这些点本来不在一条直线上，我们只因为这些点本来不在一条直线上，我们只能要求选取这样的能要求选取这样的，使得，使得在在处的函数值与实验数据处的函数值与实验数据相相差都很小差都很小ba,battf = =)(710,ttt710,yyy解解首先确定首先确定)(tf的类型的类型. .就是要使偏差就是要使偏差 )7 , 2 , 1 , 0()(= = itfyii都很小都很小.因此可以考虑选取常数因此可以考虑选取常数，使得，使得 ba, = = = =702)(iiibatyM定义定义这种根据偏差的平方和为最小的条件来选这种根据偏差的平方和为最小的条件来选择常数择常

4、数的方法叫做的方法叫做最小二乘法最小二乘法ba,这种确定常数的方法是通常所采用的这种确定常数的方法是通常所采用的.最小来保证每个偏差的绝对值都很小最小来保证每个偏差的绝对值都很小M把看成自变量把看成自变量和和的一个二元函数，的一个二元函数，ab那么问题就可归结为求函数那么问题就可归结为求函数在那在那些点处取得最小值些点处取得最小值.),(baMM = = = = = = = = = = = = =7070; 0)(2, 0)(2iiiiiiibatybMtbatyaM令令代入方程组得代入方程组得 = = = = . 5 .208828,71728140baba解此方程组，得到解此方程组

5、，得到.125.27,3036. 0= = = =ba这样便得到所求经验公式为这样便得到所求经验公式为)2(.125.273036. 0)( = = =ttfy由（由（2）式算出的函数值）式算出的函数值与实测与实测的有的有一定的偏差一定的偏差.现列表比较如下：现列表比较如下：)(itfiyit01234567实实测测iy27.026.826.526.326.125.725.324.3算算得得)(itf27.125 26.821 26.518 26.214 25.911 25.607 25.303 25.000偏偏差差-0.125-0.021-0.018-0.0860.1890.093-0.

6、003-0.200偏差的平方和偏差的平方和，它的平方根它的平方根 108165. 0= =M329. 0= =M我们把我们把称为称为均方误差均方误差，它的大小在一定，它的大小在一定程度上反映了用经验公式来近似表达原来函数关程度上反映了用经验公式来近似表达原来函数关系的近似程度的好坏系的近似程度的好坏M设经实际测量已得设经实际测量已得到到n组数据（组数据（xi , yi），），i=1, n。将数据。将数据画在平面直角坐标系中，见画在平面直角坐标系中，见图。如果建模者判断图。如果建模者判断这这n个点很个点很象是分布在某条直线附近，令象是分布在某条直线附近，令该直线方程该直线方程为为y

7、=ax+b，进而，进而利用数据来求参利用数据来求参数数a和和b。由于该直线只是数据近似满足的。由于该直线只是数据近似满足的关系式，故关系式，故 yi-(axi+b)=0一般不成立，但我们希望一般不成立，但我们希望 =niiibaxy12)(最小最小此式对此式对a和和b的偏导数均的偏导数均为为0，解相应方程组，求得：解相应方程组，求得： =xaybxxyyxxaniiniii121)()(y=ax+byO(xi ,yi)x其中其中和和分别为分别为xi和和yi的平均值的平均值 xyabax yx xLLyx=11()()nnx yiiiiiiLxxyyx ynx y=22211()nnxx

8、iiiiLxxxnx=其中：其中：例例2.在某种产品表面进行腐蚀刻线试验，在某种产品表面进行腐蚀刻线试验，得到腐蚀深度与腐蚀时间对应的一组数据得到腐蚀深度与腐蚀时间对应的一组数据求回归方程？求回归方程？xy （秒）（秒）5101520304050607090120 （微米）（微米）610101316171923252946解：解：Matlab命令：命令：5.31820.3049yx=回归方程：x=5 10 15 20 30 4050 60 70 90 120;y=6 10 10 13 16 17 19 23 25 29 46;p=polyfit(x, y,1) 显示：P= 0.3049 5.

9、31820204060801001205101520253035404550 x=5 10 15 20 30 40 50 60 70 90 120;y=6 10 10 13 16 17 19 23 25 29 46;x1=0:0.2:120;y1=0.304*x1+5.344;plot(x,y,*);hold on plot(x1,y1,r);例例3 3 在研究单分子化学反应速度时，得到下列数据：在研究单分子化学反应速度时，得到下列数据：6.58.912.216.622.731.041.957.6242118151296387654321ii iy其中其中表示从实验开始算起的时间，表示从实验

10、开始算起的时间，表示时刻表示时刻反应物的量试定出经验公式反应物的量试定出经验公式 y).( fy = = 解解)( fy = = 由化学反应速度的理论知道，由化学反应速度的理论知道，应是应是指数函数：指数函数：, mkey = =其中其中和和是待定常数是待定常数.km将他们代入方程组得将他们代入方程组得 = = = = . 3 .108108,1221081836baba解这方程组，得解这方程组，得 = = = = = =.8964. 1lg,045. 04343. 0kbma.78.78,1036. 0= = = =km因此所求经验公式为因此所求经验公式为.78.781036. 0

11、= =ey由于由于,lgbay = = 讨论：讨论：我们希望建立一个我们希望建立一个体重体重与与身高身高之间的关系式，不难看出两者之间的关系式，不难看出两者之间的关系不易通过机理的分析得出，不妨可以采取之间的关系不易通过机理的分析得出，不妨可以采取统计统计方法方法，用数据来拟合出与实际情况较为相符的经验公式。，用数据来拟合出与实际情况较为相符的经验公式。为为此，我们先作一番抽样调查，测量了十五个不同高度的人的此，我们先作一番抽样调查，测量了十五个不同高度的人的体重，列成了体重，列成了下表，在抽样时，各高度的人都需经适当挑选，下表，在抽样时，各高度的人都需经适当挑选，既不要太胖也不要太瘦

12、。既不要太胖也不要太瘦。例例4 体重与身高的关系体重与身高的关系将表中的数画将表中的数画到到h-w平面上，你会发现这些数据分布很接近某平面上，你会发现这些数据分布很接近某一指数曲线。为此，一指数曲线。为此，对对h和和w均取对数，令均取对数，令x=lnh，y=lnw，将，将（xi，yi）再画到）再画到x-y平面中去（平面中去（i=1,15），这次你会发现这），这次你会发现这些点几乎就分布在一条直线附近，令此直线的些点几乎就分布在一条直线附近，令此直线的方程为方程为y=ax+b，用最小二乘法求，用最小二乘法求得得a2.3,b2.82，故可取，故可取y=2.32x+2.84，即，即lnw=2

13、.32lnh+2.84，故有，故有w=17.1h2.327566595451体重体重 w（公斤）（公斤）1.851.781.711.671.63身高身高 h（米）（米）5048413527体重体重 w（公斤）（公斤）1.601.551.511.351.26身高身高 h（米）（米）2017151210体重体重 w（公斤）（公斤）1.121.080.960.860.75身高身高 h（米）（米）三、小结用的一种用的一种，其中最小二乘法是常，其中最小二乘法是常作曲线拟合有多种方法作曲线拟合有多种方法，给定平面上一组点给定平面上一组点), 3 , 2 , 1(),(niyxii= =最小二乘法的原理：最

14、小二乘法的原理：达到最小达到最小，使，使求求 = = = =niiibatyMtf12)()(注意：计算机与数据拟合注意：计算机与数据拟合练练习习题题:(%)0的数据如下表的数据如下表与与，由实验测得，由实验测得为为，其溶解温度，其溶解温度为为比比某种合金的含铅量百分某种合金的含铅量百分 pCp之间的经验公式之间的经验公式与与试用最小二乘法建立试用最小二乘法建立bapp = = %pC0 9 .367 .467 .631812351972922832708 .770 .845 .87建立牙膏销售量与价格、广告投入之间的模型；预测在不建立牙膏销售量与价格、广告投入之间的模型；预测在不同价格

15、和广告费用下的牙膏销售量。同价格和广告费用下的牙膏销售量。问问题题为此收集了为此收集了30个销售周期本公司牙膏销售量、价格、广个销售周期本公司牙膏销售量、价格、广告费用，及同期其它厂家同类牙膏的平均售价。（下表）告费用，及同期其它厂家同类牙膏的平均售价。（下表）实例一实例一. .牙膏的销售量牙膏的销售量9.260.556.804.253.70307.930.055.803.853.80298.510.256.754.003.7527.38-0.055.503.803.851销售量销售量(百万支百万支)价格差价格差（元）（元）广告费用广告费用(百万元百万元)其它厂家其它厂家价格价格(元元)本公

16、司价本公司价格格(元元)销售销售周期周期基本模型基本模型y 公司牙膏销售量公司牙膏销售量x1其它厂家与本公司其它厂家与本公司价格差价格差x2公司广告费用公司广告费用=110 xy=222210 xxy55.566.577.577.588.599.510 x2y-0.200.20.40.677.588.599.510 x1y=22322110 xxxyx1, x2解释变量解释变量(回归变量回归变量, 自变量自变量) y被解释变量（因变量）被解释变量（因变量） 0, 1 , 2 , 3 回归系数回归系数随机随机误差（误差（均值为零的均值为零的正态分布随机变量）正态分布随机变量）MATLAB 统计

17、工具箱统计工具箱模型求解模型求解b,bint,r,rint,stats=regress(y,x,alpha) 输入输入 x= n 4数数据矩阵据矩阵, 第第1列为全列为全1向量向量1 2221xxxalpha(置信置信水平水平,0.05) =22322110 xxxyb 的的估计值估计值 bintb的置信区间的置信区间 r 残差向量残差向量y-xb rintr的置信区间的置信区间 Stats检验统计量检验统计量 R2,F, p yn维数据向量维数据向量输出输出由数据由数据 y,x1,x2估计估计参数参数参数估计值参数估计值置信区间置信区间17.32445.7282 28.92061.30

18、700.6829 1.9311 -3.6956-7.4989 0.1077 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p=0.0000 0 1 2 3结果分析结果分析y的的90.54%可由模型确定可由模型确定参数参数参数估计值参数估计值置信区间置信区间17.32445.7282 28.92061.30700.6829 1.9311 -3.6956-7.4989 0.1077 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p=0.0000 0 1 2 3=22322110 xxxyF远超过远超过F检验的临界值检验的临界值

19、p远小于远小于 =0.05 2的置信区间包含零点的置信区间包含零点(右端点距零点很近右端点距零点很近) x2对因变量对因变量y 的的影响不太显著影响不太显著x22项显著项显著模型从整体上看成立模型从整体上看成立可将可将x22留在模型留在模型22322110 xxxy=销售量预测销售量预测价格差价格差x1=其它厂家其它厂家价格价格x3-本公司本公司价格价格x4估计估计x3调整调整x4控制价格差控制价格差x1=0.2元，投入广告费元，投入广告费x2=650万元万元销售量预测区间为销售量预测区间为 7.8230，8.7636（置信度（置信度95%）上限用作库存管理的目标值上限用作库存管理的目标值

20、下限用来把握公司的现金流下限用来把握公司的现金流若估计若估计x3=3.9，设定，设定x4=3.7，则可以，则可以95%的把握的把握知道销售额在知道销售额在 7.8320 3.7 29（百万元）以上（百万元）以上控制控制x1通过通过x1, x2预测预测y2933.822322110=xxxy(百万支百万支)模型改进模型改进x1和和x2对对y的的影响独立影响独立 =22322110 xxxy=21422322110 xxxxxy参数参数参数估计值参数估计值置信区间置信区间17.32445.7282 28.92061.30700.6829 1.9311 -3.6956-7.4989 0.1077

21、 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p=0.0000 0 1 2 3参数参数参数估计值参数估计值置信区间置信区间29.113313.7013 44.525211.13421.9778 20.2906 -7.6080-12.6932 -2.5228 0.67120.2538 1.0887 -1.4777-2.8518 -0.1037 R2=0.9209 F=72.7771 p=0.0000 3 0 1 2 4x1和和x2对对y的影响有的影响有交互作用交互作用两模型销售量预测两模型销售量预测比较比较21422322110 xxxxxy=22322110

22、 xxxy=2933. 8 =y(百万支百万支)区间区间 7.8230，8.7636区间区间 7.8953，8.7592 3272. 8 =y(百万支百万支)控制价格差控制价格差x1=0.2元，投入广告费元，投入广告费x2=6.5百万元百万元预测区间长度更短预测区间长度更短略有增加略有增加 y x2=6.5x1=0.2 -0.200.20.40.67.588.59x1y -0.200.20.40.67.588.59x1y 56787.588.599.510 x2y 567888.599.51010.5x2y 22322110 xxxy=21422322110 xxxxxy=两模型两模型与与

23、x1, ,x2关系的关系的比较比较y 交互作用影响的讨论交互作用影响的讨论2221 . 06712. 07558. 72267.301xxyx=价格差价格差 x1=0.1 价格差价格差 x1=0.32223 . 06712. 00513. 84535.321xxyx=21422322110 xxxxxy=5357. 72x加大广告投入使销售量增加加大广告投入使销售量增加（ x2大于大于6百万元）百万元）价格差较小时增加价格差较小时增加的速率更大的速率更大 56787.588.599.51010.5x1=0.1x1=0.3x2y 1 . 03 . 011=xxyy价格优势会使销售量增加价格优势

24、会使销售量增加价格差较小时更需要靠广告价格差较小时更需要靠广告来吸引顾客的眼球来吸引顾客的眼球完全二次多项式模型完全二次多项式模型 =22521421322110 xxxxxxyMATLAB中有命令中有命令rstool直接求解直接求解00.20.47.588.599.5105.566.57x1x2y ),(543210=从输出从输出 Export 可得可得从这个实例我们看到，建立回归模型可以从这个实例我们看到，建立回归模型可以先根据已知的数据，从常识和经验进行分析，辅先根据已知的数据，从常识和经验进行分析，辅以作图，决定取哪几个回归变量，及它们的函数以作图，决定取哪几个回归变量，及它们的

25、函数形式（如线性的、二次的）。用软件（形式（如线性的、二次的）。用软件（MATLABMATLAB）来解后，作统计分析，来解后，作统计分析，、、值的大小是对值的大小是对模型整体的评价，每个回归系数置信区间是否包模型整体的评价，每个回归系数置信区间是否包含零点，可以用来检验对应的因变量的影响是否含零点，可以用来检验对应的因变量的影响是否显著（若包含零点则不显著）。如果对结果不够显著（若包含零点则不显著）。如果对结果不够满意，则应改进模型，如添加二次项、交互相等。满意，则应改进模型，如添加二次项、交互相等。2RFp资历资历从事专业工作的年数；管理从事专业工作的年数；管理 1= =管理人员，管

26、理人员，0= =非管理人非管理人员；教育员；教育 1= =中学，中学，2= =大学，大学，3= =更高程度更高程度建立模型研究薪金与资历、管理责任、教育程度的关系建立模型研究薪金与资历、管理责任、教育程度的关系分析人事策略的合理性，作为新聘用人员薪金的参考分析人事策略的合理性，作为新聘用人员薪金的参考编编号号薪金薪金资资历历管管理理教教育育0113876111021160810303187011130411283102编编号号薪金薪金资资历历管管理理教教育育422783716124318838160244174831601451920717024619346200146名软件开发人员的档案资

27、料名软件开发人员的档案资料实例二实例二. . 软件开发人员的薪金软件开发人员的薪金分析与假设分析与假设 y 薪金薪金，x1 资历（年）资历（年）x2 = = 1 管理人员，管理人员，x2 = = 0 非管理人员非管理人员1= =中学中学2= =大学大学3= =更高更高=其它中学,x013=其它大学,x014资历每加一年薪金的增长是常数；资历每加一年薪金的增长是常数；管理、教育、资历之间无交互作用管理、教育、资历之间无交互作用教教育育=443322110 xaxaxaxaay线性回归模型线性回归模型 a0, a1, , a4是待估计的回归系数，是待估计的回归系数，是随机误差是随机误差中学

28、：中学：x3=1, x4=0 ；大大学：学：x3=0, x4=1；更高：更高：x3=0, x4=0 模型求解模型求解=443322110 xaxaxaxaay参数参数参数估计值参数估计值置信区间置信区间a011032 10258 11807 a1546 484 608 a26883 6248 7517 a3-2994 -3826 -2162 a4148 -636 931 R2=0.957 F=226 p=0.000R2,F, p 模型整体上可用模型整体上可用资历增加资历增加1年薪年薪金增长金增长546 管理人员薪金多管理人员薪金多6883 中学程度薪金比更中学程度薪金比更高的少高的少2994

29、大学程度薪金比更大学程度薪金比更高的多高的多148 a4置信区间包含零点，置信区间包含零点，解释不可靠解释不可靠! !中学：中学：x3=1, x4=0;大大学：学：x3=0, x4=1; 更高：更高：x3=0, x4=0. x2 = = 1 管理，管理，x2 = = 0 非管理非管理x1资历资历( (年年) )残差分析方法残差分析方法结果分析结果分析443322110 xaxaxaxaay=残差残差yye=e 与资历与资历x1的关系的关系 05101520-2000-1000010002000e与管理与管理教育组合的关系教育组合的关系 123456-2000-1000010002000残差

30、全为正，或全为负，管理残差全为正，或全为负，管理教教育组合处理不当育组合处理不当残差大概分成残差大概分成3个水平，个水平，应在模型中增加管理应在模型中增加管理x2与教育与教育x3, x4的交互项的交互项组合组合123456管理管理010101教育教育112233管理与教育的组合管理与教育的组合=426325443322110 xxaxxaxaxaxaxaay进一步的模型进一步的模型增加管理增加管理x2与教育与教育x3, x4的交互项的交互项参数参数参数估计值参数估计值置信区间置信区间a01120411044 11363a1497486 508a270486841 7255a3-1727-1

31、939 -1514a4-348-545 152a5-3071-3372 -2769a618361571 2101R2=0.999 F=554 p=0.000R2, ,F有改进，所有回归系数置信有改进，所有回归系数置信区间都不含零点，模型完全可用区间都不含零点，模型完全可用消除了不正常现象消除了不正常现象异常数据异常数据( (33号号) )应去掉应去掉 05101520-1000-5000500e x1 123456-1000-5000500e 组合组合去掉异常数据后去掉异常数据后的结果的结果参数参数参数估计值参数估计值置信区间置信区间a01120011139 11261a1498494 5

32、03a270416962 7120a3-1737-1818 -1656a4-356-431 281a5-3056-3171 2942a619971894 2100R2= 0.9998 F=36701 p=0.000005101520-200-1000100200e x1 123456-200-1000100200e 组合组合R2： 0.957 0.999 0.9998F： 226 554 36701 置信区间长度更短置信区间长度更短残差残差图十分正常图十分正常最终模型的结果可以应最终模型的结果可以应用用模型应用模型应用制订制订6种管理种管理教育组合人员的教育组合人员的“基础基础”薪金薪金(

33、(资历为资历为0）组合组合管理管理教育教育系数系数“基础基础”薪金薪金101a0+a39463211a0+a2+a3+a513448302a0+a410844412a0+a2+a4+a619882503a011200613a0+a218241426325443322110 xxaxxaxaxaxaxaay=中学：中学：x3=1, x4=0 ；大；大学：学：x3=0, x4=1；更高：更高：x3=0, x4=0 x1= = 0； x2 = = 1 管理，管理，x2 = = 0 非管理非管理大学程度管理人员比大学程度管理人员比更高更高程度管理人员的薪金高程度管理人员的薪金高大学程度非管理人员比

34、大学程度非管理人员比更高更高程度非管理人员的薪金略低程度非管理人员的薪金略低对定性因素对定性因素( (如管理、教育如管理、教育) )，可以，可以引入引入0- -1变量变量处理。处理。软件开发人员的薪金软件开发人员的薪金总结总结残差分析方法残差分析方法可以发现模型的缺陷，可以发现模型的缺陷，引入交互作用项引入交互作用项常常能够改善模型常常能够改善模型剔除异常数据剔除异常数据，有助于得到更好的结果，有助于得到更好的结果注：可以直接对注：可以直接对6种管理种管理教育组合引入教育组合引入5个个0- -1变量变量问问题题建立数学模型，反映酶促反应的速度与底物浓度的关建立数学模型，反映酶促反应的速度

35、与底物浓度的关系？以及系？以及反应的速度是否与反应的速度是否与酶经嘌呤霉素处理有关系。酶经嘌呤霉素处理有关系。设计了两个实验设计了两个实验：酶经过嘌呤霉素处理；酶经过嘌呤霉素处理；酶未酶未经嘌呤霉素处理。经嘌呤霉素处理。方方案案实例三实例三. . 酶促反应酶促反应记酶促反应的速度为记酶促反应的速度为，底物浓度为，底物浓度为，二者之间，二者之间的关系写作的关系写作，其中，其中为参数。为参数。由酶促反应的基本性质可知，当底物浓度较小时，反应速度由酶促反应的基本性质可知，当底物浓度较小时，反应速度大致与浓度成正比（一级反应）；当底物浓度很大，渐进饱和时，大致与浓度成正比（一级反应）；

36、当底物浓度很大，渐进饱和时，反应速度趋于一个固定的值反应速度趋于一个固定的值最终反应速度（零级反应），下最终反应速度（零级反应），下面两个模型都具有这种性质面两个模型都具有这种性质。分析与假设分析与假设xxy=21模型（模型（1）模型（模型（2）21xy=-（1-e）yx( ,)yf x=线性化模型线性化模型经嘌呤霉素处理后实验数据的估计结果经嘌呤霉素处理后实验数据的估计结果参数参数参数估计值（参数估计值（10-3）置信区间（置信区间（10-3） 15.1073.539 6.676 20.2470.176 0.319R2=0.8557 F=59.2975 p=0.00008027.195

37、/111=04841. 0/122=xxy=21xy111121=对对 1 , 2非线性非线性对对 1, 2线性线性 x121=线性化模型结果分析线性化模型结果分析 x较大时，较大时，y有较大偏差有较大偏差 1/x较小时有很好的较小时有很好的线性趋势，线性趋势，1/x较大较大时出现很大的起落时出现很大的起落参数估计时，参数估计时，x较小较小（1/x很大）的数据控很大）的数据控制了回归参数的确定制了回归参数的确定 0102030405000.0050.010.0150.020.0251/y1/xxy1121=00.511.5050100150200250 xxy=21xybeta,R,J =

38、 nlinfit (x,y,model,beta0) beta的置信区间的置信区间MATLAB 统计工具箱统计工具箱输入输入 x自变量自变量数据矩阵数据矩阵y 因变量数据向量因变量数据向量beta 参数的估计值参数的估计值R 残差，残差，J 估计预估计预测误差的测误差的Jacobi矩阵矩阵 model 模型的函数模型的函数M文件名文件名beta0 给定的参数初值给定的参数初值输出输出 betaci =nlparci(beta,R,J) 非线性模型参数估计非线性模型参数估计非线性模型结果分析非线性模型结果分析参数参数参数估计值参数估计值置信区间置信区间 1212.6819197.2029 2

39、28.1609 20.06410.0457 0.0826 画面左下方的画面左下方的Export 输出其它统计结果。输出其它统计结果。拖动画面的十字线，得拖动画面的十字线，得y的预测值和预测区间的预测值和预测区间剩余标准差剩余标准差s= 10.9337xxy=21最终反应速度为最终反应速度为6831.2121=0641. 02=其它输出其它输出命令命令nlintool 给出交互画面给出交互画面00.511.5050100150200250o 原始数据原始数据+ 拟合结果拟合结果 00.20.40.60.81-50050100150200250混合反应混合反应模型模型 x1为底物浓度，为底物浓度，

40、 x2为一示性变量为一示性变量 x2=1表示经过处理，表示经过处理，x2=0表示未经处理表示未经处理 1是未经处理的最终反应速度是未经处理的最终反应速度 1是经处理后最终反应速度的增长值是经处理后最终反应速度的增长值 2是未经处理的反应的半速度点是未经处理的反应的半速度点 2是经处理后反应的半速度点的增长值是经处理后反应的半速度点的增长值在同一模型中考虑嘌呤霉素处理的影响在同一模型中考虑嘌呤霉素处理的影响xxy=2112221211)(xxxxy=）（o 原始数据原始数据+ 拟合结果拟合结果混合模型求解混合模型求解用用nlinfit 和和 nlintool命令命令,17001=,6001=

41、,05. 002=01. 002=估计结果和预测估计结果和预测剩余标准差剩余标准差s= 10.4000 参数参数参数估计值参数估计值置信区间置信区间 1160.2802145.8466 174.7137 20.04770.0304 0.0650 152.403532.4130 72.3941 20.0164-0.0075 0.0403 2置信区间包含零点，置信区间包含零点，表明表明 2对因变量对因变量y的影响不显著的影响不显著12221211)(xxxxy=）（参数初值参数初值(基于对数据的分析基于对数据的分析)经嘌呤霉素处理的作用不影响半速度点参数经嘌呤霉素处理的作用不影响半速度点参数未经未

42、经处理处理经处理经处理o 原始数据原始数据+ 拟合结果拟合结果简化的混合模型简化的混合模型简化的混合模型简化的混合模型形式简单，形式简单，参数置信区间参数置信区间不含零点不含零点剩余标准差剩余标准差 s = 10.5851，比一般混合模型略大，比一般混合模型略大 12221211)(xxxxy=）（121211xxxy=）（估计结果和预测估计结果和预测参参数数参数估参数估计值计值置信区间置信区间 1166.6025 154.4886 178.7164 20.05800.0456 0.0703 142.025228.9419 55.1085一般混合模型与简化混合模型预测比较一般混合模型与简化

43、混合模型预测比较实际实际值值一般模型预测一般模型预测值值(一般一般模型模型）简化模型预测简化模型预测值值(简化简化模型模型）6747.34439.207842.73585.44465147.34439.207842.73585.44468489.28569.571084.73567.0478191190.83299.1484189.05748.8438201190.83299.1484189.05748.8438207200.968811.0447198.183710.1812200200.968811.0447198.183710.1812简化混合模型的预测区间较短，更为实用、有效简化混合模

44、型的预测区间较短，更为实用、有效12221211)(xxxxy=）（121211xxxy=）（预测区间为预测区间为预测值预测值注：非线性模型拟合程度的评价无法直接利用注：非线性模型拟合程度的评价无法直接利用线性模型的方法，但线性模型的方法，但R2 与与s仍然有效。仍然有效。酶促反应酶促反应反应速度与底物浓度的关系反应速度与底物浓度的关系非线性非线性关系关系求解求解线性模型线性模型求解非线性模型求解非线性模型机理分析机理分析嘌呤霉素处理对反应速度与底物浓度关系的影响嘌呤霉素处理对反应速度与底物浓度关系的影响混合混合模型模型发现问题，发现问题，得参数初值得参数初值引入引入0-1变量变量简化

45、简化模型模型检查检查参数置信区参数置信区间间是否包含零点是否包含零点作业：作业：投资额与国民生产总值和物价指数投资额与国民生产总值和物价指数问问题题建立投资额模型，研究建立投资额模型，研究某地区某地区实际投资额与国民实际投资额与国民生产总值生产总值 ( GNP ) 及物价指数及物价指数 ( PI ) 的关系的关系2.06883073.0424.5201.00001185.9195.0101.95142954.7474.9190.96011077.6166.491.78422631.7401.9180.9145 992.7144.281.63422417.8423.0170.8679 94

46、4.0149.371.50422163.9386.6160.8254 873.4133.361.40051918.3324.1150.7906 799.0122.851.32341718.0257.9140.7676 756.0125.741.25791549.2206.1130.7436 691.1113.531.15081434.2228.7120.7277 637.797.421.05751326.4 229.8110.7167 596.7 90.91物价物价指数指数国民生国民生产总值产总值投资额投资额年份年份序号序号物价物价指数指数国民生产国民生产总值总值投资额投资额年份年份序号序号根

47、据对未来根据对未来GNP及及PI的估计，预测未来投资额的估计，预测未来投资额该地区该地区连续连续20年的统计数据年的统计数据作业：作业：投资额与国民生产总值和物价指数投资额与国民生产总值和物价指数问问题题建立投资额模型，研究建立投资额模型，研究某地区某地区实际投资额与国民实际投资额与国民生产总值生产总值 ( GNP ) 及物价指数及物价指数 ( PI ) 的关系的关系2.06883073.0424.5201.00001185.9195.0101.95142954.7474.9190.96011077.6166.491.78422631.7401.9180.9145 992.7144.2

48、81.63422417.8423.0170.8679 944.0149.371.50422163.9386.6160.8254 873.4133.361.40051918.3324.1150.7906 799.0122.851.32341718.0257.9140.7676 756.0125.741.25791549.2206.1130.7436 691.1113.531.15081434.2228.7120.7277 637.797.421.05751326.4 229.8110.7167 596.7 90.91物价物价指数指数国民生国民生产总值产总值投资额投资额年份年份序号序号物价物价指数

49、指数国民生产国民生产总值总值投资额投资额年份年份序号序号根据对未来根据对未来GNP及及PI的估计，预测未来投资额的估计，预测未来投资额该地区该地区连续连续20年的统计数据年的统计数据时间序列中同一变量的顺序观测值之间存在时间序列中同一变量的顺序观测值之间存在自相关自相关以时间为序的数据，称为以时间为序的数据，称为时间序列时间序列分分析析许多经济数据在时间上有一定的许多经济数据在时间上有一定的滞后滞后性性需要诊断并消除数据的自相关性，建立新的模型需要诊断并消除数据的自相关性，建立新的模型若采用普通回归模型直接处理，将会出现不良后果若采用普通回归模型直接处理，将会出现不良后果投资额与国民

50、生产总值和物价指数投资额与国民生产总值和物价指数 1.32341718.0257.9140.7676 756.0125.741.25791549.2206.1130.7436 691.1113.531.15081434.2228.7120.7277 637.797.421.05751326.4 229.8110.7167 596.7 90.91物价物价指数指数国民生国民生产总值产总值投资额投资额年份年份序号序号物价物价指数指数国民生产国民生产总值总值投资额投资额年份年份序号序号基本回归模型基本回归模型投资额与投资额与 GNP及物价指数间均有很强的线性关系及物价指数间均有很强的线性关系ttttx

展开阅读全文