1、 罗罗 汉汉(湖南大学 数学与计量经济学院)数据建模数据建模拟合与回归拟合与回归一一.拟合.设有变量设有变量x,y,根据它们的一组数据,根据它们的一组数据(xi,yi),i=1,2,n,视,视为平面上的为平面上的 n 个点,寻求一个函数个点,寻求一个函数 y=f(x),使,使 y=f(x)在某种在某种准则下与所有的数据点准则下与所有的数据点(xi,yi)总体上最接近。总体上最接近。线性最小二乘法线性最小二乘法考虑考虑 y=a+bx,a,b为待定系数为待定系数Q(a,b)=niiiniibxay1212)(min设变量设变量 x,y,数据数据(xi,yi),i=1,2,n,Q(a,b)=niii
2、niiybxa1212)(min0)(20)(211niiiiniiixybxabQybxaaQ令令iiiyxbxaxnynbxnna)(2即即其中其中,11niixnxniiyny11解得解得xbyaxxyyxxxnxyxnyxbiiiiii222)()(y=a+bx故得到故得到 一般地,选定一组函数一般地,选定一组函数rk(x),k=1,2,m,令令 f(x)=b1r1(x)+b2r2(x)+bmrm(x)其中其中bk是待定系数是待定系数,k=1,2,mQ(b1,b2,bm)=niiiniiyxf1212)(min得,2,1,0mkbQknimkiikkimnimkiikkiyxrbxry
3、xrbxr111110)()(0)()(nmmnnmnmyyybbbxrxrxrxrR111111,)()()()(记0 yRbRTyRRbRTT当当 r1(x),r2(x),rm(x)线性无关时,线性无关时,R列满秩,故列满秩,故RTR可逆,可逆,yRRRbTT1)(二二、回归.)|()(xyExfexfy)(称为称为y对对x的回归函数的回归函数其中其中e为随机误差为随机误差)(xfy 经验回归方程经验回归方程回归分析回归分析(1)建立回归模型建立回归模型(经验方程经验方程)(2)对回归模型可信度进行检验对回归模型可信度进行检验(3)判断自变量判断自变量 x 对对 y 的影响是否显著的影响是
4、否显著(4)诊断回归模型是否适合这组数据诊断回归模型是否适合这组数据(5)利用模型进行预报和控制利用模型进行预报和控制三三、一元线性回归模型.y=a+bx+e 对对n 组数据组数据(xi,yi)i=1,2,n假设假设(1)E(ei)=0;(2)Var(ei)=2;(3)Cov(ei,ej)=0,i j;(5)e N(0,2).OLSOLS估计估计:min Q(a,b)=得得(4)Cov(ei,Xi)=0;niiiniibxaye1212)(xbyaxxyyxxxnxyxnyxbiiiiii)()()(222得得 yi=a+bxi+eixbay故得故得)(,)(2yyxxLxxLiixyixx记
5、记xbyaLLxxyyxxxnxyxnyxbxxxyiiiiii)()()(222则则且有且有)(212xyyyLbLn回归模型的统计检验:回归模型的统计检验:(1)回归系数的显著性检验回归系数的显著性检验(t 检验检验)H0:b=0.检验统计量检验统计量xxLbt拒绝域拒绝域)2(|2ntt(2)回归方程的显著性检验回归方程的显著性检验(F 检验检验)H0:b=0.检验统计量检验统计量)2/()(1/)(22nyyyyFiii拒绝域拒绝域)2,1(nFF(3)拟合优度检验拟合优度检验样本决定系数样本决定系数yyxxxyyyxxLLLLLbr222例例1.1.我国的人均消费和国民收入.我国19
6、81年到1993年我国的人均消费金额和人均国民收入的统计资料如下(单位:人民币元;资料来源:中国统计年鉴1993)年 份 1981 1982 1983 1984 1985 1986 1987人均国民收入 393.8 419.14 460.86 544.11 668.29 737.73 859.97人均消费金额 249 267 289 329 406 451 513 年 份 1988 1989 1990 1991 1992 1993人均国民收入 1068.8 1169.2 1250.7 1429.5 1725.9 2099.5人均消费金额 643 699 713 803 947 1148例例3.
7、3.温度对红铃虫产卵的影响.一只红铃虫的产卵数y(枚)与温度 x(C)有关,一组抽样的统计数据如下:x 21 23 25 27 29 32 35 y 7 11 21 24 66 115 325三三、多元线性回归模型.y=b0+b1x1+b2x2+bkxk+e对对 n 组数据组数据(xi1,xi2,xik,yi)i=1,2,n记记111)1(0)1(111111,11,nnkkknnknknneeebbbxxxxXyyY Y=Xb+e假设假设(1)E(e)=0;(2)E(eeT)=2I;(3)E(XTe)=0;(4)rank(X)=k+1;(5)e N(0,2I).OLS估计估计:min Q(b
8、)=|Y Xb|2得得YXXXbTT1)(例例1.1.国家财政收入模型.年年 份份财政收财政收入入(亿元亿元)y工业总产工业总产值值(亿元亿元)x1农业总产农业总产值值(亿元亿元)x2建筑业总建筑业总产值产值(亿元亿元)x3人口数人口数(万人万人)x4社会商品零社会商品零售总额售总额(亿元亿元)x5受灾面积受灾面积(万公顷万公顷)x619781979198019811982198319841985198619871988198919901121.11103.31085.21089.51124.01249.01501.91866.42260.32368.92628.02947.93244.8 4
9、237 4681 5154 5400 5811 6461 7617 971611194138131822422017238511397169819232181248327503214361940134176586565357662569645767747912103512631656203824312967283430359625997542987051000721016541030081043571058511075071093001110261127041143331558.61800.02140.02350.02570.02849.43376.44305.04950,05820.0744
10、0.08101.48300.15076393744533973331334713189443747144209508746993847iiiiiexbxbxbby6622110设理论模型设理论模型13,2,1iOLS估计估计)1875.0()7064.1()5454.0()0377.1(00108.085323.010550.007848.00301.4624321xxxxy)4010.0()8122.0(04453.030780.065xx47.8)6,6(,9432.1)6(,824.61,98408.001.005.02FtFR)1194.1()9637.1()5921.0()4081.
11、1(34282.087837.010632.008559.095.3315321xxxxy)6814.0(05680.06x46.7)7,5(,8946.1)7(,0408.86,9839892.001.005.02FtFR)4161.0()0359.1()9867.1()0217.2(02595.029180.084508.010303.07646.4996531xxxxy01.7)8,4(,8595.1)8(,9584.116,9831874.001.005.02FtFR)2072.1()2911.2()2053.2(31667.089342.010603.01368.605531xxxy
12、99.6)9,3(,8331.1)9(,6581.171,9828236.001.005.02FtFR)2054.3()6988.2(45329.005278.01027.52531xxy56.7)10,2(,8125.1)10(,5309.245,9800423.001.005.02FtFR例例2.2.我国的粮食生产模型.年年 份份粮食总产量粮食总产量(万吨万吨)y化肥施用量化肥施用量(万公斤万公斤)x1粮食播种面粮食播种面积积(千公顷千公顷)x2成灾面积成灾面积(千公顷千公顷)x3农业机械劳动农业机械劳动力力(万千瓦万千瓦)x4农业劳力农业劳力(万万人人)x5198319841985198
13、619871988198919901991199219931994199538728.0040731.0037911.0039151.0040298.0039408.0040755.0044624.0043529.0044266.0045649.0044510.0046662.00 1659.800 1739.8001775.8001930.6001999.3002141.5002357.1002590.3002805.1002930.2003151.9003317.9003593.700 114047.0112884.0108845.0110933.0111268.0110123.01122
14、05.0113466.0112314.0110560.0110509.0109544.0110060.016209.3015264.0022705.3023656.0020392.7023944.7024448.7017819.3027814.0025894.7023133.0031383.0022267.0018022.0019497.0020913.0022950.0024836.0026575.0028067.0028708.0029389.0030308.0031817.0033802.0036118.0031645.1031685.0030351.5030467.0030870.0031455.7032440.5033330.4034186.3034037.0033258.2032690.3032334.50 Thank youThank you