1、3.4 多元线性回归模型的预测多元线性回归模型的预测 一、一、E(Y0)的置信区间的置信区间 二、二、Y0的置信区间的置信区间 对于模型 XY 给 定 样 本 以 外 的 解 释 变 量 的 观 测 值 X0=(1,X10,X20,Xk0),可以得到被解释变量的预 测值: X 00 Y 它可以是总体均值E(Y0)或个值Y0的预测。 但严格地说,这只是被解释变量的预测值的估 计值,而不是预测值。 为了进行科学预测,还需求出预测值的置信为了进行科学预测,还需求出预测值的置信 区间,包括区间,包括E(Y0)和和Y0的的置信区间置信区间。 一、一、E(Y0)的置信区间的置信区间 易知 )() () (
2、) ( 00 YEEEYEXXX 000 ) () () ( 2 0 ()X(XXX 0000 EEYVar 0 1 0 2 0 00 )( ) () ( XXXX X)(X X)(X 0 0 E EYVar 容易证明 ),( 0 2 0 XX)X(XX 1 00 NY ) 1( knt )E(YY 00 0 1 0 XX)X(X 于是,得到(1-)的置信水平下E(Y0)的置信区间置信区间: 0 1 0000 1 00 )( )()( 22 XXXXXXXX tYYEtY 其中,t/2为(1-)的置信水平下的临界值临界值。 二、二、Y0的置信区间的置信区间 如果已经知道实际的预测值Y0,那么预
3、测误差为: 000 YYe 容易证明 0 )( ) ( ) ()( 1 00 00 0000 XXXX X XX E E EeE )(1 ( )( )()( 0 1 0 2 21 00 2 00 XXXX XXXX E eEeVar e0服从正态分布,即 )(1 (, 0( 0 1 0 2 0 XXXX Ne )(1 ( 0 1 0 22 0 XXXX e 构造t统计量 ) 1( 0 00 knt YY t e 可得给定(1-)的置信水平下Y0的置信区间置信区间: 0 1 0000 1 00 )(1 )(1 22 XXXXXXXX tYYtY 中国居民人均收入中国居民人均收入- -消费支出消费
4、支出二元模型二元模型例中: 2001年人均GDP:4033.1元, 于是人均居民消费的预测值人均居民消费的预测值为 2001=120.7+0.22134033.1+0.45151690.8=1776.8(元) 实测值实测值(90年价)=1782.2元,相对误差:相对误差:-0.31% 预测的置信区间预测的置信区间 : 00004. 000001. 000828. 0 00001. 000001. 000285. 0 00828. 000285. 088952. 1 )( 1 XX 3938. 0 0 1 0 XX)X(X 于是E(E(2001)的95%的置信区间为: 3938.05.705093.28.1776 或 (1741.8,1811.7) 3938. 15 .705093. 28 .1776 或 (1711.1, 1842.4) 同样,易得2001的95%的置信区间为