1、2.2 2.2 一元线性回归模型的参数估计一元线性回归模型的参数估计 一、一元线性回归模型的基本假设一、一元线性回归模型的基本假设 二、参数的普通最小二乘估计(二、参数的普通最小二乘估计(OLSOLS) 三、参数估计的最大或然法三、参数估计的最大或然法(ML) (ML) 四、最小二乘估计量的性质四、最小二乘估计量的性质 五、参数估计量的概率分布及随机干五、参数估计量的概率分布及随机干 扰项方差的估计扰项方差的估计 单方程计量经济学模型分为两大类: 线性模型和非线性模型 线性模型中,变量之间的关系呈线性关系 非线性模型中,变量之间的关系呈非线性关系 一元线性回归模型一元线性回归模型:只有一个解释
2、变量 iii XY 10 i=1,2,n Y为被解释变量,X为解释变量,0与1为待估待估 参数参数, 为随机干扰项随机干扰项 回归分析的主要目的回归分析的主要目的是要通过样本回归函 数(模型)SRF尽可能准确地估计总体回归函 数(模型)PRF。 估计方法估计方法有多种,其种最广泛使用的是普通普通 最小二乘法最小二乘法(ordinary least squares, OLS)。 为保证参数估计量具有良好的性质,通常对为保证参数估计量具有良好的性质,通常对 模型提出若干基本假设。模型提出若干基本假设。 注:实际这些假设与所采用的估计方法紧密 相关。 一、线性回归模型的基本假设一、线性回归模型的基本
3、假设 假设1、解释变量X是确定性变量,不是随机变量; 假设2、随机误差项具有零均值、同方差和不序列相 关性: E(i)=0 i=1,2, ,n Var (i)=2 i=1,2, ,n Cov(i, j)=0 ij i,j= 1,2, ,n 假设3、随机误差项与解释变量X之间不相关: Cov(Xi, i)=0 i=1,2, ,n 假设4、服从零均值、同方差、零协方差的正态分布 iN(0, 2 ) i=1,2, ,n 1、如果假设1、2满足,则假设3也满足; 2、如果假设4满足,则假设2也满足。 注意:注意: 以上假设也称为线性回归模型的经典假设经典假设 或高斯(高斯(Gauss)假设)假设,满足
4、该假设的线性回归 模型,也称为经典线性回归模型经典线性回归模型(Classical Linear Regression Model, CLRM)。 另外另外,在进行模型回归时,还有两个暗含的 假设: 假设5:随着样本容量的无限增加,解释变 量X的样本方差趋于一有限常数。即 nQnXX i ,/)( 2 假设6:回归模型是正确设定的 假设5旨在排除时间序列数据出现持续上升或下降的变 量作为解释变量,因为这类数据不仅使大样本统计推断变 得无效,而且往往产生所谓的伪回归问题伪回归问题(spurious regression problem)。 假设6也被称为模型没有设定偏误设定偏误(specific
5、ation error) 二、参数的普通最小二乘估计(二、参数的普通最小二乘估计(OLSOLS) 给定一组样本观测值(Xi, Yi)(i=1,2,n)要 求样本回归函数尽可能好地拟合这组值. 普通最小二乘法普通最小二乘法(Ordinary least squares, OLS) 给出的判断标准是:二者之差的平方和 n iii n i XYYYQ 1 2 10 2 1 ) () ( 最小。 方程组(*)称为正规方程组正规方程组(normal equations)。 记 2 222 1 )( iiii X n XXXx iiiiiiii YX n YXYYXXyx 1 )( 上述参数估计量可以写成
6、: XY x yx i ii 10 2 1 称为OLS估计量的离差形式离差形式(deviation form)。)。 由于参数的估计结果是通过最小二乘法得到的, 故称为普通普通最小二乘估计量最小二乘估计量(ordinary least squares estimators)。 顺便指出 ,记 YYy ii 则有 ini ii eXX eXXy 1 1 1010 )( ) () ( 可得 ii xy 1 (*)式也称为样本回归函数样本回归函数的离差形式离差形式。 (*) 注意:注意: 在计量经济学中,往往以小写字母表示对均值 的离差。 三、参数估计的最大或然法三、参数估计的最大或然法(ML) 最
7、大或然法最大或然法( (Maximum Likelihood,简称ML), 也称最大似然法最大似然法,是不同于最小二乘法的另一种 参数估计方法,是从最大或然原理出发发展起来 的其它估计方法的基础。 基本原理基本原理: 对于最大或然法最大或然法,当从模型总体随机抽取n组 样本观测值后,最合理的参数估计量应该使得从 模型中抽取该n组样本观测值的概率最大。 在满足基本假设条件下,对一元线性回归模型: iii XY 10 随机抽取n组样本观测值(Xi, Yi)(i=1,2,n)。 那么Yi服从如下的正态分布: ), ( 2 10 ii XNY 于是,Y的概率函数为 2 10 2 ) ( 2 1 2 1
8、 )( ii XY i eYP (i=1,2,n) 假如模型的参数估计量已经求得,为 因为Yi是相互独立的,所以的所有样本观测值的联 合概率,也即或然函数或然函数( (likelihood function)likelihood function)为: ),(), , ( 21 2 10n YYYPL 2 10 2 2 ) ( 2 1 )2( 1 ii n XY n e 将该或然函数极大化,即可求得到模型 参数的极大或然估计量。 由于或然函数的极大化与或然函数的对数的极 大化是等价的,所以,取对数或然函数如下: 2 10 2 * ) ( 2 1 )2ln( )ln( ii XYn LL 解得模
9、型的参数估计量为: 22 1 22 2 0 )( )( ii iiii ii iiiii XXn XYXYn XXn XYXYX 可见,在满足一系列基本假设的情况下, 模型结构参数的最大或然估计量最大或然估计量与普通最小普通最小 二乘估计量二乘估计量是相同的。 例例2.2.1:在上述家庭可支配收入可支配收入- -消费支出消费支出例中,对 于所抽出的一组样本数,参数估计的计算可通过下面的 表2.2.1进行。 表表 2.2.1 参参数数估估计计的的计计算算表表 i X i Y i x i y iiy x 2 i x 2 i y 2 i X 2 i Y 1 800 594 -1350 -973 13
10、14090 1822500 947508 640000 352836 2 1100 638 -1050 -929 975870 1102500 863784 1210000 407044 3 1400 1122 -750 -445 334050 562500 198381 1960000 1258884 4 1700 1155 -450 -412 185580 202500 170074 2890000 1334025 5 2000 1408 -150 -159 23910 22500 25408 4000000 1982464 6 2300 1595 150 28 4140 22500 76
11、2 5290000 2544025 7 2600 1969 450 402 180720 202500 161283 6760000 3876961 8 2900 2078 750 511 382950 562500 260712 8410000 4318084 9 3200 2585 1050 1018 1068480 1102500 1035510 10240000 6682225 10 3500 2530 1350 963 1299510 1822500 926599 12250000 6400900 求和 21500 15674 5769300 7425000 4590020 5365
12、0000 29157448 平均 2150 1567 777. 0 7425000 5769300 2 1 i ii x yx 172.1032150777. 01567 00 XY 因此,由该样本估计的回归方程为: ii XY777. 0172.103 四、最小二乘估计量的性质四、最小二乘估计量的性质 当模型参数估计出后,需考虑参数估计值的 精度,即是否能代表总体参数的真值,或者说需 考察参数估计量的统计性质。 一个用于考察总体的估计量,可从如下几个方 面考察其优劣性: (1)线性性)线性性,即它是否是另一随机变量的线性 函数; (2)无偏性)无偏性,即它的均值或期望值是否等于总 体的真实值
13、; (3)有效性)有效性,即它是否在所有线性无偏估计量 中具有最小方差。 (4)渐近无偏性)渐近无偏性,即样本容量趋于无穷大时,是 否它的均值序列趋于总体真值; (5)一致性)一致性,即样本容量趋于无穷大时,它是否 依概率收敛于总体的真值; (6)渐近有效性)渐近有效性,即样本容量趋于无穷大时,是 否它在所有的一致估计量中具有最小的渐近方差。 这三个准则也称作估计量的小样本性质。小样本性质。 拥有这类性质的估计量称为最佳线性无偏估计最佳线性无偏估计 量量(best liner unbiased estimator, BLUE)。 当不满足小样本性质时,需进一步考察估计量的 大样本大样本或或渐近
14、性质渐近性质: 高斯高斯马尔可夫定理马尔可夫定理(Gauss-Markov theorem) 在给定经典线性回归的假定下,最小二乘估计 量是具有最小方差的线性无偏估计量。 2 2、无无偏偏性性,即估计量 0 、 1 的均值(期望)等于总体回归 参数真值0与1 证:证: iiiiiiiiii kXkkXkYk 10101 )( 易知0 2 i i i x x k 1 ii Xk 故 ii k 11 1111 )()() ( iiii EkkEE 同样地,容易得出 0000 )()()() ( iiii EwEwEE 3 3、有有效效性性(最最小小方方差差性性) ,即在所有线性无偏估计量 中,最小
15、二乘估计量0 、 1 具有最小方差。 (1)先求 0 与 1 的方差 )var()var()var() var( 2 10 2 1iiiiiii kXkYk 2 2 2 2 2 ii i xx x 22 10 2 0 )/1 ()var()var() var( iiiiii kXnXwYw 2 2 2 2222 2 211 2 1 i i iii x x XkX nn kXkX nn 2 2 2 2 2 22 2 2 2 1 i i i i i xn X xn Xnx x X n (2)证明最小方差性 假设 * 1 是其他估计方法得到的关于1的线性无偏估计量: iiY c * 1 其中,ci=
16、ki+di,di为不全为零的常数 则容易证明 ) var() var( 1 * 1 同理,可证明0的最小二乘估计量 0 具有最的小方差 普通最小二乘估计量普通最小二乘估计量(ordinary least Squares Estimators)称为最佳线性无偏估计量最佳线性无偏估计量(best linear unbiased estimator, BLUE) 由于最小二乘估计量拥有一个由于最小二乘估计量拥有一个“好好”的估计量的估计量 所应具备的小样本特性,它自然也拥有大样本特性所应具备的小样本特性,它自然也拥有大样本特性。 )/lim( )/lim( )lim()lim()lim() lim(
17、 2 1 2 111 nxP nxP x x PPkPP i ii i ii ii 111 0),( QQ XCov 五、参数估计量的概率分布及随机干扰五、参数估计量的概率分布及随机干扰 项方差的估计项方差的估计 1、参数估计量、参数估计量 0 和和 1 的概率分布的概率分布 ),( 2 2 11 i x N ),( 2 2 2 00 i i xn X N 22 / 1 i x 2 22 0 i i xn X 2、随机误差项、随机误差项 的方差的方差 2的估计的估计 由于随机项 i不可观测,只能从 i的估计残 差ei i出发,对总体方差进行估计。 2又称为总体方差总体方差。 可以证明可以证明,2的最小二乘估计量最小二乘估计量为 2 2 2 n ei 它是关于2的无偏估计量。 在最大或然估计法最大或然估计法中, 因此, 2 2的最大或然估计量不具无偏性,的最大或然估计量不具无偏性, 但却具有一致性但却具有一致性。 在随机误差项的方差2估计出后,参数0 和 1 的方方差差和标标准准差差的估计量分别是: 1 的样本方差: 222 1 i xS 1 的样本标准差: 2 1 i xS 0 的样本方差: 2222 0 ii xnXS 0 的样本标准差: 22 0 ii xnXS