1、第八章非线性模型和质量属性模型主要内容n非线性模型估计方法n二元因变量模型Probit模型Logit模型nTobit模型参数非线性n当模型为参数非线性形式时,需要利用非线性估计技术。n非线性模型的一般形式为:Yt=f(Xt,b)+et,t=1,T式中f(.)为一个可微分的非线性函数,b为K1未知参数向量,X为KT解释变量矩阵,e为服从正态分布的误差项。n此时我们无法将待估计参数表示为由已知的X和Y表示的线性函数,这种情况被称作参数非线性。非线性回归方程案例n例1:不变替代弹性生产函数(CES)假定模型有两个解释变量,其一般形式可以表示为 式中:n0为技术效率系数n1为分配系数(01时,边际消费
2、倾向递增,反之递减。ttteDYCONS210bbb1212bbbDYdDYdCONSMPC非线性最小二乘法n非线性最小二乘法的原理与线性最小二乘法相同,即求解使残差平方和最小的参数:n在满足要求的条件下,模型参数可以由求解一阶条件构成的方程组得出,即:n对于非线性方程,通常我们无法确保得到估计参数的解析解,但是能够利用数值逼近方法得到上述问题的解。TtttXfYMinSSEMin12,bTttttXfXfYSSE10,2bbbb非线性最小二乘法n求解非线性方程组的常用方法有:直接寻找法(Direct search),即依据某种指标(如误差平方和),选择最优的结果;直接优化法(Direct o
3、ptimization),即利用前述求偏导数的方法,直接通过求解方程组来得到参数估计,在应用工作中很少使用此方法;线性化迭代求解法线性化迭代求解法(Iterative liberalization method),即从初始值开始将非线性函数线性化,然后求解线性议程,得到新的估计值,重复上述步骤,直到结果出现收敛时或达到最大迭代次数时为止。非线性最小二乘法n估计非线性最小二乘法包括以下步骤:在未给定初始值的情况下,利用OLS方法估计系数作为初始值,反之利用给定的初始值,在该组值求导以确定每个参数的变化方向及步长,或采用泰勒级数展开转化为线性方程求解得到新的参数估计值。重复上述过程,直到参数达到给
4、定的收敛标准时为止,或达到最大迭代次数时为止。此时得到的结果包括最后一次计算得到的参数估计值,对应的渐近t统计值,R2值等。非线性最小二乘法n需要注意的是,非线性最小二乘法并不能够保证收敛到最优解。收敛速度缓慢收敛到局部最优解估计系数出现发散情况n在应用工作中,当遇到上述情况时,一种做法是改变初始值,然后重新开始迭代过程。n利用现有的计算机能力和软件,对模型重复做估计不会发生过高的费用,或要求过长的时间投入。局部收敛与全局收敛-SSEbACD局部最优点全局最优点Bb*b非线性最小二乘法估计量的性质n用于对线性回归模型做统计检验的方法无法直接应用于非线性回归模型,原因是我们无法由回归残差得到模型
5、误差项方差的无偏估计,即使回归残差服从正态分布。n在采用迭代法时,我们是对最后一次线性化后的估计结果应用标准线性模型的统计检验。n这一方法依赖于最小二乘法在大样本时具有的一致性。n对于一般形式的非线性模型,其估计参数b*的小样本特性仍不够清楚,但对于大样本特性则有较好的了解。n假定解释变量X是非随机的,可以做出以下结论:b*是真实参数b的一致估计量 b*服从渐近正态分布(根据中心极限定理)这两个结论与模型误差项et假定的分布无关 模型估计参数b的性质n假定对于任何观察值,其误差项et都服从标准正态分布,不同观察值之间误差项的协方差等于0,即:n可以注意到,这些假定与古典线性模型相同。n在此条件
6、下有:当T趋于无穷大时,估计参数b*趋近于以真实参数b为均值的正态分布;因而b*是b的一个一致性估计量。TttteeCovtteVareeEttttt,1,0,*288如果如果样本的似然函数n样本的似然函数为:n相应的对数似然函数为:nb和2的最大似然估计量是使似然函数实现最大值时对应的参数。TtTtXfYttttTtteXfYeefeeL1122,212,22bb 222222222,222bbSSELnTLnTXfYXfYLnTLnTLLntttt样本的似然函数n前述的对数似然函数可以改写为:nLn(L)=与b无关的部分SSE/(22)n由于20,求解Ln(L)对应于b的最大值等同于求解S
7、SE对应于b的最小值。这意味着,在正态分布假定下,最大似然估计量与最小二乘法估计量是相同的。n在模型为线性函数的情况下,s2的最大似然估计量为SSE/T,不同于OLS方法得到的SSE/(T-1)。n由于最大似然估计量bl和l2均为真实参数(b,2)的一致性估计量并且服从渐近正态分布,因而可以对非线性模型的估计参数做各种统计检验。对非线性函数的统计检验n当需要检验非线性函数的某些系数是否满足某个约束条件时,我们可以利用似然值比值检验方法。n估计有系数约束和没有系数约束的模型,得到对应的似然值,分别用L(br)和L(bur)表示。n似然值比值 L(br)L(bur),该值在0和1之间。n当足够小时
8、,我们拒绝与系数约束相对应的虚假设。n利用得到的似然值计算得出以下统计量:n该统计量服从自由度为m的2分布,m为约束条件个数。22mURRLLbb利用EVIEWS估计参数非线性方程nEVIEWS软件包括了非线性最小二乘法估计方法。n非线性最小二乘法估计指令与线性最小二乘法估计指令相同,但需要给出方程的数学表达式,其中用向量C(i)代表第i个参数。n在多数情况下,可以让EVIEWS利用线性最小二乘法自行估计初始值,并得到最终结果。n如果使用上述方法出现在给定迭代次数下不收敛或收敛到异常的参数(可以通过检验R2、对数似然值和变量系数等方式做出判断),那么需要人工给出初始值。n为了确定结果的可靠性,
9、可以试不同的初始值,看是否都能够收敛到相近的结果(局部最优和全局最优)。n在方程组模型中也可以包括非线性方程。案例:不变边际消费倾向宏观消费函数Dependent Variable:RCONSMethod:Least SquaresSample:1978 2002Included observations:25Variable CoefficientStd.Errort-StatisticProb.C 394.8546121.09233.2607740.0034RDY 0.5199160.00884058.813920.0000R-squared0.993395 Mean dependent
10、var6385.284Adjusted R-squared0.993108 S.D.dependent var3944.278S.E.of regression327.4567 Akaike info criterion14.49721Sum squared resid2466242.Schwarz criterion14.59472Log likelihood-179.2151 F-statistic3459.078Durbin-Watson stat0.378861 Prob(F-statistic)0.000000案例:可变边际消费倾向宏观消费函数Dependent Variable:R
11、CONSMethod:Least SquaresSample:1978 2002Included observations:25Convergence achieved after 1 iterationsRCONS=C(1)+C(2)*RDYC(3)CoefficientStd.Errort-StatisticProb.C(1)493.4338392.55351.2569850.2219C(2)0.4028150.3095741.3011930.2067C(3)1.0248060.07330713.979730.0000R-squared0.993554 Mean dependent var
12、6385.284Adjusted R-squared0.992968 S.D.dependent var3944.278S.E.of regression330.7626 Akaike info criterion14.55285Sum squared resid2406885.Schwarz criterion14.69911Log likelihood-178.9106 Durbin-Watson stat0.385993案例:可变边际消费倾向宏观消费函数Wald Test:Equation:EQ3Null Hypothesis:C(3)=1F-statistic0.114510Proba
13、bility0.738275Chi-square0.114510Probability0.735067根据该检验结果,我们应该接受不变边际消费倾向函数形式。有限因变量模型(Limited Dependent Variables)n有限因变量模型涉及因变量只是做性质区分的情况及其取值范围受到某种限制的情况,包括:二元选择模型:因变量反映二者挑一的选择。n例:是否采纳某种技术多元选择模型:因变量反映多种选择。n例:上班时多种交通工具的选择截取模型:因变量反映在某一数值区间内的选择n例:某种技术采纳的程度n随着计量经济学软件的改进,有限因变量模型逐步得到广泛应用。有限因变量模型n有限因变量模型的一般
14、形式可以表达为:P(y=1|x)=G(b0+xb b )y*=b0+xb b+u,y=max(0,y*)式中P(.)表示事件发生的概率;y*是一个隐变量(Latent variable),其值大小取决于影响因素x,而y*决定事件发生的概率。当y*0时y=1,当y*0时y=0(可以选择其他临界值)。n二元因变量模型是有限因变量模型的一种特殊形式。二元因变量模型用于评价政策n在评价某项政策计划(或技术应用)产生的影响时,常常可以用虚变量作为模型的因变量,例如:是否参与某政策计划:n当所分析对象参与该某政策计划时D=1,否则D=0;是否采纳某种(新)技术n当所分析对象采纳该技术时D=1,否则D=0;
15、农业劳动力转移n当农户家庭中有劳动力实现转移时D=1,否则D=0。农户土地流转、借贷行为、政府提价自我选择问题n在很多情况下,是否选择参与某政策计划或是否采用某生产技术是由微观行为主体选择的,由此导致了自我选择问题。n如果我们能够掌握影响是否参与及结果的因素,那么这不成为一个问题。n然而经常出现的情况是,有一些无法观察的因素影响到是否参与。n在此情况下,估计政策的效果可能出现偏差,这可能导致制定错误的政策。隐变量(Latent Variables)n建立二元因变量模型有时是出于在模型中以隐变量作为因变量的考虑;n这样做的基本思路是,我们可以用模型y*=b0+xb b+e来反映隐变量,但实际只能
16、观察到以下两种情况:当y*0时y=1当y*0时y=0二元因变量模型n二元变量模型指因变量取值只为0或1的情况。n我们可以将其看作是一种选择决策模型,当选择时y=1,未选择时y=0;n我们可以用线性概率模型来研究这种情况,模型可以写作P(y=1|x)=b1x1+bKxK bj 表示当xj 变化时概率的变化 n利用该方程推断的y 值表示选择的概率。n一个问题是,推断的概率值可能在区间0,1之外。线性概率模型Z1F ZZ*线性概率函数利用OLS方法估计得到的线性概率函数的参数仍反映自变量一单位变化对选择该事件概率的影响。二元因变量模型n即使没有上述推断问题,我们利用线性概率模型推断的X变化对概率的影
17、响也会大于1或小于-1,因而只有在均值附近才较为可靠。n线性概率模型违反了古典模型同方差的假定,因而估计结果的有效性下降,影响到利用模型所做的推断。n尽管存在这些缺点,对于分析工作,线性概率模型仍是一个很好的起点。n为了解决这一问题,我们可以用一种概率函数G(b0+xb b)来模拟事件发生的概率,该函数满足0G(z)Estimate equation-模型选项nBinary Binary choice(Logit,Probit,Extreme value)nOrdered Ordered choice 必要时给出选项估计结果。截取数据n当样本是总体中的某个特殊子集时,我们遇到数据被截取的情况。
18、例1:针对贫困户的调查资料 例2:对有借款行为农户的调查n此时只观察到该特殊子集的各项资料,没有获得有关其他对象的观察资料。n此时出现样本对总体的代表性问题。审查数据n若样本本身在总体中的分布具有代表性,但当数据由于报告制度而使某些信息被高度简化时,我们遇到审查后的数据情况。例:农户收入的调查中将低于某一水平的农户全部报告为贫困户而没有报告具体收入数据。n审查数据仍有关于自变量的信息。n审查数据情况可以被看作是数据本身存在缺点。截取数据和审查数据n从统计技术角度讲,由于两种情况均导致随机变量的分布形式发生变化,并引起丢失解释变量错误,因而利用OLS方法估计模型会出现估计系数偏差。n在很多应用工
19、作中,人们常常利用有限因变量模型处理存在上限、下限或上下限的数据,而不去认真地考虑数据体现何种性质。隐变量(Latent Variables)n对于截取数据模型或审查数据模型,均可以借鉴二元因变量模型引入的隐变量概念;n模型中的隐变量是解释变量的函数y*=b0+b b x+u然而我们从实践中只能观察到y max(0,y*)n即:当y*0时y=y*当y*0时y=0Tobit模型nTobit模型适合处理隐变量为多元因变量的情况,例如y*=xb b+u,u|x N(0,2),但我们只观察到y=max(0,y*)nTobit模型利用最大似然法估计模型参数b b和;n需要认识到的是,b估计的是X对隐变量
20、y*的影响,而不是对y的影响。对Tobit模型的解释n除非我们所关心的是隐变量y*,我们不能只解释所得到的系数;由于E(y|x)=F(xb b/)xb b+fxb b/因而有E(y|x)/xj=bj F(xb b/)n如果误差服从正态分布和同方差两个假定不成立,那么Tobit模型可能失去意义;n如果X对P(y0)和E(y)的影响效果方向相反,那么Tobit模型是不适当的。审查回归模型和截取回归模型(Censored&Truncated Regression Models)n我们可以估计更一般化的隐变量模型,例如:y=xb b+u,u|x,c N(0,2)当从右边censored时,我们只能观察
21、到,w=min(y,c)当从左边censored时,我们只能观察到,w=max(y,c)n若当超过某个censoring点后所有的数据均出现丢失时,我们遇到了截取回归模型。对样本选择偏差的校正n如果一个样本被以非随机的形式截取了,那么OLS方法面临选择偏差;n这种情况与丢失解释变量非常相似,其核心是哪些观察值被选进样本,从而造成E(y|z,s=1)=xb b +r(zg g)式中(c)是inverse Mills ratio:f(c)/F(c)n我们需要得到关于的一个估计,为此要估计s(不管是否可以观察到y)对z的Probit模型;n这些估计结果可以随后与z一起构建(c);n再下一步是做y对x
22、和估计值的回归,从而得到b b的一致估计量;n需要注意的是,x必须是z的一个子集。Heckman两阶段估计n阶段一:估计Probit模型n利用该方程得到的估计值:n阶段二:利用OLS方法估计下列方程n该方法可以得到参数的一致性估计。*iiiYFXFPbiiiXXbbfFiiiiuXYb最大似然法估计n取对数的似然函数为(以下限为0的情况为例):n由公式可以看出,前一部分为因变量不受限制情况的OLS回归公式,后一部分为受限制的部分。n最大似然法是一种更有效的估计方法。F002221221iiyiyiixLogxyLogLogLogLbb利用EVIEWS估计Tobit模型n在Eviews中包括了估
23、计Tobit模型的指令,其操作步骤如同普通的OLS模型:Quick Estimate equations Censored给出因变量和自变量给出上、下限(可以用常数、变量或公式)选择分布形式nNormal/Logistic/Extreme value指出样本性质(实际审查/以指标值区分是否审查/截取;选择截取时样本发生变化);其他选项非线性模型练习n利用农产品成本数据估计不变替代弹性模型(CES),数据同前。模型形式为:LS 先选择以OLS估计系数为初始值得到估计结果;再人工设定不同的初始值得到估计结果。初始值设置指令形式如:nParam c(1)c1 c(2)c2 c(3)c3 c(4)c4n式中c1到c4为给出的初始值,例如0.2,0.4。n在估计模型时需要注意收敛情况。)4()3(2*)2(1()3(1*)2(*)1(CCXCCXCCY