1、第七章第七章 线性线性回归模型的扩展第一节第一节 变量变量非线性回归模型非线性回归模型第二节第二节 参数非线性回归模型参数非线性回归模型*第三节第三节 虚拟虚拟解释解释变量变量回归模型回归模型第四节第四节 虚拟虚拟被解释被解释变量变量回归模型回归模型*机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第2 2页页 前几章所讨论的,都是基于横截面数据的线性回前几章所讨论的,都是基于横截面数据的线性回归模型,涉及的变量均是数值变量。实际上,许多经归模型,涉及的变量均是数值变量。实际上,许多经济变量之间
2、并不存在线性关系,建模中涉及的许多变济变量之间并不存在线性关系,建模中涉及的许多变量也不直接表现为数值,而是属于分类变量的范畴。量也不直接表现为数值,而是属于分类变量的范畴。为了扩大计量经济建模方法的适用范围,本章为了扩大计量经济建模方法的适用范围,本章拟将横截面数据的线性回归建模方法扩展到对非线拟将横截面数据的线性回归建模方法扩展到对非线性关系的分析,并将计量经济模型的变量类型从数性关系的分析,并将计量经济模型的变量类型从数值变量扩展到分类变量。值变量扩展到分类变量。机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统
3、计学院计量经济教研室第第3 3页页 线性回归分析的前提是作为被解释变量的经济变量与作为线性回归分析的前提是作为被解释变量的经济变量与作为解释变量的经济变量之间存在着线性关系。这里所说的线性是解释变量的经济变量之间存在着线性关系。这里所说的线性是指指解释变量线性并且参数线性解释变量线性并且参数线性。但是,在众多的经济现象中,。但是,在众多的经济现象中,分析经济变量之间的关系,根据某种经济理论和对实际经济问分析经济变量之间的关系,根据某种经济理论和对实际经济问题的分析,所建立的经济模型往往不符合上面的线性要求,即题的分析,所建立的经济模型往往不符合上面的线性要求,即模型是非线性的,称为模型是非线性
4、的,称为非线性模型非线性模型(Non-linear Model)。非线性模型包括两种情况:(非线性模型包括两种情况:(1)解释变量非线性解释变量非线性,但是,但是参数线性。(参数线性。(2)参数非线性参数非线性。尤其参数非线性是对古典假定。尤其参数非线性是对古典假定SLR.1和和MLR.1的违背,对回归分析影响很大。的违背,对回归分析影响很大。本节针对第一种情况进行讨论,常用的变量非线性回归模型本节针对第一种情况进行讨论,常用的变量非线性回归模型包括包括对数函数模型、双曲线模型和多项式模型对数函数模型、双曲线模型和多项式模型。这类模型有一个这类模型有一个共同特点,可以利用变量转换等处理方法将模
5、型线性化,线性化共同特点,可以利用变量转换等处理方法将模型线性化,线性化后的模型即可采用后的模型即可采用OLS方法进行参数估计。这类非线性模型被称方法进行参数估计。这类非线性模型被称为内蕴线性模型,或广义线性模型。为内蕴线性模型,或广义线性模型。第一节第一节 变量非线性回归模型变量非线性回归模型机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第4 4页页一、对数函数模型一、对数函数模型(一)双对数函数模型(一)双对数函数模型 回归分析经常使用的对数模型是双对数函数模型回归分析经常使用的对数模型是
6、双对数函数模型(Double-log Model),考虑如下形式的需求收入模型,考虑如下形式的需求收入模型uyylnlnln10 (7.2)(7.2)中的参数是以线性形式出现在模型中的,虽)中的参数是以线性形式出现在模型中的,虽然然(7.1)中原变量中原变量x和和y之间是非线性的,但因变量与自变之间是非线性的,但因变量与自变量的对数形式是线性的,因而称量的对数形式是线性的,因而称双对数函数模型。双对数函数模型。对数函数模型的自变量和因变量中,至少有一种对数函数模型的自变量和因变量中,至少有一种是原始变量的对数形式。具体分为以下两种类型:是原始变量的对数形式。具体分为以下两种类型:10uyx e
7、两边取对数,模型可变换为两边取对数,模型可变换为:(7.1)机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第5 5页页 实际工作中,双对数模型应用非常广泛,实际工作中,双对数模型应用非常广泛,其原因在于,如果忽略误差项其原因在于,如果忽略误差项,(7.2)是一条直线是一条直线(y和和x都是对数形式),所以它的斜率(都是对数形式),所以它的斜率(1)为一常数为一常数,是是y相对于相对于x的弹性系数的弹性系数:1(ln)/(ln)/dyy yEdxx x 所以弹性为一常数。由于这个特殊的性质,所以
8、弹性为一常数。由于这个特殊的性质,双对数模型又称为双对数模型又称为不变不变(固定固定)弹性模型。弹性模型。对这类模型可作如下代换,令对这类模型可作如下代换,令xxyylnln*双对数模型可化为标准线性模型双对数模型可化为标准线性模型uxy*10*在古典假定满足的情况下,可以使用在古典假定满足的情况下,可以使用OLS对模型进行估计。对模型进行估计。机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第6 6页页对于多个解释变量的情形,(对于多个解释变量的情形,(7.2)式可以扩展为)式可以扩展为uxx
9、xykklnlnlnln22110(7.3)称为偏弹性系数。它度量了在其他变量不变的条件称为偏弹性系数。它度量了在其他变量不变的条件下,被解释变量下,被解释变量y对于解释变量对于解释变量 的弹性系数。的弹性系数。如著名的柯布如著名的柯布道格拉斯(道格拉斯(CobbDouglas)生产函)生产函数模型数模型 ,就是这类模型的一个典型,我,就是这类模型的一个典型,我们下面举例说明。们下面举例说明。uQAL Keiix例例7-1 表表7-1列出了抽样调查得到的某市列出了抽样调查得到的某市19个规模以上个规模以上制造业企业的投入产出数据。试用回归分析法分析企制造业企业的投入产出数据。试用回归分析法分析
10、企业产出中各要素的贡献及其特点。业产出中各要素的贡献及其特点。机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第7 7页页企业企业产值产值Q(万元)(万元)职工数职工数L(人)(人)固定资产固定资产K(万元)(万元)大华大华1291.878742051.92麒麟麒麟1347.058952151.3双剑双剑1399.69172250.21衡麓衡麓1505.119572370.26六合六合1578.979532488.97春风春风1652.869662606.61联华联华1784.911033275
11、4.66太岳太岳1994.5710982953.78东海东海2123.2311753157.15荷佳荷佳2269.7711523376.42博世博世2411.9411543635.99科维科维2608.8112073918.47梅花梅花2774.9812304223.82绿源绿源2965.312964550.49人和人和3067.1213344846.77花都花都3290.313745205.33金鼎金鼎3540.5715925615.31谦祥谦祥3749.7714156098.25表表71 某市某市19个规模以上制造业企业的投入产出数据个规模以上制造业企业的投入产出数据机动 目录 上页 下页
12、 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第8 8页页用用EViews建立双对数模型,回归结果如下:建立双对数模型,回归结果如下:样本回归方程为:样本回归方程为:tttKLQln8419.0ln3397.05452.1lnDependent Variable:LOG(Q)Method:Least SquaresIncluded observations:19 after adjustmentsVariableCoefficientStd.Errort-StatisticProb.C-1.5452110.5907
13、10-2.6158550.0187LOG(L)0.3397010.1889871.7974790.0912LOG(K)0.8419100.0951418.8491220.0000 R-squared0.994499 Mean dependent var7.651499 Adjusted R-squared0.993811 S.D.dependent var0.365836 S.E.of regression0.028780 Akaike info criterion-4.114328 Sum squared resid0.013253 Schwarz criterion-3.965206 Lo
14、g likelihood42.08611 F-statistic1446.223 Durbin-Watson stat0.432115Prob(F-statistic)0.000000机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第9 9页页 对样本回归方程解释如下:斜率系数对样本回归方程解释如下:斜率系数0.3397表示表示产出对劳动投入的弹性,即表明在资本投入保持不变产出对劳动投入的弹性,即表明在资本投入保持不变的条件下,劳动投入每增加一个百分点,平均产出将的条件下,劳动投入每增加一个百分
15、点,平均产出将增加增加0.3397个百分点。同样地,在劳动投入保持不变个百分点。同样地,在劳动投入保持不变的条件下,资本投入每增加一个百分点,产出将平均的条件下,资本投入每增加一个百分点,产出将平均增加增加0.8419个百分点。两个弹性系数相加为规模报酬个百分点。两个弹性系数相加为规模报酬系数,其数值大于系数,其数值大于1,表明该市经济的特征很可能是,表明该市经济的特征很可能是规模报酬递增的(如果数值等于规模报酬递增的(如果数值等于1,属于规模报酬不,属于规模报酬不变;小于变;小于1,则属于规模报酬递减)。,则属于规模报酬递减)。机动 目录 上页 下页 返回 结束 20232023年年5 5月
16、月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第1010页页 根据单边检验的结果,这两个系数各自均是统根据单边检验的结果,这两个系数各自均是统计显著的(这是用单边检验,即计显著的(这是用单边检验,即 ,因为我,因为我们预期劳动力和资本对产出影响都是正向的),模们预期劳动力和资本对产出影响都是正向的),模型的型的F值也是高度显著的(因为值也是高度显著的(因为prob=0.0000),因),因此能够拒绝零假设:劳动力与资本对产出无影响。此能够拒绝零假设:劳动力与资本对产出无影响。R2值为值为0.995,表明劳动力和资本(对数)的变动,表明劳动力和资本(对数)的
17、变动解释了大约解释了大约99.5%的产出(对数)的变动,说明了的产出(对数)的变动,说明了模型很好地拟合了样本数据。模型很好地拟合了样本数据。0.10机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第1111页页(二)半对数函数模型(二)半对数函数模型线性模型与对数函数模型的混合就是线性模型与对数函数模型的混合就是半对数模型半对数模型(Semi-log Models)。因变量是对数形式(对数线性模型):因变量是对数形式(对数线性模型):uxy10ln(7.4)解释变量是对数形式解释变量是对数形式
18、(线性对数模型):(线性对数模型):01lnyxu(7.5)这两个模型的参数是以线性形式出现的,虽然原变量这两个模型的参数是以线性形式出现的,虽然原变量之间是非线性的,但被解释(解释)变量的对数与解释之间是非线性的,但被解释(解释)变量的对数与解释(被解释)变量之间是线性关系,因此,半对数函数模型(被解释)变量之间是线性关系,因此,半对数函数模型可以很容易地转换成线性模型,并使用可以很容易地转换成线性模型,并使用OLS估计参数。估计参数。机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第1212
19、页页对于半对数模型(对于半对数模型(7.4),显然有),显然有1d|d|dlnd/iiiiiiiE y xE y xE y xxxxx x 可见,可见,表示表示x每变化一个相对单位(变动率)对每变化一个相对单位(变动率)对应的应的y的平均绝对变动量,所以,半对数函数模型又称增的平均绝对变动量,所以,半对数函数模型又称增长率模型。(长率模型。(7.4)常用于度量由解释变量相对变动率导)常用于度量由解释变量相对变动率导致的被解释变量平均变动的绝对数量;(致的被解释变量平均变动的绝对数量;(7.5)常用于度)常用于度量由解释变量绝对量变化导致的被解释变量的平均相对量由解释变量绝对量变化导致的被解释变
20、量的平均相对变动率。两个模型中的斜率系数变动率。两个模型中的斜率系数 又被称为半弹性又被称为半弹性(Semi-elasticity)系数。系数。11机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第1313页页二、双曲线模型二、双曲线模型形如形如011yux的模型,称为的模型,称为双曲线模型双曲线模型(Double-curve Model)。该模型刻该模型刻画了画了 y与与x的反向变动关系的反向变动关系,其显著特点是随着其显著特点是随着 x的无限增大的无限增大(即即 1/x接近于零接近于零),y
21、趋近于趋近于 。01zx令令,原模型可化为线性形式,原模型可化为线性形式01yzu即可用即可用OLS的方法进行估计。的方法进行估计。菲利普斯曲线(菲利普斯曲线(Phillips Curve)就是这个模型在经济)就是这个模型在经济分析中应用的典型体现。菲利普斯曲线刻画了通货膨胀率分析中应用的典型体现。菲利普斯曲线刻画了通货膨胀率与失业率的反向变动关系,如图与失业率的反向变动关系,如图7-1。机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第1414页页 失业率与通货膨胀率负向相关,同时通货膨胀率变
22、化失业率与通货膨胀率负向相关,同时通货膨胀率变化有一个渐近底限有一个渐近底限。当失业率。当失业率x趋于无穷大时,通货膨胀率趋于无穷大时,通货膨胀率y将取渐近值将取渐近值 。0100000失业率菲利普斯曲线机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第1515页页三、多项式函数模型三、多项式函数模型 多项式回归模型(多项式回归模型(Polynomial Regression Model)在在生产与成本函数分析中被广泛地使用。生产与成本函数分析中被广泛地使用。如果用如果用y表示成本,表示成本,x
23、表示产出,则可以建立以下多表示产出,则可以建立以下多项式模型,体现微观经济分析中的二者关系:项式模型,体现微观经济分析中的二者关系:总成本(总成本(TC):):230123yxxxu边际成本(边际成本(MC)和平均成本()和平均成本(AC)的)的 PRF为:为:(7.8)即总体回归函数(即总体回归函数(PRF)为:)为:230123(|)iiiiE y xxxx2123(|)23iiiE y xxx201231(|)iiiiE yxxxx机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第1616
24、页页产出产出x成本成本y产出产出x成本成本yMCTCAC 成本曲线 如果模型的解释变量为如果模型的解释变量为时间变量时间变量t,多项式函数模型多项式函数模型又称为又称为曲线回归模型,曲线回归模型,常常用于对非线性长期趋势的常常用于对非线性长期趋势的拟合。拟合。有时为了反映自变量之间的有时为了反映自变量之间的交互影响交互影响,也需要用到多,也需要用到多项式回归模型。项式回归模型。机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第1717页页 如以如以y、x、z分别表示单位面积上的粮食产量、施肥量分
25、别表示单位面积上的粮食产量、施肥量和灌溉用水量。由于施肥量和灌溉用水量对粮食产量的效和灌溉用水量。由于施肥量和灌溉用水量对粮食产量的效应之间存在交互影响,所以,可以建立以下模型:应之间存在交互影响,所以,可以建立以下模型:0123iiiiiiyxzx zu施肥量施肥量x对粮食产量对粮食产量y的总边际影响是:的总边际影响是:是施肥量对粮食产量的直接效应(假定灌溉用水量不是施肥量对粮食产量的直接效应(假定灌溉用水量不变),变),是施肥量对粮食产量的间接效应,随灌溉用水量的是施肥量对粮食产量的间接效应,随灌溉用水量的不同而变化,说明肥效的发挥取决于灌溉用水的多少。同样,不同而变化,说明肥效的发挥取决
26、于灌溉用水的多少。同样,灌溉用水灌溉用水z对粮食产量对粮食产量y的总边际影响也可以这样分解。显然,的总边际影响也可以这样分解。显然,该模型比单纯的二元回归模型该模型比单纯的二元回归模型 更符合实更符合实际情况。际情况。13z012iiiiyxzu13d(|)diiiE y xzx机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第1818页页例例7-2 表表7-3给出了某市给出了某市16个企业的产品产量(个企业的产品产量(x)与单位产)与单位产品成本(品成本(y)的抽样调查数据。试研究二者的依存关
27、系。)的抽样调查数据。试研究二者的依存关系。企业序号企业序号产品产量产品产量(吨)(吨)x单位产品成单位产品成本本(元(元/吨)吨)y企业序号企业序号产品产量产品产量(吨)(吨)x单位产品成单位产品成本本(元(元/吨)吨)y143034629602310824103433106193068343232751175630514501315112738300755523108136953068656530761464730347588314615635298186653057167882962 企业产品产量与单位产品成本数据企业产品产量与单位产品成本数据机动 目录 上页 下页 返回 结束 2023
28、2023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第1919页页 根据规模经济的原理,产品产量是单位产品成本变化的根据规模经济的原理,产品产量是单位产品成本变化的原因。为了明确二者的具体关系类型,使用原因。为了明确二者的具体关系类型,使用EViews的的Graph功能,绘制散点图如下:功能,绘制散点图如下:2900300031003200330034003500400500600700800XYKernel Fit(Epanechnikov,h=56.700)机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东
29、财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第2020页页 显然,二者的关系不是线性关系。可供选择的模型有显然,二者的关系不是线性关系。可供选择的模型有以下两种:以下两种:双曲线模型:双曲线模型:011yux半对数模型:半对数模型:01lnyxu分别拟合两种模型,回归结果整理如下:分别拟合两种模型,回归结果整理如下:01模型模型 的估计值与的估计值与t检验值检验值 的估计值与的估计值与t检验值检验值R2AICSCt检验值检验值t检验值检验值双曲线双曲线半对数半对数2489.77247.833.4413.18367183.6-646.28.70-7.510.840.8011
30、.1411.3811.2311.48 双曲线模型和幂函数模型的系数均通过了显著性检验,双曲线模型和幂函数模型的系数均通过了显著性检验,但前者无论是但前者无论是R2还是还是AIC、SC均好于后者,所以,最终的均好于后者,所以,最终的模型应为双曲线模型:模型应为双曲线模型:12489.7367183.6yx10机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第2121页页 该回归结果说明,单位产品成本随产量的上升而下降,该回归结果说明,单位产品成本随产量的上升而下降,当产品产量趋近于无穷大时,单位产
31、品成本趋近于当产品产量趋近于无穷大时,单位产品成本趋近于2489.7元元/吨,这就是单位产品成本的理论最低值(实际上是可变吨,这就是单位产品成本的理论最低值(实际上是可变成本部分)。成本部分)。四、四、Box-Cox变换变换 在考察被解释变量在考察被解释变量y和解释变量和解释变量 的关系的关系时,经常用的两种模型是线性模型时,经常用的两种模型是线性模型Kxxx,2101 122tttkkttyxxxu和对数线性模型和对数线性模型01122lnlnlnlntttkkttyxxxu事实上,经济学家对被解释变量和解释变量之间的具体的事实上,经济学家对被解释变量和解释变量之间的具体的函数关系并不是很清
32、楚的。函数关系并不是很清楚的。机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第2222页页 由博克斯和考克斯(由博克斯和考克斯(Box,Cox,1964)引进的)引进的Box-Cox变换变换对于利用样本数据确定函数形式非常有益的。对于利用样本数据确定函数形式非常有益的。对一种关系中的所有变量进行某个变换就会得到一个对一种关系中的所有变量进行某个变换就会得到一个由变换参数决定的函数族,线性和对数线性关系是这个函数由变换参数决定的函数族,线性和对数线性关系是这个函数族中的两个特例。函数形式最终由估
33、计的变换参数值确定。族中的两个特例。函数形式最终由估计的变换参数值确定。我们考虑变量我们考虑变量z的下列的下列Box-Cox变换:变换:()10ln0zzz1时,时,;1)(zz1时,时,;11)(zz0时,时,。zzln)(机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第2323页页 对某个特殊的关系式的所有变量都进行对某个特殊的关系式的所有变量都进行Box-Cox变换变换可得到下列模型可得到下列模型()()()()01 12 2tttk kttyxxxu 时,这个模型就是双对数模型(时,这
34、个模型就是双对数模型(7.13)。)。01时,可得时,可得011221(1)(1)(1)tttkkttyxxxu 即即0121 1*01 1(1)tktkktttkkttyxxuxxu它和线性模型(它和线性模型(7.12)是等价的。对于其它的)是等价的。对于其它的 的值,确的值,确定其它的函数形式。定其它的函数形式。机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第2424页页 也可以进行更一般的变换,它就是每个变量的变换参也可以进行更一般的变换,它就是每个变量的变换参数不一样。此时变换后得到的
35、模型为数不一样。此时变换后得到的模型为012()()()()01 122ktttkkttyxxxu可能有些变量以线性的形式出现(可能有些变量以线性的形式出现(,有些变量,有些变量以对数的形式出现(以对数的形式出现(,有些变量以倒数的形式出,有些变量以倒数的形式出现(现(,等等。这样得到的函数族更大些,但是等等。这样得到的函数族更大些,但是它也给我们估计参数带来困难。它也给我们估计参数带来困难。1)j0)j1)j 接下来,我们需要做的事情就是利用样本数据估计变换接下来,我们需要做的事情就是利用样本数据估计变换参数参数 或(或()以及)以及 ,得到估计,得到估计的函数形式。一般采用极大似然估计方法
36、估计参数,在此的函数形式。一般采用极大似然估计方法估计参数,在此不展开讨论。不展开讨论。012(,)k j机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第2525页页五、小结五、小结 计量经济模型设定的重要方面是要使所设定的变量间计量经济模型设定的重要方面是要使所设定的变量间函数形式能够函数形式能够体现体现变量间的变量间的基本关系基本关系。总体回归模型是对。总体回归模型是对总体回归函数的描述,总体回归函数正是计量经济要去估总体回归函数的描述,总体回归函数正是计量经济要去估计的目标。但其真实的函
37、数形式事先并不知道。所谓计的目标。但其真实的函数形式事先并不知道。所谓模型模型函数形式的设定函数形式的设定,是指根据对变量间相互关系的已有认识,是指根据对变量间相互关系的已有认识,把把y的条件期望设定为解释变量的条件期望设定为解释变量x的某种函数。总体条件期的某种函数。总体条件期望函数望函数 ,可以设定为各种具体的函数形式。,可以设定为各种具体的函数形式。在计量经济学的实践中,通常把总体回归函数的具体函数在计量经济学的实践中,通常把总体回归函数的具体函数形式设定为初等函数,应当注意的是不同函数形式中参数形式设定为初等函数,应当注意的是不同函数形式中参数的经济意义有较大差异。常用的函数形式见课本
38、的经济意义有较大差异。常用的函数形式见课本P217表表7-5(课件略)。课件略)。|iiE y xf x机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第2626页页 大多数模型中,边际和弹性系数为变量,其大小取决大多数模型中,边际和弹性系数为变量,其大小取决于具体样本点自变量或(和)因变量的取值。在实际应用于具体样本点自变量或(和)因变量的取值。在实际应用时,一般用时,一般用 代替具体的代替具体的 计算,得到的是平均的计算,得到的是平均的边际效应或弹性系数。边际效应或弹性系数。,x y,iix
39、 y机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第2727页页第三节第三节 虚拟变量虚拟变量虚拟变量含义虚拟变量含义虚拟解释变量的回归虚拟解释变量的回归分类变量表现为多种状态分类变量表现为多种状态机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第2828页页 迄今为止,本教材涉及的变量都是数值变量,诸迄今为止,本教材涉及的变量都是数值变量,诸如市场需求量、商品的价格、收入、产量等;但我如市场需
40、求量、商品的价格、收入、产量等;但我们在建模时还经常遇到另外一些们在建模时还经常遇到另外一些“变量变量”,如职业、,如职业、性别、地区、季节等等。性别、地区、季节等等。例如,季节的变化会对某些商品的需求量产生影例如,季节的变化会对某些商品的需求量产生影响;性别或者职业的不同,其收入水平可能会有很响;性别或者职业的不同,其收入水平可能会有很大的差异。大的差异。再如,当研究某一经济问题时还可能有些起暂时再如,当研究某一经济问题时还可能有些起暂时作用的作用的“变量变量”,诸如在某一时期出现了战争、天,诸如在某一时期出现了战争、天灾、人祸等。诸如此类的灾、人祸等。诸如此类的“变量变量”都是分类变量,都
41、是分类变量,或称为或称为“非数值变量非数值变量”、“定性变量定性变量”或或“名义变名义变量量”。一、虚拟变量一、虚拟变量 机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第2929页页 在计量经济建模过程中,有时候分类变量是不可缺在计量经济建模过程中,有时候分类变量是不可缺少的。但由于在一般情况它们并少的。但由于在一般情况它们并不表现为具体的数值不表现为具体的数值,为了将分类变量引入计量经济模型中,需要率先将其数为了将分类变量引入计量经济模型中,需要率先将其数量化,即转化为所谓的量化,即转化为所
42、谓的“虚拟变量虚拟变量”(Dummy Variable),又被称为二元变量或二进制变量(),又被称为二元变量或二进制变量(Binary Variable),一般用),一般用D来表示。来表示。分类变量数量化的方法分类变量数量化的方法是,当分类变量起作用时,赋是,当分类变量起作用时,赋值值“D1”;不起作用时,赋值;不起作用时,赋值“D0”。通过定义虚。通过定义虚拟变量,就可以将分类变量等同于数值变量,引入回归拟变量,就可以将分类变量等同于数值变量,引入回归模型之中。模型之中。机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大
43、学统计学院计量经济教研室第第3030页页 计量经济模型中,虚拟变量可以发挥多方面的作计量经济模型中,虚拟变量可以发挥多方面的作用:比如,作为属性因素的代表,如性别、所有制等;用:比如,作为属性因素的代表,如性别、所有制等;可以作为某些非精确计量的数量因素的代表,如受教可以作为某些非精确计量的数量因素的代表,如受教育程度、管理者素质等;作为某些偶然因素或政策因育程度、管理者素质等;作为某些偶然因素或政策因素的代表,如战争、灾害、改革前后等;实现分段回素的代表,如战争、灾害、改革前后等;实现分段回归,研究斜率、截距的变动,或比较两个回归模型的归,研究斜率、截距的变动,或比较两个回归模型的结构差异;
44、作为时间序列分析中季节(月份)的代表;结构差异;作为时间序列分析中季节(月份)的代表;等等。等等。机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第3131页页 在计量经济学中,把包含有虚拟变量的模型称在计量经济学中,把包含有虚拟变量的模型称为虚拟变量模型。常用的虚拟变量模型有三种类型:为虚拟变量模型。常用的虚拟变量模型有三种类型:1.解释变量中只包含虚拟变量,作用是在假定其解释变量中只包含虚拟变量,作用是在假定其他因素都不变时,只研究分类变量是否使被解释变量他因素都不变时,只研究分类变量是否使
45、被解释变量表现出显著差异;表现出显著差异;2.解释变量中既含数值变量,又含虚拟变量,解释变量中既含数值变量,又含虚拟变量,研究数值变量和虚拟变量同时对被解释变量的影响;研究数值变量和虚拟变量同时对被解释变量的影响;3.被解释变量本身为虚拟变量的模型,即被解被解释变量本身为虚拟变量的模型,即被解释变量本身取值为释变量本身取值为0或或1的模型,适于对某社会经济现的模型,适于对某社会经济现象进行象进行“是是”与与“否否”的判断研究。的判断研究。本节讨论前两种情形。本节讨论前两种情形。机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财
46、经大学统计学院计量经济教研室第第3232页页二、二、虚拟解释变量的回归虚拟解释变量的回归 在计量经济模型中,加入虚拟解释变量的途径有两在计量经济模型中,加入虚拟解释变量的途径有两种基本类型:一是加法类型;二是乘法类型。不同的途种基本类型:一是加法类型;二是乘法类型。不同的途径引入虚拟变量有不同的作用,加法方式引入虚拟变量径引入虚拟变量有不同的作用,加法方式引入虚拟变量改变的是模型的截距;乘法方式引入虚拟变量改变的是改变的是模型的截距;乘法方式引入虚拟变量改变的是模型的斜率。模型的斜率。(一)用虚拟变量表示不同截距的回归(一)用虚拟变量表示不同截距的回归加法类型加法类型 以加法类型引入虚拟解释变
47、量的模型,虚拟解释变以加法类型引入虚拟解释变量的模型,虚拟解释变量与其他解释变量是相加关系;从计量经济模型的意义量与其他解释变量是相加关系;从计量经济模型的意义看,其作用是改变了设定模型的截距水平。比如:看,其作用是改变了设定模型的截距水平。比如:012iiiiyxDu机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第3333页页例例 :研究性别与收入(:研究性别与收入(yi)的关系:我们可以定义虚拟变)的关系:我们可以定义虚拟变量量Di,Di=0时表示女性,时表示女性,Di=1时表示男性,即:
48、时表示男性,即:对于线性回归模型对于线性回归模型 (7.18),若假设若假设H0:1=0成立,则说明收入与性别将没有太大关系;成立,则说明收入与性别将没有太大关系;若假设若假设H0:1=0不成立,则说明收入与性别有关。不成立,则说明收入与性别有关。01iiiyDu男性女性10iD 以加法类型引入虚拟变量时,分为两种情形:解释以加法类型引入虚拟变量时,分为两种情形:解释变量只有分类变量而无数值变量;解释变量既有数值变变量只有分类变量而无数值变量;解释变量既有数值变量又有分类变量。量又有分类变量。1.解释变量只有分类变量而无数值变量的回归解释变量只有分类变量而无数值变量的回归机动 目录 上页 下页
49、 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第3434页页例例7-4 7-4 研究学历与收入(研究学历与收入(y yi i)的关系:可以建立)的关系:可以建立如下模型:如下模型:01iiiyDu,3,2,1iyi表示起薪,其中大学非大学10iD女性男性可分解成两个式子时,借助在iiiiiuuyD010:)18.7(,0机动 目录 上页 下页 返回 结束 20232023年年5 5月月1313日日山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第3535页页表表7-6为从某城市随机获取的为从某
50、城市随机获取的10名职工的学历情况与最初参加名职工的学历情况与最初参加工作时的起薪。试建立样本回归模型。工作时的起薪。试建立样本回归模型。起薪(元)起薪(元)教育教育(1=1=大学,大学,0=0=非大非大学)学)起起 薪薪(元)(元)教育(教育(1=1=大学,大学,0=0=非大学)非大学)23002300150015001400140021002100250025001 10 00 01 11 1170017001300130090090017001700220022000 01 10 00 01 1表表7-6 7-6 起薪与受教育程度数据起薪与受教育程度数据机动 目录 上页 下页 返回 结束