1、计量经济学应用实践专题计量经济学应用实践专题本章主要内容一、提出问题一、提出问题二、关于数据二、关于数据三、回归模型的选择三、回归模型的选择四、处理结果描述四、处理结果描述一、提出问题一、提出问题n要有明确的分析目标,对你将要估计的模型进要有明确的分析目标,对你将要估计的模型进行细致的形式化表述,同时,评价数据的可获行细致的形式化表述,同时,评价数据的可获得性(切勿随意地抓一把数据过来。)得性(切勿随意地抓一把数据过来。)n所构思的问题应该让人感兴趣,并不需要有广所构思的问题应该让人感兴趣,并不需要有广泛的政策内涵,只需要能引起部分人的兴趣就泛的政策内涵,只需要能引起部分人的兴趣就可以了可以了
2、n所研究的领域可以涉及经济学、管理学、社会所研究的领域可以涉及经济学、管理学、社会学、教育学等众多领域。学、教育学等众多领域。二、关于数据二、关于数据1、数据收集、数据收集n确定采用的数据类型(横截面、时间序确定采用的数据类型(横截面、时间序列、面板数据)列、面板数据)n大致确定有关变量及其数据类型与单位大致确定有关变量及其数据类型与单位选择。(对于同一类变量,单位应该是选择。(对于同一类变量,单位应该是一致的)一致的)n主要标识缺省值,不要混淆,最好采用主要标识缺省值,不要混淆,最好采用句号或问好,或不容易混淆的数字。句号或问好,或不容易混淆的数字。二、关于数据二、关于数据1、数据收集、数据
3、收集n对数据集合中可能遇到的错误进行检测,对数据集合中可能遇到的错误进行检测,保持数据的完整性,了解每项数据的有保持数据的完整性,了解每项数据的有关统计特征。(如样本中教育的最小值关统计特征。(如样本中教育的最小值为为-99,则说明这是缺省值,在分析中应,则说明这是缺省值,在分析中应该忽略这些缺省值。该忽略这些缺省值。n对于时间序列数据,必须注意时间顺序,对于时间序列数据,必须注意时间顺序,做好时间标记。做好时间标记。二、关于数据二、关于数据2、数据描述、数据描述n对数据进行详细解释,说明数据收集的方式与来源,对数据进行详细解释,说明数据收集的方式与来源,及其所做的有关处理。使读者能获得相应数
4、据,并重及其所做的有关处理。使读者能获得相应数据,并重新进行分析新进行分析n若有问卷,应附在后面;其他数据也须包括在参考书若有问卷,应附在后面;其他数据也须包括在参考书或附录中或附录中n列出变量定义表,并明确变量单位列出变量定义表,并明确变量单位n给出一张总结统计量,如最小值、最大值、均值和每给出一张总结统计量,如最小值、最大值、均值和每个变量标准差的表格个变量标准差的表格n清楚地表明观察值的个数,对时间序列数据的特殊时清楚地表明观察值的个数,对时间序列数据的特殊时期进行描述。期进行描述。三、回归模型的选择三、回归模型的选择1、被解释变量与解释变量的形式选择。、被解释变量与解释变量的形式选择。
5、n对数形式的特点:系数度量了变化百分比或弹对数形式的特点:系数度量了变化百分比或弹性、斜率系数不随测度单位而变化、性、斜率系数不随测度单位而变化、logy(y大于大于0)比)比y的水平值的模型更接近经典假设即的水平值的模型更接近经典假设即条件分布更接近正态分布、缩小被解释变量的条件分布更接近正态分布、缩小被解释变量的取值范围(对异常观测并不敏感。取值范围(对异常观测并不敏感。n一般地,工资、薪水、销售额、人口、雇员数一般地,工资、薪水、销售额、人口、雇员数量、学校人数都具有大的正整数特征,常取对量、学校人数都具有大的正整数特征,常取对数形式。数形式。三、回归模型的选择三、回归模型的选择1、被解
6、释变量与解释变量的形式选择。、被解释变量与解释变量的形式选择。n一般地,以年度量的变量(如教育年数、一般地,以年度量的变量(如教育年数、工作经历等)常以原形出现;比例或百工作经历等)常以原形出现;比例或百分比(失业率等)可采用对数或水平值。分比(失业率等)可采用对数或水平值。三、回归模型的选择三、回归模型的选择2、模型的选择、模型的选择n二次函数:描述递减或递增的边际效应。(如二次函数:描述递减或递增的边际效应。(如描述工资与工作经历关系时采用,需要注意最描述工资与工作经历关系时采用,需要注意最高点,若这个转折点超过了样本中绝大多数人高点,若这个转折点超过了样本中绝大多数人的工作经历,就无须考
7、虑二次项。)的工作经历,就无须考虑二次项。)n含交互作用项的模型(若模型中一个解释变量含交互作用项的模型(若模型中一个解释变量对被解释变量的偏效应取决于另一解释变量,对被解释变量的偏效应取决于另一解释变量,则可以采用交互项。)则可以采用交互项。)三、回归模型的选择三、回归模型的选择2、模型的选择、模型的选择n嵌套模型的选择(诊断是否存在一组不相关变量):嵌套模型的选择(诊断是否存在一组不相关变量):用排除性约束下的用排除性约束下的F检验。检验。P132。对多重排除性约束。对多重排除性约束进行联合假设检验,构造进行联合假设检验,构造q个排除性约束的个排除性约束的F统计量。统计量。若发现零假设是正
8、确的,即系数都为零,则可以在模若发现零假设是正确的,即系数都为零,则可以在模型中排除这些解释变量若拒绝零假设,则说明这些约型中排除这些解释变量若拒绝零假设,则说明这些约束中有些变量应该纳入到模型中来。束中有些变量应该纳入到模型中来。(这种检验对于检验一组高度相关变量的排除很有作这种检验对于检验一组高度相关变量的排除很有作用。如企业业绩与经理薪水,对业绩度量可能高度相用。如企业业绩与经理薪水,对业绩度量可能高度相关,由于多重共线性,难以发现单个有显著影响的变关,由于多重共线性,难以发现单个有显著影响的变量,但量,但F检验可决定一组业绩变量是否会影响薪水)让检验可决定一组业绩变量是否会影响薪水)让
9、我们看一个例子。我们看一个例子。三、回归模型的选择三、回归模型的选择2、模型的选择、模型的选择n非嵌套模型的选择:非嵌套模型的选择:a:用调整的:用调整的R平方进行选择。平方进行选择。P186。选择比较大的那。选择比较大的那个模型。(缺陷:不能用与被解释变量不同的两个模个模型。(缺陷:不能用与被解释变量不同的两个模型进行检验。)型进行检验。)b:借鉴排除性约束下的:借鉴排除性约束下的F检验,创造一个包含两个非检验,创造一个包含两个非嵌套模型的不受约束的一般复合模型,并对这个不受嵌套模型的不受约束的一般复合模型,并对这个不受约束模型进行约束模型进行F检验,方法与上面类似。检验,方法与上面类似。c
10、:Davidson-Mackinnon检验。检验。P272。对于两个比。对于两个比较的模型,将较的模型,将a模型的拟合值添加到模型的拟合值添加到b模型,检验其系模型,检验其系数的统计显著性,若拒绝,则说明数的统计显著性,若拒绝,则说明b模型误设。模型误设。三、回归模型的选择三、回归模型的选择3、增加解释变量(对研究对象不很清楚,缺乏、增加解释变量(对研究对象不很清楚,缺乏熟练的理论指导时容易发生大杂烩式的过度拟熟练的理论指导时容易发生大杂烩式的过度拟合)合)n好处:随机误差项的总误差方差会减少,拟合好处:随机误差项的总误差方差会减少,拟合优度提高;优度提高;n坏处:解释起来更加麻烦,导致多重共
11、线性加坏处:解释起来更加麻烦,导致多重共线性加剧,估计系数的方差会变大,置信区间变宽,剧,估计系数的方差会变大,置信区间变宽,对真实参数的假设检验不准确。对真实参数的假设检验不准确。n用用stepwise的方法应该慎重。的方法应该慎重。三、回归模型的选择三、回归模型的选择4、遗漏解释变量、遗漏解释变量n若被遗漏变量与解释变量无关。现有估计量是若被遗漏变量与解释变量无关。现有估计量是无偏而且一致的无偏而且一致的n若被遗漏变量与解释变量有关。现有估计量是若被遗漏变量与解释变量有关。现有估计量是有偏而且不一致的,无论样本容量多大,偏差有偏而且不一致的,无论样本容量多大,偏差都不消失。都不消失。n 误
12、差方差是真实误差方差的有偏估计量;估误差方差是真实误差方差的有偏估计量;估计量方差也是真实估计量方差的有偏估计量;计量方差也是真实估计量方差的有偏估计量;置信区间与假设检验不再可靠。置信区间与假设检验不再可靠。三、回归模型的选择三、回归模型的选择5、函数形式误设的一般性检验:、函数形式误设的一般性检验:RESETP270。在待诊断的回归函数中添加拟合值的平。在待诊断的回归函数中添加拟合值的平方项和三次项。然后检验约束下的多重假设检方项和三次项。然后检验约束下的多重假设检验,与前面的验,与前面的F检验类似。(其中,分子自由检验类似。(其中,分子自由度是度是2,分母自由度是,分母自由度是n-k-1
13、-2)。若接受零)。若接受零假设,意味着添加项系数不显著,从而原模型假设,意味着添加项系数不显著,从而原模型是正确设定的。是正确设定的。不足:当拒绝零假设,即判断模型设定有误时,不足:当拒绝零假设,即判断模型设定有误时,不能提供改进的方向。而且,如果遗漏变量是不能提供改进的方向。而且,如果遗漏变量是线性特征时,无法诊断出来。线性特征时,无法诊断出来。在在某某商品进口回归中商品进口回归中,估计了中国商品进口估计了中国商品进口M与与GDP的关的关系,并发现具有强烈的一阶自相关性。系,并发现具有强烈的一阶自相关性。然而,由于仅用然而,由于仅用GDP来解释商品进口的变化,明显地来解释商品进口的变化,明
14、显地遗漏了诸如商品进口价格、汇率等其他影响因素。因此,遗漏了诸如商品进口价格、汇率等其他影响因素。因此,序列相关性的主要原因可能就是建模时遗漏了重要的相序列相关性的主要原因可能就是建模时遗漏了重要的相关变量造成的。关变量造成的。下面进行下面进行RESET检验。检验。用原回归模型估计出商品进口序列用原回归模型估计出商品进口序列 ttGDPM020.091.152R2=0.9484应用实例 (-0.085)(8.274)(-6.457)(6.692)R2=0.9842320759.80028.0072.0860.3tttMEMGDPM)1(/()1(/)(222qknRqRRFURU5.22)42
15、4/()984.01(2/)948.0984.0(在=5%下,查得临界值F0.05(2,20)=3.49判断:拒绝原模型与引入新变量的模型可决系数无显著差异的假设,表明原模型确实存在遗漏相关变量的设定偏误。三、回归模型的选择三、回归模型的选择6、诊断是否存在异方差(截面数据)或、诊断是否存在异方差(截面数据)或自相关(序列数据)自相关(序列数据)并采用广义最小二乘法对模型进行变换。并采用广义最小二乘法对模型进行变换。四、处理结果描述四、处理结果描述n应包括任何模型的估计,可从易到难;应包括任何模型的估计,可从易到难;n若仅仅估计了几个方程,直接用方程形若仅仅估计了几个方程,直接用方程形式展示出
16、来,标准差用括号放在系数之式展示出来,标准差用括号放在系数之下;下;n若模型有不少解释变量,而且模型形式若模型有不少解释变量,而且模型形式有差异,最好用表格记录并描述结果,有差异,最好用表格记录并描述结果,包括调整的包括调整的R平方、观测次数、平方、观测次数、t值等;值等;四、处理结果描述四、处理结果描述n讨论对经验结果的解释程度与显著性,系数符讨论对经验结果的解释程度与显著性,系数符号等;号等;n描述主要解释变量系数的大小,对于重要变量描述主要解释变量系数的大小,对于重要变量系数的符号、大小与显著性应特别关注。系数的符号、大小与显著性应特别关注。n对于产生结果的特定计量经济学软件包命令,对于
17、产生结果的特定计量经济学软件包命令,不应该出现论文之中。不应该出现论文之中。n对处理的结果进行经济学分析,并对模型分析对处理的结果进行经济学分析,并对模型分析进行评价。进行评价。n从政策与经验的角度提出相应的建议。从政策与经验的角度提出相应的建议。n严禁隐瞒、虚报生产安全事故。22.8.622.8.6Saturday,August 06,2022n推行ISO9000不走样,企业生存发展有希望。15:32:5215:32:5215:328/6/2022 3:32:52 PMn质量出效益,点滴成江河。22.8.615:32:5215:32Aug-226-Aug-22n厕所卫生要注意,干净清洁常保持
18、。15:32:5215:32:5215:32Saturday,August 06,2022n人人讲安全,安全为人人。22.8.622.8.615:32:5215:32:52August 6,2022n今日的质量,明日的市场。2022年8月6日下午3时32分22.8.622.8.6n树立自我信心,把握各工段流程;消灭疵点起因,管理操作是关键。2022年8月6日星期六下午3时32分52秒15:32:5222.8.6n安全是增产的细胞,隐患是事故的胚胎。2022年8月下午3时32分22.8.615:32August 6,2022n我们极度鄙视一切乱丢乱吐等不文明行为。2022年8月6日星期六15时32分52秒15:32:526 August 2022n清洁拥有清爽明亮的工作环境。下午3时32分52秒下午3时32分15:32:5222.8.6n贯彻ISO系列标准,树立企业新形象。22.8.622.8.615:3215:32:5215:32:52Aug-22n老兄!品管不是空想,而是起而行的工作。2022年8月6日星期六15时32分52秒Saturday,August 06,2022n幸福是棵树,安全是沃土。22.8.62022年8月6日星期六15时32分52秒22.8.6谢谢大家!谢谢大家!