大学课件:第2章 回归概述(新).ppt

上传人(卖家):罗嗣辉 文档编号:5268725 上传时间:2023-03-03 格式:PPT 页数:50 大小:742KB
下载 相关 举报
大学课件:第2章 回归概述(新).ppt_第1页
第1页 / 共50页
大学课件:第2章 回归概述(新).ppt_第2页
第2页 / 共50页
大学课件:第2章 回归概述(新).ppt_第3页
第3页 / 共50页
大学课件:第2章 回归概述(新).ppt_第4页
第4页 / 共50页
大学课件:第2章 回归概述(新).ppt_第5页
第5页 / 共50页
点击查看更多>>
资源描述

1、1第二章第二章 经典单方程计量经济学模型:经典单方程计量经济学模型:一元线性回归模型一元线性回归模型 线性回归的基本思想:线性回归的基本思想:双变量模型双变量模型2线性回归的基本思想:双变量模型线性回归的基本思想:双变量模型 回归分析概述回归分析概述参数估计参数估计模型检验模型检验模型预测模型预测回归分析构成回归分析构成计量经济学的计量经济学的方法论基础方法论基础3线性回归的基本思想:线性回归的基本思想:双变量模型双变量模型(或一元线性回归模型或一元线性回归模型)本节课的内容回归分析的含义总体回归函数样本回归函数总体回归模型回归分析的目的样本回归模型随机误差项的性质二、参数估计二、参数估计 一

2、、回归分析概述一、回归分析概述最小二乘原理OLS下如何进行参数估计4本章学习重点:本章学习重点:1、总体回归函数(、总体回归函数(PRF)、样本回归函数、样本回归函数(SRF)2、随机误差项的性质(或内容)、随机误差项的性质(或内容)3、回归分析的主要目的、回归分析的主要目的4、“线性线性”回归特殊含义回归特殊含义5、普通最小二乘估计量的重要性质、普通最小二乘估计量的重要性质5一、一、回归分析的含义1.变量间的关系变量间的关系2.回归分析的含义回归分析的含义4.回归分析的主要内容回归分析的主要内容3.“线性线性”回归分析的回归分析的“特殊特殊”含义含义5.从双变量到多变量的线性回归从双变量到多

3、变量的线性回归61.1.变量间的关系变量间的关系2,f 圆 面 积半 径半 径,f农作物产量 气温 降雨量 阳光 施肥量7确定性关系或函数关系统计依赖或相关关系经济变量之间的关系相关分析回归分析回归分析线性关系非线性关系变量间的关系变量间的关系8相关分析相关分析(correlation analysis):对称地对待任何(两个)变量,两个变量都被看作是随机的回归分析回归分析(regression analysis):对变量的处理方法存在不对称性,即区分应变量(被解释变量)和自变量(解释变量):前者是随机变量,后者不是回归分析回归分析/相关分析相关分析研究一个变量对另一个(些)变量的统计依赖关系

4、,但它们并不意味着一定有因果关系但它们并不意味着一定有因果关系被解释变量(因变量)解释变量(自变量)回归分析情况下非随机变量随机变量因果关系的判定或推断必须建立在经实践检验的相关理论基础之上9是用于研究一个变量与另一个(或一些)变量的具体是用于研究一个变量与另一个(或一些)变量的具体依赖关系的计算方法和理论依赖关系的计算方法和理论。被解释变量(因变量)Y解释变量(自变量)X1、X2、目的:目的:在于通过自变量的已知或设定值,去估计和(或)预测在于通过自变量的已知或设定值,去估计和(或)预测因变量的(总体)均值。因变量的(总体)均值。估计预测农作物的产量,气温降雨量阳光 施肥量示例:2.2.回归

5、分析回归分析(regression analysis)的含义的含义103.“线性线性”回归的特殊含义回归的特殊含义变量线性变量线性参数线性参数线性应变量的条件均值是应变量的条件均值是自变量的线性函数自变量的线性函数应变量的条件均值是参数应变量的条件均值是参数的线性函数,而变量之间的线性函数,而变量之间并不一定是线性的并不一定是线性的线性线性回归是指参数线性的回归回归是指参数线性的回归(即参数仅(即参数仅以一次方的形式出现在模型中),而解释以一次方的形式出现在模型中),而解释变量并不一定是线性的。变量并不一定是线性的。11(1)根据自变量的取值,估计应变量的均值。即根据样本观察值对经济计量模型参

6、数进行估计,求得回归方程;(2)对回归方程、参数估计值进行显著性检验;(3)根据样本外自变量的取值,预测应变量的均值。即利用回归方程进行分析、评价及预测。4.4.回归分析的主要内容回归分析的主要内容估计检验预测125.从双变量回归到多元线性回归从双变量回归到多元线性回归1223344()iiiEYXXX1223 344iiiiiYXXXu iE(Y)13 例2.1:背景介绍 SAT是Scholastic Aptitude Test,是美国高中生的所谓“高考”,在高中的最后两年,大部分美国学生都要参加这一考试,但能否读四年制大学并不取决于一个SAT分数。SAT由美国的College Board举

7、办,在美国领土上每年举办7次,其它地方每年6次。考试用英语。SAT包括三种测试:1、Critical Reading:阅读;2、Math:数学;3、Writing:写作。二、总体回归函数二、总体回归函数14例2.1:假定我们感兴趣的是学生的家庭年收入与其数学分数有怎样的关系。家庭年收入X数学分数Y7000080000美元2000030000美元3000040000美元4000050000美元100000美元收收入入变变量量X分分为为10组组15一个家庭年收入5000美元的学生,其数学分数为460,X=5000,Y1=460;另一家庭年收入为5000美元的学生,其数学分数为470,X=5000,

8、Y1=470。这10个家庭收入为5000美元的学生,其数学平均分数为452。16Y1|X=5000=460;Y2|X=5000=470;Y3|X=5000=460;Y4|X=5000=420;Y5|X=5000=440;Y6|X=5000=500;Y7|X=5000=420;Y8|X=5000=410;Y9|X=5000=450;Y10|X=5000=490E(Y|X1=5000)=452同理:E(Y|X2=15000)=475同理:E(Y|X3=25000)=478同理:E(Y|X4=25000)=478同理:E(Y|X5=35000)=488同理:E(Y|X10=150000)=552(家

9、庭收入(家庭收入、数学分数的条件均值)数学分数的条件均值)(家庭收入,数学分数值)(家庭收入,数学分数值)做散点图做散点图17图图2-1 家庭年收入与数学家庭年收入与数学S.A.T分分数学分数值数学分数的条件均值总体回归线:总体回归线:条件均值的连线条件均值的连线18由于图2-1的总体回归线近似线性,因此可表达为一线性函数:iiXXYE10)|(其中,0,1是未知参数,称为回归系数回归系数(regression coefficients)。总体回归函数总体回归函数1是斜率,它表示X每变动一个单位,Y(条件)均值的变化率。例:如果1=0.001,表示家庭收入每增加表示家庭收入每增加1 1千美千美

10、元,预期数学平均分会提高元,预期数学平均分会提高1 1分分。确定性非随机确定性非随机总体回归函数总体回归函数19iiXXYE10)|(这意味着Y依赖于X,也称为Y对X的回归。即给定X的条件下,Y分布的均值;或者说,总体回归线穿过Y的条件期望值。因此,严格地说,回归分析是条件回归分条件回归分析析,关注的是在给定自变量取值条件下在给定自变量取值条件下应变量的变化。20三、总体回归模型三、总体回归模型(总体回归函数的统计或随机设定)总体回归函数的统计或随机设定)如何解释个体学生分数与收入的关系呢?个体数学分数=这一组的平均分+(-)某个值随机误差项随机误差项总体回归函数的总体回归函数的统计或随机设定

11、统计或随机设定总体回归模型总体回归模型如何理解如何理解该式?该式?是一随机变量,其值无法先验确定是一随机变量,其值无法先验确定,通常用概率分布描述随机变量,通常用概率分布描述随机变量21系统或确定性成分非系统或确定性随机成分系统或确定性成分(452)非系统或随机成分(18)(528)(-28)22iiXXYE10)|(表示在给定收入水平表示在给定收入水平X下,该组学生的下,该组学生的数学平均分。数学平均分。表示由于误差项的存在,个人数学分数表示由于误差项的存在,个人数学分数在均值附近是如何变动的。在均值附近是如何变动的。确定或非随机总体回归函数(总体回归函数)随机或统计总体回归函数(总体回归模

12、型)23 总体回归函数说明在给定的收入水平Xi下,该组的数学平均分。但对该组某一个别的学生,其数学分数可能与该组平均分数有偏差。)|(iiiXYEY 称i为观察值Yi围绕它的期望值E(Y|Xi)的离差离差(deviation),是一个不可观测的随机变量,又称为随机干扰项随机干扰项(stochastic disturbance)或随机误随机误差项差项(stochastic error)。记四、随机误差项四、随机误差项241)在解释变量中被忽略的因素的影响在解释变量中被忽略的因素的影响;如个人健康状况、居住区域、学校开设的数学课程等因素。2)变量观测值的观测误差的影响)变量观测值的观测误差的影响;

13、3)即使模型中包含了所有解释变量,但其内在随机性不可避免,这是做任何努力都无法解释的。因为,人类的行为存在内在随机性人类的行为存在内在随机性;4)其它随机因素的影响)其它随机因素的影响。奥卡姆剃刀原则。即模型是现实的简化,描述奥卡姆剃刀原则。即模型是现实的简化,描述应尽可能简单,应尽可能简单,只要不遗漏重要的信息只要不遗漏重要的信息。随机误差项性质或主要包括因素(*)25如何得到总体回归函数呢?iiXXYE10)|(五、样本回归函数(SRF)如果已知表2-1的全体数据,则很容易得到总体回归线(现实中,可能吗?)如果仅仅有来自总体的一个样本,则可根据样本信息估计估计总体回归函数(现实中,可能吗?

14、)26五、样本回归函数(SRF)27实际中很少能获得整个总体的数据,通常,仅仅有来自总体的某一个样本。问题:能问题:能从一次抽从一次抽样中获得样中获得总体的近总体的近似的信息似的信息吗?吗?五、样本回归函数(SRF)28根据表2-2、表2-3的数据做散点图散点图(scatter diagram):样本回归线K个不同的样本可得到K条不同的样本回归线29 记样本回归线的函数形式样本回归线的函数形式为:iiiXXfY10)(称为样本回归函数样本回归函数(sample regression function,SRF)即本课程所要找到的回归方程五、样本回归函数(SRF)30 这里将样本回归线样本回归线看

15、成总体回归线总体回归线的近似替代则 注意:注意:五、样本回归函数(SRF)31同样地,样本回归函数也有如下的随机形式:iiiiieXYY10式中,ie称为(样样本本)残残差差(或剩剩余余)项项(residual),代表了其他影响iY的随机因素的集合,可看成是i的估计量i。由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型样本回归模型(sample regression model)。六、样本回归函数的随机形式/样本回归模型32 根据样本回归函数SRF即,根据 iiiiieXeYY10估计iiiiiXXYEY10)|(七、回归分析的目的(*)PRFPRFSRFSRF估计总体回归函数

16、PRF33注意:注意:这里PRF可能永远无法知道。七、回归分析的目的PRFPRFSRFSRF34 回归分析的主要目的回归分析的主要目的通过样本回归函数(模型)SRF估计总体回归函数(模型)PRF最广泛使用的是普通最小二乘法普通最小二乘法 为保证参数估计量具有良好的性质,通常对模型提出若干基本假设。这些假设与所采用的估计方法紧密相关。第二部分:参数估计估计方法估计方法有多种,如OLS、MLE、GMM等(ordinary least squares,OLS)35第二部分:参数估计最小二乘原理:最小二乘原理:即在给定样本观测值之下,选择出即在给定样本观测值之下,选择出 、能使能使 、之差的平方和最小

17、。之差的平方和最小。10iYiY图示法说明数学推导说明 回归分析的主要目的回归分析的主要目的通过样本回归函数(模型)SRF估计总体回归函数(模型)PRF36图示法图示法说明:说明:1 1、PRFPRF无法获知。因此,选择实际值作为衡量标准无法获知。因此,选择实际值作为衡量标准2 2、残差之和可能正负抵消。因此,选择残差平方和、残差之和可能正负抵消。因此,选择残差平方和3701()iiiiieYYYX22201()()iiiiiMineY YYXOLSOLS方法的数学推导说明方法的数学推导说明如何选择参数,以使得残差平方和最小如何选择参数,以使得残差平方和最小38方程组(*)称为正规方程组正规方

18、程组(normal equations)。OLSOLS方法的数学推导说明方法的数学推导说明39例2.1 综合应用综合应用40例2.1 综合应用综合应用432.41380.0013iiYX根据表根据表2-42-4的计算,得到的计算,得到数学数学S.A.TS.A.T分数回归结果分数回归结果如下:如下:其中,其中,X X表示家庭年收入,表示家庭年收入,Y Y表示数学分数,表示数学分数,表示表示给定给定X X水平下真实总体均值的估计量。水平下真实总体均值的估计量。Y该样本回归线如图所示该样本回归线如图所示通常采用软件实现估计通常采用软件实现估计可通过计算实现估计可通过计算实现估计4142斜率系数斜率系

19、数0.00130.0013表示在其他条件保持不变的情况下,家庭年收入每增加1元,数学分数平均提高0.0013分。(或者,在其他条件保持不变的情况下,家庭年收入每增加1000元,数学分数平均提高1.3分)例2.1 综合应用综合应用对数学对数学S.A.TS.A.T分数回归结果的解释分数回归结果的解释432.41380.0013iiYX截距的解释则没什么经济意义,截距的解释则没什么经济意义,因为家庭年收入为0的数据几乎不会发生。43普通最小二乘估计量的一些重要性质(*)1.用OLS法得出的样本回归线经过样本均值点,即:2.残差的均值 ()总为0。3.对残差与解释变量的积求和,其值为零;即这两个变量不

20、相关。这条性质也可用来检查最小二乘法计算结果。4.对残差与(估计的 )的积求和,其值为0;即 为0(见习题2.25)。12iY b bX enei/0iie X iYiYiiYe44线性回归的基本思想:双变量模型线性回归的基本思想:双变量模型本节课的小结回归分析的含义总体回归函数样本回归函数总体回归模型回归分析的目的样本回归模型随机误差项的性质二、参数估计二、参数估计 一、回归分析概述一、回归分析概述最小二乘原理如何进行参数估计“线性”回归的含义45一些例子 例例1:受教育年限与平均小时工资:受教育年限与平均小时工资研究结论:教育与收入之间存在正相关关系。回归系数的含义:受教育年限每增加1年,

21、平均小时工资增加72美分。样本回归模型中负的截距没有经济含义46例2:奥肯定律 样本回归模型:Y=-0.4(X-2.5)Y-为失业率的变动率;X-为实际产出的增长率;2.5-为美国长期产出增长率 结论:实际GDP增长每超过2.5个百分点,失业率将降低0.4个百分点 预测:如果x=5%,则失业率减少1个百分点 如果x=7.5%,则失业率减少2个百分点47例3 股票价格与利率 非线性回归模型(图2-7是著名的菲利普斯曲线)与双变量线性回归模型比较:问题1:两种模型,哪一个模型更好?问题2:两个模型的斜率符号相反,说明这两个模型所得到的结论是矛盾吗?48思考题 1.总体回归线、总体回归函数的含义及关

22、系 2.总体回归模型与样本回归模型的关系 3.总体回归系数与样本回归系数的关系 4.奥卡姆剃刀原则在计量经济学模型建立中,给我们提供了什么启示?5.回归分析的目的 6.随机误差项性质(或内容)实例 对中国经济增长及其影响因素的定量分析 对中国股票价格波动的实证研究 对中国家用汽车市场发展的研究49对中国家用汽车市场发展的研究应该围绕以下几个方面:应该围绕以下几个方面:(1)家用汽车市场状况如何?)家用汽车市场状况如何?可以用汽车的销售量去观测可以用汽车的销售量去观测(2)分析影响家用汽车销售量的主要因素)分析影响家用汽车销售量的主要因素如:居民收入、价格、使用费用、道路状况、国家政策、消费行如:居民收入、价格、使用费用、道路状况、国家政策、消费行为为(3)各种因素对汽车销售量影响的性质)各种因素对汽车销售量影响的性质即哪些有正面影响、哪些有负面影响即哪些有正面影响、哪些有负面影响(4)各个因素影响汽车销售量的具体数量关系)各个因素影响汽车销售量的具体数量关系用销售量和各个影响因素的实际数据,运用一定的方法分析其具用销售量和各个影响因素的实际数据,运用一定的方法分析其具体的相互关系体的相互关系(5)所得到的分析结论是否可靠?)所得到的分析结论是否可靠?(6)今后汽车市场的发展前景如何?应如何制定汽车产业政策?)今后汽车市场的发展前景如何?应如何制定汽车产业政策?50

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(大学课件:第2章 回归概述(新).ppt)为本站会员(罗嗣辉)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|