ImageVerifierCode 换一换
格式:PPT , 页数:181 ,大小:1.35MB ,
文档编号:2901207      下载积分:29 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-2901207.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(三亚风情)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(计量经济学-第2章一元线性回归模型1课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

计量经济学-第2章一元线性回归模型1课件.ppt

1、1第二章第二章 经典单方程计量经济学模型:经典单方程计量经济学模型:一元线性回归模型一元线性回归模型 2.12.1回归分析概述回归分析概述 2.22.2一元线性回归模型的参数估计一元线性回归模型的参数估计 2.32.3一元线性回归模型检验一元线性回归模型检验 2.42.4一元线性回归模型预测一元线性回归模型预测 2.52.5实例实例22.1 2.1 回归分析概述回归分析概述一、一、变量间的关系及回归分析的基本变量间的关系及回归分析的基本概念概念二、二、总体回归函数(总体回归函数(PRFPRF)三、三、随机扰动随机扰动项项(随机干扰(随机干扰项)项)四、四、样本回归函数(样本回归函数(SRFSR

2、F)3一、变量间的关系及回归分析的基本概念一、变量间的关系及回归分析的基本概念1. 变量间的关系变量间的关系(1)或或:研究的是:研究的是确定现象非随机变量间的关系。确定现象非随机变量间的关系。(2 2)或或:研究的是非确:研究的是非确定现象随机变量间的关系。定现象随机变量间的关系。4函数关系函数关系1. 是一一是一一对应的确定关系对应的确定关系2. 设设有两个变量有两个变量 x 和和 y ,变量变量 y 随变量随变量 x 一起变一起变化,并完全依赖于化,并完全依赖于 x ,当变量当变量 x 取某个数值时,取某个数值时, y 依确定的关系取相应的依确定的关系取相应的值,则称值,则称 y 是是

3、x 的函数,的函数,记为记为 y = f (x),其中,其中 x 称称为自变量,为自变量,y 称为因变量称为因变量3. 各各观测点落在一条线上观测点落在一条线上 5函数关系函数关系(几个例子几个例子)函数关系的例子函数关系的例子某种商品的销售额某种商品的销售额( (y y) )与销售量与销售量( (x x) )之间的关系之间的关系可表示为可表示为 y y = = pxpx ( (p p 为单价为单价) )圆的面积圆的面积(S)(S)与半径之间的关系可表示为与半径之间的关系可表示为S S= = R R2 2 企业的原材料消耗额企业的原材料消耗额( (y y) )与产量与产量( (x x1 1)

4、) 、单位产、单位产量消耗量消耗( (x x2 2) ) 、原材料价格、原材料价格( (x x3 3) )之间的关系可之间的关系可表示为表示为y y = = x x1 1 x x2 2 x x3 3 6相关关系相关关系(correlation)1. 变量间关系不能用函变量间关系不能用函数关系精确表达数关系精确表达2. 一个变量的取值不能一个变量的取值不能由另一个变量唯一确由另一个变量唯一确定定3. 当变量当变量 x 取某个值时,取某个值时,变量变量 y 的取值可能有的取值可能有几个几个4. 各观测各观测点分布在直线点分布在直线周围周围 7 对变量间对变量间统计依赖关系统计依赖关系的考察主要是通

5、的考察主要是通过过(correlation analysis)或或(regression analysis)来完成的来完成的8相关关系相关关系(几个例子几个例子)父亲身高父亲身高( (y y) )与子女身高与子女身高( (x x) )之间的关系之间的关系收入水平收入水平( (y y) )与受教育程度与受教育程度( (x x) )之间的关系之间的关系粮食亩产量粮食亩产量( (y y) )与施肥量与施肥量( (x x1 1) ) 、降雨量、降雨量( (x x2 2) ) 、温度、温度( (x x3 3) )之间的关系之间的关系商品的消费量商品的消费量( (y y) )与居民收入与居民收入( (x

6、x) )之间的关系之间的关系商品销售额商品销售额( (y y) )与广告费支出与广告费支出( (x x) )之间的关系之间的关系9相关关系相关关系(类型类型)正正 相相 关关 负负 相相 关关线线 性性 相相 关关 非非 线线 性性 相相 关关正正 相相 关关 负负 相相 关关完完 全全 相相 关关 不不 相相 关关相相 关关 关关 系系10相关关系的描述与测度相关关系的描述与测度(散点图散点图)11散点图散点图(scatter diagram)12散点图散点图(例题分析例题分析)【例】一家大型商业银行在多个地区设一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建有分行,其业务主要

7、是进行基础设施建设、国家重点项目建设、固定资产投资设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较例的提高,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。分析,以便找出控制不良贷款的办法。下面是该银行所属的下面是该银行所属的2525家分行家分行20022002年的年的有关业务数据有关业务数据

8、 13散点图散点图(例题分析例题分析)14散点图散点图(例题分析例题分析) 不良贷款与贷款余额的散点图不良贷款与贷款余额的散点图024681012140100200300400贷款余额不良贷款 不良贷款与累计应收贷款不良贷款与累计应收贷款的散点图的散点图02468101214051015202530累计应收贷款不良贷款 不良贷款与贷款项目个数 不良贷款与贷款项目个数的散点图的散点图0 02 24 46 68 81010121214140 020204040贷款项目个数贷款项目个数不良贷款不良贷款 不良贷款与固定资产投资额不良贷款与固定资产投资额的散点图的散点图02468101214050100

9、150200固定资产投资额不良贷款15相关系数相关系数(correlation coefficient)1. 对变量之间关系密切程度的度量对变量之间关系密切程度的度量2. 对两个变量对两个变量(xi, yi) , i = 1, 2, , n 之间之间线线性相关程度及方向性相关程度及方向的度量称为简单相关系的度量称为简单相关系数数3. 若相关系数若相关系数是根据总体全部数据计算的,是根据总体全部数据计算的,称为总体相关系数,记为称为总体相关系数,记为 4. 若若是根据样本数据计算的,则称为样本相是根据样本数据计算的,则称为样本相关系数,记为关系数,记为 r16相关系数相关系数 (计算公式计算公式

10、) 样本相关系数的计算公式样本相关系数的计算公式17(xi, yi) , i = 1, 2, , n其平均数与标准差分别为其平均数与标准差分别为sX,sY则样本相关系数则样本相关系数r定义为:定义为:相关系数相关系数 (计算公式计算公式)niYiXisyysxxnr1)(1118相关系数相关系数(取值及其意义取值及其意义)1. r 的取值范围的取值范围是是 -1,12. r =1,为完全正相关,为完全正相关r =-1,为完全负相关,为完全负相关 r = 0,不存在不存在线性线性相关关系相关关系3. |r|越趋于越趋于1表示表示关系越密切;关系越密切;|r|越趋于越趋于0表表示关系越不密切示关系

11、越不密切19相关系数的特性相关系数的特性 相关系数中,两变量并不区分解释相关系数中,两变量并不区分解释变量或被解释变量。变量或被解释变量。 相关系数的计算以数值型变量为主,相关系数的计算以数值型变量为主,此公式不适用于类别变量。此公式不适用于类别变量。 相关系数的计算使用标准化值,与相关系数的计算使用标准化值,与各数值型变量的度量单位无关。各数值型变量的度量单位无关。20相关系数相关系数(例题分析例题分析)21线性关系的不同强度之线性关系的不同强度之r427356555886075215134744285255212825105665506318784955114538235365383032

12、745075047972550849566607521513474428525521282510566550631878495511453823536538303274507504797255084956654348947350607521513474428525521282510566550631878495511453823536538303274507504797255084956654348947350607521513474428525521282510566550631878495511453823536538303274507504797255084956642735655588

13、607521513474428525521282510566550631878495511453823536538303274507504797255084956654348947350427356555886075215134744285255212825105665506318784955114538235365383032745075047972550849566r = 0r = 0.6r = 0.97r = 0.3r = 0.5r = 0.822练习练习1下表中的数据列出了某市下表中的数据列出了某市2005年年18月的月的月平均气温月平均气温X和每户平均啤酒消费量和每户平均啤酒消费量Y

14、。(1)画出散点图)画出散点图(2)计算相关系数)计算相关系数R月月份份12345678X5.56.68.115.8 19.5 22.4 28.3 28.9Y2.38 3.85 4.41 5.67 5.44 6.03 8.15 6.8723练习练习 将某年将某年21家企业的广告预算与这些企业家企业的广告预算与这些企业产品的观看者每周保留的印象次数相联产品的观看者每周保留的印象次数相联系。系。 以印象数为纵轴、以广告支出为横轴画以印象数为纵轴、以广告支出为横轴画散点图。散点图。 你认为这两个变量之间的关系具有什么你认为这两个变量之间的关系具有什么样的性质?样的性质? 看一下你的图,你认为值得作广

15、告吗?看一下你的图,你认为值得作广告吗?序序号号企业企业印象印象(百万(百万次)次)支出(百支出(百万美元)万美元)序号序号企业企业印象印象(百万(百万次)次)支出(百支出(百万美元)万美元)1美乐美乐32.150.112百威百威10.445.62百事百事99.674.113贝尔贝尔88.9154.93联邦快递联邦快递21.922.914CK12.05.04金鹰金鹰11.719.315温迪快温迪快餐餐29.249.75汉堡王汉堡王60.882.416宝丽莱宝丽莱38.026.96可口可乐可口可乐78.640.117Shasta 10.05.77麦当劳麦当劳92.4185.918Meow Mix

16、12.37.68前世通公前世通公司司50.726.919卡夫食卡夫食品品23.49.29健贻可乐健贻可乐21.420.420佳洁士佳洁士71.132.410福特福特40.1166.221KibblesN Bits4.46.111利维利维40.827.025050100150200020406080100YXX vs. Y26验证:配第验证:配第克拉克法则克拉克法则 随着人均随着人均GDP的增加,或者说随着的增加,或者说随着一个国家经济的发展,就业结构也一个国家经济的发展,就业结构也会发生相应的变化,第一产业中就会发生相应的变化,第一产业中就业人数的比例会下降,而第二和第业人数的比例会下降,而第

17、二和第三产业的就业比例会上升。三产业的就业比例会上升。以我国改革开放后某一年为例,计算人以我国改革开放后某一年为例,计算人均均GDP与第一产业中就业者比例的相关与第一产业中就业者比例的相关系数,并解释其意义。(提示:利用不系数,并解释其意义。(提示:利用不同的城市的数据)同的城市的数据)27回归分析回归分析28“回归回归”一次的历史渊源一次的历史渊源回归这个术语是由英国著名统计学家回归这个术语是由英国著名统计学家Francis Galton在在19世纪末期研究孩子及世纪末期研究孩子及他们的父母的身高时提出来的。他们的父母的身高时提出来的。孩子的身高会趋向平均发展。孩子的身高会趋向平均发展。当双

18、亲的身高都很高(矮)时,他们的当双亲的身高都很高(矮)时,他们的孩子身高虽然会高(矮)于一般人,却孩子身高虽然会高(矮)于一般人,却往往比父母亲矮(高)。往往比父母亲矮(高)。高尔顿的普遍回归定律。(高尔顿的普遍回归定律。(law of universal regression)29回归的现代释义回归的现代释义 回归分析是关于研究一个叫做回归分析是关于研究一个叫做因变量因变量的的变量对另一个或多个叫做变量对另一个或多个叫做解释变量解释变量的变的变量的依赖关系,其用意在于通过后者量的依赖关系,其用意在于通过后者(在重复抽样中)的已知或设定值,取(在重复抽样中)的已知或设定值,取估计或预测前者的(

19、总体)均值。估计或预测前者的(总体)均值。30举例举例 高尔顿的普遍回归定律。高尔顿的兴趣在于发现高尔顿的普遍回归定律。高尔顿的兴趣在于发现为什么人口的身高分布有一种稳定性。但现代观为什么人口的身高分布有一种稳定性。但现代观点关心的则是给定父辈身高的情形下找出儿辈平点关心的则是给定父辈身高的情形下找出儿辈平均身高的变化。即关心一旦知道了父辈的身高,均身高的变化。即关心一旦知道了父辈的身高,怎样预测儿辈的平均身高。怎样预测儿辈的平均身高。60607070656575756060656570707575父辈身高,英寸父辈身高,英寸儿辈身高,英儿辈身高,英寸寸对应于给定父亲身高的儿子身高的假想分布对

20、应于给定父亲身高的儿子身高的假想分布31什么是回归分析?什么是回归分析?(Regression)1. 从一组样本数据出发,确定变量之间的从一组样本数据出发,确定变量之间的数学关系式数学关系式2. 对这些关系式的可信程度进行各种统计对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响量中找出哪些变量的影响显著显著,哪些,哪些不不显著显著(即确定因果关系及影响大小即确定因果关系及影响大小)3. 利用所求的关系式,根据一个或几个变利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量量的取值来预测或控制另一个特定变

21、量的取值,并给出这种预测或控制的精确的取值,并给出这种预测或控制的精确程度程度32回归与因果关系回归与因果关系 肯德尔(肯德尔(Kendall)和斯图尔特)和斯图尔特(Stuart)说)说“一个统计关系式,不一个统计关系式,不管多强也不管多么有启发性,却永管多强也不管多么有启发性,却永远不能确立因果方面的联系;对因远不能确立因果方面的联系;对因果关系的理念,必须来自于统计学果关系的理念,必须来自于统计学以外,最终来自这种或那种理论。以外,最终来自这种或那种理论。” 虽然回归分析研究一个变量对另一虽然回归分析研究一个变量对另一(些)变量的依赖关系,但它并不(些)变量的依赖关系,但它并不一定意味着

22、因果关系。一定意味着因果关系。33相关关系和回归分析相关关系和回归分析 注意注意相关分析相关分析测度两个变量之间的线性关联力测度两个变量之间的线性关联力度。相关系数就是测度关联强度的。度。相关系数就是测度关联强度的。相关分析相关分析对称地对待任何(两个)变量,对称地对待任何(两个)变量,两个变量都被看作是随机的。两个变量都被看作是随机的。回归分析回归分析对变对变量的处理方法存在不对称性,即区分应变量量的处理方法存在不对称性,即区分应变量(被解释变量)和自变量(解释变量):前(被解释变量)和自变量(解释变量):前者是随机变量,后者是固定的。者是随机变量,后者是固定的。相关关系相关关系关心两个变量

23、间关系的紧密程度;关心两个变量间关系的紧密程度;回归分析回归分析感兴趣的则是试图根据其他变量的感兴趣的则是试图根据其他变量的设定值来估计或预测某一变量的平均值。设定值来估计或预测某一变量的平均值。34 回归分析构成计量经济学的方法论基础,回归分析构成计量经济学的方法论基础,其主要内容包括:其主要内容包括: (1)根据样本观察值对经济计量模)根据样本观察值对经济计量模型参数进行估计,求得回归方程;型参数进行估计,求得回归方程; (2)对回归方程、参数估计值进行)对回归方程、参数估计值进行显著性检验;显著性检验; (3)利用回归方程进行分析、评价)利用回归方程进行分析、评价及预测。及预测。35回归

24、模型的类型回归模型的类型线线 性性 回回 归归非非 线线 性性 回回 归归一一 元元 回回 归归线线 性性 回回 归归非非 线线 性性 回回 归归多多 元元 回回 归归回回 归归 模模 型型36二、总体回归函数二、总体回归函数 回归分析回归分析关心的是根据解释变量的已关心的是根据解释变量的已知或给定值,估计或预测被解释变量知或给定值,估计或预测被解释变量的总体均值。的总体均值。 回归分析的原理回归分析的原理 目的在于找出一个最能够代表所有观测目的在于找出一个最能够代表所有观测资料的函数(回归估计式)资料的函数(回归估计式) 用此函数代表因变量和自变量之间的关用此函数代表因变量和自变量之间的关系

25、。系。37 例:例:一个假想的社区有一个假想的社区有100户家庭组成,户家庭组成,要研究该社区每月要研究该社区每月家庭消费支出家庭消费支出Y与每月与每月家庭可支配收入家庭可支配收入X的关系。的关系。 即如果知道即如果知道了家庭的月收入,能否预测该社区家庭了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。的平均月消费支出水平。 为达到此目的,将该为达到此目的,将该100户家庭划分为组户家庭划分为组内收入差不多的内收入差不多的10组,以分析每一收入组,以分析每一收入组的家庭消费支出组的家庭消费支出。表表 2.1.1 某某社社区区家家庭庭每每月月收收入入与与消消费费支支出出统统计计表表 每月家

26、庭可支配收入X(元) 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 561 638 869 1023 1254 1408 1650 1969 2090 2299 594 748 913 1100 1309 1452 1738 1991 2134 2321 627 814 924 1144 1364 1551 1749 2046 2178 2530 638 847 979 1155 1397 1595 1804 2068 2266 2629 935 1012 1210 1408 1650 1848 2101 2354 2860 968 1045

27、 1243 1474 1672 1881 2189 2486 2871 1078 1254 1496 1683 1925 2233 2552 1122 1298 1496 1716 1969 2244 2585 1155 1331 1562 1749 2013 2299 2640 1188 1364 1573 1771 2035 2310 1210 1408 1606 1804 2101 1430 1650 1870 2112 1485 1716 1947 2200 每 月 家 庭 消 费 支 出 Y (元) 2002 共计 2420 4950 11495 16445 19305 23870

28、25025 21450 21285 15510 Y的条件的条件均值均值E(Y/X)6058251045126514851705192521452365258505001000150020002500300035005001000150020002500300035004000每月可支配收入每月可支配收入X(元)(元)每月消费支出Y(元)描出散点图发现:随着收入的增加,消费描出散点图发现:随着收入的增加,消费“平平均地说均地说”也在增加,且也在增加,且Y Y的条件均值均落在一的条件均值均落在一根正斜率的直线上。这条直线称为根正斜率的直线上。这条直线称为总体回归线总体回归线。40 在给定解释变量在

29、给定解释变量Xi条件下被解释变量条件下被解释变量Yi的期望轨迹称为的期望轨迹称为总体总体回归线回归线。(。(population regression line),或更一般地称为),或更一般地称为总总体回归曲线体回归曲线(population regression curve),就是),就是Y对对X的的回归。回归。总体回归线总体回归线800800140014001100110060560582582510451045E E(Y YXiXi)41 含义:含义:回归函数(回归函数(PRF)说明被解释变)说明被解释变量量Y的平均状态(总体条件期望)随解释的平均状态(总体条件期望)随解释变量变量X变化

30、的规律。变化的规律。)()|(iiXfXYE称为(双变量)称为(双变量)总体回归函数总体回归函数(population population regression function, regression function, PRFPRF)或条件期望函)或条件期望函数(数(conditional expectation function, conditional expectation function, CEF CEF )。)。 相应的函数:相应的函数:总体回归函数的概念总体回归函数的概念42 函数形式:函数形式:可以是线性或非线性的可以是线性或非线性的。 例例2.12.1中,根据刚才的例子

31、,一位经济学中,根据刚才的例子,一位经济学家可能提出消除支出与收入有线性关系,家可能提出消除支出与收入有线性关系,作为一个暂行的假设,作为一个暂行的假设,: : iiXXYE10)|(为一为一线性函数。线性函数。其中,其中, 0 0, 1 1是未知参数,是未知参数,称为称为回归系数回归系数(regression regression coefficientscoefficients)。)。43回归线的系数的图形表示回归线的系数的图形表示X X1 1X X2 2X XY Y斜率斜率144线性的含义线性的含义对变量而言对变量而言对参数而言对参数而言 iiiXXY22110222110iiiXXY“

32、线性线性”一词的含义一词的含义X21eiY指数指数二次方、立方等二次方、立方等本书中的本书中的“线性线性”是对参数而言是对参数而言45三、随机扰动项三、随机扰动项 一个例子一个例子 凯恩斯绝对收入假设消费理论凯恩斯绝对收入假设消费理论:消费(:消费(Y)是)是由收入(由收入(X)唯一决定的,是收入的线性函数:)唯一决定的,是收入的线性函数: Y = + X (2.2.1) 但实际上但实际上上述等式不能准确实现上述等式不能准确实现。 原因原因 消费除受收入影响外,还受其他因素的影响;消费除受收入影响外,还受其他因素的影响; 线性关系只是一个近似描述;线性关系只是一个近似描述; 收入变量观测值的近

33、似性:收入数据本身并不收入变量观测值的近似性:收入数据本身并不绝对准确地反映收入水平。绝对准确地反映收入水平。46 因此,一个更符合实际的数学描述为:因此,一个更符合实际的数学描述为: Y = + X+ (2.2.2)其中:其中: 是一个随机误差项,是其他影响是一个随机误差项,是其他影响因素的因素的“综合体综合体”,是不可控的。,是不可控的。这个式子由于引进了随机误差项,成为计这个式子由于引进了随机误差项,成为计量经济学模型,所以被称为量经济学模型,所以被称为总体回归模总体回归模型型。表表 2.1.1 某某社社区区家家庭庭每每月月收收入入与与消消费费支支出出统统计计表表 每月家庭可支配收入X(

34、元) 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 561 638 869 1023 1254 1408 1650 1969 2090 2299 594 748 913 1100 1309 1452 1738 1991 2134 2321 627 814 924 1144 1364 1551 1749 2046 2178 2530 638 847 979 1155 1397 1595 1804 2068 2266 2629 935 1012 1210 1408 1650 1848 2101 2354 2860 968 1045 1243 14

35、74 1672 1881 2189 2486 2871 1078 1254 1496 1683 1925 2233 2552 1122 1298 1496 1716 1969 2244 2585 1155 1331 1562 1749 2013 2299 2640 1188 1364 1573 1771 2035 2310 1210 1408 1606 1804 2101 1430 1650 1870 2112 1485 1716 1947 2200 每 月 家 庭 消 费 支 出 Y (元) 2002 共计 2420 4950 11495 16445 19305 23870 25025 21

36、450 21285 15510 48随机扰动项随机扰动项 该偏差称为观察值围绕它的期望值的该偏差称为观察值围绕它的期望值的离离差差(deviation),是一个不可观测的随机变量,),是一个不可观测的随机变量,又称为又称为随机干扰项随机干扰项(stochastic disturbance)或)或随机误差项随机误差项(stochastic error)。)。)|(iiiXYEY iii)XY(EY或或49 例例2.1中,给定收入水平中,给定收入水平Xi ,个别家庭的支出个别家庭的支出可表示为两部分之和:可表示为两部分之和: (1)该收入水平下所有家庭的平均消费支出)该收入水平下所有家庭的平均消费

37、支出E(Y|Xi),称为,称为系统性(系统性(systematic)或或确定性确定性(deterministic)部分;部分; (2)其他)其他随机随机或或非确定性非确定性(nonsystematic)部分部分 i。0)X(Eii50随机误差项的意义随机误差项的意义 随机误差项是从模型中省略下来的而又集体地影响着随机误差项是从模型中省略下来的而又集体地影响着Y Y的全部变量的替代物,那么的全部变量的替代物,那么为什么不把这些变量明显为什么不把这些变量明显地引进到模型中来?即为什么不构造一个含有尽可能地引进到模型中来?即为什么不构造一个含有尽可能多个变量的多元回归模型?多个变量的多元回归模型?

38、随机误差项主要包括下列因素:随机误差项主要包括下列因素:在解释变量中被忽略的因素的影响;在解释变量中被忽略的因素的影响;变量观测值的观测误差的影响;变量观测值的观测误差的影响;模型关系的设定误差的影响;模型关系的设定误差的影响;其他随机因素的影响。其他随机因素的影响。51例例 令令Y表示一名妇女生育孩子的生育表示一名妇女生育孩子的生育率,率,X表示该妇女接受过教育的年数。表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型生育率对教育年数的简单回归模型为:为: 随机干扰项可能包含什么样的因随机干扰项可能包含什么样的因素?素?XY1052四、样本回归函数(四、样本回归函数(SRF) 例例2

39、.2:在例在例2.1的总体中有如下一个样本,的总体中有如下一个样本,能否从该样本估计总体回归函数能否从该样本估计总体回归函数PRF?表表2.1.3 家家 庭庭 消消 费费 支支 出出 与与 可可 支支 配配 收收 入入 的的 一一 个个 随随 机机 样样 本本 Y 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 X 594 638 1122 1155 1408 1595 1969 2078 2585 2530 53 该样本的该样本的散点图散点图(scatter diagram): 画一条直线以尽好地拟合该散点图,由于样本取自画一条直线以尽好地拟

40、合该散点图,由于样本取自总体,可以该直线近似地代表总体回归线。该直线总体,可以该直线近似地代表总体回归线。该直线称为称为样本回归线样本回归线(sample regression lines)。)。5455 记样本回归线的函数形式为:记样本回归线的函数形式为:iiiXXfY10)(称为称为样本回归函数样本回归函数(sample regression sample regression functionfunction,SRFSRF)。)。56 样本回归函数的随机形式样本回归函数的随机形式/ /样本回归模型:样本回归模型:同样地,样本回归函数也有如下的随机形式: iiiiieXYY10式中,ie称

41、为(样本)残差(样本)残差(或剩余剩余)项项(residual) ,代表了其他影响iY的随机因素的集合,可看成是i的估计量i。 由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型(sample regression model)。 57回归分析的主要目的回归分析的主要目的iiieYY即,根据即,根据 iiiiieXeYY10估计估计iiiiiXXYEY10)|(根据样本回归函数根据样本回归函数SRF,估计总体回归函数,估计总体回归函数PRF。iii)X|Y(EY58这这就就要要求求:设计一“方法”构造SRF,以使SRF尽可能“接近”PRF,或者说使) 1 , 0(ii尽可能接近)

42、 1 , 0( ii。注注:这里真实的PRF可能永远无从知道 Y iY iiXY10 ie iY iiXXYE10)|( )|(iXYE Xi X 样本与总体回归线样本与总体回归线i592.2 2.2 一元线性回归模型的参数估计一元线性回归模型的参数估计 一、一元线性回归模型的基本假设 二、参数的普通最小二乘估计(OLS) 三、参数估计的最大或然法(ML) 四、最小二乘估计量的性质 五、参数估计量的概率分布及随机干 扰项方差的估计 60为什么先讨论两变量回归分析为什么先讨论两变量回归分析 一元线性回归模型一元线性回归模型:只有一个解释变量:只有一个解释变量Y Y为被解释变量,为被解释变量,X

43、X为解释变量,为解释变量, 0 0与与 1 1为为待估参待估参数数, 0 0常称为截距项或常数项,常称为截距项或常数项, 1 1称为回归系称为回归系数,数, 为随机干扰项为随机干扰项 这种带随机误差项的两变量线性随机函数这种带随机误差项的两变量线性随机函数关系,正是两变量线性回归模型的核心,关系,正是两变量线性回归模型的核心,是两变量线性回归分析的基本出发点。是两变量线性回归分析的基本出发点。iiiXY10i=1,2,n表表 2.1.1 某某社社区区家家庭庭每每月月收收入入与与消消费费支支出出统统计计表表 每月家庭可支配收入X(元) 800 1100 1400 1700 2000 2300 2

44、600 2900 3200 3500 561 638 869 1023 1254 1408 1650 1969 2090 2299 594 748 913 1100 1309 1452 1738 1991 2134 2321 627 814 924 1144 1364 1551 1749 2046 2178 2530 638 847 979 1155 1397 1595 1804 2068 2266 2629 935 1012 1210 1408 1650 1848 2101 2354 2860 968 1045 1243 1474 1672 1881 2189 2486 2871 1078

45、1254 1496 1683 1925 2233 2552 1122 1298 1496 1716 1969 2244 2585 1155 1331 1562 1749 2013 2299 2640 1188 1364 1573 1771 2035 2310 1210 1408 1606 1804 2101 1430 1650 1870 2112 1485 1716 1947 2200 每 月 家 庭 消 费 支 出 Y (元) 2002 共计 2420 4950 11495 16445 19305 23870 25025 21450 21285 15510 Y的条件的条件均值均值E(Y/X)

46、6058251045126514851705192521452365258505001000150020002500300035005001000150020002500300035004000每月可支配收入每月可支配收入X(元)(元)每月消费支出Y(元) 根据图中两个变量数据坐标的分布情况可以看出,在根据图中两个变量数据坐标的分布情况可以看出,在所考察的期间,月均消费支出和可支配收入之间,存在比较所考察的期间,月均消费支出和可支配收入之间,存在比较明显的线性关系。明显的线性关系。 可是仅通过散点图我们并不知道它们之间的数量关系。可是仅通过散点图我们并不知道它们之间的数量关系。因此,要进行参数

47、估计。因此,要进行参数估计。63 估计方法估计方法有多种,其中最广泛使用的是有多种,其中最广泛使用的是普通最小二乘法普通最小二乘法(ordinary least squares, OLS)。)。 为保证参数估计量具有良好的性质,通为保证参数估计量具有良好的性质,通常对模型提出若干基本假设。实际这些常对模型提出若干基本假设。实际这些假设与所采用的估计方法紧密相关,如假设与所采用的估计方法紧密相关,如果实际模型不满足这些基本假设,普通果实际模型不满足这些基本假设,普通最小二乘法就不再适用,而要发展其它最小二乘法就不再适用,而要发展其它方法来估计模型。方法来估计模型。64 一、线性回归模型的基本假设

48、一、线性回归模型的基本假设 假设假设1. 解释变量解释变量X是确定性变量,不是随机变量,是确定性变量,不是随机变量,且在重复抽样中且在重复抽样中X值是固定的;值是固定的; 假设假设2. 随机误差项随机误差项 具有零均值、同方差和不序列具有零均值、同方差和不序列相关性:相关性: E( i)=0 i=1,2, ,n Var ( i)= 2 i=1,2, ,n Cov( i, j)=0 ij i,j= 1,2, ,n满足这三条假设的随机误差项,称为满足这三条假设的随机误差项,称为“球形扰动项球形扰动项” iiiXY10i=1,2,n65假设假设3. 随机误差项随机误差项 与解释变量与解释变量X之间不

49、相之间不相关:关: Cov(Xi, i)=0 i=1,2, ,n 假设假设4. 服从零均值、同方差、零协方差服从零均值、同方差、零协方差的正态分布的正态分布 iN(0, 2 ) i=1,2, ,n660)X(Eiii10iXY:PRFX X1 1X X3 3X X2 2均值均值Y YX Xii67 如果两个变量关系中确实是如果两个变量关系中确实是线性函数主线性函数主导导的,误差项只是次要的随机扰动因素,的,误差项只是次要的随机扰动因素,那么如果对同样的那么如果对同样的X多次重复观测对应的多次重复观测对应的Y值,则值,则Y值的概率均值应该能消除随机值的概率均值应该能消除随机扰动的影响扰动的影响,

50、符合线性函数的基本趋势。,符合线性函数的基本趋势。 等价表示形式:等价表示形式: EYi | Xi =0 + 1Xi 。 即被解释变量的数学期望始终落在总体即被解释变量的数学期望始终落在总体回归直线上。回归直线上。零均值的意义零均值的意义68Var ( i)= 2 i=1,2, ,n 误差项的方差反映的是误差项作为随机误差项的方差反映的是误差项作为随机函数的分布分散程度。这个假设的意义函数的分布分散程度。这个假设的意义是是对应不同观测数据误差项分布的发散对应不同观测数据误差项分布的发散趋势相同趋势相同。如果。如果 i 的方差会随的方差会随 i 变化,就变化,就意味着这部分因素对被解释变量的影响

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|