1、1-1计计 量量 经经 济济 学学 基基 础础 与与 应应 用用The Economic School of Jilin UniversityYu ZhenTwo-Variable Regression Analysis:Some Basic Ideaschapter two第二章第二章 双变量回归分析双变量回归分析:基本概念基本概念1-3第一节第一节 关于关于“回归回归”p“回归回归”最早由统计学家最早由统计学家Francis Galton提出提出父母身高、子女身高父母身高、子女身高儿女的身高趋向人口总体平均,普遍回归定律儿女的身高趋向人口总体平均,普遍回归定律(law of univers
2、al regression)。Karl Pearson发现:父亲高的的群体,儿辈平均身高发现:父亲高的的群体,儿辈平均身高低于父辈;而父亲身高矮的群体,儿辈平均身高高于低于父辈;而父亲身高矮的群体,儿辈平均身高高于父辈。父辈。p回归是计量经济学的主要工具回归是计量经济学的主要工具回归分析是研究一个因变量对一个或多个自变量的依回归分析是研究一个因变量对一个或多个自变量的依赖关系的过程,其用意在于通过后者的设定去估计或赖关系的过程,其用意在于通过后者的设定去估计或预测前者的均值(总体均值)。预测前者的均值(总体均值)。几个例子几个例子1-4第一节第一节 关于关于“回归回归”p 变量变量表示符号表示
3、符号用用Y代表因变量,代表因变量,X代表自变量或解释变量。如果有代表自变量或解释变量。如果有多个解释变量,将使用适当的下标表示各个不同的多个解释变量,将使用适当的下标表示各个不同的X。(例如,例如,X1,X2,X3等等等等)。1-5第二节第二节 一个假想的例子一个假想的例子p家庭收入与家庭消费支出的关系家庭收入与家庭消费支出的关系 假设一个国家人口总体假设一个国家人口总体由由60户户家庭组成家庭组成 分析每周家庭消费分析每周家庭消费支出支出Y 和可家庭支配收入和可家庭支配收入X 的的关系关系 将将60户家庭划分为收入水平差不多的户家庭划分为收入水平差不多的10组组 表表2-11-6第二节第二节
4、 一个假想的例子一个假想的例子p可家庭支配收入可家庭支配收入X给定情况下家庭消费支出给定情况下家庭消费支出Y 的条件分布的条件分布p由于为总体,所以可以计算条件概率由于为总体,所以可以计算条件概率p再计算再计算Y 的条件期望,条件均值的条件期望,条件均值p表表2-2(|)ip Y X(|)iEY X X1-7第二节第二节 一个假想的例子一个假想的例子pY 条件均值落在一条直线上,该直线为总体回归线条件均值落在一条直线上,该直线为总体回归线(population regression line,PRL),现实中可能为曲线现实中可能为曲线pPRL是是Y 对对X 的回归的回归(regression
5、of Y on X)图图2-1PRL都是直线?都是直线?NO!巧合!巧合!1-8第二节第二节 一个假想的例子一个假想的例子图图2-21-9第三节第三节 总回归函数总回归函数(PRF)p 根据图根据图2-1和图和图2-2,条件均值,条件均值 均为均为Xi 函数,表示为:函数,表示为:(2.3.1)p PRF的形式是一个经验问题,线性方程是常的形式是一个经验问题,线性方程是常用的形式:用的形式:(2.3.2)其中其中 和和 为未知但却固定的参数,称为回归系为未知但却固定的参数,称为回归系数数(regression coefficient)。和和 分别称为截距分别称为截距和斜率系数。方程和斜率系数。
6、方程(2.3.2)本身则称为线性总体回归)本身则称为线性总体回归函数或简称线性总体回归。函数或简称线性总体回归。(|)iEY X X()()iiE Y XfX12()()iiiE Y XfXX12121-10第四节第四节 线性的含义线性的含义p 线性线性(linear),线性回归模型,线性回归模型(LRM)对变量线性对变量线性 对参数线性(对参数线性(本课程主要关注本课程主要关注)12()iiE Y XX212()iiE Y XX对变量非线性12()iiE Y XX12()iiE Y XX对参数非线性1-11第五节第五节 PRF的随机设定的随机设定p随着家庭收入的增加,家庭消费支出平均地说也增
7、加。但随着家庭收入的增加,家庭消费支出平均地说也增加。但对单个家庭而言,消费支出对单个家庭而言,消费支出 与收入与收入 之间的关系呢?之间的关系呢?p答案:消费不一定随收入的增加而增加。而是围绕在其条答案:消费不一定随收入的增加而增加。而是围绕在其条件均值周围,表示为:件均值周围,表示为:或者或者 (2.5.1)p其中离差其中离差 ui 是一个不可观测的可正可负的随机变量,在专是一个不可观测的可正可负的随机变量,在专业术语中,把它称为随机扰动项业术语中,把它称为随机扰动项(stochastic disturbance term)或随机误差项或随机误差项(stochastic error ter
8、m)。()()iiiiiiuYE Y XYE Y XuiYiX1-12第五节第五节 PRF的随机设定的随机设定p 怎样解释方程式怎样解释方程式(2.5.1)呢呢?支出可表示为两个成分之和:一部分系统性或确定性成支出可表示为两个成分之和:一部分系统性或确定性成分分 ;另一部分为随机或非系统性成分;另一部分为随机或非系统性成分 。p 假定假定 与与 为线性关系,即如式为线性关系,即如式(2.3.2)那么,式那么,式(2.5.1)可变换为:可变换为:(2.5.2)(2.5.2)为为PFR的随机设定形式,与(的随机设定形式,与(2.3.2)等价。)等价。()iE Y Xiu()iE Y XiX12ii
9、iYXu12()iiE Y XX()iiiYE Y Xu1-13第六节第六节 随机扰动项的意义随机扰动项的意义p为什么要引入随机扰动项?为什么要引入随机扰动项?理论的含糊性理论的含糊性 数据的缺失数据的缺失 变量的解释力(核心变量与周边变量)变量的解释力(核心变量与周边变量)人类行为的内在随机性人类行为的内在随机性 糟糕的替代变量(永久消费与当前消费等)糟糕的替代变量(永久消费与当前消费等)节省原则节省原则 错误的函数形式错误的函数形式1-14第七节第七节 样本回归函数(样本回归函数(SRF)p总体是观测不到的,大多数情况下,对应于一个总体是观测不到的,大多数情况下,对应于一个解释变量解释变量
10、X,只能观测到被解释变量只能观测到被解释变量Y的一个值。的一个值。我们只能得到对应于某些固定我们只能得到对应于某些固定X 值的值的Y 值的一个(有限值的一个(有限个)样本。个)样本。1-15第七节第七节 样本回归函数(样本回归函数(SRF)p样本回归函数样本回归函数(sample regression function,SRF)1-16第七节第七节 样本回归函数(样本回归函数(SRF)p对应对应(2.3.2)的的SRFp其中其中 读为读为Y-帽,是帽,是 的估计量。的估计量。注意,一个估计量注意,一个估计量(estimator),又称,又称(样本样本)统计量统计量(statistic),是指一
11、个规则或公式或方法。在一项应用中,是指一个规则或公式或方法。在一项应用中,由估计量算出的一个具体的数值,称为估计值由估计量算出的一个具体的数值,称为估计值(estimate)。p对应对应(2.5.2)的的SRF 表示样本残差项表示样本残差项(residual term)12iiYXY()iE Y X12iiiYXuiu1-17第七节第七节 样本回归函数(样本回归函数(SRF)p回归分析的主要目的,根据回归分析的主要目的,根据SRF去估计去估计PRF12iiiYXu12iiiYXu1-181-19p从图中从图中可以看出可以看出()iiiiiiSRFYYuPRFYE Y Xu1-20疑问疑问?p现在,重要的问题是:既然认识到现在,重要的问题是:既然认识到SRF只不过是只不过是PRF的一个近似,能不能设计一种规则或方法,使的一个近似,能不能设计一种规则或方法,使得这种近似是一种尽可能得这种近似是一种尽可能“接近接近”的近似的近似?p换一种说法,怎样构造换一种说法,怎样构造SRF能使能使 的估计值尽可的估计值尽可能能“接近接近”真实的真实的?从而估计得到从而估计得到PRF。p尽管真实的尽管真实的 永远不得而知永远不得而知!iii
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。