虚拟变量回归模型课件.ppt

上传人(卖家):三亚风情 文档编号:3293833 上传时间:2022-08-17 格式:PPT 页数:32 大小:819.50KB
下载 相关 举报
虚拟变量回归模型课件.ppt_第1页
第1页 / 共32页
虚拟变量回归模型课件.ppt_第2页
第2页 / 共32页
虚拟变量回归模型课件.ppt_第3页
第3页 / 共32页
虚拟变量回归模型课件.ppt_第4页
第4页 / 共32页
虚拟变量回归模型课件.ppt_第5页
第5页 / 共32页
点击查看更多>>
资源描述

1、7.17.1 虚拟变量的基本含义虚拟变量的基本含义7.27.2 虚拟变量的引入虚拟变量的引入7.3 7.3 案例分析案例分析第第7 7章章 虚拟变量回归模型虚拟变量回归模型第1页,共32页。第第7 7章章 单方程回归模型的几个专门问题单方程回归模型的几个专门问题 7.1 虚拟变量7.1.1 虚拟变量的概念及作用1虚拟变量的内涵在计量经济学中,我们把反映定性(或属性)因素变化,取值为0和1的人工变量称为虚拟变量(Dummy Variable),或称为哑变量、虚设变量、属性变量、双值变量、类型变量、定性变量、二元型变量、名义变量等,习惯上用字母D表示。例如第2页,共32页。虚拟变量虚拟变量为什么要

2、引入为什么要引入“虚拟变量虚拟变量”?如商品需求量、价格、收入、产量等如商品需求量、价格、收入、产量等许多经济变量是可以定量度量的或者说是可以直接观测的许多经济变量是可以定量度量的或者说是可以直接观测的但是也有一些影响经济变量的因素无法定量度量或者说无法直接观测但是也有一些影响经济变量的因素无法定量度量或者说无法直接观测 如职业、性别对收入的影响,战争、自然灾害对如职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节的影响,季节对某些产品对某些产品(如冷饮如冷饮)销售的影响等。销售的影响等。第3页,共32页。为了能够在模型中反映这些因素的影响,并提高模型的精度,需要将为了能够在模型中反映

3、这些因素的影响,并提高模型的精度,需要将它们人为地它们人为地“量化量化”,这种,这种“量化量化”通常是通过引入通常是通过引入“虚拟变量虚拟变量”来完成的。来完成的。这种用两个相异数字来表示对被解释变量有重要影响而自身又这种用两个相异数字来表示对被解释变量有重要影响而自身又没有观测数值的一类变量,称为没有观测数值的一类变量,称为虚拟变量虚拟变量(dummy variables)。虚拟变量也称为哑变量或定性变量。虚拟变量也称为哑变量或定性变量。第4页,共32页。虚拟变量的特点是:虚拟变量的特点是:1虚拟变量是对经济变化有重要影响的不可测变量。虚拟变量是对经济变化有重要影响的不可测变量。2虚拟变量是

4、赋值变量,一般根据这些因素的属性类型,构造只取虚拟变量是赋值变量,一般根据这些因素的属性类型,构造只取“0”或或“1”的人工变量,通常称为虚拟变量,记为的人工变量,通常称为虚拟变量,记为D。这是为了便于计算而。这是为了便于计算而把定性因素这样数量化的,所以虚拟变量的数值只表示变量的性质而不表把定性因素这样数量化的,所以虚拟变量的数值只表示变量的性质而不表示变量的数值。示变量的数值。基础类型和肯定类型取值为基础类型和肯定类型取值为1;一般地,在虚拟变量的设置中,一般地,在虚拟变量的设置中,比较类型和否定类型取值为比较类型和否定类型取值为0。第5页,共32页。例如:例如:1)表示性别的虚拟变量可取

5、为)表示性别的虚拟变量可取为D1=1 男性男性 0 女性女性2)表示文化程度的虚拟变量可取为)表示文化程度的虚拟变量可取为D2=1 本科及以上学历本科及以上学历 0 本科以下学历本科以下学历3)表示地区的虚拟变量可取为)表示地区的虚拟变量可取为D3=1 城市城市 0 农村农村4)表示消费心理的虚拟变量可取为)表示消费心理的虚拟变量可取为D4=1 喜欢某种商品喜欢某种商品 0 不喜欢某种商品不喜欢某种商品5)表示天气变化的虚拟变量可取为)表示天气变化的虚拟变量可取为D5=0 雨天雨天 1 晴天晴天第6页,共32页。2引入虚拟变量的作用 引入虚拟变量的作用,在于将定性因素或属性因素对因变量的影响数

6、量化。(1)可以描述和测量定性(或属性)因素的影响;(2)能够正确反映经济变量之间的相互关系,提高模型的精度;(3)便于处理异常数据。设置虚拟变量(即将异常数据作为一个特殊的定性因素)。例如:第7页,共32页。7.1 7.1 虚拟变量的基本含义虚拟变量的基本含义n许多经济变量是许多经济变量是可以定量度量可以定量度量的,的,如:如:商品需求量、价格、收入、商品需求量、价格、收入、产量等,产量等,n但也有一些影响经济变量的因素但也有一些影响经济变量的因素无法定量度量无法定量度量,如:如:职业、性职业、性别对收入的影响,战争、自然灾害对别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产的影响

7、,季节对某些产品(如冷饮)销售的影响等等。品(如冷饮)销售的影响等等。n为了在模型中能够反映这些因素的影响,并提高模型的精度,为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们需要将它们“量化量化”。第8页,共32页。这种这种“量化量化”通常是通过引入通常是通过引入“虚拟变量虚拟变量”来完成的。根据来完成的。根据这些因素的属性类型,构造只取这些因素的属性类型,构造只取“0”0”或或“1”1”的人工变量,通常称的人工变量,通常称为为虚拟变量虚拟变量(dummy variables),记为),记为D。例如例如,反映文程度的虚拟变量可取为:,反映文程度的虚拟变量可取为:1,本科学历本科

8、学历 D=0,非本科学历非本科学历 一般地,在虚拟变量的设置中:一般地,在虚拟变量的设置中:基础类型、肯定类型取值为基础类型、肯定类型取值为1 1;比较类型,否定类型取值为比较类型,否定类型取值为0 0。第9页,共32页。概念:概念:同时含有一般解释变量与虚拟变量的模型称为虚拟同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(变量模型或者方差分析(analysis-of variance:ANOVA)模型。模型。一个以性别为虚拟变量考察企业职工薪金的模型:一个以性别为虚拟变量考察企业职工薪金的模型:其中其中:Yt为企业职工的薪金,为企业职工的薪金,Xt为工龄,为工龄,Dt=1,

9、若是男性,若是男性,Dt=0,若是女性。,若是女性。ttttDXYm mb bb bb b+=210第10页,共32页。虚拟变量模型虚拟变量模型同时含有一般解释变量与虚拟变量的模型称为同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型虚拟变量模型。在模型中,虚拟变量可作为解释变量,也可作为被解释变量,但主要在模型中,虚拟变量可作为解释变量,也可作为被解释变量,但主要是用作是用作解释变量解释变量。一个以性别为虚拟变量来考察职工薪金的模型如下:一个以性别为虚拟变量来考察职工薪金的模型如下:(7-1)i012iiiYXDbbbm=+其中其中例如:例如:iY为职工的薪金;为职工的薪金;iX为职工工龄

10、;为职工工龄;iD=1代表男性代表男性iD=0 代表女性代表女性第11页,共32页。7.2 7.2 虚拟变量的引入虚拟变量的引入 虚拟变量做为解释变量引入模型有两种基本方式:虚拟变量做为解释变量引入模型有两种基本方式:n 加法方式加法方式所设定的计量经济模型中加入适当的虚拟变量,此时虚拟变量与其他解释变量在设定模型中是相加关系。其作用是改变了设定模型的截距水平。乘法方式乘法方式在所设定的计量经济模型中,将虚拟解释变量与其他解释变量相乘作为新的解释变量出现在模型中,以达到其调整设定模型斜率系数的目的。第12页,共32页。7.2 7.2 虚拟变量的引入虚拟变量的引入企业女职工的薪金模型:企业女职工

11、的薪金模型:yt=b0+b1xt+ut企业男职工的薪金模型:企业男职工的薪金模型:yt=(b0+a)+b1xt+ut企业职工薪金模型中性别虚拟变量的引入采取了加法方式,企业职工薪金模型中性别虚拟变量的引入采取了加法方式,以研究妇女在工作中是否受到性别歧视(实验经济学)以研究妇女在工作中是否受到性别歧视(实验经济学)令令y=年薪,年薪,x=工作年限,工作年限,建立企业年薪模型:建立企业年薪模型:yt=b0+b1xt+aD+ut 1 1、加法方式、加法方式所设定的计量经济模型中加入适当的虚拟变量,此时虚虚拟变量与其他解释变量在设定模型中是相加关系拟变量与其他解释变量在设定模型中是相加关系。其作用是

12、改变了设定模型的截距水平改变了设定模型的截距水平。=女性男性01D第13页,共32页。几何意义:几何意义:男女职工的年薪对工龄的男女职工的年薪对工龄的函数具有相同函数具有相同斜率斜率b1,表明随着工龄的增长,男女职工表明随着工龄的增长,男女职工工资的增长幅度相同;工资的增长幅度相同;截距不同截距不同,说明男,说明男女职工的初始年薪不同。这种虚拟变量只女职工的初始年薪不同。这种虚拟变量只影响截距不影响斜率的模型为加法模型。影响截距不影响斜率的模型为加法模型。年薪 Y 男职工 女职工 工龄 Xb0b0+ayt=b0+b1xt+aD+ut第14页,共32页。7.2.虚拟变量的引入虚拟变量的引入虚拟变

13、量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。1.加法方式加法方式上述职工薪金模型(上述职工薪金模型(7-1)中性别虚拟变量的引入就采取了加法方式,)中性别虚拟变量的引入就采取了加法方式,女职工的平均薪金为:女职工的平均薪金为:男职工的平均薪金为:男职工的平均薪金为:ttttuaDxbby+=10ttttxbbD,xyE100+=ttttxbabD,xyE101+=0=tuE在该模型中,如仍假定在该模型中,如仍假定,则:,则:为什么下面这样的写法?为什么下面这样的写法?=女性男性01D,第15页,共32页。从从几何意义

14、几何意义上看上看(图图7-1),图图7-1 男女职工平均薪金示意图男女职工平均薪金示意图则两个函数有相同的斜率,但有不同的截距。则两个函数有相同的斜率,但有不同的截距。假定假定 ,0a 这意味着,男女职工平均薪金对工龄的变化率这意味着,男女职工平均薪金对工龄的变化率 是一样的,但两者的平均薪金水平相差是一样的,但两者的平均薪金水平相差 。aa 可以通过传统的回归检验,对可以通过传统的回归检验,对 的统计显著性进行检验,以判断的统计显著性进行检验,以判断男女职工的平均薪金水平是否显著差异。男女职工的平均薪金水平是否显著差异。a第16页,共32页。例7.1.4 居民家庭的教育费用支出除了受收入水平

15、的影响之外,还与子女的年龄结构密切相关。如果家庭中有适龄子女(6-21岁),教育费用支出就多。因此,为了反映“子女年龄结构”这一定性因素,设置虚拟变量:第17页,共32页。图7.1.1表明,在相同的收入水平情况下,有适龄子女家庭的教育费用平均要比无适龄子女家庭的教育费用多支a出个单位。图7.1.1 虚拟变量对截距的影响 第18页,共32页。又例:又例:在横截面数据基础上,考虑个人保健支出对个人收在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。入和教育水平的回归。教育水平考虑三个层次:高中以下,教育水平考虑三个层次:高中以下,高中,高中,大学及其以上大学及其以上 =011D 其他

16、高中 =012D 其他大学及其以上模型可设定如下:模型可设定如下:这时需要引入两个虚拟变量:这时需要引入两个虚拟变量:tttDDXYm mb bb bb bb b+=231210第19页,共32页。在在E(m mt)=0 的初始假定下,高中以下、高中、大学及的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:其以上教育水平下个人保健支出的函数:高中以下:高中以下:高中:高中:大学及其以上:大学及其以上:tttXDDXYE1021)0,0,|(b bb b+=tttXDDXYE12021)()0,1,|(b bb bb b+=tttXDDXYE13021)()1,0,|(b

17、bb bb b+=第20页,共32页。假定假定b b3b b2,其几何意义:,其几何意义:大学教育 保健 高中教育 支出 低于中学教育 收入023第21页,共32页。还可将多个虚拟变量引入模型中以考察多种还可将多个虚拟变量引入模型中以考察多种“定性定性”因素的影响。因素的影响。如如在上述职工薪金的例中,再引入代表学历的虚拟在上述职工薪金的例中,再引入代表学历的虚拟变量变量D2:=012D本科及以上学历本科及以上学历本科以下学历本科以下学历职工薪金的回归模型可设计为:职工薪金的回归模型可设计为:tttDDXYm mb bb bb bb b+=231210第22页,共32页。女职工本科以下学历的平

18、均薪金:女职工本科以下学历的平均薪金:女职工本科以上学历的平均薪金:女职工本科以上学历的平均薪金:于是,不同性别、不同学历职工的平均薪金分于是,不同性别、不同学历职工的平均薪金分别为:别为:男职工本科以下学历的平均薪金:男职工本科以下学历的平均薪金:男职工本科以上学历的平均薪金:男职工本科以上学历的平均薪金:tttXDDXYE1021)0,0,|(b bb b+=tttXDDXYE12021)()0,1,|(b bb bb b+=tttXDDXYE13021)()1,0,|(b bb bb b+=tttXDDXYE132021)()1,1,|(b bb bb bb b+=第23页,共32页。2

19、 2、乘法方式、乘法方式n加法方式引入虚拟变量,考察:加法方式引入虚拟变量,考察:截距的不同截距的不同,n许多情况下:往往是斜率就有变化,许多情况下:往往是斜率就有变化,或斜率、截距同时发生变或斜率、截距同时发生变化化。n斜率的变化可通过以乘法的方式引入虚拟变量来测度。斜率的变化可通过以乘法的方式引入虚拟变量来测度。例:例:根据消费理论,消费水平根据消费理论,消费水平C主要取决于收入水平主要取决于收入水平Y,但,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费然灾害、战争等反常年

20、份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。倾向的变化可通过在收入的系数中引入虚拟变量来考察。在所设定的计量经济模型中,将虚拟解释变量与其他解释变虚拟解释变量与其他解释变量相乘作为新的解释变量出现在模型量相乘作为新的解释变量出现在模型中,以达到其调整设定达到其调整设定模型斜率系数的目的模型斜率系数的目的。乘法形式引入虚拟解释变量的主要作用:两个回归模型之间的比较;因素之间的交互影响分析;提高模型对现实经济现象的描述精度。第24页,共32页。(2)(2)乘法类型乘法类型例7.1.6 随着收入水平的提高,家庭教育费用支出的边际消费倾向可能会发生变化。为了反映

21、定性因素对斜率的影响,可以用乘法方式引入虚拟变量,将家庭教育费用支出函数取成:图7.1.2 虚拟变量对斜率的影响 第25页,共32页。tttttXDXCmbbb+=210 这里,虚拟变量这里,虚拟变量D以与以与X相乘的方式引入了模型中,从而可用相乘的方式引入了模型中,从而可用来考察消费倾向的变化。来考察消费倾向的变化。如,设如,设=01tD反常年份正常年份消费模型可建立如下:消费模型可建立如下:第26页,共32页。假定假定E(m mt)=0,上述模型所表示的函数可化为:上述模型所表示的函数可化为:正常年份:正常年份:ttttXDXCE)()1,|(210bbb+=反常年份:反常年份:ttttX

22、DXCE10)0,|(bb+=第27页,共32页。(3)(3)一般方式一般方式 实际应用中,一般是直接以加法和乘法方式引入虚加法和乘法方式引入虚拟变量拟变量,然后再利用t检验判断其系数是否显著的不等于零,进而确定虚拟变量的具体引入方式。我们还可以用加法模型与乘法模型相结合的方式建加法模型与乘法模型相结合的方式建立模型来拟合经济发展出现转折立模型来拟合经济发展出现转折的情况。例例7.1.97.1.9 进口商品消费支出y主要取决于国民生产总值x的多少。我国改革开放前后,由于国家政策的变化,及改革开放后外资的大量引入等因素的影响,1978年前后,y和x 第28页,共32页。例如,例如,进口消费品数量

23、进口消费品数量Y主要取决于国民收入主要取决于国民收入X的多少,中国在改革开放前后,的多少,中国在改革开放前后,Y对对X的回归关系明显的回归关系明显不同。不同。这时,可以这时,可以t*=1978年为转折期,以年为转折期,以19781978年的国年的国民收入民收入Xt*为临界值,设如下虚拟变量:为临界值,设如下虚拟变量:=01tD*tttt则进口消费品的回归模型可建立如下:则进口消费品的回归模型可建立如下:ttttt10tuDxxaxbby+=第29页,共32页。临界指标的虚拟变量的引入临界指标的虚拟变量的引入 在经济发生转折时期,可通过建立临界在经济发生转折时期,可通过建立临界指标的虚拟变量模型来反映。指标的虚拟变量模型来反映。第30页,共32页。第31页,共32页。OLS法得到该模型的回归方程为法得到该模型的回归方程为则两时期进口消费品函数分别为:则两时期进口消费品函数分别为:tttt10tDxxa xbby+=当当tt*=1978年年,当当t t*=1978年年,当截距与斜率发生变化时,则需要同时引入加法与乘当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量法形式的虚拟变量。0=tD1=tD t1t0txa bxa by+=第32页,共32页。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(虚拟变量回归模型课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|