1、9.2 9.2 离散被解释变量数据计量经济学离散被解释变量数据计量经济学模型(二)模型(二)多元选择模型多元选择模型 Models with Discrete Dependent VariablesMultiple Choice Model一、多元离散选择模型的经济背景一、多元离散选择模型的经济背景 二、一般多元离散选择二、一般多元离散选择LogitLogit模型模型三、嵌套多元离散选择模型三、嵌套多元离散选择模型四、排序多元离散选择模型四、排序多元离散选择模型一、多元离散选择模型的经济背景一、多元离散选择模型的经济背景1、经济生活中的多元选择问题、经济生活中的多元选择问题 一般的多元选择问题
2、一般的多元选择问题 排序选择问题排序选择问题 将选择对象按照某个准则排队,由决策者从中将选择对象按照某个准则排队,由决策者从中选择选择。决策者对同一个选择对象的偏好程度。决策者对同一个选择对象的偏好程度。嵌套选择问题嵌套选择问题2、社会生活中的多元选择问题、社会生活中的多元选择问题 一般的多元选择问题一般的多元选择问题 排序选择问题排序选择问题 嵌套选择问题嵌套选择问题二、一般多元离散选择二、一般多元离散选择LogitLogit模型模型说明说明 在多元离散选择模型中,因为在多元离散选择模型中,因为ProbitProbit模型需要对模型需要对多元正态分布的整体进行评价,所以它的应用受多元正态分布
3、的整体进行评价,所以它的应用受到限制。到限制。逻辑分布更适合于效用最大化时的分布选择,所逻辑分布更适合于效用最大化时的分布选择,所以应用最多的多元离散选择模型是以应用最多的多元离散选择模型是LogitLogit模型。模型。LogitLogit模型的似然函数能够快速可靠地收敛,当方模型的似然函数能够快速可靠地收敛,当方案或者决策个体数量较大时,计算比较简便。案或者决策个体数量较大时,计算比较简便。LogitLogit模型计算的简便性是有条件的。即选择方案模型计算的简便性是有条件的。即选择方案是不相关的,具体包括:是不相关的,具体包括:U Uijij=V Vijij+ijij,i i是独立的;是独
4、立的;P Pi i/P Pk k与其它选择方案的属性无关,与选择方案的个数与其它选择方案的属性无关,与选择方案的个数无关;无关;P Pi i关于其它选择方案属性的弹性是不变的,与关于其它选择方案属性的弹性是不变的,与i i无关。无关。上述条件只有在选择方案的差异相同的情况下才上述条件只有在选择方案的差异相同的情况下才能得到满足。能得到满足。在相关文献中有数学证明。在相关文献中有数学证明。一般多元选择一般多元选择LogitLogit模型的思路模型的思路 如果决策者如果决策者i在(在(J+1)项可供选择方案中选择了)项可供选择方案中选择了第第j项,那么其效用模型为:项,那么其效用模型为:UijXi
5、jijP UUkJkjijik(),0 1 2 P yjeeijJ()XXijij0如果(J+1)个随机误差项互不相关,并且服从Weibull分布 Feijij()效用模型的解释变量中包括所有影响选择的因素,效用模型的解释变量中包括所有影响选择的因素,既包括决策者所具有的属性,也包括备选方案所既包括决策者所具有的属性,也包括备选方案所具有的属性。具有的属性。备选方案所具有的属性是随着方案的变化而变化备选方案所具有的属性是随着方案的变化而变化的。的。决策者所具有的属性中一部分是随着方案的变化决策者所具有的属性中一部分是随着方案的变化而变化的,而一部分是不随着方案的变化而变化而变化的,而一部分是不
6、随着方案的变化而变化的。的。用用Zij表示随着方案的变化而变化的那部分解释变表示随着方案的变化而变化的那部分解释变量,量,Wi表示不随着方案的变化而变化的那部分解表示不随着方案的变化而变化的那部分解释变量。释变量。P yjeeeeeeijJjJ()ZWZWZWZWijiijiijiiji00P yjeeeeeeijJjJ()ZWWZZZijiiijijij00 实用的一般多元实用的一般多元Logit选择模型又分选择模型又分3种情况。种情况。一是研究选择某种方案的概率与决策者的特征变一是研究选择某种方案的概率与决策者的特征变量之间的关系;量之间的关系;二是研究选择某种方案的概率与决策者的特征变二
7、是研究选择某种方案的概率与决策者的特征变量以及方案的特征变量之间的关系;量以及方案的特征变量之间的关系;三是考虑到不同方案之间的相关性的情况。三是考虑到不同方案之间的相关性的情况。Multinomial Logit Model多项式多项式Logit模型模型名义名义Logit模型模型Conditional Logit Model 条件条件Logit模型模型 Nested Logit模型模型嵌套模型嵌套模型 多元名义多元名义LogitLogit离散选择模型及其参数估计离散选择模型及其参数估计 P yjeeijJjj()XXii0X中未包含备选方案所具有的中未包含备选方案所具有的属性变量,而参数向量
8、属性变量,而参数向量B对不对不同的选择方案(即不同的方程)同的选择方案(即不同的方程)是不同的。是不同的。P yjeeikJjk()XXii11P yeikJk()0111Xi令令B0=0,j=1,2,Jlnln()LdP yjijijJin01 由对数似然函数最大化的一阶条件,利用由对数似然函数最大化的一阶条件,利用Newton 迭代方法可以迅速地得到方程组的解,得到模型迭代方法可以迅速地得到方程组的解,得到模型的参数估计量。的参数估计量。ln(),LdPjJijijijiX1 2 21ln()LPjlPijiliiinjl1X X 1()jljljl10如果如果另一种估计方法另一种估计方法
9、 可以计算得到相对于基准方案的对数概率比为:可以计算得到相对于基准方案的对数概率比为:ln()PPiji0 Xijln()()PPijikXijk 两点注意:两点注意:假设了原模型中(假设了原模型中(J+1)个随机误差项互不相关。)个随机误差项互不相关。对估计结果的解释不同。对估计结果的解释不同。例题例题 农村异地转移劳动力的迁移目标研究。农村异地转移劳动力的迁移目标研究。被解释变量:被解释变量:迁移目标,即小城镇、县级市、地级市、省迁移目标,即小城镇、县级市、地级市、省级城市和超大城市,依次取值级城市和超大城市,依次取值1、2、3、4、5。解释变量:解释变量:个人特征和目前所在地属性个人特征
10、和目前所在地属性。连续变量连续变量包括受包括受教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、原有收入、现有收入,目前所在地属性中的所在地农村人原有收入、现有收入,目前所在地属性中的所在地农村人口、国内生产总值、城乡居民储蓄余额、粮食产量、中学口、国内生产总值、城乡居民储蓄余额、粮食产量、中学生在校人数、小学生在校人数等。生在校人数、小学生在校人数等。离散变量离散变量包括性别、婚包括性别、婚姻状况、收入稳定与否,目前所在地所属级别与家乡所在姻状况、收入稳定与否,目前所在地所属级别与家乡所在地所属级别等。地所属级别等。虽然作为被解释变量的城
11、市规模本身是有序的,但是对于虽然作为被解释变量的城市规模本身是有序的,但是对于农村劳动力来说,选择进入哪一个级别的城市,本身是无农村劳动力来说,选择进入哪一个级别的城市,本身是无序的,因此对于城市化迁移目标构造序的,因此对于城市化迁移目标构造多元名义多元名义logit离散选离散选择模型择模型。调查样本,有效样本调查样本,有效样本303份。份。用用SAS统计软件进行估计与分析。统计软件进行估计与分析。首先将定义的全部变量放进模型中进行估计,并通过比较首先将定义的全部变量放进模型中进行估计,并通过比较各个变量的各个变量的P值来考虑具体剔除哪些变量以及对哪些变量值来考虑具体剔除哪些变量以及对哪些变量
12、考虑将其交互影响的效应放进模型中去。考虑将其交互影响的效应放进模型中去。小城镇、县级市、地级市、省级城市和超大城市依次取值小城镇、县级市、地级市、省级城市和超大城市依次取值1、2、3、4、5。由于得到了频数,可以采用由于得到了频数,可以采用“对数概率模型对数概率模型”进行估计。进行估计。最终模型的估计结果(部分)最终模型的估计结果(部分)*代表的是90的显著性水平,*代表的是95的显著性水平,*代表的是99的显著性水平。将模型的结果整理出来,并对每个解释变量进行分析。将模型的结果整理出来,并对每个解释变量进行分析。例如:教育程度、家庭情况及现有收入对迁移目标的影响:例如:教育程度、家庭情况及现
13、有收入对迁移目标的影响:从教育程度来看从教育程度来看,所有系数都是负值,教育程度越高的农,所有系数都是负值,教育程度越高的农村劳动力越愿意进入规模较大的城市;从显著性水平来看,村劳动力越愿意进入规模较大的城市;从显著性水平来看,相对于超大城市来说,县级市被选择的可能性最小,其次相对于超大城市来说,县级市被选择的可能性最小,其次是小城镇,然后是地级城市,而教育程度相似的农村劳动是小城镇,然后是地级城市,而教育程度相似的农村劳动力在省级城市与超大城市之间的选择没有明显的差异。力在省级城市与超大城市之间的选择没有明显的差异。从家庭情况来看从家庭情况来看,所有系数都是负值,也就是说家庭情况,所有系数都
14、是负值,也就是说家庭情况越好的农村劳动力越愿意进入规模较大的城市;从显著性越好的农村劳动力越愿意进入规模较大的城市;从显著性水平来看,相对于超大城市来说,省级城市最不容易被选水平来看,相对于超大城市来说,省级城市最不容易被选中,其次是县级市,而小城镇与地级市之间没有明显区中,其次是县级市,而小城镇与地级市之间没有明显区别别。从现有收入来看从现有收入来看,所有系数都是负值,也就是说目前收入,所有系数都是负值,也就是说目前收入越高的农村劳动力越愿意进入规模较大的城市;再从显著越高的农村劳动力越愿意进入规模较大的城市;再从显著性水平来看,所有系数都是显著的,这说明相对于任何级性水平来看,所有系数都是
15、显著的,这说明相对于任何级别的城市而言,农村劳动力都更倾向于超大城市。别的城市而言,农村劳动力都更倾向于超大城市。多元条件多元条件LogitLogit离散选择模型及其参数估计离散选择模型及其参数估计 选择某种方案的概率不仅与决策者的特征变量有选择某种方案的概率不仅与决策者的特征变量有关,而且也与方案的特征变量有关,模型为:关,而且也与方案的特征变量有关,模型为:P yjeeijJjjjj()XXii1区别在于X的下标lnln()LdP yjijijJin11 由对数似然函数最大化的一阶条件,利用由对数似然函数最大化的一阶条件,利用Newton 迭代方法可以迅速地得到方程组的解,迭代方法可以迅速
16、地得到方程组的解,得到模型的参数估计量。得到模型的参数估计量。ln()LdijjJiniji11XX211ln()()LPijjJijiijiin XXXXXXiijjJijP1三、嵌套多元离散选择模型三、嵌套多元离散选择模型1 1、问题的提出、问题的提出(J+1)个不同的选择方案之间具有相关性,而且必个不同的选择方案之间具有相关性,而且必须考虑这种相关性,表现为模型随机误差项相关。须考虑这种相关性,表现为模型随机误差项相关。可行的思路是将(可行的思路是将(J+1)个选择方案分为)个选择方案分为L组,在组,在每组内部的选择方案之间不具有相关性,而组间每组内部的选择方案之间不具有相关性,而组间则
17、具有相关性。则具有相关性。就是将条件就是将条件Logit模型中隐含的齐次方差性条件放模型中隐含的齐次方差性条件放松,允许方差在组间可以不同,但在组内仍然是松,允许方差在组间可以不同,但在组内仍然是同方差的。同方差的。这样的模型被称为这样的模型被称为Nested Logit模型。模型。1 1、Nested Nested LogitLogit模型模型P j lPeejljJlLl(,)XZXZj llj ll11表示对选择第l组产生影响的变量 表示在第l组内对选择第j种方案产生影响的变量PPPeeeeeeejlj lljJlLjJlLjJlLlllXXZZXZXZj lj lllj llj ll1
18、11111 定义第定义第l组的组的“内值内值”(Inclusive Value)IeljJllnXj l1Peej ljJlXXj lj l1PeellLllZIZIllll13 3、估计方法、估计方法 两阶段最大似然法两阶段最大似然法,是一种有限信息估计方法。,是一种有限信息估计方法。其具体步骤是:其具体步骤是:在组内,作为一个简单的条件在组内,作为一个简单的条件Logit模型,估计参数;模型,估计参数;计算每组的计算每组的“内值内值”;将每组看成是一种选择方案,再进行简单的条件将每组看成是一种选择方案,再进行简单的条件Logit模型的估计,得到参数模型的估计,得到参数和和T的估计量。此时用
19、到的贡的估计量。此时用到的贡献变量是献变量是Zl和和Il。完全信息最大似然法完全信息最大似然法。将对数似然函数写为:。将对数似然函数写为:lnln()LPPj lliin1四、排序多元离散选择模型四、排序多元离散选择模型Multivariate Choice ModelMultivariate Choice Modelfor Ordered Dadafor Ordered Dada1 1、问题的提出、问题的提出 作为被解释变量的(作为被解释变量的(J+1)个选择结果本身是排)个选择结果本身是排序的,序的,J优于(优于(J1),),2优于优于1,1优于优于0。决策者选择不同的方案所得到的效用也是
20、排序的。决策者选择不同的方案所得到的效用也是排序的。一般多元离散选择模型中的效用关系不再适用。一般多元离散选择模型中的效用关系不再适用。2 2、效用关系、效用关系 选择不同方案的效用关系:选择不同方案的效用关系:yyyuuyuJuyJ001021121如果如果如果如果*3 3、模型、模型为了保证所有的概率都是正的,必须有为了保证所有的概率都是正的,必须有:y*XP yP yuP yuuP yJuJ()()()()()()()()()()01211211XXXXXX假定服从正态分布,并且标准化为服从期望为0、方差为1的正态分布。那么可以得到选择各个方案的概率 为正态分布的概率函数0121uuuJ4 4、估计、估计 可以看作二元可以看作二元Probit模型的推广;模型的推广;采用最大似然法估计。采用最大似然法估计。