1、4.3 4.3 离散被解释变量数据计量经济学离散被解释变量数据计量经济学模型模型 多元选择模型多元选择模型 Models with Discrete Dependent VariablesMultiple Choice Model一、社会经济生活中的多元选择问题一、社会经济生活中的多元选择问题二、一般多元离散选择二、一般多元离散选择LogitLogit模型模型三、嵌套三、嵌套LogitLogit模型模型四、排序多元离散选择模型四、排序多元离散选择模型一、社会经济生活中的多元选择问题一、社会经济生活中的多元选择问题 可以将社会经济生活中的多元选择问题分为三类:可以将社会经济生活中的多元选择问题分
2、为三类:一般多元选择问题一般多元选择问题 排序选择问题排序选择问题(Ordered Multivariate Choice)嵌套选择问题嵌套选择问题(Nested Multiple Choices)一般多元选择问题一般多元选择问题 决策者按照效用最大原则在多个可供选择的方案中进行决策者按照效用最大原则在多个可供选择的方案中进行选择。选择。一类问题是决策者面临多项选择一类问题是决策者面临多项选择 一类问题是决策者对同一个选择对象的偏好程度一类问题是决策者对同一个选择对象的偏好程度 排序选择问题排序选择问题 决策者作出某种选择并不意味实现了效用最大,而是在决策者作出某种选择并不意味实现了效用最大,
3、而是在条件制约下的无奈选择。条件制约下的无奈选择。一个典型的例子是商品的满意度调查。一个典型的例子是商品的满意度调查。将对商品的满意度分为将对商品的满意度分为5等:十分满意、一般满意、等:十分满意、一般满意、无所谓、一般不满意、十分不满意,对已经购买了该无所谓、一般不满意、十分不满意,对已经购买了该商品的居民进行调查,会有不同的满意程度,该调查商品的居民进行调查,会有不同的满意程度,该调查结果就是一个排序选择问题。结果就是一个排序选择问题。嵌套选择问题嵌套选择问题 选择对象是分层次的,决策者必须逐层进行选择。选择对象是分层次的,决策者必须逐层进行选择。二、一般多元离散选择二、一般多元离散选择L
4、ogitLogit模型模型说明说明 在多元离散选择模型中,应用最多的是在多元离散选择模型中,应用最多的是Logit模型。模型。不同的教科书从不同的角度对此有不同的解释。不同的教科书从不同的角度对此有不同的解释。在多元离散选择模型中,因为在多元离散选择模型中,因为ProbitProbit模型需要对多元正模型需要对多元正态分布的整体进行评价,所以它的应用受到限制。态分布的整体进行评价,所以它的应用受到限制。逻辑分布更适合于效用最大化时的分布选择,所以应用逻辑分布更适合于效用最大化时的分布选择,所以应用最多的多元离散选择模型是最多的多元离散选择模型是LogitLogit模型。模型。LogitLogi
5、t模型的似然函数能够快速可靠地收敛,当方案或模型的似然函数能够快速可靠地收敛,当方案或者决策个体数量较大时,计算比较简便。者决策个体数量较大时,计算比较简便。1 1、一般多元选择、一般多元选择LogitLogit模型的思路模型的思路 如果决策者如果决策者i在(在(J+1)项可供选择方案中选择了)项可供选择方案中选择了第第j项,那么其项,那么其效用模型效用模型为:为:UijXijijP UUkJkjijik(),0 1 2 P yjeeijJ()XXijij0当且仅当(J+1)个随机误差项互不相关,并且服从类极值分布)exp()(ijeFij选择j的概率 效用模型的解释变量中包括所有影响选择的因
6、素,效用模型的解释变量中包括所有影响选择的因素,既包括既包括决策者所具有的属性,也包括备选方案所决策者所具有的属性,也包括备选方案所具有的属性。具有的属性。备选方案所具有的属性是随着方案的变化而变化的。备选方案所具有的属性是随着方案的变化而变化的。决策者所具有的属性中一部分是随着方案的变化而变决策者所具有的属性中一部分是随着方案的变化而变化的,而一部分是不随着方案的变化而变化的。化的,而一部分是不随着方案的变化而变化的。用用Zij表示随着方案的变化而变化的那部分解释变量,表示随着方案的变化而变化的那部分解释变量,Wi表示不随着方案的变化而变化的那部分解释变量。表示不随着方案的变化而变化的那部分
7、解释变量。P yjeeeeeeijJjJ()ZWZWZWZWijiijiijiiji00P yjeeeeeeijJjJ()ZWWZZZijiiijijij00 实用的一般多元实用的一般多元Logit选择模型又分选择模型又分3种情况。种情况。一是研究选择某种方案的概率与决策者的特征变量之一是研究选择某种方案的概率与决策者的特征变量之间的关系;间的关系;二是研究选择某种方案的概率与决策者的特征变量以二是研究选择某种方案的概率与决策者的特征变量以及方案的特征变量之间的关系;及方案的特征变量之间的关系;三是考虑到不同方案之间的相关性的情况。三是考虑到不同方案之间的相关性的情况。Multinomial
8、Logit Model多项多项Logit模型模型名义名义Logit模型模型Conditional Logit Model 条件条件Logit模型模型 Nested Logit模型模型嵌套模型嵌套模型 2 2、多项、多项LogitLogit离散选择模型及其参数估计离散选择模型及其参数估计 P yjeeijJjj()XXii0X中未包含备选方案所具有的中未包含备选方案所具有的属性变量,而参数向量属性变量,而参数向量B对不对不同的选择方案(即不同的方程)同的选择方案(即不同的方程)是不同的。是不同的。P yjeeikJjk()XXii11P yeikJk()0111Xi令令B0=0,j=1,2,Jl
9、nln()LdP yjijijJin01 由对数似然函数最大化的一阶条件,利用由对数似然函数最大化的一阶条件,利用Newton 迭代方法可以迅速地得到方程组的解,得到模型迭代方法可以迅速地得到方程组的解,得到模型的参数估计量。的参数估计量。ln(),LdPjJijijijiX1 2 21ln()LPjlPijiliiinjl1X X 1()jljljl10如果如果 另一种估计方法另一种估计方法 可以计算相对于基准方案的可以计算相对于基准方案的“对数成败比对数成败比”为:为:ln()PPiji0 Xijln()()PPijikXijk 两点注意:两点注意:假设了原模型中(假设了原模型中(J+1)
10、个随机误差项互不相关。)个随机误差项互不相关。对估计结果的解释不同。对估计结果的解释不同。如果对每个决策者进行如果对每个决策者进行重复观测,可以得到被重复观测,可以得到被解释变量的观测值。解释变量的观测值。如果对每个决策者只进如果对每个决策者只进行一次观测,如何得到行一次观测,如何得到被解释变量的观测值?被解释变量的观测值?3 3、例题、例题 将4.1例中某商业银行从历史贷款客户中随机抽取的78个样本进一步细分,贷款结果2表示贷款成功,1表示延滞还款,0表示呆坏账。目的是研究贷款结果(JG)与“商业信用支持度”(XY)和“市场竞争地位等级”(SC)之间的关系。为此建立三元选择多项Logit模型
11、。采用采用Stata估计模型,估计结果估计模型,估计结果 以JG=0为基准,对于JG=1和JG=2,“商业信用支持度”的系数为负,即当客户的财务状况越差(该变量观测值越大)时,获得贷款成功的概率越小,而且对JG=2的影响远大于对JG=1的影响。类似地,“市场竞争地位等级”的系数为正,即当客户的市场状况越好(该变量观测值越大)时,获得贷款成功的概率越大;而且对JG=2的影响远大于对JG=1的影响。模型有较高的拟合优度和总体显著性;解释变量在5%的显著性水平下显著。利用估计结果对样本客户贷款结果分别取0、1和2的概率进行预测,除了个别样本客户外,预测结果和实际结果具有一致性。对于多元选择模型,需要
12、检验选择结果之间的独立性,以及是否可以对于多元选择模型,需要检验选择结果之间的独立性,以及是否可以将某些选择结果合并。将某些选择结果合并。独立检验显示,选择结果1与选择结果0、2之间是独立的;选择结果2与选择结果0、1之间也是独立的。选择结果合并检验显示,选择结果1和2、1和0、2和0是不能合并的,即0、1、2选项均不可合并,也验证了IIA假设成立。4 4、条件、条件LogitLogit离散选择模型及其参数估计离散选择模型及其参数估计 选择某种方案的概率不仅与决策者的特征变量有选择某种方案的概率不仅与决策者的特征变量有关,而且也与方案的特征变量有关关,而且也与方案的特征变量有关,模型为:,模型
13、为:JjijjeejyP1)(iiXX区别在于X的下标lnln()LdP yjijijJin11 由对数似然函数最大化的一阶条件,利用由对数似然函数最大化的一阶条件,利用Newton 迭代方法可以迅速地得到方程组的解,迭代方法可以迅速地得到方程组的解,得到模型的参数估计量。得到模型的参数估计量。ln()LdijjJiniji11XX211ln()()LPijjJijiijiin XXXXXXiijjJijP1三、嵌套三、嵌套LogitLogit模型模型 1 1、问题的提出、问题的提出(J+1)个不同的选择方案之间具有相关性,而且必个不同的选择方案之间具有相关性,而且必须考虑这种相关性,表现为模
14、型随机误差项相关。须考虑这种相关性,表现为模型随机误差项相关。可行的思路是将(可行的思路是将(J+1)个选择方案分为)个选择方案分为L组,在组,在每组内部的选择方案之间不具有相关性,而组间每组内部的选择方案之间不具有相关性,而组间则具有相关性。则具有相关性。就是将条件就是将条件Logit模型中隐含的齐次方差性条件放模型中隐含的齐次方差性条件放松,允许方差在组间可以不同,但在组内仍然是松,允许方差在组间可以不同,但在组内仍然是同方差的。同方差的。这样的模型被称为这样的模型被称为Nested Logit模型。模型。2 2、Nested Nested LogitLogit模型模型P j lPeejl
15、jJlLl(,)XZXZj llj ll11表示对选择第l组产生影响的变量 表示在第l组内对选择第j种方案产生影响的变量PPPeeeeeeejlj lljJlLjJlLjJlLlllXXZZXZXZj lj lllj llj ll111111 定义第定义第l组的组的“内值内值”(Inclusive Value)IeljJllnXj l1Peej ljJlXXj lj l1PeellLllZIZIllll13 3、估计方法、估计方法 两阶段最大似然法两阶段最大似然法,是一种有限信息估计方法。,是一种有限信息估计方法。其具体步骤是:其具体步骤是:在组内,作为一个简单的条件在组内,作为一个简单的条件
16、Logit模型,估计参数;模型,估计参数;计算每组的计算每组的“内值内值”;将每组看成是一种选择方案,再进行简单的条件将每组看成是一种选择方案,再进行简单的条件Logit模型的估计,得到参数模型的估计,得到参数和和T的估计量。此时用到的贡的估计量。此时用到的贡献变量是献变量是Zl和和Il。完全信息最大似然法完全信息最大似然法。将对数似然函数写为:。将对数似然函数写为:lnln()LPPj lliin1比两阶段最大似然法更有效四、排序多元离散选择模型四、排序多元离散选择模型1 1、问题的提出、问题的提出 作为被解释变量的(作为被解释变量的(J+1)个选择结果本身是排)个选择结果本身是排序的,序的
17、,J优于(优于(J1),),2优于优于1,1优于优于0。决策者选择不同的方案所得到的效用也是排序的。决策者选择不同的方案所得到的效用也是排序的。一般多元离散选择模型中的效用关系不再适用。一般多元离散选择模型中的效用关系不再适用。2 2、效用关系、效用关系 选择不同方案的效用关系:选择不同方案的效用关系:yyyuuyuJuyJ001021121如果如果如果如果*3 3、模型、模型为了保证所有的概率都是正的,必须有为了保证所有的概率都是正的,必须有:y*XP yP yuP yuuP yJuJ()()()()()()()()()()01211211XXXXXX假定服从正态分布,并且标准化为服从期望为
18、0、方差为1的正态分布。那么可以得到选择各个方案的概率 为正态分布的概率函数0121uuuJ4 4、估计、估计 可以看作二元可以看作二元Probit模型的推广;模型的推广;采用最大似然法估计;采用最大似然法估计;得到参数估计值;得到参数估计值;计算每个样本选择各个方案的概率。计算每个样本选择各个方案的概率。5 5、排序模型问题举例、排序模型问题举例 为了研究各种不同的养老模式对老年人健康水平和为了研究各种不同的养老模式对老年人健康水平和幸福感的影响,利用幸福感的影响,利用2002年、年、2005年中国老年人年中国老年人口健康状况调查数据,建立多元排序选择模型。口健康状况调查数据,建立多元排序选
19、择模型。将客观健康状况分为将客观健康状况分为5个等级:非常健康、较健康、较不个等级:非常健康、较健康、较不健康、很不健康、死亡,显然这是一个排序多元选择问健康、很不健康、死亡,显然这是一个排序多元选择问题。题。将主观幸福感分为将主观幸福感分为6个等级:非常好、好、一般、差、非个等级:非常好、好、一般、差、非常差、死亡,显然这也是一个排序多元选择问题。常差、死亡,显然这也是一个排序多元选择问题。影响因素包括居住模式(即养老模式,包含独居、只影响因素包括居住模式(即养老模式,包含独居、只与配偶居住、多代合住、住养老院与配偶居住、多代合住、住养老院4种)以及其它因素种)以及其它因素,包含主要生活来源
20、、医疗状况、初始健康水平、社,包含主要生活来源、医疗状况、初始健康水平、社会经济地位、健康行为,以及人口统计信息等,所有会经济地位、健康行为,以及人口统计信息等,所有这些因素都属于决策者属性。这些因素都属于决策者属性。因为本例重点考察养老模式对老年人健康水平和幸福因为本例重点考察养老模式对老年人健康水平和幸福感的影响,考虑到养老模式和经济来源的二维性,进感的影响,考虑到养老模式和经济来源的二维性,进一步将养老模式细分,即每种模式下又分为经济独立一步将养老模式细分,即每种模式下又分为经济独立、子女供养、政府补助、子女供养、政府补助3种,共种,共12种养老模式。种养老模式。模型估计结果显示,模型估
21、计结果显示,不同养老模式对老年人客观健康水平不同养老模式对老年人客观健康水平的影响,以子女供养的独居老人为参照组,经济独立或子的影响,以子女供养的独居老人为参照组,经济独立或子女供养情况下生活独立的老年夫妻保持健康(即非常健康女供养情况下生活独立的老年夫妻保持健康(即非常健康或较健康)的概率要比参照组分别高或较健康)的概率要比参照组分别高13%-15%,死亡概,死亡概率要低率要低13%-15%,属于最优的养老模式;其次是经济独,属于最优的养老模式;其次是经济独立但选择多代合住的模式;立但选择多代合住的模式;子女供养的养老院老人、子女供养的养老院老人、依靠补助的独居老人和子女供养的独居老人(参照
22、组)具依靠补助的独居老人和子女供养的独居老人(参照组)具有最差的客观健康水平。有最差的客观健康水平。模型估计结果显示,模型估计结果显示,不同养老模式对老年人主观幸福感的不同养老模式对老年人主观幸福感的影响,与子女供养的独居老人相比,经济与生活均独立的影响,与子女供养的独居老人相比,经济与生活均独立的老年夫妻和依靠补助的养老院老人对生活最满意,感到非老年夫妻和依靠补助的养老院老人对生活最满意,感到非常幸福和幸福的概率要高出常幸福和幸福的概率要高出14%;其次是子女供养但生活;其次是子女供养但生活独立的老年夫妻和经济独立的养老院老人;独立的老年夫妻和经济独立的养老院老人;子女供养子女供养的养老院老人、依靠补助的独居老人和子女供养的独居老的养老院老人、依靠补助的独居老人和子女供养的独居老人(参照组)仍然具有最差的主观幸福感。人(参照组)仍然具有最差的主观幸福感。