1、2022-8-16计量经济学72二元选择模型计量经济学计量经济学72二元选择二元选择模型模型计量经济学72二元选择模型说明说明 在经典计量经济学模型中,被解释变量通常被假在经典计量经济学模型中,被解释变量通常被假定为连续变量。定为连续变量。离散被解释变量数据计量经济学模型(离散被解释变量数据计量经济学模型(Models Models with Discrete Dependent Variableswith Discrete Dependent Variables)和离散)和离散选择模型选择模型(DCM,Discrete Choice Model)(DCM,Discrete Choice Mo
2、del)。二元选择模型二元选择模型(Binary Choice Model)(Binary Choice Model)和多元选和多元选择模型择模型(Multiple Choice Model)(Multiple Choice Model)。本节只介绍二元选择模型。本节只介绍二元选择模型。计量经济学72二元选择模型 离散选择模型起源于离散选择模型起源于FechnerFechner于于18601860年进行的动物年进行的动物条件二元反射研究。条件二元反射研究。19621962年,年,WarnerWarner首次将它应用于经济研究领域,首次将它应用于经济研究领域,用以研究公共交通工具和私人交通工具的
3、选择问用以研究公共交通工具和私人交通工具的选择问题。题。7070、8080年代,离散选择模型被普遍应用于经济布年代,离散选择模型被普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。等经济决策领域的研究。模型的估计方法主要发展于模型的估计方法主要发展于8080年代初期。年代初期。计量经济学72二元选择模型一、二元离散选择模型的经济背景一、二元离散选择模型的经济背景计量经济学72二元选择模型实际经济生活中的二元选择问题实际经济生活中的二元选择问题 研究选择结果与影响因素之间的关系。研究选择结果与影响因素之间的关系。影响因素包括
4、两部分:影响因素包括两部分:决策者的属性决策者的属性和和备选方案备选方案的属性的属性。对于单个方案的取舍。例如,购买者对某种商品对于单个方案的取舍。例如,购买者对某种商品的购买决策问题的购买决策问题 ,求职者对某种职业的选择问题,求职者对某种职业的选择问题,投票人对某候选人的投票决策,银行对某客户的投票人对某候选人的投票决策,银行对某客户的贷款决策。由贷款决策。由决策者的属性决定。决策者的属性决定。对于两个方案的选择。例如,两种出行方式的选对于两个方案的选择。例如,两种出行方式的选择,两种商品的选择。由择,两种商品的选择。由决策者的属性决策者的属性和和备选方备选方案的属性共同决定。案的属性共同
5、决定。计量经济学72二元选择模型二、二元离散选择模型二、二元离散选择模型计量经济学72二元选择模型1 1、原始模型、原始模型 对于二元选择问题,可以建立如下计量经济学模对于二元选择问题,可以建立如下计量经济学模型。其中型。其中Y为观测值为为观测值为1和和0的决策被解释变量;的决策被解释变量;X为解释变量,包括选择对象所具有的属性和选择为解释变量,包括选择对象所具有的属性和选择主体所具有的属性。主体所具有的属性。左右端矛盾左右端矛盾计量经济学72二元选择模型 由于存在这两方面的问题,所以原始模型不能作由于存在这两方面的问题,所以原始模型不能作为实际研究二元选择问题的模型。为实际研究二元选择问题的
6、模型。需要将原始模型变换为效用模型。需要将原始模型变换为效用模型。这是离散选择模型的关键。这是离散选择模型的关键。具有异具有异方差性方差性 计量经济学72二元选择模型2 2、效用模型、效用模型 作为研究对象的二元选择模型作为研究对象的二元选择模型第第i个个体个个体 选择选择1的效的效用用第第i个个体个个体 选择选择0的效用的效用计量经济学72二元选择模型 注意,在模型中,效用是不可观测的,人们能够注意,在模型中,效用是不可观测的,人们能够得到的观测值仍然是选择结果,即得到的观测值仍然是选择结果,即1和和0。很显然,如果不可观测的很显然,如果不可观测的U1U0,即对应于观测,即对应于观测值为值为
7、1,因为该个体选择公共交通工具的效用大,因为该个体选择公共交通工具的效用大于选择私人交通工具的效用,他当然要选择公共于选择私人交通工具的效用,他当然要选择公共交通工具;交通工具;相反,如果不可观测的相反,如果不可观测的U1U0,即对应于观测值,即对应于观测值为为0,因为该个体选择公共交通工具的效用小于,因为该个体选择公共交通工具的效用小于选择私人交通工具的效用,他当然要选择私人交选择私人交通工具的效用,他当然要选择私人交通工具。通工具。计量经济学72二元选择模型3 3、最大似然估计最大似然估计 欲使得效用模型可以估计,就必须为随机误差项欲使得效用模型可以估计,就必须为随机误差项选择一种特定的概
8、率分布。选择一种特定的概率分布。两种最常用的分布是标准正态分布和逻辑两种最常用的分布是标准正态分布和逻辑(logistic)分布,于是形成了两种最常用的二元)分布,于是形成了两种最常用的二元选择模型选择模型Probit模型模型和和Logit模型模型。最大似然函数及其估计过程如下:最大似然函数及其估计过程如下:计量经济学72二元选择模型标准正态分布或逻标准正态分布或逻辑分布的对称性辑分布的对称性似然函数计量经济学72二元选择模型 在样本数据的支持下,如果知道概率分布函数在样本数据的支持下,如果知道概率分布函数和概率密度函数,求解该方程组,可以得到模和概率密度函数,求解该方程组,可以得到模型参数估
9、计量。型参数估计量。1阶极值条件计量经济学72二元选择模型三、二元三、二元ProbitProbit离散选择模型及其参数离散选择模型及其参数估计估计计量经济学72二元选择模型1 1、标准正态分布的概率分布函数、标准正态分布的概率分布函数 计量经济学72二元选择模型2 2、重复观测值不可以得到情况下二元、重复观测值不可以得到情况下二元ProbitProbit离散选择模型的参数估计离散选择模型的参数估计 计量经济学72二元选择模型 关于参数的非线性函数,不能直接求解,需采用关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。完全信息最大似然法中所采用的迭代方法。应用计量经
10、济学软件。应用计量经济学软件。这里所谓这里所谓“重复观测值不可以得到重复观测值不可以得到”,是指对每,是指对每个决策者只有一个观测值。如果有多个观测值,个决策者只有一个观测值。如果有多个观测值,也将其看成为多个不同的决策者。也将其看成为多个不同的决策者。计量经济学72二元选择模型例例7.2.27.2.2 贷款决策模型贷款决策模型 分析与建模:分析与建模:某商业银行从历史贷款客户中随机某商业银行从历史贷款客户中随机抽取抽取78个样本,根据设计的指标体系分别计算它个样本,根据设计的指标体系分别计算它们的们的“商业信用支持度商业信用支持度”(CC)和)和“市场竞争地市场竞争地位等级位等级”(CM),
11、对它们贷款的结果(),对它们贷款的结果(JG)采)采用二元离散变量,用二元离散变量,1表示贷款成功,表示贷款成功,0表示贷款失表示贷款失败。目的是研究败。目的是研究JG与与CC、CM之间的关系,并为之间的关系,并为正确贷款决策提供支持。正确贷款决策提供支持。计量经济学72二元选择模型 样样本本观观测测值值CC=XYCM=SC计量经济学72二元选择模型计量经济学72二元选择模型计量经济学72二元选择模型该方程表示该方程表示,当,当CC和和CM已知时,代入方程,可以计算贷款成已知时,代入方程,可以计算贷款成功的概率功的概率JGF。例如,将表中第。例如,将表中第19个样本观测值个样本观测值CC=15
12、、CM=1代入方程右边,计算括号内的值为代入方程右边,计算括号内的值为0.1326552;查标准正态;查标准正态分布表,对应于分布表,对应于0.1326552的累积正态分布为的累积正态分布为0.5517;于是,;于是,JG的预测值的预测值JGF=10.5517=0.4483,即对应于该客户,贷款,即对应于该客户,贷款成功的概率为成功的概率为0.4483。输出的估计结果计量经济学72二元选择模型模拟预测计量经济学72二元选择模型 预测:预测:如果有一个新客户,根据客户资料,计算如果有一个新客户,根据客户资料,计算的的“商业信用支持度商业信用支持度”(XY)和)和“市场竞争地位市场竞争地位等级等级
13、”(SC),代入模型,就可以得到贷款成功),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。的概率,以此决定是否给予贷款。计量经济学72二元选择模型3 3、重复观测值可以得到情况下二元、重复观测值可以得到情况下二元ProbitProbit离离散选择模型的参数估计散选择模型的参数估计 思路思路 对每个决策者有多个重复(例如对每个决策者有多个重复(例如10次左右)观测值。次左右)观测值。对第对第i个决策者重复观测个决策者重复观测ni次,选择次,选择yi=1的次数比例为的次数比例为pi,那么可以将那么可以将pi作为真实概率作为真实概率Pi的一个估计量。的一个估计量。建立建立“概率单位模型概
14、率单位模型”,采用广义最小二乘法估计,采用广义最小二乘法估计。实际中并不常用。实际中并不常用。计量经济学72二元选择模型 对第对第i个决策者重复观测个决策者重复观测n次,选择次,选择yi=1的次数比例为的次数比例为pi,那么可以将那么可以将pi作为真实概率作为真实概率Pi的一个估计量。的一个估计量。定义“观测到的”概率单位 计量经济学72二元选择模型 V的观测值通过求解标准正态分布的概率分布函数的反函数的观测值通过求解标准正态分布的概率分布函数的反函数得到得到 实际观测得到的 计量经济学72二元选择模型四、二元四、二元LogitLogit离散选择模型及其参数离散选择模型及其参数估计估计计量经济
15、学72二元选择模型1 1、逻辑分布的概率分布函数、逻辑分布的概率分布函数 计量经济学72二元选择模型B Brsch-Supanrsch-Supan于于19871987年指出年指出:如果选择是按照效用最大化而进行的,具有极限如果选择是按照效用最大化而进行的,具有极限值的逻辑分布是较好的选择,这种情况下的二元值的逻辑分布是较好的选择,这种情况下的二元选择模型应该采用选择模型应该采用Logit模型。模型。计量经济学72二元选择模型2 2、重复观测值不可以得到情况下二元、重复观测值不可以得到情况下二元logitlogit离散选择模型的参数估计离散选择模型的参数估计 关于参数的非线性函数,不能直接求解,
16、需采用关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。完全信息最大似然法中所采用的迭代方法。应用计量经济学软件。应用计量经济学软件。计量经济学72二元选择模型计量经济学72二元选择模型计量经济学72二元选择模型计量经济学72二元选择模型Probit0.9999991.0000000.4472330.000000计量经济学72二元选择模型3 3、重复观测值可以得到情况下二元、重复观测值可以得到情况下二元logitlogit离离散选择模型的参数估计散选择模型的参数估计 思路思路 对每个决策者有多个重复(例如对每个决策者有多个重复(例如10次左右)观测值。次左右)观测
17、值。对第对第i个决策者重复观测个决策者重复观测ni次,选择次,选择yi=1的次数比例为的次数比例为pi,那么可以将那么可以将pi作为真实概率作为真实概率Pi的一个估计量。的一个估计量。建立建立“对数成败比例模型对数成败比例模型”,采用广义最小二乘法估,采用广义最小二乘法估计计。实际中并不常用。实际中并不常用。计量经济学72二元选择模型 用样本重复观测得到的用样本重复观测得到的pi构成构成“成败比例成败比例”,取对数并进,取对数并进行台劳展开,有行台劳展开,有 逻辑分布的概率分布函数 计量经济学72二元选择模型五、二元离散选择模型的检验五、二元离散选择模型的检验计量经济学72二元选择模型1 1、
18、计量经济学模型中的两类检验统计量、计量经济学模型中的两类检验统计量 基于基于LSLS R2 总体显著性总体显著性F检验检验 约束回归的约束回归的F检验检验 基于基于ML Wald LR(likelihood ratio)LM(lagrange multiplier)原理相同原理相同计量经济学72二元选择模型2 2、拟合检验、拟合检验 P:样本观测值中被解释变量等于1的比例。L0:模型中所有解释变量的系数都为0时的似然函数值。LRI=1,即L=1,完全拟合。LRI=0,所有解释变量完全不显著,完全不拟合。计量经济学72二元选择模型LnL=1.639954LnL0=52.80224LRI=0.96
19、8942计量经济学72二元选择模型3 3、省略变量检验、省略变量检验 经典模型中采用的变量显著性经典模型中采用的变量显著性t检验仍然是有效的。检验仍然是有效的。如果省略的变量与保留的变量不是正交的,那么如果省略的变量与保留的变量不是正交的,那么对参数估计量将产生影响,需要进一步检验这种对参数估计量将产生影响,需要进一步检验这种省略是否恰当。省略是否恰当。计量经济学72二元选择模型如果X2中的变量省略后对参数估计量没有影响,那么H1和H0情况下的对数最大似然函数值应该相差不大,此时LR统计量的值很小,自然会小于临界值,不拒绝 H0。计量经济学72二元选择模型 检验步骤检验步骤 首先进行约束模型的
20、估计首先进行约束模型的估计 选择系数检验选择系数检验 引入省略的变量引入省略的变量 判断判断计量经济学72二元选择模型省略CC,只保留CM,估计模型计量经济学72二元选择模型选择”Omitted Variables-LR Test”计量经济学72二元选择模型引入CC计量经济学72二元选择模型拒绝CC系数为0的0假设计量经济学72二元选择模型4、异方差性检验、异方差性检验 截面数据样本,容易存在异方差性。截面数据样本,容易存在异方差性。假定异方差结构为:假定异方差结构为:采用采用LM检验检验将解释变量分为两类,Z为只与个体特征有关的变量。显然异方差与这些变量相关。将异方差检验问题变为一个约束检验
21、问题计量经济学72二元选择模型 一般都存在异方差。不检验,采用White修正进行估计计量经济学72二元选择模型计量经济学72二元选择模型5、分布检验、分布检验 检验关于分布的假设(检验关于分布的假设(probit、logit)。一般不进行该项检验。一般不进行该项检验。具体见相关教科书(具体见相关教科书(Greene,P682)。)。计量经济学72二元选择模型:模型1的参数,:模型2的参数。组合模型的似然函数:构造LM统计量,如果不拒绝0假设,表明模型1是适当的。计量经济学72二元选择模型6 6、回代检验、回代检验 当二元离散选择模型被估计后,将所有样本的解释变当二元离散选择模型被估计后,将所有
22、样本的解释变量观测值代入模型,计算得到每个样本的被解释变量量观测值代入模型,计算得到每个样本的被解释变量选择选择1的概率,与每个样本被解释变量的实际观测值进的概率,与每个样本被解释变量的实际观测值进行比较,以判断模型的预测(回代)效果,是一种实行比较,以判断模型的预测(回代)效果,是一种实际有效的模型检验方法。际有效的模型检验方法。概率阈值概率阈值 朴素选择:朴素选择:p=0.5(1、0的样本相当时)的样本相当时)先验选择:先验选择:p=(选(选1的样本数的样本数/全部样本)(全样本全部样本)(全样本时)时)最优阈值:犯第一类错误最小原则最优阈值:犯第一类错误最小原则计量经济学72二元选择模型
23、例例7.2.2 朴素选择,即以朴素选择,即以0.5为阈值:除了为阈值:除了2个样本外,个样本外,所有样本都通过了回代检验。所有样本都通过了回代检验。先验选择,即以选择先验选择,即以选择1的样本的比例的样本的比例0.41为阈为阈值:除了值:除了1个样本外,所有样本都通过了回代个样本外,所有样本都通过了回代检验。检验。计量经济学72二元选择模型实例实例财务欺诈识别模型财务欺诈识别模型 我国上市公司财务欺诈识别模型我国上市公司财务欺诈识别模型 样本:年度报告审计意见为样本:年度报告审计意见为“无法发表意见无法发表意见”或者或者“证监会立案调查证监会立案调查”等公司属于财务欺诈等公司属于财务欺诈样本;
24、年度报告审计意见为样本;年度报告审计意见为“标准无保留意见标准无保留意见”和财务报表满足和财务报表满足“利润利润现金流量现金流量0”的公司的公司属于配对样本。属于配对样本。解释变量:开始选择解释变量:开始选择11个财务指标;通过个财务指标;通过T检检验,确定验,确定6个指标:资产负债率、资产毛利率、个指标:资产负债率、资产毛利率、资产周转率、营运资金比率、应收账款周转率、资产周转率、营运资金比率、应收账款周转率、经营活动现金流量经营活动现金流量/资产额。资产额。计量经济学72二元选择模型 样本:财务欺诈公司样本:财务欺诈公司30,非财务欺诈公司,非财务欺诈公司30 采用犯第一类错误最小原则确定最优阈值为采用犯第一类错误最小原则确定最优阈值为0.68 欺诈样本中,欺诈样本中,p0.68,25个,占个,占83.3%2022-8-16计量经济学72二元选择模型