1、第第5 5节节 定性选择模型定性选择模型二元选择模型二元选择模型 Models with Discrete Dependent VariablesBinary Choice Model一、社会经济生活中的二元选择问题一、社会经济生活中的二元选择问题 二、二元离散选择模型二、二元离散选择模型 三、二元三、二元ProbitProbit离散选择模型及其参数估计离散选择模型及其参数估计 四、二元四、二元LogitLogit离散选择模型及其参数估计离散选择模型及其参数估计 五、二元离散选择模型的检验五、二元离散选择模型的检验 说明说明 离散被解释变量数据计量经济学模型(离散被解释变量数据计量经济学模型(
2、Models with Discrete Dependent Variables)和离散选择)和离散选择模型模型(DCM,Discrete Choice Model)的区别。的区别。二元选择模型二元选择模型(Binary Choice Model)和多元选择和多元选择模型模型(Multiple Choice Model)。本节只介绍二元选择模型。本节只介绍二元选择模型。离散选择模型起源于离散选择模型起源于FechnerFechner于于18601860年进行的动物年进行的动物条件二元反射研究。条件二元反射研究。19621962年,年,WarnerWarner首次将它应用于经济研究领域,首次将它
3、应用于经济研究领域,用以研究公共交通工具和私人交通工具的选择问用以研究公共交通工具和私人交通工具的选择问题。题。7070、8080年代,离散选择模型被普遍应用于经济布年代,离散选择模型被普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。等经济决策领域的研究。模型的估计方法主要发展于模型的估计方法主要发展于8080年代初期。年代初期。一、社会经济生活中的二元选择问题一、社会经济生活中的二元选择问题 研究选择结果与影响因素之间的关系。研究选择结果与影响因素之间的关系。选择结果:选择结果:0 0、1 1影响选择结果的因素包括两部
4、分:影响选择结果的因素包括两部分:决策者的属性决策者的属性和和备备选方案的属性选方案的属性。两种方案的选择两种方案的选择由由决策者的属性决策者的属性和和备选方案的属性备选方案的属性共同决定。共同决定。例如,选择利用公共交通工具还是私人交通工具,取例如,选择利用公共交通工具还是私人交通工具,取决于两类因素。一类是公共交通工具和私人交通工具决于两类因素。一类是公共交通工具和私人交通工具所具有的属性,诸如速度、耗费时间、成本等;一类所具有的属性,诸如速度、耗费时间、成本等;一类是决策个体所具有的属性,诸如职业、年龄、收入水是决策个体所具有的属性,诸如职业、年龄、收入水平、健康状况等。平、健康状况等。
5、从大量的统计中,可以发现选择结果与影响因素之间从大量的统计中,可以发现选择结果与影响因素之间具有一定的因果关系。具有一定的因果关系。单个方案的取舍单个方案的取舍一般由一般由决策者的属性决策者的属性决定。决定。例如,对某种商品的购买决策问题。决定购买与否,例如,对某种商品的购买决策问题。决定购买与否,取决于两类因素。一类是该商品本身所具有的属性,取决于两类因素。一类是该商品本身所具有的属性,诸如性能、价格等;一类是消费者个体所具有的属性,诸如性能、价格等;一类是消费者个体所具有的属性,诸如收入水平、对该商品的偏好程度等。诸如收入水平、对该商品的偏好程度等。对于所有的决策者,商品本身所具有的属性是
6、相同的,对于所有的决策者,商品本身所具有的属性是相同的,在模型中一般不予体现。在模型中一般不予体现。二、二元离散选择模型二、二元离散选择模型1 1、原始模型、原始模型 对于二元选择问题,可以建立如下计量经济学模对于二元选择问题,可以建立如下计量经济学模型。其中型。其中Y为观测值为为观测值为1和和0的决策被解释变量;的决策被解释变量;X为解释变量,包括选择对象所具有的属性和选择为解释变量,包括选择对象所具有的属性和选择主体所具有的属性。主体所具有的属性。YXyiXii0)(iEiX)(iyEiiiipyPyPyE)0(0)1(1)(E yP yii()()1Xi)0(1)1(iiiiyPpyPp
7、左右端矛盾左右端矛盾 由于存在这两方面的问题,主要是模型左右端矛由于存在这两方面的问题,主要是模型左右端矛盾问题,导致:盾问题,导致:原始模型不能作为实际研究二元选择问题的模型。原始模型不能作为实际研究二元选择问题的模型。需要将原始模型变换为效用模型。一般教科书称为潜需要将原始模型变换为效用模型。一般教科书称为潜变量模型变量模型(Latent Variable Model)。)。这是离散选择模型的关键。这是离散选择模型的关键。iiiyy1101XXXXiiii当,其概率为当,其概率为具有异具有异方差性方差性 2 2、效用模型、效用模型 作为研究对象的二元选择模型作为研究对象的二元选择模型Uii
8、i11X1Uiii000X UUiiiii1010X10()()yii*Xi第第i个个体个个体 选择选择1的效用的效用第第i个个体个个体 选择选择0的效用的效用P yP yPiii()()()*10Xi 注意:注意:在效应模型中,被解释变量是不可观测的潜变量,人在效应模型中,被解释变量是不可观测的潜变量,人们能够得到的观测值仍然是选择结果,即们能够得到的观测值仍然是选择结果,即1和和0。很显然,如果不可观测的很显然,如果不可观测的U1U0,即对应于观测值为,即对应于观测值为1,因为该个体选择公共交通工具的效用大于选择私人交因为该个体选择公共交通工具的效用大于选择私人交通工具的效用,他当然要选择
9、公共交通工具;通工具的效用,他当然要选择公共交通工具;相反,如果不可观测的相反,如果不可观测的U1U0,即对应于观测值为,即对应于观测值为0,因为该个体选择公共交通工具的效用小于选择私人交因为该个体选择公共交通工具的效用小于选择私人交通工具的效用,他当然要选择私人交通工具。通工具的效用,他当然要选择私人交通工具。OLS不能用于效用模型的估计。不能用于效用模型的估计。3 3、最大似然估计最大似然估计 欲使得效用模型可以采用欲使得效用模型可以采用ML估计,就必须为随机估计,就必须为随机误差项选择一种特定的概率分布。误差项选择一种特定的概率分布。两种最常用的分布是标准正态分布和逻辑两种最常用的分布是
10、标准正态分布和逻辑(logistic)分布,于是形成了两种最常用的二元)分布,于是形成了两种最常用的二元选择模型选择模型Probit模型模型和和Logit模型模型。最大似然函数及其估计过程如下:最大似然函数及其估计过程如下:FtF t()()1P yP yPPFFiiii()()()()()()*1011XXXXiiiiP yyyFFnyyii(,)()()12011XXiiLFFin()()XXiyi1yii11标准正态分布或逻标准正态分布或逻辑分布的对称性辑分布的对称性似然函数ln(ln()()ln()LyFyFiiinXXii111ln()()Ly fFyfFiiiiiiin111X0i
11、 在样本数据的支持下,如果知道概率分布函数在样本数据的支持下,如果知道概率分布函数和概率密度函数,求解该方程组,可以得到模和概率密度函数,求解该方程组,可以得到模型参数估计量。型参数估计量。1阶极值条件三、二元三、二元ProbitProbit离散选择模型及其参数离散选择模型及其参数估计估计1 1、标准正态分布的概率分布函数、标准正态分布的概率分布函数 F txdxt()()exp()22122f xx()()exp()221222 2、重复观测值不可以得到情况下二元、重复观测值不可以得到情况下二元ProbitProbit离散选择模型的参数估计离散选择模型的参数估计 ln()()LfFfFq f
12、 qF qiiyiiiyiiiiiiniinii10111XXXXXX0iiiqyii21 关于参数的非线性函数,不能直接求解,需采用关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。完全信息最大似然法中所采用的迭代方法。应用计量经济学软件。应用计量经济学软件。这里所谓这里所谓“重复观测值不可以得到重复观测值不可以得到”,是指对每,是指对每个决策者只有一个观测值。如果有多个观测值,个决策者只有一个观测值。如果有多个观测值,也将其看成为多个不同的决策者。也将其看成为多个不同的决策者。3 3、例题:贷款决策模型、例题:贷款决策模型 分析与建模:分析与建模:某商业银行从
13、历史贷款客户中随机抽取某商业银行从历史贷款客户中随机抽取78个样本,根个样本,根据设计的指标体系分别计算它们的据设计的指标体系分别计算它们的“商业信用支持度商业信用支持度”(XY)和)和“市场竞争地位等级市场竞争地位等级”(SC),对它们贷款),对它们贷款的结果(的结果(JG)采用二元离散变量,)采用二元离散变量,1表示贷款成功,表示贷款成功,0表示贷款失败。目的是研究表示贷款失败。目的是研究JG与与XY、SC之间的关系,之间的关系,并为正确贷款决策提供支持。并为正确贷款决策提供支持。样样本本观观测测值值 选择选择Probit模型模型 估计结果估计结果 输出的估计结果输出的估计结果该方程表示:
14、该方程表示:当当XY和和SC已知时,代入方程,可以计算贷已知时,代入方程,可以计算贷款成功的概率款成功的概率JGF。例如,将表中第。例如,将表中第19个样本观测值个样本观测值XY=15、SC=1代入方程右边,计算括号内的值为代入方程右边,计算括号内的值为0.1326552;查标准正态分布表,对应于;查标准正态分布表,对应于0.1326552的累积的累积正态分布为正态分布为0.5517;于是,;于是,JG的预测值的预测值JGF=10.5517=0.4483,即对应于该客户,贷款成功的概率为,即对应于该客户,贷款成功的概率为0.4483。正确解读该结果十分重要正确解读该结果十分重要 讨论:讨论:能
15、否说能否说“当市场竞争地位等级提高当市场竞争地位等级提高1,给该企业贷款成,给该企业贷款成功的概率提高功的概率提高5.062”?不能。为什么?不能。为什么?能否说能否说“对于不同的企业,当市场竞争地位等级都提对于不同的企业,当市场竞争地位等级都提高高1,给这些企业贷款成功的概率所提高的幅度是相同,给这些企业贷款成功的概率所提高的幅度是相同的的”?不能。为什么?不能。为什么?模拟预测模拟预测 预测:预测:如果有一个新客户,根据客户资料,计算如果有一个新客户,根据客户资料,计算的的“商业信用支持度商业信用支持度”(XY)和)和“市场竞争地位市场竞争地位等级等级”(SC),代入模型,就可以得到贷款成
16、功),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。的概率,以此决定是否给予贷款。4 4、重复观测值可以得到情况下二元、重复观测值可以得到情况下二元ProbitProbit离离散选择模型的参数估计散选择模型的参数估计 思路思路 对每个决策者有多个重复(例如对每个决策者有多个重复(例如10次左右)观测值。次左右)观测值。对第对第i个决策者重复观测个决策者重复观测ni次,选择次,选择yi=1的次数比例为的次数比例为pi,那么可以将那么可以将pi作为真实概率作为真实概率Pi的一个估计量。的一个估计量。建立建立“概率单位模型概率单位模型”,采用广义最小二乘法估计,采用广义最小二乘法估计。实
17、际中并不常用。实际中并不常用。对第对第i个决策者重复观测个决策者重复观测n次,选择次,选择yi=1的次数比例为的次数比例为pi,那么可以将那么可以将pi作为真实概率作为真实概率Pi的一个估计量。的一个估计量。pPeFeiiii()XiE eVar eppniiiii()()()01vFpFPeiiii11()()FPeFPef FPiiiii111()()()vFPuiii1()E uVar uPPnfFPiiiiii()()()()0112定义“观测到的”概率单位 V的观测值通过求解标准正态分布的概率分布函数的反函数的观测值通过求解标准正态分布的概率分布函数的反函数得到得到 vuiiXVXU
18、iFPi1()Xi()XXXV111iiFP)(iXptdtivi()exp()22122实际观测得到的 四、二元四、二元LogitLogit离散选择模型及其参数离散选择模型及其参数估计估计1 1、逻辑分布的概率分布函数、逻辑分布的概率分布函数 F tet()11f teett()()12F teettt()()1f teetttt()()()()1122 2、重复观测值不可以得到情况下二元、重复观测值不可以得到情况下二元logitlogit离散选择模型的参数估计离散选择模型的参数估计 关于参数的非线性函数,不能直接求解,需采用关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采
19、用的迭代方法。完全信息最大似然法中所采用的迭代方法。应用计量经济学软件。应用计量经济学软件。ln()()()Ly fFyfFyiiiiiiiniin1111XXX0iii3 3、重复观测值可以得到情况下二元、重复观测值可以得到情况下二元logitlogit离离散选择模型的参数估计散选择模型的参数估计 思路思路 对每个决策者有多个重复(例如对每个决策者有多个重复(例如10次左右)观测值。次左右)观测值。对第对第i个决策者重复观测个决策者重复观测ni次,选择次,选择yi=1的次数比例为的次数比例为pi,那么可以将那么可以将pi作为真实概率作为真实概率Pi的一个估计量。的一个估计量。建立建立“对数成
20、败比例模型对数成败比例模型”,采用广义最小二乘法估,采用广义最小二乘法估计计。实际中并不常用。实际中并不常用。用样本重复观测得到的用样本重复观测得到的pi构成构成“成败比例成败比例”,取对数并进,取对数并进行台劳展开,有行台劳展开,有 ln()ln()()ppPPePPiiiiiii111F tet()11F tF tet()()1 iXePPii1ln()ln()ppeuuiiiiii1XXvuiiXVXUi()XXXV111逻辑分布的概率分布函数 五、二元离散选择模型的检验五、二元离散选择模型的检验1 1、拟合检验、拟合检验 P:样本观测值中被解释变量等于1的比例。L0:模型中所有解释变量
21、的系数都为0时的似然函数值。LRI=1,即L=1,完全拟合。LRI=0,所有解释变量完全不显著,完全不拟合。0lnln1LLLRI)1ln()1(ln(ln0PPPPnLLnL=1.639954LnL0=52.80224LRI=0.9689422 2、总体显著性检验总体显著性检验 例中,例中,lnL=1.639954,lnL0=52.80224,LR=102.3246。20.01(2)=9.21。可见,在可见,在0.01的显著水平上,该模型拒绝总体不的显著水平上,该模型拒绝总体不显著的显著的0假设。假设。012:0kHL)()ln(ln220kLLLR3、异方差性检验、异方差性检验 截面数据样
22、本,容易存在异方差性。截面数据样本,容易存在异方差性。假定异方差结构为:假定异方差结构为:2)(exp(),Var(ZZX0:0H 采用采用LM检验检验将解释变量分为两类,Z为只与个体特征有关的变量。显然异方差与这些变量相关。将异方差检验问题变为一个约束检验问题 由于一般都存在异方差,不检验,直接采用由于一般都存在异方差,不检验,直接采用White修正进行估计修正进行估计4、分布检验、分布检验 检验关于分布的假设(检验关于分布的假设(probit、logit)。一般不进行该项检验。一般不进行该项检验。具体见相关教科书(具体见相关教科书(Greene,P682)。)。:模型1的参数,:模型2的参
23、数。组合模型的似然函数:zdzXzLXzLXyLXyLL11),(),()1(),(),()1(21210:0:10HH构造LM统计量,如果不拒绝0假设,表明模型1是适当的。5 5、回代检验、回代检验 概率阈值概率阈值 朴素选择:朴素选择:p=0.5(1、0的样本相当时)的样本相当时)先验选择:先验选择:p=(选(选1的样本数的样本数/全部样本)(全样本全部样本)(全样本时)时)最优阈值:犯第一类错误最小原则最优阈值:犯第一类错误最小原则 如果按照朴素原则如果按照朴素原则,例中,除了,例中,除了2个样本外,所个样本外,所有样本都通过了回代检验。没有通过回代检验的有样本都通过了回代检验。没有通过
24、回代检验的2个样本中,第个样本中,第19个样本的选择结果为个样本的选择结果为1,回代算,回代算得的选择得的选择1的概率为的概率为0.4472;第;第45个样本的选择个样本的选择结果为结果为0,回代算得的选择,回代算得的选择1的概率的概率0.5498。但是,该例中,选择但是,该例中,选择1和选择和选择0的样本数目分别为的样本数目分别为32和和46,差异较大,不适合采用该方法。,差异较大,不适合采用该方法。如果按照先验方法如果按照先验方法,即以全部样本中选择,即以全部样本中选择1的样的样本所占的比例为临界值。例中,选择本所占的比例为临界值。例中,选择1的样本的的样本的比例为比例为0.41。以此为临
25、界值,只有第。以此为临界值,只有第45个样本不个样本不能通过检验。能通过检验。但是,该方法适合于以全部个体作为样本的情况,但是,该方法适合于以全部个体作为样本的情况,而该例中的而该例中的78个样本仅是贷款客户的极少部分,个样本仅是贷款客户的极少部分,所以也不适合采用该方法。所以也不适合采用该方法。如果按照最优方法如果按照最优方法,即以,即以“犯第一类错误最小犯第一类错误最小”为原则确定临界值的方法。在例中,如果以为原则确定临界值的方法。在例中,如果以0.50为临界值,则有为临界值,则有2个样本发生个样本发生“弃真弃真”,即犯第,即犯第一类错误;如果以一类错误;如果以0.41为临界值,则发生为临
26、界值,则发生“弃真弃真”的样本只有的样本只有1个。所以以个。所以以0.41作为临界值比较合适。作为临界值比较合适。其它实例其它实例财务欺诈识别模型财务欺诈识别模型 建立我国上市公司财务欺诈识别模型建立我国上市公司财务欺诈识别模型 样本:年度报告审计意见为样本:年度报告审计意见为“无法发表意见无法发表意见”或者或者“证监会立案调查证监会立案调查”等公司属于财务欺诈样本;年等公司属于财务欺诈样本;年度报告审计意见为度报告审计意见为“标准无保留意见标准无保留意见”和财务报表和财务报表满足满足“利润利润现金流量现金流量0”的公司属于配对样本。的公司属于配对样本。解释变量:开始选择解释变量:开始选择11
27、个财务指标;通过个财务指标;通过T检验,检验,确定确定6个指标:资产负债率、资产毛利率、资产周个指标:资产负债率、资产毛利率、资产周转率、营运资金比率、应收账款周转率、经营活动转率、营运资金比率、应收账款周转率、经营活动现金流量现金流量/资产额。资产额。样本:财务欺诈公司样本:财务欺诈公司30,非财务欺诈公司,非财务欺诈公司30 采用犯第一类错误最小原则确定最优阈值为采用犯第一类错误最小原则确定最优阈值为0.68 欺诈样本中,欺诈样本中,p0.68,25个,占个,占83.3%其它实例其它实例上市公司并购上市公司并购 被解释变量:当年发生并购行为为被解释变量:当年发生并购行为为1,反之为,反之为0。解释变量:净利润率、解释变量:净利润率、,全流通虚变量。,全流通虚变量。试图研究全流通都并购的影响。试图研究全流通都并购的影响。样本:样本:1994-2008上市公司,并购样本上市公司,并购样本731,非并,非并购样本购样本9835。采用先验原则,采用先验原则,P=5%模拟结果:模拟结果:并购样本中:并购样本中:p5%占占53%非并购样本中:非并购样本中:p5%占占72%