1、数据包络分析及应用MG1314029周换换周换换2022-8-61参考书目1魏权龄 著.数据包络分析.北京:科学出版社.20042吴文江 著.数据包络分析及其应用.北京:中国统计出版社.20023段永瑞 著.数据包络分析-理论和应用.上海:上海科学普及出版社.20064吴丽丽.基于数据包络分析_DEA_的高等院校规模有效性分析_2006.2022-8-622022-8-63报告大纲1 背景知识介绍 1.1 定义 1.2 相关术语 1.3 主要应用领域2 主要模型介绍 2.1 第一个模型C2R模型 2.2 BC2模型3 应用举例 高等院校规模有效性分析1 背景知识介绍2022-8-641.1 定
2、义1.2 相关术语1.3 主要应用领域2022-8-65企业管理者如何评估一所快餐分销店、银行支行、健康诊所或初等学校的生产力?衡量生产力有三重困难:第一,什么是系统适当的投入(如劳动力时间、材料金额)及其度量方法?第二,什么是系统适当的产出(如现金支票、存款凭证)及其度量方法?第三,正确衡量这些投入产出之间关系的方法是什么?Question Answer 数据包络分析数据包络分析(data envelopment analysis)简称DEA,是数学、运筹学、数理经济学和管理科学的一个新的交叉领域。它是由A.Charnes和W.W.Cooper等人于1978年开始创建,并被命名为DEA。20
3、22-8-66定义2022-8-67l在生产活动和社会活动中经常会遇到这样的问题:在经过一段时间后需要对同类的部门或单位进行评价,其中每个部门或单位称为决策单元(决策单元(Decision Making Units,DMU)。评价的依据,一种是它在活动中需要消耗的量,所谓输入指标(输入指标(input),),另一种是表明该活动的成效的量,所谓输出指标输出指标(output)。根据多个输入指标和多个输出指标的数据,要评价相对于所给的诸决策单元的优劣,这就是评价决策单元间的相对有效性相对有效性(称为DEA有效有效)。例如:例如:要对若干个建筑卫生陶瓷企业的经济效益进行评价,每个企业就是一个决策单元
4、决策单元。输入指标输入指标:l 产品工厂总成本l 全部职工年平均人数l 全年标准煤总耗量输出指标输出指标:l 卫生陶瓷产量墙地砖产量l 釉面砖产量l 陶瓷锦砖产量最终,根据这些输入、输出指标来评价这些决策单元(企业)的优劣。也就是评价决策单元间的相对有效性。2022-8-682022-8-69经济系统的相对有效性l 情况1(产出):一个经济系统如果有可能增加其中某一产出的数量而不增加任何投入也不减少任何其他产出,那么我们认为这个系统就不是有效的。l 情况2(投入):一个经济系统如果有可能减少其中某一投入的数量而不增加任何其他投入也不减少任何产出,那么我们认为这个系统不是有效的。一个经济系统,当
5、且仅当既不出现情况1也不出现情况2时,我们认为这个系统是有效的。作用衡量服务生产力l从工程学角度看,衡量组织的生产力和衡量系统的效率相似。它可以表述为产出和投入的比率。l它避开了计算每项服务的标准成本,因为它可以把多种投入和多种产出转化为效率比率的分子和分母,而不需要转换成相同的货币单位。因此,用DEA衡量效率可以清晰地说明投入和产出的组合,从而,它比一套经营比率或利润指标更具有综合性并且更值得信赖。2022-8-610关于DEA模型的基本定理l 存在性定理:至少存在一个决策单元,它是DEA有效的。l 有效性与量纲选取无关定理:决策单元的DEA有效性与输入和输出量纲的选取无关。l 有效性与DM
6、U同倍“增长”无关定理:决策单元的DEA有效性与决策单元对应的输入和输出同倍“增长”无关。2022-8-611生产前沿面l 生产前沿面实际上是指由观察到的决策单元的输入数据和输出数据的包络面的有效部分,这也是称谓“数据包络分析”的原因所在。l 决策单元为DEA有效,也即相应于生产可能集生产可能集而言,以投入最小、产出最大为目标的Pareto最优。因此,生产前沿面即为Pareto面(Pareto最优点构成的面)。2022-8-612技术有效与规模有效l 技术有效:输出相对输入而言已达最大,即该决策单元位于生产函数的曲线上。(其实这就是前面一直提到的相对有效性,注意,技术有效于纯技术有效是不同的,
7、有文献指出,技术效率等于纯技术效率与规模效率的乘积)l 规模有效:指投入量既不偏大,也不过小,是介于规模收入收益由递增到递减之间的状态,即处于规模收益不变的状态。2022-8-613f(kX)kf(X):即规模收益递增;即规模收益递增;f(kX)=kf(X):即规模收益不变;即规模收益不变;f(kX)0;0;y yrj rj=DMUjDMUj对第对第r r种输出的产出量,种输出的产出量,y yrj rj0;0;v vi i=对第对第i i种输入的一种度量(或称权);种输入的一种度量(或称权);u ur r=对第对第r r种输出的一种度量(或称权),种输出的一种度量(或称权),i i=1,2,=
8、1,2,m;j=1,2,n;r=1,2,m;j=1,2,n;r=1,2,,s.s.2022-8-618l 设某个设某个DMUDMU在一项生产活动中的输入向量在一项生产活动中的输入向量为为 ,输出向量为输出向量为 。我们可以用(我们可以用(x x,y y)来表示这个)来表示这个DMUDMU的整个生产活动。的整个生产活动。l 现设有现设有n n个个DMUDMUj j(1jn1jn),),DMUDMUj j对应的输入、输对应的输入、输出向量分别为:出向量分别为:2022-8-619Tmxxxx,21syyyy,21njxxxxTmjjjj,2,1,0,21njyyyyTsjjjj,2,1,0,21l
9、 v v和和u u分别为与分别为与m m种投入和种投入和s s种输出对应的权向量:种输出对应的权向量:v=(v1,v2,vm)T,u=(u1,u2,us)T。l 每个决策单元每个决策单元DMUDMUj j都有相应的效率评价都有相应的效率评价指数,我们可以适当的取权系数指数,我们可以适当的取权系数v v和和u u,使得使得 h hj j1 1。2022-8-620njxvyuxvyuhmiijisrrjrjTjTj,2,111l 现在,对第现在,对第j j0 0个决策单元进行效率评价。一个决策单元进行效率评价。一般来说,般来说,越大,表明越大,表明 能够用相对较少能够用相对较少的输入而得到相对较
10、多的输出。如果我们的输入而得到相对较多的输出。如果我们要对要对 进行评价,看进行评价,看 在这在这n n个个DMUDMU中相对来说是不是最优的。我们可以考察中相对来说是不是最优的。我们可以考察当尽可能地变化权重时,当尽可能地变化权重时,的最大值究竟是的最大值究竟是多少。以第多少。以第j j0 0个决策单元的效率指数为目标,个决策单元的效率指数为目标,以所有决策单元(含第以所有决策单元(含第j j0 0个决策单元)的效个决策单元)的效率指数为约束,就构造如下的率指数为约束,就构造如下的C C2 2R R模型:模型:2022-8-621ojhojh0jDMU0jDMU0jDMUmiijisrrjr
11、jxvyuh11000maxnjxvyutsmiijisrrjr,2,11.110,21Tmvvvv0,21TsuuuuRC2222022-8-6模型模型:l 原始的C2R模型是一个分式规划问题,使用Charnes-Cooper变换可将其化为一个等价的线性规划的形式。为此,即令:l 则可得到C2R的的线性规划模型:2022-8-62301xvtttvtu 001,2,10.max000 xnjyxtsyhPTjTjTTj11(0),njjjl 现在,现在,我们考虑的我们考虑的C C2 2R R的另外一种形式的另外一种形式:如果要衡量某如果要衡量某一决策单元一决策单元j j0 0是否是否DEAD
12、EA有效,即是否处在由包络线组成有效,即是否处在由包络线组成的生产前沿面上,的生产前沿面上,为此先构造一个有为此先构造一个有n n个决策单元线性个决策单元线性组合成的假想决策单元。这个假想决策单元的第组合成的假想决策单元。这个假想决策单元的第i i项投项投入为入为 且且 该假想该假想决策单元的第决策单元的第r r项产出为项产出为 且且1(1,2,.,)njijjx im11(0),njjj242022-8-61(1,2,.)njrjjyrs 如果这个假想的决策单元的各项产出均不低于如果这个假想的决策单元的各项产出均不低于j j0 0决决策单元的各项产出,它的各项投入均低于策单元的各项产出,它的
13、各项投入均低于j j0 0的各项的各项投入投入(当当 11时时),即有,即有 这说明这说明j j0 0决策单元不在生产前沿面上。决策单元不在生产前沿面上。01011,(1,2,.),(1,2,.,1)1,0,(1,2,.)njrjrjjnjijijjnjjjyyrsxximjn252022-8-6l 基于上述,可以写出如下数学模型,该式也基于上述,可以写出如下数学模型,该式也是是C C2 2R R的的对偶对偶形式:形式:min2022-8-62601011,(1,2,.).,(1,2,.,)1,0,(1,2,.)njrjrjjnjijijjnjjjyyrsstxximjn当求解结果有当求解结果
14、有 11,则决策单元,则决策单元j j0 0非非DEADEA有效,否则,有效,否则,j j0 0决策单元决策单元DEADEA有效。有效。l 应用线性规划对偶理论,我们可以通过对偶规划应用线性规划对偶理论,我们可以通过对偶规划来判断来判断 的有效性。为了讨论及应用方便,进的有效性。为了讨论及应用方便,进一步引入松弛变量一步引入松弛变量s+s+和剩余变量和剩余变量s-s-,将上面的不,将上面的不等式约束变为等式约束:等式约束变为等式约束:2022-8-6270jDMU0,0,10.min0101ssnjysyxsxtsDjnjjjnjjj无约束例:四个人的输入输出见下表,试用例:四个人的输入输出见
15、下表,试用DEADEA方法分析方法分析其有效性。其有效性。2022-8-6282022-8-6292022-8-630例:某银行的四个分理处的投入和产出情况见下例:某银行的四个分理处的投入和产出情况见下表,要求分别确定各分理处的运行是否表,要求分别确定各分理处的运行是否DEADEA有效。有效。2022-8-631分理处分理处分理处分理处1分理处分理处2分理处分理处3分理处分理处4投投 入入产产 出出职工数职工数营业面积营业面积储蓄储蓄贷款贷款中间业务中间业务15202120180010008009001401301201352003504504201600100013001500解:先确定分理
16、处解:先确定分理处1是否是否DEA有效有效123412341234123412341234min18001000800900180020035045042020016001000130015001600.152021201514013012013514010jEstEE2022-8-632l 求解结果为求解结果为E=1E=1,说明分理处,说明分理处1 1的运行的运行DEADEA有效。同理可有效。同理可求得分理处求得分理处3 3和和4 4,E=1E=1,但对于分理处,但对于分理处2 2,E=0.892,E=0.892,即分即分理处理处2 2的运行非的运行非DEADEA有效。有效。检验的检验的DE
17、ADEA有效性时,可通过构造一个稍加变化有效性时,可通过构造一个稍加变化的模型可使这一检验简化。这就是具有非阿基米的模型可使这一检验简化。这就是具有非阿基米德无穷小的模型(祥见有关文献)。利用此模型德无穷小的模型(祥见有关文献)。利用此模型可以一次性判断出决策单元是可以一次性判断出决策单元是DEADEA有效,还是弱有效,还是弱DEADEA有效,或者是非有效,或者是非DEADEA有效。有效。2022-8-633非阿基米德无穷小的模型非阿基米德无穷小的模型l Banker,CharnesBanker,Charnes和和CooperCooper于于19841984年将年将C C2 2R R模型修正模
18、型修正,并将固定并将固定规模报酬的假设以变动规模报酬规模报酬的假设以变动规模报酬(variable Return scale:VRS)(variable Return scale:VRS)代替衡量技术效率代替衡量技术效率,提出提出BCBC2 2模型。模型。2022-8-634BCBC2 2模型模型l 另外,由于实际生产过程中积极活动的多样另外,由于实际生产过程中积极活动的多样性,或决策者在评价活动中的作用不同,在性,或决策者在评价活动中的作用不同,在基本模型基本模型C C2 2R R的基础上,又发展、派生出一的基础上,又发展、派生出一些新的些新的DEADEA模型。模型。如如综合DEA模型(BC
19、2、FG、ST)、锥比率的DEA模型、具有无穷多个DMU的DEA模型、模糊DEA模型等。l 这里就不赘述了。感兴趣的可这里就不赘述了。感兴趣的可以参考相关文献。以参考相关文献。2022-8-6353 应用举例2022-8-636高等院校规模有效性分析2022-8-637主要步骤主要步骤一指标选取原则二投入产出指标的确定三决策单元的选择四模型求解五分析评价结果六提出决策建议2022-8-638一、指标选取原则一、指标选取原则1)1)指标要具有时代特色指标要具有时代特色,与高校教育目标保持一致与高校教育目标保持一致2)2)指标要具有可行性指标要具有可行性3)3)指标要具有独立性指标要具有独立性4)
20、4)指标要具有整体完备性指标要具有整体完备性5)5)指标要具有可接受性指标要具有可接受性要符合我国高校的实际水平的要符合我国高校的实际水平的,从实际出发提出从实际出发提出的指标才是可接受的。的指标才是可接受的。2022-8-639二、投入产出指标的确定二、投入产出指标的确定1 1、投入结构分析、投入结构分析高等院校的产出有三种形式高等院校的产出有三种形式,即直接产出即直接产出、间接产出和间接产出和最终产出最终产出。2022-8-6402 2、产出结构分析、产出结构分析2022-8-6413 3、评价指标的确定、评价指标的确定2022-8-642三、决策单元的选择三、决策单元的选择 选择选择DM
21、UDMU的一个基本要求是的一个基本要求是DMUDMU的同类性的同类性,即即DMUDMU具有相同的环境、相同的输入输出和相同的任务。具有相同的环境、相同的输入输出和相同的任务。本例选取教育部直属的在江浙沪地区的本例选取教育部直属的在江浙沪地区的1616所高校所高校(如如下表所示下表所示)。教育部直属高校教育部直属高校,其资金来源较为相似其资金来源较为相似;而而且除中国矿业大学之外其它且除中国矿业大学之外其它1515所高校都处于长三角地所高校都处于长三角地区区,高校所处地区的经济也基本处于同一水平高校所处地区的经济也基本处于同一水平,因此这因此这1616个评估对象是属于同类的个评估对象是属于同类的
22、DMUDMU。2022-8-643作为评估对象的学校一览表作为评估对象的学校一览表2022-8-644决策单元的投入产出原始数据表决策单元的投入产出原始数据表2022-8-645四、模型求解四、模型求解下面主要利用下面主要利用DEAPDEAP软件进行软件进行DEADEA效率评估效率评估“通通过过DEADEA效率评估的结果效率评估的结果,可以知道受评估学校的相可以知道受评估学校的相对总体效率、纯技术效率和规模效率对总体效率、纯技术效率和规模效率,效率分析结效率分析结果如表所示。由于评价结果可能会对被评价对象果如表所示。由于评价结果可能会对被评价对象的声誉产生影响的声誉产生影响,因此评价结果中分别
23、用序号因此评价结果中分别用序号U1,U2U16U1,U2U16来表示这来表示这1616所高校。所高校。2022-8-646C C2 2R R和和BCBC2 2模型评价各高校效率值模型评价各高校效率值2022-8-647五、结果分析五、结果分析1)1)总体效率分析总体效率分析相对总体效率为相对总体效率为1 1的高校有的高校有U8U8、U11U11、U14U14、U16,U16,占占所有评估学校的所有评估学校的25%25%这这4 4所学校是其中最有效率的所学校是其中最有效率的决策单元决策单元,即其整体运作上处于最佳的状况即其整体运作上处于最佳的状况。2)纯技术效率分析纯技术效率分析纯技术效率为纯技
24、术效率为1 1的学校共有的学校共有6 6所所,说明了这说明了这6 6所学校投所学校投入资源使用是最有效率的入资源使用是最有效率的,无浪费现象无浪费现象.3)规模效率和规模报酬分析规模效率和规模报酬分析通过整体效率与技术效率的比值可求出规模效率通过整体效率与技术效率的比值可求出规模效率,规模效率越接近规模效率越接近1,1,表示规模大小越合适表示规模大小越合适,也就越接近也就越接近最适规模最适规模.2022-8-648六、提出决策建议六、提出决策建议l 松弛变量分析松弛变量分析对处于非对处于非DEADEA有效的学校提供改善的方向与建议有效的学校提供改善的方向与建议,在应用上应该将松弛变量与效率值相
25、结合进行在应用上应该将松弛变量与效率值相结合进行分析分析。即通过投入产出各项的松弛变量分析了解即通过投入产出各项的松弛变量分析了解投入与产出各项有多少改善的空间投入与产出各项有多少改善的空间,显示出各高显示出各高校目前资源的使用情况校目前资源的使用情况,同时可以得出各校需要同时可以得出各校需要改善的幅度。改善的幅度。2022-8-649基于投入的基于投入的C C2 2R R模型的松弛变量调整量建议表模型的松弛变量调整量建议表2022-8-650l 上上表将各高校调整幅度大于表将各高校调整幅度大于30%30%的指标用斜体的指标用斜体标出标出,学校决策者应该在学校今后发展过程中重学校决策者应该在学
26、校今后发展过程中重视这些指标的投入量和产出量视这些指标的投入量和产出量,从斜体部分可从斜体部分可以看出以看出,各个学校所面临的问题都是不同的各个学校所面临的问题都是不同的,影影响非有效的原因也各不相同。响非有效的原因也各不相同。l 上上表的调整建议是根据目前的产出所需要的最表的调整建议是根据目前的产出所需要的最少投入量而调整的数值少投入量而调整的数值,从从上上表可以看出表可以看出,除了除了相对有效的相对有效的4 4个参照单元个参照单元,其他其他1212个决策单元的个决策单元的投入都需要做相应的减少投入都需要做相应的减少,这说明这些高校的这说明这些高校的投入是过量的投入是过量的,或者是没有能够充
27、分的利用好投或者是没有能够充分的利用好投入的教育资源入的教育资源。2022-8-651基于产出的基于产出的C2RC2R模型的松弛变量调整量建议表模型的松弛变量调整量建议表2022-8-652l 上表的调整建议是从产出角度对各高校进行的上表的调整建议是从产出角度对各高校进行的改进改进 由于学校的固定资产和专任教师等不可能由于学校的固定资产和专任教师等不可能在短期内进行大幅度的调整在短期内进行大幅度的调整,因此充分利用现有因此充分利用现有的投入资源增加产出是高校提高规模效益的最的投入资源增加产出是高校提高规模效益的最有效途径。有效途径。l U1U1、U2U2、U4U4、U7U7、U10U10在产出
28、的调整方面需要在产出的调整方面需要加大的幅度比较大加大的幅度比较大,基本每个产出指标都需要增基本每个产出指标都需要增加加30%30%以上的调整量以上的调整量,所以学校要对目前的投入所以学校要对目前的投入产出效率给以足够的重视。产出效率给以足够的重视。2022-8-653以以U1U1为例为例 可以看出可以看出,U1,U1投入所有指标都调整了投入所有指标都调整了40%40%以上以上,这说明该高校这说明该高校相比于有效率的高校而言投入量过高相比于有效率的高校而言投入量过高,各项投入都没有得到各项投入都没有得到充分的利用充分的利用。除此之外除此之外,目前学校处于规模报酬递减的状态目前学校处于规模报酬递
29、减的状态,因此该校领因此该校领导需要审视学校运行的效率和规模效率导需要审视学校运行的效率和规模效率,及时调整管理方法及时调整管理方法充分利用现有资源而不能一味的增加投入充分利用现有资源而不能一味的增加投入。否则否则,学校的投学校的投入浪费将越来越多入浪费将越来越多,而且规模效益也只会越来越低。而且规模效益也只会越来越低。以以U9U9(南京大学)南京大学)为例为例2022-8-654变量毕业生人数量(人)Y1科研项目数Y2发表学术论文数Y3专任教师数(人)X1固定资产(万元)X2教育经费(万元)X3原始值8106.000 1724.000 2810.000 3468.000 97086.000
30、62832.990 调整幅度0.000 0.000 0.000-121.112-3390.521-2194.308 调整值0.000 0.000 315.187-368.050 0.000-15321.393 目标值8106.000 1724.000 3125.187 2978.837 93695.479 45317.290 调整百分比3.49%3.49%3.49%可以看出可以看出,南京大学南京大学投入所有指标都调整了投入所有指标都调整了3.49%,3.49%,这说明该这说明该高校投入量高校投入量稍微偏稍微偏高高,利用率虽然没有达到利用率虽然没有达到100%,100%,但利用已但利用已经比较充
31、分,比较有效经比较充分,比较有效 。除此之外除此之外,目前学校处于规模报酬递减的状态目前学校处于规模报酬递减的状态,因此该校领因此该校领导需要审视学校运行的效率和规模效率导需要审视学校运行的效率和规模效率,及时调整管理方法及时调整管理方法充分利用现有资源而不能一味的增加投入充分利用现有资源而不能一味的增加投入。否则否则,学校的投学校的投入浪费将越来越多入浪费将越来越多,而且规模效益也只会越来越低。而且规模效益也只会越来越低。2022-8-655六、总结六、总结p 综上综上,对于非对于非DEADEA有效的高等学校而言有效的高等学校而言,在调整过在调整过程中应该结合投入调整和产出调整程中应该结合投入调整和产出调整,从易于调整从易于调整的投入产出变量入手。的投入产出变量入手。p 同时在调整优化的过程中同时在调整优化的过程中,学校管理决策层需要学校管理决策层需要利用短期目标和长期目标相结合的原则利用短期目标和长期目标相结合的原则,循序渐循序渐进逐步调整。这样才能使学校在技术有效的基进逐步调整。这样才能使学校在技术有效的基础上达到规模效率最佳状态。础上达到规模效率最佳状态。