1、熵权法及其改进1 1熵权法主要内容主要内容1、背背 景景2、理理 论论3、应应用举例用举例4、软件实现软件实现5、方方法改进法改进2 2德国物理学家克劳德国物理学家克劳修斯于修斯于1856年创立年创立熵理论。熵理论。1870年玻尔兹曼发现了处于年玻尔兹曼发现了处于同能级状态的分子个数的对同能级状态的分子个数的对数值与熵值成正比。爱因斯数值与熵值成正比。爱因斯坦和普朗克也利用熵原理解坦和普朗克也利用熵原理解决科学研究中遇到的问题,决科学研究中遇到的问题,20 世纪世纪 30 年代后熵理论进入年代后熵理论进入到化学研究领域。到化学研究领域。1945 年,年,薛定谔把熵的概念运用到了生薛定谔把熵的概
2、念运用到了生物学领域中物学领域中。1948 年,申年,申农和维纳将通农和维纳将通信过程中信息信过程中信息源信号的不确源信号的不确定性称为信息定性称为信息熵。熵。20 世纪后期,熵理论进入了世纪后期,熵理论进入了科技含量较高的高新技术行科技含量较高的高新技术行业。业。一、背一、背 景景熵概念的产生熵概念的产生3 3熵原本是一热熵原本是一热力学概念,它力学概念,它最先由申农最先由申农 C.E.Shannon 引入信息论引入信息论,称之为信息熵。称之为信息熵。现已在工现已在工 程程技术,社会经技术,社会经济等领域得到济等领域得到十分广泛的应十分广泛的应用。用。申农定义的信息熵申农定义的信息熵是一个独
3、立于热力是一个独立于热力学熵的概念,学熵的概念,但具但具有热力学熵的基本有热力学熵的基本性质性质(单值性、可加单值性、可加性和极性和极 值性值性),并且,并且具有更为广泛和普具有更为广泛和普遍的意义,所以称遍的意义,所以称 为广义熵。它是熵为广义熵。它是熵概念和熵理论在非概念和熵理论在非热力学领域泛热力学领域泛 化应化应用的一个基本概念。用的一个基本概念。熵权法是一种客熵权法是一种客观赋权方法。在观赋权方法。在具体使用具体使用 过程中,过程中,熵权法根据各指熵权法根据各指标的变异程度,标的变异程度,利利 用信息熵计算用信息熵计算出各指标的熵权,出各指标的熵权,再通过熵权再通过熵权 对各对各指标
4、的权重进行指标的权重进行修正,从而得出修正,从而得出较为客较为客 观的指标观的指标权重。权重。熵权法简述熵权法简述4 4二、基本原理二、基本原理根据信息论的基本原理,信息是系统有序程度的一个度量;而熵是系统无序程度的一个度量。若系统可能处于多种不同的状态。而每种状态出现的概率为 (i=1,2,m)时,则该系统的熵就定义为:显然,当 =1/m(i=1,2,m)时,即各种状态出现的概率相同时,熵取最大值,为:现有m个待评项目,n个评价指标,形成原始评价矩阵 对于某个指标 有信息熵:imiippeln1melnmaxjrjrijmiijjppeln1miijijijrrp1/nmijrRipip其中
5、5 5从信息熵的公式可以看出从信息熵的公式可以看出:1如果某个指标的熵值越小,说明其指标值的变异程度越大,如果某个指标的熵值越小,说明其指标值的变异程度越大,提供的信息量越多,在综合评价中该指标起的作用越大,提供的信息量越多,在综合评价中该指标起的作用越大,其权重应该越大其权重应该越大121如果某个指标的熵值越大,说明其指标值的变异程度越如果某个指标的熵值越大,说明其指标值的变异程度越小,提供的信息量越少,在综合评价中起的作用越小,小,提供的信息量越少,在综合评价中起的作用越小,其权重也应越小其权重也应越小在具体应用时在具体应用时:可根据各指标值的变异程度,利用熵来计算各指标的可根据各指标值的
6、变异程度,利用熵来计算各指标的熵权,利用各指标的熵权对所有的指标进行加权,从而得熵权,利用各指标的熵权对所有的指标进行加权,从而得出较为客观的评价结果出较为客观的评价结果6 6利用熵权法计算权重利用熵权法计算权重我们将综合指标的重要性和指标提供的信息量这两方面来确定各指标的最终权重。现有m个待评项目,n个评价指标,形成原始数据矩阵 :其中 为第j个指标下第i个项目的评价值 nmijrRnmmmmmnnrrrrrrrrrrR43212222111211ijr7 7求各指标值权重的过程为求各指标值权重的过程为:(1)计算第j个指标下第i个项目的指标值的比重 :(2)计算第j个指标的熵值 :(3)计
7、算第j个指标的熵权 :ijpmiijijijrrp1jeijmiijjppkeln1mkln1jwnjjjjeew1)1()1((1)(2)(3)其中8 8(4)确定指标的综合权数 :假设评估者根据自己的目的和要求将指标重要性的权重确定为 ,j=1,2,n,结合指标的熵权 就可以得到指标j的综合权数:jjjwmiiiiijww1当各备选项目在指标j上的值完全相同时,该指标的熵达到最大值1,其熵权为零。这说明该指标未能向决策者供有用的信息,即在该指标下,所有的备选项目对决策者说是无差异的,可考虑去掉该指标。因此,熵权本身并不是表示指标的重要性系数,而是表示在该指标下对评价对象的区分度。9 9建设
8、工程质量评价三、应 用举例评标工作是否客观熵权法完全根据决策矩熵权法完全根据决策矩阵求出能代表权重的熵阵求出能代表权重的熵权,能有效规避专家主权,能有效规避专家主观判断误差对权重分析观判断误差对权重分析的影响。的影响。利用熵权法对项目建设利用熵权法对项目建设的质量进行评价,以更的质量进行评价,以更客观客观 地反映工程质量的地反映工程质量的实际情况,保证工程的实际情况,保证工程的顺利进行顺利进行.10101、基于熵权法的房地产项目建筑质量评价基于熵权法的房地产项目建筑质量评价 房地产房地产 项目建设工程的质量评项目建设工程的质量评价涉及很多内容。我们的例子是根据工价涉及很多内容。我们的例子是根据
9、工程建设质量控制的关键点,参考有关研程建设质量控制的关键点,参考有关研究资料,从安全性、适用性和协调性三究资料,从安全性、适用性和协调性三个方面建立了房地产项目建设工程质量个方面建立了房地产项目建设工程质量评价标体系。如下图评价标体系。如下图1111强强度度防防火火抗抗震震通风采采光光社社会会环环境境生生态态环环境境基基础础设设施施隔隔音音隔隔热热适用性适用性安全性安全性协调性协调性工程质量评价指标体系工程质量评价指标体系1212 邀请了有关专家对这些评价指标进行打分,结果如表邀请了有关专家对这些评价指标进行打分,结果如表 1 1 所示。该表中某一数值越大,则说明该数值对应的项目在此所示。该表
10、中某一数值越大,则说明该数值对应的项目在此指标上比其他项目更优。本例就是在表指标上比其他项目更优。本例就是在表 1 1 的基础上对各项的基础上对各项目进行分析、评价和排序的。目进行分析、评价和排序的。评价评价指标指标 强度强度 防火防火抗震抗震通风通风采光采光隔音隔音隔热隔热社会社会环境环境生态生态环境环境基础基础设施设施787886868989848486868282868682828484888887879090868689898282919180808989888885858282848485858282808086868484797980808181848481818282909090
11、9081818787848483837979表 1工程质量评价指标数据表1313评价的理论基础:理想解法综合评价的步骤理想解法综合评价的步骤1.构造加权规构造加权规范化矩阵范化矩阵 V本文将权重本文将权重 wj与目标矩阵与目标矩阵 R=(rij)mn中相对应的各中相对应的各类指标分别相乘,得到加权规范化矩阵类指标分别相乘,得到加权规范化矩阵 V。根据根据“大中取最大,小中取最小大中取最大,小中取最小”的原则,确定理想解和负理想解的原则,确定理想解和负理想解为:为:其中其中 J1代表效益型指标集合,该集合中指标值越大,表明评价对代表效益型指标集合,该集合中指标值越大,表明评价对象在该项指标上的表
12、现越好;象在该项指标上的表现越好;J2代表成本标型集合,该集合中的指代表成本标型集合,该集合中的指标值越小,表明评价对象在该项指标上的表现越好。标值越小,表明评价对象在该项指标上的表现越好。miJjviJjvVjij.,3,2,1min,max21miJjviJjvVjij.,3,2,1max,min212.确定理想确定理想解解 V+和负理和负理想解想解 V-评价对象到理想点的距离评价对象到理想点的距离 S+为为mivvsnjjiji,.,2,1,21评价对象到负理想点的距离评价对象到负理想点的距离 S-为为mivvsnjjiji,.,2,1,21评价对象与理想解的相对贴近度为评价对象与理想解
13、的相对贴近度为:).,3,2,1,10)(/(micsssiciiii根据计算出的根据计算出的 ci值对各企业的投资价值进行排序,值对各企业的投资价值进行排序,ci较大的较大的企业投资价值较优,反之,则较差。企业投资价值较优,反之,则较差。3.计算对象到理计算对象到理想解和负理想解想解和负理想解的距离的距离4.计算相对计算相对贴近度贴近度(4)(5)(6)(7)1414评价过程评价过程(1).指标数据标准化指标数据标准化因为全部的评价指标越大越好,应用公式因为全部的评价指标越大越好,应用公式(1)对指标数据进对指标数据进行标准化,结果如下所示:行标准化,结果如下所示:2372.02478.02
14、515.02582.02382.02663.02609.02398.02375.02538.02432.02388.02365.02493.02529.02367.02377.02485.02463.02477.02553.02627.02665.02374.02676.02426.02580.02515.02639.02628.02643.02507.02445.02552.02412.02544.02435.02602.02522.02356.0V=1515(2).熵权值的计算熵权值的计算将将 R 中标准化后的指标数据代入式中标准化后的指标数据代入式(2),求得各指标的,求得各指标的熵值熵
15、值ej,将熵值代入式,将熵值代入式(3),可得到各指标的熵权值,可得到各指标的熵权值 wj,结果见表结果见表 2:表 2评价指标熵值及熵权值计算结果指标指标强度强度 防火防火抗震抗震通风通风采光采光隔音隔音隔热隔热社会社会环境环境生态生态环境环境基础基础设施设施熵值熵值0.9990.9994 40.9990.9995 50.9990.9997 70.9990.9995 50.9990.9993 30.9990.9996 60.9990.9992 20.9990.9993 30.9990.9996 60.9940.994熵权熵权值值0.1010.1016 60.0950.0952 20.0550
16、.0555 50.0970.0977 70.1330.1335 50.1380.1382 20.0660.0662 20.1220.1227 70.0750.0755 50.1130.1139 91616(3).确定理想解和负理想确定理想解和负理想解解经过计算,加权规范化矩阵 V 如下:0270.00187.00309.00171.00329.00355.00255.00133.00266.00258.00277.00180.00290.00165.00350.00316.00232.00138.00235.00252.00291.00198.00327.00157.00370.00324.0
17、0252.00140.00251.00267.00301.00189.00301.00169.00333.00340.00238.00144.00240.02390.0v然后根据式(4)确定理想解和负理想解如下:V+=(0.0267,0.0266,0.0144,0.0255,0.0355,0.0370,0.0171,0.0327,0.0198,0.0301)V-=(0.0239,0.0235,0.0133,0.0232,0.0316,0.0329,0.0157,0.0290,0.0180,0.0270)1717项目项目1项目2项目3项目4S+0.00590.00360.00730.0063S-
18、0.00470.00750.00280.0055贴进度0.55660.32430.72280.5339(4).确定各企业的贴近度确定各企业的贴近度根据式(5)(6)计算出各评价企业与理想解和负理想解的距离,然后根据式(7)计算出各企业的贴近度,计算结果如表 3 所示:表 3各企业距离和贴近度根据评价准则可知,项目 3 的贴近度为 0.8644,所以其房地产项目建筑整体最好,其次为项目 1(0.5566)和项目4(0.5339),最后是项目 2(0.3243)。1818根据决策矩阵求出能根据决策矩阵求出能代表权重的熵权代表权重的熵权2.熵权法在熵权法在评标工作评标工作中的运用中的运用引入评价指标
19、,在数引入评价指标,在数据的标准化过程中引据的标准化过程中引入指标值合理区间。入指标值合理区间。1919 指标一般可分为效益型指标,成本性指标和区间型指标。应先由招标人根据工程需要确定各指标的合理区间 对区间型指标,还需确定中间最适值 ,再根据归一化函数进行归一 化。设原始数据矩阵 归一化后得到决策矩阵 评价指标的分类评价指标的分类评价指标的分类评价指标的分类2020式中:为指标下界;为指标上界;为归一化后数据;为原始数据。式中 为指标中间最适值。效益型指标效益型指标成本型指标成本型指标区间型指标区间型指标(1)(2)(3)经过(1),(2),(3)处理后即转化为决策矩阵.分别建立归一化函数分
20、别建立归一化函数:2121设有m个待评价方案,n个评价指标。根据熵的定义,指标的熵值可由式(4)求得:式中:为第j个指标的熵值,m为方案个数,n为指标个数;为使 有意义且符合熵的意义,将第j个指标的熵权 定义为将式(4)结果代入式(5),可得指标权重向量根据决策矩阵确定权重根据决策矩阵确定权重(4)(5)2222求综合评估向量求综合评估向量由式(6)对各方案的各指标值加权求和可得综合评估向量根据综合评估值 对各方案进行排序。值越大,则第i个承包商越满足项目和招标人的要求。应取值 最大的承包商为首选中标单位,值第二的承包商为备选中标单位。2323实例分析实例分析 位于福建永定县境内的棉花滩水电站
21、地下厂房项目,共有中国水电一局 ,水电九局 ,水电六局 ,水电十四局 ,水电四局 ,广东二局 6家单位参加竞标,6家单位标书初审均有效。评标专家组从商务标,技术标2个方面对标书进行评审。商务标指标为:投标价 ,流动比 ,速动比 ,资金利用比 ,预计项目流动比 ,投标单位资质 ,类似项目施工经历 。技术标指标为:施工进度 ,施工总布置 ,施工方法 ,施工机械数(凿岩台车 ,钻孔设备 ,锚杆台车 ,装载机 ,挖掘机 ,推土机 )。一共16个指标。2424原始数据 见表1.2525由招标人在项目特殊性的基础上给出各指标值合理区间,将表1数据代入式(1),(2),(3)得到决策矩阵2626由式(6)得
22、综合向量=(0.322,0.271,0.319,0.561,0.246,0.209)该模型评价结果前四名为水电十四局 ,水电一局 ,水电六局 ,水电九局 。其中水电十四局 综合评估值0.561,以绝对优势中标。水电站地下厂房主体工程评标工作组对各单位投标书及澄清资料进行认真预审,对各项参数,指标进行测算。并对此基础上对各投标单位的技术,商务等部分进行深入的分析,比较,最终以无记名方式投票推荐4个单位进入终评:水电四局,水电一局,水电六局,水电十四局因其丰富的地下工程施工经验和雄厚的人力,财力,物力最终中标。与本模型评标结果完全一致。2727 该实例分析证明,本模型能充分考虑投标该实例分析证明,
23、本模型能充分考虑投标人信息(决策矩阵)与招标人信息(指标值人信息(决策矩阵)与招标人信息(指标值合理区间),对各承包商进行全方位综合评合理区间),对各承包商进行全方位综合评价,从而能得到客观综合的评标结果。价,从而能得到客观综合的评标结果。熵权法是根据信息的离散程度为各指标赋熵权法是根据信息的离散程度为各指标赋予熵权。熵权法注重充分利用原始数据所提予熵权。熵权法注重充分利用原始数据所提供的信息,利用决策矩阵求权。本模型能更供的信息,利用决策矩阵求权。本模型能更全面地综合决策信息,帮助承包人合理选择全面地综合决策信息,帮助承包人合理选择最优承包方,具有良好的客观性,科学性。最优承包方,具有良好的
24、客观性,科学性。2828四、方法改进四、方法改进熵权法的熵权法的优缺点优缺点熵权法在具熵权法在具体例子中运体例子中运用后的改进用后的改进思考思考2929客观性相对那些主观赋值法,精度较高客观性更强,能够更好的解释所得到的结果。适应性可以用于任何需要确定权重的过程,也可以结合一些方法共同使用。熵权法的优点3030熵权法的缺点熵权法的缺点123131 目前国内建设工程项目评标常用综合评估法,运用综合评估法对技术部分和商务部分的量化结果加权求和,计算综合评估分时,权重极大地影响着评标结果。实际评标过程中,权重往往由评标委员会事先给出,极易受专家偏好的影响,进而导致评标结果客观性、科学性不足。如何合理
25、地确定各指标权重,是一个比较急切的问题。熵权法完全根据决策矩阵求出能代表权重分配的熵权,能有效规避专家主管判断误差对权重分配的影响。根据定义,指标的熵权越大,而最无序的指标并不一定是最影响工程效益的、招标人最重视的指标,因此仅用熵权法求权评标不一定能得出最合理的结果。熵权法在具体例子中运用后的改进思考熵权法在具体例子中运用后的改进思考3232 所以,这也是在应用举例中我们将熵权法和指标值合理区间所以,这也是在应用举例中我们将熵权法和指标值合理区间结合的原因,因为这样能很好地克服这一缺点。结合的原因,因为这样能很好地克服这一缺点。指标值合理区间是在多目标决策中,决策者根据相关知识、指标值合理区间
26、是在多目标决策中,决策者根据相关知识、经验等确定的指标值的合理范围。影响指标权重的因素通常被经验等确定的指标值的合理范围。影响指标权重的因素通常被归纳在决策矩阵之中,但已知信息通常比决策矩阵所包含的信归纳在决策矩阵之中,但已知信息通常比决策矩阵所包含的信息多。若忽略这些信息,局限在矩阵之中确定权重,会导致权息多。若忽略这些信息,局限在矩阵之中确定权重,会导致权重不合理。为此,只有在指标值合理区间内,对各指标值进行重不合理。为此,只有在指标值合理区间内,对各指标值进行标准化后,才能确定最合理的权重。工程项目平板过程中,决标准化后,才能确定最合理的权重。工程项目平板过程中,决策矩阵往往只能反映各投
27、标人所提供的信息,而不能反映招标策矩阵往往只能反映各投标人所提供的信息,而不能反映招标人对项目的要求。应引入指标值合理区间,全面考虑招投标双人对项目的要求。应引入指标值合理区间,全面考虑招投标双方信息,才能确定最合理的指标权重分配。方信息,才能确定最合理的指标权重分配。3333五、软件实现五、软件实现 在前面的“基于熵权法的房地产项目建筑质量评价”一例中,我们通过公式进行数据处理,但是这个过程比较繁琐和复杂,需要大量的计算量。所以我们通过VBA在EXCEL下编写宏程序使得在处理数据时彻底从手工操作中解放出来,最终达到熵值法在EXCEL中实现“傻瓜”操作的目标。具体软件演示我们仍然是采用与前面相同的例子。通过相同的例子不同的数据处理方法我们可以直观的看到公式计算与软件运用这两种不同方法之间的差距。3434