1、何为灰色关联度分析?如何计算?有何应用?灰色关联度分析u灰色系统灰色系统 u关联度关联度 是指部分信息已知而部分信息未知的系统,灰色系统理论所要考察和研究的是对信息不完备的系统,通过已知信息来研究和预测未知领域从而达到了解整个系统的目的。关联度是事物之间、因素之间关联性大小的量度。它定量地描述了事物或因素之间相互变化的情况,即变化的大小、方向与速度等的相对性。如果事物或因素变化的态势基本一致,则可以认为它们之间的关联度较大,反之,关联度较小。基本思想:根据序列曲线几何形状的相似程度来判断其联系是否紧密,曲线越接近,相应序列之间的关联度就越大,反之就越小。确定参考数列处理原始数据计算关联系数关联
2、度的计算与比较灰色关联度的计算灰色关联度的计算确定参考数列对一个抽象系统或现象进行分析,首先要选准反映系统行为特征的数据序列(参考序列)。我们称之为找系统行为的映射量,用映射量来间接地表征系统行为。比如:国民平均受教育的年限 教育的发达程度刑事案件的发案率 社会治安面貌和社会秩序原始数据的处理由于各因素各有不同的计量单位,因而原始数据存在量纲和数量级上的差异,不同的量纲和数量级不便于比较,或者比较时难以得出正确结论。因此,在计算关联度之前,通常要对原始数据进行无量纲化处理。设 为因素 的行为序列)(,),2(),1(nxxxXniiiiXu初值化初值化一般地,初值化方法适用于较稳定的社会经济现
3、象的无量纲化,因一般地,初值化方法适用于较稳定的社会经济现象的无量纲化,因为这样的数列多数呈稳定增长趋势,通过初值化处理,可使增长趋为这样的数列多数呈稳定增长趋势,通过初值化处理,可使增长趋势更加明显。势更加明显。u区间化区间化一般地,三种方法不宜混合、重叠作用,在进行系统因素分析时,可根据实际情况选用其中一个。u均值化均值化一般说来,均值化方法比较适合于没有明显升降趋势现象的数据处理。若系统 因素 与系统主行为 呈负相关关系,我们可以将其逆化或倒数化后进行计算。u逆化0XiXu倒数化关联系数的计算设经过数据处理后的参考数列为:比较数列为:从几何角度看,关联程度实质上是参考数列与比较数列曲线形
4、状的相似程度。凡比较数列与参考数列的曲线形状接近,则两者间的关联度较大;反之,如果曲线形状相差较大,则两者间的关联度较小。因此,可用曲线间的差值大小作为关联度的衡量标准。则:两极最大差与最小差:关联系数:式中 为分辩系数,用来削弱(max)过大而使关联系数失真的影响。人为引入这个系数是为了提高关联系数之间的差异显著性。关联度的计算与比较由于每个比较数列与参考数列的关联程度是通过n 个关联系数来反映的,关联信息分散,不便于从整体上进行比较。因此,有必要对关联信息作集中处理。而求平均值便是一种信息集中的方式。即用比较数列与参考数列各个时期的关联系数之平均值来定量反映这两个数列的关联程度,其计算公式
5、为:灰色关联度分析的运用灰色关联度分析的运用因 素 分 析优 势 分 析综 合 评 价指标19821983198419851986铅球专项成绩X013.6014.0114.5415.6415.694 公斤前抛X111.5013.0015.1515.3015.024 公斤后抛X213.7616.3616.9016.5617.304 公斤原地X312.2112.7013.9614.0413.46立定跳远X42.482.492.562.642.59高翻X5858590100105抓举X65565758080卧推X765707585903 公斤前抛X812.8015.3016.2416.4017.05
6、3 公斤后抛X915.3018.4018.7517.9519.303 公斤原地X1012.7114.5014.6615.8815.703 公斤滑步X1114.7815.5416.0316.8717.82立定三级跳远X127.647.567.767.547.70全蹲X13120125130140140挺举X14808590909530 米起跑X15420425410406399100 米X1613101342128512721256for i=1:15 x(i,:)=x(i,:)/x(i,1);%标准化数据 end for i=16:17 x(i,:)=x(i,1)./x(i,:);%标准化数据
7、 end data=x;n=size(data,1);ck=data(1,:);m1=size(ck,1);bj=data(2:n,:);m2=size(bj,1);for i=1:m1 for j=1:m2 t(j,:)=bj(j,:)-ck(i,:);end jc1=min(min(abs(t);jc2=max(max(abs(t);rho=0.5;ksi=(jc1+rho*jc2)./(abs(t)+rho*jc2);rt=sum(ksi)/size(ksi,2);r(i,:)=rt;end r 其数据列于下表。19791980198119821983X1X2X3X4X5Y1Y2Y3Y4
8、Y5Y6308.58310295346367195.4189.4187.2205222.724.62112.215.114.572025.623.329.23018.891922.323.527.66170174197216.4235.857.5570.7476.880.789.8588.567085.3899.83103.411.1913.2816.8218.922.84.034.264.345.065.7813.715.613.7711.9813.95n=size(data,1);for i=1:n data(i,:)=data(i,:)/data(i,1);%标准化数据 end ck=d
9、ata(6:n,:);m1=size(ck,1);bj=data(1:5,:);m2=size(bj,1);for i=1:m1 for j=1:m2 t(j,:)=bj(j,:)-ck(i,:);end jc1=min(min(abs(t);jc2=max(max(abs(t);rho=0.5;ksi=(jc1+rho*jc2)./(abs(t)+rho*jc2);rt=sum(ksi)/size(ksi,2);r(i,:)=rt;end r 综合评价综合评价基本思路是:从样本中确定一个理想化的最优样本,以此为参考数列,通过计算各样本序列与该参考序列的关联度,对被评价对象做出综合比较和排序。
10、设有n 个被评价对象,每个被评价对象有p 个评价指标。这样,第i 个被评价对象可描述为步骤:步骤:确定参考序列确定参考序列根据各评价指标的经济含义,在n 个被评价对象中选出各项指标的最优值组成参考序列实际上,参考序列 构成了一个相对理想化的最优样本,是综合评价的标准。如果第j 项指标是数值越大越好的正向指标,则 就是n 个被评价对象第j 项指标实际值的最大值;如果是逆向指标,则是最小值;如果是适度标,便是该指标的适度值。无量纲化无量纲化此时,各指标的最优值均为1。为叙述方便,把无量纲化后的数据仍记为xij,则最优参考序列为x01,1,1。求两极最大差和最小差求两极最大差和最小差计算各被评价对象
11、序列与最优参考序列间的绝对差列:在此基础上,依公式就可求得两级最大差(max)和两级最小差(min)计算关联系数计算关联系数计算第i 个被评价对象与最优参考序列间的关联系数。计算关联度计算关联度对各评价对象分别计算其p个指标与参考序列对应元素的关联系数的均值,以反映各评价对象与参考序列的关联关系,称其为关联度,记为i0PkikP10)(1ni,.,2,1如果各指标在综合评价中所起的作用不同,可对关联系数求加权平均值,即PkikikPW10)(1Pk,.,2,1式中 为各指标权重。Wk依据各观察对象的关联度,得出综合评价结果。例2利用灰色关联度分析对6位教师工作状况进行综合评价1、评价指标包括:
12、专业素质、外语水平、教学工作量、科研成果、论文、著作与出勤。2、对原始数据经过处理后得到以下数值,见表 x=9 9 9 9 8 9 9;8 9 8 7 5 2 9;7 8 7 5 7 3 8;9 7 9 6 6 4 7;6 8 8 8 4 3 6;8 6 6 9 8 3 8;8 9 5 7 6 4 8;n=size(x,2);for j=1:n x(:,j)=x(:,j)/x(1,j);%标准化数据 end data=x;n=size(data,1);ck=data(1,:);m1=size(ck,1);bj=data(2:n,:);m2=size(bj,1);for i=1:m1 for j
13、=1:m2 t(j,:)=bj(j,:)-ck(i,:);end jc1=min(min(abs(t);jc2=max(max(abs(t);rho=0.5;ksi=(jc1+rho*jc2)./(abs(t)+rho*jc2);rt=sum(ksi)/size(ksi,2);r(i,:)=rt;end r 作业n例例1 1:用灰关联分析的方法分析影响呼和浩特:用灰关联分析的方法分析影响呼和浩特市大气污染的各主要因素和污染水平的相关性。市大气污染的各主要因素和污染水平的相关性。下表为下表为1999-20031999-2003年城市大气污染监测数据年城市大气污染监测数据因素因素 1999 200
14、02001 20022003 大气污染大气污染值值 0.732 0.646 0.636 0.598 0.627 NO0.038 0.031 0.042 0.036 0.043 TSP 0.507 0.451 0.448 0.411 0.1220.048 0.034 0.030 0.030 0.031 工业总产工业总产值值 183.25 207.28 240.98 290.80 370.00基建投资基建投资 24.03 44.98 62.79 83.44 127.22 机动车数机动车数量量85508 74313 85966 100554 109804 煤炭用量煤炭用量 175.87 175.72 183.69 277.11 521.26 沙尘天数沙尘天数 10 13 13 x2SO例2:公路建设招标中取最接近标准者得标,请问何者得标?设分辨系数:=0.5厂商及指标厂商及指标标准标标准标A A厂厂 B B厂厂 C C厂厂 造价造价(亿亿)1.11.11.11.11.21.21.51.5建设期限建设期限(年年)1.31.31.81.81.51.51.31.3车流车流(百辆百辆)5 54 43 35 5车速车速(公里公里/时时)1101108080110110100100Thank you