1、 系统聚类分析法在大气污染中的应用 System clustering analysis in application of atmospheric pollution 实际问题的提出聚类要素的数据处理样品间距离计算 最短距离法 绘制出聚类谱系图类的定义结论 设在某城市的环保检测站于2009年在全市均匀地布置了14个监测点,每天三次定时抽取大气样品,测量大气中二氧化硫、氮氧化物、飘尘的含量。前后5天,每个取样点(监测点)每种污染元素实测15次,取15次实测值的平均作为该取样点大气污染元素的含量(见表1)n(1)试用系统聚类分析法对这现象进行研究,并绘制谱系图来进行分类。n(2)根据(1)中的分
2、类结果,谈谈你自己的建议?一、实际问题的提出一、实际问题的提出1X2X 污染元素样品号 二氧化硫二氧化硫()氮氧化物氮氧化物()飘尘飘尘()1 10.0450.0430.2652 20.0660.0390.2653 30.0940.0610.1944 40.0030.0030.1025 50.0480.0150.1066 60.2100.0660.2637 70.0860.0720.2748 80.1960.0720.2119 90.1870.0820.30110100.0530.0600.20911110.0200.0080.11212120.0350.0150.17013130.2050.
3、0680.28414140.0880.0580.2151X2X3X表1 2009年某城市记录的14个监测点的大气污染数据二、聚类要素的数据处理 在聚类分析中,聚类要素的选择是十分重要的,它直接影响分类结果的准确性和可靠性。在地理分类和分区研究中,被聚类的对象常常是多个要素构成的。不同要素的数据往往具有不同的单位和量纲,其数值的变异可能是很大的,这就会对分类结果产生影响。因此当分类要素的对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。要 素聚 类 对 象 假设有m 个聚类的对象,每一个聚类对象都有n个要素构成。它们所对应的要素数据可用表2给出。mi21mnmjmminijiinj
4、njxxxxxxxxxxxxxxxx2121222221111211njxxxx21表2 聚类对象与要素数据 在本论文中,用到的聚类要素的数据处理(转换)方法有如下:极差的标准化极差的标准化,即 经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在0与1之间。(公式1)niijniijijniijijxxxxx111minmaxmin表3 极差标准化处理后的数据9G10GX1X2X3G1 0.2030.5060.819G2 0.3040.4540.814G3 0.4400.7340.462G4 0.0000.0000.000G5 0.2170.1520.020G6 1.0
5、000.7970.809G7 0.4010.8730.864G8 0.9320.8730.548 0.8891.0001.000 0.2420.7220.538 0.0820.0630.050 0.1550.1520.342 0.9760.8230.915 0.4110.6960.5689G10G11G12G13G14G三、样品间距离的计算 绝对值距离计算),2,1,(1mjixxdmkjkikij四、最短距离法 qGpGijd),(,minqpkdddqkpkrkminijpqddiGjGn原理原理 最短距离法,是在原来的1414距离矩阵的非对角元素中找出 ,把分类对象和 归并为一新类 ,然
6、后按计算公式 计算原来各类与新类之间的距离,这样就得到一个新的13阶的距离矩阵;再从新的距离矩阵中选出最小者 ,把 和 归并成新类;再计算各类与新类的距离,这样一直下去,直至各分类对象被归为一类为止。13,6d6G13G由于 的距离是最小的,故而合并 和 ,同时划去第13行和第13列,于是我们得到如此重复下去,直到合并为一类为止,我们得到五、类的定义 设阈值T的正数,若集合中任意两个元素的距离都满足:),(GjiTdij则称G对于阈值组成一个类。3G14G7G1G2G4G5G6G8G9G10G11G12G13G0.5000.622六、绘制出聚类谱系图七、结论 (1)由最长距离法计算的结果与最短
7、距离法比较后,发现运用最短距离的谱系图并且当阈值 =0.500时分类是比较好的,所以再根据类的定义,把这些监测点分为六大类分别是6,8,13、1,2、4,5,11,12,9,10、3、7,14。T(2)由此,我们用互不相关的前5个主要成分来代替原来的18个指标变量损失的信息不大,所以结论分析(建议)如下:1,2这三个观测点,污染极轻,应加以保持。4,5,11,12,9,10这五个观测点,污染较轻,应注意减少污染物的排放。6,8,13这三个观测点,大气污染较严重,应加强城市绿化工作,建立城市立体绿化体系。7观测点污染较重,应该进行整治。14观测点污染很重应该按照环保工作总体方案进行大气环境污染综合整治工作部署,以大气污染企业污染治理和全面达标为重点。3观测点,污染极重应大力的、系统的整治。