1、第六章 遥感数字图像计算机解译2第三节 遥感数字图像的计算机分类3本节内容一、分类原理与过程二、分类方法三、遥感图像解译专家系统4一、分类原理与过程1.1.概述概述2.2.方法方法3.3.过程过程51.概述定义(计算机自动识别):自然界中不同类型的地物具有各自不同的电磁波谱特性,遥感数字图像中像元的不同数值(亮度值)反映了相应地物的波谱特性。因此,通过计算通过计算机对图像像元的数值的统计、运算、对比和归纳,机对图像像元的数值的统计、运算、对比和归纳,对像元进行分类,即可达到对地物的自动识别,这对像元进行分类,即可达到对地物的自动识别,这种技术处理称为种技术处理称为。6例如:你身高1.9m,体重
2、100kg 99%你是男人 身高/体重=?婴儿、儿童、青少年、青年、中年所依赖的理论方法:统计模式识别,提取待识别模式的一组统计特征值,然后按照一定准则作出分类决策。7遥感图像分类中所用统计特征变量:全局统计特征变量:将整个数字图像作为研究对象,从整个图像中获取或进行变换处理后获取变量;局部统计特征变量:将数字图像分割为不同识别单元,在各单元内分别抽取的统计特征变量(如描述纹理的特征量)。例如,1-7波段亮度值是特征变量x1,x2,x7;组合运算也可产生特征变量。8利用统计特征变量统计特征变量进行分类,需要:(1)变量能反映分类特征的区别区别;将人分婴儿、儿童,要选择特征变量“年龄”,而不是身
3、高、体重、性别、民族 波段1-7分别反映对不同波段的反射率差异,但如果进行热分布制图,主要依据热红外波段(6),而不用其他波段值。(2)如果有几个特征变量,尽可能使其:区分不同的特征如,通过主成分变换,主成分变换,将相互之间存在相关性的原始波段遥感图像转换为相互独立的多波段新图像,变换后的信息集中于前几个组分的图像上,实现特征空间将维数压缩的目的。91.概述遥感图像计算机分类的依据图像像素的相似度相似度 一组图像(原始的、主成分变换后的、或其它运算产生的)每个像素对应有1组特征值 该像素所属类别?同类别的像素应当特征相似 特征值具有较高相似度101.概述相似度的衡量方法,常采用距离、相关系数衡
4、量:(1)绝对值距离(2)欧氏距离(3)马氏距离(4)混合距离(5)相关系数例,已知分类标准:类别婴儿0-2,平均1岁;儿童3-9,平均6岁;少年;问:8岁的人是哪一类?混合距离发现,离儿童平均年龄6岁差值2,最接近所以是“儿童”类11(1)绝对值距离 i,j为特征空间中两点nkjkikijxxd112l(2)欧式距离)()(kkkxuxdt在二维和三维空间中的欧式距离的就是两点之间的距离,二维的公式是 d=sqrt(x1-x2)+(y1-y2)三维的公式是 d=sqrt(x1-x2)+(y1-y2)+z1-z2)推广到n维空间,欧式距离的公式是 d=sqrt(xi1-xi2)这里i=1,2.
5、n xi1表示第一个点的第i维坐标,xi2表示第二个点的第i维坐标 13l(3)马氏距离12)()(ijjijikxxxxd即考虑离散度,也考虑到各轴间总体分布的相关性(协方差)。ij为协方差矩阵14l(4)混合距离 像元i到第g类类均值的混合距离。pkkgkijMxdi1l(5)相关系数nknknkjkjikijkjikijxxxxxxxxri11221)()()(152.方法(1)非监督分类方法(2)监督分类方法162.方法(1)非监督分类方法 定义:非监督分类又称边学习边分类边学习边分类法。它直接对输入的数字图像像元数值(亮度值)进行统计运算处理,分别将每个像元归纳到由图像各波段构成的多
6、维空间的集群中,达到分类识别的目的。172.方法(2)监督分类方法 定义:监督分类又称训练场地法或先学习后分类法。它是先选择具有代表性的典型试验区或训练区,用训练区训练区已知地面样本的光谱特征来“训练”计算机,获得识别各类地物的判别模式或判别函数,并依此模式或判别函数,对未知地区的像元进行处理分类,分别归入到已知的类别中,达到自动分类识别的目的。183.过程(1)明确分类目的,选取数字图像;(2)收集、分析地面参考信息和有关数据;数字图像预处理(几何纠正、辐射纠正);(3)比选合适的分类方法和算法,制定分类系统;(4)找出代表这些类别的统计特征;(5)采用训练场地(监督分类中)或聚类方法(非监
7、督分类中)测定总体特征;(6)对各未知像素分类;(7)分类精度检查(用训练数据或随机抽样数据);(8)对判别分析的结果统计检验;19l非监督分类的前提:假定遥感影像上同类同类物体在同样条件下具有相同相同的光谱信息特征。完全按照像元的光谱信息特征进行分类,适用于对分类区不了解的情况。自动化程度高。非监督分类20l分类步骤:初始分类 专题判别 分类合并 色彩确定 分类后处理 色彩重定义 栅格矢量转换 统计分析非监督分类21l常用方法 (1)分级集群法(2)动态聚类法非监督分类22(1)分级集群法p当同类物体聚集分布在一定的空间位置上,他们在同样同样条件下应具有相同相同的光谱信息特征,这时其他其他类
8、别的物体应聚集分布在不同不同的空间位置上。由于不同地物的辐射特性不同,反映在直方图上会出现很多峰值峰值及其对应的一些众数众数灰度值,他们在图像上对应的像元分别倾向于聚集在各自不同的重数附近重数附近的灰度空间形成的很多点群,这些点群就叫做群集。一个群集就是一个分类。非监督分类23l分级集群法的分类过程确定相似程度指标确定相似程度指标初定分类种数初定分类种数计算样本间距离计算样本间距离归并成新类别归并成新类别非监督分类24l分级集群法的缺点 在迭代过程中过程中没有调整类别总数的措施,操作次序不同会产生不同的分类结果。非监督分类25(2)动态聚类法 在初始状态给出图像粗糙的分类,然后基于一定的原则在
9、类别间重新组合样本,直到分类比较合理为止,这种分类方法就叫-。代表:迭代自组织数据分析技术,ISODATA(Interative-Orgnizing Data Analysize Technigue)。非监督分类26l动态聚类法分类过程选择初始类聚类中心分配各像元到最近的类别中去计算并改正重新组合的类别中心非监督分类27l监督分类方法 定义:监督分类又称或它是先选择具有的典型试验区或训练区,用训练区已知地面样本的光谱特征来“训练”计算机,获得识别各类地物的判别模式或判别函数,并依此模式或判别函数,对未知地区的像元进行处理分类,分别归入到已知的类别中,达到自动分类识别的目的。分类方法(二)监督分
10、类28l训练场地的选择:要具有代表性(目标地物中心中心较大的区域选取);数目要包含足够的信息;分类方法(二)监督分类29l分类步骤:建立模板(训练样本)评价模板 确定初步分类结果 检验分类结果 分类后处理 分类统计特征 栅格矢量转换 统计分析分类方法(二)监督分类30l常用方法(1)最小距离分类法 以特征空间中的距离作为像素分类的依据。以特征空间中的距离作为像素分类的依据。1)最小距离判别法 2)最近领域分类法(多光谱)原理简单,分类精度不高,计算速度快,常在快速浏览分类概况中使用。分类方法(二)监督分类31(2)多级切割分类法 在各轴上设定分割点,将多维特征空间划分成对在各轴上设定分割点,将
11、多维特征空间划分成对应不同分类类别的互不重叠的特征子空间。应不同分类类别的互不重叠的特征子空间。优:便于直观理解如何分割特征空间,以及待分类像素如何与分类类别相对应。缺:多级分割法要求分割面总是与各特征轴正交,如果各类别在特征空间中呈现倾斜分布,就会产生分类误差!因此,需要先进行主成分分析,或正交变换,然后进行多级分割。32(3)特征曲线窗口法 以特征曲线为小心取一个条带,构造一个窗口,以特征曲线为小心取一个条带,构造一个窗口,凡是落在此窗口范围内的地物即被认为是一类,凡是落在此窗口范围内的地物即被认为是一类,反之,则不属于该类。反之,则不属于该类。分类依据:相同的地物在相同的地域环境及成像条
12、件下,特征曲线是相同或相近的,不同地物的特征曲线差别明显。33(4)最大似然比分类法 通过求出每个像素对于各类别的归属概率,把该通过求出每个像素对于各类别的归属概率,把该像素分到归属概率最大的类别中去的方法。像素分到归属概率最大的类别中去的方法。利用训练区求出均值、方差以及协方差等待征参数,从而求出总体的先验概率密度函数。条件:总体分布不符合正态分布时,其分类可靠件将下降,这种情况下不宜采用最大似然比分类法。最大似然比分类法在多类别分类时,常采用统计学方法建守起一个判别函数集,然后根据这个判别函数集计算各待分像元的归属概率。34监督分类和非监督分类方法比较(小结)l根本区别:是否利用训练场地来
13、获取先验类别知识。监督分类根据训练场提供的样本选择特征参数,建立判别函数。训练场地选择是监督分类的关键。对于不熟悉区域情况的人来说,选择足够数量的训练场地带来很大的工作量。由于训练场地要求有代表性,训练样本的选择既要考虑到地物光谱特征,样本数目有要能满足分类的要求,常难周全,这是监督分类不足之处。35l 相比之下,非监督分类不需要更多的先验知识,分类方法简单,且分类具有一定的精度。l 当光谱特征类能够和唯一的地物类型(水体、植被)相对应时,非监督分类可取得较好分类效果。当两种地物类型对应的光谱特征类差异很小时,非监督分类效果不如监督分类效果好。l 共同点:分类效果的好坏需要经过实际调查来检验。
14、监督分类和非监督分类方法比较(小结)36(1)未充分利用遥感图像提供的有用信息 遥感数字图像计算机分类的依据是像素具有的多光谱特征,并没有考虑相邻像素间的关系。例如,被湖泊包围的岛屿,通过分类仅能将陆地与水体区别,但不能将岛屿与临近的陆地(假定二者地面覆盖类型相同,具有同样的光谱特征)识别出来。这种方法的主要缺陷在于地物识别与分类中没有利用到地物空间关系等方面的信息。(将同一类型分成了两类)37 统计模式统计模式识别以像素作为识别的基本单元,未能利用图像中提供的形状和空间位置特征形状和空间位置特征,其本质本质是地物光谱特征的分类。例如,根据水体的光谱特征,在分类过程中可以识别构成水体的像素,但
15、计算机无法确定一定空间范围的水体究竟是湖泊还是河流。这个问题如果引入地物形状特征则可以识别。显然,遥感图像计算机分类未能充分利用遥感图像提供的多种信息。因此图像分类后,可以利用分类的结果,将这些目标对象进行重组,在区域分割或边界跟踪的基础上抽取遥感图像形态、纹理特征和空间关系等特征,然后利用这些特征对图像进行解译。38(2)提高遥感图像分类精度受到限制 分类精度是指与实际地物相比实际地物相比的正确率。正确率包括地物属性被正确识别,以及它们在空间分布的面积被准确度量。遥感数字图像分类结果在没有经过专家检验和多次纠正检验和多次纠正的情况下,分类精度一般不超过90(通常60%)。39影响遥感图像分类
16、精度的几个客观因素:1)大气状况的影响 地物辐射电磁波,必须经过大气层才能到达传感器,大气衰减作用,导致遥感图像灰度级产生偏移;对多时相图像进行分类处理时,由于不同时间大气成分以及湿度不同,散射影响也不同,因此遥感图像中的灰度值不完全反映目标地物辐射电磁波的特征。为了提高遥感图像分类的精度,必须在图像分类以前进行大气纠正。402)下垫面的影响 a.垫面的覆盖类型和起伏状态对分类产生影响。受空间分辨率限制,农田中的植被、土壤和水渠,石质山地稀疏的灌丛和裸露的岩石均会形成混合像元,影响分类精度。解决方法:在分类前分解混合像元,分解成子像元后再分类。b.山区向阴阳面的同一类地物,由于电磁波辐射能量不
17、同,其灰度值也存在差异,容易造成分类错误。解决方法:地形起伏变化大时,用比值图像代替原图像进行分类。413)其他因素的影响 云云朵会遮盖目标地物的电磁波辐射,影响图像分类。对于图像中 仅有少量云朵时,分类前可以采用去噪音方法进行清除。多时相多时相图像分类时,不同景的图像由于成像时光照条件的差别,同一地物电磁波辐射量存在差别,这也会对分类产生影响。地物边界的多样性地物边界的多样性,使得判定类别的边界往往是很困难的事。例如,湖泊和陆地具有明确的界线,但森林和草地的界线则不明显,不少地物类型间还存在着过渡地带。提高分类精度,既需要对图像进行分类前预处理预处理,也需要选择合适的分类方法分类方法。42四
18、、遥感图像解译专家系统43遥感图像解译专家系统是模式识别与人工智能技术相结合的产物模式识别,获取地物多种特征,为专家解译遥感图像提供证据。人工智能技术,模拟遥感图像目视解译的具体思维过程,进行遥感图像解译。44解译知识库 对遥感图像进行处理、分类和特征提取从解译专家获取解译知识,构成图像解译知识库。在基于知识指导下,由计算机完成遥感图像解译。45l图像处理与特征提取子系统l遥感图像解译知识获取子系统l狭义的遥感图像解译专家系统46图像处理 图像前期处理、空间增强、几何校正。特征提取 从图像中抽取光谱特征、形状特征、空间特征,为专家系统提供推理、判读、及分析的客观依据。图像处理与特征提取子系统遥感图像解译知识获取子系统狭义的遥感图像解译专家系统47三个层次:增加遥感解译新知识 解译知识获取、图像背景知识获取。能够发现不全的解译知识,修改、补充解译知识。创造性知识获取 自动总结解译知识,增加解译知识图像处理与特征提取子系统遥感图像解译知识获取子系统狭义的遥感图像解译专家系统48图像处理与特征提取子系统遥感图像解译知识获取子系统狭义的遥感图像解译专家系统