1、1第七章第七章 高光谱遥感图像分类高光谱遥感图像分类 本章主要介绍高光谱遥感数据的分类算法和实验。27.1 遥感图像分类遥感图像分类数据数据信息信息l利用计算机通过对高光谱遥感图像中的各类地物的光谱信息和空间信息进行分析、选择特征,并用一定的手段将特征空间互分为互不重叠的子空间,然后将图像中的各个像元划分到各个子空间去。41 1)遥感图像的分类特征)遥感图像的分类特征l分类特征即将各类模式区分开来的特征,常用的高光谱图像的分类特征就是光谱特征,主要分为:光谱反射率、波形、光谱数学变换特征、光谱吸收指数、导数光谱波形等。l除此之外,还有几何特征,多时相特征(融合),数字变换特征(),高程信息等。
2、它们都可以作为分类的依据加入到分类模型当中。52 2)分类判据)分类判据相似性作为分类判据的度量:可以表现为不同的 形式:l 距离值(Distance Value):像素或像素组信号特征向量之间距离值的大小来衡量。假如样本均线性可分欧式距离 假如样本正态分布马氏距离,假如样本线性不可分似然度l 概率值(Probability Value):像素信号特征向量与某一像素组的似然性的大小为相似性的量度l光谱角值(Spectral Angle Value):像素或像素组之间光谱角的大小为相似性量度。光谱波形特征光谱相似度或光谱夹角63 3)分类准则)分类准则最常用的分类准则是:最小二乘法(平方误差最小
3、)和费歇尔准则(假设样本基于正态分布)是广泛采用的分类准则,除此之外,还有,基于最小误差准则(分类的错误概率最小),最小风险准则(损失的条件数学期望最小),聂曼皮尔逊准则,基于熵函数可分性准则等74 4)算法选择)算法选择l分类模型或分类器:统计分类、模糊分类、邻域分类、神经网络分类l参数分类和非参数分类:假定类的概率分布函数并估计其分布参数l硬分类和软分类:像元属于一个类或多个类8监督分类:监督分类:利用某些已知类别训练样本让分类识别系统进行学习,待其掌握了各个类别的特征以后,按照分类的决策规则进行分类。例如:最小距离法,最大似然法,平行管道法以及神经网络、支持向量机等新方法。l训练区已知地
4、表覆盖类型的代表样区用于描述主要特征类型的其精度直接影响分类l检验区用于评价分类精度的训练样区5 5)分类执行的方式)分类执行的方式9样区选择示例样区选择示例训练样区与检验区的选择:相互独立、不能重叠10l非监督分类:非监督分类:是在没有先验类别(训练场地)作为样本的条件下,即事先不知道类别特征,主要根据像元间相似度的大小进行归类合并(即相似度的像元归为一类)的方法,例如K均值,isodata算法等。l其分类的结果,只是对不同类别达到了区分,并不确定类别的属性,其属性是通过事后对各类的光谱响应曲线进行分析,以及与实地调查相比较后确定的。11聚类分析聚类分析l非监督分类主要采用聚类分析方法,把一
5、组像素按照相似性归成若干类别。例如:K均值算法基本思想是:通过迭代,移动各个基准类别的中心,直至得到最好的聚类结果为止。该算法能使得聚类域中所有样本到聚类中心的距离平方和最小。12监督分类与非监督分类方法比较l训练样本的选择是监督分类的关键,必须充分考虑地物光谱特征,且样本数目要能满足分类的要求,有时这些还不易做到,这是监督分类不足之处。l非监督分类不需要更多的先验知识,它根据地物的光谱统计特性进行分类。因此,非监督分类方法简单,但是,分类效果不如监督分类效果好。13l高光谱遥感图像分类的主要特点在于:1)光谱分辨率高,波段众多,且可以挑选特定的波段来突出特征,进行分类。2)数量冗余程度增加,
6、波段相关性高。3)hughs现象的存在,样本数目要求高,且随着波段增加分类精度反而下降。l我们主要介绍三种方式进行有效的高光谱遥感图像分类:1)降维+传统分类算法2)智能化的新分类算法3)光谱匹配分类7.2 高光谱遥感图像分类思路高光谱遥感图像分类思路141)降维+传统分类原始高光谱图像:山东青岛原始高光谱图像:山东青岛 OMIS128个波段个波段15l重点在于光谱维特征的提取,即通过映射和变换的方法(如主成分分析PCA,最小噪声分离变换MNF,小波变换等),把原始模式空间的高维数据变成特征空间的低维数据。然后对特征更集中的低维数据进行传统分类处理。分类方法:分类方法:特征提取特征提取+传统分
7、类算法传统分类算法16(1)Minimum distance classifier02550255TM Band 3TM Band 4concretehigh buildingsgrass slopewaterbare soilsforest02550255TM Band 3TM Band 4concretehigh buildingsgrass slopewaterbare soilsforest12分类器:分类器:选择最小距离和最大似然法进行比较选择最小距离和最大似然法进行比较17(2)Maximum likelihood classifier02550255TM Band 3TM Ban
8、d 4concretehigh buildingsgrass slopewaterbare soilsforest1202550255TM Band 3TM Band 4concretehigh buildingsgrass slopewaterbare soilsforest18具体步骤:具体步骤:l选取海水,建筑物和植被3个不同类别的样本,样本个数各为300个。样本要具有代表性就是样本的亮度要反映该类地物的亮度特征,当同一地物区域分布不连续时,我们要尽量使样本来自不同的区域。l如:在对海水取样时,既要选择来来自右上角的深水区的样本,又要选择来自河道以及水田中的浅水区的样本。从亮度特征角度而
9、言,对于同一类地物具有不同亮度特征情况,都要选取(同物异谱)。l原始图像选择前3个波段后,采用以下两种传统分类算法进行分类:19分类结果比较图分类结果比较图最大似然法分类结果最小距离法分类结果可以分为三个类别:可以分为三个类别:海水海水植被及农作物植被及农作物建筑物及桥梁建筑物及桥梁20l区域A:在浅水区,最大似然法分类图像中出现了原始分类图像中没有的像点。这些像点是水中的暗礁和草,RGB图像上用肉眼无法识别到这些细节。21l区域B:通过目视解译,可以分辫出这个区域是由田埂分开的一块又一块的稻田,这些稻田中全是海水。最小距离法分类时却忽略了这些由植被覆盖的田埂,将其全部分成了海水。甚至将右上角
10、处的海水类分成了植被类。22l区域C:可以看到左图中有很多被错分的像点,如山脉中的部分植被和建筑被类分成了海水类。而右图中几乎没有被错分的像点;23247.3 神经网络对高光谱影像分类神经网络对高光谱影像分类l目前的多种先进而新颖的技术手段层出不穷,人工智能,模糊理论,决策树,神经网络等都被应用于遥感图像的理解和分析当中。l人工神经网络技术,黑匣子,能被用于多源数据的综合分析被广泛用于遥感图像分类。251 神经系统基本构成神经系统基本构成l神经网络是在生物功能启示下建立的信息处理系统,摸仿了人脑的结构特征和信息处理机制,表现出了许多与人脑相同的特征。26l简单的神经元网络是对生物神经元的简化和
11、模拟,其模型如下图:njijjiixwS1)(iiSfy 272 拓扑结构拓扑结构 l网络的拓扑结构是NN的重要特征,从连接方式上可以包括:前馈型网络和反馈型动态网络两大类。o1o2omx1x2xn连接的拓扑表示:28l层次划分 l信号只被允许从较低层流向较高层。l层号确定层的高低:层号较小者,层次较低,层号较大者,层次较高。l输入层:被记作第0层。该层负责接收来自网络外部的信息输出层隐藏层输入层o1o2omx1x2xn29l第j层:第j-1层的直接后继层(j0),它直接接受第j-1层的输出。l输出层:它是网络的最后一层,具有该网络的最大层号,负责输出网络的计算结果。l隐藏层:除输入层和输出层
12、以外的其它各层叫隐藏层。隐藏层不直接接受外界的信号,也不直接向外界发送信号输出层隐藏层输入层o1o2omx1x2xn303 学习与联接模式学习与联接模式l学习规则:外部环境对系统的输出结果给出评价,学习系统通过强化受奖的动作来改善自身性能。l误差纠错学习(delta)lHebb学习l竞争学习l学习方式:l监督学习(Supervised learning)l非监督学习(Unsupervised learning)31联接模式 l用正号(“+”,可省略)表示传送来的信号起刺激作用,它用于增加神经元的活跃度;l用负号(“-”)表示传送来的信号起抑制作用,它用于降低神经元的活跃度。324 BP(Bac
13、k Propagation)神经网络神经网络 1.BP网络在1986年提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。2.BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。3.BP网络的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。4.BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)。33BP网络的拓扑结构x1o1输出层输出层隐藏层隐藏层输入层输入层x2o2omxnWV34训练过程概述 样本:(输入向量,理想
14、输出向量)权初始化:(-1,1)1、向前传播阶段:(1)从样本集中取一个样本(Xp,Yp),将Xp输入网络;神经元的网络输入:neti=x1w1i+x2w2i+xnwni(2)计算相应的实际输出O:netenetfo11)(1(0,0.5)net(0,0)o352、向后传播阶段误差传播阶段:(1)计算实际输出O与相应的理想输出Y的差;(2)网络关于第p个样本的误差测度:mjpjpjpoyE1221(3)网络关于整个样本集的误差测度:ppEE(4)按极小化误差的方式调整权矩阵。即:对W不断做调整,直到E。36lBP神经网络模型的输入层输入层的神经元个数为波段数,输入值输入值为各个像元的灰度值。输
15、出层输出层的神经元个数为地物端元的个数,输出值输出值为像元在各个典型地物所属的类别。隐含层隐含层神经元的个数经过多次的实验确定,同时也可以采用有经验公式计算:式中,M为分类数;N为特征向量维数,即影像波段数。)()1)(2/(2NMNNMMN具体应用于遥感影像分类 37l正向传播:对权值赋予-11之间的随机值,然后从网络的输入节点输入样本数据,计算样本信息在正向传播过程中,前一层的神经元数据对本层每个神经元的加权,并利用Sigmoid函数运算输出。l反向传播:接着求出误差进行反向的迭代,调整权值,权值训练完成后,求出满足一定误差条件的权矩阵。l测试:将影像上的每个像素的波段值作为输入向量,通过
16、计算可得到输出向量,对应于该像素在各个预先指定的各个分类类型的概率值,将最大的概率值赋值为1,其余的赋值为0,即得出分类图。具体过程:38l实验139l该影像区域选择的是武汉城区,通过实际调查后,预期将该影像分为,水体,植被,城市,云四个类类别。经过实际调查后得到的每个类别的样本数列在表中。40植被 (f)Self-organizing map(b)K均值(c)ISODATA(a)MODIS 影像(d)最大似然法(e)神经网络分类41 方法方法精度精度K均值均值ISODATAMLC神经网络总精度总精度78.65%72.43%76.98%83.64%Kappa系系数数0.73590.69040.
17、72560.791242l实验2该区域在常州市夏桥,为混合农业区域。采用的是国产PHI(推扫式光谱成像仪)遥感影像(340390 像素),波段数为80 波段,该区域是一个混合的农业区域,其成像波段范围为0.4170.854m。43l通过实际调查后,预期将该影像分为七类,具体为:水体,谷物1,谷物2,道路1,道路2,土壤,蔬菜。44(e)模糊算法(b)K均值(c)ISODATA(a)PHI影像(d)最大似然法水体 谷物1 谷物2 道路1道路2 土壤 蔬菜(e)神经网络分类45分类方法的比较实验结果表明UAIC对高光谱遥感影像也有很好的分类效果,是一种具有高分类精度的高光谱遥感影像分类方法。分类精
18、度比较分类精度比较 方法方法精度精度K K均值均值ISODATAISODATA模糊算法模糊算法MLCMLC神经网络神经网络总精度总精度70.2170.21%71.3371.33%75.6775.67%78.9578.95%81.5681.56%KappaKappa系数系数0.61530.61530.67560.67560.71990.71990.71770.71770.75350.7535467.4 光谱匹配的分类方法光谱匹配的分类方法l光谱匹配法光谱匹配法:基于相关/匹配滤波器的分类方法是充分利用高光谱图像的高分辨率的光谱维优势,将待分未知像元的光谱与参考光谱按照一定的规则进行比较,以确定未
19、知像元类别的方法。l比较有效的是光谱角,相关系数以及二值编码分类。47二进制编码分类二进制编码分类l对光谱进行二值编码是使得光谱可用简单的0-1序列来表述。设A,B分别是两个光谱曲线的二进编码,其中Ai,Bi是第i(i=1,2,2N)位编码值,N为波段数,则光谱相似系数r的计算方法如下:iiiBAXNiiXs21NsNr2/)2(表示异或48光谱角(光谱角(SAM)分类)分类l光谱角度匹配是比较待识别地物向量与已知地物向量的广义夹角,来确定每类地物的归属。广义夹角定义如下:l由于光谱角度匹配只利用了角度这一唯一的参数,只有当待识别像元的类内方差较小,类间方差较大,且矢量的模中的信息对分类影响不
20、大时,才能得到较高的分类精度。YXYX)(cos49相关光谱匹配(相关光谱匹配(CCSM)lCCSM(cross correlogram spectral matching)称为光谱相似度匹配或光谱相关系数,与SAM原理类似,用光谱间相关系数(r)来衡量整个测量的波长范围内光谱的相似程度,是一种模糊数学的分类方法,可定义为:)()()(2_2_RRRRRRRRr50分类步骤:分类步骤:(1)参考光谱库的建立:以图像中已知类型的区域为参考光谱,将区域中光谱的几何平均向量作为类中心。(2)计算未知像元与各类中心的夹角(相关系数)。(3)通过多次实验分别对不同的类别设置不同的阈值。若设置的阈值大于(小于)计算得出的光谱角度(相关系数),则不对该像元进行分类。(4)将给未知像元分类到夹角最小(系数最大)的类别中去。51美国印第安纳州西北部遥感试验区光谱角分类编码分类52作业作业l1.使用envi软件,对自带的cuprite数据进行监督和非监督法的分类比较试验,列出混淆矩阵和kappa系数,并比较两种分类方式结果的好坏,分析它们之间的区别。l2.说说现在有哪些典型的神经网络模型,它们具体应用的领域分别在哪里?试描述一种神经网络模型在遥感影像分类中的应用,并与BP模型的使用做一个简单的比较。