1、1、 模式与模式识别模式与模式识别所谓所谓“模式模式”是指某种具有空间或几何是指某种具有空间或几何特征的东西。特征的东西。对被识别的模式作一系列的测量,然后对被识别的模式作一系列的测量,然后将测量结果与将测量结果与“模式字典模式字典”中一组中一组“典型典型的的”测量值相比较测量值相比较,得出所需要的分类结果。得出所需要的分类结果。这一过程称为这一过程称为模式识别模式识别. 分类器(或称判决器),可以根据一定分类器(或称判决器),可以根据一定的分类规则,把某一测量矢量的分类规则,把某一测量矢量X划入某一组划入某一组预先规定的类别之中去。预先规定的类别之中去。 自然模式自然模式接收器接收器(传感器
2、传感器)分类器分类器(判决器判决器)模式识别系统的模型模式识别系统的模型 2、 光谱特征空间及地物在特征空间中聚类光谱特征空间及地物在特征空间中聚类的统计特性的统计特性 光谱特征空间光谱特征空间:以各波段图像的亮度分布为以各波段图像的亮度分布为坐标轴组成的空间坐标轴组成的空间. 同类地物在特征空间形成一个相对聚集同类地物在特征空间形成一个相对聚集的点集群的点集群;不同类地物的点集群在特征空间内一般不同类地物的点集群在特征空间内一般是相互分离的是相互分离的. 统计特征矢量(多维光谱特征空间 ) p 3f )(1pf 集群 pf )(2pf )(3pf 2f )(3pf )(1pf )(2pf (
3、a) 图像空间 1f (b) 光谱特征空间 (c) 分类空间光谱特征空间及地物在特征空间中聚类的统计特性光谱特征空间及地物在特征空间中聚类的统计特性 水土壤植被B5B7特征点集群在特征空间中的分布大致可特征点集群在特征空间中的分布大致可分为如下三种情况分为如下三种情况:理想情况理想情况不同类别不同类别地特的集群地特的集群至少在一个至少在一个特征子空间中的投影是特征子空间中的投影是完全可以相互区分开的。完全可以相互区分开的。 BiBj水植被土壤一般情况一般情况无论在总的特征空间中,还是无论在总的特征空间中,还是在任一子空间中,不同类别的集群之间总在任一子空间中,不同类别的集群之间总是存在是存在重
4、叠重叠现象。这时重叠部分的特征点现象。这时重叠部分的特征点所对应的地物,在分类时总会出现不同程所对应的地物,在分类时总会出现不同程度的分类误差,这是遥感图像中最常见的度的分类误差,这是遥感图像中最常见的情况。情况。水植被土壤典型情况典型情况不同类别地物的集群,在不同类别地物的集群,在任一任一子空间中都有相互重叠的现象存在,但在子空间中都有相互重叠的现象存在,但在总的特征空间中可以完全区分的。这时可总的特征空间中可以完全区分的。这时可采用特征变换使之变成理想情况进行分类。采用特征变换使之变成理想情况进行分类。水植被土壤地物在特征空间的聚类通常是用特征点地物在特征空间的聚类通常是用特征点(或其相应
5、的随机矢量)分布的概率密度(或其相应的随机矢量)分布的概率密度函数函数P(X)来表示的。假设特征点的统计)来表示的。假设特征点的统计分布属于正态分布,则其概率密度函数可分布属于正态分布,则其概率密度函数可表达为:表达为:式是:式是:X特征向量特征向量 均值向量;均值向量; 协方差矩阵协方差矩阵 一特征变换一特征变换 1、主分量变换、主分量变换 2、穗帽变换、穗帽变换 3、哈达玛变换、哈达玛变换 哈达玛变换定义为:哈达玛变换定义为:IH=HX哈达玛矩阵为一个对称的正哈达玛矩阵为一个对称的正交矩阵,其变换核为交矩阵,其变换核为 H由哈达玛变换核可知,哈达由哈达玛变换核可知,哈达玛变换实际是将坐标轴
6、旋玛变换实际是将坐标轴旋转了转了45的正交变换的正交变换 哈达玛矩阵的维数哈达玛矩阵的维数N总是总是2的倍数,即的倍数,即N=2m(m=1,2)其中其中m称为矩阵的阶,每个高阶哈达玛矩阵都由其低称为矩阵的阶,每个高阶哈达玛矩阵都由其低一阶的哈达玛矩阵按如下一阶的哈达玛矩阵按如下取二阶哈达玛变换矩阵 以以MSS4,5,6,7四波段的陆地卫星图像的四波段的陆地卫星图像的哈达玛为换为例哈达玛为换为例: IH=HXIH=(h0 h3 h1 h2)Th0=(x4+x5)+(x6+x7)h1=( x4+x5)-( x6+x7)h2=( x4-x5)-( x6-x7)h3= ( x4-x5)+( x6-x7
7、) 有: h0 1 1 x4+5 h1 1 -1 x6+7 h2 1 1 x4-5 h3 1 -1 x6-7=将它们投影到以将它们投影到以X4+5 X6+7 和和X4-5 X6-7形成形成的二个二维空间上的二个二维空间上 特征图像特征图像h0集中了大量的土壤信息,并且对集中了大量的土壤信息,并且对于把水同土壤与植被的混合体区分开来是于把水同土壤与植被的混合体区分开来是有效的。有效的。而而h1则有利于提取植被信息,即有利于把植则有利于提取植被信息,即有利于把植被同水和土壤的混合体区分开来。被同水和土壤的混合体区分开来。h3和和h2主要表现为噪声图像,通常在特征选主要表现为噪声图像,通常在特征选择
8、过程中可把其舍去,以达到数据压缩的择过程中可把其舍去,以达到数据压缩的目的。目的。 4、比值变换和生物量指、比值变换和生物量指标变换标变换比值变换图像用作比值变换图像用作分类有许多优点,它分类有许多优点,它可以增强土壤,植被,可以增强土壤,植被,水之间的辐射差别,水之间的辐射差别,压抑地形坡度和方向压抑地形坡度和方向引起的辐射量变化。引起的辐射量变化。从图中可以看出植从图中可以看出植物与土壤在物与土壤在7波段上有波段上有混淆;植物与水在混淆;植物与水在5波波段上有混淆。经变换段上有混淆。经变换后,植物与土壤和水后,植物与土壤和水都分离开来,因此可都分离开来,因此可独立地对绿色植物量独立地对绿色
9、植物量进行统计,因而得名。进行统计,因而得名。 二二 特征选择特征选择选择一组最佳的特征影像进行分类,这选择一组最佳的特征影像进行分类,这就称为特征选择。就称为特征选择。1、距离测度距离、距离测度距离:如果所选择的一组特征能使感兴如果所选择的一组特征能使感兴趣类别的类内距离最小,而与其它类别的类间距趣类别的类内距离最小,而与其它类别的类间距离最大,那么根据距离测度;用这组特征设计的离最大,那么根据距离测度;用这组特征设计的分类器分类效果最好。实际可使用标准化距离,分类器分类效果最好。实际可使用标准化距离,类别均值间的标准化距离公式为:类别均值间的标准化距离公式为: 类时间标准化距离越大的特征影
10、像可分性越好类时间标准化距离越大的特征影像可分性越好 2、散布矩阵测度、散布矩阵测度除了距离测度之外,实际应用中还经常除了距离测度之外,实际应用中还经常采用一种散布矩阵的方式来度量类别的可采用一种散布矩阵的方式来度量类别的可分性,它是用矩阵形式来表示模式类别在分性,它是用矩阵形式来表示模式类别在特征空间中的散布情况。特征空间中的散布情况。(1)类内散布矩阵)类内散布矩阵Sw类内散布矩阵表示属于某一类别的模式在其类内散布矩阵表示属于某一类别的模式在其均值周围的散布情况,对于均值周围的散布情况,对于m类别情况,总的类类别情况,总的类内散布矩阵可以写成各类别类内散布矩阵的先验内散布矩阵可以写成各类别
11、类内散布矩阵的先验概率概率P(Wi) 加权和,即:加权和,即:式中: m所关心的类别总数 P(Wi) 类的先验概率 i 类的协方差矩阵 (2)类间散布矩阵)类间散布矩阵Sb 类间散布矩阵表示了不同类别间相互散布的类间散布矩阵表示了不同类别间相互散布的程度。类似地,对于程度。类似地,对于m类别情况,总的类间散布类别情况,总的类间散布矩阵也采用先验概率矩阵也采用先验概率 加数和表示加数和表示式中:式中: M0是全体模式的均值向量是全体模式的均值向量 Mi Wi的均值向量的均值向量(3)总体散布矩阵Sm Sm = Sw +Sb至此,完成了分类前预处理的一项重要至此,完成了分类前预处理的一项重要工作,
12、工作,特征变换和特征选择特征变换和特征选择,下面就进入,下面就进入分类处理阶段的工作。分类处理阶段的工作。 自动识别分类监督分类法非监督分类法一一 监督法分类监督法分类 意味着对类别已有一定的先验知识,利意味着对类别已有一定的先验知识,利用用“训练样区训练样区”的数据去的数据去“训练训练”判决函判决函数就建立了每个类别的分类器数就建立了每个类别的分类器,然后按照分然后按照分类器对未知区域进行分类。类器对未知区域进行分类。原始遥感图像原始遥感图像对应的专题图像对应的专题图像1)确定每个类别的样区2)学习或训练3)确定判别函数和相应的判别准则4)计算未知类别的样本观测值函数值5)按规则进行像元的所
13、属判别(一一) 判决函数和判决规则判决函数和判决规则 判决函数判决函数:当各个类别的判别区域确定后,用当各个类别的判别区域确定后,用来表示和鉴别某个特征矢量属于哪个类别来表示和鉴别某个特征矢量属于哪个类别的函数。的函数。 判别规则判别规则当计算完某个矢量,在不同类别判决函当计算完某个矢量,在不同类别判决函数中的值后,我们要确定该矢量属于某类数中的值后,我们要确定该矢量属于某类必须给出一个判断的依据。必须给出一个判断的依据。 这种判断的依据,我们称之为判别规则。这种判断的依据,我们称之为判别规则。 判断特征矢量属于某类的依据判断特征矢量属于某类的依据概率判别函数:概率判别函数:把某特征矢量(把某
14、特征矢量(X)落入某类集)落入某类集群群 的条件概率的条件概率 当成分类判决函数(当成分类判决函数(概率判决概率判决函数函数)贝叶斯判别规则:贝叶斯判别规则:把把X落入某集群落入某集群wi的条件概率的条件概率P (wi/X)最大的类为最大的类为X的类别的类别贝叶斯判别规则以错分概率或风险最小为准则的贝叶斯判别规则以错分概率或风险最小为准则的判别规则。判别规则。 1、概率判决函数和贝叶斯判决规则、概率判决函数和贝叶斯判决规则根据贝叶斯公式可得:P (wi) wi 类出现的概率,也称先验概率。类出现的概率,也称先验概率。P (wi/X)在在wi 类中出现类中出现X的条件概率,的条件概率, 也称也称
15、wi 类的似然概率。类的似然概率。P (X/wi) X属于属于wi 的后验概率。的后验概率。 由于由于P (X) 对各个类别都是一个常数对各个类别都是一个常数,故可略去所以,判决函数可用下式表示:故可略去所以,判决函数可用下式表示: )()/()(iiiPXPXd)()()/()/(XPPXPXPiii为了计算方便,将上式可以用取对数方式来处理。即 同类地物在特征空间服从 正态分布,则类别 的概率密度函数: )(ln|ln212ln2)()(21)(1iiiiTiiPnMXMXXd)(ln)/(ln)(iiiPXPXd)()(21exp)2()/(12/2/ 1MXMXXPTn去掉与去掉与i值
16、无关的项对分类结果没有影响,因此上式值无关的项对分类结果没有影响,因此上式可简化为:可简化为: 相应的贝叶斯判决规则为:相应的贝叶斯判决规则为:若对于所有可能的若对于所有可能的 j =1,2,m; ji 有有 , 则则X属于属于 类。类。根据概率判决函数和贝叶斯判决规则来进行的分类根据概率判决函数和贝叶斯判决规则来进行的分类通常称为最大似然分类法。通常称为最大似然分类法。 )(ln|ln21)()(21)(1iiiiTiiPMXMXXd贝叶斯判决规则是以错分概率最小的最优准则 判别边界 当使用概率判别函数进行分类时,不可避免地会出现错分现象。 分类错误的总概率2、距离判决函数和判决规则、距离判
17、决函数和判决规则基本思想是设法计算未知矢量基本思想是设法计算未知矢量X到有关到有关类别集群之间的距离,哪类距离它最近,类别集群之间的距离,哪类距离它最近,该未知矢量就属于那类。该未知矢量就属于那类。概率判决函数那样偏重于集群分布的概率判决函数那样偏重于集群分布的统统计性质计性质,距离判决函数偏重于集群分布的,距离判决函数偏重于集群分布的几何位置几何位置。 根据距离判决函数分类距离判别规则是按最小距离判别的原则距离判别规则是按最小距离判别的原则 马氏(马氏(Mahalanobis)距离)距离 欧氏(欧氏(Euclidean)距离)距离 计程(计程(Taxi)距离)距离 基于距离判别函数和判别规则
18、,在实践中以基于距离判别函数和判别规则,在实践中以此为原理的分类方法称为最小距离分类法。此为原理的分类方法称为最小距离分类法。 )()(1iiTiMiMXMXd马氏距离几何意义:马氏距离几何意义:X X到类重心之间的加权距到类重心之间的加权距离,其权系数为协方差。离,其权系数为协方差。 判别函数:在各类别先验概率和判别函数:在各类别先验概率和集群体积集群体积| 都都相同情况下的概率判别函数相同情况下的概率判别函数则有 在马氏距离的基础上,作下列限制在马氏距离的基础上,作下列限制将协方差矩阵限制为对角的将协方差矩阵限制为对角的沿每一特征轴的方差均相等沿每一特征轴的方差均相等2)()(iiTiEi
19、MXMXMXd欧氏距离是马氏距离用于分类集群的形状欧氏距离是马氏距离用于分类集群的形状都相同情况下的特例。都相同情况下的特例。 则有 X到集群中心在多维空间中距离的绝对值到集群中心在多维空间中距离的绝对值之总和来表示之总和来表示 mjijTiMXd1|3、其它的判决函数和判决规则、其它的判决函数和判决规则 盒式分类法基本思想盒式分类法基本思想: 以一个包括该集群的以一个包括该集群的“盒子盒子”作为该集作为该集群的群的判别函数判别函数。判决规则判决规则为若未知矢量为若未知矢量X落入该落入该“盒盒子子”,则,则X分为此类,否则再与其它盒子比分为此类,否则再与其它盒子比较。较。例如例如对于对于A类的
20、盒子,类的盒子,其边界(最小值和最其边界(最小值和最大值)分别是大值)分别是X1=a、X1=b;X2=c、X2=d。这种分类法在盒子重这种分类法在盒子重叠区域有错分现象。叠区域有错分现象。错分与比较盒子的先错分与比较盒子的先后次序有关。后次序有关。 原始影像数据的准备原始影像数据的准备图像变换及特征选择图像变换及特征选择分类器的设计分类器的设计初始类别参数的确定初始类别参数的确定逐个像素的分类判别逐个像素的分类判别形成分类编码图像形成分类编码图像输出专题图输出专题图 选择样本区域计算每个类别的 M 和 ,建立类别的判别函数水老城区新城区植被红红255255耕地0蓝蓝255?老城区老城区(三三)
21、 影响监督分类精度的几个方面影响监督分类精度的几个方面: 1. 特征变换和特征选择特征变换和特征选择根据感兴趣地物的特征进行有针对性的根据感兴趣地物的特征进行有针对性的特征变换,加快分类速度,提高分类精度。特征变换,加快分类速度,提高分类精度。 2. 分类的类别数与实际是否相符分类的类别数与实际是否相符? 3. 训练样区的选择训练样区的选择训练样区的选择要注意训练样区的选择要注意准确性、代表性准确性、代表性和统计性和统计性三个问题。三个问题。准确性就是要确保选择的样区与实际地准确性就是要确保选择的样区与实际地物的一致性物的一致性代表性一方面指所选择区为某一地物的代表性一方面指所选择区为某一地物
22、的代表,另一方面还要考虑到地物本身的复代表,另一方面还要考虑到地物本身的复杂性,所以必须在一定程度上反映同类地杂性,所以必须在一定程度上反映同类地物光谱特性的波动情况物光谱特性的波动情况统计性是指选择的训练样区内必须有足统计性是指选择的训练样区内必须有足够多的像元。够多的像元。4 . 判决函数和判决规则判决函数和判决规则优点:优点: .根据应用目的和区域,有选择的决定分类类别,根据应用目的和区域,有选择的决定分类类别,避免出现一些不必要的类别;避免出现一些不必要的类别; .可以控制训练样本的选择可以控制训练样本的选择 .可以通过检查训练样本来决定训练样本是否被精可以通过检查训练样本来决定训练样
23、本是否被精确分类,从而避免分类中的严重错误确分类,从而避免分类中的严重错误,分类精分类精度高度高 . 避免了非监督分类中对光谱集群的重新归类避免了非监督分类中对光谱集群的重新归类 .分类速度快分类速度快 主观性;主观性; 由于图象中间类别的光谱差异,使得训练样本由于图象中间类别的光谱差异,使得训练样本没有很好的代表性;没有很好的代表性; 训练样本的获取和评估花费较多人力时间;训练样本的获取和评估花费较多人力时间; 只能识别训练中定义的类别。只能识别训练中定义的类别。 监督法分类的基本思想 最大似然法和最小距离法分类的原理 错分情况分析二二 非监督分类非监督分类仅凭遥感影像地物的光谱特征的分布规
24、仅凭遥感影像地物的光谱特征的分布规律,即自然聚类的特性,进行律,即自然聚类的特性,进行“盲目盲目”的的分类;分类;其分类的结果只是对不同类别达到了区其分类的结果只是对不同类别达到了区分,但并不能确定类别的属性;其类别的分,但并不能确定类别的属性;其类别的属性是通过分类结束后目视判读或实地调属性是通过分类结束后目视判读或实地调查确定的。查确定的。一般的聚类算法是先选择若干个模式点一般的聚类算法是先选择若干个模式点作为聚类的作为聚类的中心中心。每一中心代表一个类别,按照某种相似每一中心代表一个类别,按照某种相似性度量方法(如最小距离方法)将各模式性度量方法(如最小距离方法)将各模式归于各聚类中心所
25、代表的类别,形成归于各聚类中心所代表的类别,形成初始初始分类。分类。然后由聚类准则判断初始分类是否合理,然后由聚类准则判断初始分类是否合理,如果不合理就修改分类,如此如果不合理就修改分类,如此反复迭代运反复迭代运算算,直到合理为止。,直到合理为止。(一一) K-均值聚类法均值聚类法K-均值算法的聚类均值算法的聚类准则准则是使每一聚类中,是使每一聚类中,多模式点到该类别的中心的距离的平方和多模式点到该类别的中心的距离的平方和最小。最小。 基本思想基本思想是:通过迭代,逐次移动各类的是:通过迭代,逐次移动各类的中心,直至得到最好的聚类结果为止。中心,直至得到最好的聚类结果为止。K 均值算法要求各类
26、样本到聚类中心的距离平方和最小,它是在误差平方和准则的基础上建立起来的。其步骤如下: (1)任选 K 个初始聚类中心 1,1,121kzzz。一般以开头 K 个样本作为初始中心。 (2) 逐个将模式样本集x的每一样本按最小距离原则分配给 K 个聚类中心,形成 K 个类群,即在第 m 次迭代时,若 jiKimzxmzxij, 2 , 1, 则 mfxj,这里 mfj表示第 m 次迭代时,以第 j 个聚类中心为代表的聚类域。 (3)由(2) ,计算新的聚类中心,即 KixNmzmfxiii, 2 , 111 式中iN为第i个聚类域 mfj中的样本个数。其均值向量作为新的聚类中心,因为这样可以使误差
27、平方和准则函数 mfxiiKimzxJ, 2 , 112 达到最小值。 (4)若 Kimzmzii, 2 , 1,1,算法收敛,计算完毕。否则回到(2) ,进行下一次迭代。 缺点缺点:这种算法的结果受到所选聚类中心这种算法的结果受到所选聚类中心的数目和其初始位置以及模式分布的几何的数目和其初始位置以及模式分布的几何性质和读入次序等因素的影响,并且在迭性质和读入次序等因素的影响,并且在迭代过程中又没有调整类数的措施,因此可代过程中又没有调整类数的措施,因此可能产生不同的初始分类得到不同的结果。能产生不同的初始分类得到不同的结果。(二二) ISODATA算法聚类分析算法聚类分析 可以可以自动地进行
28、类别的自动地进行类别的“合并合并”和和“分裂分裂”,从而得到类数比较合理的聚,从而得到类数比较合理的聚类结果。类结果。 选定初始类别中心选定初始类别中心输入迭代限值参数输入迭代限值参数:I,Tn, TS ,TC对样本像素进行聚类并统计对样本像素进行聚类并统计ni,m,ni TS 确定分裂后的中心确定分裂后的中心DIK TC 确定并类后的中心确定并类后的中心输出输出否否否否是是否否否否是是ISODATA算法过程框图算法过程框图 每类集群允许每类集群允许 的最大标准差的最大标准差 集群允许的最集群允许的最 短距离短距离 每类集群至少每类集群至少的点数的点数 是是迭代次数迭代次数(三三) 平行管道法
29、聚类分析平行管道法聚类分析 它以地物的它以地物的光谱特性曲线为基础光谱特性曲线为基础,同,同类地物在特征空间上表现为以特征曲线类地物在特征空间上表现为以特征曲线为中心,以相似阈值为半径的管子,此为中心,以相似阈值为半径的管子,此即为所谓的即为所谓的“平行管道平行管道”。 这种聚类方法实质上是一种基于最邻这种聚类方法实质上是一种基于最邻近规则的试探法。近规则的试探法。 通过非监督法将一定区域聚类成不同的通过非监督法将一定区域聚类成不同的单一类别,监督法再利用这些单一类别区单一类别,监督法再利用这些单一类别区域域“训练训练”计算机。使分类计算机。使分类精度精度得到保证得到保证的前提下,分类的前提下
30、,分类速度速度得到了提高。得到了提高。 一分类后处理一分类后处理1、分类后专题图像的格式、分类后专题图像的格式遥感影像经分类后形成的专题图,用编号、遥感影像经分类后形成的专题图,用编号、字符、图符或颜色表示各种类别。字符、图符或颜色表示各种类别。原始遥感图像对应的专题图像2、 分类后处理分类后处理用光谱信息对影像逐个像元地分类,在用光谱信息对影像逐个像元地分类,在结果的分类地图上会出现结果的分类地图上会出现“噪声噪声”产生噪声的原因有原始影像本身的噪声,产生噪声的原因有原始影像本身的噪声,在地类交界处的像元中包括有多种类别,在地类交界处的像元中包括有多种类别,其混合的幅射量造成错分类,以及其它
31、原其混合的幅射量造成错分类,以及其它原因等。因等。另外还有一种现象,分类是正确的,但另外还有一种现象,分类是正确的,但某种类别零星分布于地面,占的面积很小,某种类别零星分布于地面,占的面积很小,我们对大面积的类型感兴趣,因此希望用我们对大面积的类型感兴趣,因此希望用综合的方法使它从图面上消失。综合的方法使它从图面上消失。多数平滑多数平滑:平滑时中心像元值取周围占多数的 类别。 二分类后的误差分析二分类后的误差分析利用一些样本对分类误差进行估计。利用一些样本对分类误差进行估计。采集样本的方式有三种类型:采集样本的方式有三种类型: 来自监督分类的训练样区;来自监督分类的训练样区; 专门选定的试验场
32、;专门选定的试验场; 随机取样。随机取样。 混淆矩阵 分类精度的评定 实际类别 试验像元的百分比%类别1 类别2 类别3 试验像元 1 2 3 84.3 4.9 10.8 8.5 80.3 11.2 6.1 4.1 89.8100% 102100% 152100% 49平均精度平均精度 S =(84.3%+80.3%+89.8%)/3=84.8%加权平均精度加权平均精度 S =(84.3%*102+80.3%*152+89.8%*49)/(102+152+49)=83.2%一高程信息在遥感图像分类中的应用一高程信息在遥感图像分类中的应用1.地面高程地面高程“影像影像”可以直接与多光谱影像可以直
33、接与多光谱影像一起对分类器进行训练一起对分类器进行训练 2.将地形分成一些较宽的高程带,将多光谱将地形分成一些较宽的高程带,将多光谱影像按高程带切片(或分层),然后分别影像按高程带切片(或分层),然后分别进行分类。进行分类。 3. 智能的方法智能的方法 (神经元网络方法等神经元网络方法等)二纹理信息在遥感图像分类中的应用二纹理信息在遥感图像分类中的应用 纹理信息提取纹理信息提取:目前用得比较多的方法包目前用得比较多的方法包括:共生矩阵法、分形维方法、马尔可夫括:共生矩阵法、分形维方法、马尔可夫随机场方法等。随机场方法等。1.纹理影像直接与多光谱影像一起对分类器纹理影像直接与多光谱影像一起对分类
34、器进行训练进行训练2.先利用多光谱信息对遥感图像进行自动分先利用多光谱信息对遥感图像进行自动分类。再利用纹理特征对光谱分类的结果进类。再利用纹理特征对光谱分类的结果进行进一步的细分行进一步的细分3. 智能的方法智能的方法 (神经元网络方法等神经元网络方法等)一面向对象的遥感信息提取一面向对象的遥感信息提取问题的提出问题的提出 基于像素级别的信息提取以单个像素为基于像素级别的信息提取以单个像素为单位单位,过于着眼于局部而忽略了附近整片图过于着眼于局部而忽略了附近整片图斑的几何结构情况,从而严重制约了信息斑的几何结构情况,从而严重制约了信息提取的精度提取的精度方法方法 首先对图像数据进行影像首先对
35、图像数据进行影像分割分割,影像的最影像的最小单元不再是单个的像素,而是一个个小单元不再是单个的像素,而是一个个对对象象(图斑图斑), 后续的影像分析和处理也都基于后续的影像分析和处理也都基于对象进行。对象进行。 优点优点 面向对象的遥感信息提取,综合考虑了面向对象的遥感信息提取,综合考虑了光谱统计特征、形状、大小、纹理、相邻光谱统计特征、形状、大小、纹理、相邻关系等一系列因素,因而具有更高精度的关系等一系列因素,因而具有更高精度的分类结果。分类结果。二神经元网络方法二神经元网络方法 (Artificial Neural Netwroks,简称,简称ANN) 人工神经网络人工神经网络是由具有适应
36、性的简单单是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体作能够模拟生物神经系统对真实世界物体作出交互反应。出交互反应。 ANN与经典计算方法相比与经典计算方法相比 ANN对处理大量原始数据而不能用对处理大量原始数据而不能用规则或公式描述的问题规则或公式描述的问题, 表现出极大的灵活表现出极大的灵活性和自适应性。性和自适应性。 前馈型前馈型BP网络即误差逆传播神经网络是网络即误差逆传播神经网络是最常用、最流行的神经网络。最常用、最流行的神经网络。BP网络建模特点:网络建模特点:非线性映照能力非线性映照能力:神经网络
37、能以任意精度逼近任何非线性连续函:神经网络能以任意精度逼近任何非线性连续函数。在建模过程中的许多问题正是具有高度的非线性。数。在建模过程中的许多问题正是具有高度的非线性。并行分布处理方式并行分布处理方式:在神经网络中信息是分布储存和并行处理的,:在神经网络中信息是分布储存和并行处理的,这使它具有很强的容错性和很快的处理速度。这使它具有很强的容错性和很快的处理速度。自学习和自适应能力自学习和自适应能力:神经网络在训练时,能从输入、输出的数:神经网络在训练时,能从输入、输出的数据中提取出规律性的知识,记忆于网络的权值中,并具有泛化能据中提取出规律性的知识,记忆于网络的权值中,并具有泛化能力,即将这
38、组权值应用于一般情形的能力。神经网络的学习也可力,即将这组权值应用于一般情形的能力。神经网络的学习也可以在线进行。以在线进行。 数据融合的能力:数据融合的能力:神经网络可以同时处理定量信息和定性神经网络可以同时处理定量信息和定性信息,因此它可以利用传统的工程技术(数值运算)和人信息,因此它可以利用传统的工程技术(数值运算)和人工智能技术(符号处理)。工智能技术(符号处理)。 多变量系统:多变量系统:神经网络的输入和输出变量的数目是任意的,神经网络的输入和输出变量的数目是任意的,对单变量系统与多变量系统提供了一种通用的描述方式。对单变量系统与多变量系统提供了一种通用的描述方式。基本基本BP网络的
39、拓扑结构网络的拓扑结构b1bia1c1cqcjahbpanWp1WiqWpjW1qW1jWijV11W11WpqWi1Vh1VhiV1iVn1VniV1pVhpVnp1kckjckqckhakna1ka输出层输出层LC隐含层隐含层LB输入层输入层LAWVBP网络的训练就是通过应用误差反传原理不网络的训练就是通过应用误差反传原理不断调整网络权值使网络模型输出值与已知的训练断调整网络权值使网络模型输出值与已知的训练样本输出值之间的误差平方和达到最小或小于某样本输出值之间的误差平方和达到最小或小于某一期望值。一期望值。由于由于BP网络采用误差反传算法,其实质是一网络采用误差反传算法,其实质是一个无约
40、束的非线性最优化计算过程,在网络结构个无约束的非线性最优化计算过程,在网络结构较大时不仅计算时间长,而且很容易限入较大时不仅计算时间长,而且很容易限入局部极局部极小点小点而得不到最优结果。而得不到最优结果。学习率影响系统学习过程的稳定性学习率影响系统学习过程的稳定性大的学习率可能使网络权值每一次的修正量过大,甚大的学习率可能使网络权值每一次的修正量过大,甚至会导致权值在修正过程中超出某个误差的极小值呈不规至会导致权值在修正过程中超出某个误差的极小值呈不规则跳跃而不收敛;则跳跃而不收敛;但过小的学习率导致学习时间过长,不过能保证收敛但过小的学习率导致学习时间过长,不过能保证收敛于某个极小值。所以
41、,一般倾向选取较小的学习率以保证于某个极小值。所以,一般倾向选取较小的学习率以保证学习过程的收敛性(稳定性),通常在学习过程的收敛性(稳定性),通常在0.010.8之间。之间。决策树分类器 决策树分类器 三三 决策树分类法决策树分类法 一个较大的决策树中可以使用不同的分类一个较大的决策树中可以使用不同的分类算法,称之为算法,称之为复合决策树复合决策树 即通过在一个决策空间内使用不同的分类即通过在一个决策空间内使用不同的分类算法可使一些特定子类和特定子数据集的算法可使一些特定子类和特定子数据集的划分更为准确。划分更为准确。 复合决策树的最大优点在于它可以用来复合决策树的最大优点在于它可以用来处理
42、复杂的分类问题处理复杂的分类问题,使该算法更具弹性和使该算法更具弹性和扩展性,分类精度也大为提高。扩展性,分类精度也大为提高。 四四 专家系统方法专家系统方法 将某一领域的专家分析方法或经验,对将某一领域的专家分析方法或经验,对对象的多种属性进行分析、判断,确定事对象的多种属性进行分析、判断,确定事物的归属。其核心内容是物的归属。其核心内容是知识库和推理机知识库和推理机专家系统的特长:专家系统的特长: 1)灵活性。专家系统可能具有大量的知识,并且其知识库可以按照一定的规则增加、修改和删除知识以适应应用的需要。 2)持久性。系统贮存的知识是持久的,它不像人类专家那样会退休、或者死亡,专家系统的知
43、识会无限地持续。3)具有解释、说明功能。专家系统能明确、详细具有解释、说明功能。专家系统能明确、详细地解释导出结论的推理过程。一个人可能会讨厌、地解释导出结论的推理过程。一个人可能会讨厌、不愿意或是没有能力给出详细而明确的推理过程。不愿意或是没有能力给出详细而明确的推理过程。4)复合专家知识。由多个专家复合起来的知识,)复合专家知识。由多个专家复合起来的知识,其水平肯定会超过某个单独的专家。其水平肯定会超过某个单独的专家。5)稳定、理智、及时和完整的响应。专家可能由)稳定、理智、及时和完整的响应。专家可能由于压力或疲劳而不能高效的解决问题,专家系统于压力或疲劳而不能高效的解决问题,专家系统可能
44、比专家反应得更加迅速或更有效。可能比专家反应得更加迅速或更有效。 五五 基于基于GIS的遥感图像分类方法的遥感图像分类方法 将原有的将原有的GIS数据和各种土地利用类型数据和各种土地利用类型变化的先验性知识综合集成用于新的遥感变化的先验性知识综合集成用于新的遥感图像的分类中,不仅可以促进图像的分类中,不仅可以促进GIS数据更新数据更新的自动化,而且还可以得到比常规最大似的自动化,而且还可以得到比常规最大似然法高的分类精度。然法高的分类精度。 提出从提出从GIS空间数据库中挖掘知识用以空间数据库中挖掘知识用以辅助遥感影像分类,以提高分类精度辅助遥感影像分类,以提高分类精度 六六 模糊分类方法模糊
45、分类方法 在分析事物的隶属关系,即分类时,一在分析事物的隶属关系,即分类时,一般须以某数学模型计算它对于所有集合的般须以某数学模型计算它对于所有集合的隶属度,然后根据隶属度的大小,确定归隶属度,然后根据隶属度的大小,确定归属。属。 模糊等价关系的模糊聚类步骤:模糊等价关系的模糊聚类步骤:(1)确定分类对象及所使用的属性。设分类对象的全体为 s=s1,s2,s3,sn,选定k个有关特征,每个分类对象均用相应的一组有k个特征值的向量来表示。nkjknkikjknkikijijxxxxr12121cos(2)原始数据标准化要构造模糊关系矩阵,必须对样本数据进行预处理,使样本数据压缩到0,1闭区间内,
46、首先求出n个样本的第j个指标的平均值和标准差。 原始数据标准化值为运用极值标准化公式,将标准化数据压缩到0,1闭区间内(3) 确立每一分类对象之间si与sj的模糊相似关系。相似系数法标定建立模糊相似矩阵R,引入相似系数rij这里表示两个样本与之间相似程度的变量,当rij接近于1,表明这两个样本越接近。(4)对相容矩阵复合模糊等价关系通过上述标定,得到模糊相似矩阵,反映了样本间的相似关系,但它只具有自反性和对称性,不具有传递性,此时,可以通过平方法得到R的传递闭包t(R),而t(R)就是论域上的一个模糊等价矩阵 R2=RR R2=R2 R2 0.8 0.2 0.5 0.7 R= S= 0.1 0.6 0.5 0.7 0.8 0.2 0.5 0.7 RS= 0.1 0.6 0.1 0 (0.80.5)(0.20.1) (0.80.7)(0.20) = (0.10.5)(0.60.1) (0.10.7)(0.60) 0.5 0.7 RS= 0.1 0.1 -两数取最小 -两数取最大(5)选择不同的 值,得到不同的水平截 集,得到动态聚类结果,生成动态聚类树 遥感图象分类的基础是什么? 影响分类精度的因素有哪些? 何为特征变换?我们所学的各种特征变换有何特点? 比较最大似然法与最小距离法的优缺点。 比较K均值法与ISODATA法的优缺点。 比较监督分类与非监督分类的优缺点。