1、 概概 论论 第一章第一章遥感信息工程学院1模式识别孙和利武汉大学遥感信息工程学院http:/ 论论 第一章第一章遥感信息工程学院2概 论 概概 论论 第一章第一章遥感信息工程学院3 3课程对象:遥感科学与技术专业本科生的专业课。成绩评定:1,作 业 10分2,期中测验 15分3,实 习 15分4,期末考试 60分课程对象与成绩评定课程对象与成绩评定 概概 论论 第一章第一章遥感信息工程学院4 4n统计学n概率论n线性代数(矩阵计算)n形式语言n机器学习n人工智能n图像处理n计算机视觉与模式识别相关的学科与模式识别相关的学科 概概 论论 第一章第一章遥感信息工程学院5 5理论教学:重点讲述模式
2、识别的基本概念,基本方法和算法原理。注重理论与实践紧密结合实例教学:通过实例讲述如何将所学知识运用到实际应用之中,避免引用过多的、繁琐的数学推导。教学方法教学方法 概概 论论 第一章第一章遥感信息工程学院6 6n掌握模式识别的基本概念和方法n运用所学知识和方法解决实际问题n研究新的模式识别的理论和方法奠定基础 教学目标教学目标 概概 论论 第一章第一章遥感信息工程学院7 7n基本:完成课程学习,通过考试,获得学分。n提高:能够将所学知识和内容用于课题研究,解决实际问题。n飞跃:通过模式识别的学习,改进思维方式,为将来的学习工作打好基础,终身受益。教学效果教学效果 概概 论论 第一章第一章遥感信
3、息工程学院8 8舒宁等,模式识别的理论与方法模式识别的理论与方法,武汉大学出版社,2004。边肇祺等,模式识别模式识别(第二版),清华大学出版社,2000。蔡元龙,模式识别模式识别,西北电讯工程学院出版社,1986。沈清、汤霖,模式识别导论模式识别导论,国防科技大学出版社,1991。教材教材/参考文献参考文献 概概 论论 第一章第一章遥感信息工程学院9 9本门课程的主要内容本门课程的主要内容第一章 概论第二章 贝叶斯决策理论第三章 判别函数与确定性分类器 第四章 聚类分析第五章 模式特征分析与选取 第六章 模糊集合理论在模式识别中的应用 第七章 句法模式识别第八章 神经网络在模式识别中的应用
4、概概 论论 第一章第一章遥感信息工程学院1010第一章第一章 概概 论论 1.1 1.1 模式识别基础模式识别基础1.2 1.2 模式识别系统及模式识别方法模式识别系统及模式识别方法1.3 1.3 模式识别应用模式识别应用1.4 1.4 模式识别基本问题模式识别基本问题 概概 论论 第一章第一章遥感信息工程学院11111.1 1.1 模式识别基础模式识别基础一一.模式识别模式识别 n模式(pattern)-存在于时间,空间中可观察的事物,具有时间 或空间分布的信息。-识别的对象,是对客体定量的或结构的描述。广义地说,存在于时间和空间中可观察的物体,如果我们可以区别它们是否相同或是否相似,都可以
5、称之为模式。模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息。概概 论论 第一章第一章遥感信息工程学院1212n模式的直观特性:可观察性可区分性相似性 1.1 1.1 模式识别基础模式识别基础 概概 论论 第一章第一章遥感信息工程学院1313n模式识别模式识别(Pattern Recognition)(Pattern Recognition)-用计算机实用计算机实现人对各种事物或现象的分析现人对各种事物或现象的分析,描述描述,判断判断,识别识别。物体识别:飞机、坦克人的识别:王同学、赵先生声音识别:鸡鸣、狗叫气味识别:油闷大虾、烧排骨F模式识别能力对人
6、和动物来说是极其平常的,但对计算机来说却是非常困难的。n模式类-具有共同特征的模式的集合。n识 别-对模式类的分辨,判断,分类。1.1 1.1 模式识别基础模式识别基础 概概 论论 第一章第一章遥感信息工程学院1414n模式识别的研究目的:目的:1 1、利用计算机对物理对象进行分类,在错误概、利用计算机对物理对象进行分类,在错误概率最小的条件下,使识别的结果尽量与客观物体率最小的条件下,使识别的结果尽量与客观物体相符合。相符合。2、提高计算机的感知能力,开拓计算机的应用。、提高计算机的感知能力,开拓计算机的应用。Y=F(X X)X的定义域取自特征集Y的值域为类别的标号集F是模式识别的判别方法1
7、.1 1.1 模式识别基础模式识别基础 概概 论论 第一章第一章遥感信息工程学院1515n模式识别的研究模式识别的研究主要集中在两方面:模式识别的研究主要集中在两方面:F研究生物体研究生物体(包括人包括人)是如何感知对象的,是是如何感知对象的,是生理学家、心理学家、生物学家、神经生理生理学家、心理学家、生物学家、神经生理学家的研究内容,属于认知科学的范畴;学家的研究内容,属于认知科学的范畴;F研究在给定的任务下,如何用计算机实现模研究在给定的任务下,如何用计算机实现模式识别的理论和方法。是数学家、信息学专式识别的理论和方法。是数学家、信息学专家和计算机科学工作者的研究内容。家和计算机科学工作者
8、的研究内容。1.1 1.1 模式识别基础模式识别基础 概概 论论 第一章第一章遥感信息工程学院1616模式识别是模拟人的某些功能 F模拟人的视觉:计算机+光学系统F模拟人的听觉:计算机+声音传感器F模拟人的嗅觉和触觉:计算机+传感器n模式识别与图象识别,图象处理的关系模式识别与图象识别,图象处理的关系1.1 1.1 模式识别基础模式识别基础 概概 论论 第一章第一章遥感信息工程学院1717二二.模式识别的发展史模式识别的发展史1929年 G.Tauschek发明阅读机,能够阅读0-9的数字。30年代 Fisher提出统计分类理论,奠定了统计模式识别的基础。因此,在6070年代,统计模式识别发展
9、很快,但由于被识别的模式愈来愈复杂,特征也愈多,就出现“维数灾难”。但由于计算机运算速度的迅猛发展,这个问题得到一定克服。统计模式识别仍是模式识别的主要理论。1.1 1.1 模式识别基础模式识别基础 概概 论论 第一章第一章遥感信息工程学院181850年代 Noam Chemsky 提出形式语言理论,美籍华人付京荪 提出句法结构模式识别。60年代 L.A.Zadeh提出了模糊集理论,模糊模式识别理论得到了较广泛的应用。80年代 Hopfield提出神经元网络模型理论。近些年人工神经元网络在模式识别和人工智能上得到较广泛的应用。90年代 小样本学习理论,支持向量机也受到了很大的重视。1.1 1.
10、1 模式识别基础模式识别基础 概概 论论 第一章第一章遥感信息工程学院1919三三.关于模式识别的主要期刊和会议关于模式识别的主要期刊和会议 IEEE IEEE Trans.OnTrans.On PAMI,NN PAMI,NN Pattern RecognitionPattern Recognition图形识别图形识别英国英国 Pattern Recognition LettersPattern Recognition Letters模式识别快模式识别快报报荷兰荷兰 Machine LearningMachine Learning机器学习机器学习 TelematicsTelematics an
11、d Informatics and Informatics远距通信与信远距通信与信息学息学英国英国 Computational GeometryComputational Geometry计算几何学计算几何学荷兰荷兰 Discrete and Computational GeometryDiscrete and Computational Geometry离离散与计算几何学散与计算几何学美国美国 模式识别与人工智能模式识别与人工智能中国中国1.1 1.1 模式识别基础模式识别基础 概概 论论 第一章第一章遥感信息工程学院20201973年,年,IEEE发起了第一次关于模式识别的国际会议发起了第
12、一次关于模式识别的国际会议“ICPR”,成立了国际模式识别协会,成立了国际模式识别协会-“IAPR”,每,每2年召年召开一次国际学术会议开一次国际学术会议1977年年 IEEE的计算机学会成立了模式分析与机器智能的计算机学会成立了模式分析与机器智能(PAMI)委员会,每)委员会,每2年召开一次模式识别与图象处理年召开一次模式识别与图象处理学术会议。学术会议。国内的组织有电子学会,通信学会,自动化协会,中文国内的组织有电子学会,通信学会,自动化协会,中文信息学会信息学会.。AAAI(1):美国人工智能学会美国人工智能学会AAAI的年会的年会 ICPR:模式识别方面的会议,:模式识别方面的会议,I
13、EEE主办主办CVPR:计算机视觉和模式识别方面的会议计算机视觉和模式识别方面的会议,IEEE主办主办ICML:机器学习方面的会议,机器学习方面的会议,IMLS主办主办 COLT:计算学习理论方面的会议计算学习理论方面的会议,ACM主办主办 NIPS:神经计算方面的会议神经计算方面的会议,NIPS主办主办ICCV:计算机视觉方面的会议,:计算机视觉方面的会议,IEEE主办主办1.1 1.1 模式识别基础模式识别基础 概概 论论 第一章第一章遥感信息工程学院2121数据获取预处理表征形状变换分类决策模式表示模式空间特征空间特征选择 特征提取基元选择 基元抽取分类系统设计(学习、分类、评估、调整)
14、决策一、模式识别系统的基本构成一、模式识别系统的基本构成一个计算机模式识别系统基本上是由三个相互关联而又有明显区别的过程组成的,即数据获取、模式表示(数据处理)和分类决策(模型匹配)。1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院2222n 数据获取:通过各种传感器把被研究对象的各种物理变量转换为计算机可以接受的数值或符号(串)集合。习惯上,称这种数值或符号(串)所组成的空间为模式空间。二维图像:文字、指纹、地图、照片等一维波形:脑电图、心电图、季节震动波形等物理参量和逻辑值:体温、化验数据、参量正常与否的描述1.21.2模式识别系统
15、及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院2323l 预处理:为了从这些数字或符号(串)中抽取出对识别有效的信息,必须对它进行处理,其中包括:消除噪声,排除不相干的信号提取有用信息,并对输入测量仪器或其它因素所造成的退化现象进行复原(图像处理)与对象的性质和采用的识别方法密切相关的特征的计算(如表征物体的形状、周长、面积等等)必要的变换(如为得到信号功率谱所进行的快速傅里叶变换)等。1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院2424n 模式表示(数据处理):模式表示(数据处理):是对数据进行
16、加工,包括特征选择、特征提取、数据维数压缩和决定可能存在的类别等。通过特征选择和提取或基元选择形成模式的特征空间。以后的分类决策或模型匹配就在特征空间的基础上进行。系统的输出或者是对象所属的类型或者是模型数据库中与对象最相似的模型编号。1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院2525l 表示:表示:表示是将客观数据或现象利用数值或者编码方式进行描述,从而使其在一定数学含义框架下彼此相关的过程。原始数据表示:原始数据表示:采样测量数据本身常规表示:常规表示:F统计表示模式=d个特征或测量值,目前应用最多 特征提取和选择:对原始数据
17、进行变换,得到最能反映分类本质的特征 测量空间:原始数据组成的空间 特征空间:进行分类识别的空间 特征选择:维数较高的测量空间维数较低的特征空间 特征提取:k-l变换、二维共生矩阵等1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院2626F结构化表示模式=子模式1+子模式2+子模式n=基元a+基元b+-符合人类习惯,但难以泛化。相异度表示:相异度表示:利用对象与特定对象集合的相异度来进行相对表示。相异度可以来源于原始数据,如图像、谱或时间样本,也可来源于原始的统计特征向量或结构特征表示,如字串、关系图等。主要应用于混合分类器。可视化表示
18、:可视化表示:数据可视化,通过交互引入人类知识(疾病医学诊断)。主要用于解决维数特高(数万维)、数据复现性差,半定量的数据这类问题。1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院2727l 识别系统设计:识别系统设计:主要功能是通过训练确定判决规则,使按此类判决规则决策时,错误率最低。把这些判决规则建成标准库。学习:有监督学习-使用分好类的样本集 无监督学习-自动分类分类:根据待分类事物的特征及分类规则进行分类评估:对分类结果进行评估调整:调整分类规则。主要任务是将学习方法或问题描述进行调整或扩展,使其更适合决策。n 分类决策:分类决
19、策:利用特征及分类规则对被识别对象进行识别1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院2828二、模式识别方法二、模式识别方法l 模式识别系统的目标:在特征空间和解释空间之间找到一种映射关系,这种映射也称之为假说。特征空间:从模式得到的对分类有用的度量、属性或基元构成的空间。解释空间:将c个类别表示为i ,i=1,2,c其中 为所属类别的集合,称为解释空间。1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院2929l假说的两种获得方法假说的两种获得方法监督学习、概念驱动或归纳假
20、说:在特征空间中找到一个与解释空间的结构相对应的假说。在给定模式下假定一个解决方案,任何在训练集中接近目标的假说也都必须在“未知”的样本上得到近似的结果。F依靠已知所属类别的的训练样本集,按它们特征向量的分布来确定假说(通常为一个判别函数),只有在判别函数确定之后才能用它对未知的模式进行分类;F对分类的模式要有足够的先验知识,通常需要采集足够数量的具有典型性的样本进行训练。1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院3030非监督学习、数据驱动或演绎假说:在解释空间中找到一个与特征空间的结构相对应的假说。这种方法试图找到一种只以特征
21、空间中的相似关系为基础的有效假说。F在没有先验知识的情况下,通常采用聚类分析方法,基于“物以类聚”的观点,用数学方法分析各特征向量之间的距离及分散情况;F如果特征向量集聚集若干个群,可按群间距离远近把它们划分成类;F这种按各类之间的相似程度的划分,若事先能知道应划分成几类,则可获得更好的分类结果。1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院3131l模式识别的方法 模板匹配 统计方法 概率分类法 判别分析法 (聚类分析)模糊方法 句法(结构)方法 神经网络方法1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论
22、论 第一章第一章遥感信息工程学院3232首先对每个类别建立一个或多个模版;输入样本和数据库中每个类别的模版进行比较;求相关或距离;根据相关性或距离大小进行决策。优点:直接、简单。缺点:适应性差。解决:形变模版n模板匹配方法模板匹配方法1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院3333根据训练样本,建立决策边界统计决策理论根据每一类总体的概率分布 决定决策边界。是一种监督分类的方法,分类 器是概念驱动的。判别分析方法给出带参数的决策边界,根 据某种准则,由训练样本决定“最优”的参数。是一种监督分类的方法,分类器是概念驱动的。n统计模
23、式识别方法统计模式识别方法1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院3434聚类分析聚类分析方法用某种相似性度量的方法将 原始数据组织成有意义的和有用的各种数据集。是一种非监督学习的方法,解决方案是数据驱 动的。统计模式识别方法统计模式识别方法优点:理论基础扎实,算法适用面广缺点:算法复杂、对于统计分类不明确的问题 难以求解(例如图像识别)1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院3535基于模糊数学理论,利用隶属函数描述事物的不确定性。使用模糊化的特征来进行模式分类
24、,同时给出模糊化的分类结果,可结合统计方法或句法方法来使用。识别根据研究对象对于某模糊子集的隶属程度采用最大隶属原则识别法、择近原则识别法,模糊聚类分析法对模式进行识别。优点:可提高分类器的性能,并可给出模糊化分类结果;缺点:隶属度函数和模糊推理规则受主观影响大。n模糊模式识别方法模糊模式识别方法1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院3636该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目的。许多复杂的模式可以分解为简单的子模式,这些子模式组成所谓“基元”;每个模式都可以由基元根据一定的关系来组成;基元可以认为是语言
25、中的字母,每个模式都可以认为是一个句子,关系可以认为是语法;模式的相似性由句子的相似性来决定;通过检查组成句子的模式基元的序列是否遵守某种规则,即句法规则或语法,来确定模式的类别。优点:适合结构性强的模式缺点:抗噪声能力差,计算复杂度高n句法模式识别方法句法模式识别方法1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院3737神经网络是受人脑组织的生理学启发而创立的。由一系列互相联系的、相同的单元(神经元)组成。相互间的联系可以在不同的神经元之间传递增强或抑制信号。增强或抑制是通过调整神经元相互间联系的权重系数来实现。神经网络可以实现监督
26、和非监督学习条件下的分类。利用人工神经元网络实现大规模并行计算,通过反馈式学习不断提高分类器性能-自适应、容错。优点:可以有效的解决一些复杂的非线性问题缺点:缺少有效的学习理论,算法不透明。n神经网络方法神经网络方法1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院38381.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法几种方法比较方法表达识别函数典型准则模板匹配样本,像元,曲线相关,距离度量分类错误统计方法特征决策函数分类错误模糊方法模糊矩阵隶属函数模糊分类错误句法方法基元规则,语法规则,语法接受错误神经网络样本,像元,
27、特征网络函数均值方差错误 概概 论论 第一章第一章遥感信息工程学院3939n在传送带上用光学传感器件对鱼按品种分类鲈鱼(Seabass)品种鲑鱼(Salmon)模式识别过程实例模式识别过程实例1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院4040n数据获取:架设一个摄像机,采集一些样本图像,获取样本数据。n预处理:去噪声,用一个分割操作把鱼和鱼之间以及鱼和背景之间分开。识别过程识别过程1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院4141n特征提取和选择:对单个鱼的信息进行特
28、征选择,从而通过测量某些特征来减少信息量。长度亮度宽度鱼翅的数量和形状嘴的位置,等等 n分类决策:把特征送入决策分类器。识别过程识别过程1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院42421.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院43431.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院44441.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院45451.21
29、.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院46461.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院47471.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院4848n数据采集n特征选取n模型选择n训练和测试n计算结果和复杂度分析,反馈模式分类器的评测过程模式分类器的评测过程1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院4949开始开始数据采集数据采集结束结束训练和测试
30、训练和测试计算结果和复杂度分析,反馈计算结果和复杂度分析,反馈特征选取特征选取模型选择模型选择分类器评测分类器评测1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院5050n训练集:是一个已知样本集,在监督学习方法中,用它来开发出模式分类器。n测试集:在设计识别和分类系统时没有用过的独立样本集。n系统评价原则:为了更好地对模式识别系统性能进行评价,必须使用一组独立于训练集的测试集对系统进行测试。训练和测试训练和测试1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院5151模式识别过程
31、总结模式识别过程总结 1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院5252n19名男女同学进行体检,测量了身高和体重,但事后发现其中有4人忘记填写性别,试问(在最小错误的条件下)这4人是男是女?体检数值如下:编号身高(cm)体重(kg)性别编号身高(cm)体重(kg)性别117068男1114060男215040女1215050女318080男1314040女419090男1415070男516050女1518065女615060男x117575?718580男x217055?816555男x316065?917060女x41604
32、5?1017075男实例实例1:统计模式识别:统计模式识别1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院5353n待识别的模式:性别(男或女)n测量的特征:身高和体重n训练样本:15名已知性别的样本特征n目标:希望借助于训练样本的特征建立判别函数(即数学模型)实例实例1:统计模式识别(续):统计模式识别(续)1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院5454n由训练样本得到的特征空间分布图身高(cm)100150200体重(kg)405060708090男女男男女男男女女
33、男男女女男女x1x3x2x4X1:X1:男男X2:X2:女女X3:X3:男男X4:X4:女女实例实例1:统计模式识别(续):统计模式识别(续)1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院5555n从图中训练样本的分布情况,找出男、女两类特征各自的聚类特点,从而求取一个判别函数(直线或曲线)。n只要给出待分类的模式特征的数值,看它在特征平面上落在判别函数的哪一侧,就可以判别是男还是女了。结论:结论:1.1.错误最小。错误最小。2.2.存在错分。存在错分。实例实例1:统计模式识别(续):统计模式识别(续)1.21.2模式识别系统及模式识
34、别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院5656n已知一围棋图像,进行黑白围棋子识别。实例实例2:聚类分析:聚类分析1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院5757n1、数据获取与预处理1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法n2、模式表示X(R G B)X1(184 129 49)X2(207 187 152)X3(88 71 53)概概 论论 第一章第一章遥感信息工程学院5858n3、分类决策 采用聚类分析方法1.21.2模式识别系统及模式识别方法模式识别系统及模式识
35、别方法确定标准样本:计算X1(184 129 49),X2(207 187 152),X3(88 71 53)到标准样本的欧氏距离:X1黑=115;X1白=97;X1空=33X1空 X2黑=202;X2白=23;X2空=97X1白 X3黑=14;X3白=175;X3空=142X1黑黑:(89 68 39)白:(205 175 132)空:(207 148 63)概概 论论 第一章第一章遥感信息工程学院5959n问题:如何利用对图像的结构信息描述,识别如下所示图片:地板地板M M墙壁墙壁N NL LT TB BD DE EX XZ ZY Y实例实例3:句法模式识别:句法模式识别1.21.2模式识
36、别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院6060n将整个场景图像结构分解成一些比较简单的子图像的组合;n子图像又用一些更为简单的基本图像单元来表示,直至子图像达到了我们认为的最简单的图像单元(基元);n所有这些基元按一定的结构关系来表示,利用多级树结构对其进行描述(这种描述可以采用形式语言理论)。实例:句法模式识别(续)实例:句法模式识别(续)1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院6161n多级树描述结构地板地板M M墙壁墙壁N NL LT TB BD DE EX XZ ZY Y
37、景物景物:A:A 景物景物A A物体物体B B背景背景C C三角体三角体D D长方体长方体E E三角形三角形T T面面L L面面Y Y地板地板M M墙壁墙壁N N面面Z Z面面X X实例:句法模式识别(续)实例:句法模式识别(续)1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院6262n训练过程:用已知结构信息的图像作为训练样本,先识别出基元(比如场景图中的X、Y、Z等简单平面)和它们之间的连接关系(例如长方体E是由X、Y和Z三个面拼接而成),并用字母符号代表之;然后用构造句子的文法来描述生成这幅场景的过程,由此推断出生成该场景的一种文
38、法。实例:句法模式识别(续)实例:句法模式识别(续)1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院6363n识别过程:先对未知结构信息的图像进行基元提取及其相互结构关系的识别;然后用训练过程获得的文法做句法分析;如果能被已知结构信息的文法分析出来,则该幅未知图像与训练样本具有相同的结构(识别成功),否则就不是这种结构(识别失败)。实例:句法模式识别(续)实例:句法模式识别(续)1.21.2模式识别系统及模式识别方法模式识别系统及模式识别方法 概概 论论 第一章第一章遥感信息工程学院6464n遥感:遥感:数字摄影测量,卫星影像处理;数字
39、化地球n文字:文字:OCR技术(Optical Character Recognition,光学字符识别)-版面分析;印刷体字符识别;联机手写体字符识别;脱机手写体字符识别 可用于:信函分拣、文件处理、卡片输入、支票查对、自动排板、期刊阅读、稿件输入;在线手写字符的识别(联机),各种书写输入板。n医疗诊断:心电图分析,脑电图分析,医学图像分析,染色体,癌细胞识别,疾病诊断。n文本分类:搜索引擎;信息过滤n经济:国民经济分析;股市分析;企业运营的分析n图像识别:反黄软件;目标识别和跟踪;条码识别;智能交通;火灾探测1.3 1.3 模式识别的应用模式识别的应用 概概 论论 第一章第一章遥感信息工程
40、学院6565n语音识别:语言控制;话音监控;语言文字转换 三大障碍:大词汇量,连续语言,非特定人n生物特征识别:指纹、掌纹;虹膜;脸像;声音;笔迹n数据挖掘和知识发现:从大量数据中提取出可信、新颖、有效并能被人理解的模式,找出最有价值的信息,指导商业行为或辅助科学研究。n军事:敌我识别;图像制导;自动侦察n工业自动化:故障检测;过程控制;产品质量检验1.3 1.3 模式识别的应用模式识别的应用 概概 论论 第一章第一章遥感信息工程学院6666n环境气象:气象卫星影像处理;地震分析;污染分析、大气、水源、环境监测n自然语言处理:智能搜索引擎;机器翻译;语音界面1.3 1.3 模式识别的应用模式识
41、别的应用 概概 论论 第一章第一章遥感信息工程学院6767一、模式识别的一、模式识别的5 5个公认的假设(公设)个公认的假设(公设)1 1、存在一个有代表性的样本集、存在一个有代表性的样本集 可供使用,以便获得一个问题范围可供使用,以便获得一个问题范围 。2 2、一个、一个“简单简单”模式,具有表征其类别的类属性特征。模式,具有表征其类别的类属性特征。3 3、一个类的模式,其特征在特征空间中组成某种程度上的、一个类的模式,其特征在特征空间中组成某种程度上的一个集群区域,不同类的特征组成的区域是彼此分离的。一个集群区域,不同类的特征组成的区域是彼此分离的。4 4、一个、一个“复杂复杂”模式具有简
42、单的组成部分,它们之间存在模式具有简单的组成部分,它们之间存在着确定的关系。模式被分解成这些组成部分,且它们有着确定的关系。模式被分解成这些组成部分,且它们有一个确定的而不是任意的结构。一个确定的而不是任意的结构。5 5、如果两个模式的特征或其简单的组成部分仅有微小差别,、如果两个模式的特征或其简单的组成部分仅有微小差别,则称两个模式是相似的。则称两个模式是相似的。1.4 1.4 模式识别的基本问题模式识别的基本问题)(,),(XfXfki 概概 论论 第一章第一章遥感信息工程学院6868二、模式二、模式(样本样本)表示方法表示方法1 1、向量表示、向量表示:假设一个样本有n个变量(特征)=(
43、x1,x2,xn)T2 2、矩阵表示、矩阵表示:N个样本,n个变量(特征)变量 样本 X 1 X 2 X n X 1 X 11 X 12 X 1n X 2 X 21 X 22 X 2n X N X N1 X N2 X Nn 1.4 1.4 模式识别的基本问题模式识别的基本问题3、基元(链码)表示、基元(链码)表示:0-7表示8个方向,如223567 这种方法用于句法模式识别。概概 论论 第一章第一章遥感信息工程学院69691 1、紧致集、紧致集:同一类模式类样本的分布比较集中,没有或临界样本很少,这样的模式类称紧致集。三、模式类的紧致性三、模式类的紧致性1.4 1.4 模式识别的基本问题模式识
44、别的基本问题无临界点x1x2有临界点x1x2多临界点x1x2 概概 论论 第一章第一章遥感信息工程学院70702 2、临界点、临界点(样本样本):在多类样本中,某些样本的值有微小变化时就变成另一类样本称为临界样本(点)。3 3、紧致集的性质、紧致集的性质 要求临界点很少 集合内的任意两点的连线,在线上的点属于同 一集合 集合内的每一个点都有足够大的邻域,在邻域内只包含同一集合的点4 4、模式识别的要求:、模式识别的要求:满足紧致集,才能很好的分类;如果不满足紧致集,就要采取变换的方法,满足紧致集。1.4 1.4 模式识别的基本问题模式识别的基本问题 概概 论论 第一章第一章遥感信息工程学院71
45、711、两个样本xi,xj之间的相似度量满足以下要求:应为非负值 样本本身相似性度量应最大 度量应满足对称性 在满足紧致性的条件下,相似性应该是 点间距离的单调函数四、相似与分类四、相似与分类1.4 1.4 模式识别的基本问题模式识别的基本问题 概概 论论 第一章第一章遥感信息工程学院72722 2、用于模式识别的相似性测度:、用于模式识别的相似性测度:欧氏距离(欧几里德距离)欧氏距离(欧几里德距离)n维模式向量xi与xj之间的欧氏距离为:1.4 1.4 模式识别的基本问题模式识别的基本问题nkjkijxxdik12绝对值距离绝对值距离(“city block”distance)nkjkiki
46、jxxd1|又称城市距离,街坊距离。又称城市距离,街坊距离。概概 论论 第一章第一章遥感信息工程学院73731.4 1.4 模式识别的基本问题模式识别的基本问题明氏距离(明考夫斯基距离明氏距离(明考夫斯基距离MinkowskiMinkowski)nkmijjkikxxmd1|/1 当m=1时为绝对值距离;当m=2时为欧氏距离;当m时为切氏距离。切氏距离(切比雪夫距离)切氏距离(切比雪夫距离)nkmmijjkikxxmd1|/1lim 概概 论论 第一章第一章遥感信息工程学院7474mxCmxdt1 马氏距离(马哈拉诺比斯距离马氏距离(马哈拉诺比斯距离MahalanobisMahalanobis
47、)其中m为均值向量,C 为协方差矩阵,使用的条件是样本符合正态分布。1.4 1.4 模式识别的基本问题模式识别的基本问题向量夹角余弦向量夹角余弦jijtijixxxxxxS,它反映了几何相似性,在模式向量具有扇形分布时常采用这种测度。121cosxxS231cosxxS 概概 论论 第一章第一章遥感信息工程学院75753 3、分类的主观性和客观性、分类的主观性和客观性 分类带有主观性:模式识别具有想当明显的主观性。目的不同,分类不同。例如:遥感影像分类,不同的目的会有不同的分类体系。分类的客观性:(科学性)判断分类必须有客观标准,因此分类是追求客观性的,但主观性也很难避免,这就是分类的复杂性。
48、yxyyxxyxxyStttt当模式特征向量各分量取0、1二值时,常采用此式。TanimotoTanimoto测度测度1.4 1.4 模式识别的基本问题模式识别的基本问题 概概 论论 第一章第一章遥感信息工程学院7676五、特征的生成五、特征的生成 1.低层特征:无序尺度:有明确的数量和数值。有序尺度:有先后、好坏的次序关系,如酒 分为上,中,下三个等级。名义尺度:无数量、无次序关系,如有红,黄两种颜色。2.中层特征:经过计算,变换得到的特征 3.高层特征:在中层特征的基础上有目的的经过 运算形成 例如:遥感影像-像素的灰度;差分;边缘跟踪1.4 1.4 模式识别的基本问题模式识别的基本问题
49、概概 论论 第一章第一章遥感信息工程学院7777六、数据的标准化六、数据的标准化 1、极差标准化,一批样本中,每个特征的最大值与最小值之差。ijijiXXRminmaxiiijRXXXijiiijSXXXij1.4 1.4 模式识别的基本问题模式识别的基本问题极差 2、方差标准化 极差标准化 Si 为方差标准化的方法很多,原始数据是否应该标准化,应采用什么方法标准化,都要根据具体情况来定。概概 论论 第一章第一章遥感信息工程学院7878 1、查阅有关文献,把目前常见的期刊和有关模式识别的中英文专著或期刊列一个表格。2、查阅有关网站、文献,罗列目前模式识别 中的常用算法,并对照自己的数学基础知识,看看哪些是熟悉的,哪些是不熟悉的。对于不 熟悉的内容,尽量找相关的数学参考书学习。思考与练习:思考与练习:1.4 1.4 模式识别的基本问题模式识别的基本问题