1、第9章 计算机视觉简介 人类视觉 计算机视觉 Marr的视觉计算理论框架人类约有75%的信息是通过视觉系统获取的。视觉是思维的一种最基本的工具人类视觉人类视觉是通过人眼来感知世界的过程 输入:通过眼睛对世界的观察 输出:对世界的感知计算机视觉 计算机视觉是一门研究如何使机器“看”的科学,即用摄影机和电脑代替人眼对目标进行识别、跟踪和测量。用计算机实现对视觉信息处理的全过程计算机视觉是通过对图像和视频的分析处理,实现类似人类视觉感知能力的过程 输入:图像或视频 输出:对象的恢复以及对对象信息的使用Marr的视觉计算理论框架David Marr(1945-1980)是英国心理学家。他将心理学、人工
2、智能和神经生理学的结果结合起来,对视觉的研究做出了重要贡献。他是计算视觉的奠基人。David Marr 70年代末在美国MIT提出了第一个较为完善的视觉系统框架此框架尽管存在很多缺陷,但过去20多年一直处于主导地位视觉系统研究的三个层次视觉系统研究的三个层次视觉信息处理的三个阶段低层视觉(Low-level vision)构成所谓的“要素图要素图”(primary sketch),包含一些基本的包含一些基本的图像特征图像特征(角点、边缘、线条、边界、色彩、纹理等)中层视觉(Intermediate-level vision)构成对环境的2.5维描述,即部分的、不完整的三维信息描述(恢复场景可见部分的深度、法线方向、轮廓等,包含了深度信息,但不是真正的物体三维表示。)高层视觉(High-level vision)从2.5维描述得到完整的三维描述(恢复、表示和识别三维物体)Marr框架的计算机视觉三阶段Marr模型的缺点:假定视觉系统是被动的,给什么图像就处理什么缺乏或者未足够重视高层知识的指导作用由局部信息到整体信息的单向过程,没有反馈