1、第第 11 章章 深度图(Depth Map)获取场景中各点相对于摄象机的距离是计算机视觉系统的重要任务之一场景中各点相对于摄象机的距离可以用深度图(Depth Map)来表示,即深度图中的每一个像素值表示场景中某一点与摄像机之间的距离机器视觉系统获取场景深度图技术可分为被动测距传感和主动测距传感两大类 被动测距传感:视觉系统接收来自场景发射或反射的光能量,形成有关场景光能量分布函数,即灰度图像,然后在这些图像的基础上恢复场景的深度信息 主动测距传感:视觉系统首先向场景发射能量,然后接收场景对所发射能量的反射能量主动测距传感系统也称为测距成象系统(Rangefinder)图111双目立体视觉几
2、何模型 外极平面 外极线 共轭对 视差(disparity)rlxxBFz假设坐标系原点与左透镜中心重合。F是焦距,B是基线距离。FxzxlFxzBxrrlxxBFz提高精度的措施是增大基线距离。产生的问题:随着基线距离的增加,两个摄象机的共同的可视范围减小;场景点对应的视差值增大,则搜索对应点的范围增大,出现多义性的机会就增大;由于透视投影引起的变形导致两个摄象机获取的两幅图像中不完全相同,这就给确定共轭对带来了困难立体成象的最一般情况:一个运动摄像机连续获取场景图像,形成立体图像序列,或间隔一定距离的两个摄像机同时获取场景图像,形成立体图像对。2.立体匹配的基本方法立体匹配的基本方法 立体
3、成象系统的一个不言而喻的假设是能够找到立体图像对中的共轭对,即求解对应问题然而,对于实际的立体图像对,求解对应问题极富有挑战性,可以说是立体视觉最困难的一步为了求解对应,人们已经建立了许多约束来减少对应点搜索范围,并最终确定正确的对应(1)立体匹配的基本约束立体匹配的基本约束 外极线约束外极线约束图11.4 空间某一距离区间内的一条直线段对应外极线上的一个有限区间 一致性约束一致性约束0000/),(,jifjifkkkkjifjif/),(,是参考摄像机的图象函数njmijifmn1122),(1 立体视觉通常由两个或两个以上摄像机组成,各摄像机的特性一般是不同的这样,场景中对应点处的光强可
4、能相差太大,直接进行相似性匹配,得到的匹配值变化太大因此,在进行匹配前,必须对图像进行规范化处理(Normalization)jifk,相似估价函数:nimjkkjifjif110),(),(唯一性约束:一般情况下,一幅图像(左或右)上的每一个特征点只能与另一幅图像上的唯一一个特征对应。连续性约束:物体表面一般都是光滑的,因此物体表面上各点在图像上的投影也是连续的,它们的视差也是连续的比如,物体上非常接近的两点,其视差也十分接近,因为其深度值不会相差很大。(2)基于边缘的立体匹配)基于边缘的立体匹配 在某一行上计算各边缘的位置 通过比较边缘的方向和强度粗略地进行边缘匹配 通过在精细尺度上进行匹
5、配,可以得到视差估计水平边缘是无法进行匹配的!(3 3)基于区域相关性的立体匹配)基于区域相关性的立体匹配 在立体图像对中识别兴趣点(interesting point),而后使用区域相关法来匹配两幅图像中相对应的点 兴趣点计算公式如下:SyxyxfyxfI),(21)1,(),(SyxyxfyxfI),(22),1(),(SyxyxfyxfI),(23)1,1(),(SyxyxfyxfI),(24)1,1(),(),min(),(4321IIIIyxIcc在以某一点为中心的窗函数中,计算其在不同方向上的变化量是这些方向上点的差异性的最好测度。S表示窗函数中的所有像素。特征点匹配 一旦在两幅图
6、像中确定特征后,则可以使用许多不同方法进行特征匹配一种简单的方法是计算一幅图像以某一特征点为中心的一个小窗函数内的像素与另一幅图像中各个潜在对应特征点为中心的同样的小窗函数的像素之间的相关值具有最大相关值的特征就是匹配特征很明显,只有满足外极线约束的点才能是匹配点考虑到垂直视差的存在,应将外极线邻近的特征点也包括在潜在的匹配特征集中 2/1),(221),(211),(2211),(),(),(),(),(SyxyxSyxSyxyxyxfdydxffyxffdydxffyxfddr考虑两幅图像 f1和 f2设待匹配的候选特征点对的视差为 ,则以特征点为中心的区域之间相似性测度可由相关系数 定义
7、为:(,)ddxyr ddxy(,)这里的 和 是被匹配的两个区域中的所有像素灰度平均值,和式符号是在以特征点为中心的小窗函数中的所有像素上进行的。f1f2在每一个像素上使用阈值化处理后的具有正负符号的梯度幅值,而不是图像灰度值,可以改善相关性的计算精度实现过程:计算未平滑的两幅图像中的每个像素的梯度幅值,然后使用两个阈值,一个大于0,另一个小于0,将这些值映射到三个值这样图像就被转换为波浪起伏阵列,可以产生更灵敏的相关值3.多基线立体成象多基线立体成象 一幅图像上的每一个特征点只能与另一幅图像上的唯一一个特征对应,通常将这一性质称为特征的唯一性约束在实际中,由于大多数特征点不是十分明显,特别
8、是重复纹理的出现,常常会产生对应多义性(ambiguity),即一幅图像上的一个特征点对应另一幅图像的若干个对应点,其中的一个点是真正的对应点,而其它点是假对应点消除对应点多义性的一种有效方法是采用多基线立体成象Okutomi 1993。ririirFBzFBd)()()()(00 xnxfxf)()()()(xndxfxfiiri图像强度函数 和 在Z点附近可以表示为:)(0 xf)(xfi立体图像对方差和(sum of squared difference,SSD),匹配评估函数:Wjiiiijdxfjxfdxe2)(0)()()(),(WjiiijFBxfjxfxe20)()(),(或2
9、22)()(),(nwWjriiNjFBxfjxfxeE期望值:n个摄像机形成(n-1)个SSD函数,将所有的SSD函数相加(sum of SSD,SSSD)形成了总的评估函数:niinxexe11,.,2,1),(),(1122111,.,2,12)()(),(),(ninwWjriniinnNjFBxfjxfxeExeE定义:能够直接测量可视范围内每个点的距离,并将其记录为一个二维函数的系统称为测距成象系统,得到的图像称为距离图像或深度图。分类:结构光测距 测距雷达:声雷达、激光雷达、毫米波雷达 变焦测距4、测距成象系统、测距成象系统 结构光三角测距一次只照明一个点然后使用上述方程计算该点
10、的深度,一次只照明一个点然后使用上述方程计算该点的深度,由此得到二维距离图像。由此得到二维距离图像。,cos,FyxxFbzyx图11.12 结构光测距原理示意图Jarvis 1983激光测距雷达 在生物界,蝙蝠和海豚是通过接收自己发出的超声波来确定其周围物体的存在根据生物的这种感知距离的能力,人类发明了各种测距系统,称之为雷达,即向空间发射信号,然后接收反射信号并与发射信号进行比较,以确定目标的距离和方位激光测距(laser range finder)是在二十世纪60年代发展起来的一种新型测距雷达,现在已经进入实用化阶段激光雷达具有波束窄、波长短等独特优点,因而具有极高的角分辨能力、距离分辨
11、能力和速度分辨能力。激光雷达可以获取目标的多种信息,如反射特性、距离信息、速度信息等(1)脉冲飞行时间测距这种激光测距雷达在米的测量范围内,测距精度为厘米获取128128图像需要3分钟。激光脉冲测距雷达就属于这类测距系统激光脉冲测距雷达向空间发射激光脉冲信号,并接收由于碰到物体表面而反射回来的信号,然后测量发射和接收脉冲的时间差,就可以得到空间物体的距离。(2)相位差测距深度信息可以通过检测调幅光波发射和接收的相位差来得到。44mmfcd已知调制频率 和相位差 ,则物体到传感器的距离为:22mmfcD测距范围:mfmmfcNfcd24变焦测距根据理想薄透镜定理,透镜中心(光学原点)到图象平面的
12、距离 、透镜中心到场景点的距离 z 和透镜焦距长度 f 之间的关系为:fzz111 z当某一场景点不聚焦时,它会在图象平面上产生一个圆斑图象,而不是一个点图像。如果圆斑的直径低于成象装置的分辨率,那么图象散焦量不会特别的显著。假定圆斑的直径为b,透镜光圈直径为d,焦距长度为f,图象平面的理想位置为 。zzzzdb)(1)()(11zfzzzdfb视野范围内远距离平面的距离表示式:bzdfbdfzz)(1视野范围内近距离平面的距离表示式:zfz dbdfbz2()对于一个特定的配置,焦距平面为z,光圈直径为d,焦距长为f,最大可接受模糊直径为b,上述方程提供了近距离和远距离平面位置。景深D是近距离和远距离平面之差:2222)(2zbfdzfbdfzD5、主动视觉大多数计算机视觉系统都依赖于由固定参数的系统来获取数据,包括所有的被动敏感系统(如视频摄象机)和主动敏感系统(如激光测距仪)与这些数据提取方法不同,在一个主动视觉系统中,传感器的状态参数如焦距、光圈、聚散度以及照度都可以控制,以获取有利于场景解释的数据。