1、授课内容 第 0 章 数字图像处理概述 第1章 Matlab 图像处理编程基础 第2章 Visual C+图像处理编程基础 第3章 图像的点运算 第4章 图像的几何变换 第5章 空间域图像增强参考书目u 1、教材数字图像处理与机器视觉-Visual C+与Matlab实现,张峥等,人民邮电出版社,2010年4月u 2、教学参考书霍宏涛.数字图像处理.北京理工大学出版社,2002 赵荣椿.数字图象处理导论.西北工业大学出版社,1995杨枝灵,王开等.Visual C+数字图像获取处理及实践应用.人民邮电出版社,2003李介谷.计算机视觉的理论和实践.上海交通大学出版社,1991Kenneth R
2、.Castleman.DIGITAL IMAGE PROCESSING.清华大学出版社,1998章毓晋.图象处理和分析(图象工程上册),清华大学出版社,1999p数字图像p数字图像处理与识别p数字图像处理的预备知识知识第0章 数字图像处理概论 图像的概念 一幅图像是对另一个事物的一种表示。物体(object)图像(image)可见的图像(visible image)图片(picture)照片(photograph)图(drawing)画(painting)光图像(optical image)不可见物理图像(invisible physical image)数学函数(function)连续函数(
3、continuous)离散函数(discrete)0.1 数字图像什么是数字图像数字图像是指一个被采样和量化后的二维函数(该二维函数由光学方法产生),采用等距矩形网格采样,对幅度进行等间隔量化。至此,一幅是指图像是一个被量化的采样数值的二维矩阵。这样,我们可以用f(x,y)来表达数字图像,其中,x,y:2-D空间中XY坐标点的位置,f:代表图象在(x,y)的性质F 的数值。f,x,y 的值可以是任意实数性质F:可对应不同物理量;灰度图象里用灰度表示这样,我们可以用f(x,y)来表达数字图像,其中,x,y:2-D空间中XY坐标点的位置,f:代表图象在(x,y)的性质F 的数值。f,x,y 的值可
4、以是任意实数性质F:可对应不同物理量;一个大小为MN的数字图像是由M行N列的有限元素组成的,每个元素有特定的位置(x,y)和幅值(f),代表了其所在行列位置上的图像物理信息。这些元素成为图像元素(picture element)或者简称像素(pixel)。数字图像的显示位图图像的例子数字图像的分类根据每个像素所代表的信息的不同,可将数字图像分为u二值图像u灰度图像uRGB图像u索引图像.1.二值图像每个像素只有黑、白两种颜色的图像成为二值图像。在二值图像中,像素只有0和1两种取值,一般用0来表示黑色,用1来表示白色。2.灰度图像灰度图像通常显示为从最暗黑色到最亮的白色的灰度,每种灰度(颜色深度
5、)称为一个灰度级。每个像素可以取0L-1之间的整数值,其中L是指全部灰度等级的个数,一般为2的乘方。常用如8位灰度图像,其中8是指灰度图像在计算机中以2进制数形式表达或存储时的位数或容量,即8位灰度图像有28,共256个灰度级。196 195 196 194 194 193 190 192 187 180 162 153 138 137 132 103197 197 197 198 198 198 193 193 183 170 151 138 115 100 9768197 200 203 203 199 197 190 185 173 159 132 118 87586253198 203
6、 202 203 202 194 188 178 158 128 917859566049204 205 205 207 203 199 186 156 118 75615653595351205 204 209 208 202 189 159 101 5654585147505554212 209 211 207 197 167 112 654950514546424959215 211 213 204 181 122 81545049444349444455215 214 211 193 143 9267505053605248434561217 214 204 158 111 86695
7、65065676354454060217 212 190 129 101 7879785160848063424672211 203 168 124 9085 103 97616194 100 89756787212 197 154 110 93 105 120 120 93588597 100 938688214 191 134 104 105 108 128 134 118 816585 103 100 9698207 181 127 99 111 114 129 144 148 111 907775898886205 174 126 100 97 107 125 137 150 139
8、114 105 887979863.RGB图像颜色模型主要有HSV、RGB、HSI、CHL、LAB、CMY等。它们在不同的行业各有所指,但在计算机技术方面运用较为广泛是RGB模型。自然界中几乎所有颜色都可以由红(Red,R),绿(Green,G),蓝(Blue,B)三种颜色组合而成,通常称为RGB三原色。RGB图像中,每个像素的颜色信息由RGB三个分量构成。对于每一个像素,通过控制R,G,B三原色的合成比例可决定该像素的最终显示颜色。对于三原色RGB中的每一种颜色,可以像灰度图那样使用L等级来表示含有这种原色成分的多少。如果每一种原色都可以划分为256个等级,即每一种原色都用8位2进制数据表示
9、,则三原色总共需要24位2进制数来表示,这样能够表示出的颜色种类可达224,大约1600万种。(207,137,130)(220,179,163)(215,169,161)(210,179,172)(210,179,172)(207,154,146)(217,124,121)(215,169,161)(216,179,170)(216,179,170)(207,137,120)(159,51,71)(213,142,135)(216,179,170)(221,184,170)(190,89,89)(204,109,113)(204,115,118)(216,179,170)(220,188,1
10、76)(190,77,84)(206,95,97)(217,113,113)(189,85,97)(222,192,179)(150,54,71)(177,65,73)(145,39,65)(150,47,67)(112,20,56)(136,38,65)(112,20,56)(112,20,56)(109,30,65)(112,20,56)(95,19,64)(136,38,65)(91,11,56)(113,25,60)(103,19,59)(81,12,59)(126,62,94)(138,46,71)(103,19,59)(158,65,83)(124,40,70)(145,62,79
11、)(130,46,73)4.索引图像 u 索引图像一般由索引图像矩阵和颜色映射表组成。u 索引图像中的颜色不用RGB三原色直接表示,而是用颜色映射表中的偏移量来表示。图像的颜色由这个偏移量所指的颜色映射表相应位置上的RGB三原色的值决定。u 颜色映射表存储按一定顺序排列着图像中可能使用的由RGB三个分量构成的颜色信息。u 有时又称为调色板(palette),或者叫颜色查找表(CLUT,Color Look Up Table)。u 使用调色板技术减小图像文件体积的条件是图像中用到颜色种类较少。如果一个图像中用到了全部24位真彩色,则用调色板技术不能起到减少图像文件体积的作用。数字图像不同角度的观
12、察 静态的灰度图像:f(x,y);动态画面f(x.y.t);函数值可能是一个数值,也可能是一个向量(对于彩色图像)。从线性代数和矩阵论的角度,数字图像就是一个由图像信息组成的二维/三维矩阵。由于随机变化和噪声的原因,图像在本质上是统计性的。因而有时将图像函数作为随机过程的实现来观察。从线性系统的角度考虑,图像及其处理也可以表示为用狄拉克冲激公式表达的点展开函数的叠加,在使用这种方式对图像进行表示时,可以采用成熟的线性系统理论研究。数字图像的表示图0.2 数字图像的坐标约定0,00,10,11,01,11,11,01,11,1,NNMMMNiiiiiiII m niii图像的空间和灰度级分辨率1
13、.图像的空间分辨率(Spatial Resolution)u图像的空间分辨率是指图像中每单位长度所包含的像素或点的数目,常以像素/英寸(pixels per inch,ppi)为单位来表示。u通常会称一幅大小为MN的数字图像的空间分辨率为MN像素.图像的空间分辨率例子2.图像的灰度级/辐射计量分辩率(Radiometric Resolution)u灰度级分辨率又称色阶,是指图像中可分辨的灰度级数目,由于灰度级度量的是投射到传感器上光辐射的强度,也叫辐射计量分辨率。u灰度级分辨率的逐渐降低,图像中包含的颜色数目变少,从而在颜色的角度造成图像信息受损。图像的灰度级/辐射计量分辩率例子0.2 数字图
14、像处理与识别 0.2.1 从图像处理到图像识别1.数字图像处理 对一个物体的数字表达进行一系列的操作,以得到期望的效果。一般是指对图像的修改或增强。2.数字图像分析 对感兴趣的目标进行检测和测量,获得距离、目标对象的计数或其尺寸等.外延:边缘检测和图像分割、特征提取以及几何测量与计数等.3.数字图像识别 图像中各目标的性质和相互关系,识别出目标对象的类别,从而理解图像的含义。例如光学字符识别(OCR)、产品质量检验、人脸识别、自动驾驶、医学图像和地貌图像的自动判读理解等.数字图像处理、分析和识别的关系0.2.2 机器视觉机器视觉(Machine Vision),又称计算机视觉(Computer
15、 Vision).将数字图像处理和数字图像分析、图像识别结合起来,能够理解自然景物和环境的系统,是数字成像领域的尖端方向,具有最综合的内容和最广泛的涵盖面.0.2.3 数字图像处理和识别的一些应用0.3 数字图像处理的预备知识邻接性、连通性、区域和边界邻接性像素p的4邻域、8邻域和对角邻域P的4邻域P的8邻域P的对角邻域邻接性定义V 是用于决定邻接性的灰度值集合,它是一种相似性的度量,用于确定所需判断邻像素之间的相似程度。4 邻接(4-Neighbor):如果QN4(P),则称具有V中数值的两个像素P和Q是4邻接的。8 邻接(8-Neighbor):如果QN8(P),则称具有V中数值的两个像素
16、P和Q是4邻接的。对于两个图像子集S1和S2,如果S1中的某些像素和S2中的某些像素相邻,则称这两个子集是邻接的。(a)4 邻接示意图 (b)8 邻接示意图 连通性通路:像素P到像素Q的通路(Path)指的是一个特定的像素序列(x0,y0),(x1,y1)(xn,yn),其中(x0,y0)=(xp,yp),(xn,yn)=(xq,yq)。并且像素(xi,yi)和,(xi-1,yi-1)在 满足l i n 时是邻接的。连通性:令S代表一幅图像中的像素子集。如果在S 中全部像素之间存在一个通路,则可以称2个像素P 和Q在S中是连通的。对于S中的任何像素p,S中连通到该像素的像素集叫做S的连通分量。
17、如果S中仅有一个连通分量,则集合S 叫做连通集.区域和边界n令R是图像中的一个像素子集,如果R同时是连通集,则称R为一个区域(Region);n边界的概念是相对于区域而言的;n一个区域的边界(或边缘、轮廓)是区域中所有包含一个或多个不在区域R 中的邻接像素的像素所组成的集合;n区域指一幅图像的子集,并包括区域的边缘。边缘(Edge)则由具有某些导数值的像素组成,是一个像素及其直接邻域的局部性质,是一个有大小和方向属性的矢量。边界是和区域有关的全局概念,而边缘表示图像函数的周部性质。距离度量的几种方法距离是描述像素间关系的基本参数,也是目标物几何距离是描述像素间关系的基本参数,也是目标物几何特征
18、和相似性的重要测度。特征和相似性的重要测度。1.1.距离的定义距离的定义 给定三个像素给定三个像素 ,若,若 满足满足 (1 1)非负性:)非负性:,当且仅当,当且仅当p=qp=q时,时,(2 2)对称性:)对称性:;(3 3)三角不等式:)三角不等式:;则则 称为距离的度量函数。称为距离的度量函数。112233p(m,n),q(m,n),r(m,n)D(p,q)D(p,q)=0D(p,q)0D(p,q)=D(q,p)D(p,q)D(p,r)+D(r,q)D(p,q)距离度量的几种方法像素间的几种距离像素间的几种距离欧氏距离 城区距离棋盘距离 22 1/2E(,)()()Dp qxsyt4(,
19、)Dp qxsyt8(,)max(,)Dp qxsyt距离计算示例(a)(b)(c)32.82.222.22.82.21.411.42.232101232.21.411.42.22.82.222.22.8333233212332101233212332333333333322222332111233210123321112332222233333333基本的图像操作1.点运算和邻域运算 点运算指的是对图像中的每一个像素逐个进行同样的灰度变换运算;设r和s分别是输入图像f(x,y)和输出图像g(x,y)在任一点(x,y)的灰度值,点运算:s=T(r)如果将点运算扩展,对图像中每一个小范围(邻域)内的像素进行灰度变换运算,即称为邻域运算或邻域滤波。这可以使用下式定义zg(x,y)=T f(x,y)精品课件精品课件!精品课件精品课件!基本的图像操作2.线性和非线性操作 令H 是一种算子,其输入输出都是图像.若对于任意两幅图像F1和F2,任意两个标量a 和b 有:H(aF1+bF2)=aH(F1)+bH(F2)则称H 为线性算子。同样,不符合上述定义的算子即为非线性算子,对应的是非线性图像操作。滤被中的平均平滑,高斯平滑,梯度锐化等都是线性运算,而中值滤波 则是非线性的。.