彩色数字图像基础讲解课件.ppt_163文库

资源描述

1、彩色数字图像基础计算机图形、图像技术计算机图形分为两大类位图图像和矢量图形n矢量图形，是由叫作矢量的数学对象所定义的直线和曲线组成的。矢量根据图形的几何特性来对其进行描述，矢量图形与分辨率无关。n位图图象，也叫作栅格图象。位图图象是用小方形网格（位图或栅格），即人所共知的象素来代表图象，每个象素都被分配一个特定位置和颜色值。位图图象与分辨率有关，换句话说，它包含固定数量的象素，代表图象数据。研究路线图像数据压缩主要根据下面两个基本事实来实现的：n 图像数据中有许多重复的数据，使用数学方法来表示这些重复数据就可以减少数据量；n 人的眼睛对图像细节和颜色的辨认有一个极限，把超过极限的部分去掉，这也

2、就达到压缩数据的目的。利用前一个事实的压缩技术就是无损压缩技术，利用后一个事实的压缩技术就是有损压缩技术。实际的图像压缩是综合使用各种有损和无损压缩技术来实现的。图像的RGB颜色模型n绝大部分可见光谱可用红、绿和蓝(RGB)三色光按不同比例和强度的混合来表示。在颜色重叠的位置，产生青色、洋红和黄色。n因为 RGB 颜色合成产生白色，它们也叫作加色。将所有颜色加在一起产生白色就是说，所有光被反射回眼睛。加色用于光照、视频和显示器。例如，显示器通过红、绿和蓝荧光粉发射光线产生彩色。图像的RGB颜色模型图像的CMYK颜色模型nCMYK模型以打印在纸张上油墨的光线吸收特性为基础，白光照射到半透明油墨上

3、时，部分光谱被吸收，部分被反射回眼睛。n理论上，青色(C)、洋红(M)和黄色(Y)色素能合成吸收所有颜色并产生黑色。由于这个原因，这些颜色叫作减色。图像的CMYK颜色模型n 因为所有打印油墨都会包含一些杂质，这三种油墨实际上产生一种土灰色，必须与黑色(K)油墨混合才能产生真正的黑色。将这些油墨混合产生颜色叫作四色印刷。图像的CMYK颜色模型相加色与相减色关系相加混色RGB相减混色CMY生成的颜色000111黑001110蓝010101绿011100青100011红101010品红110001黄111000白颜色模型的空间表示颜色模型关系示意VGA调色板色度-饱和度-亮度 HSL(HSB)颜色模

4、型 hue SaturationLightness(brightness)图像的HSL颜色模型基于人类对颜色的感觉，HSL 模型描述颜色的三个基本特征：n色相是从物体反射或透过物体传播的颜色。在 0 到 360 度的标准色轮上，色相是按位置度量的。在通常的使用中，色相是由颜色名称标识的，比如红、橙或绿色。n饱和度是指颜色的强度或纯度。饱和度表示色相中灰成分所占的比例，用从 0%（灰色）到 100%（完全饱和）的百分比来度量。在标准色轮上，从中心向边缘饱和度是递增的。n亮度是颜色的相对明暗程度，通常用从 0%（黑）到 100%（白）的百分比来度量。图像的HSL颜色模型图像的Lab颜色模型nL L

5、*a a*b b 颜色模型颜色模型是在 1931 年国际照明委员会（CIE）制定的颜色度量国际标准的基础上建立的。1976 年，这种模型被重新修订并命名为 CIE L*a*b。n L*a*b 颜色设计为与设备无关；不管使用什么设备（如显示器、打印机、计算机或扫描仪）创建或输出图象，这种颜色模型产生的颜色都保持一致。nL*a*b 颜色由亮度或光亮度分量(L)和两个色度分量组成；两个分量即 a 分量（从绿到红）和 b 分量（从蓝到黄）。图像的Lab颜色模型nA.光度=100（白）nB.绿到红分量nC.蓝到黄分量nD.光度=0（黑）到红分量关于“溢色”颜色模型的色域n色域是一个色系能够显示或打印的颜

6、色范围。人眼看到的色谱比任何颜色模型中的色域都宽。n在颜色模型中，L*a*b具有最宽的色域，它包括RGB和CMYK色域中的所有颜色。通常RGB色域包含能在计算机显示器或电视屏幕（发出红、绿和蓝光）上所有能显示的颜色。因而一些诸如纯青或纯黄等颜色不能在显示器上精确显示。颜色模型的色域nCMYK色域较窄，仅包含使用印刷色油墨能够打印的颜色。当不能被打印的颜色在屏幕上显示时，它们称为溢色即超出CMYK色域之外。彩色空间的线性变换标准nYIQ适用于NTSC彩色电视制式 nYUV适用于PAL和SECAM彩色电视制式 nYCrCb适用于计算机用的显示器为了使用人的视角特性以降低数据量，通常把RGB空间表示

7、的彩色图像变换到其他彩色空间。彩色空间变换有三种：彩色空间的线性变换标准nYUV与YIQ模型在彩色电视制式中，使用YUV和YIQ模型来表示彩色图像。在PAL彩色电视制式中使用YUV模型，Y表示亮度，UV用来表示色差，U、V是构成彩色的两个分量；在NTSC彩色电视制式中使用YIQ模型，其中的Y表示亮度，I、Q是两个彩色分量。nYUV/YIQ特点亮度信号(Y)和色度信号(U、V)是相互独立的；可以利用人眼的特性来降低数字彩色图像所需要的存储容量。用YUV的好处n 亮度信号Y解决了彩色电视机与黑白电视的兼容问题。n大量实验表明，人眼对色差信号不敏感，而对亮度信号特别敏感。用亮度信号Y传送细节，用

8、色差信号UV进行大面积涂色。选YIQ的好处n大量实验统计，人眼对红黄之间的颜色变化最敏感，而分辨蓝和紫之间颜色变化最不敏感。所以把相角为123的橙色及其相反相角的303的青色定义为I轴，它表示人眼最敏感的色轴。与I正交的色度信号轴，通过33 0213线，叫Q轴，它表示人眼最不敏感的色轴。在传送分辨率弱的Q信号是，可用较窄的频带，而传送分辨率较强的I信号是，可用较宽的频带。彩色空间RGB-YUVnY=0.299R+0.587G+0.114BnU=0.147R0.289G+0.436B nV=0.615R0.515G0.100B彩色空间RGB-YIQnY=0.299R+0.587G+0.114B

9、n I=0.596R0.275G0.321B nQ=0.212R0.523G+0.311B彩色空间RGB-YCrCbn数字域中的彩色空间变换与模拟域的彩色空间变换不同。它们的分量使用Y、Cr和Cb来表示，与RGB空间的转换关系如下：nY 0.299R0.578G0.114B nCr(0.500R0.4187G0.0813B)128 nCb=(0.1687R0.3313G0.500B)128电视信号n黑白全电视信号摄象机把图象信号转变成的最后输出信号就是全电视信号。全电视信号主要由三个部分组成：图象信号（视频信号）、复合消隐信号、复合同步信号。n彩色全电视信号彩色全电视信号主要由：亮度信号、

10、色度信号、复合同步信号、复合消隐信号组成。数字视频的制式数字视频的制式n数字视频是由一序列静止画面组成的，称为帧。帧率选择在每秒2430帧之间，视频的运动就非常光滑连续；而低于每秒15帧，连续运动视频就会有停顿的感觉。nPAL制规定视频每秒25帧，每帧625个扫描行。625行中用于扫描图像的有效行数只有576行，所以图像在垂直方向上的分辨率为576点。按现行4：3（宽：高）的电视标准，图像在水平方向上的分辨率应为576*4/3=768点，这就得到了768*576这一常见的图像大小。nNTSC制规定每秒30帧，每帧525行，同样采用了隔行扫描方式，每一帧由两场组成，其图像大小是720*486。由

11、于PAL制与NTSC制的场频、行频以及色彩处理方式均不同，因此两者是互不兼容的。影响数字视频质量的因素n帧速：25帧/秒（PAL）、30帧/秒（NTSC）。帧速越高，数据量越大，质量越好。n分辨率：视频分辨率越大，数据量越大，质量越好。n颜色数：指视频中最多能使用的颜色数。颜色位数越多，色彩越逼真，数据量也越大。n压缩比：压缩比较小时对图像质量不会有太大影响，而超过一定倍数后，将会明显看出图像质量下降，而且压缩比越大在回放时花费在解压的时间越长。n关键帧：视频数据具有很强的帧间相关性，动态视频压缩正是利用帧间相关性的特点，通过前后两个关键帧动态合成中间的视频帧。因此对于含有频繁运动的视频图像序

12、列，关键帧数少就会出现图像不稳定现象。图像的种类n只有黑白两中颜色的图像称为单色图像(monochrome image)，它的每个像素的像素值用1位存储，它的值只有“0”或者“1”，一幅640480的单色图像需要占据37.5KB的存储空间。n如果每个像素的像素值用一个字节表示，灰度值级数就等于256级，每个像素可以是0-255之间的任何一个值，一幅640480的灰度图像就需要占据300KB的存储空间。图像的种类图像的种类n彩色图像(color image)可按照颜色的数目来划分，例如256色图像和真彩色(24bit颜色)等。彩色图像的每个像素的R、G和B值用一个

13、字节来表示，一幅640480的8位彩色图像需要307.2KB的存储空间。一幅640480的真彩色图像需要921.6 KB的存储空间。n许多24位彩色图像是用32位存储的，这个附加的8位叫做alpha通道，它的值叫做alpha值，它用来表示该像素如何产生特技效果。图像的种类图像的三个基本属性分辨率n显示分辨率显示分辨率是指显示屏上能够显示出的像素数目。n图像分辨率图像分辨率是指组成一幅图像的像素密度的度量方法。对同样大小的一幅图，如果组成该图的图像像素数目越多，则说明图像的分辨率越高，看起来就越逼真。相反，图像显得越粗糙。图像的三个基本属性像素深度 n像素深度是指存储每个像素所用的位数，它也

14、是用来度量图像的分辨率 n例如，一幅彩色图像的每个像素用R，G，B三个分量表示，若每个分量用8位，那么一个像素共用24位表示，就说像素的深度为24，每个像素可以是224=16777216种颜色中的一种。图像的三个基本属性像素深度 n在用二进制数表示彩色图像的像素时，除R，G，B分量用固定位数表示外，往往还增加1位或几位作为属性(Attribute)位。例如，RGB 5:5:5表示一个像素时，用2个字节共16位表示，其中R，G，B各占5位，剩下一位作为属性位。在这种情况下，像素深度为16位，而图像深度为15位图像的三个基本属性像素深度 n用32位表示一个像素时，R，G，B分别用8位表示，剩下的

15、8位常称为通道(alpha channel)位，或称为复盖(overlay)位、中断位、属性位。它的用法可用一个预乘通道(premultiplied alpha)的例子说明。假如一个像素(A，R，G，B)的四个分量都用规一化的数值表示，(A，R，G，B)为(1，1，0，0)时显示红色。当像素为(0.5,1,0,0)时，预乘的结果就变成(0.5,0.5,0,0)，这表示原来该像素显示的红色的强度为1，而现在显示的红色的强度降了一半。n用这种办法定义一个像素的属性在实际中很有用。例如在一幅彩色图像上叠加文字说明，而又不想让文字把图复盖掉，就可以用这种办法来定义像素，而该像素显示的颜色又有人把它称为

16、混合色(key color)。在图像产品生产中，也往往把数字电视图像和计算机生产的图像混合在一起，这种技术称为视图混合(video keying)技术，它也采用通道。图像的三个基本属性真彩色、伪彩色与直接色 n真彩色(true color)真彩色图通常是指RGB 8:8:8，即图像的颜色数等于224，也常称为全彩色(full color)图像。图像的三个基本属性真彩色、伪彩色与直接色n伪彩色(pseudo color)伪彩色图像的含义是，每个像素的颜色不是由每个基色分量的数值直接决定，而是把像素值当作彩色查找表(color look-up table，CLUT)的表项入口地址，去查找一个显示图

17、像时使用的R，G，B强度值，用查找出的R，G，B强度值产生的彩色称为伪彩色。使用查找得到的数值显示的彩色是真的，但不是图像本身真正的颜色，它没有完全反映原图的彩色。图像的三个基本属性真彩色、伪彩色与直接色n直接色(direct color)每个像素值分成R，G，B分量，每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度，用变换后得到的R，G，B强度值产生的彩色称为直接色。它的特点是对每个基色进行变换。用这种系统产生颜色与真彩色系统相比，相同之处是都采用R，G，B分量决定基色强度，不同之处是前者的基色强度直接用R，G，B决定，而后者的基色强度由R，G，B经变换后决定。因而

18、这两种系统产生的颜色就有差别。试验结果表明，使用直接色在显示器上显示的彩色图像看起来真实、很自然。这种系统与伪彩色系统相比，相同之处是都采用查找表，不同之处是前者对R，G，B分量分别进行变换，后者是把整个像素当作查找表的索引值进行彩色变换。图像文件格式nBMP文件格式位图文件(Bitmap-File，BMP)格式是Windows采用的图像文件存储格式，由4个部分组成：位图文件头(bitmap-file header)、位图信息头(bitmap-information header)、彩色表(color table)和定义位图的字节阵列。图像文件格式nGIF文件格式 GIF(Graphics

19、Interchange Format)格式由CompuServe公司于87年开发，版本号GIF87a，89年扩充后版本号为GIF89a。GIF图像文件以块(block)为单位存储信息。GIF文件采用LZW压缩算法来存储图像数据。图像文件格式图像文件格式nPNG文件格式流式网络图形格式(Portable Network Graphic Format，PNG)名称来源于非官方的“PNGs Not GIF”，是一种位图文件(bitmap file)存储格式，读成“ping”。PNG用来存储灰度图像时，灰度图像的深度可多到16位，存储彩色图像时，彩色图像的深度可多到48位，并且还可存储多到16位的通

20、道数据。PNG使用从LZ77派生的无损数据压缩算法。图像文件格式n文件结构 PNG图像格式文件(或者称为数据流)由一个8字节的PNG文件署名(PNG file signature)域和按照特定结构组织的3个以上的数据块(chunk)组成。PNG定义了两种类型的数据块，一种是称为关键数据块(critical chunk)，这是标准的数据块，另一种叫做辅助数据块(ancillary chunks)，这是可选的数据块。关键数据块定义了4个标准数据块，每个PNG文件都必须包含它们，PNG读写软件也都必须要支持这些数据块。虽然PNG文件规范没有要求PNG编译码器对可选数据块进行编码和译码，但规范提倡支持可选数据块。图像文件格式nJPG文件格式 JPEG(Joint Photogaphic Experts Group)是一种连续色调、多级灰度、静止图像的数字图像压缩编码方法。它是彩色、灰度、静止图像的第一个国际标准。它的彩色空间采用CCIR 601标准（现改为ITU-R BT.601标准），每个分量、每个像素的电平规定为255级，用8位代码表示。JPEG算法的核心是基于离散余弦变换的编码方式。算法具有四种操作方式：1.顺序编码；2.累进编码；3.无失真编码；4.分层编码。

展开阅读全文