1、彩色数字图像基础计算机图形、图像技术计算机图形分为两大类位图图像和矢量图形n矢量图形,是由叫作矢量的数学对象所定义的直线和曲线组成的。矢量根据图形的几何特性来对其进行描述,矢量图形与分辨率无关。n位图图象,也叫作栅格图象。位图图象是用小方形网格(位图或栅格),即人所共知的象素来代表图象,每个象素都被分配一个特定位置和颜色值。位图图象与分辨率有关,换句话说,它包含固定数量的象素,代表图象数据。研究路线图像数据压缩主要根据下面两个基本事实来实现的:n 图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数据量;n 人的眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也
2、就达到压缩数据的目的。利用前一个事实的压缩技术就是无损压缩技术,利用后一个事实的压缩技术就是有损压缩技术。实际的图像压缩是综合使用各种有损和无损压缩技术来实现的。图像的RGB颜色模型n绝大部分可见光谱可用红、绿和蓝(RGB)三色光按不同比例和强度的混合来表示。在颜色重叠的位置,产生青色、洋红和黄色。n因为 RGB 颜色合成产生白色,它们也叫作加色。将所有颜色加在一起产生白色就是说,所有光被反射回眼睛。加色用于光照、视频和显示器。例如,显示器通过红、绿和蓝荧光粉发射光线产生彩色。图像的RGB颜色模型图像的CMYK颜色模型nCMYK模型以打印在纸张上油墨的光线吸收特性为基础,白光照射到半透明油墨上
3、时,部分光谱被吸收,部分被反射回眼睛。n理论上,青色(C)、洋红(M)和黄色(Y)色素能合成吸收所有颜色并产生黑色。由于这个原因,这些颜色叫作减色。图像的CMYK颜色模型n 因为所有打印油墨都会包含一些杂质,这三种油墨实际上产生一种土灰色,必须与黑色(K)油墨混合才能产生真正的黑色。将这些油墨混合产生颜色叫作四色印刷。图像的CMYK颜色模型相加色与相减色关系相加混色RGB相减混色CMY生成的颜色000111黑001110蓝010101绿011100青100011红101010品红110001黄111000白颜色模型的空间表示颜色模型关系示意VGA调色板色度-饱和度-亮度 HSL(HSB)颜色模
4、型 hue SaturationLightness(brightness)图像的HSL颜色模型基于人类对颜色的感觉,HSL 模型描述颜色的三个基本特征:n色相是从物体反射或透过物体传播的颜色。在 0 到 360 度的标准色轮上,色相是按位置度量的。在通常的使用中,色相是由颜色名称标识的,比如红、橙或绿色。n饱和度是指颜色的强度或纯度。饱和度表示色相中灰成分所占的比例,用从 0%(灰色)到 100%(完全饱和)的百分比来度量。在标准色轮上,从中心向边缘饱和度是递增的。n亮度是颜色的相对明暗程度,通常用从 0%(黑)到 100%(白)的百分比来度量。图像的HSL颜色模型图像的Lab颜色模型nL L
5、*a a*b b 颜色模型颜色模型是在 1931 年国际照明委员会(CIE)制定的颜色度量国际标准的基础上建立的。1976 年,这种模型被重新修订并命名为 CIE L*a*b。n L*a*b 颜色设计为与设备无关;不管使用什么设备(如显示器、打印机、计算机或扫描仪)创建或输出图象,这种颜色模型产生的颜色都保持一致。nL*a*b 颜色由亮度或光亮度分量(L)和两个色度分量组成;两个分量即 a 分量(从绿到红)和 b 分量(从蓝到黄)。图像的Lab颜色模型nA.光度=100(白)nB.绿到红分量nC.蓝到黄分量nD.光度=0(黑)到红分量关于“溢色”颜色模型的色域n色域是一个色系能够显示或打印的颜
6、色范围。人眼看到的色谱比任何颜色模型中的色域都宽。n在颜色模型中,L*a*b具有最宽的色域,它包括RGB和CMYK色域中的所有颜色。通常RGB色域包含能在计算机显示器或电视屏幕(发出红、绿和蓝光)上所有能显示的颜色。因而一些诸如纯青或纯黄等颜色不能在显示器上精确显示。颜色模型的色域nCMYK色域较窄,仅包含使用印刷色油墨能够打印的颜色。当不能被打印的颜色在屏幕上显示时,它们称为溢色即超出CMYK色域之外。彩色空间的线性变换标准nYIQ适用于NTSC彩色电视制式 nYUV适用于PAL和SECAM彩色电视制式 nYCrCb适用于计算机用的显示器为了使用人的视角特性以降低数据量,通常把RGB空间表示
7、的彩色图像变换到其他彩色空间。彩色空间变换有三种:彩色空间的线性变换标准nYUV与YIQ模型 在彩色电视制式中,使用YUV和YIQ模型来表示彩色图像。在PAL彩色电视制式中使用YUV模型,Y表示亮度,UV用来表示色差,U、V是构成彩色的两个分量;在NTSC彩色电视制式中使用YIQ模型,其中的Y表示亮度,I、Q是两个彩色分量。nYUV/YIQ特点 亮度信号(Y)和色度信号(U、V)是相互独立的;可以利用人眼的特性来降低数字彩色图像所需要的存储容量。用YUV的好处n 亮度信号Y解决了彩色电视机与黑白电视的兼容问题。n大量实验表明,人眼对色差信号不敏感,而对亮度信号特别敏感。用亮度信号Y传送细节,用
8、色差信号UV进行大面积涂色。选YIQ的好处n大量实验统计,人眼对红黄之间的颜色变化最敏感,而分辨蓝和紫之间颜色变化最不敏感。所以把相角为123的橙色及其相反相角的303的青色定义为I轴,它表示人眼最敏感的色轴。与I正交的色度信号轴,通过33 0213线,叫Q轴,它表示人眼最不敏感的色轴。在传送分辨率弱的Q信号是,可用较窄的频带,而传送分辨率较强的I信号是,可用较宽的频带。彩色空间RGB-YUVnY=0.299R+0.587G+0.114BnU=0.147R0.289G+0.436B nV=0.615R0.515G0.100B彩色空间RGB-YIQnY=0.299R+0.587G+0.114B
9、n I=0.596R0.275G0.321B nQ=0.212R0.523G+0.311B彩色空间RGB-YCrCbn数字域中的彩色空间变换与模拟域的彩色空间变换不同。它们的分量使用Y、Cr和Cb来表示,与RGB空间的转换关系如下:nY 0.299R0.578G0.114B nCr(0.500R0.4187G0.0813B)128 nCb=(0.1687R0.3313G0.500B)128电视信号n黑白全电视信号 摄象机把图象信号转变成的最后输出信号就是全电视信号。全电视信号主要由三个部分组成:图象信号(视频信号)、复合消隐信号、复合同步信号。n彩色全电视信号 彩色全电视信号主要由:亮度信号、
10、色度信号、复合同步信号、复合消隐信号组成。数字视频的制式数字视频的制式n数字视频是由一序列静止画面组成的,称为帧。帧率选择在每秒2430帧之间,视频的运动就非常光滑连续;而低于每秒15帧,连续运动视频就会有停顿的感觉。nPAL制规定视频每秒25帧,每帧625个扫描行。625行中用于扫描图像的有效行数只有576行,所以图像在垂直方向上的分辨率为576点。按现行4:3(宽:高)的电视标准,图像在水平方向上的分辨率应为576*4/3=768点,这就得到了768*576这一常见的图像大小。nNTSC制规定每秒30帧,每帧525行,同样采用了隔行扫描方式,每一帧由两场组成,其图像大小是720*486。由
11、于PAL制与NTSC制的场频、行频以及色彩处理方式均不同,因此两者是互不兼容的。影响数字视频质量的因素n帧速:25帧/秒(PAL)、30帧/秒(NTSC)。帧速越高,数据量越大,质量越好。n分辨率:视频分辨率越大,数据量越大,质量越好。n颜色数:指视频中最多能使用的颜色数。颜色位数越多,色彩越逼真,数据量也越大。n压缩比:压缩比较小时对图像质量不会有太大影响,而超过一定倍数后,将会明显看出图像质量下降,而且压缩比越大在回放时花费在解压的时间越长。n关键帧:视频数据具有很强的帧间相关性,动态视频压缩正是利用帧间相关性的特点,通过前后两个关键帧动态合成中间的视频帧。因此对于含有频繁运动的视频图像序
12、列,关键帧数少就会出现图像不稳定现象。图像的种类n只 有 黑 白 两 中 颜 色 的 图 像 称 为 单 色 图 像(monochrome image),它的每个像素的像素值用1位存储,它的值只有“0”或者“1”,一幅640480的单色图像需要占据37.5KB的存储空间。n如果每个像素的像素值用一个字节表示,灰度值级数就等于256级,每个像素可以是0-255之间的任何一个值,一幅640480的灰度图像就需要占据300KB的存储空间。图像的种类图像的种类n彩色图像(color image)可按照颜色的数目来划分,例如256色图像和真彩色(24bit颜色)等。彩色图像的每个像素的R、G和B值用一个
13、字节来表示,一幅640480的8位彩色图像需要307.2KB的存储空间。一幅640480的真彩色图像需要921.6 KB的存储空间。n许多24位彩色图像是用32位存储的,这个附加的8位叫做alpha通道,它的值叫做alpha值,它用来表示该像素如何产生特技效果。图像的种类图像的三个基本属性分辨率n显示分辨率 显示分辨率是指显示屏上能够显示出的像素数目。n图像分辨率 图像分辨率是指组成一幅图像的像素密度的度量方法。对同样大小的一幅图,如果组成该图的图像像素数目越多,则说明图像的分辨率越高,看起来就越逼真。相反,图像显得越粗糙。图像的三个基本属性像素深度 n像素深度是指存储每个像素所用的位数,它也
14、是用来度量图像的分辨率 n例如,一幅彩色图像的每个像素用R,G,B三个分量表示,若每个分量用8位,那么一个像素共用24位表示,就说像素的深度为24,每个像素可以是224=16777216种颜色中的一种。图像的三个基本属性像素深度 n在用二进制数表示彩色图像的像素时,除R,G,B分量用固定位数表示外,往往还增加1位或几位作为属性(Attribute)位。例如,RGB 5:5:5表示一个像素时,用2个字节共16位表示,其中R,G,B各占5位,剩下一位作为属性位。在这种情况下,像素深度为16位,而图像深度为15位 图像的三个基本属性像素深度 n用32位表示一个像素时,R,G,B分别用8位表示,剩下的
15、8位常称为通道(alpha channel)位,或称为复盖(overlay)位、中断位、属性位。它的用法可用一个预乘通道(premultiplied alpha)的例子说明。假如一个像素(A,R,G,B)的四个分量都用规一化的数值表示,(A,R,G,B)为(1,1,0,0)时显示红色。当像素为(0.5,1,0,0)时,预乘的结果就变成(0.5,0.5,0,0),这表示原来该像素显示的红色的强度为1,而现在显示的红色的强度降了一半。n用这种办法定义一个像素的属性在实际中很有用。例如在一幅彩色图像上叠加文字说明,而又不想让文字把图复盖掉,就可以用这种办法来定义像素,而该像素显示的颜色又有人把它称为
16、混合色(key color)。在图像产品生产中,也往往把数字电视图像和计算机生产的图像混合在一起,这种技术称为视图混合(video keying)技术,它也采用通道。图像的三个基本属性真彩色、伪彩色与直接色 n真彩色(true color)真彩色图通常是指RGB 8:8:8,即图像的颜色数等于224,也常称为全彩色(full color)图像。图像的三个基本属性真彩色、伪彩色与直接色n伪彩色(pseudo color)伪彩色图像的含义是,每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表(color look-up table,CLUT)的表项入口地址,去查找一个显示图
17、像时使用的R,G,B强度值,用查找出的R,G,B强度值产生的彩色称为伪彩色。使用查找得到的数值显示的彩色是真的,但不是图像本身真正的颜色,它没有完全反映原图的彩色。图像的三个基本属性真彩色、伪彩色与直接色n直接色(direct color)每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。它的特点是对每个基色进行变换。用这种系统产生颜色与真彩色系统相比,相同之处是都采用R,G,B分量决定基色强度,不同之处是前者的基色强度直接用R,G,B决定,而后者的基色强度由R,G,B经变换后决定。因而
18、这两种系统产生的颜色就有差别。试验结果表明,使用直接色在显示器上显示的彩色图像看起来真实、很自然。这种系统与伪彩色系统相比,相同之处是都采用查找表,不同之处是前者对R,G,B分量分别进行变换,后者是把整个像素当作查找表的索引值进行彩色变换。图像文件格式nBMP文件格式 位图文件(Bitmap-File,BMP)格式是Windows采用的图像文件存储格式,由4个部分组成:位图文件头(bitmap-file header)、位图信息头(bitmap-information header)、彩色表(color table)和定义位图的字节阵列。图像文件格式nGIF文件格式 GIF(Graphics
19、Interchange Format)格式由CompuServe公司于87年开发,版本号GIF87a,89年扩充后版本号为GIF89a。GIF图像文件以块(block)为单位存储信息。GIF文件采用LZW压缩算法来存储图像数据。图像文件格式图像文件格式nPNG文件格式 流式网络图形格式(Portable Network Graphic Format,PNG)名称来源于非官方的“PNGs Not GIF”,是一种位图文件(bitmap file)存储格式,读成“ping”。PNG用来存储灰度图像时,灰度图像的深度可多到16位,存储彩色图像时,彩色图像的深度可多到48位,并且还可存储多到16位的通
20、道数据。PNG使用从LZ77派生的无损数据压缩算法。图像文件格式n文件结构 PNG图像格式文件(或者称为数据流)由一个8字节的PNG文件署名(PNG file signature)域和按照特定结构组织的3个以上的数据块(chunk)组成。PNG定义了两种类型的数据块,一种是称为关键数据块(critical chunk),这是标准的数据块,另一种叫做辅助数据块(ancillary chunks),这是可选的数据块。关键数据块定义了4个标准数据块,每个PNG文件都必须包含它们,PNG读写软件也都必须要支持这些数据块。虽然PNG文件规范没有要求PNG编译码器对可选数据块进行编码和译码,但规范提倡支持可选数据块。图像文件格式nJPG文件格式 JPEG(Joint Photogaphic Experts Group)是一种连续色调、多级灰度、静止图像的数字图像压缩编码方法。它是彩色、灰度、静止图像的第一个国际标准。它的彩色空间采用CCIR 601标准(现改为ITU-R BT.601标准),每个分量、每个像素的电平规定为255级,用8位代码表示。JPEG算法的核心是基于离散余弦变换的编码方式。算法具有四种操作方式:1.顺序编码;2.累进编码;3.无失真编码;4.分层编码。