1、第四章第四章 数字视频基础数字视频基础l像素像素是数字图形与图像中能被单独处理的最小基本单元。注:从像素的视觉属性看,它是一个最小可视单位。从像素的量值属性看,它的数据结构应同时包含有显示地址、色彩、亮度等数据,这些数据就称为像素值。如果把每个像素值按照图像中该像素所对应的位置排列,就可以构成一个像素矩阵,矩阵中的每一个元素对应图像中的一个点。因此数字图形与图像的非线性编辑正是对这个像素矩阵的数据采用一定的算法进行有目的的处理。1 1、图形、图像的像素、图形、图像的像素l常见的色彩模式有:HSB(色相、饱和度、亮度);RGB(红色、绿色、蓝色);CMYK(青色、洋红、黄色、黑色);LAB(由亮
2、度L分量和两个色度分量:A从绿色到红色,B从蓝色到黄色);YUV与YIQ模式。(其中HSB(不常用),RGB三色光混合,用于显示器,CMYK以打印在纸上的油墨的光线吸收特性为基础。)2 2、图形图像的色彩模式、图形图像的色彩模式RGBRGB(红色、绿色、蓝色)(红色、绿色、蓝色)lRGB模型也称为加色法混色模型。它是以RGB(红、绿、蓝)三基色光互相叠加来实现混色的方法,因而适合于显示器等发光体的显示。当三种基本颜色等量相加时,就会得到不同深浅的灰色。然而物体的颜色是丰富多彩的,任何一种颜色和这三种基色之间的关系可用下面的配色方程来描述:lF(物体颜色)=R(红色的百分比)+G(绿色的百分比)
3、+B(蓝色的百分比)YUVYUV与与YIQYIQ模式模式lYUV适用于PAL和SECAM彩色电视制式,而YIQ适用于NTSC(National Television System Committee,国家电视系统委员会)彩色电视制式。其中Y是亮度信号,U和V则是两个色差信号,分别传送红基色分量和蓝基色分量与亮度分量的差值信号,在NTSC彩色电视制式中使用YIQ模型,其特性与YUV模型相近。3 3、图形与图像的基本类型、图形与图像的基本类型n位图图像在技术上称为栅格图像,它使用彩色网格即像素来表现图像每个像素都具有特定的位置和颜色值。(优缺点)n矢量图形由称为矢量的数学对象定义的线条和曲线组成。
4、矢量根据图像的几何特性描绘图像。(优缺点)4 4、图形与图像的基本属性、图形与图像的基本属性l分辨率分辨率l颜色深度颜色深度lAlphaAlpha通道通道l分辨率分辨率:分辨率是一个统称,分为显示分辨分辨率是一个统称,分为显示分辨率、图像分辨率等。率、图像分辨率等。l显示分辨率是指某一种显示方式下,显示屏显示分辨率是指某一种显示方式下,显示屏上能够显示出的像素数目,以水平和垂直的上能够显示出的像素数目,以水平和垂直的像素数表示。像素数表示。l图像分辨率是指组成数字图形与图像的像素图像分辨率是指组成数字图形与图像的像素数目,以水平和垂直的像素数表示。数目,以水平和垂直的像素数表示。关于图像的大小
5、和分辨率关于图像的大小和分辨率n显示器分辨率显示器分辨率:显示器上每单位长度显示的像素或点的显示器上每单位长度显示的像素或点的数量数量,通常以点通常以点/英寸英寸(dpi)(dpi)来表示,硬件上与制造有关。来表示,硬件上与制造有关。一定的图像像素在不同分辨率的屏幕上显示的大小不一一定的图像像素在不同分辨率的屏幕上显示的大小不一样,屏幕分辨率越大显示的图像越小。显示器的尺寸只样,屏幕分辨率越大显示的图像越小。显示器的尺寸只影响人视觉上的大小。影响人视觉上的大小。n图像分辨率:通常以像图像分辨率:通常以像/英寸英寸(ppi)(ppi)来表示,在来表示,在photoshopphotoshop中可以
6、更改图像的分辨率,在中可以更改图像的分辨率,在inmagereadyinmageready中,图像的分辨率始终是中,图像的分辨率始终是72ppi.72ppi.由于其创建的图像专由于其创建的图像专门用于联机门用于联机WebWeb介质而非打印介质。介质而非打印介质。n在在photoshopphotoshop中,图像的分辨率和像素尺寸是相互依存的。中,图像的分辨率和像素尺寸是相互依存的。由于一定的打印机其打印分辨率是一定的,如果在打印尺由于一定的打印机其打印分辨率是一定的,如果在打印尺寸一定的情况下,图像分辨率越大,像素尺寸越小。寸一定的情况下,图像分辨率越大,像素尺寸越小。n文件大小:图像大小是指
7、图像的容量数字大小,度量单位文件大小:图像大小是指图像的容量数字大小,度量单位是字节。相同的图像尺寸,像素越多,图像尺寸越大,是字节。相同的图像尺寸,像素越多,图像尺寸越大,(1 1*1 1英寸英寸200ppi200ppi的图像所包含的像素是的图像所包含的像素是1 1*1 1英寸英寸100ppi100ppi所所包含的像素的四倍,所以文件大小也是它的四倍。)。另包含的像素的四倍,所以文件大小也是它的四倍。)。另外,文件的压缩格式也影响图像文件的大小。外,文件的压缩格式也影响图像文件的大小。l颜色深度颜色深度 颜色深度是指图像中每个像素的颜色(或颜色深度是指图像中每个像素的颜色(或亮度)信息所占的
8、二进制数位数,亮度)信息所占的二进制数位数,记作位记作位/像素(像素(bits per pixelbits per pixel,bpp bpp)。)。n 常见颜色深度种类有:常见颜色深度种类有:n4 4位:这是位:这是VGAVGA标准支持的颜色深度,共标准支持的颜色深度,共1616种颜色。种颜色。n8 8位:这是数字媒体应用中的最低颜色深度,共位:这是数字媒体应用中的最低颜色深度,共256256种颜色。种颜色。n1616位:在位:在1616位中,用其中的位中,用其中的1515位表示位表示RGBRGB三种颜色,每种三种颜色,每种颜色颜色5 5位,用剩余的一位表示图像的其他属性。位,用剩余的一位表
9、示图像的其他属性。n2424位:用三个位:用三个8 8位分别表示位分别表示RGBRGB,称为三个颜色通道,可生,称为三个颜色通道,可生成的颜色数为成的颜色数为16 777 21616 777 216种,约种,约16 M16 M种颜色,这已成为真种颜色,这已成为真彩色。彩色。n3232位:同位:同2424位颜色深度一样,也是用三个位颜色深度一样,也是用三个8 8位通道分别表示位通道分别表示RGBRGB三种颜色,剩余的三种颜色,剩余的8 8位用来表示图像的其他属性。位用来表示图像的其他属性。lAlphaAlpha通道通道 使用使用3232位颜色深度时,用一个位颜色深度时,用一个8 8位来表示图位来
10、表示图像的像的透明度透明度信息,这个信息,这个8 8位通道称为位通道称为AlphaAlpha通通道。道。n AlphaAlpha通道分为两种类型:通道分为两种类型:StraightStraight和和PremultipliedPremultiplied通道。通道。n Straight AlphaStraight Alpha通道将像素的透明度信息通道将像素的透明度信息保存在独立的保存在独立的AlphaAlpha通道中,它也被称为通道中,它也被称为不带遮罩的不带遮罩的AlphaAlpha通道通道。n Premultiplied AlphaPremultiplied Alpha通道不但保存通道不但保
11、存AlphaAlpha通道中的透明度信息,而且同时保通道中的透明度信息,而且同时保存存RGBRGB通道中的相同信息,因而它也被称通道中的相同信息,因而它也被称为为带有背景色遮罩的带有背景色遮罩的AlphaAlpha通道通道。数字视频原理及标准数字视频原理及标准 1 1动态图形与图像的视觉原理动态图形与图像的视觉原理 人眼具有人眼具有“视觉暂留视觉暂留”的时间特性,人眼对光像的时间特性,人眼对光像的主观亮度感觉与光像对人眼作用的时间并不同的主观亮度感觉与光像对人眼作用的时间并不同步步,主观感觉亮度是逐渐下降的主观感觉亮度是逐渐下降的,如图所示如图所示:图像亮度视觉 t亮度 t t 图1-2 动态
12、图像之间在视觉亮度上的时间重叠特性曲线 视觉暂留一般时间较短暂(约0.1s0.4s)。利用这一现象,将一系列画面中物体移动或形状改变很小的图像,以足够快的速度连续播放,就会产生连续活动的场景。(电影电视里屏幕闪烁、车轮风扇反转等)2.视频的定义 视频又称运动图像或活动图像,它是指连续地随着时间变化的一组图像。(一般情况下该组图像具有相关性,趋于一致)l 帧:一幅单独的图像(frame)l 帧率:每秒种播放的帧数,单位是f/sl 典型的帧率:24f/s、25f/s、30f/sl 常见的视频信号:电影、电视3.3.视频信号的描述视频信号的描述 (a)奇数场图像 (b)偶数场图像 (c)奇、偶数场镶
13、嵌 图例 隔行扫描图像再现示意图 普通电视制式:PAL、NTSC、SECAM制从扫描的形式上看,可以分为非交错式和交错式。(逐行、隔行)从扫描的形式上看,可以分为非交错式和交错式。(逐行、隔行)NTSC制式(美国、日本、中国台湾等)National Television Systems Committee(1953,美国)30帧/秒(29.97fps),525行/帧 隔行扫描:2场/帧,262.5行/场 颜色模型:YIQ 宽高比:4:3(帧大小:352*240)PAL制式(中国、德国、英国、朝鲜等)Phase Alternation Line(1962,德国)25帧/秒,625行/帧 隔行扫描
14、:2场/帧,312.5行/场 颜色模型:YUV 宽高比:4:3(帧大小:352*288)SECAM制式(法国、俄罗斯、东欧国家)“轮流传送彩色与存储”(1966年,法国)类似PAL制式数字电视:拍摄、编辑、制作、传输、播出、接收电视信号全过程都使用数字技术的电视系统。目前数字视频可以分为三种不同的标准:目前数字视频可以分为三种不同的标准:l(1 1)ATSC(Advanced Television Systems Committee,ATSC(Advanced Television Systems Committee,广播行业组广播行业组织,美国高级电视系统委员会织,美国高级电视系统委员会)标
15、准标准 ,该标准中该标准中1414种采用逐行扫描方式。种采用逐行扫描方式。n高清晰度电视(高清晰度电视(HDTVHDTV)为)为1920192010801080F F,帧频,帧频F F为为6060(59.9459.94)Hz/Hz/隔行扫描,帧频隔行扫描,帧频3030(29.9729.97)Hz/Hz/逐行扫描,帧频逐行扫描,帧频2424(23.9223.92)Hz/Hz/逐逐行扫描;还有(行扫描;还有(HDTVHDTV)12801280720720F F,帧频,帧频F F为为6060(59.9459.94)Hz/Hz/逐逐行扫描,帧频行扫描,帧频3030(29.9729.97)Hz/Hz/逐
16、行扫描,帧频逐行扫描,帧频24Hz/24Hz/逐行扫描。逐行扫描。n目前的目前的HDTV有三种显示分辨率格式,分别是:有三种显示分辨率格式,分别是:720P(1280720,逐行,逐行)、1080i(19201080,隔行隔行)和和1080P(19201080,逐行,逐行)。n常规清晰度电视(常规清晰度电视(SDTVSDTV)为)为704 704 480 480 F F和和64O 64O 480 480 F F,帧,帧频频F F可以是可以是 23.97623.976、2424、29.9729.97、3030、59.9459.94和和60Hz60Hz。4 4、数字视频标准、数字视频标准l (2
17、2)DVBDVB(The Digital Video The Digital Video Broadcasting ProjectBroadcasting Project,数字视频广播节目),数字视频广播节目)标准(是以欧洲为典型的数字视频标准)标准(是以欧洲为典型的数字视频标准)n25Hz25Hz帧频的帧频的SDTV IRDSDTV IRD可以接收扫描格式为可以接收扫描格式为7207205765762525、5445445765762525、3523525765762525的图的图像像;n3OHz3OHz帧频的帧频的SDTV IRDSDTV IRD可以支持可以支持30000/1001Hz30
18、000/1001Hz的帧频,的帧频,可以接收扫描格式为可以接收扫描格式为7207204804803030、5445444804803030、4804806806803030、3523524804803030和和352352240O240O3030的图的图像。像。n对对25Hz25Hz的的HDTV IRDHDTV IRD,可以接收扫描格式为,可以接收扫描格式为11521152192O192OF F和和1080108019201920F F的图像。的图像。l(3 3)ISDB(Integrated Services Digital ISDB(Integrated Services Digital
19、BroadcastingBroadcasting,综合业务数字广播,综合业务数字广播)标准标准n它是由欧洲的它是由欧洲的DVB-TDVB-T衍生出来的集中在日本的数字视衍生出来的集中在日本的数字视频标准,可以说是经修改的欧洲方案。与频标准,可以说是经修改的欧洲方案。与DVB-TDVB-T相比,相比,ISDB-TISDB-T增加了部分接收和分层传输功能,是一种标增加了部分接收和分层传输功能,是一种标准化的复用方案,可以灵活地集成和发送多节目的准化的复用方案,可以灵活地集成和发送多节目的电视和其它数据业务。它可以接收的扫描格式与电视和其它数据业务。它可以接收的扫描格式与DVBDVB系统相近。系统相
20、近。HDTVEDTVSDTVPDTV高清晰度数字电视增强型数字电视标准清晰数字电视普及型数字电视电影级图像比DVD略高DVD级图像VCD级图像其电视接收器按清晰度等级可分其电视接收器按清晰度等级可分收看数字电视收看数字电视:数字机顶盒:数字机顶盒/AV/AV端子智能卡端子智能卡 1.视频数字化过程扫描扫描采样采样量化量化编码编码模拟视模拟视频信号频信号数字视数字视频信号频信号视频是连续的图像视频是连续的图像图像是离散的视频图像是离散的视频二、视频的数字化 2.数字视频的优点 与模拟视频相比,其优点:数字视频便于创造性的编辑与合成 数字视频可不失真地进行多次复制 在网络环境下容易实现资源共享 数
21、字视频可与其它媒体组合使用 缺陷:处理速度慢 数据量大(压缩、光盘)运动图像压缩标准一、MPEG标准概述 MPEG(Moving Picture Experts Group,运动图像专家组)是在1988年由ISO/IEC联合成立的工作组,其主要任务是制订各种运动图像及其伴音信号的数字压缩国际标准。1.MPEG-1标准 MPEG-1是92年通过的用于1.5Mbps速率的数字存储媒体运动图像及伴音编码标准。MPEG-1主要应用:光盘、数字录音带、磁盘、通信网络以及VCD等。5.2 运动图像压缩标准2.MPEG-2标准 MPEG-2是1994年通过的用于4-15Mbps速率的广播级运动图像及伴音编码
22、国际标准。MPEG-2主要应用:DVD、HDTV(高清晰度电视)、视频会议以及多媒体邮件等。3.MPEG-4标准 MPEG-4是1998年通过的用于低比特率(64kbps)的视频压缩编码标准。主要应用:可视电话、视听对象(交互)衍生DIVX:DivX是将影片的音频由MP3来压缩、视频由MPEG-4技术来压缩,最后再将两部分合成制作而成的 Xvid(真正全开放,性能比DIVX更佳)运动图像压缩标准4.MPEG-7标准 MPEG-7(Multimedia Content Description Interface,多媒体内容描述接口)规定一套描述符标准,用于描述各种多媒体信息,以便更快更有效地检索
23、信息。主要应用:数字图书馆、广播媒体选择、多媒体编辑以及多媒体索引服务。5.MPEG-21标准 多媒体框架(Multimedia Framework)运动图像压缩标准6.H.264/AVC是由ITU-T视频编码专家组(VCEG)和ISO/IEC动态图像专家组(MPEG)联合组成的联合视频组(JVT,Joint Video Team)提出的高度压缩数字视频编解码器标准。(H.264/MPEG-4 AVC)x.264是H.264的另外一种开源编码格式,相对依赖CPU软件解码.7.VC-1 微软公司高清电视压缩标准,VC-1和H.264一样是下一代数字高清电视的视频压缩标准,VC-1是SMTP(美国
24、电影协会)所有,只有付费才能拿到运动图像压缩标准8.AVSAVS(Audio and Video coding Standard Workgroup of China):“信息技术先进音视频编码”是我国具备自主知识产权的第二代信源编码标准是我国具备自主知识产权的第二代信源编码标准.是国家标准之一。据传:AVS和H.264即将成为IPTV的候选国际标准。MPEG-4未入选 视频容器格式定义了怎么存储数据(视频和音频),而不论存储什么类型的数据,不是所有视频格式能兼容该容器格式。(一般我们说视频文件格式主要是指容器格式,而不是指编码格式)1.AVI文件 AVI(Audio Video Interl
25、eave)是一种音视频交叉记录的视频容器文件格式,微软在1992年推出AVI文件及其应用软件Video for Windows,故通用性好,使用广泛。索引放在文件尾部。特点:AVI采用帧内压缩,可用一般的视频编辑软件进行编辑。提供无硬件视频回放,其窗口大小和帧率可根据播放环境调整。不适用网络流媒体,高码率和动态速率编码支持不好。三、视频容器格式(文件格式)2.MOV文件 MOV(Movie digital video)文件是Apple公司在其Macintosh机推出的视频文件格式,其相应的视频应用软件QuickTime。QuickTime for Macintosh QuickTime for
26、 Windows 目前很少有人使用。3.MPEG/MPG文件 MPG文件是采用MPEG算法进行压缩的全运动视频文件格式。可同步播放全运动视频图像和CD音乐伴音。其扩展名一般是.mpg或.mepg Video CD的文件名是.DAT;M1V(基于MPEG1压缩算法);DVD文件一般是.VOB .M2V4.WMV文件 微软公司的编码方式,可用在Internet上实时传播多媒体的技术标准。可扩充的媒体类型、本地或网络回放、可伸缩的媒体类型、流的优先级化、多语言支持、扩展性等 5.Asf文件 asf(Advanced Streaming format)高级流格式;是MICROSOFT 为了和现在的Re
27、al player 竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式,实用于网络实时观看。6.3GP文件 3GP是一种3G流媒体的视频编码格式,主要是为了配合3G网络的高传输速度而开发的,也是目前手机中最为常见的一种视频格式.7.MP4文件 MP4视频文件封装格式是基于QuickTime容器格式定义的开放的容器,几乎可以用来描述所有的媒体结构。支持多种格式,并非只是MPEG-4的缩写,也非MP4播放器。8.TS/PS/M2TS文件 都基于MPEG2/H.264/VC1算法进行压缩的全运动视频文件格式,有HDDVD和BD之争。HDDVD文件后缀为.TS(remux)(原版PS流 .V
28、OB .EVO)BluRay-DVD(BD)后缀名:M2TS9.RA/RAM文件 RealNetWorks公司的REAL VIDEO视频流技术编码一开始就是基于Internet的。微软开发ASF 与其竞争。视频效果一般,支持高清较差。10.FLV文件 FLV(flash Video)流媒体格式是一种新的视频格式。由于它形成的文件极小、加载速度极快。目前很多视频网站采用此格式,高清支持差。11.MKV文件(推荐)是一种全称为Matroska的新型多媒体封装格式,这种先进的、开放的封装格式。可在一个文件中集成16条以上不同类型的音轨和字幕轨,而且其视频编码的自由度也非常大.后缀有3种:1).mkv:通用视频文件,有的包含音频,也可以只有视频;2).mka:音频文件,可以包含各种支持的音频编码,如MP2,MP3,Vorbis,AAC,AC3,DTS,PCM。3).mks:字幕流文件