1、第第8章章 数字视频与动画处理技术数字视频与动画处理技术n8.1 数字视频基础n8.2 数字视频的采集与处理n8.3 流媒体技术简介n8.4 计算机动画处理技术8.1 数字视频基础数字视频基础n8.1.1 视频的基本概念n8.1.2 模拟电视制式与信号类型n8.1.3 视频的数字化n8.1.4 视频编码技术标准n8.1.5 常见视频文件格式8.1.1 视频的基本概念视频的基本概念n视频是指连续随时间变化的一组图像,也称为运动图像或活动图像。由于人的眼睛存在一种视觉残留现象,即物体的映像在眼睛的视网膜上会保留大约0.1秒的短暂时间。因此,只要将一系列连续的图像以足够快的速度播放,人眼就会觉得画面
2、是连续活动的。n组成视频的每一幅图像称为帧,图像播放的速度称为帧率,单位是fps(frame per second,帧/秒)。常见的帧率有24fps、25fps和30fps。通常伴随视频图像还会有一条或多条音频轨道,为视频提供音效。8.1.1 视频的基本概念视频的基本概念n视频图像的分层结构:8.1.1 视频的基本概念视频的基本概念n按照处理方式不同,视频可以分为模拟视频和数字视频两种。1模拟视频模拟视频是用于记录视频图像和声音,并随时间连续变化的电磁信号。早期的视频都是采用模拟方式存储、处理和传输的。但模拟视频在复制、传输等方面存在不足,也不利于分类、检索和编辑。2数字视频数字视频是将模拟视
3、频信号进行数字化处理后得到的视频信号。数字视频与模拟视频相比在存储、复制、编辑、检索和传输等方面有着不可比拟的优势。8.1.1 视频的基本概念视频的基本概念n数字视频的主要优点有:(1)便于编辑处理。(2)有利于视频再现。(3)便于分类和检索。8.1 数字视频基础数字视频基础n8.1.1 视频的基本概念n8.1.2 模拟电视制式与信号类型n8.1.3 视频的数字化n8.1.4 视频编码技术标准n8.1.5 常见视频文件格式8.1.2 模拟电视制式与信号类型模拟电视制式与信号类型n电视信号的技术标准称为制式,不同的制式在帧频、分辨率、信号带宽、载波频率和颜色空间等方面存在不同,目前世界上常用的电
4、视制式有以下几种:(1)PAL制式。它是德国于1962年制定的一种彩色电视标准,被中国大陆、新加坡、新西兰、澳大利亚等国和中国香港地区,以及德国、英国等一些西欧国家采用。PAL制式规定帧频为25帧/秒,每帧625行,场扫描频率50Hz,颜色空间为YUV。PAL制式采用隔行扫描的方式,即每帧画面需要两次扫描完成,每次扫描绘出一个场,两个场构成一帧。8.1.2 模拟电视制式与信号类型模拟电视制式与信号类型(2)NTSC制式。这是美国国家电视系统委员会在1953年制定的彩色电视标准,被美国、加拿大等大部分西半球国家,以及日本、韩国、菲律宾等国和中国台湾地区采用。NTSC制式规定帧频为30帧/秒(严格
5、的说是29.97帧/秒),每帧525行,场扫描频率60Hz,颜色空间为YIQ,也采用隔行扫描方式。(3)SECAM制式。它是法国于1965年提出的一种彩色电视标准,被法国、俄罗斯及一些东欧和中东国家采用。除了色度信号采用频率调制,色差信号按行的顺序传输外,这种制式的其它方面与PAL制类似。8.1.2 模拟电视制式与信号类型模拟电视制式与信号类型n三种制式的主要技术指标:电视制式帧频(Hz)行/帧亮度带宽(MHz)色度带宽(MHz)彩色副载频(Hz)声音载频(MHz)PAL256256.01.3(U),1.3(V)4.436.5NTSC305254.21.3(I),0.6(Q)3.584.5SE
6、CAM256256.01.0(U),1.0(V)4.256.58.1.2 模拟电视制式与信号类型模拟电视制式与信号类型n电视信号中包括了亮度信号、色度信号、复合同步信号和伴音信号,将这些信号传送给电视接收机后,就能还原出视频图像和伴音了。n根据信号源不同,电视机输入/输出的信号类型有以下几种:(1)高频或射频信号。电视节目的信号在空中传输前,必须被调制成高频或射频信号,每个信号占用一个频道,以防止多路节目互相干扰。PAL制式的每个频道占用8MHz带宽,NTSC制式的每个频道占用4MHz带宽。传统的无线电视、有线电视都是使用这种信号进行传输的。(2)复合视频信号。它是将电视信号中的亮度、色差和同
7、步信号复合成而的单一信号,即将全电视信号分离出伴音后的信号。由于复合视频信号中的色度和亮度是间插在一起的,因此在重放时很难恢复原有的色彩。这种信号的带宽较低,一般只有水平240线左右的分辨率。(3)分量视频信号。它将视频中的每个基色分量,如R、G和B,Y、U和V或者Y、I和Q分别作为独立的信号进行传送。该信号表示的颜色效果最好,但需要较高的带宽和同步信号。8.1.2 模拟电视制式与信号类型模拟电视制式与信号类型(4)S-Video信号。它是一种两分量视频信号,将亮度和色度信号分为两路进行传送,是复合信号和分量信号之间的一种折中方案。由于减少了色度和亮度信号的相互干扰,S-Video信号的水平分
8、辨率可达420线,比复合信号的效果要好得多。(1)射频线 (2)复合视频线 (3)色差分量线 (4)S-Video线8.1 数字视频基础数字视频基础n8.1.1 视频的基本概念n8.1.2 模拟电视制式与信号类型n8.1.3 视频的数字化n8.1.4 视频编码技术标准n8.1.5 常见视频文件格式8.1.3 视频的数字化视频的数字化n视频数字化是指以一定的速度对模拟视频信号进行采样、量化等处理生成数字信号的过程,该过程主要包括色彩空间的转换、光栅扫描的转换以及分辨率的统一等。n模拟视频数字化的方法主要有复合数字化和分量数字化两种,目前使用得较多的是后一种。分量数字化法先把复合视频信号中的亮度和
9、色度分离,得到YUV或YIQ分量,然后用三个模/数(A/D)转换器对三个分量分别进行数字化,最后再转换成RGB空间。8.1.3 视频的数字化视频的数字化n在模拟电视信号中,色度信号的带宽低于亮度信号的带宽,因此在数字化时,对色差分量的采样率可以低于亮度信号的采样率。如果用Y:U:V来表示Y、U、V三分量的采样比例,则数字视频的采样格式有Y:U:V4:4:4、Y:U:V4:2:2、Y:U:V4:1:1和Y:U:V4:2:0等几种。n为了在PAL、NTSC和SECAM电视制式之间确定共同的数字化参数,国际无线电咨询委员会(CCIR)制定了广播级质量的数字电视编码标准,称为CCIR 601标准。在该
10、标准中,对采样频率、采样结构、色彩空间转换等都作了严格的规定。8.1.3 视频的数字化视频的数字化nCCIR 601标准的主要内容有:(1)采样频率为13.5MHz,这个采样频率正好是PAL、SECAM制式行频的864倍、NTSC制式行频的858倍,可以保证采样时采样时钟与行同步信号同步。例如,对于Y:U:V4:2:2的采样格式,亮度信号的采样频率为13.5MHz,两个色差信号的采样频率分别为6.75MHz。(2)根据采样频率可知,对于PAL、SECAM制式,每一扫描行采样864个样本;对于NTSC制式,每一扫描行采样858个样本。但对于所有制式,每一扫描行的有效样本均为720个。8.1.3
11、视频的数字化视频的数字化n在计算机实际显示数字视频时,通常采用表中的参数:(3)CCIR 601规定,每个样本点均按8位二进制数进行量化,即有256个级别。如果按照13.5MHz的采样率、4:2:2的采样格式,则数字视频的数据量为:13.5(MHz)8(b)26.75(MHz)8(b)=27MByte/s如果采样格式改为4:4:4,则数据量会增加为40.5MB/s。电视制式分辨率帧率NTSC72048030PAL、SECAM720576258.1.3 视频的数字化视频的数字化n与静态图像的数字化不同,视频的数字化不仅要在空间上进行采样,还要在时间上进行采样。单位时间内采集的帧数,称为采样帧速率
12、。通常用时间码来识别和记录视频数据流中的每一帧,从一段视频的起始帧到终止帧,其间的每一帧都有一个唯一的时间码地址。n根据动画和电视工程师协会(Society of Motion Picture and Television Engineers,SMPTE)使用的时间码标准,其格式是“小时:分钟:秒:帧”。例如,一段长度为00:02:31:15的视频片段,如果以每秒30帧的速率播放,则播放时间为2分钟31.5秒。8.1 数字视频基础数字视频基础n8.1.1 视频的基本概念n8.1.2 模拟电视制式与信号类型n8.1.3 视频的数字化n8.1.4 视频编码技术标准n8.1.5 常见视频文件格式8.
13、1.4 视频编码技术标准视频编码技术标准n由于视频数字化后的数据量十分巨大,因此必须对数字视频进行压缩编码。目前最常用的视频编码标准是MPEG标准和H.26x标准两大类。1MPEG标准MPEG的全称是Moving Picture Experts Group(运动图像专家组),是国际标准化组织(ISO)和国际电工委员会(IEC)建立的联合技术委员会1(JTC1)的第29分委员会(SC29)第11工作组(WG11)。该专家组从1988年起,每年召开4次左右的国际会议,内容是制定、修订和发展MPEG系列的多媒体标准。目前已经公布和正在制定的标准有MPEG-1、MPEG-2、MPEG-4、MPEG-7
14、和MPEG-21,它已经成为影响最大的视频编码技术标准。8.1.4 视频编码技术标准视频编码技术标准n(1)MPEG-1标准。MPEG-1标准于1991年11月提出,1992年11月获得通过,1993年8月公布。该标准适用于数据传输率为1.5Mb/s左右的应用环境,主要用于在CD-ROM等数字存储设备上存储视频和声音信号。它主要包括MPEG-1视频、MPEG-1音频和MPEG-1系统三个部分。MPEG-1视频是标准的核心,目标是采用类似4:2:2的采样格式,将分辨率为352288帧频为25Hz(PAL制式)或分辨率为352240帧频为30Hz(NTSC制式)的视频图像压缩成数据传输率为1.2M
15、b/s3Mb/s的数字编码,解码后的图像效果接近VHS录像带。8.1.4 视频编码技术标准视频编码技术标准MPEG-1图像压缩的基本思想是在空间方向上利用与JPEG类似的压缩算法来去掉冗余信息,在时间方向上利用运动补算法偿来去掉冗余信息。MPEG-1将视频图像帧分为三种:I帧、P帧和B帧。I帧采用帧内压缩法,也称关键帧压缩法,利用离散余弦变换(DCT)算法进行压缩,压缩比可达1/6。P帧采用前向预测算法,根据本帧与相邻的前一帧(I帧或P帧)的不同点来压缩本帧数据,即根据运动的特征进行帧间压缩,利用P帧与I帧联合压缩可达更高的压缩比。B帧采用双向预测算法,根据相邻的前一帧、本帧以及后一帧数据的不
16、同点来压缩本帧数据,仅记录本帧与前后帧的差值,它的数据只有I帧的15%、P帧的50%以下。8.1.4 视频编码技术标准视频编码技术标准MPEG-1视频编码时首先确定压缩当前帧为I帧、P帧或B帧,然后采用相应的算法对其进行压缩。从第一帧的图像为I帧起,一般每隔15帧设置一个I帧。一个经MPEG-1压缩后的视频帧序列可能为:IBBPBBPBBPBBPBBIBBPBBPBBPBBPBBI MPEG-1标准中的三种图像帧8.1.4 视频编码技术标准视频编码技术标准MPEG-1音频的目标是将采样频率为48kHz、44.1kHz或32kHz,量化位数为16位的音频压缩到数据传输率0.192Mb/s以下,还
17、原后仍能接近原有音质。MPEG-1提供3种音频压缩编码等级,分别为Layer1、Layer2和Layer3。Layer1算法最简单,压缩后每声道数据率为192kb/s,Layer2较复杂,压缩后每声道数据率为128kb/s,Layer3最复杂,压缩后每声道数据率为64kb/s。MPEG-1支持两个声道,可设为单声道(mono)和立体声(stereo)等。MPEG-1系统负责一个视频流与一个或多个音频流的多路复用和同步技术,将编码后的图像和伴音数据复合成单一的、数据传输率在1.5Mb/s以下的数据位流。8.1.4 视频编码技术标准视频编码技术标准(2)MPEG-2标准MPEG-2是1994年11
18、月被批准为国际标准的,之后又进行了扩展。MPEG-2是高分辨率视频图像的标准,主要针对720484的广播级视频图像,压缩后的数据传输率为3Mb/s15Mb/s。MPEG-2包括4部分的内容:MPEG-2视频、音频、系统和测试。其中,视频部分引入了5种档次,每种档次又分为4个等级,因此能够在很宽的范围内对不同分辨率和不同输出数据率的图像信号进行压缩,压缩比可变,最高可达200:1;音频部分与MPEG-1兼容,但提供了多语言声道,最大可达8个,包括5个全带宽声道、两个环绕声道和一个低频声道;系统部分定义了编码的句法和语法,以便将一个或多个视频、音频和其它数据流复合成适合在不同环境下传输的单一或多个
19、数据位流。8.1.4 视频编码技术标准视频编码技术标准(3)MPEG-4标准MPEG-4标准是1999年正式发布的,并在2000年公布了第二版。该标准的第一个目标是制定一个通用的低码率(64kb/s以下)压缩标准,并采用第二代压缩算法,有效地支持甚低码率(very low bit rate)应用,比如移动通信中的声像业务,和窄带多媒体通信等等;它的第二个目标是实现基于内容的压缩编码,以提高可靠性,支持多媒体数据的集成和交互式多媒体业务等。MPEG-4标准主要包括视频、音频、系统、一致性测试、软件仿真和多媒体综合框架等内容。其中视频模块支持从88到20482048的分辨率,支持从5kb/s到4M
20、b/s的数据率,支持固定数据率和可变数据率的编码。音频模块不仅支持自然声音,而且支持合成声音和音频对象。8.1.4 视频编码技术标准视频编码技术标准nMPEG-4标准与之前标准的最大差别在于它采用基于对象的编码理念,即在编码时将一幅景物分成若干在时间和空间上相互联系的视频和音频对象,分别编码后,再经过复用传输到接收端,然后再对不同的对象分别解码,从而组合成所需要的视频和音频。这样既方便对不同的对象采用不同的编码方法和表示方法,又有利于不同数据类型间的融合,还能方便地实现对于各种对象的操作及编辑。nMPEG-4的技术特点使得它在很多领域都能得到广泛应用,如因特网多媒体应用、广播电视、交互式视频游
21、戏、实时可视通信、交互式存储媒体应用、演播室技术及电视后期制作、采用面部表情模拟的虚拟会议、多媒体邮件、移动通信条件下的多媒体应用、远程视频监控和通过ATM网络等进行的远程数据库业务等。8.1.4 视频编码技术标准视频编码技术标准nMPEG-1、MPEG-2和MPEG-4的主要技术指标:标准名称MPEG-1MPEG-2MPEG-4批准年份199219941999最大分辨率3522881920115220482048默认分辨率352288(PAL)352240(NTSC)720576(PAL)640480(NTSC)720576(PAL)640480(NTSC)最大音频采样率48kHz96kHz
22、96kHz最大声道数288最大数据率(Mb/s)380510常用数据率(kb/s)13806500800帧频(Hz)25(PAL)30(NTSC)25(PAL)30(NTSC)25(PAL)30(NTSC)视频质量一般很好好很好编解码硬件要求低中等高8.1.4 视频编码技术标准视频编码技术标准(4)MPEG-7和MPEG-21标准MPEG-7的正式名称是“多媒体内容描述接口”,它规定了一套用于描述各种多媒体信息的描述符,这些描述符与多媒体信息一起,支持用户对其感兴趣的多媒体信息进行快速有效的检索。MPEG-7的主要内容包括描述符(D)、描述方案(DS)和描述定义语言(DDL),它不是一种压缩编
23、码方法,它关心的是如何实现描述多媒体信息的通用接口的标准化。MPEG-21的正式名称是“多媒体框架”或“数字视听框架”,它致力于将标准集成起来相互支持和相互协调以管理多媒体商务。MPEG-21的最终目标是要为多媒体信息用户提供透明而有效的电子交易和使用环境。8.1.4 视频编码技术标准视频编码技术标准n综上所述,MPEG-1和MPEG-2是MPEG体系中的第一代视频和音频压缩编码标准,主要解决视音频信息的存储、传输和广播的问题,为VCD、DVD、数字电视和高清电视的普及和发展奠定了基础。MPEG-4是第二代视音频编码标准,实现了低速率下的视音频编码、视频对象和交互式多媒体的集成,目前已广泛应用
24、于网络流媒体服务。MPEG-7是多媒体内容描述标准,支持对多媒体资源的组织管理、搜索、过滤和检索。MPEG-21的目的则是建立统一的多媒体框架,为多媒体内容从发布到消费所涉及的所有标准提供一个基础体系。8.1.4 视频编码技术标准视频编码技术标准2H.26x标准H.26x标准是指由国际电信同盟远程通信标准化组(ITU-T)制定的一系列视频编码标准,该组织的前身是国际电报与电话咨询委员会(CCITT)。H.26x主要应用于实时视频通信领域,包括H.261、H.262、H.263和H.264等标准,其中H.262标准等同于MPEG-2标准,H.264标准则被纳入了MPEG-4标准的第10部分。(1
25、)H.261标准H.261标准于1988年提出,1990年12月正式公布,是最早的运动图像压缩标准,用于在综合业务数字网(ISDN)上开展双向声像业务(可视电话、视频会议)。8.1.4 视频编码技术标准视频编码技术标准该标准主要针对P64Kb/s的数据率设计(P为130的可变参数,P=l或2时支持帧率较低的视频电话传输,P=6时支持帧率较高的电视会议数据传输),并可实现不同电视制式之间的连接,主要思想是通过减少图像帧之间时间上和空间上的冗余性和相关性信息来减少数据量。为了适用于不同的电视制式,H.261标准只对CIF(公用中间格式,分辨率352288)和QCIF(1/4公用中间格式,分辨率17
26、6144)格式的图像进行处理。H.261标准的压缩比可高达1/50左右,使用的编码算法与MPEG-1标准十分相似,主要有变换编码、帧间预测和运动补偿,但编码序列中只有I帧和P帧,没有B帧。这两种标准的主要区别在于,H.261的目标是为了适应各种信道容量的传输,MPEG-1的目标是为了在较低的带宽上实现高质量的图像和高保真声音的传送。8.1.4 视频编码技术标准视频编码技术标准(2)H.263标准H.263是ITU-T制定的一个针对低于64kb/s的窄带通信信道的视频编码标准,目的是能在电话网上传输活动图像。H.263是在H.261的基础上发展起来的,对帧内压缩仍采用变换编码,但对帧间压缩采用的
27、预测编码进行了改进,它处理的图像格式可以是S-QCIF、QCIF、CIF、4CIF和16CIF。H.263标准制定后,ITU-T又对它进行了修改,提出了H.263+、H.263+等升级版本,扩大了标准的适用范围,提高了编码效率和重建图像的主观质量,加强了对编码数据率的控制和抗误码能力。虽然H.263标准是为了基于模拟电话线路的可视电话和视频会议系统而设计的,但由于它优异的性能,目前已成为一般的低数据率视频编码标准。8.1.4 视频编码技术标准视频编码技术标准(3)H.264标准H.264也称为MPEG-4 AVC,是由ISO/IEC与ITU-T组成的联合视频小组(JVT)制定的视频编码标准,它
28、的性能比之前的视频编码标准有了很大的提高,既可以满足低延时的实时业务需要,也可以满足无延时限制的视频存储等场合。H.264仍使用运动补偿加变换编码的混合模式,同时提高了网络适应性和解码器的差错恢复能力,并对图像质量进行了分级处理,以适应不同复杂度的应用。H.264使用了多项新技术,如44整数变换、空域内的帧内预测、1/4像素精度的运动估计等,从而使压缩比得到了较大的提高,但同时也大大增加了算法的复杂度。8.1 数字视频基础数字视频基础n8.1.1 视频的基本概念n8.1.2 模拟电视制式与信号类型n8.1.3 视频的数字化n8.1.4 视频编码技术标准n8.1.5 常见视频文件格式8.1.5
29、常见视频文件格式常见视频文件格式n数字视频与其它数据一样,也是以文件的形式在计算机中存储的,根据视频文件的编码标准、编辑软件、应用领域和设计公司的不同,它的格式主要有以下几种。(1)AVI格式AVI是Audio Video Interleaved(音频视频交错)的缩写,它是Microsoft公司开发的一种符合RIFF文件规范的数字音频与视频文件格式,文件扩展名为“.AVI”。AVI格式允许视频和音频交错在一起同步播放,但并未限定编码标准,因此,要播放使用不同编码算法生成的AVI文件,必须使用相应的解码算法才行。该格式常用的编解码技术有Microsoft Video、Microsoft RLE、
30、Cinepak Codec by Radius、Intel Indeo Video、XviD、DivX等。目前AVI格式主要用在多媒体光盘和Internet上,用来存储和传输电影、电视等各种视频信息。该格式的图像质量较好,易于编辑,但体积较庞大。8.1.5 常见视频文件格式常见视频文件格式(2)RealVideo格式RealVideo是Real Networks公司开发的一种流式视频文件格式,它包含在该公司所制定的音频视频压缩规范Real Media中,可以根据网络数据传输速率的不同而采用不同的压缩比率,从而实现在低速网络上实时传送和播放影像数据。它可以采用固定速率和动态速率两种编码方式,扩展
31、名分别为“.RM”和“.RMVB”。在采用了动态速率编码时,在静止和动作场面少的画面场景采用较低的编码速率,在复杂的动态画面场景则采用较高的编码速率,从而在保证静止画面质量的前提下,大幅地提高了运动画面的质量,在图像质量和文件大小之间取得了较好的平衡。该格式除了可以以普通的视频文件形式播放之外,还可以通过Real Server服务器对外发布。8.1.5 常见视频文件格式常见视频文件格式(3)MOV格式MOV是Apple公司开发的一种视频文件格式,被包括Apple Mac OS、Microsoft Windows在内的所有主流电脑平台支持,文件扩展名为“.MOV”,需要使用Apples Quic
32、kTime软件进行播放。MOV格式的视频文件可以采用不压缩或压缩的编码方式,其压缩算法包括Cinepak、Intel Indeo Video R3.2、MPEG-4、H.264等。(4)MPEG格式MPEG格式是指使用MPEG-1、MPEG-2和MPEG-4编码标准设计的数字视频文件格式。我们常见的VCD使用的就是MPEG-1格式,SVCD和DVD使用的是MPEG-2格式。由于MPEG规定的是视音频编码的标准,在具体的实现方法和封装形式上可以有些差别。8.1.5 常见视频文件格式常见视频文件格式(5)ASF与WMV格式ASF是Advanced Streaming Format(高级串流格式)的
33、缩写,是Microsoft为了和Real Media格式竞争而设计出来的一种网络流式视频文件格式,既适合在网络发布,也适合在本地播放,文件扩展名为“.ASF”。WMV也是Microsoft推出的一种视频文件格式,扩展名为“.WMV”,它是在ASF格式的基础上升级而来的,在同等的视频质量下,WMV格式的体积非常小,因此很适合在网上播放和传输。在WMV格式的新版本中则使用了WMV9视频压缩编码标准,对高分辨率视频而言优势更明显。以WMV9为基础的VC-1格式从2006年起正式被SMPTE(电影电视工程师协会)颁布为高清编码标准,与H.264一样成为被认可的高清编码格式。8.1.5 常见视频文件格式
34、常见视频文件格式(6)3GP格式3GP是由3GPP(第三代合作伙伴项目)定义的一种流式视频格式,是为了配合3G网络的高传输速度而设计的,也是目前手机中最为常见的一种视频格式。该格式使用MPEG-4 或H.263对视频流进行编码,使用AMR-NB或AAC-LC对音频流编码,文件扩展名为“.3GP”。(7)FLV格式FLV由Macromedia公司(已与Adobe公司合并)开发的流式视频文件格式,扩展名为:“.FLV”。该格式不仅可以轻松地导入Flash,还可以通过rtmp 协议从Flashcom服务器上流式播放。目前大部分视频网站都使用这种格式发布在线视频。8.1.5 常见视频文件格式常见视频文
35、件格式(8)DV格式DV的全称是Digital Video Format(数字视频格式),是由索尼、松下、JVC等多家厂商联合提出的一种家用数字视频格式,数码摄像机就是使用这种格式记录视频数据的。这种视频格式的文件扩展名一般是“.AVI”,所以也叫DV-AVI格式。(9)DivX和XviD格式DivX是由MPEG-4标准衍生出的一种视频压缩编码格式,它分别使用MPEG4对视频图像进行压缩,用MP3或AC3对音频进行压缩,再将视频与音频编码数据进行合成。XviD格式与DivX几乎相同,是一种开源、免费的编码技术。这两种格式的扩展名为“.AVI”、“.MP4”等。第第8章章 数字视频与动画处理技术
36、数字视频与动画处理技术n8.1 数字视频基础n8.2 数字视频的采集与处理n8.3 流媒体技术简介n8.4 计算机动画处理技术8.2 数字视频的采集与处理数字视频的采集与处理n8.2.1 视频采集系统n8.2.2 非线性编辑系统n8.2.3 视频编辑工具Adobe Premiere8.2.1 视频采集系统视频采集系统n所谓视频采集是指通过视频采集设备将模拟视频转换成数字视频,并以数字视频文件格式保存下来。一个视频采集系统主要包括视频信号源设备、视频采集设备以及配置有大容量存储设备和视频处理软件的高性能计算机系统。n提供视频信号的设备主要有录像机、摄像机、电视机或电视卡等;n对模拟视频信号进行采
37、集、量化和编码的设备主要是视频采集卡;n编码后的数字视频数据则由计算机来接收和记录。n在这些设备中,最重要的是视频采集卡,它不仅提供接口来连接模拟视频设备和计算机,还能够将模拟视频信号转换成数字视频数据。8.2.1 视频采集系统视频采集系统n从视频信号源发出的模拟信号由视频接口进入采集卡后,经过模数转换,送到多制式数字解码器进行解码;解码后的YUV信号经转换变为RGB信号后,被送入视频处理芯片,并实时存储在帧存储器(VRAM)中,通过算法完成对视频图像的编辑和处理;视频输出的RGB信号与VGA显示卡的RGB信号叠加后,经过模数转换成为模拟信号在显示器窗口中进行显示。由于数字视频的数据量巨大,因
38、此视频采集卡一般还提供了对视频数据的压缩功能。8.2.1 视频采集系统视频采集系统n视频采集的过程一般包括下面几个步骤:(1)设置音频和视频源,将视频源设备的视频输出与采集卡相连、音频输出与声卡相连;(2)准备好多媒体计算机系统环境,启动采集程序,预览采集信号、设置采集参数后进行采集;(3)播放采集的视频数据,如果丢帧严重可以修改采集参数或优化采集环境后重新采集,直到满足要求;(4)根据需要对采集的原始数据进行简单的编辑,如剪切掉起始处、结尾处和中间部分无用的视频序列,减少存储空间的占用。8.2 数字视频的采集与处理数字视频的采集与处理n8.2.1 视频采集系统n8.2.2 非线性编辑系统n8
39、.2.3 视频编辑工具Adobe Premiere8.2.2 非线性编辑系统非线性编辑系统n非线性编辑系统是相对于传统的使用磁带和电影胶片的线性编辑系统而言的。由于传统的线性编辑系统将视频信号顺序记录在磁带等介质上,因此在编辑时也必须顺序查找所需的视频画面。而非线性编辑系统将数字化的视音频信号记录在硬盘等介质上,可以对任意一帧画面进行随机读取和存储,从而实现编辑的非线性化。n非线性编辑系统将传统的电视节目制作系统中的各种设备集成于一台计算机内,利用非线性编辑软件,如Premiere、Vegas等,对视频图像和声音进行编辑处理,再将编辑好的信号录制在磁带上。8.2.2 非线性编辑系统非线性编辑系
40、统n与传统的编辑系统相比,非线性编辑系统的设备更加小型化,功能集成度更高,可以任意地剪辑、修改、复制、调动画面顺序都不会引起画面质量的下降,克服了传统设备的致命弱点。n随着计算机技术的发展,非线性编辑系统的价格不断下降,利用一台多媒体计算机、一套视频转换卡和一套编辑软件就可以组建一个初级的非线性编辑系统。8.2 数字视频的采集与处理数字视频的采集与处理n8.2.1 视频采集系统n8.2.2 非线性编辑系统n8.2.3 视频编辑工具Adobe Premiere8.2.3 视频编辑工具视频编辑工具Adobe PremierenPrimere是Adobe公司开发的一种非线性视频编辑软件,它可以配合多
41、种硬件对视频进行捕获和输出,能对视频、声音、动画、图像、文本等多种素材进行编辑加工,并生成广播级的影视文件。目前该软件的最新版本是Premiere Pro CS3。n【例8.1】素材的导入与编辑(P245)n【例8.2】效果的添加与设置(P249)第第8章章 数字视频与动画处理技术数字视频与动画处理技术n8.1 数字视频基础n8.2 数字视频的采集与处理n8.3 流媒体技术简介n8.4 计算机动画处理技术8.3 流媒体技术简介流媒体技术简介n8.3.1 流媒体技术概述n8.3.2 流媒体技术的特点n8.3.3 流媒体系统n8.3.4 流媒体文件格式n8.3.5 流媒体技术的实现8.3.1 流媒
42、体技术概述流媒体技术概述n流媒体技术(Streaming Media Technology)是为解决以Internet为代表的中低带宽网络上多媒体信息(以视音频信息为主)传输问题而产生的一种网络技术。它能克服传统媒体传输方式的不足,有效突破带宽瓶颈,实现大容量多媒体信息在Internet上的流式传输。n流媒体技术把连续的视频和音频信息经过压缩处理后并加上传输信息,通过服务器形成实时数据流,让用户一边下载一边观看、收听,而不是需要等整个文件下载后才可以观看。n该技术会先在使用者的电脑上创建一个缓冲区,在播放前预先下载一段数据作为缓冲。在实际播放过程中,如果网络实际连接速率小于播放所需速率时,播放
43、程序就会取用这一小段缓冲区内的资料,从而避免播放的中断,使得播放品质得以维持。8.3 流媒体技术简介流媒体技术简介n8.3.1 流媒体技术概述n8.3.2 流媒体技术的特点n8.3.3 流媒体系统n8.3.4 流媒体文件格式n8.3.5 流媒体技术的实现8.3.2 流媒体技术的特点流媒体技术的特点n流媒体技术的关键是 流式传输、文件压缩和数据缓存三个方面。n与传统的下载方式相比较,使用流式传输具有以下优点:(1)由于不需要将全部数据下载,因此等待时间可以大大缩短;(2)由于流文件往往小于原始文件的数据量,并且用户也不需要将全部流文件下载到硬盘,从而节省了大量的磁盘空间;(3)由于采用了RSTP
44、等实时传输协议,更加适合动画、视音频在网上的实时传输。8.3.2 流媒体技术的特点流媒体技术的特点n实现流式传输的方法有实时流式传输(Realtime Streaming)和顺序流式传输(Progressive Streaming)两种。n实时流式传输保证媒体信号带宽与网络连接相匹配,使媒体可被实时观看到。它需要有专用的流媒体服务器与传输协议,特别适合现场事件,也支持随机访问,用户可快进或后退以观看前面或后面的内容。顺序流式传输是在下载文件的同时使用户可观看媒体,在给定时刻,用户只能观看已下载的那部分,而不能跳到还未下载的部分。由于标准的HTTP服务器可发送这种形式的文件,而不需要其他特殊协议
45、,它经常被称作HTTP流式传输。8.3.2 流媒体技术的特点流媒体技术的特点n实时流式传输和顺序流式传输相比较,存在以下区别:(1)从视频质量上讲,实时流式传输必须匹配连接带宽,由于出错丢失的信息被忽略掉,网络拥挤或出现问题时,视频质量会很差,而顺序流式传输可以保证视频质量;(2)实时流式传输需要特定服务器,如QuickTime Streaming Server、Real Server与Windows Media Server,这些服务器允许对媒体发送进行更多级别的控制,因而系统设置、管理比标准HTTP服务器更复杂;8.3.2 流媒体技术的特点流媒体技术的特点(3)实时流式传输还需要特殊网络协
46、议,这些协议在有防火墙时可能会出现问题,导致一些地点的用户不能看到媒体内容,而顺序流式传输与防火墙无关。n目前在流媒体技术中常用的几种流式传输协议有RTP(实时传输协议)/RTCP(实时传输控制协议)、RTSP(实时流协议)、RSVP(资源预留协议)等。8.3 流媒体技术简介流媒体技术简介n8.3.1 流媒体技术概述n8.3.2 流媒体技术的特点n8.3.3 流媒体系统n8.3.4 流媒体文件格式n8.3.5 流媒体技术的实现8.3.3 流媒体系统流媒体系统n流媒体系统指利用某种流媒体技术,完成流媒体文件的压缩生成,流媒体服务器数据的发布,客户端流媒体文件的解压缩播放的系统。n一个完整的流媒体
47、系统一般应该包括以下三个部分:(1)流媒体开发工具,用于用于创建、捕捉和编辑多媒体数据,处理后形成流媒体格式。包括各种处理视频、音频的硬件设备和制作软件;(2)流媒体服务器,用来存放并通过网络发布流媒体数据;(3)流媒体播放器,用于客户端对流媒体文件的解压和播放。8.3.3 流媒体系统流媒体系统n目前常用流媒体系统主要有以下几种:1Real System系统Real System是由Real Networks公司开发的流式产品,涵盖了从制作端、服务器端到客户端的所有环节。其中,开发工具RealProducer是Real System的编码器,可以将普通格式的音频、视频或动画媒体文件压缩转换为流
48、格式文件。服务器端软件RealServer能将RealProducer生成的流式文件进行流式传输。客户端软件RealPlayer则早已被广泛使用,既能独立运行,又能作为插件在浏览器中运行。8.3.3 流媒体系统流媒体系统2Windows Media系统Windows Media是Microsoft公司开发的一个能适应多种网络带宽条件的流式多媒体信息的发布平台,它也提供了对流式媒体进行制作、发布、播放和管理的一整套解决方案,还提供了开发工具包(SDK)供二次开发使用。Windows Media系统包括开发工具Windows Media Encoder、服务器组件Windows Media Ser
49、ver以及播放器Windows Media Player。该系统与Windows操作系统结合紧密,制作、发布和播放软件的易用性十分好,制作和播放视音频的质量很好,但可移植性较差。8.3.3 流媒体系统流媒体系统3Quick Time系统Quick Time是Apple公司为Macintosh系统开发的软件,它也可以运行在PC机上,对应的视频文件格式为MOV,也是一种应用比较广泛的流式系统。Quick Time系统包括制作工具Quick Time4 Pro、服务器Quick Time Streaming server、播放器QuickTime Player、图像浏览器Picture Viewer
50、以及浏览器的Quick Time插件等。8.3 流媒体技术简介流媒体技术简介n8.3.1 流媒体技术概述n8.3.2 流媒体技术的特点n8.3.3 流媒体系统n8.3.4 流媒体文件格式n8.3.5 流媒体技术的实现8.3.4 流媒体文件格式流媒体文件格式流媒体系统文件类型用途Real SystemRM用于传输流式视频数据RA用于传输流式音频数据RP用于流式传输图片文件RT用于流式传输文本文件RAMReal Media流媒体文件的索引文件,指示流媒体数据所在位置WindowsMediaASF用于流式传输图形、图像、视频、音频数据ASXWindows Media文件的索引文件,指示媒体数据所在位