1、1第四章第四章 多媒体技术基础多媒体技术基础【本章内容【本章内容】4.1 4.1 多媒体的概念多媒体的概念4.2 4.2 光盘存储系统光盘存储系统4.3 4.3 多媒体音频信号处理多媒体音频信号处理4.4 4.4 多媒体图像信号处理多媒体图像信号处理4.5 4.5 多媒体视频信号处理多媒体视频信号处理24.1 多媒体的概念(自学)多媒体的概念(自学)l 媒体媒体(Media)是指承载或传递信息的载体。是指承载或传递信息的载体。l 媒体具有多种形式:媒体具有多种形式:1.存储信息的实体载体,如纸张、磁盘等;存储信息的实体载体,如纸张、磁盘等;2.表述信息的逻辑载体,如文字、声音、表述信息的逻辑载
2、体,如文字、声音、图形、图像等。图形、图像等。31、媒体的分类、媒体的分类根据根据CCITTCCITT的定义,媒体可分为五种:的定义,媒体可分为五种:感觉媒体:例如声音、文字、图像及物质的质地、感觉媒体:例如声音、文字、图像及物质的质地、形状等。形状等。表示媒体:例如语言、图像、视频的编码方式。表示媒体:例如语言、图像、视频的编码方式。显示媒体:例如输入显示媒体(键盘等)和输出显示媒体:例如输入显示媒体(键盘等)和输出显示媒体(显示器等)。显示媒体(显示器等)。存储媒体:例如磁盘、光盘等。存储媒体:例如磁盘、光盘等。传输媒体:例如双绞线、光纤等。传输媒体:例如双绞线、光纤等。42、多媒体与多媒
3、体技术、多媒体与多媒体技术l 通常人们将各种感觉媒体包括文字、声音、通常人们将各种感觉媒体包括文字、声音、图形、图像、动画、视频称为多媒体。图形、图像、动画、视频称为多媒体。l 多媒体技术是指利用计算机综合处理(获取、多媒体技术是指利用计算机综合处理(获取、编辑、存储和显示)多种媒体信息(文本、编辑、存储和显示)多种媒体信息(文本、图形、图像、音频和视频)的技术。图形、图像、音频和视频)的技术。l 多媒体技术涉及:数字化信息处理技术、音多媒体技术涉及:数字化信息处理技术、音频和视频技术、计算机软硬件技术、人工智频和视频技术、计算机软硬件技术、人工智能和模式识别技术、通信和网络技术。能和模式识别
4、技术、通信和网络技术。5l 多媒体技术的主要特性多媒体技术的主要特性u多样性多样性u集成性集成性u交互性交互性l 多媒体的关键技术多媒体的关键技术u大容量数据存储大容量数据存储u多媒体压缩编码和解码多媒体压缩编码和解码u虚拟现实(虚拟现实(VR)技术)技术u多媒体数据库多媒体数据库u智能多媒体技术智能多媒体技术u多媒体信息检索多媒体信息检索63、多媒体计算机系统、多媒体计算机系统 多媒体计算机系统的组成:多媒体计算机系统的组成:u硬件系统(硬件系统(P94 图图4-4)u软件系统(操作系统)软件系统(操作系统)u多媒体多媒体API(应用程序接口)(应用程序接口)u多媒体创作工具软件多媒体创作工
5、具软件u多媒体应用系统多媒体应用系统74.2 光盘存储系统光盘存储系统l 光盘存储系统由光盘和光盘驱动器组成。光盘存储系统由光盘和光盘驱动器组成。l 光盘又光盘又称称CDCD(Compact DiscCompact Disc)通过光学方式)通过光学方式来记录和读取信息。来记录和读取信息。l 光驱是对光盘上存储的信息进行读写操作的光驱是对光盘上存储的信息进行读写操作的设备。设备。CDCDROMROM驱动器的速度通常以数据传驱动器的速度通常以数据传输率来衡量,数据传输率以输率来衡量,数据传输率以150KB/S150KB/S为一倍为一倍速。速。81、光盘主要特点、光盘主要特点l 记录密度高记录密度高
6、l 存储容量大存储容量大l 采用非接触方式读采用非接触方式读/写信息写信息l 信息保存时间长信息保存时间长l 多种媒体融合多种媒体融合l 价格低廉价格低廉92、光盘的类型、光盘的类型按读写性能可分为三种:按读写性能可分为三种:l 只读光盘存储器:包括只读光盘存储器:包括CD-DACD-DA、CD-ROMCD-ROM、VCDVCD、DVD-ROMDVD-ROM。l 一次可写光盘存储器:包括一次可写光盘存储器:包括CD-RCD-R,DVD-RDVD-R。特点每个记忆单元只能写入一次,信息写入特点每个记忆单元只能写入一次,信息写入后呈只读状态。后呈只读状态。l 多次可擦写光盘存储器:包括多次可擦写光
7、盘存储器:包括CD-RWCD-RW,DVD-RWDVD-RW,DVD-RAMDVD-RAM。特点可多次读写,采用相变或磁光技术。特点可多次读写,采用相变或磁光技术。103、光盘的标准、光盘的标准l CD-DACD-DA:数字式激光唱盘,用于存储数字化:数字式激光唱盘,用于存储数字化的高保真立体声音乐。的高保真立体声音乐。l CD-ROMCD-ROM:制定了光盘存储只读信息的统一标:制定了光盘存储只读信息的统一标准,可用于存储数据、文本、图形、图像、准,可用于存储数据、文本、图形、图像、声音、视频等信息。声音、视频等信息。l CD-RCD-R:一次写入,永久读的标准。用途:一次写入,永久读的标准
8、。用途:CD-RCD-R空白光盘在按一定文件格式刻写数据后,空白光盘在按一定文件格式刻写数据后,可变成可变成CD-DACD-DA、CD-ROMCD-ROM、VCDVCD等格式的光盘。等格式的光盘。11l VCD VCD(VideoVideoCDCD):用于表述在光盘上存):用于表述在光盘上存放放MpegMpeg1 1标准编码的全动态图像及其相应标准编码的全动态图像及其相应声音数据(数字电视视盘)。声音数据(数字电视视盘)。l DVDDVD:数字通用光盘,主要用于存储多媒体:数字通用光盘,主要用于存储多媒体软件和影视节目。特点:软件和影视节目。特点:u容量单层容量单层4.7GB4.7GB,4 4
9、层层17GB17GBu采用采用MpegMpeg2 2标准进行视频标准进行视频处理处理12l 蓝光光盘(蓝光光盘(Blue-ray DiscBlue-ray Disc,简称,简称BDBD)是新)是新一代光盘标准,用以存储高品质的影音以及一代光盘标准,用以存储高品质的影音以及高容量的数据存储。一个单层的蓝光光碟的高容量的数据存储。一个单层的蓝光光碟的容量为容量为25GB25GB,双层,双层50GB50GB,四层,四层100GB100GB;可以;可以支持支持VC-1VC-1、Mpeg-2Mpeg-2、H.264H.264、Mpeg-4Mpeg-4等视频等视频标准。标准。134、光盘记录与读取信息的原
10、理、光盘记录与读取信息的原理 光盘读取信息的原理:光盘上用光盘读取信息的原理:光盘上用“平面平面”和和“凹坑凹坑”来表示二进制信息,通过激光的来表示二进制信息,通过激光的反射来读出其中存储的信息。激光照射在反射来读出其中存储的信息。激光照射在“平面平面”上将有上将有70708080光反射回来,光反射回来,CDCD头顺利读取;若照射在头顺利读取;若照射在“凹坑凹坑”将出现激光将出现激光散射,散射,CDCD头无法接收。头无法接收。14光盘刻录的原理:光盘刻录的原理:1.1.CD-ROMCD-ROM光盘中的数据通过压模或化学刻写方光盘中的数据通过压模或化学刻写方法制成。法制成。2.2.CD-RCD-
11、R光盘增加了一层有机染料作为记录层,光盘增加了一层有机染料作为记录层,在刻录在刻录CD-RCD-R盘片时,通过大功率激光照射盘片时,通过大功率激光照射CD-RCD-R盘片的染料层,在染料层上形成代表信盘片的染料层,在染料层上形成代表信息的平面和凹坑,由于这种变化是一次性的,息的平面和凹坑,由于这种变化是一次性的,所以所以CD-RCD-R盘片只能写入一次,不能重复写入。盘片只能写入一次,不能重复写入。153.3.CD-RWCD-RW的刻录原理与的刻录原理与CD-RCD-R大致相同,只在记大致相同,只在记录层上镀的是一层结晶物质,这种结晶层能录层上镀的是一层结晶物质,这种结晶层能够呈现出结晶和非结
12、晶两种状态,等同于够呈现出结晶和非结晶两种状态,等同于CD-RCD-R的平面和凹坑。通过激光束的照射,可的平面和凹坑。通过激光束的照射,可以在这两种状态之间相互转换,所以以在这两种状态之间相互转换,所以CD-RWCD-RW盘片可以重复写入。盘片可以重复写入。163.3 多媒体音频信号处理多媒体音频信号处理1、音频信号的类型、音频信号的类型l 音频信号可分为两类:语音信号和非语音信音频信号可分为两类:语音信号和非语音信号。号。l 规则音频是一种连续规则音频是一种连续变化的模拟信号,可变化的模拟信号,可用一条连续的曲线来用一条连续的曲线来表示,这条曲线可分表示,这条曲线可分解成一系列正弦波的解成一
13、系列正弦波的线性叠加。线性叠加。17l 模拟音频信号的两个重要参数:频率体现音模拟音频信号的两个重要参数:频率体现音调的高低;幅度体现声音的强弱。调的高低;幅度体现声音的强弱。l 周期周期(T T):信号在两个峰点或谷底之间的):信号在两个峰点或谷底之间的相对时间。相对时间。l 频率(频率(f f):每秒钟波峰所发生的数目,单):每秒钟波峰所发生的数目,单位用赫兹(位用赫兹(HzHz)或千赫兹()或千赫兹(kHzkHz)表示,周)表示,周期与频率互为倒数,期与频率互为倒数,f f1/T1/T。l 幅度(振幅):从信号的基线到当前幅度(振幅):从信号的基线到当前波峰的波峰的距离。距离。18 亚音
14、亚音(subsonicsubsonic):频率小于):频率小于20Hz20Hz的信号的信号 音频(音频(AudioAudio):频率范围为):频率范围为20Hz20Hz20kHz20kHz的的信号信号 超音频(超音频(ultrasonicultrasonic):高于):高于20kHz20kHz的信号的信号 日常说话的语音信号频率范围:日常说话的语音信号频率范围:3003003000Hz3000Hz192、音频的数字化过程、音频的数字化过程l 计算机要处理音频信息,首先要将模拟音频计算机要处理音频信息,首先要将模拟音频信号(如语音、音乐等)转变成数字信号,信号(如语音、音乐等)转变成数字信号,这
15、个过程称之为模数转换这个过程称之为模数转换(A AD D)。l 模拟信号数字化过程的三个步骤:采样、量模拟信号数字化过程的三个步骤:采样、量化和编码。化和编码。模拟信号的数字化过程100101100011101201)采样)采样l 采样是指用每隔一定时间间隔,在模拟声音的波形采样是指用每隔一定时间间隔,在模拟声音的波形上取一个幅度值,把时间上的连续信号变成时间上上取一个幅度值,把时间上的连续信号变成时间上的离散信号。的离散信号。l 采样周期:即采样的时间间隔,(其倒数为采样频采样周期:即采样的时间间隔,(其倒数为采样频率)率)l 采样频率:每秒钟对采样频率:每秒钟对模拟信号的采样次数模拟信号的
16、采样次数l 奈奎斯特采样定理:采样频率奈奎斯特采样定理:采样频率22信号最高频率。信号最高频率。l 目前最常用的三种采样频率分别为:电话效果(目前最常用的三种采样频率分别为:电话效果(11 11 kHzkHz)、)、FMFM电台效果(电台效果(22 kHz22 kHz)和)和CDCD效果(效果(44.1 44.1 kHzkHz)。)。212)量化)量化l 量化:对声波波形幅度的数字化。量化:对声波波形幅度的数字化。l 量化位数:量化时采用的二进制位数,位数量化位数:量化时采用的二进制位数,位数越多,精度也越高,音质越细腻。越多,精度也越高,音质越细腻。例如,例如,用用1616个二进制位(个二进
17、制位(bitbit)表示声音,可将声)表示声音,可将声音强度分为音强度分为2 216 16=65536=65536级。级。l 每秒声音的数据量每秒声音的数据量 =采样频率采样频率量化位数量化位数声道数声道数/8/8(字节)(字节)22采样率为采样率为2000Hz2000Hz,量化等级为,量化等级为2020的采样量化过程的采样量化过程在相同的采样频率下,量化位数愈高,声音的质量越在相同的采样频率下,量化位数愈高,声音的质量越好;在相同量化位数的情况下,采样频率越高,声音好;在相同量化位数的情况下,采样频率越高,声音效果也就越好。效果也就越好。23l 编码:是按照一定的格式,把量化后的值编码:是按
18、照一定的格式,把量化后的值用二进制数字表示,并加入一些纠错、同用二进制数字表示,并加入一些纠错、同步和控制的数据。步和控制的数据。l 常用的编码方式:脉冲编码调制(常用的编码方式:脉冲编码调制(PCMPCM),),特点是抗干扰能力强、失真小、传输特性特点是抗干扰能力强、失真小、传输特性稳定。稳定。3)编码)编码244)数字化音频文件的存储容量)数字化音频文件的存储容量波形声音文件的存储量(未经压缩)波形声音文件的存储量(未经压缩)=采样频率采样频率量化位数量化位数声道数声道数时间时间/8/8(字节)(字节)例例4-14-1:用:用44.1KHz44.1KHz的采样频率进行采样,量化位的采样频率
19、进行采样,量化位数选用数选用1616位,则录制一分钟的立体声节目,求位,则录制一分钟的立体声节目,求波形文件的大小?波形文件的大小?44.1K44.1K*16bit16bit*2 2*60/8=10584KB 60/8=10584KB 约约10MB10MB253、数字音频的文件格式、数字音频的文件格式l 波形文件波形文件.wav.wav WAV WAV文件来源于对声音模拟波形的采样,文件来源于对声音模拟波形的采样,并以不同的量化位数把这些采样点的值转换并以不同的量化位数把这些采样点的值转换成二进制数,然后存入磁盘。成二进制数,然后存入磁盘。WAVWAV文件支持多种音频位数、采样频率文件支持多种
20、音频位数、采样频率和声道,但文件尺寸过大。和声道,但文件尺寸过大。Microsoft公司公司26l MPEGMPEG音频文件音频文件.mp1/.mp2/.mp3.mp1/.mp2/.mp3 这里的音频文件格式指的是这里的音频文件格式指的是MPEGMPEG标准中的音标准中的音频部分(音频层)。根据压缩质量和编码处理的频部分(音频层)。根据压缩质量和编码处理的不同分为不同分为3 3层,分别对层,分别对.mp1/.mp2/.mp3.mp1/.mp2/.mp3这这3 3种声音种声音文件。文件。MPEGMPEG音频文件的压缩是一种有损压缩音频文件的压缩是一种有损压缩,其中其中MPEG3MPEG3音频编码
21、具有音频编码具有1010:1 11212:1 1的高压缩率,的高压缩率,用用.mp3.mp3格式来储存,一般只有格式来储存,一般只有.wav.wav文件的文件的1/101/10,而音质要略次于而音质要略次于CDCD格式或格式或WAVWAV格式的声音文件。格式的声音文件。使用千千静听、使用千千静听、WinampWinamp播放。播放。27l(补充)(补充)Mp3Mp3中位速的概念:中位速的概念:KbpsKbps又称比特又称比特率,指的是数字信号的传输速率。常见的率,指的是数字信号的传输速率。常见的MP3MP3的位速:的位速:u128Kbps=128Kbps=磁带(手机立体声磁带(手机立体声MP3
22、MP3播放器播放器最佳设定值、低档最佳设定值、低档MP3MP3播放器最佳设定播放器最佳设定值)值)u192Kbps=192Kbps=接近接近CDCD(高档(高档MP3MP3播放器最佳播放器最佳设定值)设定值)u320Kbps=Studio320Kbps=Studio音乐工作室(音乐发烧音乐工作室(音乐发烧友适用)友适用)28l RealAudioRealAudio文件文件.RA/.RM/.RAM.RA/.RM/.RAM 一种新型流式音频(一种新型流式音频(Streaming AudioStreaming Audio)文件格式,使用文件格式,使用Real PlayerReal Player播放。
23、播放。特点:可以实时传输音频信息,尤其特点:可以实时传输音频信息,尤其是在网速较慢的情况下,仍然可以较为流畅是在网速较慢的情况下,仍然可以较为流畅地传送数据,因此地传送数据,因此RealAudioRealAudio主要适用于网主要适用于网络上的在线播放。络上的在线播放。RealNetworks公司出品公司出品29l ASFASF文件文件.ASF/.WMA.ASF/.WMA ASF ASF和和WMAWMA都是微软公司针对都是微软公司针对RealReal公司开发的公司开发的新一代网上流式数字音频压缩技术。这种压缩技新一代网上流式数字音频压缩技术。这种压缩技术的特点是同时兼顾了保真度和网络传输需求,
24、术的特点是同时兼顾了保真度和网络传输需求,所以具有一定的先进性。可以利用所以具有一定的先进性。可以利用WinAMPWinAMP或媒体或媒体播放机播放。播放机播放。l AIFFAIFF文件文件.AIF/.AIFF.AIF/.AIFF 苹果公司开发的声音文件格式,被苹果公司开发的声音文件格式,被MacintoshMacintosh平台和应用程序所支持。平台和应用程序所支持。l CDCD音乐格式音乐格式.CDA.CDA CD CD存储采用了音轨的形式,其取样频率为存储采用了音轨的形式,其取样频率为44.1kHz44.1kHz,1616位量化位数,是一种近似无损的格式。位量化位数,是一种近似无损的格式
25、。30l VOCVOC文件文件 VOCVOC文件是文件是CreativeCreative公司的波形音频文件格公司的波形音频文件格式,也是声霸卡使用的音频文件。式,也是声霸卡使用的音频文件。l MIDIMIDI文件文件.MID/.RMI.MID/.RMI MIDI MIDI是数字乐器接口的国际标准,规定了使是数字乐器接口的国际标准,规定了使用数字编码来描述音乐乐谱的规范。计算机就是用数字编码来描述音乐乐谱的规范。计算机就是根据根据MIDIMIDI文件中存放的对文件中存放的对MIDIMIDI设备的命令,即每设备的命令,即每个音符的频率、音量、通道号等指示信息进行音个音符的频率、音量、通道号等指示信
26、息进行音乐合成的。乐合成的。MIDMID文件的优点是短小;缺点是播放效文件的优点是短小;缺点是播放效果因软、硬件而异。果因软、硬件而异。314、语音处理技术、语音处理技术l 语音编码语音编码l 语音合成语音合成l 语音识别语音识别l 语音增强语音增强324.4 多媒体图像信息处理多媒体图像信息处理1、计算机图像处理的概念、计算机图像处理的概念 计算机图像处理的主要研究内容:计算机图像处理的主要研究内容:u图像数字化(采样、量化、编码)图像数字化(采样、量化、编码)u图像变换图像变换u图像编码压缩图像编码压缩u图像特征增强与提取图像特征增强与提取u计算机视觉和模式识别计算机视觉和模式识别u图像噪
27、声的滤除图像噪声的滤除332 2、彩色模型、彩色模型lRGB模型(显示):将红(模型(显示):将红(Red)、绿)、绿(Green)、蓝()、蓝(Blue)三原色的色光以不同)三原色的色光以不同的比例相加,以产生多种多样的色光。的比例相加,以产生多种多样的色光。lCMYK模型(打印):印刷四分色模式利用色模型(打印):印刷四分色模式利用色料的三原色混色原理,加上黑色油墨,共计四料的三原色混色原理,加上黑色油墨,共计四种颜色混合叠加,形成所谓种颜色混合叠加,形成所谓“全彩印刷全彩印刷”。四。四种标准颜色是:种标准颜色是:C:Cyan 青色;青色;M:Magenta 品红色(洋红色)。品红色(洋红
28、色)。Y:Yellow 黄色。黄色。K:blacK 黑色,为了避免与黑色,为了避免与RGB的的Blue蓝色混淆而改称蓝色混淆而改称K。343 3、图像的数字化过程、图像的数字化过程l 图像数字化过程分为:采样、量化和编码。图像数字化过程分为:采样、量化和编码。1 1)图像采样是将二维空间上连续的图像用等距)图像采样是将二维空间上连续的图像用等距的水平线和垂直线分割成像素点,通过像素的水平线和垂直线分割成像素点,通过像素点的亮度(灰度)或色彩值来表示图像。点的亮度(灰度)或色彩值来表示图像。像像素素 把图像分割成离散把图像分割成离散的小区域即的小区域即像素像素。一幅图像是一幅图像是M MN N个
29、个像素的集合,像素的集合,M MN N表示图像的表示图像的分辨率分辨率。352 2)图像量化是将采样值划分成各种等级,用一)图像量化是将采样值划分成各种等级,用一定位数的二进制数(量化字长)来表示采样定位数的二进制数(量化字长)来表示采样的值。的值。量化字长(也称颜色深度)越大,则越量化字长(也称颜色深度)越大,则越能真实地反映原有图像的颜色。但得到的数能真实地反映原有图像的颜色。但得到的数字图像的容量也越大。字图像的容量也越大。3 3)图像编码是按一定的规则,将量化后的数据)图像编码是按一定的规则,将量化后的数据用二进制数据存储在文件中。用二进制数据存储在文件中。位图文件(位图文件(.bmp
30、.bmp):):Microsoft Windows Microsoft Windows 中使用的一种非压缩图像文件格式。中使用的一种非压缩图像文件格式。36常见的几种位图图像:常见的几种位图图像:l 黑白图像:每个像素点仅用黑白图像:每个像素点仅用1bit表示。表示。l 灰度图像:每个点由从灰度图像:每个点由从0(黑色黑色)到到2n-1(白色白色)的亮的亮度值来表现,其中间的值来表现不同程度的灰。度值来表现,其中间的值来表现不同程度的灰。每个像素点用每个像素点用nbit表示。表示。l 彩色图像:任何一种颜色均可台用红、绿、蓝三彩色图像:任何一种颜色均可台用红、绿、蓝三种原色调配出来。每种颜色用
31、若干位来表示。种原色调配出来。每种颜色用若干位来表示。37例:例:一张分辨率为一张分辨率为800800600600的的256256色的图像色的图像需要多少的存储空间?需要多少的存储空间?位图存储量位图存储量=分辨率分辨率 *颜色深度颜色深度 /8/8位转换为字位转换为字节节800800*600 600*8 8/8=480000Byte 480KB/8=480000Byte 480KB像素点个数像素点个数256=28个不同的个不同的色彩,用色彩,用 8位位表示表示384 4、图像的压缩与编码、图像的压缩与编码l 数据之所以能够压缩是基于原始信源的数据存在数据之所以能够压缩是基于原始信源的数据存在
32、着很大的冗余度。着很大的冗余度。l 图像压缩:采用编码技术来压缩图像信息的比特图像压缩:采用编码技术来压缩图像信息的比特量。量。l 图像压缩分类:有损压缩和无损压缩。图像压缩分类:有损压缩和无损压缩。l 经典压缩编码方法:预测编码、变换编码和统计经典压缩编码方法:预测编码、变换编码和统计编码。编码。39l 行程编码(行程编码(RLE)常用的无损压缩算法,将一扫描行中颜色值相常用的无损压缩算法,将一扫描行中颜色值相同的相邻像素用两个字节来表示,同的相邻像素用两个字节来表示,第一个字节是第一个字节是一个计数值,一个计数值,用于指定像素重复的次数;用于指定像素重复的次数;第二个第二个字节是具体像素的
33、值。能够比较好地保存图像的字节是具体像素的值。能够比较好地保存图像的质量,但是相对有损压缩来说这种方法的压缩率质量,但是相对有损压缩来说这种方法的压缩率比较低。比较低。例例 写出下图的游程编码写出下图的游程编码:6W2B6W3B3W405 5、图像文件格式、图像文件格式 l位图文件位图文件.bmp/.dib.bmp/.dib BMP(Bitmap BMP(Bitmap)是是WindowsWindows中的标准图像文件格中的标准图像文件格式,可达式,可达2424位全彩色模式,与设备无关,一般不位全彩色模式,与设备无关,一般不压缩。压缩。lJPEGJPEG文件文件.jpg/.jpeg.jpg/.j
34、peg JPEG JPEG压缩率高,并且最小化图像质量损失。压缩率高,并且最小化图像质量损失。它是数码照相时保存的格式它是数码照相时保存的格式,也可以用作网页图像。也可以用作网页图像。注意:由于采用有损压缩,一个太高的压缩注意:由于采用有损压缩,一个太高的压缩率会导致图形质量变差。率会导致图形质量变差。41JPEG2000JPEG2000与传统与传统JPEGJPEG的区别的区别uJPEG2000JPEG2000是基于小波变换的图像压缩标是基于小波变换的图像压缩标准,通常被认为是未来取代基于离散余准,通常被认为是未来取代基于离散余弦变换弦变换JPEGJPEG的下一代图像压缩标准。的下一代图像压缩
35、标准。uJPEG2000JPEG2000的压缩比更高,其压缩率比的压缩比更高,其压缩率比JPEGJPEG高高30%30%左右;同时支持有损数据压左右;同时支持有损数据压缩和无损数据压缩。缩和无损数据压缩。42lGIFGIF文件文件.gif.gif GIF GIF 图像色彩丰富,压缩率较高,图像色彩丰富,压缩率较高,GIF GIF 格式格式还支持动画,它是网页图片的标准格式。还支持动画,它是网页图片的标准格式。lPNGPNG格式格式.png.png PNG PNG汲取了汲取了GIFGIF和和JPGJPG二者的优点;能把图像二者的优点;能把图像文件压缩到极限以利于网络传输,但又能保留所文件压缩到极
36、限以利于网络传输,但又能保留所有与图像品质有关的信息。有与图像品质有关的信息。lPHOTOShopPHOTOShop格式格式.PSD.PSDlTIFFTIFF文件文件.tiff.tifflPCXPCX文件文件.pcx.pcxlMAC PAINTMAC PAINT.MPT/.MAC.MPT/.MAC434.5 计算机图形处理技术计算机图形处理技术 l 计算机图形处理是指利用由概念或数学描述所表示计算机图形处理是指利用由概念或数学描述所表示物体的几何数据或几何模型,用计算机进行显示并物体的几何数据或几何模型,用计算机进行显示并存储,并可以进行修改、完善以及有关操作的过程。存储,并可以进行修改、完善
37、以及有关操作的过程。l 图形处理技术主要用于计算机辅助设计和制造、计图形处理技术主要用于计算机辅助设计和制造、计算机艺术、计算机动画和虚拟现实。算机艺术、计算机动画和虚拟现实。l 图形处理的研究内容包括:几何变换、曲线和曲面图形处理的研究内容包括:几何变换、曲线和曲面拟合、建模造型、隐藏线隐藏面消除、阴暗处理、拟合、建模造型、隐藏线隐藏面消除、阴暗处理、纹理产生、渲染。纹理产生、渲染。44 计算机可以处理的图可以分成两类:计算机可以处理的图可以分成两类:数字图像和图形。数字图像和图形。l 数字图像:模拟图像经过采样,量化和编码数字图像:模拟图像经过采样,量化和编码得到的数字信号,以位图的形式存
38、储;得到的数字信号,以位图的形式存储;l 图形是由计算机软件生成或数学公式计算生图形是由计算机软件生成或数学公式计算生成(形状、大小及色彩),以矢量图的形式成(形状、大小及色彩),以矢量图的形式存储。存储。45 1 1)位图)位图u位图位图(Bitmap)(Bitmap)是由许多的像素组合而成的是由许多的像素组合而成的平面点阵图,其中每个像素的颜色、亮度平面点阵图,其中每个像素的颜色、亮度和属性是用一组二进制像素值来表示的,和属性是用一组二进制像素值来表示的,因此数据量大,适合表现层次和色彩丰富,因此数据量大,适合表现层次和色彩丰富,细致的图像。细致的图像。u常用图像处理软件:画笔、常用图像处
39、理软件:画笔、PhotoshopPhotoshop。46 2 2)矢量图矢量图u矢量图使用直线和曲线来描述图形,这些图矢量图使用直线和曲线来描述图形,这些图形的元素是一些点、线、矩形、多边形、圆形的元素是一些点、线、矩形、多边形、圆和弧线等等,它们都是通过数学公式计算获和弧线等等,它们都是通过数学公式计算获得的,因此矢量图形文件体积一般较小。得的,因此矢量图形文件体积一般较小。u矢量图形优点是无论放大、缩小或旋转等不矢量图形优点是无论放大、缩小或旋转等不会失真;缺点是难以表现色彩层次丰富的逼会失真;缺点是难以表现色彩层次丰富的逼真图像效果。真图像效果。u矢量图形设计软件矢量图形设计软件 :Au
40、toCADAutoCAD、CorelDRAWCorelDRAW等等47l 图形与图像的联系图形与图像的联系 在实际应用中,图形图像技术是相互关在实际应用中,图形图像技术是相互关联的,二者结合可以使视觉效果和质量更完联的,二者结合可以使视觉效果和质量更完善。随着图形图像技术的发展,两者间相互善。随着图形图像技术的发展,两者间相互交叉、相互渗透。交叉、相互渗透。484.6 多媒体视频信息处理多媒体视频信息处理1、视频的定义、视频的定义 视频是其内容随时间变化的一组动态图视频是其内容随时间变化的一组动态图像,所以视频又叫运动图像或活动图像。像,所以视频又叫运动图像或活动图像。l视频信号的特点:视频信
41、号的特点:图像内容随时间变化图像内容随时间变化 伴随有与画面动作同步的声音伴随有与画面动作同步的声音l图像与视频的区别:图像与视频的区别:静止的图片称为图像,视频是运动的图像;静止的图片称为图像,视频是运动的图像;信源方式不同。信源方式不同。492 2、视频的分类、视频的分类 按照处理方式的不同:视频分为模拟视按照处理方式的不同:视频分为模拟视频和数字视频。频和数字视频。l 模拟视频:是一种传输图像和声音的连续的模拟视频:是一种传输图像和声音的连续的变动电信号。变动电信号。l 数字视频数字视频(digital video-DV)(digital video-DV):经过数字化:经过数字化的视频
42、信号。的视频信号。503 3、电视信号制式、电视信号制式l 电视信号的标准称为电视制式,不同制式的区别在电视信号的标准称为电视制式,不同制式的区别在于刷新速度,颜色编码和传送频率等。于刷新速度,颜色编码和传送频率等。l 目前世界上彩色广播电视制式最主要的有三种:目前世界上彩色广播电视制式最主要的有三种:(1)NTSC(1)NTSC制,制,19531953年由美国创立,日本、加拿大年由美国创立,日本、加拿大等国相继采用;等国相继采用;(2)PAL(2)PAL制,用于中国、英国和大部分西欧国家以制,用于中国、英国和大部分西欧国家以及北欧各国;及北欧各国;(3)SECAM(3)SECAM制,用于法国
43、、俄罗斯和东欧等国。制,用于法国、俄罗斯和东欧等国。514 4、YUVYUV与与RGBRGB彩色模型彩色模型l YUVYUV模型:模型:Y Y表示亮度,表示亮度,UVUV用来表示色差,用来表示色差,U U、V V是是构成彩色的两个分量,用于构成彩色的两个分量,用于PALPAL彩色电视制式中。彩色电视制式中。YUVYUV表示法的重要性是它的亮度信号表示法的重要性是它的亮度信号(Y)(Y)和色和色度信号度信号(U(U、V)V)是相互独立的。由于是相互独立的。由于Y Y、U U、V V是独立是独立的,所以可以对这些单色图分别进行编码。的,所以可以对这些单色图分别进行编码。l RGBRGB模型模型:用
44、用R,G,BR,G,B表示红表示红,绿绿,蓝三个彩色分量的值。蓝三个彩色分量的值。l YUVYUV与与RGBRGB可以进行彩色空间变换可以进行彩色空间变换 525 5、视频的数字化过程、视频的数字化过程1)视频信号的采样)视频信号的采样 用用Y:U:VY:U:V来表示来表示YUVYUV三分量的采样比例,三分量的采样比例,则数字视频的采样格式分别有则数字视频的采样格式分别有4:1:14:1:1、4:2:24:2:2和和4:4:44:4:4三种。根据电视信号的特征,亮度三种。根据电视信号的特征,亮度信号的带宽是色度信号带宽的两倍,因此其信号的带宽是色度信号带宽的两倍,因此其数字化对信号的色差分量的
45、采样率低于对亮数字化对信号的色差分量的采样率低于对亮度分量的采样率。建议采用度分量的采样率。建议采用4:2:24:2:2,既满足,既满足视觉效果,又可减少数据量。视觉效果,又可减少数据量。532 2)量化是对幅值上的离散化处理。)量化是对幅值上的离散化处理。3 3)编码)编码:将采样、量化后的信号转换成数字符将采样、量化后的信号转换成数字符号的过程。号的过程。数字视频编码技术主要有数字视频编码技术主要有MPEGMPEG与与H.261H.261标准,编码技术主要分成帧内编码与帧间编标准,编码技术主要分成帧内编码与帧间编码。码。546 6、数字电视系统、数字电视系统l 数字电视系统是一个从节目采集
46、、节目制作、数字电视系统是一个从节目采集、节目制作、节目传输直到用户端都以数字方式处理信号节目传输直到用户端都以数字方式处理信号的端到端的系统。的端到端的系统。l 多种业务:高清晰度电视(多种业务:高清晰度电视(“HDTV”HDTV”)、标)、标准清晰度电视(准清晰度电视(“SDTV”SDTV”)、互动电视、)、互动电视、数据业务等。数据业务等。l 数字电视系统的特征:显示分辨率数字电视系统的特征:显示分辨率1920X10801920X1080,帧率,帧率60fps60fps;显示屏的高宽比为;显示屏的高宽比为169169;支持杜比;支持杜比5.15.1声道传输;到达声道传输;到达Hi-FiH
47、i-Fi的听觉效果的听觉效果。557 7、H.264H.264视频编解码标准视频编解码标准l H.264H.264是国际电联(是国际电联(ITU-T ITU-T)制定的视频编)制定的视频编解码标准解码标准H.26xH.26x系列中最新的规范,同时也系列中最新的规范,同时也是是MPEG-4MPEG-4标准的一部分。标准的一部分。l 用途:数字电视、交互媒体、视频会议、视用途:数字电视、交互媒体、视频会议、视频点播、流媒体服务、视频监控等。频点播、流媒体服务、视频监控等。l 特点:特点:1 1)更高的编码效率;)更高的编码效率;2 2)高质量的视频画面;)高质量的视频画面;3 3)较少的网络带宽。
48、)较少的网络带宽。568 8、常见的视频文件格式、常见的视频文件格式1 1)AVIAVI文件文件.AVI.AVI AVI AVI是音频视频交错(是音频视频交错(Audio Video Audio Video InterleavedInterleaved)的英文缩写,它是)的英文缩写,它是MicrosoftMicrosoft公司开发允许视频和音频交错在一起同步播公司开发允许视频和音频交错在一起同步播放,放,AVIAVI文件目前主要应用在多媒体光盘上,文件目前主要应用在多媒体光盘上,用来保存电影、电视等各种影像信息用来保存电影、电视等各种影像信息。572 2)MPEGMPEG文件文件.MPEG/.
49、MPG/.DAT.MPEG/.MPG/.DATuMPEGMPEG文件格式是运动图像压缩算法的国际标文件格式是运动图像压缩算法的国际标准,它包括准,它包括MPEGMPEG视频、视频、MPEGMPEG音频和音频和MPEGMPEG系统系统(视频、音频同步视频、音频同步)三个部分。三个部分。MPEGMPEG的平均压的平均压缩比为缩比为501501,最高可达,最高可达20012001,压缩效率非,压缩效率非常高,同时图像和音响的质量也非常好。常高,同时图像和音响的质量也非常好。uMPEG1MPEG1是是VCDVCD的视频图像压缩标准;的视频图像压缩标准;MPEG2MPEG2是是DVDDVD的视频图像压缩
50、标准;的视频图像压缩标准;MPEG4MPEG4是网络视频是网络视频图像压缩标准之一,特点是压缩比高、成像图像压缩标准之一,特点是压缩比高、成像清晰,数据的损失很小。主要应用于视像电清晰,数据的损失很小。主要应用于视像电话、视像电子邮件等,对传输速率要求较低。话、视像电子邮件等,对传输速率要求较低。583 3)QuickTimeQuickTime文件文件.MOV.MOV Apple Apple公司开发的公司开发的QuickTimeQuickTime文件格式作文件格式作为开发为开发MPEG-4MPEG-4规范的统一数字媒体存储格式。规范的统一数字媒体存储格式。4 4)Flash VideoFlas