1、第四章 数制和信息编码多媒体信息编码多媒体分类 通常,人们将文本、音频、视频、图形、图像、动画的综合体笼统称为“多媒体”。由此可见,多媒体信息包括以下5种:文本 图形、图像 动画 声音 视频影像一、音频信息音频信息 1.1.基本概念基本概念声波:声波:声源体发生振动会引起四周空气声源体发生振动会引起四周空气 振荡,振荡方式就是声波。振荡,振荡方式就是声波。复杂的声波由许许多具有不同振幅复杂的声波由许许多具有不同振幅和频率的正弦波组成。和频率的正弦波组成。周期周期T:T:重复出现的时间间隔重复出现的时间间隔;振幅振幅A:A:波形相对基线的最大位移波形相对基线的最大位移,表示音量的大小表示音量的大
2、小;频率频率f:f:信号每秒钟变化的次数信号每秒钟变化的次数,即即1/T1/T 以赫兹以赫兹(Hz)(Hz)为单位。为单位。振幅A f 周期T 声音按频率分类 正常人所能听到的声音频率范围正常人所能听到的声音频率范围为为20 Hz20 Hz20 kHz20 kHz。声音质量的频率范围声音质量的频率范围:CD CD 如随身听如随身听 FM:FM:调频调频 AM:AM:调幅调幅 20kHZ 20HZ 20HZ 次声波 可听声波 超声波(HZ)20kHZ CD-DA FM 广播 AM 广播 10 20 50 200 3.4k 7k 15k 20k(HZ)20kHZ 电话 把调制信号从低频搬移到了高频
3、,以便利用电离层传播,调频声音的高低变为频率的变化的电信号,调幅就是用声音的高低变为幅度的变化的电信号.2.模拟音频的数字化用计算机对音频信息处理,就要将模拟信号(如语音、音乐用计算机对音频信息处理,就要将模拟信号(如语音、音乐等)转换成维数字信号。等)转换成维数字信号。采样采样 每隔一定时间间隔对模拟每隔一定时间间隔对模拟 波形上取一个幅度值。波形上取一个幅度值。量化量化 将每个采样点得到的幅度值将每个采样点得到的幅度值 以数字存储。以数字存储。编码编码 将采样和量化后的数字数据将采样和量化后的数字数据 以一定的格式记录下来以一定的格式记录下来模拟信号模拟信号采样采样量化量化编码编码数字信号
4、数字信号 振幅 频率1/T 采样点 T 振幅1/TT 采样 模拟信号 量化 编码成数字信号 0111000111000 3.3.数字音频的技术指标数字音频的技术指标 采样频率、量化位数和声道数采样频率、量化位数和声道数采样频率:采样频率:每秒钟的采样次数每秒钟的采样次数量化位数量化位数(采样精度采样精度):存放采样点振幅值的二进制位数存放采样点振幅值的二进制位数。通常。通常 量化位数有量化位数有8 8位、位、1616位,分别表示有位,分别表示有2 28 8、2 21616个等级。个等级。声道数声道数:声音通道的个数声音通道的个数,立体声立体声 为双声道。为双声道。每秒钟存储声音容量的公式为:每
5、秒钟存储声音容量的公式为:采样频率采样频率采样精度采样精度声道数声道数/8=字节数字节数例如,用例如,用44.10 kHz的采样频率,的采样频率,16位的精度存储,则录制位的精度存储,则录制1秒钟的秒钟的立体声节目,其立体声节目,其WAV文件所需的存储量为:文件所需的存储量为:44 100162/8=176 400(字节)(字节)采样频率和量化参数比较4.数字音频的文件格式 WaveWave格式文件(格式文件(.Wav.Wav)记录了真实声音的二进制采样数据,通常文件较大。记录了真实声音的二进制采样数据,通常文件较大。MIDIMIDI格式文件(格式文件(.MID.MID)数字音乐的国际标准数字
6、音乐的国际标准.记录的是音符数字,文件小。记录的是音符数字,文件小。MPEGMPEG音频文件(音频文件(.MP1/.MP2/.MP3.MP1/.MP2/.MP3)采用采用MPEGMPEG音频压缩标准进行压缩的文件。音频压缩标准进行压缩的文件。RARA格式文件(格式文件(.ra.ra)RARA(Real AudioReal Audio)是)是Real NetworkReal Network公司制定的音频压缩规公司制定的音频压缩规 范,有较高的压缩比,采用流媒体的方式在网上实时播放范,有较高的压缩比,采用流媒体的方式在网上实时播放。5.5.声音的录制与播放声音的录制与播放“录音机”是用于声音文件的
7、录制与播放,还可以对声音进行编辑和特殊效果处理。录制声音录制声音 编辑声音编辑声音删除声音删除声音 当前位置之前或之后当前位置之前或之后插入声音插入声音移动声音移动声音 删除和插入间接完成删除和插入间接完成二、数字图像及处理 1.1.基本概念基本概念 图形和图像图形和图像 图形:由点、线等组成的有边界画面,文件中存放描述图形的指令。图形:由点、线等组成的有边界画面,文件中存放描述图形的指令。图像:由图像设备输入的无边界画面,数字化后以位图形式存储。图像:由图像设备输入的无边界画面,数字化后以位图形式存储。图形与图像的数字化图形与图像的数字化 分辨率(行、列)和颜色深度分辨率(行、列)和颜色深度
8、 真彩色每个像素点占真彩色每个像素点占3 3个字节,个字节,2 22424=16777216=16777216 种颜色。种颜色。计算存储一秒图像公式:计算存储一秒图像公式:列数列数行数行数像素的颜色深度像素的颜色深度/8/8 帧帧/秒秒=字节数字节数 例:例:12801024分辨率的分辨率的“真彩色真彩色”电视图像,电视图像,按每秒按每秒30帧计算,显帧计算,显示示1分钟,则需要:分钟,则需要:1280102433060 6.6 GB2.图像的数字化 采样采样 用多少个像素点的用多少个像素点的“列数列数行数行数”表示,分辨率越高,图像表示,分辨率越高,图像越清晰,存储量也越大。越清晰,存储量也
9、越大。量化量化 量化是在图像离散化后,将表示图像色彩浓淡的连续变化值离量化是在图像离散化后,将表示图像色彩浓淡的连续变化值离化为整数值的过程。化为整数值的过程。把量化时所确定的整数值取值个数称为把量化时所确定的整数值取值个数称为量化级数量化级数,也称为颜色深度也称为颜色深度.图像图像 采样采样 量化量化 数字图像数字图像颜色深度黑白图黑白图 图像的颜色深度为1,则用一个二进制位1和0表示纯白、纯黑两种情况;灰度图灰度图 图像的颜色深度为8,占一个字节,灰度级别为256级。通过调整黑白两色的程度(称颜色灰度)来有效地显示单色图像;RGB 24位位真彩色 彩色图像显示时,由红、绿、蓝三基色通过不同
10、的强度混合而成,当强度分成256级(值为0255),占24位,就构成了224=16777216种颜色的“真彩色”图像。灰度图灰度图彩色图彩色图 图像的分辨率和像素位的颜色深度决定了图像文件的大小,图像的分辨率和像素位的颜色深度决定了图像文件的大小,计算公式为:计算公式为:列数列数行数行数颜色深度颜色深度8=8=图像字节数图像字节数例例8.2 当要表示一个分辨率为当要表示一个分辨率为640480的的“24位真彩色位真彩色”图图像,则需要:像,则需要:6404802481MB 由此可见,数字化后的图像数据量十分巨大,必须采用编码由此可见,数字化后的图像数据量十分巨大,必须采用编码技术来压缩信息。它
11、是图像传输与存储的关键。技术来压缩信息。它是图像传输与存储的关键。2.2.常用图像文件格式常用图像文件格式BMPBMP和和DIBDIB格式文件格式文件 与设备无关的位图格式文件,与设备无关的位图格式文件,WindowsWindows环境中经常使用环境中经常使用.GIFGIF格式文件格式文件 Internet上的重要文件格式之一,最大不超过上的重要文件格式之一,最大不超过64 KB,256色以内色以内,压缩比较高,与设备无关。压缩比较高,与设备无关。JPEGJPEG格式文件(格式文件(.JPG.JPG)利用利用JPEG方法压缩方法压缩,Internet上重要文件格式之一,上重要文件格式之一,适用
12、于处理适用于处理256色以上、大幅面图像。色以上、大幅面图像。WMFWMF格式文件格式文件 位图与矢量图的混合体位图与矢量图的混合体,Windows中许多剪贴画图像中许多剪贴画图像 是以该格式存储的。是以该格式存储的。广泛应用于桌面出版印刷领域。广泛应用于桌面出版印刷领域。3.3.图像数据的获取图像数据的获取利用图像处理软件和现成的图像库利用图像处理软件和现成的图像库 最常用的是最常用的是Photoshop,Photoshop,可以绘图可以绘图,也可以编辑来自网络、也可以编辑来自网络、CD-ROMCD-ROM光盘上存储的图像库光盘上存储的图像库 “画图画图”程序可以获取屏幕界面程序可以获取屏幕
13、界面利用数字化设备获取利用数字化设备获取 数码相机、数字摄象机,将拍摄的自然界景物按数字格式数码相机、数字摄象机,将拍摄的自然界景物按数字格式存储通过连接转换转换成计算机中的图像和影象文件。存储通过连接转换转换成计算机中的图像和影象文件。扫描仪将照片、艺术作品转换成数字图像文件。扫描仪将照片、艺术作品转换成数字图像文件。三、视频 视频视频是将一幅幅独立图像组成的序列按照是将一幅幅独立图像组成的序列按照一定的速率连续播放,利用视觉暂留现象一定的速率连续播放,利用视觉暂留现象在人的眼前呈现出连续运动的画面。在人的眼前呈现出连续运动的画面。模拟视频常用两种标准:模拟视频常用两种标准:NTSC制式制式
14、(30帧帧/秒,秒,525行行/帧帧)PAL制式(制式(25帧帧/秒,秒,625行行/帧),我国采用帧),我国采用PAL制式。制式。例例1分钟的数字视频容量分钟的数字视频容量640480 3 30 60=1 658 880 000字节字节分辨率分辨率帧帧/秒秒采样深度采样深度 时间时间常用视频文件格式AVIAVI(Audio-Video InterleavedAudio-Video Interleaved)文件)文件将视频与音频信息交错地保存在一个文件中,较好地解决了音频将视频与音频信息交错地保存在一个文件中,较好地解决了音频与视频的同步问题,已成为与视频的同步问题,已成为WindowsWin
15、dows视频标准格式文件。视频标准格式文件。MOVMOV文件文件利用它可以合成视频、音频、动画、静止图像等多种素材。利用它可以合成视频、音频、动画、静止图像等多种素材。MPG(.mpg)MPG(.mpg)文件文件是按照是按照MPEG标准压缩的全屏视频的标准文件。标准压缩的全屏视频的标准文件。DATDAT文件文件是是VCD专用的格式文件,文件结构与专用的格式文件,文件结构与MPG文件格式基本相同。文件格式基本相同。流媒体概述 流媒体一种可以使音频、视频等多媒体文件能在一种可以使音频、视频等多媒体文件能在InternetInternet上以实时的、上以实时的、无需下载等待的无需下载等待的流式传输流
16、式传输方式进行播放的技术方式进行播放的技术应用应用 互联网直播互联网直播 视频点播视频点播 远程教育远程教育 视频会议系统视频会议系统常用流媒体文件RealMedia(RealNetworksRealMedia(RealNetworks)RA(RealAudio)用来传输接近)用来传输接近CD音质的音频数据音质的音频数据RM(RealVideo)在低速率的网络上实时传输活动视频影像)在低速率的网络上实时传输活动视频影像RF(RealFlash)一种高压缩比的动画格式)一种高压缩比的动画格式QuickTime(AppleQuickTime(Apple)是数字媒体领域事实上的工业标准,是创建是数字
17、媒体领域事实上的工业标准,是创建3D动画、实时效果、动画、实时效果、虚拟现实、虚拟现实、A/V和其他数字流媒体的重要基础。和其他数字流媒体的重要基础。ASFASF与与WMA(MicrosoftWMA(Microsoft)ASF是一种数据格式,音频、视频、图像以及控制命令脚本等多媒是一种数据格式,音频、视频、图像以及控制命令脚本等多媒体信息通过这种格式,以网络数据包的形式传输,实现流式多媒体信息通过这种格式,以网络数据包的形式传输,实现流式多媒体内容发布。体内容发布。WMV是微软公司推出的与是微软公司推出的与MP3格式齐名的一种音频格式,是用于格式齐名的一种音频格式,是用于高清晰度映像的编解码器
18、。高清晰度映像的编解码器。数据压缩技术数据压缩技术 数字化了的视频和音频信号的数量之大是非常惊人的。数字化了的视频和音频信号的数量之大是非常惊人的。带来的问题带来的问题 占用存储容量占用存储容量 降低通信干线的信道传输率降低通信干线的信道传输率 影响计算机的处理速度和播放效果影响计算机的处理速度和播放效果问题的解决问题的解决:数据压缩数据压缩数据压缩:数据压缩:一般可以分为有损压缩和无损压缩两种。一般可以分为有损压缩和无损压缩两种。数据压缩技术的性能指标数据压缩技术的性能指标 压缩比压缩比:即压缩前后所需的信息存储之比要大;即压缩前后所需的信息存储之比要大;恢复效果恢复效果 即要尽可能恢复到原
19、始数据即要尽可能恢复到原始数据 速度速度 即压缩、解压缩的速度即压缩、解压缩的速度 开销开销 实现压缩的软、硬件开销要小实现压缩的软、硬件开销要小 1.1.无损压缩(解压缩后信息不失真,可逆)无损压缩(解压缩后信息不失真,可逆)这类算法主要特点是压缩比较低,为这类算法主要特点是压缩比较低,为2:15:1,一般用来压缩文,一般用来压缩文本数据或本数据或计算机绘制的图像(色彩不丰富)计算机绘制的图像(色彩不丰富)。典型的编码:典型的编码:l 行程编码:行程编码:对连续出现的符号用一个计数值来表示,能确保解压后对连续出现的符号用一个计数值来表示,能确保解压后的数据不失真的数据不失真。例用于文字压缩例
20、用于文字压缩:AAAAABBBBCCDDDDDD 5A4B2C6Dl HuffmanHuffman编码编码 编码思想:出现频率较高的符号采用短码字,出现频率较低的符号编码思想:出现频率较高的符号采用短码字,出现频率较低的符号采用较长的码字,以达到缩短平均码长来实现数据的压缩。采用较长的码字,以达到缩短平均码长来实现数据的压缩。2.2.有损压缩有损压缩 有损压缩方法是以牺牲某些信息(这部分信息基本不影响对有损压缩方法是以牺牲某些信息(这部分信息基本不影响对原始数据的理解)为代价,换取了较高的压缩比。原始数据的理解)为代价,换取了较高的压缩比。广泛用于语音、图像和视频数据的压缩。广泛用于语音、图像
21、和视频数据的压缩。3.3.数据压缩的国际标准数据压缩的国际标准 v JPEG标准标准 适用于连续色调和多级灰度的静态图像适用于连续色调和多级灰度的静态图像v MPEGMPEG标准标准 适用于运动图像、音频信息。包括适用于运动图像、音频信息。包括MPEGMPEG视频、视频、MPEGMPEG音频、音频、MPEGMPEG系统(视频和音频的同步)。系统(视频和音频的同步)。MPEGMPEG已制定了已制定了MPEG-1MPEG-1、MPEG-2MPEG-2、MPEG-4MPEG-4和和MPEG-7MPEG-7四种。四种。文件压缩和解压缩软件文件压缩和解压缩软件 压缩工具软件(如压缩工具软件(如ARJARJ、PKZIP PKZIP、WinZipWinZip、WinRARWinRAR等)对原等)对原来的文件进行压缩处理,这种压缩通常是无损压缩。压缩后来的文件进行压缩处理,这种压缩通常是无损压缩。压缩后所生成的文件称为压缩包,体积只有原来的几分之一甚至更所生成的文件称为压缩包,体积只有原来的几分之一甚至更小。当然,压缩包已经是另一种文件格式了,如果你想使用小。当然,压缩包已经是另一种文件格式了,如果你想使用其中的数据,需要用压缩软件把数据还原,这个过程称作解其中的数据,需要用压缩软件把数据还原,这个过程称作解压缩。压缩。