1、回顾与补充:回顾与补充:音频信号的数字化及压缩音频信号的数字化及压缩技术技术4.0.1 4.0.1 模拟音频的数字化过程模拟音频的数字化过程 数字化的声音易于用计算机软件处理,现在几乎所有的专数字化的声音易于用计算机软件处理,现在几乎所有的专业化声音录制、编辑器都是数字方式。对模拟音频数字化过程业化声音录制、编辑器都是数字方式。对模拟音频数字化过程涉及到涉及到音频的采样音频的采样、量化量化和和编码编码。采样和量化的过程可由采样和量化的过程可由A/DA/D转换器实现转换器实现。A/DA/D转换器以固定的转换器以固定的频率去采样,即每个周期测量和量化信号一次。经采样和量化频率去采样,即每个周期测量
2、和量化信号一次。经采样和量化后声音信号经编码后就成为数字音频信号,可以将其以文件形后声音信号经编码后就成为数字音频信号,可以将其以文件形式保存在计算机的存储介质中,这样的文件一般称为数字声波式保存在计算机的存储介质中,这样的文件一般称为数字声波文件。文件。模拟信号的数字化过程 100101100011101 信息论的奠基者香农(信息论的奠基者香农(ShannonShannon)指出:)指出:在一定条件下,用在一定条件下,用离散的序列可以完全代表一个连续函数离散的序列可以完全代表一个连续函数,这是采样定理的基本,这是采样定理的基本内容。内容。为实现为实现A/DA/D转换,需要转换,需要把模拟音频
3、信号波形进行分割,这种把模拟音频信号波形进行分割,这种方法称为采样方法称为采样(Sampling)(Sampling)。采样的过程是每隔一个时间间隔在。采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值模拟声音的波形上取一个幅度值,把时间上的连续信号变成时,把时间上的连续信号变成时间上的离散信号。该时间间隔称为采样周期,其倒数为采样频间上的离散信号。该时间间隔称为采样周期,其倒数为采样频率。采样频率是指计算机每秒钟采集多少个声音样本。率。采样频率是指计算机每秒钟采集多少个声音样本。1.1.采样采样 采样频率与声音频率之间有一定的关系,根据奈奎斯特采样频率与声音频率之间有一定的关系,根据
4、奈奎斯特(NyquistNyquist)理论,)理论,只有采样频率高于声音信号最高频率的两只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原成为原来的声音。倍时,才能把数字信号表示的声音还原成为原来的声音。2f2ff fs s 采样只解决了音频波形信号在采样只解决了音频波形信号在时间坐标时间坐标(即横轴即横轴)上把一个上把一个波形切成若干个等分的数字化问题,但是还需要用某种数字化波形切成若干个等分的数字化问题,但是还需要用某种数字化的方法来反映某一瞬间声波幅度的电压值大小。该值的大小影的方法来反映某一瞬间声波幅度的电压值大小。该值的大小影响音量的高低。我们把响音量的高低。我
5、们把对声波波形幅度的数字化表示称之为对声波波形幅度的数字化表示称之为“量化量化”。量化的过程是先将采样后的信号按整个声波的幅度划分成有量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入某个区段内的样值归为一类,并赋于限个区段的集合,把落入某个区段内的样值归为一类,并赋于相同的量化值。如何分割采样信号的幅度呢相同的量化值。如何分割采样信号的幅度呢?我们还是采取二进我们还是采取二进制的方式,以位制的方式,以位(bit)或或16位位(bit)的方式来划分纵轴。也就是说的方式来划分纵轴。也就是说在一个以在一个以8位为记录模式的音效中,其纵轴将会被划分为位为记录模式的音效中,其纵
6、轴将会被划分为8个量个量化等级,用以记录其幅度大小。化等级,用以记录其幅度大小。2.量化量化 以下图所示的原始模拟波形为例进行采样和量化。假设采样以下图所示的原始模拟波形为例进行采样和量化。假设采样频率为频率为1000次次/秒,即每秒,即每1/1000秒秒A/D转换器采样一次,其幅度被转换器采样一次,其幅度被划分成划分成0到到9共共10个量化等级,并将其采样的幅度值取最接近个量化等级,并将其采样的幅度值取最接近0 9之间的一个数来表示,如下图所示。图中每个正方形表示一次之间的一个数来表示,如下图所示。图中每个正方形表示一次采样。采样。D/A转换器从上图得到的数值中重构原来信号时,得到下转换器从
7、上图得到的数值中重构原来信号时,得到下图中蓝色图中蓝色(直线段直线段)线段所示的波形。从图中可以看出,蓝色线线段所示的波形。从图中可以看出,蓝色线与原波形与原波形(红色线红色线)相比,其波形的细节部分丢失了很多。这意相比,其波形的细节部分丢失了很多。这意味着重构后的信号波形有较大的失真。味着重构后的信号波形有较大的失真。失真在采样过程中是不可避免的,如何减少失真呢?可以直失真在采样过程中是不可避免的,如何减少失真呢?可以直观地看出,我们可以把上图中的波形划分成更为细小的区间,即观地看出,我们可以把上图中的波形划分成更为细小的区间,即采用更高的采样频率。同时,增加量化精度,以得到更高的量化采用更
8、高的采样频率。同时,增加量化精度,以得到更高的量化等级,即可减少失真的程度。在下图(左)中,采样率和量化等等级,即可减少失真的程度。在下图(左)中,采样率和量化等级均提高了一倍,分别为级均提高了一倍,分别为2000次次/秒和秒和20个量化等级。在下图(右)个量化等级。在下图(右)中,采样率和量化等级再提高了一倍,分别达到中,采样率和量化等级再提高了一倍,分别达到4000次次/秒和秒和40个个量化等级。从图中可以看出,当用量化等级。从图中可以看出,当用D/A转换器重构原来信号时转换器重构原来信号时(图中的轮廓线),信号的失真明显减少,信号质量得到了提高。(图中的轮廓线),信号的失真明显减少,信号
9、质量得到了提高。3.3.编码编码 模拟信号量经过采样和量化以后,形成一系列的离散信模拟信号量经过采样和量化以后,形成一系列的离散信号号脉冲数字信号。这种脉冲数字信号可以已一定的方式进脉冲数字信号。这种脉冲数字信号可以已一定的方式进行编码,形成计算机内部运行的数据。所谓行编码,形成计算机内部运行的数据。所谓编码,就是按照一编码,就是按照一定的格式把经过采样和量化得到的离散数据记录下来,并在有定的格式把经过采样和量化得到的离散数据记录下来,并在有用的数据中加入一些用于纠错、同步和控制的数据用的数据中加入一些用于纠错、同步和控制的数据。在数据回。在数据回放时,可以根据所记录的纠错数据判别读出的声音数
10、据是否有放时,可以根据所记录的纠错数据判别读出的声音数据是否有错,如在一定范围内有错,可加以纠正。错,如在一定范围内有错,可加以纠正。编码的形式比较多,常用的编码方式是编码的形式比较多,常用的编码方式是PCM脉冲调制。脉冲调制。脉冲编码调制(脉冲编码调制(PCM)是把模拟信号变换为数字信号的一种调)是把模拟信号变换为数字信号的一种调制方式,即把连续输入的模拟信号变换为在时域和振幅上都离制方式,即把连续输入的模拟信号变换为在时域和振幅上都离散的量,然后将其转化为代码形式传输或存储。散的量,然后将其转化为代码形式传输或存储。4.0.2 音频信号压缩技术音频信号压缩技术 音频信号压缩编码的主要依据是
11、人耳的听觉特性,主音频信号压缩编码的主要依据是人耳的听觉特性,主要有两点:要有两点:1.人的听觉系统中存在一个听觉阈值电平,低于这个人的听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号人耳听不到电平的声音信号人耳听不到.2.人的听觉存在屏蔽效应。当几个强弱不同的声音同时人的听觉存在屏蔽效应。当几个强弱不同的声音同时存在时,强声使弱声难以听到,并且两者之间的关系存在时,强声使弱声难以听到,并且两者之间的关系与其相对频率的大小有关与其相对频率的大小有关.声音编码算法就是通过这些特性来去掉更多的冗余声音编码算法就是通过这些特性来去掉更多的冗余数据,来达到压缩数据的目的。数据,来达到压缩数据的目
12、的。(一)(一)脉冲编码调制脉冲编码调制 1编码的原理编码的原理 它的原理框图下图所示它的原理框图下图所示 模拟信号数字化一般有三个步骤:模拟信号数字化一般有三个步骤:第一步是采样第一步是采样,就是每隔一段时间间隔读一次声音的幅度;就是每隔一段时间间隔读一次声音的幅度;第二步第二步是量化是量化,就是把采样得到的声音信号幅度转换成数,就是把采样得到的声音信号幅度转换成数字值。但那时并没有涉及如何进行量化。量化有好字值。但那时并没有涉及如何进行量化。量化有好几种方法,但可归纳成两类:一类称为几种方法,但可归纳成两类:一类称为均匀量化均匀量化,另一类称为另一类称为非均匀量化非均匀量化。采用的量化方法
13、不同,量。采用的量化方法不同,量化后的数据量也就不同。因此,可以说量化也是一化后的数据量也就不同。因此,可以说量化也是一种压缩数据的方法;种压缩数据的方法;第三步是编码第三步是编码,就是按一定格,就是按一定格式记录采样和量化后的数据。式记录采样和量化后的数据。2均匀量化均匀量化 采用相同的采用相同的“等分尺等分尺”来度量采样得到的幅度,也称为线来度量采样得到的幅度,也称为线性量化,如图性量化,如图3-43-4所示。量化后的样本值所示。量化后的样本值Y Y和原始值和原始值X X的差的差 E=Y-XE=Y-X称为量化误差或量化噪声。称为量化误差或量化噪声。3非均匀量化非均匀量化 对输入信号进行量化
14、时,大的输入信号采用大的量化间隔,对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,如图小的输入信号采用小的量化间隔,如图3-5所示。一个一个CDDADA采用脉冲编码调制采用脉冲编码调制PCM编码的实例编码的实例 首先用一组脉冲采样时钟信号与输入的模拟音频信首先用一组脉冲采样时钟信号与输入的模拟音频信号相乘,相乘的结果即输入信号在时间轴上的数号相乘,相乘的结果即输入信号在时间轴上的数字化。然后对采样以后的信号幅值进行量化。最字化。然后对采样以后的信号幅值进行量化。最简单的量化方法是均衡量化,这个量化的过程由简单的量化方法是均衡量化,这个量化的过程由量化器来完成。
15、对经量化器量化器来完成。对经量化器A/DA/D变换后的信号再进变换后的信号再进行编码,即把量化的信号电平转换成二进制码组,行编码,即把量化的信号电平转换成二进制码组,就得到了离散的二进制输出数据序列就得到了离散的二进制输出数据序列x(n)x(n),n n表示表示量化的时间序列,量化的时间序列,x(n)x(n)的值就是的值就是n n时刻量化后的幅时刻量化后的幅值,以二进制的形式表示和记录。值,以二进制的形式表示和记录。(二)(二)增量调制(增量调制(DMDM调制)调制)它是一种预测编码技术,是它是一种预测编码技术,是PCMPCM编码的一种变形。编码的一种变形。DMDM是是对实际的采样信号与预测的
16、采样信号之差的极性进行编码,对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成将极性变成“0”0”和和“1”1”这两种可能的取值之一。如果实际这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为的采样信号与预测的采样信号之差的极性为“正正”,则用,则用“1”1”表示;相反则用表示;相反则用“0”0”表示,或者相反。表示,或者相反。图3-7 DM波形示意图 从上图中可以看到,在开始阶段增量调制器的输出从上图中可以看到,在开始阶段增量调制器的输出不能保持跟踪输入信号的快速变化,这种现象称为不能保持跟踪输入信号的快速变化,这种现象称为增量调制器的增量调制器的“斜率过载斜率
17、过载”(slope overload)(slope overload)。在输入信号缓慢变化部分,即输入信号与预测信号在输入信号缓慢变化部分,即输入信号与预测信号的差值接近零的区域,增量调制器的输出出现随机的差值接近零的区域,增量调制器的输出出现随机交变的交变的“0”和和“1”。这种现象称为增量调制器的粒。这种现象称为增量调制器的粒状噪声状噪声(granular noise),这种噪声是不可能消除,这种噪声是不可能消除的。的。在输入信号变化快的区域,斜率过载是关心的焦点,在输入信号变化快的区域,斜率过载是关心的焦点,而在输入信号变化慢的区域,关心的焦点是粒状噪而在输入信号变化慢的区域,关心的焦点
18、是粒状噪声。声。第第4章章 多媒体硬件基础多媒体硬件基础本章内容本章内容数字音频处理接口数字音频处理接口数字视频处理接口数字视频处理接口多媒体输入多媒体输入/输出设备输出设备多媒体存储技术多媒体存储技术4.1 数字音频处理接口数字音频处理接口一、声卡的功能与工作原理(一、声卡的功能与工作原理(P68)1.声卡的功能声卡的功能(数字化声音数字化声音,合成音乐合成音乐,CD音频音频)(1)播放数字音乐)播放数字音乐(2)录音)录音(3)语音通信)语音通信(全双工全双工)(4)实时的效果器)实时的效果器(5)接口卡)接口卡(SB1394)(6)音频解码)音频解码(7)合成器)合成器(波表波表)2.声
19、卡的基本原理声卡的基本原理(1)结构)结构 模模/数转换电路数转换电路 数数/模转换电路模转换电路(2)组成)组成 MIDI输入输入/输出电路输出电路 MIDI合成器芯片合成器芯片 模模/数转换器数转换器 压缩芯片压缩芯片 语音合成器语音合成器 语音识别电路语音识别电路 输出电路输出电路3.声卡的类型声卡的类型(1)板卡式)板卡式(2)集成式)集成式(3)外置式声卡)外置式声卡二、音乐合成和二、音乐合成和MIDI接口规范接口规范(P70)1.音乐合成与音乐合成与MIDI目前,声卡的音乐合成主要有两种方法:目前,声卡的音乐合成主要有两种方法:一种是常用的调频(一种是常用的调频(FM)合成法;另一
20、种就)合成法;另一种就是波表(是波表(Wave Table)合成法。)合成法。衡量声卡的音乐合成器性能好坏的参数:衡量声卡的音乐合成器性能好坏的参数:(1)音色数目)音色数目(2)发音数)发音数(3)音乐的兼容性)音乐的兼容性2.MIDI术语(见表术语(见表4.1)3.MIDI接口接口(1)MIDI In(输入口)(输入口)(2)MIDI Out(输出口)(输出口)(3)MIDI Thru(转发口)(转发口)4.MIDI技术规范技术规范MIDI规定合成器、音序器、微机和鼓乐规定合成器、音序器、微机和鼓乐等能通过一个标准的接口连接。等能通过一个标准的接口连接。二、音乐合成和二、音乐合成和MIDI
21、接口规范接口规范三、语音合成语音合成(P73)1.概述概述计算机话语输出按其实现功能可分为:计算机话语输出按其实现功能可分为:1)有限词汇的计算机语音输出有限词汇的计算机语音输出(报时、报站报时、报站)2)基于语音合成技术的文字基于语音合成技术的文字语音转换语音转换(TTS)2.合成方法合成方法1)发音器官参数语音合成发音器官参数语音合成2)声道模型参数语音合成声道模型参数语音合成3)波形编辑语音合成技术波形编辑语音合成技术PSOLA(基音同步叠加基音同步叠加)算法(P74)(1)对原始波形进行分析,产生非参)对原始波形进行分析,产生非参数的中间表示;数的中间表示;(2)对中间表示进行修改;)
22、对中间表示进行修改;(3)将修改过的中间表示重新合成为)将修改过的中间表示重新合成为语音信号。语音信号。3.语音基元数据库的构建语音基元数据库的构建(1)基元的选择)基元的选择选择音节选择音节选择双音素和三音素选择双音素和三音素(2)语音数据的存储形式)语音数据的存储形式波形存储方式存储波形存储方式存储参数存储方式存储参数存储方式存储4.韵律模拟韵律模拟1)自然语言中的韵律特征自然语言中的韵律特征2)韵律合成及方法)韵律合成及方法3)韵律模拟的问题)韵律模拟的问题4.1.4 音频编码标准音频编码标准(一)(一)CCITT G系列声音压缩标准系列声音压缩标准CCITTCCITT和和ISOISO先
23、后提出了一系列有关语音数据编译码标先后提出了一系列有关语音数据编译码标准准,下面简要介绍几种音频编码技术标准。下面简要介绍几种音频编码技术标准。1电话质量的音频压缩编码技术标准电话质量的音频压缩编码技术标准信号频率规定在信号频率规定在300Hz300Hz3.4kHz3.4kHz,采用标准的脉冲编,采用标准的脉冲编码调制码调制(PCM)(PCM),当采样频率为,当采样频率为8kHz8kHz,进行,进行8bit8bit量化量化时,所得数据速率为时,所得数据速率为64kb/s64kb/s,即一个数字电话。,即一个数字电话。1972年年CCITT为电话质量和语音压缩制定了为电话质量和语音压缩制定了PC
24、M标准标准G.711,其速率为,其速率为64Kbs,使用非线性量化,使用非线性量化技术,主要用于公共电话网中。技术,主要用于公共电话网中。2 2调幅广播质量的音频压缩编码技术标准调幅广播质量的音频压缩编码技术标准 频率在频率在50Hz50Hz一一7kHz7kHz范围。范围。G.722G.722标准是采用标准是采用16kHz16kHz采样,采样,14bit14bit量化,信号数据速率为量化,信号数据速率为224kbit224kbits s,采用子带编码方法,将输入音频信号经滤波器分采用子带编码方法,将输入音频信号经滤波器分成高子带和低子带两个部分,分别进行成高子带和低子带两个部分,分别进行ADP
25、CMADPCM编编码,再混合形成输出码流,码,再混合形成输出码流,224kbit224kbits s可以被压可以被压缩成缩成64kbit64kbits s,最后进行数据插入,最后进行数据插入(最高插入速最高插入速率达率达16kbit16kbits)s),因此利用,因此利用G.722G.722标准可以在窄标准可以在窄带综合服务数据网带综合服务数据网N-ISDNN-ISDN中的一个中的一个B B信道上传送信道上传送调幅广播质量的音频信号调幅广播质量的音频信号。3 3高保真度立体声音频压缩编码技术标准高保真度立体声音频压缩编码技术标准 高保真立体声音频信号频率范围是高保真立体声音频信号频率范围是50
26、Hz50Hz20kHz20kHz,采用,采用44441kHz1kHz采样频率,采样频率,16bit16bit量化进行数字化转换,其数据速率量化进行数字化转换,其数据速率每声道达每声道达705kbit705kbits s。19911991年国际标准化组织年国际标准化组织ISOISO和和CCITTCCITT开开始联合制定始联合制定MPEGMPEG标准,其中标准,其中ISOCDlll72-3ISOCDlll72-3作为作为“MPEGMPEG音频音频”标准,成为国际上公认的高保真立体声音频压缩标准。标准,成为国际上公认的高保真立体声音频压缩标准。MPEGMPEG音频第一和第二层次编码是将输入音频信号进
27、行采样频率为音频第一和第二层次编码是将输入音频信号进行采样频率为48kHz48kHz,44.1kHz44.1kHz,32kHz32kHz的采样,经滤波器组将其分为的采样,经滤波器组将其分为3232个子个子带,同时利用人耳屏蔽效应,根据音频信号的性质计算各频带,同时利用人耳屏蔽效应,根据音频信号的性质计算各频率分量的人耳屏蔽门限,选择各子带的量化参数,获得高的率分量的人耳屏蔽门限,选择各子带的量化参数,获得高的压缩比。压缩比。MPEGMPEG第三层次是在上述处理后再引入辅助子带,非第三层次是在上述处理后再引入辅助子带,非均匀量化和熵编码技术,再进一步提高压缩比。均匀量化和熵编码技术,再进一步提高
28、压缩比。MPEGMPEG音频压音频压缩技术的数据速率为每声道缩技术的数据速率为每声道3232448kbit448kbits s,适合于,适合于CDCDDADA光盘应用。光盘应用。(二)(二)MP3MP3压缩技术压缩技术 MP3MP3的全名是的全名是MPEG Audio Layer-3MPEG Audio Layer-3,简单地说就是一种声音,简单地说就是一种声音文件的压缩格式。文件的压缩格式。ISO/MPEGISO/MPEG音频压缩标准里包括了三个使用高性能音频数据压音频压缩标准里包括了三个使用高性能音频数据压缩方法的感知编码方案缩方法的感知编码方案,按照压缩质量按照压缩质量(每每BitBit
29、的声音效果的声音效果)和编码方案的复杂程度分别是和编码方案的复杂程度分别是Layer1Layer1、Layer2Layer2、Layer3Layer3。所有这三层的编码采用的基本结构是相同的。它们在采用所有这三层的编码采用的基本结构是相同的。它们在采用传统的频谱分析和编码技术的基础上还应用了子带分析和传统的频谱分析和编码技术的基础上还应用了子带分析和心理声学模型理论。也就是通过研究人耳和大脑听觉神经心理声学模型理论。也就是通过研究人耳和大脑听觉神经对音频失真的敏感度,在编码时先分析声音文件的波形,对音频失真的敏感度,在编码时先分析声音文件的波形,利用滤波器找出噪音电平利用滤波器找出噪音电平(N
30、oise Level)(Noise Level),然后滤去人耳,然后滤去人耳不敏感的信号,通过矩阵量化的方式将余下的数据每一位不敏感的信号,通过矩阵量化的方式将余下的数据每一位打散排列,最后编码形成打散排列,最后编码形成MPEGMPEG的文件。而音质听起来与的文件。而音质听起来与CDCD相差不大。相差不大。MPEGMPEG的层次与压缩比率的层次与压缩比率 Layer1(相当于相当于384kbps立体声信号立体声信号)4:1Layer2(相当于相当于192256kbps立体声信立体声信号号)6:18:1Layer3(相当于相当于112154kbps立体声信立体声信号号)10:112:1(三)(三
31、)MP4压缩技术压缩技术MP4MP4并不是并不是MPEG-4MPEG-4或者或者MPEG-1Layer4MPEG-1Layer4,它的出现是针对,它的出现是针对MP3MP3的大的大众化、无版权的一种保护格式,由美国网络技术公司开发,众化、无版权的一种保护格式,由美国网络技术公司开发,美国唱片行业联合会倡导公布的一种新的网络下载和音乐播美国唱片行业联合会倡导公布的一种新的网络下载和音乐播放格式。放格式。MP4MP4使用的是使用的是MPEG-2 AACMPEG-2 AAC技术也就是俗称的技术也就是俗称的a2ba2b或或AACAAC。其中,。其中,MPEG-2MPEG-2是是MPEGMPEG于于19
32、941994年年1111月针对数码电视月针对数码电视(数码影像数码影像)提出的。提出的。它的特点就是,音质更加完美而压缩比更加大它的特点就是,音质更加完美而压缩比更加大(1:15)(1:15)。MPEG-2 AAC(ISO/IEC 13818-7)MPEG-2 AAC(ISO/IEC 13818-7)在采样率为在采样率为8 896KHz96KHz下提供下提供了了1 14848个声道可选范围的高质量音频编码。个声道可选范围的高质量音频编码。AACAAC就是就是Advanced Audio Coding(Advanced Audio Coding(先进音频编码先进音频编码)的意思,适用于从的意思,
33、适用于从比特率在比特率在8kbit/s8kbit/s单声道的电话音质到单声道的电话音质到160kbit/s160kbit/s多声道的超多声道的超高质量音频范围内的编码,并且允许对多媒体进行编码高质量音频范围内的编码,并且允许对多媒体进行编码/解解码。码。AAC与与MP3相比,增加了诸如对立体声的完美再现、相比,增加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪优异等比特流效果音扫描、多媒体控制、降噪优异等MP3没有的特性,使得在音频压缩后仍能完美的再现没有的特性,使得在音频压缩后仍能完美的再现CD音质。音质。AAC技术主要由以下三个部分组成。第一,技术主要由以下三个部分组成。第一
34、,AT&T的音频压缩技术专利。它可以将的音频压缩技术专利。它可以将AAC压缩比提高到压缩比提高到20:1而不损失音质。这样,一首而不损失音质。这样,一首3分钟的歌仅仅需要分钟的歌仅仅需要2.25MB,这在互联网上的下载速度是很惊人的。第,这在互联网上的下载速度是很惊人的。第二、安全数据库。它可以为你的二、安全数据库。它可以为你的AAC Music创建一创建一个特定的密钥,将此密钥存于其数据库中。同时,个特定的密钥,将此密钥存于其数据库中。同时,只有只有AAC的播放器才能播放含有这种密钥。第三、的播放器才能播放含有这种密钥。第三、协议认证。这个认证包含了复制许可、允许复制副协议认证。这个认证包含
35、了复制许可、允许复制副本数目、歌曲总时间、歌曲可以播放时间以及售卖本数目、歌曲总时间、歌曲可以播放时间以及售卖许可等信息。许可等信息。MP4MP4技术的优越性要远远高于技术的优越性要远远高于MP3MP3,因为它更适合,因为它更适合多媒体技术的发展以及视听欣赏的需求。但是,多媒体技术的发展以及视听欣赏的需求。但是,MP4MP4是一种商品,它利用改良后的是一种商品,它利用改良后的MPEG-2 AACMPEG-2 AAC技术技术并强加上由出版公司直接授权的知识产权协议作并强加上由出版公司直接授权的知识产权协议作为新的标准;而为新的标准;而MP3MP3是一种自由音乐格式,任何人是一种自由音乐格式,任何
36、人都可以自由使用。此外,都可以自由使用。此外,MP4MP4实际上是由音乐出版实际上是由音乐出版界联合授意的官方标准;界联合授意的官方标准;MP3MP3则是广为流传的民间则是广为流传的民间标准。相比之下,标准。相比之下,MP3MP3的灵活和自由度要远远大于的灵活和自由度要远远大于MP4MP4,这使得音乐发烧友们更倾向于使用,这使得音乐发烧友们更倾向于使用MP3MP3。更。更重要的一点是,重要的一点是,MP3MP3是目前最为流行的一种音乐格是目前最为流行的一种音乐格式,它占据着大量的网络资源,这使得式,它占据着大量的网络资源,这使得MP4MP4的推广的推广普及难上加难。普及难上加难。4.1.4 M
37、P3播放器(P75)1、MP3播放器的内部结构和工作原理播放器的内部结构和工作原理DSP功能:功能:(1)将)将MP3歌曲文件从中读取出来,并读取播放歌曲文件从中读取出来,并读取播放器上的信号到解码芯片;器上的信号到解码芯片;(2)解码芯片对信号进行解码;)解码芯片对信号进行解码;(3)通过数)通过数/模转换器将解码出来的数字信号转换模转换器将解码出来的数字信号转换成模拟信号;成模拟信号;(4)把转换后的模拟音频放大;)把转换后的模拟音频放大;(5)低通滤波到输出口,输出后就是我们所听到)低通滤波到输出口,输出后就是我们所听到的音乐了。的音乐了。嵌入式嵌入式DSP处理器处理器2、MP3播放器的
38、主要功能及性能参数播放器的主要功能及性能参数(1)播放功能)播放功能(2)录制功能)录制功能(3)存储容量与类型)存储容量与类型(4)音乐格式)音乐格式(5)输入)输入/输出接口输出接口4.2 数字视频处理接口数字视频处理接口一、视频图像显示一、视频图像显示1.显卡显卡(1)总线接口类型)总线接口类型PCI接口接口AGP接口接口PCI-E接口接口(2)显示芯片性能指标)显示芯片性能指标显示的核心频率显示的核心频率公版频率公版频率核心代号核心代号显示芯片位宽显示芯片位宽顶点着色单元顶点着色单元渲染管线渲染管线像素填充率像素填充率(3)显存类型与性能指标显存类型与性能指标目前,市场中所采用的显存类
39、型主要有:目前,市场中所采用的显存类型主要有:SDRAM、DDR SDRAM和和DDR SGRAM三种。三种。显存的性能指标主要包括:显存的性能指标主要包括:显存位宽显存位宽显存时钟周期显存时钟周期显存容量显存容量显存频率显存频率显存带宽显存带宽(4)显示接口)显示接口DVI接口接口HDMI接口接口VGA接口接口TV-Out接口接口输出到电视的接口目前主要有以下输出到电视的接口目前主要有以下3种:种:1)采用)采用VGA接口接口2)复合视频接口)复合视频接口RCA接口接口3)S端子接口(端子接口(Separate Video)2.CRT显示系统显示系统(1)屏幕尺寸)屏幕尺寸(2)荫罩和点间距
40、)荫罩和点间距(3)荧光粉类型)荧光粉类型(4)刷新(或扫描)频率与闪烁)刷新(或扫描)频率与闪烁(5)隔行和非隔行扫描)隔行和非隔行扫描(6)显示缓冲区与颜色定义)显示缓冲区与颜色定义(7)模拟信号接口和数字信号接口)模拟信号接口和数字信号接口(8)视频)视频BIOS3.液晶显示系统(液晶显示系统(LCD)(1)工作原理)工作原理(2)宽屏)宽屏(3)可视角度)可视角度(4)分辨率)分辨率(5)点距)点距(6)垂直扫描频率)垂直扫描频率(7)显示器接口)显示器接口4.投影显示系统投影显示系统(1)LCD液晶投影机液晶投影机(2)DLP数字光处理器投影机数字光处理器投影机(3)LCOS投影技术
41、投影技术(4)ANSI流明与投影机的亮度流明与投影机的亮度(5)物理分辨率)物理分辨率(6)最大分辨率)最大分辨率(7)输入)输入/输出端子输出端子二、视频卡二、视频卡/盒盒1.视频卡视频卡/盒的分类与功能简介盒的分类与功能简介(1)视频采集卡)视频采集卡广播级视频采集卡广播级视频采集卡专业级视频采集卡专业级视频采集卡民用级视频采集卡民用级视频采集卡(2)DV卡(卡(1394卡)卡)4.2 数字视频处理接口数字视频处理接口(3)电视卡)电视卡/盒盒(4)非线性编辑卡)非线性编辑卡(5)视频监控卡)视频监控卡(6)视频信号转换器)视频信号转换器(7)压缩卡)压缩卡/盒盒(8)字幕卡)字幕卡2.视
42、频卡视频卡/盒的主要性能参数盒的主要性能参数(1)编码方式)编码方式(2)接口类型)接口类型(3)视频输入)视频输入/输出格式输出格式4.3 多媒体输入多媒体输入/输出设备输出设备一、扫描仪一、扫描仪1.扫描仪的结构原理扫描仪的结构原理(1)结构)结构(2)信息数字化原理)信息数字化原理2.扫描仪的分类扫描仪的分类(1)按扫描方式分类)按扫描方式分类手动式扫描仪手动式扫描仪平面式扫描仪平面式扫描仪滚筒式扫描仪滚筒式扫描仪胶片扫描仪胶片扫描仪(2)按扫描幅面分类)按扫描幅面分类(3)按扫描分辨率分类)按扫描分辨率分类(4)按灰度与彩色分类)按灰度与彩色分类(5)按反射式或透射式分类)按反射式或透
43、射式分类3.扫描仪的技术指标扫描仪的技术指标(1)原稿种类)原稿种类(2)扫描精度)扫描精度(3)扫描分辨率)扫描分辨率分辨率的单位分辨率的单位分辨率与精度分辨率与精度光学分辨率和间插分辨率光学分辨率和间插分辨率光电转换精度光电转换精度(4)色彩精度)色彩精度(5)扫描速度)扫描速度(6)阶调)阶调(7)灰阶)灰阶(8)鲜锐度)鲜锐度(9)色彩再现能力)色彩再现能力(10)接口标准)接口标准3.扫描仪的技术指标扫描仪的技术指标二、数码相机二、数码相机1.数码相机的感光器件数码相机的感光器件(1)电荷耦合器件图像传感器)电荷耦合器件图像传感器CCD(2)互补性氧化金属半导体)互补性氧化金属半导体
44、CMOS2.数码相机的主要性能参数数码相机的主要性能参数(1)CCD/CMOS尺寸尺寸(2)光学变焦与数字变焦)光学变焦与数字变焦(3)最大像素和有效像素)最大像素和有效像素(4)存储介质)存储介质(5)接口类型)接口类型4.3 多媒体输入多媒体输入/输出设备输出设备三、数码摄像机三、数码摄像机(1)Mini DV(2)Digital 8 DV(3)DVD数码摄像机数码摄像机(4)硬盘摄像机)硬盘摄像机(5)高清摄像机()高清摄像机(HDV)4.3 多媒体输入多媒体输入/输出设备输出设备磁带式数码摄像机磁带式数码摄像机 光盘式数码摄像机光盘式数码摄像机 硬盘式数码摄像机硬盘式数码摄像机 四、输
45、入四、输入/输出接口输出接口1.SCSI接口接口(1)SCSI概述概述(2)SCSI接口技术接口技术2.USB接口接口(1)控制器)控制器(2)控制器驱动程序)控制器驱动程序(3)USB芯片驱动程序芯片驱动程序(4)USB设备设备(5)设备驱动程序)设备驱动程序4.3 多媒体输入多媒体输入/输出设备输出设备USB规定了规定了4种不同的数据传输方式:种不同的数据传输方式:(1)等时传输方式)等时传输方式(2)中断传输方式)中断传输方式(3)控制传输方式)控制传输方式(4)批传输方式)批传输方式3.IEEE1394接口接口IEEE1394分为两种传输方式:分为两种传输方式:backplane模模式
46、和式和Cable模式。模式。4.4 多媒体存储技术多媒体存储技术多媒体存储技术主要是指多媒体存储技术主要是指光存储技术和闪存技术。光存储技术和闪存技术。(P109)如如CD-ROM、CD-DA、CD-I、CD-V、photo-CD、CD-ROM/XA 即即WORM(CD-WO)如相变型光盘(如相变型光盘(PCD)和磁光型光盘)和磁光型光盘CD-MO(MOD):也叫:也叫Audio-CD,即,即CD唱片,唱片,存放音乐与歌曲。存放音乐与歌曲。(黄皮书):存放计算机数(黄皮书):存放计算机数据,其中据,其中CD-ROM/XA是扩展形式,与是扩展形式,与CD-I兼容,是兼容,是扩展的音频、文本和图形
47、混合格式。扩展的音频、文本和图形混合格式。:用于存放用:用于存放用MPEG算法压缩的立体算法压缩的立体声视频信号,且具有交互能力,称为交互声视频信号,且具有交互能力,称为交互CD。:存放电视的模拟信号和数字控制信:存放电视的模拟信号和数字控制信号号。:分为两个部分,:分为两个部分,BOOK1定义了定义了CD-MO,BOOK2定义了定义了CD-R(CD-WO)。:存放了以:存放了以MPEG-1算法压缩的立体算法压缩的立体声数字视频信号。声数字视频信号。2.光存储系统的技术指标光存储系统的技术指标(1)尺寸)尺寸(2)容量)容量(3)平均存取时间、平均寻道时间和平均)平均存取时间、平均寻道时间和平
48、均等待时间等待时间(4)数据传输速率)数据传输速率(5)误码率)误码率(6)平均无故障时间)平均无故障时间1)光盘的物理结构)光盘的物理结构2)在基片层形成凹坑)在基片层形成凹坑3)螺旋型的轨道,凹坑和岸在轨道中形成有序的序列)螺旋型的轨道,凹坑和岸在轨道中形成有序的序列标签层标签层保护层保护层反射层反射层基片层基片层岸岸凹坑凹坑:凹坑到岸及岸到凹坑的转变编码为:凹坑到岸及岸到凹坑的转变编码为1,没有变,没有变化时编码为化时编码为0,凹坑长为,凹坑长为0.3um的倍数。的倍数。=16(bits/样本)样本)2声道声道44100(样本(样本/(秒(秒声声道)道)=1,411,200比特比特/秒秒
49、=74分钟分钟1,411,200(比特(比特/秒)秒)747MB 协议规定序列中至少有两个岸和两个凹坑连续地出协议规定序列中至少有两个岸和两个凹坑连续地出现,因此两个现,因此两个1之间至少有两个之间至少有两个0。凹坑或岸不允许太长,必须保持最大间隔,至多凹坑或岸不允许太长,必须保持最大间隔,至多10个个0可以连在一起。可以连在一起。8比特字编码成比特字编码成14比特值,使之满足最小、最大间比特值,使之满足最小、最大间隔。隔。两个连续地调制符号(两个连续地调制符号(14比特)之间插入比特)之间插入3个附加个附加比特,以便得到需要的最小、最大间隔。比特,以便得到需要的最小、最大间隔。:同步样式(同
50、步样式(12个个1,12个个0和和3个填充比特)个填充比特)=27bits 音频数据音频数据=12字节字节2声道声道=12(14+3)2=408bits错误检测错误检测=4字节字节=4(14+3)=68bits错误纠正错误纠正=4字节字节=4(14+3)=68bits控制和显示字节控制和显示字节=1(14+3)=17bits 一帧合计共一帧合计共588bits:a)引入区域)引入区域CD-DA目录目录b)程序区域)程序区域CD-DA上所有轨道、存放实际数据上所有轨道、存放实际数据c)引出区域)引出区域CD-DA尾部尾部,一个轨道,一个轨道一首歌曲。每个轨道有几个索引,一首歌曲。每个轨道有几个索