第2章-数字音频技术基础课件.ppt_163文库

资源描述

1、声学原理声学原理 2.1声音数字化声音数字化 2.2数字音频的主要性能参数数字音频的主要性能参数 2.3数字音频文件的常见格式数字音频文件的常见格式 2.4知识目标：了解声学的基本原理，了解知识目标：了解声学的基本原理，了解数字音频的主要性能参数，掌握声音数字数字音频的主要性能参数，掌握声音数字化的实现方法，掌握与数字音频相关的基化的实现方法，掌握与数字音频相关的基本概念，熟悉数字音频文件的常见格式，本概念，熟悉数字音频文件的常见格式，为学好数字音频设备打好基础。为学好数字音频设备打好基础。技能目标：正确拆装技能目标：正确拆装CD机芯，了解机芯，了解CD唱唱机的基本结构，掌握机的基本结构，掌握

2、CD电路的工作原理。电路的工作原理。图图2-1 CD2-1 CD唱机外形结构唱机外形结构1CD机机芯的基本组成机机芯的基本组成（1）机芯的基本组成）机芯的基本组成图图2-2 CD2-2 CD机的机芯基本组成方框图机的机芯基本组成方框图（2）机芯各部分的主要作用）机芯各部分的主要作用2CD机电路的基本组成机电路的基本组成（1）电路的基本组成）电路的基本组成图图2-3 CD2-3 CD机电路组成方框图机电路组成方框图（2）电路各部分的主要作用）电路各部分的主要作用a聚焦伺服电路聚焦伺服电路b循迹伺服电路循迹伺服电路c进给伺服电路进给伺服电路d主轴伺服电路主轴伺服电路图图2-4 2-4 三光束型激

3、光头的光路结构图三光束型激光头的光路结构图声和音实际上应该是属于两个概念。声和音实际上应该是属于两个概念。声由各种压力变化构成，而音是指有声由各种压力变化构成，而音是指有音调的声。音调的声。声音是怎样产生和传播的呢？当一个物声音是怎样产生和传播的呢？当一个物体振动时，会引起周围空气质点的振动，由体振动时，会引起周围空气质点的振动，由于空气的可压缩性，在质点的相互作用下，于空气的可压缩性，在质点的相互作用下，周围空气会产生交替的压缩和膨胀过程，并周围空气会产生交替的压缩和膨胀过程，并向外传播，这就是声音的产生和声音的传播。向外传播，这就是声音的产生和声音的传播。自然界中声音有各种各样的表现方式

4、，自然界中声音有各种各样的表现方式，如语音、音乐、风声、雨声、鸟叫声、机器如语音、音乐、风声、雨声、鸟叫声、机器声、汽笛声等，但是在数字音视频作品中声声、汽笛声等，但是在数字音视频作品中声音表现的主要方式只有对白、音乐、背景声音表现的主要方式只有对白、音乐、背景声音、音效等几种。音、音效等几种。声音的技术表现和声音的艺术表现是所声音的技术表现和声音的艺术表现是所有音视频作品中声音都具有的共同属性。有音视频作品中声音都具有的共同属性。2.1.1 声音物理特性声音物理特性声音是由材料振动产生的一种物理现声音是由材料振动产生的一种物理现象，通过空气等介质的传播，引起人的耳象，通过空气等介质的传播，

5、引起人的耳膜振动，并为人耳所感知。膜振动，并为人耳所感知。从物理学的角度来看，声音实际上是从物理学的角度来看，声音实际上是通过空气等介质传播的一种连续的波，称通过空气等介质传播的一种连续的波，称为声波。为声波。1频率、声速和波长频率、声速和波长2音调、响度和音色音调、响度和音色（1）声调（）声调（Pitch，音调），音调）（2）响度（）响度（Loundness）（3）音色（）音色（Timbre）图图2-5 2-5 声强与声压的关系声强与声压的关系2.1.2 人的听觉特性人的听觉特性人主要通过耳朵接受声音。人主要通过耳朵接受声音。人耳构造对声音的感受具有双耳效应、人耳构造对声音的感受具有双耳效

6、应、频率响应以及声掩蔽，从而形成人的听觉特频率响应以及声掩蔽，从而形成人的听觉特性。性。人的听觉特性具有方向性、带通滤波器人的听觉特性具有方向性、带通滤波器的频率特性以及非线性的掩蔽效应。的频率特性以及非线性的掩蔽效应。1听觉的方向性听觉的方向性人对声音方向的定位能力是由听觉的人对声音方向的定位能力是由听觉的定位特性决定的。定位特性决定的。人耳对声音的方位非常敏感，能在大人耳对声音的方位非常敏感，能在大约约1度的范围内辨知声音的方向，同时还可度的范围内辨知声音的方向，同时还可以判断声源离人耳的距离。以判断声源离人耳的距离。在测试环境中，听众坐在具有同样构在测试环境中，听众坐在具有同样构造的两

7、个扬声器前面，尽管两扬声器的声造的两个扬声器前面，尽管两扬声器的声音幅度相同，但听者定位右边扬声器的声音幅度相同，但听者定位右边扬声器的声音更强，这是因为左边扬声器传输有接近音更强，这是因为左边扬声器传输有接近15ms的时延。的时延。当时延超过当时延超过50ms时，听众感知到来自时，听众感知到来自左边和右边扬声器两个不同声音事件。左边和右边扬声器两个不同声音事件。为弥补这一延时产生的影响，需增加为弥补这一延时产生的影响，需增加该延时声道的幅度。该延时声道的幅度。设计立体声设备和指导放声布局及聆设计立体声设备和指导放声布局及聆听方法时应充分考虑这一点。听方法时应充分考虑这一点。2听觉的频率特性听

8、觉的频率特性声音信号的频率范围为声音信号的频率范围为20Hz20kHz。单一频率的信号称为分量信号，由许多单一频率的信号称为分量信号，由许多不同频率的信号组成的是复合信号。不同频率的信号组成的是复合信号。它们的电平及频谱分布虽有差异，但有它们的电平及频谱分布虽有差异，但有着相同的规律。着相同的规律。人类听觉对声音频率的感觉不仅表现人类听觉对声音频率的感觉不仅表现为音调的高低，而且在声音强度相同条件为音调的高低，而且在声音强度相同条件下对声音主观感觉的强弱也是不同的，即下对声音主观感觉的强弱也是不同的，即人类听觉的频率响应不是平坦的。人类听觉的频率响应不是平坦的。由于外耳具有一定长度的耳道，会

9、对由于外耳具有一定长度的耳道，会对某段频率产生共鸣。某段频率产生共鸣。有些频率的声音人耳感觉很灵敏，很有些频率的声音人耳感觉很灵敏，很小的声强就能感觉到，而频率很低的声音小的声强就能感觉到，而频率很低的声音必须强度很高人耳才能感觉得到，这个频必须强度很高人耳才能感觉得到，这个频率段大约在率段大约在35kHz。因此人耳听到声音的响度与声音的频因此人耳听到声音的响度与声音的频率有关。率有关。描述响度、声音声压级以及声源频率描述响度、声音声压级以及声源频率之间的关系曲线称为等响度曲线。之间的关系曲线称为等响度曲线。等响度曲线如图等响度曲线如图2-6所示，它是将听起所示，它是将听起来与来与1kHz纯音

10、（基音）响度相同的各频率纯音（基音）响度相同的各频率的声音的声压求得后用曲线连接起来的结的声音的声压求得后用曲线连接起来的结果，又叫做响度的灵敏度曲线。果，又叫做响度的灵敏度曲线。图图2-6 2-6 等响度特性曲线等响度特性曲线等响度曲线与人的年龄以及人耳结构等响度曲线与人的年龄以及人耳结构有关，从对该曲线分析得出如下结论。有关，从对该曲线分析得出如下结论。（1）响度与人耳处的声压级有关。声压级）响度与人耳处的声压级有关。声压级提高，相应的响度随之增大。提高，相应的响度随之增大。（2）在）在45kHz附近的声音听起来比较响，附近的声音听起来比较响，这是因为外耳道对其产生共鸣。这是因为外耳道对

11、其产生共鸣。（3）图中的等响度线越向上越趋向平直，）图中的等响度线越向上越趋向平直，下部曲线变化较大。说明当声压级很高时，下部曲线变化较大。说明当声压级很高时，不同频率下的声音差不多一样响，基本上不同频率下的声音差不多一样响，基本上与声音的频率无关。当声压级降低，等响与声音的频率无关。当声压级降低，等响度曲线低频区的变化率要大于高频区变化度曲线低频区的变化率要大于高频区变化率，也就是在此区域内，声压级略有变化，率，也就是在此区域内，声压级略有变化，其低频声音响度级会有明显地变化。其低频声音响度级会有明显地变化。（4）等响度曲线中的下方虚线以下区域为）等响度曲线中的下方虚线以下区域为不可闻区，它

12、表示虽然人耳处存在一定的不可闻区，它表示虽然人耳处存在一定的声压，却感觉不到。对于频率为声压，却感觉不到。对于频率为200Hz的的声音，只有它的声压级高于声音，只有它的声压级高于22dB人耳才能人耳才能听到。听到。3听觉灵敏度听觉灵敏度听觉灵敏度是指人耳对声压、频率及听觉灵敏度是指人耳对声压、频率及方位的微小变化的判断能力。方位的微小变化的判断能力。当声压发生变化时，人们听到的响度当声压发生变化时，人们听到的响度会有变化。会有变化。例如声压级在例如声压级在50dB以上时，人耳能分辨以上时，人耳能分辨出的最小声压级差约为出的最小声压级差约为1dB；而声压级小于；而声压级小于40dB时，要变化时

13、，要变化13dB才能觉察出来。才能觉察出来。当频率发生变化时，人们听到的音调当频率发生变化时，人们听到的音调会有变化。会有变化。例如频率为例如频率为1 000Hz、声压级为、声压级为40dB的声音，变化的声音，变化3Hz就能觉察出来，当频率就能觉察出来，当频率超过超过1 000Hz、声压超过、声压超过40dB时，人耳能时，人耳能觉察到的相对频率变化范围（觉察到的相对频率变化范围（f/f）约为）约为0.003。听觉灵敏度还与年龄有关。听觉灵敏度还与年龄有关。研究结果表明：对于纯音，人耳能分研究结果表明：对于纯音，人耳能分辨出辨出280个声压层次和个声压层次和1 400个频率层次。个频率层次。对于

14、复音，人耳只能分辨对于复音，人耳只能分辨7种不同的响种不同的响度层次和度层次和7种不同的音调，共种不同的音调，共49种响度和音种响度和音调的组合。调的组合。这个数字颇为接近我们在语言中可觉这个数字颇为接近我们在语言中可觉察到的音素数。察到的音素数。在高保真音响系统中，如果能将声音在高保真音响系统中，如果能将声音的畸变控制在人耳无法觉察的范围内便可的畸变控制在人耳无法觉察的范围内便可以获得高保真的主观听觉效果。以获得高保真的主观听觉效果。4掩蔽效应掩蔽效应人耳的另一个听觉特性是掩蔽效应。人耳的另一个听觉特性是掩蔽效应。所谓掩蔽效应，即一个声音的存在会所谓掩蔽效应，即一个声音的存在会影响人耳对其

15、他声音的听觉能力，在听觉影响人耳对其他声音的听觉能力，在听觉效果上似乎一个声音掩蔽了另一个声音。效果上似乎一个声音掩蔽了另一个声音。（1）频域掩蔽效应）频域掩蔽效应（2）时域掩蔽效应）时域掩蔽效应类类别别名名称称掩蔽出现时间掩蔽出现时间掩蔽持续时间掩蔽持续时间效效果果同时掩蔽同时掩蔽同时掩蔽同时掩蔽与掩蔽声同时与掩蔽声同时同时掩声同时掩声在掩蔽声持续时间内，在掩蔽声持续时间内，对被掩蔽声的掩盖最为对被掩蔽声的掩盖最为明显明显非同时掩蔽非同时掩蔽超前掩蔽超前掩蔽在掩蔽声之前在掩蔽声之前20ms20ms由于人耳的积累效应，由于人耳的积累效应，被掩蔽声尚未被听到，被掩蔽声尚未被听到，掩蔽声已经

16、出现，其掩掩蔽声已经出现，其掩盖效果很差盖效果很差滞后掩蔽滞后掩蔽在掩蔽声之后在掩蔽声之后100ms100ms由于人耳的存储效应，由于人耳的存储效应，掩蔽声虽已消失，掩蔽掩蔽声虽已消失，掩蔽效应仍然存在效应仍然存在表表2-l2-l 时域掩蔽效应的分类及效果时域掩蔽效应的分类及效果5声波的特性及听觉的主观感受声波的特性及听觉的主观感受生理声学认为，听觉形成的基本机理可生理声学认为，听觉形成的基本机理可以这样描述：由声源振动发出的声波，通过以这样描述：由声源振动发出的声波，通过外耳道、鼓膜和小听骨的传导，引起耳蜗中外耳道、鼓膜和小听骨的传导，引起耳蜗中淋巴液和基底膜的振动，并转换成电信号，淋巴液

17、和基底膜的振动，并转换成电信号，由神经元编码形成脉冲序列，通过神经系统由神经元编码形成脉冲序列，通过神经系统传递到大脑皮层中的听觉中枢，产生听觉，传递到大脑皮层中的听觉中枢，产生听觉，感受到声音。感受到声音。由人耳和大脑所组成的听觉系统是一由人耳和大脑所组成的听觉系统是一个奇妙的机构。个奇妙的机构。它能够接收频率为它能够接收频率为20Hz20kHz的音的音频；可以感受声压为频；可以感受声压为21052102帕的帕的声波；具有判别响度、音调、音色和方位声波；具有判别响度、音调、音色和方位的本领；还能从本底噪声环境中听出某些的本领；还能从本底噪声环境中听出某些需要的声音需要的声音至今还没有一种物理

18、仪器至今还没有一种物理仪器能有人类听觉机构那样惊人的特性。能有人类听觉机构那样惊人的特性。听觉的这些基本特性决定着人们对声听觉的这些基本特性决定着人们对声音的主观感受。音的主观感受。（1）可闻声）可闻声（2）听阈和痛阈）听阈和痛阈声音的数字化是指将采集到的声音用声音的数字化是指将采集到的声音用数字的方式进行存储、处理、输出以及传数字的方式进行存储、处理、输出以及传输。输。由于数字录音和发行几乎不受外界的由于数字录音和发行几乎不受外界的干扰，信号损失小，这种特性不仅方便用干扰，信号损失小，这种特性不仅方便用户对音频进行大量的快速复制、传播，同户对音频进行大量的快速复制、传播，同时，这种特性也为

19、广大用户自己制作音频时，这种特性也为广大用户自己制作音频作品，确立了先决条件。作品，确立了先决条件。所以，数字音频在复制和传播等方面所以，数字音频在复制和传播等方面和模拟音频相比有明显的优势。和模拟音频相比有明显的优势。2.2.1 数字化概述数字化概述音频主要由模拟音频和数字音频两种音频主要由模拟音频和数字音频两种形式的音频信号表现出来。形式的音频信号表现出来。这两种形式的音频使用领域是有区别这两种形式的音频使用领域是有区别的，在技术上和应用上的特点也不同。的，在技术上和应用上的特点也不同。1模拟音频信号的特点模拟音频信号的特点模拟信号是在时间轴上连续的信号，模拟信号是在时间轴上连续的信号

20、，可以用它的某些参数去模拟其数值的大小。可以用它的某些参数去模拟其数值的大小。例如，我们面对话筒演唱或讲话时，例如，我们面对话筒演唱或讲话时，声波会使话筒的声膜振动，在动圈式话筒声波会使话筒的声膜振动，在动圈式话筒中，声膜是与处于磁场中的线圈连在一起中，声膜是与处于磁场中的线圈连在一起的，声膜振动时线圈也随之振动。的，声膜振动时线圈也随之振动。根据电磁感应原理，线圈在磁场中振根据电磁感应原理，线圈在磁场中振动时会产生感应电流，这就将声音的波动动时会产生感应电流，这就将声音的波动转变成了电信号。转变成了电信号。感应电流的变化频率和幅度是与声音感应电流的变化频率和幅度是与声音的频率和幅度相对应的，

21、话筒输出的这种的频率和幅度相对应的，话筒输出的这种电信号就是模拟信号。电信号就是模拟信号。用信号的幅度值来模拟音量的高低，用信号的幅度值来模拟音量的高低，音量高，信号的幅度值就大。音量高，信号的幅度值就大。用信号的频率模拟音调的高低，音调用信号的频率模拟音调的高低，音调高，信号的频率就高。高，信号的频率就高。因此，模拟信号具有直观、形象的特点。因此，模拟信号具有直观、形象的特点。但是模拟信号精度低，表示的范围小，但是模拟信号精度低，表示的范围小，且容易受到干扰。且容易受到干扰。图图2-7 2-7 受到干扰的模拟信号示意图受到干扰的模拟信号示意图2数字信号的特点数字信号的特点为了克服上述模拟信

22、号的缺点，可以为了克服上述模拟信号的缺点，可以将模拟信号转换成数字信号，并以数字的将模拟信号转换成数字信号，并以数字的形式进行处理、传输或存储等。形式进行处理、传输或存储等。数字信号的特点是代表信息的物理量数字信号的特点是代表信息的物理量以一系列数字组的形式来表示，它在时间以一系列数字组的形式来表示，它在时间轴上是不连续的。轴上是不连续的。以一定的时间间隔对模拟信号取样，以一定的时间间隔对模拟信号取样，再将取样值用数字组来表示，可见数字信再将取样值用数字组来表示，可见数字信号在时间轴上是离散的。号在时间轴上是离散的。因为幅度值是由有限个状态数来表示的，因为幅度值是由有限个状态数来表示的，所以表

23、示幅度值的数字量也是离散的。所以表示幅度值的数字量也是离散的。模拟信号与数字信号的关系如图模拟信号与数字信号的关系如图2-8所示。所示。图图2-8 2-8 模拟信号与数字信号的关系示意图模拟信号与数字信号的关系示意图如图如图2-9所示，数字脉冲信号具有较强所示，数字脉冲信号具有较强的抗干扰能力，即使信号受到一定程度的的抗干扰能力，即使信号受到一定程度的干扰，只要可以区分出信号电平的高低或干扰，只要可以区分出信号电平的高低或是脉冲信号的有无，就能正确地识别所表是脉冲信号的有无，就能正确地识别所表示的数字示的数字1或数字或数字0，甚至较大的噪声和干，甚至较大的噪声和干扰也不会有任何影响。扰也不会

24、有任何影响。这是因为数字脉冲只有这是因为数字脉冲只有0和和1两个值。两个值。振幅性的干扰可以通过限幅加以消除。振幅性的干扰可以通过限幅加以消除。图图2-9 2-9 受到干扰的数字脉冲信号示意图受到干扰的数字脉冲信号示意图数字信号的另一个优点是经过处理、数字信号的另一个优点是经过处理、变换或传输后，干扰杂波不会积累。变换或传输后，干扰杂波不会积累。处理数字信号的电路具有一致性好、处理数字信号的电路具有一致性好、互换性强、稳定性高的特点，便于大规模互换性强、稳定性高的特点，便于大规模集成化。集成化。数字信号的波形简单，物理上容易实数字信号的波形简单，物理上容易实现，因而它也便于存储、延迟和变换。

25、现，因而它也便于存储、延迟和变换。通过改变存储器的读出顺序，又可以通过改变存储器的读出顺序，又可以在空间坐标轴上对数字信号实现各种空间在空间坐标轴上对数字信号实现各种空间变换。变换。模拟信号数字化中的主要问题首先是模拟信号数字化中的主要问题首先是数字信号的数码率（即单位时间处理的比数字信号的数码率（即单位时间处理的比特数）高，占用频带宽。特数）高，占用频带宽。在很多情况下需要进行压缩处理，否在很多情况下需要进行压缩处理，否则很难进行处理和传输。则很难进行处理和传输。其次是数字信号在记录、播放、存储其次是数字信号在记录、播放、存储或传输等处理过程中会产生数字信号的丢或传输等处理过程中会产生数字信

26、号的丢失或错误，必须利用一些方法进行检错和失或错误，必须利用一些方法进行检错和纠错，从而消除信号失落和误码的影响。纠错，从而消除信号失落和误码的影响。3编码过程（数字化）编码过程（数字化）将时间域上幅度连续变化的声音变换将时间域上幅度连续变化的声音变换为脉冲数据的过程称为数字化。为脉冲数据的过程称为数字化。此脉冲数据可由按一定规律构成的数此脉冲数据可由按一定规律构成的数码表示。码表示。声音数字化是经过对连续变化的声音声音数字化是经过对连续变化的声音采取采样、量化、编码等环节形成二进制采取采样、量化、编码等环节形成二进制脉冲序列。脉冲序列。用高、低两种电平表示脉冲序列中的基用高、低两种电平表示脉

27、冲序列中的基本单元称之为比特（本单元称之为比特（bit），其中高电平赋为），其中高电平赋为1而低电平为而低电平为0，将，将l、0称为比特（称为比特（bit）值。）值。如采用如采用8个比特为一组表示某个时刻的幅个比特为一组表示某个时刻的幅值，共有值，共有256种组合表示种组合表示256个幅度。个幅度。此时可用一系列的数码来替代连续变化的此时可用一系列的数码来替代连续变化的声音，称这个变换为模数变换（声音，称这个变换为模数变换（Analogue Digital Conversion，ADC），常用），常用A/D简化表简化表示。示。当需要转换回连续变化的幅值时，须经当需要转换回连续变化的幅值时，须经

28、过译码后方可恢复，这个变换为数模变换过译码后方可恢复，这个变换为数模变换（Digital Analogue Conversion，DAC），常），常用用D/A简化表示。简化表示。语音的语音的A/D与与D/A变换又称为语音编变换又称为语音编码。码。其系统原理框图如图其系统原理框图如图2-10所示。所示。图图2-10 2-10 模拟信号数字处理系统方框图模拟信号数字处理系统方框图（1）码字）码字数字信号一般采用二进制码，对于数字信号一般采用二进制码，对于Q个量化电平，可以用个量化电平，可以用k位二进制码来表示，位二进制码来表示，称其中每一种组合为一个码字。称其中每一种组合为一个码字。在点对点之间

29、通信或短距离通信中，在点对点之间通信或短距离通信中，采用采用k=7位码已基本能满足质量要求。位码已基本能满足质量要求。而对于干线远程的全网通信，一般要而对于干线远程的全网通信，一般要经过多次转接，有较高的质量要求，目前经过多次转接，有较高的质量要求，目前国际上多采用国际上多采用8位编码位编码PCM设备。设备。（2）码型）码型码型指的是把量化后的所有量化级，码型指的是把量化后的所有量化级，按其量化电平的大小次序排列起来，并列按其量化电平的大小次序排列起来，并列出各对应的码字，这种对应关系的整体就出各对应的码字，这种对应关系的整体就称为码型。称为码型。在在PCM中常用的码型有自然二进制码、中常用

30、的码型有自然二进制码、折叠二进制码和反射二进制码（又称格雷折叠二进制码和反射二进制码（又称格雷码）。码）。如以如以4位二进制码字为例，则上述位二进制码字为例，则上述3种种码型的码字如表码型的码字如表2-2所示。所示。电平范围电平范围量化电平方案量化电平方案1 1量化电平方案量化电平方案2 2量化级编号量化级编号自然二进制码自然二进制码折叠二进制码折叠二进制码反射二进制码反射二进制码7 78 87.57.58 80 00000000001110111000000006 67 76.56.57 71 10001000101100110000100015 56 65.55.56 62 2001000

31、1001010101001100114 45 54.54.55 53 30011001101000100001000103 34 43.53.54 44 40100010000110011011001102 23 32.52.53 35 50101010100100010011101111 12 21.51.52 26 60110011000010001010101010 01 10.50.51 17 70111011100000000010001000 01 10.50.50 08 81000100010001000110011001 12 21.51.51 19 9100110011001

32、1001110111012 23 32.52.52 210101010101010101010111111113 34 43.53.53 311111011101110111011111011104 45 54.54.54 412121100110011001100101010105 56 65.55.55 5131311011101110l110l101110116 67 76.56.56 614141110111011101110100110017 78 87.57.57 71515111111111111111110001000表表2-22-2 4 4位二进制代码及编码方案位二进制代码及

33、编码方案（3）码位的安排）码位的安排码位数的选择，不仅关系到通信质量码位数的选择，不仅关系到通信质量的好坏，而且还涉及到设备的复杂程度。的好坏，而且还涉及到设备的复杂程度。码位数的多少，决定了量化分层（量码位数的多少，决定了量化分层（量化级）的多少。化级）的多少。目前国际上普遍采用目前国际上普遍采用8位非线性编码。位非线性编码。例如例如PCM 30/32路终端机中最大输入路终端机中最大输入信号幅度对应信号幅度对应4 096个量化单位（最小的量个量化单位（最小的量化间隔称为一个量化单位），在化间隔称为一个量化单位），在4 096单位单位的输入幅度范围内，被分成的输入幅度范围内，被分成256个量

34、化级，个量化级，因此须用因此须用8位码表示每一个量化级。位码表示每一个量化级。2.2.2 模模/数变换数变换模拟信号的数字化过程是取样、量化模拟信号的数字化过程是取样、量化和编码的过程，这个变换过程按照图和编码的过程，这个变换过程按照图2-11所示框图内的各环节完成，该系统称之为所示框图内的各环节完成，该系统称之为PCM（Pulse Code Modulation）即脉冲编）即脉冲编码调制。码调制。图图2-11 PCM2-11 PCM结构图结构图它是它是“数字化数字化”的最基本的技术，模的最基本的技术，模拟信号正是通过拟信号正是通过PCM而变换成数字信号的，而变换成数字信号的，其具体过程是

35、：通过抽样、量化和编码其具体过程是：通过抽样、量化和编码3个个步骤，用若干代码表示模拟形式的信息信步骤，用若干代码表示模拟形式的信息信号（如图像、声音信号），再用脉冲信号号（如图像、声音信号），再用脉冲信号表示这些代码来进行传输表示这些代码来进行传输/存储。存储。1抽样抽样抽样又称采样或取样。抽样又称采样或取样。把声音在时间上连续变化的信号波形把声音在时间上连续变化的信号波形每隔一定时间间隔观察一次，造成具有时每隔一定时间间隔观察一次，造成具有时间上不连续的分散的观察值，称此观察值间上不连续的分散的观察值，称此观察值为样本值或采样值，用这些样本值替换为为样本值或采样值，用这些样本值替换为原来

36、连续信号波形的过程叫做采样。原来连续信号波形的过程叫做采样。采样的过程如图采样的过程如图2-12所示。所示。图图2-12 2-12 采样保持示意图采样保持示意图2量化量化量化是在取样后将幅度轴上仍然是连量化是在取样后将幅度轴上仍然是连续的样本信号变换成由一定间距数表示的续的样本信号变换成由一定间距数表示的有限样本值（离散信号）的过程。有限样本值（离散信号）的过程。这一过程是通过人为地将信息信号幅这一过程是通过人为地将信息信号幅值连续变化的动态范围划分成若干量化等值连续变化的动态范围划分成若干量化等级（量化级差级（量化级差），每一等级用一个电平），每一等级用一个电平值表示，然后用四舍五入的办法

37、将无限个值表示，然后用四舍五入的办法将无限个不同的信号幅值分别用若干个等级电平值不同的信号幅值分别用若干个等级电平值表示而实现的。表示而实现的。量化是按四舍五入对采样后的样本值量化是按四舍五入对采样后的样本值进行计量的，见图进行计量的，见图2-13所示。所示。图图2-13 2-13 样本值量化样本值量化量化级差量化级差越小，则越小，则D/A变换后的声变换后的声音越接近输入声音，两者之差将形成噪声，音越接近输入声音，两者之差将形成噪声，由于它的造成是量化带来的，故称为量化由于它的造成是量化带来的，故称为量化噪声，即噪声，即A/D变换器产生的噪声。变换器产生的噪声。量化级差量化级差越小，要求编码

38、时采用越越小，要求编码时采用越多位的比特表示样本值。多位的比特表示样本值。A/D变换器满幅度为变换器满幅度为10Vp-p（峰（峰-峰峰值），当采用值），当采用8位会有位会有256个间距，每个量个间距，每个量化级差化级差为为10V256=0.039V=39mV；而；而16位则有位则有65 536个级差，量化级差个级差，量化级差缩小缩小为为0.152 6mV，使样本值更逼近于输入信号。，使样本值更逼近于输入信号。量化噪声即信噪比量化噪声即信噪比S/N为为 S/N=6.02N+1.76dB 式中，式中，N为量化比特即编码采用的比为量化比特即编码采用的比特位数，如上文的特位数，如上文的N=8、N=16

39、。3编码编码经过量化后的信号虽然是数字信号，经过量化后的信号虽然是数字信号，但这种数字信号一般是多进制信号，不能但这种数字信号一般是多进制信号，不能直接用于传输，必须对它进行编码，使其直接用于传输，必须对它进行编码，使其成为更适于传输的数字信号。成为更适于传输的数字信号。这里的编码一般指的是用一组二进制这里的编码一般指的是用一组二进制代码来表示量化值的大小。代码来表示量化值的大小。设量化电平总数为设量化电平总数为Q，则二进制编码位，则二进制编码位数取数取2nQ，才可能不重复编码，为了提高，才可能不重复编码，为了提高编码效率，降低传码率，一般取编码效率，降低传码率，一般取2n=Q。图图2-14

40、 2-14 逐级比较式逐级比较式A/DA/D变换器变换器设设备备名名称称采样脉冲频率采样脉冲频率（kHzkHz）量化比特数量化比特数纠纠错错方方式式调调制制方方式式CDCD播放机播放机44.144.11616位线性位线性CIRCCIRCEFMEFM（8 81414）DATDAT磁带录音机磁带录音机3232、44.144.1、48481616位线性，位线性，1212位非位非线性线性CIRCCIRC8 81010调制调制MDMD多轨录音机多轨录音机44.144.1ATRACATRAC压缩压缩ACIRCACIRCEFMEFM（8 81414）数字调音台数字调音台DA7DA744.1

41、44.1、48482424位位音频工作站音频工作站3232、44.144.1、484816/19/21/2416/19/21/24位位表表2-32-3 常用数字音频设备信号格式常用数字音频设备信号格式2.2.3 数数/模变换模变换1数数/模（模（D/A）变换的实现）变换的实现播放机获取到的码流经译码后得到样播放机获取到的码流经译码后得到样本值，可通过截止频率为输入信号最高频本值，可通过截止频率为输入信号最高频率的低通滤波器恢复为连续变化的模拟声率的低通滤波器恢复为连续变化的模拟声音，这个过程就是数模（音，这个过程就是数模（D/A）变换。）变换。D/A变换的实现可将恢复的样本值经过变换的实现可

42、将恢复的样本值经过截止频率为截止频率为fs/2的低通滤波器或将数码直接的低通滤波器或将数码直接通过电路得到模拟声音信号。通过电路得到模拟声音信号。D/A变换器的变换特性如图变换器的变换特性如图2-15所示。所示。图图2-15 D/A2-15 D/A变换器的变换特性变换器的变换特性图图2-16 D/A2-16 D/A变换器变换器图图2-17 2-17 倒倒T T型电阻型电阻D/AD/A变换器变换器2超采样变换超采样变换采用低通滤波器得到模拟声音信号的采用低通滤波器得到模拟声音信号的方法会涉及到低通滤波器制作。方法会涉及到低通滤波器制作。滤波器制作简单，但在滤波器制作简单，但在A/D变换时需变换

43、时需提高采样频率值，带来数据速率的增大。提高采样频率值，带来数据速率的增大。若使用若使用fs=2fmax这时为确保声音信号不这时为确保声音信号不失真，低通滤波器的过渡带很窄，无论结失真，低通滤波器的过渡带很窄，无论结构或调整都很复杂。构或调整都很复杂。可在未通过低通滤波器之前将得到的可在未通过低通滤波器之前将得到的样本值进行超采样变换，然后再经过低通样本值进行超采样变换，然后再经过低通滤波器。滤波器。如如CD播放机将得到的样本值播放机将得到的样本值44.1kHz的采样频率提高的采样频率提高4倍为倍为176.4kHz，低通滤，低通滤波器通带为波器通带为022.05kHz，而抑制最低频，而抑制最低

44、频率由率由44.1kHz2205kHz=22.05kHz而高而高至至176.4kHz22.05kHz=154.35kHz，过滤，过滤带加宽使得低通滤波器结构变得简单。带加宽使得低通滤波器结构变得简单。方法是在原相邻的两个样本值之间插方法是在原相邻的两个样本值之间插入入3个新样本值，图个新样本值，图2-18（a）给出他们之）给出他们之间的关系。间的关系。图图2-18 2-18 超采样变换器超采样变换器声音的技术表现主要是指声音在采集、声音的技术表现主要是指声音在采集、处理、输出的整个过程中，声音的采样频率、处理、输出的整个过程中，声音的采样频率、取样大小和声道数等技术特性。取样大小和声道数等技

45、术特性。1采样频率采样频率采样频率是将模拟声音波形转换成数采样频率是将模拟声音波形转换成数字音频时，每秒钟对声音波形进行采样的字音频时，每秒钟对声音波形进行采样的次数。次数。采样频率越高，声音的质量越好，保采样频率越高，声音的质量越好，保真度也就越高，但占用的信息数据量也就真度也就越高，但占用的信息数据量也就越大。越大。目前通用的标准采样频率有目前通用的标准采样频率有5kHz、11.025kHz、22.05kHz、44.1kHz和和48kHz。为了使采样后不连续的分散信号更接近为了使采样后不连续的分散信号更接近于原连续信号，可将采样脉冲频率提高到于原连续信号，可将采样脉冲频率提高到96kHz

46、。2量化位数量化位数量化位数即量化精度，量化位数越多，量化位数即量化精度，量化位数越多，量化精度越高，它决定了模拟信号数字化以量化精度越高，它决定了模拟信号数字化以后的动态范围。后的动态范围。由于计算机按字节运算，一般的量化位由于计算机按字节运算，一般的量化位数为数为8位和位和16位。量化位数为位。量化位数为8，那么采样信，那么采样信号就具有号就具有256级（级（28=256）。）。量化位数越多，信号的动态范围越大，量化位数越多，信号的动态范围越大，数字化后的音频信号就越可能接近原始信数字化后的音频信号就越可能接近原始信号，但所占用的存储空间也越大。号，但所占用的存储空间也越大。样本大小是用

47、每个声音样本的位数样本大小是用每个声音样本的位数（bit/s）表示的，它反映度量声音波形幅）表示的，它反映度量声音波形幅度的精度。度的精度。例如，每个声音样本用例如，每个声音样本用16bit（2B）表）表示，测得的声音样本值是在示，测得的声音样本值是在065 535的范的范围里，它的精度就是输入信号的围里，它的精度就是输入信号的1/65 536。样本位数的大小影响到声音的质量。样本位数的大小影响到声音的质量。位数越多，声音的质量越高，而需要位数越多，声音的质量越高，而需要的存储空间也越多；位数越少，声音的质的存储空间也越多；位数越少，声音的质量越低，需要的存储空间越少。量越低，需要的存储空间越

48、少。采样精度的另一种表示方法是信号噪采样精度的另一种表示方法是信号噪声比，简称为信噪比（声比，简称为信噪比（SNR），并用下式），并用下式计算计算SNR=10 lg(Vsignal)2/(Vnoise)2=20 lg(Vsignal/Vnoise)其中，其中，Vsignal表示信号电压，表示信号电压，Vnoise表表示噪声电压；示噪声电压；SNR的单位为分贝（的单位为分贝（dB）。）。假设假设Vnoise=1，采样精度为，采样精度为1bit表示表示Vsignal=21，它的信噪比，它的信噪比SNR=6dB。假设假设Vnoise=1，采样精度为，采样精度为16bit表示表示Vsignal=216

49、，它的信噪比，它的信噪比SNR=96dB。3声道数声道数声道数是指所使用的声音通道的个数，声道数是指所使用的声音通道的个数，它表明声音记录只产生一个波形还是两个波它表明声音记录只产生一个波形还是两个波形，也就是单声道或是双声道。形，也就是单声道或是双声道。双声道也称立体声，它比单声道听起来双声道也称立体声，它比单声道听起来更为丰满，但它占用的存储空间也是单声道更为丰满，但它占用的存储空间也是单声道的两倍。的两倍。现在现在DVD支持的杜比数码（支持的杜比数码（AC-3编码解编码解码）就提供码）就提供5.1声道的环绕声，分别是左右声声道的环绕声，分别是左右声道（前置）、左右环绕声道（后置）、中置

50、道（前置）、左右环绕声道（后置）、中置声道（前置）和超重低音声道（声道（前置）和超重低音声道（SW），通常），通常被称为被称为0.1声道。声道。4数据速率数据速率数据速率既与计算机中实时传输信息数据速率既与计算机中实时传输信息有关，又与计算机的存储容量有关。有关，又与计算机的存储容量有关。数据速率可用以下公式计算。数据速率可用以下公式计算。数据速率数据速率=采样频率采样频率量化位数量化位数声声道数（道数（bit/s）质量质量采样频率采样频率/kHz/kHz样本精度样本精度/（bit/sbit/s）单声道单声道/立体立体声声数据率（未压缩）数据率（未压缩）/（kbit/skbit/s）频率范围

展开阅读全文