1、1/ 1176:21第三章 数字音频技术 3.1 3.1 音频技术及特性音频技术及特性 3.2 3.2 音频数字化音频数字化 3.3 3.3 数字音频质量及格式数字音频质量及格式 3.4 3.4 数字音频的编辑技术数字音频的编辑技术 3.5 3.5 数字音频技术应用数字音频技术应用 3.63.6 游戏游戏3D3D音效音效2/ 1176:21第三章 数字音频技术基础学习目标:(1)了解音频的特性及其相关概念(2)了解模拟音频处理技术的设备及主要功能(3)掌握音频数字化的过程(4)熟悉常见数字音频格式,并进行比较。(5)了解常见的数字音频编辑软件,了解基本性能。3/ 1176:21 3.1 3.1
2、 音频技术及特性音频技术及特性 3.1.13.1.1音频的概念及特性音频的概念及特性 3.1.23.1.2模拟音频记录设备及特性模拟音频记录设备及特性 3.1.33.1.3模拟音频处理设备模拟音频处理设备第三章 数字音频技术基础4/ 1176:213.1.1音频的概念及特性 物理学上物理学上,声音被看成一种波动的,声音被看成一种波动的能量,即声波。同时在物理学上,能量,即声波。同时在物理学上,一般用声音的三个基本特性来描述一般用声音的三个基本特性来描述声音,即声音,即频率频率、振幅振幅和和波形波形。 生理学上生理学上,声音是指声波作用于听,声音是指声波作用于听觉器官所引起的一种主观感觉。如觉器
3、官所引起的一种主观感觉。如响度响度、音调音调、音色音色和音长等。和音长等。 在物理学上声音的三个基本特性:在物理学上声音的三个基本特性:频率、振幅和波形,对应到人耳的频率、振幅和波形,对应到人耳的主观感觉就是主观感觉就是音调音调、响度响度和和音色音色。5/ 1176:213.1.1音频的概念及特性 所谓频率即发声物体在振动时,单位时间内的振动的次数,单所谓频率即发声物体在振动时,单位时间内的振动的次数,单位为赫兹(位为赫兹(HzHz)。)。 一般说来,物体一般说来,物体音调音调高低取决于高低取决于松紧松紧、长短长短、厚细厚细。衡量。衡量音调音调用用音阶音阶例如:儿童说话的音调比成人的高,女子声
4、音的音调比男子高。在小提琴的四根弦中,最细的弦,音调最高;最粗的弦音调最低。在键盘乐器中,靠左边的音调低,靠右边的音调高。 频率频率 振幅振幅 波形波形音调音调 响度响度 音色音色物理学物理学生理学生理学Do re mi fa sol la si do 259 288 320 341 384 462 480 512 6/ 1176:213.1.1音频的概念及特性 振幅振幅是指发声物体在振动时偏离中心位置的幅是指发声物体在振动时偏离中心位置的幅度,代表发声物体振动时动势能的大小。振幅度,代表发声物体振动时动势能的大小。振幅是由物体振动时所产生的声音的是由物体振动时所产生的声音的能量能量或或声波压
5、声波压力力的大小所决定的。的大小所决定的。 声能或声压愈大,引起人耳主观感觉到的声能或声压愈大,引起人耳主观感觉到的响度响度也愈大。也愈大。 衡量响度用衡量响度用声强级声强级L L,单位是,单位是贝尔贝尔,分贝分贝。频率频率 振幅振幅 波形波形音调音调 响度响度 音色音色物理学物理学生理学生理学7/ 1176:213.1.1音频的概念及特性 音色音色是指声音的是指声音的纯度纯度,是声音的感觉特性,它由,是声音的感觉特性,它由声波的声波的波形形状波形形状所决定。即使某种声音它们的振所决定。即使某种声音它们的振动和频率都一样,也就是说它们的音调高低,声动和频率都一样,也就是说它们的音调高低,声音强
6、弱都相同,但它们的波形不一样,所以听起音强弱都相同,但它们的波形不一样,所以听起来就会有明显的区别。来就会有明显的区别。 例如,说话是一个声音;例如,说话是一个声音; 小提琴是一种声音,小提琴是一种声音, 钢琴又是另一种声音。钢琴又是另一种声音。 频率频率 振幅振幅 波形波形音调音调 响度响度 音色音色物理学物理学生理学生理学8/ 1176:213.1.1音频的概念及特性 音色音色又称音品,又称音品,音质音质。 基音基音是物体振动时产生的是物体振动时产生的最低音调最低音调,倍音倍音是比基是比基音较高的音调,又称音较高的音调,又称泛音泛音 音色取决于基音和泛音,即音色取决于基音和泛音,即频谱频谱
7、,也和波形、声,也和波形、声压、声音的时间特性有关。压、声音的时间特性有关。 例如,钢琴的基音可以高达例如,钢琴的基音可以高达4186Hz,4186Hz,而倍音可以高达而倍音可以高达16KHz16KHz。 频率频率 振幅振幅 波形波形音调音调 响度响度 音色音色物理学物理学生理学生理学9/ 1176:21基音与泛音基音与泛音 小提琴整根弦的振动产生了最主要的频率,小提琴整根弦的振动产生了最主要的频率,称之为称之为基音基音,而弦长的二分之一、三分之,而弦长的二分之一、三分之一、四分之一等处的振动则产生了一些次一、四分之一等处的振动则产生了一些次要的频率,称之为要的频率,称之为泛音泛音。 如果一个
8、物体振动所发出的泛音为基音的如果一个物体振动所发出的泛音为基音的整数倍整数倍,这个音就会具有清晰可辨的音高,这个音就会具有清晰可辨的音高,称之为称之为乐音乐音,如钢琴,小提琴等发出的都,如钢琴,小提琴等发出的都是乐音;是乐音; 如果泛音是基音的如果泛音是基音的非整数倍非整数倍,这个音就不,这个音就不具备清晰可辨的音高,称之为具备清晰可辨的音高,称之为噪音噪音,如汽,如汽车发动机、计算机风扇等发出的都是噪音。车发动机、计算机风扇等发出的都是噪音。 10/ 1176:213.1.1音频的概念及特性 声音的分类声音的分类按照人耳可听到的频率范围,声音可分为按照人耳可听到的频率范围,声音可分为 超声、
9、超声、 次声、次声、 正常声。正常声。人耳可感受声音频率的范围介于人耳可感受声音频率的范围介于20202000020000赫兹间。赫兹间。声音高于声音高于2000020000赫兹为超声波,低于赫兹为超声波,低于2020赫兹为次声波。赫兹为次声波。11/ 1176:21声音的分类(续)声音的分类(续)按照声音的来源以及作用来看,可分为人声、乐音和按照声音的来源以及作用来看,可分为人声、乐音和响音。响音。人声人声包括人物的独白、对白、旁白、歌声、啼笑,包括人物的独白、对白、旁白、歌声、啼笑,感叹等;感叹等;乐音乐音也可成为音乐,是指人类通过相关乐器演奏出也可成为音乐,是指人类通过相关乐器演奏出来的
10、声音,如影视作品中的背景声音,一般起着渲染来的声音,如影视作品中的背景声音,一般起着渲染气氛的作用;气氛的作用;响音响音是指除语言和音乐之外电影中所有声音的统称,是指除语言和音乐之外电影中所有声音的统称,如动作音响如动作音响 、自然音响、自然音响、 背景音响背景音响 、机械音响、机械音响、特殊音响。特殊音响。 12/ 1176:213.1.23.1.2模拟音频记录设备及特性模拟音频记录设备及特性最初声音信息的传播是瞬时性的,不能对声音进行存储和回放。直到爱迪生发明留声机声音才可以得以记录和重放。爱迪生的留声机记录声音利用的是“声音是由振动产生的”这一基本原理。 爱迪生留声机成品 13/ 117
11、6:21老式针式留声机的工作原理老式针式留声机的工作原理 黑色唱盘上黑色唱盘上, ,声音声音振动振动由一条由一条波浪起伏的波浪起伏的轨道或轨道或沟槽沟槽来实现来实现, ,在唱盘平面上的波动在唱盘平面上的波动, , 尽可能准确尽可能准确地再现声波的压力变化。地再现声波的压力变化。 当唱针沿着沟槽移动当唱针沿着沟槽移动, , 针尖随沟槽波动而轻微针尖随沟槽波动而轻微地振动地振动。这个振动通过机械装置传送一个膜而。这个振动通过机械装置传送一个膜而将其放大并散发在空气中。将其放大并散发在空气中。 当唱盘转动速度与录音时一样当唱盘转动速度与录音时一样, , 声音就被准确声音就被准确地恢复出来。地恢复出来
12、。14/ 1176:213.1.23.1.2模拟音频记录设备及特性模拟音频记录设备及特性声音记录技术发展史声音记录技术发展史(1 1)机械留声机机械留声机: :最早用来记录声音的是机械式留声机,最早用来记录声音的是机械式留声机,18771877年由爱迪生发明。初期的留声机只是在一个木盒年由爱迪生发明。初期的留声机只是在一个木盒中装上一只铜制的大喇叭,录放音的声波都经过这只中装上一只铜制的大喇叭,录放音的声波都经过这只喇叭传递。喇叭传递。 (2 2)钢丝录音机钢丝录音机: :最早的钢丝录音机是在最早的钢丝录音机是在18981898年,它由年,它由丹麦科学家波尔森发明的,第一次用磁性记录的方式丹麦
13、科学家波尔森发明的,第一次用磁性记录的方式进行记录。进行记录。(3 3)磁带录音机磁带录音机: :磁带录音机属磁性记录技术的再发挥,磁带录音机属磁性记录技术的再发挥,是根据电磁感应定律,用永久剩磁录音的可能性,把是根据电磁感应定律,用永久剩磁录音的可能性,把声音记录在磁带上,接着再用磁带进行还原。声音记录在磁带上,接着再用磁带进行还原。15/ 1176:223.1.23.1.2模拟音频记录设备及特性模拟音频记录设备及特性 由于音频技术的迅猛发展,不论从由于音频技术的迅猛发展,不论从机型机型的繁衍、的繁衍、结结构构的改进、的改进、功能功能的扩展、的扩展、性能性能的提高诸多方面都取的提高诸多方面都
14、取得了瞩目的进步得了瞩目的进步. . 上面显示了传统音频记录技术的演变历史,从上面显示了传统音频记录技术的演变历史,从记录记录介质介质上看历经了上看历经了石蜡(锡箔)石蜡(锡箔)记录、记录、钢丝钢丝记录、记录、磁磁带带记录;记录; 从从技术手段技术手段上来看经历了上来看经历了机械记录机械记录和和磁性记录磁性记录 从从外形外形上面来看录音设备由原来的上面来看录音设备由原来的开放式结构开放式结构变成变成后来的后来的封闭式封闭式的设备(盒式)。的设备(盒式)。16/ 1176:223.1.33.1.3模拟音频处理设备模拟音频处理设备 在对声音进行在对声音进行处理处理的过程中,除了对声音进行记录的过程
15、中,除了对声音进行记录之外,还需要对声音进行一些其它方面的调整。之外,还需要对声音进行一些其它方面的调整。 如对声音进行如对声音进行音调的调节音调的调节、多声音混合多声音混合、高中低音高中低音的调整的调整,还有诸如原始声波信号的拾取等等问题。,还有诸如原始声波信号的拾取等等问题。这就会涉及到一些其它的音频处理设备。这就会涉及到一些其它的音频处理设备。话筒(话筒(Microphone麦克风)麦克风)音箱(音箱(speaker,扬声器),扬声器)模拟调音台模拟调音台17/ 1176:22音调控制音调控制 音调控制音调控制就是人为地改变信号里就是人为地改变信号里高、低频成分高、低频成分的比重的比重,
16、以满足听者的爱好、渲染某种气氛、,以满足听者的爱好、渲染某种气氛、达到某种效果、或补偿扬声器系统及放音场所达到某种效果、或补偿扬声器系统及放音场所的音响不足。的音响不足。18/ 1176:223.1.33.1.3模拟音频处理设备模拟音频处理设备(1 1)话筒()话筒(MicrophoneMicrophone麦克风)麦克风) 话筒话筒的主要功能就是进行的主要功能就是进行声音能量的收集声音能量的收集。当出现磁。当出现磁性记录技术之后,话筒的功能就开始发生变化,除了性记录技术之后,话筒的功能就开始发生变化,除了完成声音的收集外,还要完成完成声音的收集外,还要完成声能向电能的转化声能向电能的转化(声(
17、声音信号转化成电流信号)音信号转化成电流信号), ,但是其还原声音的功能已逐但是其还原声音的功能已逐渐消失。渐消失。19/ 1176:223.1.33.1.3模拟音频处理设备模拟音频处理设备(2 2)音箱()音箱(speakerspeaker,扬声器),扬声器) 音箱音箱的主要功能就是的主要功能就是还原声音还原声音,将音频电流信号变换,将音频电流信号变换成声音信号,可以说是留声机中大喇叭另一功能的转成声音信号,可以说是留声机中大喇叭另一功能的转化。化。20/ 1176:223.1.33.1.3模拟音频处理设备模拟音频处理设备(3 3)模拟调音台)模拟调音台 调音台调音台在现代电台广播、舞台扩音
18、、音响节目制作中在现代电台广播、舞台扩音、音响节目制作中是一种经常使用的设备,它具有是一种经常使用的设备,它具有多路输入多路输入,每路的声,每路的声音信号可以单独被处理,还可以进行各种声音的音信号可以单独被处理,还可以进行各种声音的混合混合,且混合比例可调;拥有且混合比例可调;拥有多种输出多种输出。 调音台在诸多系统中起着核心作用,它既能调音台在诸多系统中起着核心作用,它既能创作立体创作立体声声、美化声音美化声音,又可,又可抑制噪声抑制噪声、控制音量控制音量,是声音艺,是声音艺术处理必不可少的一种设备。术处理必不可少的一种设备。21/ 1176:223.1.33.1.3模拟音频处理设备模拟音频
19、处理设备调音台调音台 22/ 1176:22调音台的功能调音台的功能 调音台能够放大输入通道的信号,并且调整输入声音调音台能够放大输入通道的信号,并且调整输入声音的的均衡均衡(EQEQ), ,甚至其他效果甚至其他效果 调音台可以把很多声音的调音台可以把很多声音的混合混合起来组成一个起来组成一个立体声立体声 调音台能为乐手和演员调音台能为乐手和演员“返送返送”监听监听。 调音台协助效果器为各个通道添加调音台协助效果器为各个通道添加混响混响、延迟延迟等效果等效果 调音台把各通道的声音发送给多轨录音机或者音频接调音台把各通道的声音发送给多轨录音机或者音频接口口分轨录音分轨录音 调音台能够可以让录音师
20、很方便的调音台能够可以让录音师很方便的监听监听所有通道的声所有通道的声音,并且并不干扰这些通道。音,并且并不干扰这些通道。 23/ 1176:22调音台的功能调音台的功能: :(1 1)前置放大器)前置放大器 话筒所产生的音频信号话筒所产生的音频信号是非常微弱的。而另外是非常微弱的。而另外一些设备的输出信号,一些设备的输出信号,比如合成器,音频接口比如合成器,音频接口的输出等等,他们的信的输出等等,他们的信号比话筒的信号强很多号比话筒的信号强很多倍。前置放大器将这些倍。前置放大器将这些大大小小的声音信号大大小小的声音信号调调整成相同大小电流整成相同大小电流24/ 1176:22调音台的功能调音
21、台的功能: :(2 2)参数均衡器)参数均衡器EQEQ 所谓参数均衡器是指可所谓参数均衡器是指可以控制中心频率,以控制中心频率,Q Q值值(带宽),增减频率幅(带宽),增减频率幅度大小的度大小的均衡器均衡器。 调整调整三个频段三个频段,分别是,分别是高音、中音和低音。高音、中音和低音。 其中其中中音中音的部分可以调的部分可以调整中心频率和它的频率整中心频率和它的频率增减幅度。增减幅度。 25/ 1176:22立体声原理立体声原理- -声像声像 人能够辨别人能够辨别声音的方向声音的方向是因为人可以分辨出一个声音是因为人可以分辨出一个声音分别到达两只耳朵的分别到达两只耳朵的强度和时间强度和时间。
22、例如,有只蚊子在左边,它的嗡嗡声可以没有阻挡的例如,有只蚊子在左边,它的嗡嗡声可以没有阻挡的进入到到左耳。而因为脑袋的阻挡了声音,右耳听到进入到到左耳。而因为脑袋的阻挡了声音,右耳听到的声音肯定没有左耳大。因此大脑就会进行判断,蚊的声音肯定没有左耳大。因此大脑就会进行判断,蚊子来自左边!子来自左边! 这就是人耳根据声音的强度差别判断声这就是人耳根据声音的强度差别判断声音方向。音方向。 蚊子在左面,它离左耳最近,所以左耳先听到声音而蚊子在左面,它离左耳最近,所以左耳先听到声音而右耳后听到!大脑也可以分辨这种非常右耳后听到!大脑也可以分辨这种非常细微的差别细微的差别! 人类就这样通过两只耳朵感受声
23、音的人类就这样通过两只耳朵感受声音的强度差强度差和和时间差时间差来判断来判断声音的方向声音的方向!人!人也能想象到蚊子的位也能想象到蚊子的位 置,就像自己能够看到一样,这就叫做置,就像自己能够看到一样,这就叫做声像声像。26/ 1176:22调音台的功能调音台的功能: :(3 3)控制声音的方向)控制声音的方向 两个左右声道对应左耳和右耳。两个左右声道对应左耳和右耳。当调音台左声道当调音台左声道输出的音量大输出的音量大于从右声道输出的音量,耳朵于从右声道输出的音量,耳朵就会相信声音是从左面来的。就会相信声音是从左面来的。 调音台通过调节调音台通过调节声像旋钮声像旋钮,来,来控制声音的方向。控制
24、声音的方向。 当声像旋钮调整到中间当声像旋钮调整到中间1212点钟点钟位置,发送到两个声道的音量位置,发送到两个声道的音量一样,就会认为声音来自正前一样,就会认为声音来自正前方。方。 27/ 1176:22调音台的功能调音台的功能: :(4 4)控制声音的大小)控制声音的大小 音量旋钮通常设计成长音量旋钮通常设计成长条状的推杆。它的学名条状的推杆。它的学名是是“衰减器衰减器”,俗名是,俗名是“推子推子”。 每个通道都被设置成同每个通道都被设置成同样标准的电平值。那么,样标准的电平值。那么,每个推子的每个推子的位置位置也就可也就可以反映出该通道音量的以反映出该通道音量的大致情况了。大致情况了。
25、28/ 1176:223.2 3.2 音频数字化音频数字化 3.2 3.2 音频数字化音频数字化 3.2.13.2.1数字音频数字音频 3.2.23.2.2音频的数字化过程音频的数字化过程29/ 1176:223.2 3.2 音频数字化音频数字化 模拟音频信号模拟音频信号。模拟信号在。模拟信号在时间时间或者或者空间空间维度维度上可以无限制的细分下去。模拟信号最大的特上可以无限制的细分下去。模拟信号最大的特点就是它是一种点就是它是一种连续的不间断的连续的不间断的信号。信号。 对音频模拟信号进行处理时,一般采用模拟的对音频模拟信号进行处理时,一般采用模拟的技术手段。电器元件是将连续的原始信号的变技
26、术手段。电器元件是将连续的原始信号的变化形式化形式原封不动的原封不动的传递给下一单元,这就是模传递给下一单元,这就是模拟的处理方式。拟的处理方式。30/ 1176:223.2.13.2.1数字音频数字音频 数字音频数字音频是指用一连串二进制数据来保存的声音信号。是指用一连串二进制数据来保存的声音信号。这种声音信号在存储和电路传输及处理过程中,不再这种声音信号在存储和电路传输及处理过程中,不再是连续的信号,而是是连续的信号,而是离散的离散的。31/ 1176:223.2.23.2.2音频的数字化过程音频的数字化过程 数字化的音频信号数字化的音频信号两种途径两种途径: 第一种途径就是将现场声源的模
27、拟信号或已存储的第一种途径就是将现场声源的模拟信号或已存储的模拟声音信号通过某种方法模拟声音信号通过某种方法转换转换成数字音频;成数字音频; 第二种途径就是在数字化设备中第二种途径就是在数字化设备中创作创作出数字音频,出数字音频,比如电子作曲。比如电子作曲。 音频数字化一般经过音频数字化一般经过三个阶段三个阶段 “采样采样量化量化编码编码”。32/ 1176:223.2.23.2.2音频的数字化过程音频的数字化过程音频数字化过程的具体步骤包括:音频数字化过程的具体步骤包括:n 第一步,将麦克风转化过来的模拟电信号以某一频率第一步,将麦克风转化过来的模拟电信号以某一频率进行离散化的样本采集,这个
28、过程就叫进行离散化的样本采集,这个过程就叫采样采样;n 第二步,将采集到的样本电压或电流值进行等级量化第二步,将采集到的样本电压或电流值进行等级量化处理,这个过程就是处理,这个过程就是量化量化;n 第三步将等级值变换成对应的二进制表示值(第三步将等级值变换成对应的二进制表示值(0 0和和1 1),),并进行存储,这个过程就是并进行存储,这个过程就是“编码编码”。n 通过这三个环节,连续的模拟音频信号即可转换成离通过这三个环节,连续的模拟音频信号即可转换成离散的数字信号散的数字信号二进制的二进制的0 0和和1 1。33/ 1176:223.2.23.2.2音频的数字化过程音频的数字化过程 数字化
29、过程两个指标:数字化过程两个指标: 一是一是采样频率采样频率,即采样点之间的时间间隔。,即采样点之间的时间间隔。 二是二是量化深度量化深度,也可称之为量化分辨率,是指单位,也可称之为量化分辨率,是指单位电压值和电流值之间的电压值和电流值之间的可分等级数可分等级数; 两者与音质还原的关系是:两者与音质还原的关系是: 采样频率越高,量化深度越大,声音质量越好。采样频率越高,量化深度越大,声音质量越好。34/ 1176:223.2.23.2.2音频的数字化过程音频的数字化过程 横坐标是时间轴(横坐标是时间轴(采样频率采样频率),纵坐标是幅度值(),纵坐标是幅度值(量量化分辨率化分辨率),曲线代表的是
30、模拟信号对应的波动曲线,),曲线代表的是模拟信号对应的波动曲线,带颜色的方格是采样量化后的所得结果。带颜色的方格是采样量化后的所得结果。采样量化采样量化 当当频率越小频率越小(时间间隔(时间间隔越短),越短),量化深度量化深度(量(量化分辨率)化分辨率)越大越大,二者,二者的的轮廓越吻合轮廓越吻合,这也说,这也说明数字化的信号能更好明数字化的信号能更好的保持模拟音频信号的的保持模拟音频信号的形状,有利于保持原始形状,有利于保持原始声音的真实情况。声音的真实情况。 35/ 1176:223.2.23.2.2音频的数字化过程音频的数字化过程 在数字音频的衡量指标中,在数字音频的衡量指标中,采样频率
31、采样频率的单位是的单位是HzHz,量量化深度化深度一般用一般用比特(比特(BitBit)来度量。来度量。 例如:某一音频的数字化指标是例如:某一音频的数字化指标是44.1kHz44.1kHz,8 8个比特位个比特位。那么这里的那么这里的44.1kHz44.1kHz比较容易理解,但比较容易理解,但8 8比特位并不是比特位并不是说把某一单位的电压(电流)值成说把某一单位的电压(电流)值成8 8份,而是分成份,而是分成2 28 8256256份;同理份;同理1616位是把纵坐标分成位是把纵坐标分成2 216166553665536份。份。 通常情况下,在音频数字化的过程中,设置的采集频通常情况下,在
32、音频数字化的过程中,设置的采集频率可已选择三种:率可已选择三种:32kHz32kHz、44kHz44kHz、48kHz48kHz。特别是在。特别是在CDCD制作过程中,一般的采样频率是制作过程中,一般的采样频率是44.1kHz44.1kHz。36/ 1176:223.2.23.2.2音频的数字化过程音频的数字化过程 上半部分表示原始音频的波形;下半部分表示录制后上半部分表示原始音频的波形;下半部分表示录制后的波形;红色的点表示的波形;红色的点表示采样点采样点。采样频率对波形的影响采样频率对波形的影响 37/ 1176:223.2.23.2.2音频的数字化过程音频的数字化过程 上下波形之所以不吻
33、合,是因为上下波形之所以不吻合,是因为采样点不够多采样点不够多,或是,或是采样频率不够高采样频率不够高。这种情况关于合理的采样频率这一。这种情况关于合理的采样频率这一问题在问题在NyquistNyquist(奈奎斯特)(奈奎斯特)定理中早已有明确的答案:定理中早已有明确的答案: 要想不产生低频失真,则采样频率至少是录制的要想不产生低频失真,则采样频率至少是录制的最高最高频率的两倍频率的两倍。38/ 1176:22基音与泛音基音与泛音 小提琴整根弦的振动产生了最主要的频率,小提琴整根弦的振动产生了最主要的频率,称之为称之为基音基音,而弦长的二分之一、三分之,而弦长的二分之一、三分之一、四分之一等
34、处的振动则产生了一些次一、四分之一等处的振动则产生了一些次要的频率,称之为要的频率,称之为泛音泛音。 如果一个物体振动所发出的泛音为基音的如果一个物体振动所发出的泛音为基音的整数倍整数倍,这个音就会具有清晰可辨的音高,这个音就会具有清晰可辨的音高,称之为称之为乐音乐音,如钢琴,小提琴等发出的都,如钢琴,小提琴等发出的都是乐音;是乐音; 如果泛音是基音的如果泛音是基音的非整数倍非整数倍,这个音就不,这个音就不具备清晰可辨的音高,称之为具备清晰可辨的音高,称之为噪音噪音,如汽,如汽车发动机、计算机风扇等发出的都是噪音。车发动机、计算机风扇等发出的都是噪音。 39/ 1176:223.3 3.3 数
35、字音频质量及格式数字音频质量及格式3.3 3.3 数字音频质量及格式数字音频质量及格式 3.3.1 3.3.1 音频数据率及质量音频数据率及质量 3.3.2 3.3.2 声音文件格式声音文件格式40/ 1176:223.3.13.3.1音频数据率及质量音频数据率及质量 数字音频文件存储在计算机中要占据一定的空间,然数字音频文件存储在计算机中要占据一定的空间,然而不同的而不同的采样频率采样频率、量化深度量化深度和和录制时间录制时间生成的音频生成的音频文件大小文件大小也不同。也不同。 例如:用例如:用44.1kHz44.1kHz、16bit16bit来进行立体声(即两个声道)来进行立体声(即两个声
36、道)采样(标准的采样(标准的CDCD音质),录制音质),录制3 3分钟的音频,那么在该分钟的音频,那么在该未经压缩的声音数据文件的大小为:未经压缩的声音数据文件的大小为: 一秒钟内采样一秒钟内采样44.144.110001000次,次, 每次的数据每次的数据 16162 232bit32bit(立体声是两个声道)(立体声是两个声道) 3 3分钟的数据分钟的数据4410044100323260603= 2540160003= 254016000(bitbit) 总共数据量是总共数据量是254016000/8/1024/1024= 30.28 MB254016000/8/1024/1024= 30
37、.28 MB。 比特率比特率,即每秒钟音频的二进制数据量。,即每秒钟音频的二进制数据量。 上述例题的比特率是176.4kB/s。41/ 1176:223.3.13.3.1音频数据率及质量音频数据率及质量 如果要衡量一个数字音频的音质好坏的话,通常可以如果要衡量一个数字音频的音质好坏的话,通常可以参考以下指标:参考以下指标: 采样频率采样频率:即采样点之间的时间间隔,采样间隔时间:即采样点之间的时间间隔,采样间隔时间越短,音质越好。越短,音质越好。 量化深度量化深度( (量化分辨率量化分辨率) ):是指单位电压值和电流值之:是指单位电压值和电流值之间的可分等级数,可分等级越多,音质越好。间的可分
38、等级数,可分等级越多,音质越好。 音频流码率音频流码率:数字化后,单位时间内音频数据的比特:数字化后,单位时间内音频数据的比特容量,流码率越大音质越好。容量,流码率越大音质越好。 以上三个方面的指标中,前面两个指标是以上三个方面的指标中,前面两个指标是绝对指标绝对指标,而音频流码率是一个而音频流码率是一个相对指标相对指标,可以间接用来考察音,可以间接用来考察音频的质量。频的质量。 42/ 1176:223.3.23.3.2声音文件格式声音文件格式不同的编码方式就对应计算机中不同的文件格式。不同的编码方式就对应计算机中不同的文件格式。对于数字音频的常见格式有以下几种:对于数字音频的常见格式有以下
39、几种:(1 1)WAVWAV格式格式:WAV:WAV格式支持许多压缩算法,支持格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用多种音频位数、采样频率和声道,采用44.1kHz44.1kHz的采样频率,的采样频率,1616位量化位数,因此位量化位数,因此WAVWAV的的音质与音质与CDCD相差无几相差无几,但,但WAVWAV格式对存储空间需求太大不格式对存储空间需求太大不便于交流和传播。便于交流和传播。43/ 1176:22(1 1)WAVWAV格式格式-文件结构分析文件结构分析 RIFF结构定义如struct RIFF_HEADER char szRiffID4; / R,I,F,
40、F DWORD dwRiffSize; / Size=FileLen-8 char szRiffFormat4; / W,A,V,E; 44/ 1176:22FormatFormat块块| | 字节数 | 具体内容 =| ID | 4 Bytes | fmt -| Size | 4 Bytes | 数值为16或18,18则最后又附加信息 - | FormatTag | 2 Bytes | 编码方式,一般为0 x0001 - | Channels | 2 Bytes | 声道数目,1-单声道;2-双声道 - | SamplesPerSec | 4 Bytes | 采样频率 - | AvgByte
41、sPerSec| 4 Bytes | 每秒所需字节数 |= WAVE_FORMAT- | BlockAlign | 2 Bytes | 数据块对齐单位(每个采样需要的字节数) -| BitsPerSample | 2 Bytes | 每个采样需要的bit数 - | | 2 Bytes | 附加信息(可选,通过Size来判断有无) - 45/ 1176:22DataData块块 Data ChunkData Chunk是真正保存是真正保存wavwav数据的地方,以数据的地方,以datadata作为该作为该ChunkChunk的标的标示。然后是数据的大小。示。然后是数据的大小。紧接着就是紧接着就是
42、wavwav数据。数据。 46/ 1176:22WaveWave数据排列数据排列单声道8bit量化取样1取样2取样3取样4双声道8bit量化取样1取样2声道0(左) 声道1(右)声道0(左)声道1(右)单声道16bit量化取样1取样2双声道16bit量化取样1声道0(左) (低位字节)声道0(左) (高位字节)声道1(右) (低位字节)声道1(右)(高位字节)47/ 1176:22WaveWave数据含义数据含义 WAV记录的是声音的本身 WAVE文件数据块中是以脉冲编码调制(PCM)格式表示的样本,直接来自模/数转换器(A/D)的信号,采样值是每一次采样周期内声音模拟信号的积分值48/ 11
43、76:22PCMPCM码数据的播放码数据的播放 waveOutOpen:打开一个波形音频输出装置 waveOutPrepareHeader :预处理 waveOutWrite:把一个数据块发送到指定的装置 waveOutUnprepareHeader waveOutClose 49/ 1176:22(2 2)MIDIMIDI格式格式:MIDI:MIDI是是MusicalMusical Instrument Digital Interface的缩写,又称作的缩写,又称作乐乐器数字接口器数字接口,是数字音乐,是数字音乐/ /电子合成乐器的统一电子合成乐器的统一国际标准。国际标准。 它定义了它定义了
44、计算机音乐程序、数字合成器计算机音乐程序、数字合成器及其它及其它电子设备电子设备交换交换音乐信号音乐信号的方式,规定了不同厂的方式,规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可以模拟多种乐器的声备间数据传输的协议,可以模拟多种乐器的声音。音。 50/ 1176:22数字音乐数字音乐 数字音乐的定义是:使用电脑的强大功能,对数字音乐的定义是:使用电脑的强大功能,对代表着各种代表着各种音乐事件音乐事件的数字信号进行记录和编的数字信号进行记录和编辑,然后发送给辑,然后发送给电子合成器电子合成器并使之演奏出来的并使之演奏出来的音乐。
45、音乐。 电子合成器电子合成器是电脑音乐系统的重要组成部分,是电脑音乐系统的重要组成部分,就是通过就是通过“电子电子”的手段的手段“合成合成”出声音的机出声音的机“器器”。51/ 1176:22数字式合成器数字式合成器 “频率调变频率调变”(Frequency Modulation,缩,缩写为写为FMFM)的合成方法:先由震荡器产生一个)的合成方法:先由震荡器产生一个载波作为基音,然后再产生若干个调制波带载波作为基音,然后再产生若干个调制波带着许多泛音加在载波之上,可以对这个组合着许多泛音加在载波之上,可以对这个组合加以任意调整加以任意调整 采样回放采样回放合成器:把一小段真实乐器的声音合成器:
46、把一小段真实乐器的声音或效果音响用数字采样的方式或效果音响用数字采样的方式“录录”下来,下来,然后再对它进行修饰、放大和输出然后再对它进行修饰、放大和输出52/ 1176:22波表波表 一个一个MIDI设备通常包含多种乐器的声音,而设备通常包含多种乐器的声音,而一个乐器又往往需要多个样本,所以把这些样一个乐器又往往需要多个样本,所以把这些样本排列起来形成一个表格以方便调用。这就称本排列起来形成一个表格以方便调用。这就称之为之为“波表波表”(Wave Table) 硬波表硬波表: :通过真实乐器采样获得的频谱数据的通过真实乐器采样获得的频谱数据的存储在存储在ROM里面里面( (例如著名的例如著名
47、的EMUEMU8000) 8000) 19961996岁末,岁末,YAMAHAYAMAHA和和 ROLANDROLAND几乎同时推出了几乎同时推出了各自的软件波表合成器各自的软件波表合成器 软波表软波表是把乐器的波形存到硬盘上的某一个文是把乐器的波形存到硬盘上的某一个文件里,在需要的时候通过件里,在需要的时候通过CPUCPU运算调用运算调用53/ 1176:22音色标准音色标准GMGM、GSGS和和XGXG 早期的早期的MIDIMIDI除了都能接受除了都能接受MIDIMIDI信号信号之外没有之外没有统一的标准,尤其是在统一的标准,尤其是在音色排列音色排列的方式上更的方式上更是是“随心所欲随心所
48、欲”的。不同型号的琴上播放时的。不同型号的琴上播放时会变得面目全非,小提琴可能会变成小号,会变得面目全非,小提琴可能会变成小号,长笛可能会变成吉他,钢琴可能会变成大鼓长笛可能会变成吉他,钢琴可能会变成大鼓 GSGS:日本:日本ROLANDROLAND,19901990,128128种音色,可变种音色,可变 GMGM:“通用通用MIDIMIDI标准系统第一级标准系统第一级” ,1991,1991,固定固定 XGXG:YAMAHAYAMAHA,19941994年,年,480480种音色,可实时种音色,可实时变变54/ 1176:22GMGM音色表音色表 0Acoustic Grand Piano大
49、钢琴(声学钢琴)1Bright Acoustic Piano明亮的钢琴2Electric Grand Piano电钢琴3Honky-tonk Piano酒吧钢琴4Rhodes Piano柔和的电钢琴 5Chorused Piano加合唱效果的电钢琴 6Harpsichord羽管键琴(拨弦古钢琴) 7Clavichord科拉维科特琴(击弦古钢琴)55/ 1176:22MIDIMIDI音乐的制作过程中三音乐的制作过程中三“法宝法宝” 音源音源: :声卡波表或硬件的音源声卡波表或硬件的音源 音序器:音序器:记录了音乐的基本要素记录了音乐的基本要素速度,节速度,节奏,音色,音符的时值等等奏,音色,音符
50、的时值等等, ,指挥音源在什么指挥音源在什么时候用什么音色发多长的音时候用什么音色发多长的音 输入设备输入设备: :基于传统乐器的基于传统乐器的MIDIMIDI输入设备,如输入设备,如MIDIMIDI键盘,键盘,MIDIMIDI吉它,吉它,MIDIMIDI吹管,吹管,MIDIMIDI小提琴小提琴等,可以按照演奏传统乐器的方法去演奏它们,等,可以按照演奏传统乐器的方法去演奏它们,而演奏则通过而演奏则通过MIDI OUTMIDI OUT出口传送到音序器,被出口传送到音序器,被记录为记录为音序内容音序内容 MIDIMIDI文件的内容实际上就是文件的内容实际上就是音序内容音序内容56/ 1176:22