1、http:/211.67.81.35/wlxt_jpkc/2007mawu/第二章 多媒体音频处理技术http:/211.67.81.35/wlxt_jpkc/2007mawu/声音是因为物体的振动而产生的。机械振动或气流声音是因为物体的振动而产生的。机械振动或气流扰动引起周围弹性媒介发生波动,产生声波。产生声波扰动引起周围弹性媒介发生波动,产生声波。产生声波的物体称为声源,如乐器、音箱等。声波所及的空间范的物体称为声源,如乐器、音箱等。声波所及的空间范围称为声场。声波传入到人耳,经过人类听觉系统的感围称为声场。声波传入到人耳,经过人类听觉系统的感知就是声音。知就是声音。2 2.1.1 音频基
2、础音频基础第二章 多媒体音频处理技术2 2.1.1.1.1 声音的基本概念http:/211.67.81.35/wlxt_jpkc/2007mawu/第二章 多媒体音频处理技术声音主要具有以下声音主要具有以下3 3种属性种属性:1.音调 音调代表了声音的高低。音调与频率有关,频率越音调代表了声音的高低。音调与频率有关,频率越高,音调越高,反之亦然。高,音调越高,反之亦然。2.音色 音色即声音的特色。音色即声音的特色。3.音强 音强是声音的强度,也称为声音的响度,即常说的音强是声音的强度,也称为声音的响度,即常说的“音量音量”。音强与声波的振幅成正比,振幅越大,强。音强与声波的振幅成正比,振幅越
3、大,强度越大。度越大。http:/211.67.81.35/wlxt_jpkc/2007mawu/有有3 3种常用方法可以衡量声音的质量:一是用声音信种常用方法可以衡量声音的质量:一是用声音信号的带宽来度量,二是客观度量,三是主观度量。评价语号的带宽来度量,二是客观度量,三是主观度量。评价语音质量时,经常采取复合法评估,即采取两种以上的方法音质量时,经常采取复合法评估,即采取两种以上的方法综合评估。综合评估。第二章 多媒体音频处理技术2 2.1.1.2 2声音的质量http:/211.67.81.35/wlxt_jpkc/2007mawu/1 1.带宽度量带宽度量第二章 多媒体音频处理技术ht
4、tp:/211.67.81.35/wlxt_jpkc/2007mawu/2.2.客观度量客观度量 声音客观质量的度量主要用信噪比声音客观质量的度量主要用信噪比(Signal to(Signal to Noise RatioNoise Ratio,SNR)SNR)来度量。信噪比是指声源产生最来度量。信噪比是指声源产生最大不失真声音信号强度与同时发出噪音强度的比率,大不失真声音信号强度与同时发出噪音强度的比率,通常以通常以S/NS/N表示,以分贝表示,以分贝(dB)(dB)为单位,信噪比越高表为单位,信噪比越高表示声音的质量越好。示声音的质量越好。第二章 多媒体音频处理技术http:/211.67
5、.81.35/wlxt_jpkc/2007mawu/3.3.主观度量主观度量 与客观度量相比较,应该说人的感觉更具有决与客观度量相比较,应该说人的感觉更具有决定意义。感觉上的、主观上的印象应该成为评价声定意义。感觉上的、主观上的印象应该成为评价声音质量不可缺少的部分。有的学者认为,在语音信音质量不可缺少的部分。有的学者认为,在语音信号编码中使用主观度量比使用客观度量更加直接和号编码中使用主观度量比使用客观度量更加直接和恰当,更有意义。恰当,更有意义。第二章 多媒体音频处理技术http:/211.67.81.35/wlxt_jpkc/2007mawu/2.2 2.2 数字音频数字音频第二章 多媒
6、体音频处理技术2 2.2 2.1.1 声音的数字化1.1.数字化过程数字化过程v采样v量化v编码http:/211.67.81.35/wlxt_jpkc/2007mawu/信息论的奠基者信息论的奠基者ShannonShannon指出,在一定条件下,用离散指出,在一定条件下,用离散的序列可以完全代表一个连续函数,这是采样定理的基本内的序列可以完全代表一个连续函数,这是采样定理的基本内容。为实现容。为实现A/DA/D转换,需要把模拟音频信号波形进行分割,转换,需要把模拟音频信号波形进行分割,即采样。采样的过程是每隔一个时间间隔在模拟声音的波形即采样。采样的过程是每隔一个时间间隔在模拟声音的波形上取
7、一个幅度值,把时间上的连续信号变成时间上的离散信上取一个幅度值,把时间上的连续信号变成时间上的离散信号。该时间间隔称为采样周期,其倒数为采样频率,采样频号。该时间间隔称为采样周期,其倒数为采样频率,采样频率是指计算机每秒钟采集多少个声音样本。率是指计算机每秒钟采集多少个声音样本。第二章 多媒体音频处理技术http:/211.67.81.35/wlxt_jpkc/2007mawu/量化的过程是先将采样后的信号按整个声波的幅度量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合,把某个区段内的值归为一类,划分成有限个区段的集合,把某个区段内的值归为一类,并赋于相同的量化值并赋于相同的
8、量化值。第二章 多媒体音频处理技术http:/211.67.81.35/wlxt_jpkc/2007mawu/失真在采样和量化的过程中是不可避免的,但可以失真在采样和量化的过程中是不可避免的,但可以尽量减少失真。尽量减少失真。第二章 多媒体音频处理技术http:/211.67.81.35/wlxt_jpkc/2007mawu/模拟信号经过采样和量化以后,形成一系列的离散信模拟信号经过采样和量化以后,形成一系列的离散信号号(即脉冲数字信号即脉冲数字信号)。这种脉冲数字信号可以用一定的方。这种脉冲数字信号可以用一定的方式进行编码,形成计算机能够处理的数据。所谓编码,就式进行编码,形成计算机能够处理
9、的数据。所谓编码,就是按照一定的格式把经过采样和量化得到的离散数据记录是按照一定的格式把经过采样和量化得到的离散数据记录下来,并在数据中加入一些用于纠错、同步和控制的数据。下来,并在数据中加入一些用于纠错、同步和控制的数据。编码的方式比较多,常用的编码方式是脉冲编码调制编码的方式比较多,常用的编码方式是脉冲编码调制(PCM)(PCM)。脉冲编码调制是把模拟信号变为数字信号的一种调制方式,脉冲编码调制是把模拟信号变为数字信号的一种调制方式,即把连续输入的模拟信号变换为在时间和振幅上都离散的即把连续输入的模拟信号变换为在时间和振幅上都离散的量,然后将其转化为数字形式传输或存储。量,然后将其转化为数
10、字形式传输或存储。第二章 多媒体音频处理技术http:/211.67.81.35/wlxt_jpkc/2007mawu/声音文件的格式是指数字音频文件在存储介声音文件的格式是指数字音频文件在存储介质上的存放格式。由于数据的编码、解码等方面质上的存放格式。由于数据的编码、解码等方面的不同,相同的数字音频可以有不同的文件格式。的不同,相同的数字音频可以有不同的文件格式。第二章 多媒体音频处理技术2.2.2 声音文件的格式http:/211.67.81.35/wlxt_jpkc/2007mawu/vWAVEWAVE文件格式文件格式vMP3MP3文件格式文件格式vRARA文件格式文件格式vWMAWMA
11、文件格式文件格式vMIDIMIDI文件格式文件格式第二章 多媒体音频处理技术http:/211.67.81.35/wlxt_jpkc/2007mawu/1.1.硬件支持硬件支持第二章 多媒体音频处理技术2.2.3 音频素材的获取http:/211.67.81.35/wlxt_jpkc/2007mawu/2.2.软件支持软件支持第二章 多媒体音频处理技术 在多媒体个人计算机上获取和处理音频信息需在多媒体个人计算机上获取和处理音频信息需要使用软件。现在音频处理软件多种多样,比如要使用软件。现在音频处理软件多种多样,比如GoldWaveGoldWave、CoolEditCoolEdit、SoundE
12、ditSoundEdit、SoundForgeSoundForge、WindowsWindows操作系统自带的操作系统自带的“录音机录音机”软件等,这些软软件等,这些软件都具备录音和编辑音频文件的功能。件都具备录音和编辑音频文件的功能。http:/211.67.81.35/wlxt_jpkc/2007mawu/3.3.获取途径获取途径第二章 多媒体音频处理技术v录制v网上下载vCD抓轨v声卡截获http:/211.67.81.35/wlxt_jpkc/2007mawu/2.3 2.3 音频素材的处理音频素材的处理第二章 多媒体音频处理技术2.3.1 GoldWave2.3.1 GoldWave
13、简介http:/211.67.81.35/wlxt_jpkc/2007mawu/GoldWave软件具有如下特点:(1)直观的用户界面,操作简单。(2)可以同时打开多个音频文件。(3)在编辑较短的音频文件时,使用计算机内存以提高编辑速度。(4)允许使用多种声音效果。(5)有精密的过滤器(如降噪器和突变过滤器),可以修复声音文件。(6)批转换命令可以同时对多个文件进行格式转换。(7)CD读取器可以直接读取CD唱盘中的音轨并生成为一个声音文件。(8)表达式求值程序在理论上可以制造任意声音,内置有表达式。第二章 多媒体音频处理技术http:/211.67.81.35/wlxt_jpkc/2007ma
14、wu/第二章 多媒体音频处理技术2.3.2 声音的录制与保存http:/211.67.81.35/wlxt_jpkc/2007mawu/第二章 多媒体音频处理技术2.3.3 声音的编辑1.1.选择区域选择区域 在波形图上单击确定所选波形的开始,右击,在弹出的快捷在波形图上单击确定所选波形的开始,右击,在弹出的快捷菜单中选择菜单中选择“设置结束标记设置结束标记”命令,以确定所选波形的结尾。命令,以确定所选波形的结尾。http:/211.67.81.35/wlxt_jpkc/2007mawu/第二章 多媒体音频处理技术2.2.剪裁、删除、复制波形段剪裁、删除、复制波形段(1)(1)剪裁和删除波形段
15、剪裁和删除波形段 剪裁波形段类似于删除波形段。不同之处是,删除剪裁波形段类似于删除波形段。不同之处是,删除波形段是把选中的波形删除,而剪裁波形段是把未选中波形段是把选中的波形删除,而剪裁波形段是把未选中的波形删除,两者的作用是相反的。的波形删除,两者的作用是相反的。(2)(2)复制波形段复制波形段 选择选择需复制需复制波形段,单击工具栏中的波形段,单击工具栏中的剪切剪切按钮,按钮,用鼠标左键选择用鼠标左键选择需粘贴处需粘贴处,单击工具栏中的,单击工具栏中的粘贴粘贴按钮,按钮,波形段就会被粘贴到所选的位置。波形段就会被粘贴到所选的位置。http:/211.67.81.35/wlxt_jpkc/2
16、007mawu/第二章 多媒体音频处理技术2.3.4 声音的效果处理1.1.调整音量调整音量http:/211.67.81.35/wlxt_jpkc/2007mawu/第二章 多媒体音频处理技术2.2.降噪降噪 为了去除录制中的微小噪声和电源的嗡嗡声等杂音,为了去除录制中的微小噪声和电源的嗡嗡声等杂音,可以单击效果栏中的可以单击效果栏中的“降噪降噪”按钮,在弹出的对话框中按钮,在弹出的对话框中选择合适的数据对录音进行降噪。由于软件是根据用户选择合适的数据对录音进行降噪。由于软件是根据用户指定的数值认定噪声的,所以降噪会对原来的声音文件指定的数值认定噪声的,所以降噪会对原来的声音文件造成损失。造
17、成损失。http:/211.67.81.35/wlxt_jpkc/2007mawu/第二章 多媒体音频处理技术3.3.静音处理静音处理 如果录音过程中在朗读停顿的时候有例如摆钟的如果录音过程中在朗读停顿的时候有例如摆钟的咔嚓声、较响的脚步声等,利用降噪功能效果不是很咔嚓声、较响的脚步声等,利用降噪功能效果不是很明显,可以利用静音处理功能。方法是选择朗读停顿明显,可以利用静音处理功能。方法是选择朗读停顿区间,选择区间,选择“编辑编辑”|“静音静音”命令。与删除声音片段命令。与删除声音片段不同,利用静音处理的区域仍然存在,其时间长度保不同,利用静音处理的区域仍然存在,其时间长度保持不变。持不变。h
18、ttp:/211.67.81.35/wlxt_jpkc/2007mawu/第二章 多媒体音频处理技术4.4.回声和混响处理回声和混响处理http:/211.67.81.35/wlxt_jpkc/2007mawu/第二章 多媒体音频处理技术5.消减人声http:/211.67.81.35/wlxt_jpkc/2007mawu/第二章 多媒体音频处理技术6.淡入淡出http:/211.67.81.35/wlxt_jpkc/2007mawu/第二章 多媒体音频处理技术7.混音 混音是配置背景音乐常用的功能。首先同时打开混音是配置背景音乐常用的功能。首先同时打开两个处理好的音频文件,两个处理好的音频文
19、件,选择其中一个音频(选择其中一个音频(在波形在波形图的标题栏上单击图的标题栏上单击按钮)按钮),选择选择后单击工具栏中的复后单击工具栏中的复制按钮;然后选择制按钮;然后选择另一个音频另一个音频文件,单击文件,单击“混音混音”按按钮,在弹出的对话框中指定起始时间和音量,单击钮,在弹出的对话框中指定起始时间和音量,单击“确定确定”按钮。按钮。http:/211.67.81.35/wlxt_jpkc/2007mawu/第二章 多媒体音频处理技术2.3.5 声音的格式转换 利用利用GoldWaveGoldWave进行音频文件的格式转换十分方便。进行音频文件的格式转换十分方便。首先打开多个它所支持格式
20、的音频文件,然后在首先打开多个它所支持格式的音频文件,然后在“另存另存为为”对话框中选择保存类型,即需要转换的格式类型,对话框中选择保存类型,即需要转换的格式类型,再单击再单击“保存保存”按钮即可。按钮即可。GoldWaveGoldWave中的批量格式转换也是一个十分有用的中的批量格式转换也是一个十分有用的功能,它能同时对多个文件进行格式转换。选择功能,它能同时对多个文件进行格式转换。选择“文文件件”|“”|“批处理批处理”命令,在打开的对话框中添加要转换命令,在打开的对话框中添加要转换的多个文件,在的多个文件,在“转换转换”选项卡中选择转换后的格式,选项卡中选择转换后的格式,在在“文件夹文件
21、夹”选项卡中选择保存路径,然后单击选项卡中选择保存路径,然后单击“开开始始”按钮。按钮。http:/211.67.81.35/wlxt_jpkc/2007mawu/MIDIMIDI有自己的文件格式,它使用扩展名为有自己的文件格式,它使用扩展名为“.mid”“.mid”的文件来存储的文件来存储MIDIMIDI数据。这是一种二进制文件,不是文数据。这是一种二进制文件,不是文本文件,所以不能直接打开和编辑。一个本文件,所以不能直接打开和编辑。一个MIDIMIDI文件包含文件包含两部分:文件头和音轨。文件头描述文件的类型和音轨两部分:文件头和音轨。文件头描述文件的类型和音轨数等,音轨记录数等,音轨记录
22、MIDIMIDI数据,其中主要是命令序列,每个数据,其中主要是命令序列,每个命令包括命令号、通道号、音色号和音速等。命令包括命令号、通道号、音色号和音速等。2.4 2.4 电子合成音乐电子合成音乐第二章 多媒体音频处理技术2.4.1 MIDI概述http:/211.67.81.35/wlxt_jpkc/2007mawu/第二章 多媒体音频处理技术2.4.2 常用术语v音乐合成器音乐合成器v复调复调v多音色多音色vMIDIMIDI电子乐器电子乐器vMIDIMIDI消息或指令消息或指令vMIDIMIDI接口接口vMIDIMIDI通道通道v音序器音序器http:/211.67.81.35/wlxt_
23、jpkc/2007mawu/第二章 多媒体音频处理技术2.4.3 MIDI音乐的制作 MIDIMIDI系统分处理设备、输入设备和输出设备三大系统分处理设备、输入设备和输出设备三大部分,中枢就是音序器。现在流行使用的就是部分,中枢就是音序器。现在流行使用的就是CAKEWALKCAKEWALK系列的各版本软件。输入设备有计算机键盘、系列的各版本软件。输入设备有计算机键盘、鼠标、合成器主键盘等,输出设备就是声卡、音源、采鼠标、合成器主键盘等,输出设备就是声卡、音源、采样器等。样器等。计算机合成音乐需要使用计算机合成音乐需要使用MIDIMIDI语言。语言。MIDIMIDI语言利用语言利用字节传送来告知相应的设备能够做什么和不能做什么。字节传送来告知相应的设备能够做什么和不能做什么。MIDIMIDI字节通知乐器、声卡和其他字节通知乐器、声卡和其他MIDIMIDI设备什么时候开始设备什么时候开始和什么时候结束演奏音符。和什么时候结束演奏音符。