1、信息技术第信息技术第3 3章音频编辑与处理章音频编辑与处理 声音是多媒体信息的一个重要组成部分,也是表达思想和情感的一种必不可少的媒体。无论其应用目的是什么,声音的合理使用可以使多媒体应用系统变得更加丰富多彩。在多媒体系统中,音频可被用作输入或输出。输入可以是自然语言或语音命令,输出可以是语音或音乐,这些都涉及到音频处理技术。3.1 数字音频基础知识3.1.1声音的基本概念 用声音录制软件记录的英文单词“Hello”的语音实际波形如图所示:用声音录制软件记录的英文单词“Hello”的语音实际波形在物理上,声音是一条连续的波,可用一条连续曲线表示。这条曲线无论多复杂,都可分解成一系列正弦波的线性
2、叠加。规则音频是一种连续变化的模拟信号,可用一条连续的曲线表示,称为声波。 3.1.1声音的基本概念 3.1.2声音的三要素 3.1.2声音的三要素指振幅和周期均固定的声音指具有不同频率和不同振幅的声音混合3.1.2声音的三要素3.1.3声音的特征 3.1.4声音的频率 3.1.4声音的频率20kHz次声可听声超声3.1.4声音的频率 3.1.4声音的频率3.1.4声音的频率音名CDEFGABC简谱1234567i唱名doremifasollasido音程全音全音半音全音全音全音半音音分200 200 100200200200100 3.1.4声音的频率3.1.4声音的频率人人声部声部音域音域
3、 频率范围频率范围(Hz)音宽音宽(度度)女声花腔女高音c1 e3 261.6 1318.517女高音c1 c3261.6 1046.515女中音a a2220 88015女低音f f 2174.6 69815男声男高音c c2130.8 523.215男中音A a1110 44015男低音F f 387.3 349.215童声童高音c1 g2261.6 783.912童低音a e2220 659.2123.1.5声音的质量3.1.5声音的质量声音类型带宽电话语音2003400Hz调幅广播507000Hz调频广播2015000Hz音响2020000Hz首先挑选一些有代表性的人物,聆听需要评测的
4、各种声音,每个人根据感觉给出分数,最后的平均分就是相对应的声音效果的评价结果。实际上,不同的应用对象,声音质量的衡量标准也不尽相同。对于语音来说,通常用可懂度、清晰度和自然度来衡量;对于音乐来说,就要求具有一定的保真度、立体感和音响效果。 主观度量可以采用的方法为主观平均判分法。召集若干实验者,由他们对声音质量的好坏进行评分,求出平均值作为对声音质量的评价,这种方法称为主观平均判分法,所得的分数称为主观平均分(mean opinion score,MOS)。 3.2.1 声音的数字化声波可以用一条连续的曲线来表示,它在时间和幅度上是连续的。我们把在时间和幅度上都是连续的信号称为模拟信号(ana
5、log signal)。AM、FM广播信号、磁带等记录的都是模拟音频信号。 音频信息在计算机中是以数字的形式存放和处理的,计算机只能处理一个个的数据。简单来说,计算机只能处理0和1两个数字。所以计算机处理声音时必须先将声音数字化,将模拟信号变成它能够处理的数字信号。3.2 3.2 数字音频数字音频模拟音频与数字音频模拟音频与数字音频模拟信号模拟信号 数字信号数字信号3.2.1 声音的数字化声音的数字化指将模拟信号变成数字信号。从模拟信号 到 数 字 信 号 的 转 换 称 为 模 数 转 换 , 记 为A/D(Analog-to-Digital);从数字信号到模拟信号的转换称为数模转换,记为D
6、/A(Digital-to-Analog)。声音的数字化过程分为三步,依次为采样、量化和编码。3.2 3.2 数字音频数字音频 2022-4-21 Multimedia Technology & Application 采样量化编码模拟音频数字音频01101001。将经采样将经采样3.2.2 常见的音频文件格式1. WAV格式WAV格式是微软公司开发的一种音频文件格式,也叫波形声音文件,是最早的数字音频格式,由于Windows本身的影响力,这个格式已经成为了事实上的通用音频格式。该格式记录的是声音的波形,所以只要采样频率足够高,采样字节足够长,记录所以只要采样频率足够高,采样字节足够长,记录的
7、声音文件能够和原声基本一致的声音文件能够和原声基本一致,但是导致音频文件占用存储空间太大。在Windows平台下,WAV格式是被支持得最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较高的音质的要求,因此,WAV格式也是音乐编辑创作的首选格式格式也是音乐编辑创作的首选格式,适合保存音乐素材。因此,WAV格式被作为了一种中介的格式,常常使用在其他编码的相互转换之中,例如MP3格式转换成WMA格式。 3.2 3.2 数字音频数字音频3.2.2 常见的音频文件格式2. MP3格式MP3格式是MPEG(MPEG:Moving Picture Experts Group) Audio Laye
8、r-3的简称,1993年由德国Fraunhofer IIS研究院和汤姆生公司合作开发成功。MP3格式是当今较流行的音频文件格式播放时需要安装播放软件,在网络和通信方面应用广泛。MP3格式可以做到12:1的压缩比并保持基本可听的音质,MP3格式之所以能够达到如此高的压缩比例同时又能保持相当不错的音质是因为利用了知觉音频编码技术,也就是利用了人耳的特性,削减音乐中人耳听不到的成分,同时尝试尽可能地维持原来的声音质量。 3.2 3.2 数字音频数字音频3.2.2 常见的音频文件格式3. WMA格式WMA格式是Windows Media Audio编码后的文件格式。WMA格式以减少数据流量但保持音质的
9、方法来达到更高的压缩率目的,其压缩率一般可以达到1:18。WMA格式支持防复制功能,她支持通过Windows Media Rights Manager加入保护,可以限制播放时间和播放次数甚至于播放的机器。WMA格式也支持流媒体技术,可以在网络上在线播放。 3.2 3.2 数字音频数字音频3.2.2 常见的音频文件格式4. ASF格式ASF格式由微软开发,是一种支持在各类网络和协议上的数据传输的标准,它支持音频、视频及其他多媒体类型。ASF格式在录制时可以对音质进行调节,同一格式,音质好的可与CD媲美,压缩比较高的可用于网络广播。由于微软的大力推广,这种格式在高音质领域直逼MP3格式,并且压缩速
10、度比MP3提高1倍;在网络广播方面可与Real公司相竞争。 3.2 3.2 数字音频数字音频3.2.2 常见的音频文件格式5. RA格式RA格式由Real Networks公司开发,它的特点是可以在非常低的带宽下(低达28.8kbps)提供足够好的音质。RA格式针对的就是网络上的媒体市场,大部分音乐网站都是采用了这这种格式。RA格式最大的特点在于它可以根据听众的带宽来控制自己的码率,在保证流畅的前提下尽可能提高音质。RA可以支持多种音频编码,包括ATRAC3。而且和WMA一样,RA不仅支持边读边放,也同样支持使用特殊协议来隐匿文件的真实网络地址,从而实现只在线播放而不提供下载的播放方式。因此,
11、它属于网络流媒体格式。 3.2 3.2 数字音频数字音频3.2.2 常见的音频文件格式6. MIDI格式MIDI格式是记录MIDI音乐的音频文件格式。与波形文件相比较,它记录的不是实际声音信号采样、量化后的数值,而是以命令符号的形式记录电子乐器的弹奏过程,比如按键的力度和时间等。所以MIDI格式的文件非常小,每分钟的音乐只用约7KB的存储空间。MIDI格式主要用于计算机作曲、流行歌曲的表演、电子游戏以及电子贺卡等方面。MIDI格式的文件可以用作曲软件写出,也可以通过声卡的MIDI接口记录外接乐器的实际演奏过程而获得。MIDI格式文件重放的效果完全依赖于声卡的性能和扬声器的质量。 3.2 3.2
12、 数字音频数字音频3.2.3 常见的音频编辑软件常见的音频编辑软件1.Windows录音机 2. GoldWave 3.CoolEdit 4. Midisoft Studio 5. Cakewalk 3.2 3.2 数字音频数字音频GoldWave是一个功能强大的数字音频编辑器,它可以对声音进行播放、录制、编辑以及格式转换等处理。GoldWave软件不需要安装,只要运行程序文件夹中的主程序即可。3.3 3.3 声音的制作与编辑声音的制作与编辑声音的录制与保存声音的录制与保存声音的编辑声音的编辑声音的编辑声音的效果处理声音的效果处理声音的效果处理声音的效果处理声音的效果处理声音的效果处理声音的效
13、果处理声音的格式转换3.4.1 MIDIMIDI(Musical Instrument Digital Interface,乐器数字接口)是指数字乐器与计算机连接的接口,即在数字乐器与计算机相连接时所使用的直接插入在计算机端口上的一个小部件,通过它可以使数字乐器与计算机相互沟通信息。 3.4 MIDI3.4 MIDI与音乐合成与音乐合成3.4.1 MIDI为了使数字乐器与计算机之间形成良好的默契,各个厂商都需要将每种音色、每个音符、节拍、力度等动作的各项属性数字化,即编号。比如,将音色Acoustic Piano编号为00,将音符C3编号为00,将8分音符编号为60。对于一个原声钢琴8分音符的
14、C3音,在MIDI文件中对应“000060。在80年代,为了使各个厂商生产的设备可以被不同的计算机接收与处理,由几家电子乐器厂商共同制定了一个MIDI接口标准,这就是常说的“GM(General MIDI)标准”。这个标准主要由两部分组成:一是规定了与设备相连的硬件标准,包括乐器间的物理连接方式,连接两个乐器所使用的MIDI缆线;二是规定了MIDI数据的格式,主要包括硬件上传输信息的编码方式。无论各厂商如何开发自己的产品,其基本设计必须参照这套MIDI标准。 3.4 MIDI3.4 MIDI与音乐合成与音乐合成3.4.1 MIDIMIDI的特点是其文件内部记录的是演奏乐器的全部动作过程,比如,
15、音色、音符、延时、音量、力度等信息,所以其数据量相当小。由此可见,MIDI不属于数字音响的范畴,如果把数字音响比作录了某个人小提琴独奏的磁带,那么MIDI就是该独奏的乐谱,尽管乐谱本身并不产生任何实际声音,但它却定义了演奏的速度、音符及该独奏声音的大小。MIDI音乐以乐谱的形式展示出来,而乐谱实际上就是描述演奏过程的命令序列。 3.4 MIDI3.4 MIDI与音乐合成与音乐合成3.4.2 MIDI合成器MIDI合成器是利用数字信号处理器DSP或其他芯片来产生音乐或声音的电子装置。利用合成器产生MIDI音乐的主要方法有FM合成法和波表合成法。 3.4 MIDI3.4 MIDI与音乐合成与音乐合
16、成3.4.2 MIDI合成器 1.FM合成法FM合成法是20世纪80年代初由美国斯坦福大学的John Chowning发明的,称为“数字式频率调制合成法”,简称FM合成法。FM合成法生成乐音的基本原理是,用数字信号来表示不同乐音的波形,然后把它们组合起来,再通过数模转换器(DAC)生成乐音播放。 3.4 MIDI3.4 MIDI与音乐合成与音乐合成3.4.2 MIDI合成器2.波表合成法使用FM合成法来产生各种逼真的乐音是相当困难的,有些乐音几乎不能产生。目前的声卡一般采用乐音样本合成法,即波表合成法。这种方法就是把真实乐器发出的声音以数字的形式记录下来,播放时根据命令生成各种音阶的音符,产生的声音质量比FM合成方法产生的声音质量要高很多。 3.4 MIDI3.4 MIDI与音乐合成与音乐合成57
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。