1、第8章 多媒体信息技术第8章 多媒体信息技术 8.1 梦幻帝国梦幻帝国多媒体技术概论多媒体技术概论 8.2 音像王国的基石音像王国的基石多媒体技术基础多媒体技术基础 8.3 创建媒体帝国的利刃创建媒体帝国的利刃经典媒体处理工具经典媒体处理工具 第8章 多媒体信息技术8.1 梦幻帝国梦幻帝国多媒体技术概论多媒体技术概论8.1.1 多媒体和多媒体技术多媒体和多媒体技术1什么是多媒体什么是多媒体(Multimedia)媒体又称媒介、媒质,它的英文是medium(单数)和media(复数)的复合词,指的是用于分发信息和展现信息的手段、方法、工具、设备或装置。多媒体指将文字、声音、图形、图像、视频等多种
2、媒体集成进计算机,使信息表现声、图、文并茂。2什么是多媒体技术什么是多媒体技术多媒体技术是指以数字化为基础,能够对多种媒体信息进行采集、加工处理、存储和传递,并能使各种媒体信息之间建立起逻辑联系,集成为一个具有良好交互性的系统技术。第8章 多媒体信息技术8.1.2 多媒体技术的基本特性多媒体技术的基本特性多媒体技术除信息载体的多样化以外,还具有以下的关键特性:(1)集成性。采用了数字信号,可以综合处理文字、声音、图形、动画、图像、视频等多种信息,并将这些不同类型的信息有机地结合在一起。(2)交互性。信息以超媒体结构进行组织,可以方便地实现人机交互。换言之,人可以按照自己的思维习惯、按照自己的意
3、愿主动地选择和接受信息,拟定观看内容的路径。(3)智能性。提供了易于操作、十分友好的界面,使计算机更直观、更方便、更亲切、更人性化。第8章 多媒体信息技术(4)易扩展性。可方便地与各种外部设备挂接,实现数据交换、监视控制等多种功能。此外,采用数字化信息有效地解决了数据在处理传输过程中的失真问题。8.1.3 多媒体技术的应用与发展多媒体技术的应用与发展1.多媒体技术的应用多媒体技术的应用多媒体技术集文字、声音、图像、视频、通信等多项技术于一体,采用计算机的数字记录和传输传送方式,对各种媒体进行处理,具有广泛的用途。(1)教育与培训。世界各国的教育学家们正努力研究用先进的多媒体技术改进教学与培训。
4、以多媒体计算机为核心的现代教育技术使教学手段丰富多彩,使计算机辅助教学(CAI)如虎添翼。第8章 多媒体信息技术实践已证明,多媒体教学系统有如下效果:学习效果好;说服力强;教学信息的集成使教学内容丰富,信息量大;各种媒体与计算机结合可以使人类的感官与想象力相互配合,产生前所未有的思维空间与创造资源。(2)桌面出版(Desktop Publishing)与办公自动化。桌面出版物主要包括表格、布告、宣传品、市场图表、蓝图及商品图等。多媒体技术为办公室增加了控制信息的能力和充分表达思想的机会,许多应用程序都是为提高工作人员的工作效率而设计的,从而产生了许多新型的办公自动化系统。由于采用了先进的数字影
5、像和多媒体计算机技术,把文件扫描仪、图文传真机、文件资料微缩系统等和通信网络等现代化办公设备综合管理起来,将构成全新的办公自动化系统。第8章 多媒体信息技术(3)多媒体通信。在通信工程中的多媒体终端和多媒体通信也是多媒体技术的重要应用领域之一。当前计算机网络已在人类社会进步中发挥着重大作用。随着“信息高速公路”开通,电子邮件已被普遍采用。多媒体通信有着极其广泛的内容,对人类生活、学习和工作将产生深刻影响的当属信息点播(Information Demand)和计算机协同工作CSCW系统(Computer Supported Cooperative Work)。信息点播有桌上多媒体通信系统和交互电
6、视ITV。通过桌上多媒体通信系统,人们可以远距离点播所需信息,而交互式电视和传统电视不同之处在于用户在电视机前可对电视台节目库中的信息按需选取,即用户主动与电视进行交互式获取信息。第8章 多媒体信息技术计算机协同工作CSCW是指在计算机支持的环境中,一个群体协同工作以完成一项共同的任务,其应用于工业产品的协同设计制造、远程会诊、不同地域位置的同行们进行学术交流、师生间的协同式学习等。多媒体计算机+电视+网络将形成一个极大的多媒体通信环境,它不仅改变了信息传递的面貌,带来通信技术的大变革,而且计算机的交互性、通信的分布性和多媒体的现实性相结合,构成了继电报、电话、传真之后的第四代通信手段,向社会
7、提供全新的信息服务。第8章 多媒体信息技术(4)多媒体电子出版物。国家新闻出版署对电子出版物定义为“电子出版物,是指以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上,通过计算机或类似设备阅读使用,并可复制发行的大众传播媒体。”该定义明确了电子出版物的重要特点。电子出版物的内容可分为电子图书、辞书手册、文档资料、报刊杂志、教育培训、娱乐游戏、宣传广告、信息咨询、简报等,许多作品是多种类型的混合。第8章 多媒体信息技术电子出版物的特点主要表现在集成性和交互性,即使用媒体种类多、表现力强、信息的检索和使用方式更加灵活方便,特别是信息的交互性不仅能向读者提供信息,而且能接收读者的反馈。电子出
8、版物的出版形式有电子网络出版和单行电子书刊两大类。电子网络出版是以数据库和通信网络为基础的新出版形式,在计算机管理和控制下,向读者提供网络联机服务、传真出版、电子报刊、电子邮件、教学及影视等多种服务。而单行电子书刊载体有软磁盘(FD)、只读光盘(CD-ROM)、交互式光盘(CD-I)、图文光盘(CD-G)、照片光盘(Photo-D)、集成电路卡(IC)和新闻出版者认定的其他载体。第8章 多媒体信息技术(5)多媒体声光艺术品的创作。专业的声光艺术作品包括影片剪接、文本编排、音响、画面等特殊效果的制作等。专业艺术家也可以通过多媒体系统的帮助增进其作品的品质,MIDI的数字乐器合成接口可以让设计者利
9、用音乐器材、键盘等合成音响输入,然后进行剪接、编辑、制作出许多特殊效果。电视工作者可以用媒体系统制作电视节目,美术工作者可以制作卡通和动画的特殊效果。制作的节目存储到VCD视频光盘上,不仅便于保存,图像质量好,价格也已为人们所接受。第8章 多媒体信息技术应用多媒体技术具有以下意义:(1)使计算机可以处理人类生活中最直接、最普遍的信息,从而使得计算机应用领域及功能得到了极大的扩展。(2)使计算机系统的人机交互界面和手段更加友好和方便,非专业人员也可以方便地使用和操作计算机。(3)多媒体技术使音像技术、计算机技术和通信技术三大信息处理技术紧密地结合起来,为信息处理技术发展奠定了新的基石。多媒体技术
10、发展已经有多年的历史了,到目前为止,声音、视频、图像压缩方面的基础技术已逐步成熟,并形成了产品进入市场,现在热门的技术如模式识别、MPEG压缩技术、虚拟现实技术正在逐步走向成熟,相信不久也会进入市场。第8章 多媒体信息技术2多媒体技术的发展趋势多媒体技术的发展趋势伴随着社会信息化步伐的加快,特别是近年来兴起的全球范围“信息高速公路”热潮的推动,多媒体的发展和应用前景将更加广阔。(1)分布式、网络化、协同工作的多媒体系统。在当前形式下,有线电视网、通信网和因特网这三网正在日趋统一,各种多媒体系统尤其是基于网络的多媒体系统,如可视电话系统、点播系统、电子商务、远程教学和医疗等将会得到迅速发展。一个
11、多点分布、网络连接、协同工作的信息资源环境正在日益完善和成熟。第8章 多媒体信息技术(2)三电(电信、电脑、电器)通过多媒体数字技术将相互渗透融合。多媒体技术的进一步发展将会充分地体现出多领域应用的特点,各种多媒体技术手段将不仅仅是科研工作的工具,而且还可以是生产管理的工具、生活娱乐的方式。如欣赏声像图书馆的各种资料、阅读电子杂志、向综合信息中心咨询、电子购物等。另外,还可以采用多媒体信息形式的远程通信,在这种状态下,虽然相距遥远,但其交谈和合作的感受却如同相聚一室。(3)以用户为中心,充分发展交互多媒体和智能多媒体技术与设备。对于未来的多媒体系统,人类可用日常的感知和表达技能与其进行自然的交
12、互,系统本身不仅能主动感知用户的意图,而且还可以根据用户的需求做出相应的反应,系统本身会具有越来越高的智能性。第8章 多媒体信息技术8.1.4 多媒体系统平台多媒体系统平台1什么是多媒体计算机系统什么是多媒体计算机系统多媒体计算机系统是能对文本、声音、图形、图像等多种媒体进行获取、编辑、存储、处理、加工和表现(输出)的一种计算机系统,包括多媒体硬件系统、多媒体操作系统、媒体处理系统工具和用户应用软件。(1)多媒体硬件系统:该系统包括计算机硬件、声音/视频处理器、多种媒体输入/输出设备及信号转换装置、通信传输设备及接口装置等。其中,最重要的是根据多媒体技术标准而研制生成的多媒体信息处理芯片和板卡
13、、光盘驱动器等。第8章 多媒体信息技术(2)多媒体操作系统:或称为多媒体核心系统(Multimedia kernel system),具有实时任务调度、多媒体数据转换、多媒体设备的驱动和同步控制,以及图形界面管理等。(3)媒体处理系统工具:或称为多媒体系统开发工具软件,是多媒体系统的重要组成部分。(4)用户应用软件:根据多媒体系统终端用户要求而定制的应用软件,或面向某一领域的用户应用软件系统,是面向大规模用户的系统产品。第8章 多媒体信息技术2多媒体系统构成多媒体系统构成(1)专门设计的多媒体计算机系统。(2)普通PC机+声卡等多媒体配件=多媒体个人计算机MPC(Multimedia Pers
14、onal Computer),如图8.1所示。图8.1 多媒体个人计算机第8章 多媒体信息技术8.2 音像王国的基石音像王国的基石多媒体技术基础多媒体技术基础8.2.1 音频信息处理音频信息处理1.声音的物理特征声音的物理特征声音一般可通过连续的波形来表示,波形的最大位移也就是振幅反映音量(音高、响度或强度)。波形中连续两个波峰或波谷之间的时间距离称为周期,周期的倒数称为频率。频率用Hz(赫兹)表示,用来反映声音的音调。另外,由于不同材质,不同的环境,所产生的声音所伴随的泛音也不同,所以也就产生了声音的音色特征。第8章 多媒体信息技术响度的大小决定于发声体振动的振幅,音调的高低决定于发声体振动
15、的频率,音色的不同取决于不同的泛音,每一种乐器、不同的人以及所有能发声的物体发出的声音,除了一个基音外,还有许多不同频率的泛音伴随,正是这些泛音决定了其不同的音色,使人能辨别出是不同的乐器甚至不同的人发出的声音。人的发音器官发出的声音频段在80 Hz到3400 Hz之间,人说话的信号频率范围为3003000 Hz,有的人将该频段的信号称为语音信号。第8章 多媒体信息技术音质是指声音的品质,主要是衡量声音的上述三方面是否达到一定的水准。即相对于某一频率或频段的音高是否具有一定的强度,并且在要求的频率范围内、同一音量下,各频点的幅度是否均匀、均衡、饱满,频率响应曲线是否平直,声音的音准是否准确,既
16、忠实地呈现了音源频率或成分的原来面目,频率的畸变和相移又符合要求。声音的泛音适中,谐波较丰富,听起来音色就优美动听。第8章 多媒体信息技术2音频音频1)音频等级音频(Audio)是指频率在20 Hz20 kHz范围内的可听声音,是多媒体信息中的一种媒体类型听觉类媒体。目前多媒体计算机中的音频主要有波形音频、CD音频和MIDI音乐三种形式(这三种形式全部都是数字音频,因为计算机所能处理的只有数字信号,所以只能以数字化的方式存储音频数据,如果是模拟式的声音,要首先经过抽样、量化和压缩编码等过程形成数字化音频,再由计算机进行存储及其他操作等)。第8章 多媒体信息技术反映数字化音频的质量的因素由采样频
17、率、量化位数和声道数3个参数决定。声道数是指记录声音时,如果每次生成1个声波的数据,称为单声道;每次生成2个声波数据,称为双声道(立体声);每次生成2个以上声波数据,称为多声道(环绕立体声)。数字音频等级如表8-1所示。表表8-1 数字音频等级数字音频等级第8章 多媒体信息技术2)声音的数字化和编码计算机处理音频信号之前,必须将模拟的声音信号数字化,产生数字音频,具体过程包括采样、量化、编码。图8.2所示为模拟声音信号数字化过程。图8.2 模拟声音信号数字化过程第8章 多媒体信息技术如图8.2(b)所示,采样是每间隔一段时间读取一次声音信号幅度,使声音信号在时间上被离散化。采样频率:指将模拟声
18、音波形数字化时,每秒钟所抽取声波幅度样本的次数,其计算单位是kHz(千赫兹)。一般来讲,采样频率越高声音失真越小,用于存储数字音频的数据量也越大。奈奎斯特(Nyquist)采样定律:采样频率应大于等于声音信号最高频率的两倍,就能把以数字表达的声音还原成原来的声音。例如,电话话音的信号频率约为3.4 kHz,采样频率就选为8 kHz;高质量声音采样频率为44.1 kHz。第8章 多媒体信息技术量化:就是把采样得到的声音信号幅度转换为数字值,是声音信号在幅度上被离散化,如图8.2(c)所示,量化位数是每个采样点能够表示的数据范围,常用的有8位、12位和16位。编码:音频数据压缩编码的方法有多种,可
19、分为无损压缩和有损压缩两大类。无损压缩主要包含各种熵编码;而有损压缩则可分为波形编码、参数编码、感知编码和同时利用多种技术的混合编码,图8.3给出了音频数据压缩编码的主要方法。第8章 多媒体信息技术图8.3 音频数据压缩方法分类第8章 多媒体信息技术波形编码是在模拟音频数字化(抽样和量化)的过程中,根据人耳的听觉特性进行编码,并使编码后的音频信号与原始信号的波形尽可能匹配,实现数据的压缩。参数编码把音频信号表示成某种模型的输出,利用特征提取的方法抽取必要的模型参数和激励信号的信息,且对这些信息编码,最后在输出端合成原始信号。混合编码介于波形编码和参数编码之间,集中了这两种方法的优点,可在较低的
20、码率上得到较高的音质。音频采样的数据量由两方面因素决定:(1)音质因素:由采样频率、量化位数和声道数3个参数决定。(2)时间因素:采样时间越长,数据量越大。第8章 多媒体信息技术3音频卡音频卡多媒体计算机系统中都有音频信号处理功能,但实现方法各不相同。美国苹果公司的Macintosh计算机一开始就被设计成具有音频处理能力的多媒体计算机,而使用Windows平台的PC系列机,起初没有声音处理能力,而是通过扩充一个专门的音频处理部件音频卡来实现其声音处理的。音频卡的功能:(1)录制和播放数字声音文件;(2)控制音量和混音效果;(3)声音文件的压缩与解压缩;(4)MIDI接口与音乐合成。音频卡的组成
21、和外围接口连接如图8.4、图8.5所示。第8章 多媒体信息技术图8.4 音频卡的组成框图第8章 多媒体信息技术图8.5 音频卡的外围接口连接示意图第8章 多媒体信息技术有的音频卡不再提供Line-Out插孔,一些新的音频卡产品追求功能的简单和较好的音效,所以简化了原来声卡上的MIDI和游戏杆功能,使之成为专门的声音处理部件。4音频采集音频采集在Windows 2000系统中,提供了录音参数的选择设置功能,其中的音质选择分为CD音质、电话质量、收音质量和Default Quality四种,还可以选择不同的采样频率、位宽和声道。为了防止录音过程中出现失真,可通过“音量控制”对话框来检测、调节进入计
22、算机的音源强度。Windows XP的录音机只能录60 s的音频数据,可以借助专业的音频处理软件进行音频录入,不但能够提供不限时长的录入功能,还可以使用不同的编码进行压缩存储。第8章 多媒体信息技术获取音频数据的另外一个方法是从不同的多媒体产品中直接抓取音轨信息,转换并压缩成自己所需的音频格式。一般的音频工具软件都具有直接抓取音乐CD的能力,而另一些软件则可以从更多媒体格式中抓取音轨。音频编辑一般包括音频内容剪切、合成以及音质和效果的编辑等方面。(1)多音轨(Multiple Tracks);(2)切边(Trimming);(3)拼接和组合(Splicing and Assembly;(4)音
23、量调节(Volume Adjustments);(5)格式转换(Format Conversion);第8章 多媒体信息技术(6)重采样或降低采样率(Resampling or Down sampling);(7)渐出和渐隐(Fade-ins and Fade-outs);(8)均衡(Equalization);(9)时间拉伸(Time Stretching);(10)数字信号处理(Digital Signal Processing,DSP)。第8章 多媒体信息技术5MIDIMIDI是Musical Instrument Digital Interface的缩写,译为乐器数字化接口。它规定了电
24、子乐器和多媒体计算机之间进行连接的硬件及数据通信协议,是多媒体计算机所支持的又一种声音产生方法MIDI方法。MIDI格式的数字化文件可以看做是乐谱的数字化描述,它记录的是乐器的种类,音阶的高低、长短、强弱、速度等因素,这些被称为MIDI消息,存储为MIDI文件。当需要播放时,从相应的MIDI文件中读出MIDI消息,通过音乐合成器产生相应的声音波形,经过放大后,再由扬声器输出。因为MIDI文件保存的是一系列由MIDI消息组成的“乐谱”,因此MIDI的播放音质是与设备有关的。第8章 多媒体信息技术两台MIDI设备之间可以通过接口发送信息而进行相互通信。一台MIDI设备可以有13个端口:(1)MID
25、I In接口接收来自其他MIDI设备上的MIDI信息。(2)MIDI Out接口用来输出本设备生成的MIDI信息。(3)MIDI Thru接口将从MIDI In端口传来的信息发送到另一台相连的MIDI设备上。在进行MIDI通信时,用户可以通过标准的MIDI电缆来相互连接各端口。MIDI电缆由一根屏蔽的双绞线和两端带有插入式的5针D型插头组成,如图8.6所示。第8章 多媒体信息技术图8.6 MIDI电缆第8章 多媒体信息技术MIDI设备还可以配备电子键盘、合成器、音序器(MIDI软件)以及扬声器或音箱等。多媒体计算机与MIDI设备的连接方法如图8.7所示。图8.7 多媒体计算机与MIDI设备的连
26、接第8章 多媒体信息技术MIDI软件(音序器)是用于记录、编辑和播放MIDI文件的一种软件,其作用相当于是MIDI乐器的一台多轨磁带录音机。声卡播放MIDI音乐最常用的方法有两种,就是FM合成与波表合成。FM是运用声音振荡的原理对MIDI进行合成处理的,但由于技术本身的局限,加上这类声卡大多采用廉价的YAMAHA OPI系列芯片,效果较差。波表(WaveTable)合成的效果较好,它是将各种真实乐器所能发出的所有声音(包括各个音域、声调)录制下来,存储在声卡的ROM中,称为硬波表,播放时,根据MIDI文件记录的乐曲信息向波表发出指令,从表格中逐一找出对应的声音信息,经过合成、加工后回放出来。由
27、于波表采用的是真实乐器的采样,所以效果自然要好于FM。第8章 多媒体信息技术从技术上讲,创作MIDI音乐的过程与将现有的音频数字化的过程完全不同。如果把数字化音频比成位图图像,那么MIDI就可以类比为矢量图形。为了制作MIDI音乐,需要按图8.7的示意构成系统,即多媒体计算机中的声卡需要带一个声音合成器,还要一个作曲软件及一个MIDI键盘,这样才具备创作MIDI乐谱的基础条件。乐谱创作软件能够录制、编辑、打印MIDI乐谱,并播放MIDI音乐。另外,一些乐谱创作软件还能对乐谱进行量化来调节节拍的不一致问题。MIDI编辑中很重要的是选择MIDI乐器,MIDI标准规定了不同的演奏乐器,用0到127之
28、间的编号加以区分。第8章 多媒体信息技术目前,MIDI是为多媒体项目创建原始音乐素材的最佳途径,使用MIDI能够带来您所希望得到的灵活性和创新。手机彩玲就是通过MIDI制作的。Musitek公司开发的SmartSore软件不仅是一个乐谱创作软件,而且可以用来扫描识别乐谱。SmartSore的基本思想与文字的OCR技术类似:首先通过扫描仪,将乐谱以图像的方式扫描成数字图像,注意扫描参数的选择与设置,分辨率一般选择150300 dpi,图像类型为黑白二值或OCR,扫描后的图片以TIF格式存储;然后通过乐谱识别功能识别出可编辑的数字乐谱,并进行校对、编辑。识别完成后会提示将识别的结果保存为Smart
29、Score专用格式的.enf文件。第8章 多媒体信息技术6MIDI和数字音频的比较和数字音频的比较MIDI数据本身并非数字化的声音,它只是利用数字形式对乐谱的速记符号。MIDI文件比数字音频文件尺寸更小,MIDI文档的大小与播放质量完全无关。由于MIDI文件非常小,可以嵌入到网页中,因此下载和播放要比相当的数字音频速度快。在有些情况下,如果使用的MIDI声源质量很高,MIDI将会比数字音频文件听起来更好。MIDI数据是完全可编辑的,可对MIDI音乐的音符、音高、输出设备等很小的乐谱单元作精确编辑和修改。MIDI数据是与设备有关,MIDI音乐文件制作的声音也依赖于特定的回放设备。第8章 多媒体信
30、息技术数字音频与播放设备无关,需要较大的数据存储空间。由于MIDI数据并不表示实际的声音,而是音乐设备的声音,因此只要MIDI的播放设备与制作MIDI时使用的设备不一样,就无法保证播放的最佳效果。采用MIDI无法表示语音信号。采用数字音频还有两个经常起决定性作用的原因:(1)Macintosh和Windows平台为数字音频提供了更多的应用软件和系统支持。(2)创建数字音频的准备和编程并不需要具备音乐理论的专业知识,但是处理MIDI数据不但需要了解音频制作,而且需要对音乐乐谱、键盘和音符有所了解。第8章 多媒体信息技术7相关工具介绍相关工具介绍(1)音频制作软件。音频制作软件主要完成MIDI乐谱
31、的制作、编辑等功能。常见的有Cakewalk Sonar、Logic Audio、Band in a Box、Guitar Pro等。Cakewalk Sonar:具备MIDI、音频、音源(合成器)的一体化制作能力。Logic Audio:提供多项高级MIDI和音频的录制和编辑、专业品质的采样音源(EXS24)和模拟合成器(ESI)。Band in a Box:“傻瓜式”MIDI制作软件,适合于缺乏系统的作曲、配器训练、非专业、要求不高的电脑音乐爱好者和入门者选用。第8章 多媒体信息技术 Guitar Pro:MIDI制作、吉他六线谱、BASS四线谱绘制、打印软件。在用MIDI制作吉他、BAS
32、S等弹拨乐器的滑音、推弦等方面,具有绝对的优势。这款软件操作简单、容易上手,可作为计算机音乐、MIDI制作时的辅助软件来使用。(2)音频处理类软件。音频处理类软件主要完成对数字音频的录音采集、剪辑、效果处理以及格式转换等功能。常见的有Cool Edit Pro、Sound Forge、Samplitude、T-RackS、Nuendo、Vegas Audio、WaveLab、Ulead Audio Editor等。第8章 多媒体信息技术 Cool Edit Pro 可以在普通声卡上同时处理64轨的音频信号,具有极丰富的音频处理效果,并能进行实时预览和多轨音频的混缩合成,是个人音乐工作室的音频处
33、理首选软件。Sound Forge:一款音频录制、处理软件。Samplitude:专业级别的多轨音频录制、处理、混缩软件,支持24 bit、96 kHz的高采样率,支持无限轨超级缩混,更重要的是采用了精确独特的内部算法。T-RackS:一款处理成品音频的音频修饰类软件,可以将“粗制滥造”的音频修饰的焕然一新,极具专业水准。第8章 多媒体信息技术 Nuendo:一款集MIDI、音频、混音等功能于一体的音乐软件,支持视频5.1环绕立体声的制作,功能强大,品质超群。Vegas Audio:一款多轨音频处理软件。该软件操作简便,极易上手。此外,音乐制作、音频处理类软件还有很多,比如自动伴奏(编曲)软件
34、、鼓机软件、打谱软件、舞曲软件、音色采样软件、音色拼接软件、识别、转换软件等。第8章 多媒体信息技术(3)音频剪辑软件。音频剪辑软件主要用在裁剪空白和拼接组合等方面,主要的处理方法与文本内容处理类似,即使用选择(定义区域)、复制(或剪裁)、粘贴的基本方法。操作过程为,先用不同的方法选择一段要复制或裁剪的音频,然后选中主菜单Edit的Cut或Copy进行剪切或复制。最后,选定要粘贴的准确位置,再选择Edit菜单中的Paste完成粘贴工作。第8章 多媒体信息技术(4)放大、缩减、去噪类软件。该类工具软件用于对数字音频的播放效果进行处理。当需要缩放音量时,首先选定一段音频,然后选择Effect菜单中
35、的Amplify命令,适当调整音量放大百分数,就可以实现音量的放大与减小。去噪是通过拖动滚动条来实现的,范围为1%100%。数值越小表示去噪越精细;调整到100%,则表示把选定的一段音频静音。第8章 多媒体信息技术(5)渐变效果处理软件。淡入、淡出是数字音频处理最常见的效果,它是通过音量的逐渐增强和逐渐减小来实现的。当需要对某段音频添加渐变效果时,可首先选定这段音频,然后打开Effect菜单中的Fade菜单项,选择(淡入、淡出)或自定义一种渐变效果,同时选择、调整渐变关系,就可得到满意的渐变效果。第8章 多媒体信息技术(6)其他效果处理。在Audio Editor 中提供了比如Reverse(
36、反向)、Invert(倒转波形)、Speed(调整音频播放速度)、Echo(回声效果)以及DirectX Audio和Audio Effect DMO等效果处理功能。其中,DirectX Audio包含了一组由SONY和Cakewalk提供的约40多种不同效果,而Audio Effect DMO则包含了微软提供的9种效果。第8章 多媒体信息技术(7)声音格式转换。声音格式转换指在编辑过程中,对音频采样参数的改变。Audio Editor中提供了这种改变声音采样参数的功能。当需要时可以选择Edit菜单中的Convert To命令,通过在Convert To对话框中选择合适的采样参数来实现声音格式
37、的改变。(8)合并与混合处理。合并是指将不同的单声道信息合并成时间上重叠的多声道音频,最后可用一个多声道文件保存。合并的对象必须是对两个单声道的音频文件。混合是将两个文件的声音混合成一个文件,混合前文件为单声道,混合后的文件仍然是单声道。混合时需要调节音量比例。第8章 多媒体信息技术8音频编音频编/解码详述解码详述数字音频信息的压缩主要是依据音频信息自身的相关性以及人耳对音频信息的听觉冗余度。音频信息在编码技术中通常分成两类来处理,分别是语音和音乐,各自采用的技术有差异。现代声码器的一个重要的课题是,如何把语音和音乐的编码融合起来。1)语音编码语音编码技术又分为三类:波形编码、参数编码以及混合
38、编码(圴属于无损压缩)。第8章 多媒体信息技术波形编码:波形编码是在时域上进行处理,力图使重建的语音波形保持原始语音信号的形状,它将语音信号作为一般的波形信号来处理,具有适应能力强、话音质量好等优点,缺点是压缩比偏低。该类编码的技术主要有非线性量化技术、时域自适应差分编码和量化技术。非线性量化技术利用语音信号小幅度出现的概率大而大幅度出现的概率小的特点,通过为小信号分配小的量化阶,为大信号分配大的量化阶来减少总量化误差。我们最常用的G.711标准用的就是这个技术。自适应差分编码是利用过去的语音来预测当前的语音,只对它们的差进行编码,从而大大减少了编码数据的动态范围,节省了码率。自适应量化技术是
39、根据量化数据的动态范围来动态调整量阶,使得量阶与量化数据相匹配。第8章 多媒体信息技术G.726标准中应用了这两项技术,G.722标准把语音分成高、低两个子带,然后在每个子带中分别应用这两项技术。参数编码:利用语音信息产生的数学模型,提取语音信号的特征参量,并按照模型参数重构音频信号。它只能收敛到模型约束的最好质量上,力图使重建语音信号具有尽可能高的可懂性,而重建信号的波形与原始语音信号的波形相比可能会有相当大的差别。这种编码技术的优点是压缩比高,但重建音频信号的质量较差、自然度低,适用于窄带信道的语音通信,如军事通信、航空通信等。美国的军方标准LPC-10就是从语音信号中提取出来反射系数、增
40、益、基音周期、清/浊音标志等参数进行编码的。MPEG-4标准中的第8章 多媒体信息技术HVXC声码器用的也是参数编码技术,当它在无声信号片段时,激励信号与CELP(码激励线性预测编码)相似,都是通过一个码本索引和通过幅度信息描述;在发声信号片段时则应用了谐波综合,它是将基音和谐音的正弦振荡按照传输的基频进行综合。第8章 多媒体信息技术混合编码:将上述两种编码方法结合起来,采用混合编码的方法,可以在较低的数码率上得到较高的音质。它的基本原理是合成分析法,将综合滤波器引入编码器,与分析器相结合,在编码器中将激励输入综合滤波器产生与译码器端完全一致的合成语音,然后将合成语音与原始语音相比较(波形编码
41、思想),根据均方误差最小原则,求得最佳的激励信号,然后把激励信号以及分析出来的综合滤波器编码送给解码端。这种得到综合滤波器和最佳激励的过程称为分析(得到语音参数);用激励和综合滤波器合成语音的过程称为综合。第8章 多媒体信息技术由此我们可以看出,CELP编码把参数编码和波形编码的优点结合在了一起,使得用较低码率产生较好的音质成为可能。通过设计不同的码本和码本搜索技术,产生了很多编码标准,目前我们通信中用到的大多数语音编码器都采用了混合编码技术。例如,在互联网上的G.723.1和G.729标准,在GSM上的EFR、HR标准,在3GPP2上的EVRC、QCELP标准,在3GPP上的AMR-NB/W
42、B标准等等。第8章 多媒体信息技术2)音乐编码音乐编码主要有自适应变换编码(频域编码)、心理声学模型和熵编码等技术(均属于有损压缩)。自适应变换编码:利用正交变换,把时域音频信号变换到另一个域,由于去相关的结果,变换域系数的能量集中在一个较小的范围,所以对变换域系数最佳量化后,可以实现码率的压缩。理论上的最佳量化很难达到,通常采用自适应比特分配和自适应量化技术来对频域数据进行量化。在MPEGlayer3和AAC标准及Dolby AC-3标准中都使用了改进的余弦变换(MDCT);在ITUG.722.1标准中则用的是重叠调制变换(MLT)。本质上它们都是余弦变换的改进。第8章 多媒体信息技术心理声
43、学模型:其基本思想是对信息量加以压缩,同时使失真尽可能不被觉察出来,利用人耳的掩蔽效应就可以达到此目的,即较弱的声音会被同时存在的较强的声音所掩盖,使得人耳无法听到。在音频压缩编码中。利用掩蔽效应,就可以通过给不同频率处的信号分量分配以不同的量化比特数的方法来控制量化噪声,使得噪声的能量低于掩蔽阈值,从而使得人耳感觉不到量化过程的存在。在MPEGlayer2、3和AAC标准及Dolby AC-3标准中都采用了心理声学模型,在目前的高质量音频标准中,心理声学模型是一个最有效的算法模型。第8章 多媒体信息技术熵编码:根据信息论的原理,可以找到最佳数据压缩编码的方法,数据压缩的理论极限是信息熵。如果
44、要求编码过程中不丢失信息量,即要求保存信息熵,这种信息保存编码叫熵编码,它是根据信息出现概率的分布特性而进行的,是一种无损数据压缩编码。常用的有霍夫曼编码和算术编码。在MPEG layer1、2、3和AAC标准及ITUG.722.1标准中都使用了霍夫曼编码;在MPEG 4BSAC工具中则使用了效率更高的算术编码。第8章 多媒体信息技术3)数字音频编码的主要应用对数字音频信息的编码进行压缩的目的,是在不影响人们使用的情况下使数字音频信息的数据量最少。通常用如下6个属性来衡量:比特率;主观/客观的语音质量;计算复杂度和对存储器的要求;延迟;对于通道误码的灵敏度;信号的带宽。第8章 多媒体信息技术由
45、于不同的应用,人们对数字音频信息的要求是不同的,并且在选择数字音频信息编码所采用的技术时也需要了解人们对音频信息的各种应用。目前数字音频信息处理技术主要应用于以下几个方面:(1)消费电子类数字音响设备。CD唱机、数字磁带录音机(DAT)、MP3播放机以及MD(MiniDisc)唱机已经广泛地应用了数字音频技术。(2)广播节目制作系统。在声音节目制作系统,如录音、声音处理加工、记录存储、非线性编辑等环节使用了数字调音台、数字音频工作站等数字音频设备。第8章 多媒体信息技术(3)多媒体应用。在多媒体上的应用体现在VCD、DVD、多媒体计算机以及Internet。VCD采用MPEG-1编码格式记录声
46、音和图像;DVD-Audio格式支持多种不同的编码方式和记录参数,可选的编码方式包括无损的MLP、DSD、Dolby AC-3、MPEG2-layer2Audio等,而且是可扩充的、开放的,并可以应用未来的编码技术;Internet上采用MP3的音频格式传输声音,以提高下载能力。(4)广播电视数字化。在广播电视和数字音频广播系统中,声音编码采用MUSICAM编码方法,符合MPEG-1Layer1高级音频编码。如当今的数字电视采用的音频标准就是Dolby AC-3和MPEG-layer2。第8章 多媒体信息技术(5)通信系统。在通信系统中,必须对音频进行压缩。传统的PSTN电话中采用的是G.71
47、1和G.726的标准;GSM移动通信采用的是GSMHR/FR/EFR标准;CDMA移动通信采用的是3GPP2EVRC、QCELP8k、QCELP16k、4GV标准;WCDMA第3代移动通信采用的是3GPPAMR-NB、AMR-WB标准。另外在IPTV和移动流媒体中,采用的是AMR-WB+和AAC的标准。第8章 多媒体信息技术总之,根据应用场合的不同,可以将数字音频编码分为如下两种编码:语音编码:针对语音信号进行的编码,主要应用于实时语音通信中减少语音信号的数据量。典型的编码标准有ITU-TG.711、G.722、G.723.1、G.729;GSMHR、FR、EFR;3GPPAMR-NB、AMR
48、-WB;3GPP2 QCELP8k、QCELP 13k、EVRC、4GV-NB等。音频编码:针对频率范围较宽的音频信号进行的编码,主要应用于数字广播和数字电视广播、消费电子产品、音频信息的存储和下载等。典型的编码有MPEG1/MPEG2的layer1、2、3和MPEG 4 AAC的音频编码。还有最新的ITU-T G.722.1、3GPP AMR-WB+和3GPP 2 4GV-WB,它们在低码率上的音频表现也很不错。第8章 多媒体信息技术4)音频编码标准发展现状(1)语音编码标准发展现状。国际电信联盟(ITU)主要负责研究和制定与通信相关的标准,作为主要通信业务的电话通信业务中使用的语音编码标准
49、均是由ITU负责完成的。其中用于固定网络电话业务使用的语音编码标准如ITU-TG.711等主要在ITU-TSG15完成,并广泛应用于全球的电话通信系统之中。随着Internet网络及其应用的快速发展,在2005年到2008年研究期内,ITU-T将研究和制定变速率语音编码标准的工作转移到主要负责研究和制定多媒体通信系统、终端标准SG16中。第8章 多媒体信息技术在欧洲、北美、中国和日本的电话网络中通用的语音编码器是8位对数量化器(相应于64kb/s的比特率)。该量化器所采用的技术在1972年由CCITT(ITU-T的前身)标准化为G.711。在1983年,CCIT规定了32Kb/s的语音编码标准
50、G.721,其目标是在通用电话网络上的应用(标准修正后称为G.726)。这个编码器价格虽低但却提供了高质量的语音。至于数字蜂窝电话的语音编码标准,在欧洲,TCH-HS是欧洲电信标准研究所(ETSI)的一部分,由他们负责制定数字蜂窝标准。在北美,这项工作是由电信工业联盟(TIA)负责执行。在日本,由无线系统开发和研究中心(称为RCR)组织这些标准化的工作。第8章 多媒体信息技术此外,国际海事卫星协会(Inmarsat)是管理地球上同步通信卫星的组织,也已经制定了一系列的卫星电话应用标准。(2)音频编码标准发展现状。音频编码标准主要由ISO的MPEG组来完成。MPEG1是世界上第一个高保真音频数据
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。