1、1 17.1 多媒体技术概述7.2 多媒体创作工具介绍7.3 图像的基础知识7.4 声音的基础知识7.5 视频的基础知识第7章 计算机多媒体基础2 27.1 多媒体技术概述7.1.1 多媒体的有关概念在学习多媒体的相关知识之前,首先要明确有关概念,如什么是媒体、什么是多媒体、什么是多媒体技术等。3 31媒体(Medium)媒体又常常称为媒介,是日常生活和工作中经常用到的词汇,如我们经常把报纸、广播、电视等称为新闻媒体,报纸通过文字、广播通过声音、电视通过图像和声音来传送信息。我们把传播信息的载体称为媒体。媒体有两层含义:一是指承载信息所使用的符号系统,如文本、图形、图像、音频、视频、动画等,媒
2、体呈现时采用的符号系统将决定媒体的信息表达功能;二是指存储、加工和传递信息的实体,如书本、挂图、投影片、录像带、计算机以及相关的播放、处理设备等。4 42多媒体(Multimedia)关于“多媒体”概念的标准定义目前还没有统一,“多媒体”一词译自英文Multimedia,这是一个合成词,即由Multiple(多种)和Media(媒体)两个单词组成的合成词,所以一般理解为“多种媒体的综合”。在计算机信息处理领域中,所谓多媒体是指计算机与人进行交流的多种媒体信息,包括文本、图形、图像、声音、动画、视频等信息。5 53多媒体技术(Multimedia Technology)多媒体技术有以下几个主要特
3、点:(1)多样性:指信息载体的多样化,包括文本、图形、图像、视频、语音等多种媒体信息。(2)集成性:能够以计算机为中心综合处理多种信息媒体,包括信息媒体的获取、存储、组织与合成。(3)交互性:指用户可以与计算机的多种信息媒体进行交互操作,从而为用户提供更加有效地控制和使用信息的手段。6 6(4)实时性:指当用户给出操作命令时,马上会得到相应的多媒体反馈信息。实时多媒体分布系统把计算机的交互性、通信的分布性和电视的真实性有机地结合在一起。(5)数字化:指多媒体中的各种媒体都是以数字形式存放在计算机中。7 74多媒体计算机(Multimedia Computer)多媒体计算机是能够对声音、图像、视
4、频等多媒体信息进行综合处理的计算机。多媒体计算机一般指多媒体个人计算机(MPC),目前来说,普通个人计算机都具有多媒体处理功能,只是在配置上增加一些相关的外设即可。8 8图7-1 多媒体计算机构成示意图9 97.1.2 多媒体技术的应用1家庭娱乐数字影视和娱乐工具已进入我们的生活,例如,家庭有线电视可以通过增加机顶盒和铺设高速光纤电缆,将单向有线电视改造成为双向交互电视系统。这样用户看电视时就可以使用点播、选择等方式随心所欲地找到自己想看的节目。10 102教育培训教育培训是多媒体技术最有前途的应用领域之一,世界各国的教育学家们正努力研究用先进的多媒体技术改进教学与培训。11 113商业应用
5、多媒体技术的商业应用很广泛,它不仅给我们的日常生活带来了无限的便利和轻松,而且也给广大的商家带来了巨大的利润。例如,产品展示、企业宣传片、电视广告等多媒体作品在进行企业与产品推广的同时,为商家赢得了商机。12 124电子出版物国家新闻出版总署规定:电子出版物是指以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上,通过计算机或类似设备阅读使用,并可复制发行的大众传播媒体。从内容上划分,电子出版物可分为电子图书、辞书手册、文档资料、报刊杂志、教育培训、娱乐游戏、宣传广告、信息咨询和简报等多种类型,例如,图书所附带的多媒体教学光盘实际上就是一种电子出版物。13 135广播电视、通信领域计算机
6、网络技术、通信技术和多媒体技术结合是现代通信发展的必然要求。多媒体通信技术可以把电话、电视、图文传真、音响、摄像机等各类电子产品与计算机融为一体,完成多媒体信息的网络传输、音频播放和视频显示。目前,多媒体技术在广播电视、通信领域的应用已经取得许多新进展,多媒体会议系统、多媒体交互电视系统、多媒体电话、远程教学系统和公共信息查询等一系列应用正在改变着我们的生活。14 146其他领域中的应用 多媒体技术在办公自动化方面主要体现在对声音和图像的处理上。采用语音自动识别系统可以将语言转换成相应的文字,同时又可以将文字翻译成语音。通过OCR(Optical Character Recognition,光
7、学字符识别)系统可以自动输入手写文字并以文字的格式存储。15 157.1.3 多媒体技术的发展多媒体技术是不断发展和不断完善的。如今,多媒体技术的发展已成为信息技术发展的重要组成部分。并不是有了计算机以后就产生了多媒体技术,多媒体技术的发展是从第四代计算机开始的。16 167.2 多媒体创作工具介绍7.2.1 素材处理软件在创作多媒体作品时会使用到大量的素材,如文字素材、图像素材、声音素材、视频素材等,所以要学会对这些素材的处理。17 171文字素材的处理在多媒体信息载体中,文字是最重要的一种信息传播媒介。无论计算机技术发展到何种程度,文字依然是最重要的载体,因此,几乎所有的应用软件都有文字处
8、理功能。如果多媒体作品对文字的要求不高,那么,多媒体创作软件本身就可以完成文字的录入、编辑。如果要对文字进行编辑与艺术加工,则要借助专业的文字处理软件Word或WPS等。18 182图像素材的处理在多媒体作品中,图像素材占据了很大的比例。处理图像素材是制作多媒体作品之前的一项关键工作,主要分为两大类:一是多媒体作品的界面设计;二是多媒体内容中出现的图像。19 193声音素材的处理 创作多媒体作品时经常要用到音效、配音、背景音乐等。声音的格式很多,如基于PC系统的WAV、MIDI格式,基于MAC系统的SND、AIF格式,这些格式之间经常需要转换,因此,声音素材的采集整理需要更多软件的支持。202
9、04动画素材的处理 多媒体作品中使用的动画主要有两种:二维动画和三维动画。通常情况下,比较普及的二维动画软件是Flash,而三维动画软件是3DS max。当然也可以使用一些小型的制作工具,如Swish、Cool3D等。21 215视频素材的处理视频以其生动、活泼、直观的特点,在多媒体系统中得到了广泛的应用,并扮演着极其重要的角色。例如制作企业的多媒体宣传片、产品推广宣传片等要用到大量的视频文件,常用的视频素材是AVI、MOV和MPG格式的视频文件。视频处理软件主要有Adobe Premiere和会声会影。22227.2.2 多媒体开发软件1DirectorDirector是Macromedia
10、公司推出的一款交互式多媒体项目集成开发工具,具有强大的面向对象开发能力,用户可以根据需要将图片、声音、三维动画、视频电影、数据库访问、Internet链接等技术集成在一个作品中,从而制作出复杂的多媒体交互程序,广泛应用于多媒体光盘、教学/汇报课件、触摸屏软件、网络电影、网络交互式多媒体查询系统、企业多媒体形象展示、游戏和屏幕保护程序等的开发制作。2323Director具有以下特点:(1)提供了专业的编辑环境,高级的调试工具以及方便易用的属性面板,使得 Director 的操作简单方便,大大提高了开发的效率。(2)支持广泛的媒体类型,包括多种图像格式以及QuickTime、AVI、MP3、WA
11、V、AIFF、高级图像合成、动画、同步和声音播放效果等40多种媒体类型。(3)强大的交互功能使创作者可以随心所欲地开发多媒体项目,不熟悉编程的用户可以通过拖放预设的Behavior完成交互的制作,而程序员则可以通过Lingo制作出更复杂的交互效果、数据跟踪及二维和三维动画效果。2424(4)Director 独有的Shockwave 3D引擎可以轻松地创建互动的三维空间,实现虚拟现实,制作交互的三维游戏,提供引人入胜的用户体验。(5)可扩展性强。Director采用了Xtra体系结构,可以为 Director 添加无限的自定义特性和功能。25252AuthorwareAuthorware是Ma
12、cromedia公司开发的多媒体制作工具。它是一种解释型、基于流程的多媒体制作软件,被用于创建互动的程序,其中整合了声音、文本、图形、简单动画以及数字电影,是一款非常优秀的多媒体创作软件,易学易用,创作出来的作品效果好,非常适合初学多媒体创作的用户使用。2626Authorware具有以下特点:(1)具备强大的集成能力。(2)具备强大的交互能力。(3)具备直观易用的开发界面。(4)具备高效开发模块。(5)强大的数据处理与编程能力。27273其他工具除了前面介绍的两个比较流行的工具外,还有一些其他的可用于多媒体开发的工具,如Flash、PowerPoint等。28287.3 图像的基础知识7.3
13、.1 位图与矢量图数字图像以文件的形式保存,即图像文件,从图像数据的表示方法上,可以将图像分为两大类位图和矢量图。前者以点阵的形式描述图形图像,后者以数学方法描述由几何元素组成的图形图像。通常我们将点阵图称为图像,把矢量图称为图形。29291位图位图又称为“栅格图或点阵图”,由描述图像的各个像素点的明暗强度与颜色的位数集合组成,工作方式类似于在画布上作画。将图像放大到一定的程度,就会发现它是由一个个小栅格组成的,这些小栅格称为像素,像素是图像中最基本的元素,位图图像的大小与质量取决于图像中像素的多少。Photoshop 编辑的图像就是位图,处理位图时,实际上是编辑像素而不是图像本身。3030图
14、7-2 位图31 312矢量图矢量图由一些几何图形,如点、线、矩形、多边形、圆和弧线等元素组成,在计算机中记录了这些几何图形的形状参数与属性参数,这些参数值决定了图形应如何显示在屏幕上。矢量图可以按任意分辨率进行打印,而不会丢失细节或降低清晰度。因此,矢量图形最适合表现醒目的图形。由于矢量图没有精度的概念,因而任意缩放图形都不会出现锯齿,如图7-3所示。3232图7-3 矢量图3333一般来说,位图能够细致、真实地描述对象,但是放大图像时会失真;而矢量图无论如何放大都不会失真,但是难以表现色彩层次丰富的图像。表7-1是位图与矢量图特点的比较。343435357.3.2 图像文件的属性1分辨率在
15、位图中,图像的分辨率是指单位长度上的像素数,习惯上用每英寸中的像素数来表示(即pixels per inch,ppi)。相同尺寸的图像,分辨率越高,单位长度上的像素数越多,图像越清晰;分辨率越低,单位长度上的像素数越少,图像越粗糙。36362颜色深度颜色深度也称做位深,是指表示一个像素所需的二进制数的位数,以比特(bit)作为单位。颜色深度一般写成2的n次方,n代表位数,反映了构成图像颜色的总数目,位数越高,图像的颜色越丰富。当用1位二进制数表示像素时,即单色(黑白)图像,这时只有黑色、白色两种颜色,如图7-4所示;当用8位二进制数表示像素时,即灰度图像,它可以由0255不同灰度值来表示图像的
16、灰阶,如图7-5所示;当位数达到24位时,可以表现出1680万种颜色。一般认为当采用24位色彩深度时就已经达到人眼分辨能力的极限,因此24位颜色也称为“真彩色”。3737图7-4 黑白图像 3838 图7-5 灰度图像 39393图像文件大小计算机以字节(byte)为单位表示图像文件的大小,数据量大是图像数据的显著特点,即使使用压缩算法存储的文件格式,数据量也是相当大的,图像文件的大小与图像所表现的内容无关,与图像的尺寸、分辨率、颜色数量等文件格式有关。40407.3.3 颜色模式1RGB颜色模式RGB颜色模式是基于光色的一种颜色模式,所有发光体都是基于该模式工作的,例如,电视机、电脑显示器、
17、幻灯片等都是基于RGB模式来还原自然界的色彩。在该模式下,R代表Red(红色),G代表Green(绿色),B代表Blue(蓝色),这三种颜色就是光的三原色,每一种颜色都有256个亮度级别,所以三种颜色通过不同比例的叠加就能形成约1680万种颜色(真彩色),几乎可以得到大自然中所有的色彩。41 41通俗地理解RGB模式,可以把它想象成红、绿、蓝三盏灯,当它们的光相互叠加的时候,就会产生不同的色彩,如图7-6所示,并且每盏灯有256个亮度级别,当值为0时表示“灯”关掉,当值为255时表示“灯”最亮。4242图7-6 RGB模型43432CMYK颜色模式 CMYK颜色模式是针对印刷的一种颜色模式。印
18、刷需要油墨,所以CMYK模式对应的媒介是油墨(颜料)。在印刷时,通过洋红(Magenta)、黄色(Yellow)、青色(Cyan)三原色油墨进行不同配比的混合,可以产生非常丰富的颜色信息,我们使用从 0 至 100%的浓淡来控制。从理论上来说,只需要C、M、Y三种油墨就足够了,它们三个100%地混合在一起就应该得到黑色。但是由于目前制造工艺还不能造出高纯度的油墨,所以C、M、Y混合后的结果实际是一种暗红色。4444图7-7 CMYK模型45453HSB颜色模式 HSB颜色模式是一种从视觉的角度定义的颜色模式。基于人类对色彩的感觉,HSB模型描述颜色的三个特征将色彩分为H(Hue,色相)、S(S
19、aturation,饱和度)和B(Brightness,亮度)三个要素。46464索引颜色模式索引颜色模式最多使用256种颜色,当将图像转换为索引颜色模式时,通常会构建一个调色板存放并索引图像中的颜色。如果原图像中的一种颜色没有出现在调色板中,程序会选取已有颜色中最相近的颜色或使用已有颜色来模拟该种颜色。47477.3.4 常见的图像文件格式1JPEG格式JPEG是Joint Photographic Experts Group(联合图像专家组)的缩写,文件后辍名为.jpg或.jpeg,是使用最广泛的图像格式,是一种有损压缩格式,能够将图像压缩在很小的储存空间内,压缩技术十分优越,可以用最少的
20、磁盘空间得到较好的图象质量。但是要注意,使用过高的压缩比例将会影响图像的质量,如果追求高品质图像,不宜采用过高的压缩比例。48482PSD格式PSD是Photoshop图像处理软件的专用文件格式,文件扩展名是.psd,可以支持图层、通道、蒙版和不同色彩模式的各种图像特征,是一种非压缩的原始文件保存格式,所以占据的磁盘空间较大。扫描仪不能直接生成该种格式的文件。PSD文件有时容量会很大,但由于可以保留所有原始信息,在图像处理中对于尚未制作完成的图像,选用 PSD格式保存是最佳的选择。49493PNG格式PNG是Portable Network Graphics(可移植性网络图像)的缩写,是网络上
21、接受的最新图像文件格式。PNG能够提供长度比GIF小30的无损压缩图像文件,同时提供 24位和48位真彩色图像,并且PNG格式的图像支持背景透明,这为制作多媒体与网页中的导航按钮、标题图片等提供了非常好的支持,既可以保证图像颜色的层次,又能够做到背景透明。50504BMP格式BMP格式是Windows最早支持的位图格式,文件几乎不压缩,占用磁盘空间较大,它的颜色存储格式有1位、4位、8位及24位。该格式仍然是当今应用比较广泛的一种格式,但由于其文件尺寸比较大,所以多应用在单机上,不受网络欢迎。51 515AI格式AI格式是Adobe公司开发的矢量图象处理软件Illustrator所使用的文件格
22、式,也是当今最流行的矢量图像格式之一,广泛应用于印刷出版业等。现已成为业界矢量图的标准,几乎所有的图形软件都能导入AI格式。它的优点是占用硬盘空间小,打开速度快,方便格式转换。52526CDR格式CDR格式是绘图软件CorelDRAW的专用图形文件格式。由于CorelDRAW是矢量图形绘制软件,所以CDR可以记录文件的属性、位置和分页等。但它在兼容度上比较差,其他图像编辑软件打不开此类文件。53537.4 声音的基础知识7.4.1 声音的定义声音是因物体的振动而产生的一种物理现象,振动使物体周围的空气绕动而形成声波,声波以空气为媒介传入人们的耳朵,于是人们就听到了声音。因此,从物理上讲,声音是
23、一种波。54547.4.2 声音的分类声音的分类有多种标准,根据客观需要可有以下三种分类标准。(1)按频率划分,可分为亚音频、音频、超音频和过音频。频率分类的意义主要是为了区分音频声音和非音频声音。(2)按原始声源划分,可分为语音、乐音和声响。按发出声音的声源分类,是为了针对不同类型的声音使用不同的采样频率进行数字化处理和依据它们产生的方法和特点采取不同的识别、合成和编码方法。(3)按存储形式划分,可分为模拟声音和数字声音。55557.4.3 声音的数字化 人们平时听到的声音是典型的连续信号,不仅在时间上是连续的,在幅度上也是连续的。我们把时间和幅度上都连续的信号称为模拟信号,由于计算机只能处
24、理数字信息,所以声音进入计算机的第一步就是数字化,从技术上来说,就是将连续的模拟声音信息通过模/数转换器(A/D)转换为计算机可以处理的数字信息。5656数字化声音的具体原理是:输入模拟声音信号,然后按照固定的时间间隔获取模拟声音信号的振幅值,再将获取的振幅值用若干二进制数表示,从而将模拟声音信号变成数字声音信号。衡量声音数字化的质量有以下三个指标。(1)采样频率。(2)量化位数。(3)声道数。57577.4.4 常见声音文件格式1WAV格式WAV格式是微软公司开发的一种声音文件格式,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。58582MP3格式MP3的全称是Moving
25、 Picture Experts Group Audio Layer III。简单地说,MP3就是一种音频压缩技术,由于这种压缩方式的全称叫MPEG Audio Layer 3,所以人们把它简称为MP3,从本质上讲仍是波形文件。MP3是利用 MPEG Audio Layer 3 技术,将音乐以1:10 甚至 1:12 的压缩率压缩成容量较小的文件。换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度。59593WMA格式WMA的全称是Windows Media Audio,是微软力推的一种音频格式。WMA格式以减少数据流量但保持音质的方法来达到更高的压缩目的,其压缩率一般可以达到1:18
26、,生成的文件大小只有相应MP3文件的一半。此外,WMA还可以通过DRM(Digital Rights Management)方案加入防止拷贝,或者限制播放时间和播放次数,甚至是播放机器的限制,可以有力地防止盗版。60604MIDI格式MIDI的含义是乐器数字接口(Musical Instrument Digital Interface),它本来是由全球的数字电子乐器制造商建立起来的一个通信标准,以规定计算机音乐程序、电子合成器和其他电子设备之间交换信息与控制信号的方法。61 617.5 视频的基础知识 7.5.1 视频的定义与分类视频(Video)是由一幅幅单独的画面(称为帧Frame)序列组
27、成,这些画面以一定的速率(帧率fps,即每秒播放帧的数目)连续地投射在屏幕上,与连续的音频信息在时间上同步,使观察者具有对象或场景在运动的感觉。所以就其本质而言,视频是内容随时间变化的一组动态图像,所以视频又叫运动图像或活动图像。6262视频与图像是两个既有联系又有区别的概念:静止的图片称为图像(Image),运动的图像称为视频(Video)。视频与图像两者的信号源不同,视频的输入是摄像机、录像机、影碟机以及可以输出连续图像信号的设备;图像的输入靠扫描仪、数码相机等设备。按照视频的存储和处理方式不同,视频可分为模拟视频和数字视频两大类。63637.5.2 数字视频压缩标准1MPEG-1MPEG
28、-1标准于1988年5月提出,1992年11月形成国际标准。它的设计思想是在11.5 Mb/s的低带宽条件下提供尽可能高的图像质量(包括音频,以下所指图像均包括音频)。这是世界上第一个用于运动图像及其伴音的编码标准,主要应用于VCD,图像尺寸为352像素288像素,标准带宽为1.2Mb/s,每秒30帧。64642MPEG-2MPEG-2发布于1994年,设计目标是高级工业标准的图象质量以及更高的传输率,能提供的传输率在310 Mb/s之间,其在NTSC制式下的分辨率可达720像素486像素,MPEG-2可提供广播级的视频和CD级的音质。MPEG-2的音频编码可提供左、右、中及两个环绕声道,以及
29、一个加重低音声道和多达7个伴音声道。65653MPEG-4MPEG-4标准于1993年提出,1998年发布。MPEG-4是为了播放流式媒体的高质量视频而专门设计的,它可利用很窄的带宽,通过帧重建技术压缩和传输数据,以求使用最少的数据获得最佳的图像质量。66664MPEG-7MPEG-7标准于1997年提出,在2001年形成国际标准。该标准是一种多媒体内容描述标准,定义了描述符、描述语言和描述方案,支持对多媒体资源的组织管理、搜索、过滤、检索等,便于用户对其感兴趣的多媒体素材进行快速有效的检索。可以应用于数字图书馆、各种多媒体目录业务、广播媒体的选择、多媒体编辑等领域。67675MPEG-21M
30、PEG-21标准是与MPEG-7标准几乎同步制定的。MPEG-21标准的重点是建立统一的多媒体框架,支持连接全球网络的各种设备透明地访问各种多媒体资源。68687.5.3 常见视频文件格式 1AVI格式AVI英文全称为Audio Video Interleaved,即音频视频交错格式,它是一种将语音和影像同步组合在一起的文件格式,具有通用和开放的特点。它对视频文件采用了一种有损压缩方式,压缩比较高,应用范围非常广泛。AVI支持256色和RLE压缩,主要应用在多媒体光盘上,用来保存电视、电影等各种影像信息。这种文件格式的优点是图像质量好,可以跨平台使用,缺点是文件体积较大。69692MPEG格式
31、MPEG/DAT格式的具体格式后缀是.mpeg、.mpg或.dat,家庭中的VCD/SVCD和DVD使用的就是MPEG格式文件。MPEG格式文件在1024像素768像素下可以用每秒25帧(或30帧)的速率同步播放视频和音频,其文件大小仅为AVI文件的1/6。MPEG的平均压缩比为50:1,最高可达200:1,压缩效率非常高,同时图像和声音的质量也非常好,几乎被所有的计算机平台共同支持,是主流的视频文件格式。70703MOV格式MOV(Movie Digital Video Technology)是美国Apple公司开发的一种视频文件格式,默认的播放器是Quick Time Player,具有较
32、高的压缩比和较好的视频清晰度,并且可以跨平台使用。71 714ASF格式ASF格式(Advanced Streaming Format)是微软公司前期的流媒体格式,采用MPEG-4压缩算法。它是微软为了和现在的Real Player竞争而推出的一种视频格式,用户可以直接使用Windows自带的Windows Media Player对其进行播放。72725WMV格式WMV(Windows Media Video)也是微软推出的一种采用独立编码方式并且可以直接在网上实时观看视频节目的文件压缩格式,是目前应用最广泛的流媒体视频格式之一。WMV格式的主要优点包括:本地或网络回放、可扩充的媒体类型、多语言支持、环境独立性以及扩展性等。73736RM格式RM是Real Networks公司开发的一种流媒体文件格式,是目前主流的网络视频文件格式。它可以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放。Real Networks所制定的音频、视频压缩规范称为Real Media,相应的播放器为Real Player。