1、中国药科大学计算机教研室,第5章 数字媒体及其应用,5.0 多媒体技术的相关概念 5.1 多媒体技术的发展和应用 5.2 多媒体计算机的组成 5.3 多媒体数据采集和数字化 5.4 数据压缩技术 5.5 *动画技术 5.6 *图象技术,中国药科大学计算机教研室,要求,掌握多媒体、多媒体技术的概念 了解多媒体技术的发展和应用 了解多媒体计算机的软、硬件结构 掌握多媒体数据的采集和数字化过程(声音、图象、视频) 掌握常见的多媒体文件格式及其特点,了解常用多媒体播放软件 了解数据压缩的相关概念及两大国际压缩标准,中国药科大学计算机教研室,5.0 多媒体技术的相关概念,中国药科大学计算机教研室,5.0
2、.1 媒体的概念及分类,媒体的概念: 媒体是信息的载体,如日常生活中的报纸电视、文本、图象、声音、视频等,中国药科大学计算机教研室,媒体的分类(5类),感觉媒体(Perception Medium):直接作用于感觉器官,使人产生感觉的媒体,如引起听觉反应的声音、视觉反应的图象等 表示媒体(Representation Medium):是指为传播或表达信息,按照一定信息编码规则建立的对象,常见的表示媒体有文本、声音、图片、视频和动画等 表现媒体( Presentation Medium ):指用于信息输入和输出的设备,如键盘、扫描仪、显示器等 存储媒体( Storage Medium ):如各种
3、存储设备 传输媒体( Transmission Medium ):指能够传送数据信息的物理介质,电缆、双绞线、光纤等,中国药科大学计算机教研室,多媒体的概念:就是将文本、声音、图形、图象、动画和视频等多种媒体有机的结合在一起综合而成的 信息的一种复杂的表示媒体 相关的媒体从时效性上可分为: 静态媒体:如文本,图形,静态图象 时变媒体:如声音、动画、视频,5.0.2 多媒体,5.0.3 多媒体技术,多媒体技术(Multimedia Technique)就是计算机交互、综合处理多种媒体信息-文本、声音、图形、图象、视频和动画等,将多种媒体有机地结合在一起,通过计算机及其它电子设备进行处理和控制,并
4、支持完成一系列交互操作的信息技术。该技术几乎包含了当今计算机领域内最新的硬件和软件技术。,5.0.4 多媒体技术的基本特征,多样性:即处理媒体的多样性,多种媒体信息-文本、声音、图形、图象、视频和动画等 交互性:既用户对多媒体的可操控性,用户可控制播放内容、可检索所需信息、可提问和作答、录入与输出等 实时性:展现在视频播放的连续性等方面 集成性:一是指把不同的媒体设备集成在一起,形成多媒体系统,如多媒体计算机的软、硬件集成;二是指多种媒体信息集成在一起 使用的便捷性:网络服务都使用了多媒体技术,5.0.5 多媒体计算机,多媒体计算机(Multimedia Personal Computer,M
5、PC)一般来说指:能够对多种媒体进行综合处理,支持研制或播放多媒体产品的计算机 多媒体计算机一般以基本计算机为基础,提高其处理多媒体的能力,如CPU中增加MMX(Multimedia Extension多媒体增强指令集),配备大容量的存储设备、安装支持多媒体功能的操作系统及多媒体处理用的相关软件、配置高质量显卡和显示器以及其它相关外围设备等,中国药科大学计算机教研室,5.1 多媒体技术的发展和应用,中国药科大学计算机教研室,5.1.1 多媒体技术的发展,初期阶段 Amiga是世界上第一台真正的多媒体计算机,1985年由美国Commodore公司推出;同年CD-ROM被Philips和Sony联
6、合推出;1990年Microsoft的Windows3.0正式推出 标准化阶段 PMC-4.0标准(表5-1),主要是对高质量硬件的要求,中国药科大学计算机教研室,发展至今天:在许多技术上都得到了相当大的发展 数据压缩技术: 存储管理技术:1990年Informis的多媒体关联数据库Online就被提出了 软件设计技术:可视化程序设计,OOP 超媒体技术(HyperMedia Technique):是多媒体信息的一种组织技术,支持跳转阅读,最好的例子就是WWW和帮助文件,中国药科大学计算机教研室,5.1.2 多媒体技术的应用,多媒体技术的应用十分广泛:如学习、教学、产品发布、形象设计、游戏、影
7、视作品出版发行、网络服务等等,中国药科大学计算机教研室,5.2 多媒体计算机的组成,中国药科大学计算机教研室,5.2.1 多媒体计算机的硬件组成,硬件组成=基本配置+扩展设备,中国药科大学计算机教研室,5.2.2 多媒体计算机的软件组成,多媒体驱动软件:如声卡驱动程序、显卡 驱动程序、视频卡驱动程序等 多媒体操作系统:其基本功能就是提供处理多媒体信息的各种基本操作和管理方法,使得各种媒体硬件和谐工作,支持实时同步播放。Windows就是一种典型的通用多媒体操作系统。 多媒体数据准备软件:是用于采集、合成各种媒体元素的工具软件, 多媒体创作软件:是提供给创作者制作多媒体作品的工具。如Author
8、ware、Flash MX、Photoshop 7.0、Tool Book、Director等 多媒体应用系统:是多媒体平台上设计开发的面向应用的多媒体作品,如网络电玩等,中国药科大学计算机教研室,5.3 多媒体数据采集和数字化,5.3.1 多媒体数据采集,数据采集的概念 就是将文本、声音、图形、图象、视频等这些媒体转换成计算机所能识别的数字信号的过程,即用0、1序列表示,常用采集方法:,文本采集:常用手工录入或扫描+识别 声音采集:计算机软件录制如total recorder、录音机录制+音频输入/输出功能+音频截取 图形、图象采集:计算机软件绘制、扫描仪扫描、数码相机拍摄、从屏幕截取、从视
9、频捕获(用视频卡自带程序或播放程序) 视频采集:视频卡+数码摄象机、视频卡+有线电视信号 后期处理:如格式转换、除噪等等可使用我们前面提到的编辑软件实现,中国药科大学计算机教研室,5.3.2 声音信息的数字化,中国药科大学计算机教研室,中国药科大学计算机教研室,1 . 模拟信号(Analog)和数字信号(Digital) 模拟信号是一种指时间和幅度上都连续的信号,相应的数字信号是前者的一个子集,如何描述波形上的点? 说明:采样:即每隔一个时间段读取波形中的一个相应数据,即选中一点。 采样频率:每秒对声音波形采样的次数,即每秒读取点的个数,单位:赫兹(Hz)。 采样点的高度:即量化位数,若每个点
10、用一个字节(位音频)来表示,即采样的高度范围是0255;用二个字节(16位音频)来表示,即采样的高度范围是065535。 声道情况:声道有单声道和立体声之分。,中国药科大学计算机教研室,4 .声音信息的计量,问题 一个声音文件中的声音取样频率为44.1kHz,量化位数8位,声道数2,声音播放时间为10分钟,不采用压缩技术,请估计该文件约有多大? 计算公式 文件的字节数=采样频率量化位数声道数时间8 注意:单位必须一致,中国药科大学计算机教研室,WAV文件,即波形文件,是微软专门为Windows设计的波形文件存储格式。 文件扩展名:.WAV 获取过程:用不同的采样频率对声音的波形进行采样,可以得
11、到一系列的离散点,用不同的量化位数把采样点的值转化为二进制数,然后存储磁盘 文件的大小由采样频率,量化位数和声道数决定 缺点是:文件太大 适用于所有声音,MIDI文件,MIDI(Musical Instrument Digital Interface)乐器和计算机等电子设备之间交换信息与控制信号的一种标准协议 文件扩展名:.MID 文件内容:是指令集,指示MIDI设备发出规定的演奏音符、决定演奏多长时间、音量的变化和生成音响效果等 优点是:文件小,容易编辑,是几乎所有多媒体创作软件都支持的背景音乐格式 可以作为背景音乐,MP3(MPEG Audio Layer 3) 是MPEG(Moving
12、Picture Expert Group活动图象专家组)制定的音频压缩协议之一,其压缩原理重要是抛弃人类无法辨识的那部分声音,压缩比一般可达到1:101:12 文件扩展名:.mp3 一首30M的WAV格式的歌曲,转换成该格式,文件大小仅3M左右,Mp3文件,中国药科大学计算机教研室,MP3音乐是以数字方式储存的音乐,如果要播放,就必须有相应的数字解码播放系统,一般通过专门的软件进行MP3数字音乐的解码,再还原成波形声音信号播放输出,这种软件就称为MP3播放器,如Winamp等。,中国药科大学计算机教研室,5.3.3 图象信息数字化,(1)图象的属性 分辨率:是一副图象的象素密度的度量方法,是该
13、图象横向象素数纵向象素数,如:一副320 240的图象,共76800个象素 注:不同于显示分辨率,后者是显示屏的属性,中国药科大学计算机教研室,象素深度:是指存储每个象素所用的位数,一般指表示象素的颜色值所用的二进制的位数。如:黑白图的象素深度是1,用个二进制位就能表示两种颜色;灰度图的象素深度是8,可以表示种颜色;真彩色图的象素深度是24,中国药科大学计算机教研室,(2)常见图象的表示,黑白图象的表示,Black and white image,中国药科大学计算机教研室,灰度图象的表示,Gray scale image,中国药科大学计算机教研室,彩色图象的表示,中国药科大学计算机教研室,(3
14、)位图和矢量图,位图(Bit Mapped Image):也叫点阵图,对应位图文件,是描述图象的一种方法,该方法先把图象切割成许许多多的象素,然后用若干二进制位描述每个象素。适用于所有图象的表示。 矢量图(Vector Based Image):是表示图象的另一种方法,对应图形文件,相当于先把图象切割成基本几何图形,然后用很少的数据量分别描述每个图形。,中国药科大学计算机教研室,位图文件容量的计算: 800*600像素的黑白图像如何计算? 重要公式: 文件的字节数=每象素所占位数行象素数列象素数8,中国药科大学计算机教研室,分析:一个像素可以存放黑或者白图像,所以每个像素就是一个比特。因此,可
15、以算出这幅图像的容量为:800*600/8=60000(B) 如果换成256色的800*600的图像又该如何计算呢?,中国药科大学计算机教研室,256色也即在每个像素里有256种色彩的可能。也就是说存储一个像素要用8个比特即1个字节的存储空间。因此,可以算出这幅图像的容量为: 800*600*8/8=480000(B) 如果一幅1024*768的16位色彩的图像又该如何计算它的容量?,中国药科大学计算机教研室,提醒:16位色彩和16色的不同。16色实际上是2的4次方,即4位色彩。而256色是2的8次方,即8位色彩。 一副480320的256色位图,所占存储空间约为多少字节? 常见的位图图像处理
16、软件简介: 画图软件、Photoshop,中国药科大学计算机教研室,(4)常见的图象文件格式,BMP格式:是Windows采用的图象文件存储格式,通用性很好,在Windows下运行的图象处理软件都支持该格式。对应的文件扩展名是.bmp GIF格式:是图形交换格式(Graphics Interchange Format),用于一个文件存储多副图象,这些图象可以象幻灯片一样播放或象动画那样演示。网络上许多微小动画就是用这种方法制作的。对应的文件扩展名是.gif,JPEG格式:(Joint Photographic Expert Group):是静态数字图象压缩编码标准。压缩比约20:1,是有损压缩
17、,但人类视觉无法分辨失真。对应文件扩展名是.jpg,PNG格式:(Portable Network Graphic Format,流式网络图形,读成ping),是企图替代gif和tiff格式的,可用于网络图象的传输。采用的是无损压缩算法。对应文件扩展名是.png WMF格式:WMF(Windows Meta File)是一种比较特殊的格式,可以说是位图和矢量图的混合体,在桌面出版物中应用广泛,如Microsoft Office中的剪贴画就是该格式,中国药科大学计算机教研室,(5)图象处理与编辑,mspaint.exe:可以制作位图,并实现几种格式转换 抓屏实现: PrintScreen:抓取整
18、个屏幕信息 Alt+ PrintScreen:抓取活动窗口信息,中国药科大学计算机教研室,一幅黑白图像,包含的颜色信息是() (A) 1种 (B) 2种 (C) 8种 (D) 16种 存储一幅640*480像素的黑白图像,需用的字节数大约是() (A) 307200 (B) 76800 (C) 38400 (D) 19200 某图像的尺寸为800600,其单位是() (A)位 (B)字节 (C)颜色 (D)像素 对同样一段音乐,分别用44KHz和11KHz的采样频率进行采样后存储,那么采样频率越小,则() (A)存储容量越大 (B)存储容量越小 (C)声音越真实 (D)存储容量及声音效果均无变
19、化,中国药科大学计算机教研室,5.3.4 视频信息处理,(1)视频相关概念 帧:视频中的每一副图象 帧频率:每秒播放的帧的数目 PAL制式:中国和欧洲使用的电视系统制式,帧频率25 NTSC制式:美国和日本使用的电视系统制式,帧频率30 以上二者帧频率都25,中国药科大学计算机教研室,在普通情况下,一幅像素(pixel)为352240近似真彩色图像,15位/像素(bit/pixel)在数字化后的数据量为352240 pixel15 bit/pixel=1267200bit。在动态视频中,采用NTSC制式的帧率为30帧/秒,那么要求视频信息的传输率为1267200bit30/s=3.8016E+
20、07bit/s。因此在一张容量为700MB的光盘上全部存放视频信息,最多所存储的动态视频数字信号所能播放的时间最大也只有700102410248bit=7.340032E+09bit/s(3.8016E+07bit/s)=193.077s,即3.218分钟。由此可知,不采用压缩技术,一张700MB的光盘存放动态视频数字信号只能播放3.218分钟。,中国药科大学计算机教研室,以计算机的150KB/s传输率,在没压缩的前提下,是无法处理3.8016E+07bit/s的大数据量的。在处理音频信号时也会遇到类似的需要处理大信号量的问题。所以要把音频和视频信号在有限的空间上存储和在现行的个人电脑总线上正
21、确传输,必须采用数据压缩与编码技术。,中国药科大学计算机教研室,(2)常见视频文件格式,AVI (Audio Video Interleaved音频视频交错)格式:分非压缩和压缩两种,前者通用性很好,但文件庞大,后者压缩比大时,画面质量不太好 MOV格式:原是QuickTime for Windows的专用文件格式,也使用有损压缩技术,音频视频混排,一般认为较AVI格式图象质量好,MPG格式:是计算机上的全屏幕运动视频标准文件格式,目前已日益普及。该格式文件使用MPEG压缩,可用于1024768分辨下,以帧频24、25或30播放有128000种颜色的全屏幕运动视频图象,并配以CD音质的伴音信息
22、。 DAT格式:是VCD及卡拉OK CD专用的视频文件格式,也采用MPEG压缩、解压缩。如果计算机配备视频卡或安装解压缩程序如超级解霸就可播放 FLIC格式:采用的是无损压缩,画面效果最好,在人工或计算机生成的动画方面使用该格式较多。播放该格式文件需要Autodesk公司的MCI(多媒体控制接口)驱动和相应的播放程序AAPlay,中国药科大学计算机教研室,(3)视频编辑与处理,常用播放软件: Windows自带的Media Player:用于接收目前流行的音频、视频及混合型多媒体文件,还支持流媒体文件的播放(.asf) 豪杰超级解霸3000:除支持多种流行文件格式外,还支持在线播放,RM格式及
23、DVD文件播放,中国药科大学计算机教研室,RealOne Player:是一个网上在线收看音频、视频和Flash动画的最佳工具 另有金山影霸播放器KingPlayer,Power DVD,QuickTime等也很流行 常用视频编辑软件有Premiere、Video For Windows、Digital Video Productor等,中国药科大学计算机教研室,5.4 数据压缩技术,中国药科大学计算机教研室,5.4.1 数据压缩的处理过程,编码(Encoding)过程:对原始数据经过编码进行压缩 解码(Decoding)过程:对编码数据进行解码,还原为可以使用的数据,中国药科大学计算机教研室
24、,5.4.2 好的数据压缩技术的标准,压缩比大 实现压缩的算法简单,压缩、解压缩速度快 恢复效果好,尽可能接近原始数据或失真人类难以辩识,中国药科大学计算机教研室,5.4.3 数据压缩方法,按压缩前后数据是否一致可分为: 有损压缩:有失真,编码不可逆,主要用于声音、视频、图象的压缩 无损压缩:无失真,编码可逆,主要用于文本压缩,中国药科大学计算机教研室,5.4.4 压缩编码标准,(1)JPEG标准:是国际标准化组织ISO和国际电工委员会IEC组成的联合图象专家组JPEC制定的、静态图象的压缩编码标准。,中国药科大学计算机教研室,(2)MPEG标准,MPEG标准:是ISO和IEC联合成立的活动图
25、象专家组(Moving Picture Expert Group)MPEG制定的一系列标准,包括音频、视频和MPEG系统三大方面,常见的有 MPEG-1:数字电视标准,如:大多数VCD MPEG-2:也是数字电视标准,可以适应普通电视节目、会议电视、高清晰度数字电视等不同质量的视频应用,如:DVD,中国药科大学计算机教研室,MPEG-4:多媒体应用标准。拥有更高的压缩比,可以用更小的存储空间和通信带宽提供与DVD不相上下的高清晰视频,如Internet上的DivX和XviD MPEG-1 Layer III:音频压缩标准,如mp3音乐,中国药科大学计算机教研室,习题参考答案,一、单选题 1 1
26、0: C C A C A B C C D C 1020: A B A C A C C A C C 二、多选题 1、ABCDE 2、ABCE 3、ABCD 4、ACDE 5、ACE 6、无答案 7、AC 三、判断题 习题更正: 一 6.(B) JPEG;二 4.(A) Flash MX;(D) Photoshop 7.0以上,中国药科大学计算机教研室,下列属于无损压缩的是 () (A)将bmp文件压缩为jpg文件 (B)用WinZip软件压缩文件 (C)将电影制作成VCD (D)将电影制作成DVD 图像数据压缩的主要目的是() (A)提高图像的清晰度 (B)提高图像的对比度 (C)使图像更鲜艳
27、(D)减少存储空间,中国药科大学计算机教研室,19图像数据经有损压缩后,下列说法正确的是() (A)图像的清晰度更高 (B)图像的色彩更鲜艳 (C)图像放大后不会失真 (D)图像的存储空间更小 20WinZIP是一种() (A)文字编辑软件 (B)视频制作软件 (C)文件压缩软件 (D)网页浏览软件 22对视频文件进行压缩是为了使() (A)图像更清晰 (B)对比度更高 (C)声音更动听 (D)存储容量更小 23下列文件中必须采用无损压缩的是() (A)视频文件 (B)音频文件 (C)程序文件 (D)图像文件 24有一大小为1.2MB的文件,经压缩处理后(压缩比为3:1),其大小约为() (A) 100 KB (B) 300 KB (C) 400 KB (D) 1024 KB,中国药科大学计算机教研室,bddcdcc,