1、16.1 多媒体技术概述 6.1.1 媒体(媒体(medium)是信息表示和传输的载体是信息表示和传输的载体,如数字、文字、声音、图形、如数字、文字、声音、图形、图像和视频等。图像和视频等。分类分类感觉媒体感觉媒体人的直观感觉人的直观感觉表示媒体表示媒体各种编码各种编码,如图像编码如图像编码,声音编码声音编码表现媒体表现媒体 如键盘、显示器、扬声器如键盘、显示器、扬声器存储媒体存储媒体保存表示媒体的介质保存表示媒体的介质,盘、光盘盘、光盘传输媒体传输媒体传输的物理载体,如光纤、电缆传输的物理载体,如光纤、电缆2多媒体多媒体(多媒体(Multimedia)是指能够同时获取、处理、编辑、存储和展示
2、两个以是指能够同时获取、处理、编辑、存储和展示两个以上不同类型信息媒体的技术。上不同类型信息媒体的技术。这些信息媒体包括文字、声音、图形、图像、动画与这些信息媒体包括文字、声音、图形、图像、动画与视频等。视频等。多媒体不仅是指多种媒体本身,而且包含处理和多媒体不仅是指多种媒体本身,而且包含处理和应用它的一整套技术。应用它的一整套技术。“多媒体多媒体”与与“多媒体多媒体技术技术”是同义词。是同义词。 36.1.2多媒体计算机系统的组成1. 多媒体硬件多媒体硬件(1)外部设备)外部设备光驱、麦克风、光驱、麦克风、MIDI合成器、扫描仪、合成器、扫描仪、VCD/DVD、数码、数码照相机、摄像机、音箱
3、、投影仪、刻录机、声卡、照相机、摄像机、音箱、投影仪、刻录机、声卡、打印机等打印机等(2)功能卡)功能卡作用:连接各种外部设备,完成音频、视频信息的数作用:连接各种外部设备,完成音频、视频信息的数字化输入、编辑和输出字化输入、编辑和输出种类:声卡、视频输出卡、种类:声卡、视频输出卡、VGA/TV转换卡等转换卡等42. 多媒体软件音频处理:音频处理:Adobe Audition、SoundForge、Goldwave等等图像处理:图像处理:Windows 的画图、的画图、Photoshop、Corel Draw动画制作:动画制作:Gifanimator、Cool3D、Flash、3D Max视频
4、处理:视频处理:Adobe Premiere、DirectorVCD制作与光盘刻录制作与光盘刻录Authorware、Director等等56.1.3多媒体技术的特点1集成性集成性多种媒体信息有机的组织在一起,共同表达一个完整多种媒体信息有机的组织在一起,共同表达一个完整的多媒体信息,成为一体化系统。的多媒体信息,成为一体化系统。 2交互性交互性从单向的被动接收到双向有选择的交互方式转变从单向的被动接收到双向有选择的交互方式转变3实时性实时性要求系统有较高的传输速率。要求系统有较高的传输速率。66.1.4 多媒体技术的应用教育教育办公自动化办公自动化电子出版物电子出版物 通信通信 商业广告商业
5、广告影视娱乐影视娱乐医疗医疗旅游旅游76.2 多媒体信息的数字化6.2.1 声音数字化声音数字化计算机处理声音的硬件要求计算机处理声音的硬件要求安装声卡安装声卡麦克风连接到声卡的麦克风连接到声卡的MIC插孔插孔音箱连接到声卡的音箱连接到声卡的SPEAKER插孔插孔处理过程:处理过程:数字化、保存和处理、还原数字化、保存和处理、还原81. 声音的基本参数振幅振幅音量,声波波形的幅度,表示声音信号的强弱。音量,声波波形的幅度,表示声音信号的强弱。频率频率声音信号每秒钟变化的次数声音信号每秒钟变化的次数带宽带宽声音信号的频率范围,带宽越宽音质越好声音信号的频率范围,带宽越宽音质越好DAT(Digit
6、al Audio Tape) 20Hz20kHzCD(Compact Disc) 20Hz20kHzFM(Frequency Modulation) 20Hz15kHzAM(Amplitude Modulation)50Hz7kHz数字电话数字电话200Hz3.4kHz92. 声音信号的数字化过程模拟音频信号模拟音频信号时间上和幅度上都是连续变化的时间上和幅度上都是连续变化的数字化数字化将模拟的声音信号转变为数字音频的过程将模拟的声音信号转变为数字音频的过程三个阶段三个阶段采样、量化和编码采样、量化和编码 模拟信号 采样 量化 编码 数字音频 10(1)采样采样采样每隔一段时间间隔读取一次声音
7、波形的幅度值每隔一段时间间隔读取一次声音波形的幅度值采样频率采样频率单位时间内进行采样的次数,通常用赫兹(单位时间内进行采样的次数,通常用赫兹(Hz)表示。)表示。采样频率越高,经过离散的波形越接近原始波形,声音还原质采样频率越高,经过离散的波形越接近原始波形,声音还原质量越好量越好奈奎斯特采样定理奈奎斯特采样定理11奈奎斯特采样定理奈奎斯特采样定理奈奎斯特采样定理采样频率高于输入信号中最高频率的两倍时,可以从采样频率高于输入信号中最高频率的两倍时,可以从采样信号中无失真地重构原始信号采样信号中无失真地重构原始信号示例:示例:(1)话音信号最高频率为)话音信号最高频率为3400Hz,采样频率为
8、,采样频率为8000Hz,能以数字声音还原原来的声音能以数字声音还原原来的声音 (2)一般音频信号最高频率为)一般音频信号最高频率为20kHz,采样频率为,采样频率为40kHz以上时,就能无失真地还原以上时,就能无失真地还原12(2)量化量化量化对采样后得到的幅度值取值数量加以限定对采样后得到的幅度值取值数量加以限定离散值的个数与采用的编码的二进制位数有关离散值的个数与采用的编码的二进制位数有关13模拟音频信号模拟音频信号分分3030次测量幅度值次测量幅度值第第20次测量次测量幅度值结果幅度值结果为为15514(3)编码将量化后的幅度值用二进制编码进行表示将量化后的幅度值用二进制编码进行表示采
9、样精度采样精度用来表示量化级别的二进制数据的位数,也叫样本位用来表示量化级别的二进制数据的位数,也叫样本位数、位深度。数、位深度。例如:采样精度为例如:采样精度为8位,可以表示位,可以表示256种幅值;采样精种幅值;采样精度为度为16位,可以表示位,可以表示65536种不同的幅值。种不同的幅值。采样精度越高,声音质量越高,需要存储空间越大采样精度越高,声音质量越高,需要存储空间越大15163. 数据率和未压缩数据量的计算数据率数据率还原还原1秒钟的声音所需传输的数据位数,未经压缩的数秒钟的声音所需传输的数据位数,未经压缩的数字声音的数据率为字声音的数据率为: 数据率(数据率(b/s)=采样频率
10、采样频率(*Hz)*样本精度样本精度(bit)*声道数声道数未压缩声音数据的容量计算未压缩声音数据的容量计算存储空量(字节)存储空量(字节) =采样频率采样频率样本精度样本精度声道数声道数采样时间采样时间/817示例(1)采样频率为)采样频率为8kHz,样本精度为,样本精度为8位:位:数据率数据率8(bit)*8kHz=64.0kb/s(2)采样频率)采样频率8kHz,样本精度,样本精度8位位,双声道:双声道:数据率数据率 8(bit)*8kHz*2(声道数)(声道数)=128kb/s(3)1分钟的双声道声音文件的数据量:分钟的双声道声音文件的数据量:8(bit)*8000Hz*2(声道数)(
11、声道数)*60(秒)(秒)/8 =960000/1024=937.5KB18示例 (4)采样频率)采样频率 44.1kHz,采样精度,采样精度16位的立体声声位的立体声声音,采样音,采样1秒钟声音的数据量大小为:秒钟声音的数据量大小为:1644.1kHz21/8176400Byte=172.27 KB(5)某个立体声音频文件大小为)某个立体声音频文件大小为2100000KB,采,采样频率为样频率为32000Hz,可以播放,可以播放70分钟,则该音频分钟,则该音频文件的采样深度为文件的采样深度为 bit。 解答:解答:2100000*1024*8/(2*32000*4200) = 64196.2
12、.2 图像数字化1. 图像的数字化图像的数字化(1)采样)采样将连续图像在二维空间上进行离散化处理将连续图像在二维空间上进行离散化处理采样方式:采样方式:逐行顺序进行,假设在水平、垂直两个方向上分别取逐行顺序进行,假设在水平、垂直两个方向上分别取M和和N个相等的间隔,可以得到个相等的间隔,可以得到MN个点个点每个点称为一个图像元素,简称像素(每个点称为一个图像元素,简称像素(Pixel)或像元)或像元20(2)量化采样后每个像素点的处理:采样后每个像素点的处理:单色图像:将每个点量化为两个级别,分别是单色图像:将每个点量化为两个级别,分别是0和和1灰度图像:将每个点的灰度进行离散化,划分纯白色
13、、灰度图像:将每个点的灰度进行离散化,划分纯白色、纯黑色和介于这两者之间的不同程度的灰色纯黑色和介于这两者之间的不同程度的灰色彩色图像:要将每个点的颜色的值进行离散化,也就彩色图像:要将每个点的颜色的值进行离散化,也就是使用不同的颜色模型进行颜色编码是使用不同的颜色模型进行颜色编码量化的等级和像素的颜色编码位数有关量化的等级和像素的颜色编码位数有关2122(3)编码将量化后的每个点的灰度级别或颜色用不同的二将量化后的每个点的灰度级别或颜色用不同的二进制编码表示,用这种编码表示的图像就称为进制编码表示,用这种编码表示的图像就称为数字图像。数字图像。像素深度(位深度)像素深度(位深度)为每个像素点
14、的颜色或灰度进行编码所使用的二进制为每个像素点的颜色或灰度进行编码所使用的二进制数的位数。数的位数。像素深度的值越大表示的颜色数越多,色彩也越丰富像素深度的值越大表示的颜色数越多,色彩也越丰富逼真,占用的存储空间越大。逼真,占用的存储空间越大。232. 颜色模型1. RGB模型:相加混色模型:相加混色有源物体有源物体:能发出光波的物体能发出光波的物体 2. CMY模型:相减混色模型:相减混色无源物体无源物体:不发出光波的物体不发出光波的物体3. HSB模型模型24RGB颜色模型1)国际照明委员会)国际照明委员会(CIE) 规定规定以以700nm(红红)、546.1nm(绿绿)、435.8nm
15、(蓝蓝)三个色光为三基三个色光为三基色。又称为物理三基色。色。又称为物理三基色。2)自然界的所有颜色都可以)自然界的所有颜色都可以通过这三基色按不同比例混通过这三基色按不同比例混合而成。合而成。25RGB颜色模型 R:200 G:50B:120黄(255,255,0)黑(0,0,0)绿(0,255,0)青(0,255,255)蓝(0,0,255)品红(255,0,255)白(255,255,255)红(255,0,0)26CMYK颜色模型颜色模型 在理论上说,任何一种颜色都可以用在理论上说,任何一种颜色都可以用青色青色(Cyan)、品红(品红(Magenta)和和黄色(黄色(Yellow)三三
16、种基本颜料按一定比例混合得到,通常写成种基本颜料按一定比例混合得到,通常写成CMY,称为称为CMY模型由于彩色墨水和颜料的化学特性,用等量的三种由于彩色墨水和颜料的化学特性,用等量的三种基本颜色得到的黑色不是真正的黑色,因此在基本颜色得到的黑色不是真正的黑色,因此在印刷术中常加一种真正的黑色(印刷术中常加一种真正的黑色(Black ink),所),所以以 CMY又写成又写成 CMYK 27HSB颜色模型 1) 色调色调 颜色的外观颜色的外观 2) 饱和度饱和度颜色明暗的程度颜色明暗的程度 3) 明度明度对可见物体辐射或发光多少的感知属性对可见物体辐射或发光多少的感知属性28HSB颜色模型颜色模
17、型29图像分辨率图像采样的点数,称为图像分辨率图像采样的点数,称为图像分辨率,用点的用点的“行数行数列数列数”表示表示 如数码像机常用的图像分辨率为如数码像机常用的图像分辨率为640480、1024786、1128764等。等。对相同尺幅的图像,如果组成该图的像素数目越对相同尺幅的图像,如果组成该图的像素数目越多,则说明图像的分辨率越高,看起来就越逼多,则说明图像的分辨率越高,看起来就越逼真。相反,图像显得越粗糙。真。相反,图像显得越粗糙。30扫描分辨率用每英寸多少点(用每英寸多少点(dots per inch,DPI)表示。)表示。如果用如果用300DPI来扫描一幅来扫描一幅810 的图像,
18、就得到一的图像,就得到一幅幅24003000个像素的数字图像。个像素的数字图像。分辨率越高,像素就越多,获得的图像越细腻分辨率越高,像素就越多,获得的图像越细腻扫描分辨率是采样时,单位尺寸内采样的点数,扫描分辨率是采样时,单位尺寸内采样的点数,而图像分辨率是组成数字图像的像素数而图像分辨率是组成数字图像的像素数31像素深度数字图像中表示每个像素的颜色使用的二进制位数字图像中表示每个像素的颜色使用的二进制位数称为像素深度或位深度。数称为像素深度或位深度。像素深度值越大,图像能表示颜色数越多,色彩像素深度值越大,图像能表示颜色数越多,色彩越丰富逼真,占用的存储空间越大。越丰富逼真,占用的存储空间越
19、大。常见的像素深度有常见的像素深度有1位、位、4位、位、8位和位和24位,分别用位,分别用来表示黑白图像、来表示黑白图像、16色或色或16级灰度图像、级灰度图像、256色色或或256级灰度图像和真彩色(级灰度图像和真彩色(22416 777 216种颜种颜色)图像色)图像32数字图像数据大小的计算计算用位图文件存储一幅分辨率为计算用位图文件存储一幅分辨率为352288的静态的静态真彩色图像需要的存储空间。真彩色图像需要的存储空间。解:图像文件大小的计算公式:解:图像文件大小的计算公式:文件字节数文件字节数=每行列数每行列数图像行数图像行数颜色深度颜色深度8真彩色图像的每一个像素点用真彩色图像的
20、每一个像素点用24位来记录:位来记录:35228824/8 B=304128B(字节)(字节)336.2.3 视频的数字化视频数字化是将视频信号经过视频采集卡转换成数字视视频数字化是将视频信号经过视频采集卡转换成数字视频文件存储在硬盘中。在使用时,将数字视频文件从频文件存储在硬盘中。在使用时,将数字视频文件从硬盘中读出,再还原成为电视图像加以输出。硬盘中读出,再还原成为电视图像加以输出。一般的视频采集卡采用帧内压缩的算法把数字化的视频一般的视频采集卡采用帧内压缩的算法把数字化的视频存储成存储成AVI格式文件,高档一些的视频采集卡还能直接格式文件,高档一些的视频采集卡还能直接把采集到的数字视频数
21、据实时压缩成把采集到的数字视频数据实时压缩成MPEG格式的文件。格式的文件。34视频的压缩 数字视频标准主要由数字视频标准主要由MPEG(Moving Picture Expert Group)即即运动图像联合专家组制定,这是由国际标准化组织运动图像联合专家组制定,这是由国际标准化组织(ISO)和国际电工委员会()和国际电工委员会(IEC)联合成立的专家组,)联合成立的专家组,负责制定关于运动图像在不同速率的传输介质上传输负责制定关于运动图像在不同速率的传输介质上传输的一系列压缩标准,目前,已出台的标准有的一系列压缩标准,目前,已出台的标准有MPEG1、MPEG2、MPEG4、MPEG7等。等
22、。358.4 数据编码及压缩 一一. 编码编码1. 编码:将模拟信号转换成数字信号的过程编码:将模拟信号转换成数字信号的过程2. 解码:将数字信号还原成模拟信号的过程解码:将数字信号还原成模拟信号的过程3. 编解码器:完成编码、解码功能的装置。编解码器:完成编码、解码功能的装置。二二. 数据压缩数据压缩1。必要性。必要性: 数据量庞大数据量庞大2。压缩目的:便于存储和传输。压缩目的:便于存储和传输36例例1:存储:存储3分分30秒的秒的CD音质立体声歌曲音质立体声歌曲44.1kHz2B2210秒秒 = 37044KB = 35.33M 例例2:存储一幅:存储一幅352288的静态真彩色图像的静
23、态真彩色图像3522883B=297kB 例例3:存储:存储1分钟视频所用的空间分钟视频所用的空间 304.13kB2560=456195kB=435.06M373.数据压缩的可能性 1)信息冗余)信息冗余 2)数据量不等于它所包含的信息量)数据量不等于它所包含的信息量 3)静态图像中存在的空间冗余)静态图像中存在的空间冗余 4)动态视频中存在的时间冗余)动态视频中存在的时间冗余 384. 压缩的方法 1)无损压缩)无损压缩一种可逆压缩方式,经过压缩后可将原文件包含的信一种可逆压缩方式,经过压缩后可将原文件包含的信息完全保留息完全保留利用原始信息中的相关性进行的数据压缩不损失原信利用原始信息中
24、的相关性进行的数据压缩不损失原信息的内容,可实现无损压缩息的内容,可实现无损压缩39例题:无损压缩的RLE编码 RLE编码后得到的代码为:编码后得到的代码为:50(200,30,100)2(255,255,255)1(0,5,5)9(0,0,0)72(200,30,100) 2)有损压缩)有损压缩 各种不同的压缩标准各种不同的压缩标准40文件格式 AVI(Audio Video Interleave)是一种音频和视频交叉记录)是一种音频和视频交叉记录的数字视频文件格式。在的数字视频文件格式。在AVI文件中,运动图像和伴音文件中,运动图像和伴音数据是以交织的方式存储,并独立于硬件设备。按交数据是
25、以交织的方式存储,并独立于硬件设备。按交替方式组织音频和视像数据可使得读取视频数据流时替方式组织音频和视像数据可使得读取视频数据流时能更有效地从存储媒介得到连续的信息。能更有效地从存储媒介得到连续的信息。416.3 数据压缩 在多媒体计算机系统中要表示、传输和处理声文图信息,在多媒体计算机系统中要表示、传输和处理声文图信息,特别是数字化图像和视频要占用大量的存储空间,因特别是数字化图像和视频要占用大量的存储空间,因此高效的压缩和解压缩算法是多媒体系统运行的关键。此高效的压缩和解压缩算法是多媒体系统运行的关键。 数据压缩是一种对原始数据进行重新编码、去除原始数数据压缩是一种对原始数据进行重新编码
26、、去除原始数据中的冗余,以较小的数据量来表示原始数据的技术,据中的冗余,以较小的数据量来表示原始数据的技术,它是实现在计算机上处理音频和视频等多媒体信息的它是实现在计算机上处理音频和视频等多媒体信息的前提。前提。42基本原理数据压缩的对象是数据。数据是信息的载体,用来记录数据压缩的对象是数据。数据是信息的载体,用来记录和传送信息。真正有用的不是数据本身,而是数据所和传送信息。真正有用的不是数据本身,而是数据所携带的信息携带的信息,大的数据量并不代表含有大的信息量大的数据量并不代表含有大的信息量 。 例例:食品包装食品包装43信息冗余多媒体数据中大的数据量并不完全等于它们所携带的信多媒体数据中大
27、的数据量并不完全等于它们所携带的信息量。在信息论中,称为冗余。息量。在信息论中,称为冗余。冗余是指信息存在的各种性质的多余度。冗余是指信息存在的各种性质的多余度。减少数据冗余可以节省存储空间,有效利用网络带宽。减少数据冗余可以节省存储空间,有效利用网络带宽。 44可逆编码可逆编码也叫无失真编码、冗余度压缩、熵编码等。其可逆编码也叫无失真编码、冗余度压缩、熵编码等。其原理是减少数据中的冗余度,而不损失任何信息。解原理是减少数据中的冗余度,而不损失任何信息。解压时可以完全恢复出原来的数据,亦称无损压缩。典压时可以完全恢复出原来的数据,亦称无损压缩。典型的无损压缩有型的无损压缩有Huffman编码、
28、算术编码和行程编码等。编码、算术编码和行程编码等。可逆编码由于不会产生失真,因此在多媒体技术中常用可逆编码由于不会产生失真,因此在多媒体技术中常用于文本、数据的压缩,它能保证完全地恢复原始数据。于文本、数据的压缩,它能保证完全地恢复原始数据。但这种方法的压缩比较低,一般在但这种方法的压缩比较低,一般在2:15:1之间。之间。45不可逆编码不可逆编码是有失真压缩,信息论中叫熵压缩。由于压不可逆编码是有失真压缩,信息论中叫熵压缩。由于压缩了熵,会减少信息而不能再恢复。因此这种压缩又缩了熵,会减少信息而不能再恢复。因此这种压缩又称有损压缩。在语音和图像中,由于存在视觉冗余和称有损压缩。在语音和图像中
29、,由于存在视觉冗余和听觉冗余,减少这种信息并不影响人们的听觉效果和听觉冗余,减少这种信息并不影响人们的听觉效果和视觉效果,所以经常采用这种方法。视觉效果,所以经常采用这种方法。有损压缩常用于数字化存储的模拟数据,并且主要应用有损压缩常用于数字化存储的模拟数据,并且主要应用于图像、声音、动态视频等数据的压缩。如果用混合于图像、声音、动态视频等数据的压缩。如果用混合编码的编码的JPEG标准,对自然景物的彩色图像,压缩比可标准,对自然景物的彩色图像,压缩比可达到几十倍甚至上百倍。达到几十倍甚至上百倍。 463. 矢量图形使用一系列指令描述一幅图所包含的直线、矩形、使用一系列指令描述一幅图所包含的直线
30、、矩形、圆、圆弧、曲线等的形状、位置、颜色等属性圆、圆弧、曲线等的形状、位置、颜色等属性和参数和参数例如,直线的描述:例如,直线的描述:line,start_point,end_point 圆的描述:圆的描述:circle,center_x,center_y,radius矢量图像不会随图像尺寸的改变而改变,也不存矢量图像不会随图像尺寸的改变而改变,也不存在采样分辨率的问题,只与显示的尺寸和显示在采样分辨率的问题,只与显示的尺寸和显示分辨率有关分辨率有关矢量图像文件所占空间较小矢量图像文件所占空间较小47473. 声音文件的存储格式WAVWindows采用的波形声音文件存储格式采用的波形声音文件
31、存储格式MP3主要应用于因特网上的声音传输。主要应用于因特网上的声音传输。高达高达96:1的压缩比,有较好的音质。的压缩比,有较好的音质。 RM、RARealNetworks公司制定的声音文件格式,有较高的压缩公司制定的声音文件格式,有较高的压缩比,可采用流媒体方式在网络上实时播放。比,可采用流媒体方式在网络上实时播放。484. 图像文件格式 位图文件位图文件(Bitmap-File,BMP)一种不压缩的格式,占有较大存储空间,但图像质量一种不压缩的格式,占有较大存储空间,但图像质量较高。较高。GIF (Graphics Interchange Format)压缩效率高、占用的存储空间很小。压
32、缩效率高、占用的存储空间很小。JPEG(Joint Photographic Experts Group)文件存储格式为文件存储格式为jpg格式,适合存储色彩丰富的照片。格式,适合存储色彩丰富的照片。49文件格式文件格式是数据在存储器中的存放形式。相同的数据,文件格式是数据在存储器中的存放形式。相同的数据,可以有不同的存放形式,所以也就有多种文件格式。可以有不同的存放形式,所以也就有多种文件格式。 WAVWAV是是WindowsWindows采用的波形声音文件存储格式,主要用于采用的波形声音文件存储格式,主要用于自然声的保存与回放,其特点是声音自然声的保存与回放,其特点是声音层次丰富,还原层次
33、丰富,还原性好,表现力强性好,表现力强。如果使用足够高的采样频率和采样。如果使用足够高的采样频率和采样精度,可以获得极好的音质,但文件的精度,可以获得极好的音质,但文件的数据量比较大数据量比较大。该格式的文件可以被几乎所有的多媒体软件使用,该格式的文件可以被几乎所有的多媒体软件使用,易易于编辑于编辑。 50MP3MP3是是MPEGMPEG(Moving Picture Expert GroupMoving Picture Expert Group运动图像专运动图像专家组)家组)第三层压缩文件格式,提供第三层压缩文件格式,提供8kb/s8kb/s到到128kb/s128kb/s的的数据率和高达数
34、据率和高达96:196:1的压缩比,有较好的音质。主要应的压缩比,有较好的音质。主要应用于因特网上的声音传输。常见的用于因特网上的声音传输。常见的MP3MP3音乐就使用了该音乐就使用了该压缩标准,是压缩标准,是MP3MP3播放器的主要格式播放器的主要格式 RMRM、RARA是是RealNetworksRealNetworks公司制定的声音文件格式,有较公司制定的声音文件格式,有较高的压缩比,可以采用流媒体的方式在网络上实时播高的压缩比,可以采用流媒体的方式在网络上实时播放,主要使用放,主要使用RealNetworksRealNetworks公司的播放器播放公司的播放器播放 51电子合成音乐电子
35、合成音乐 MIDIMIDI文件的扩展名为文件的扩展名为“.MID”.MID”,它与波形,它与波形文件不同,记录的不是声音本身,而是将每个音符记文件不同,记录的不是声音本身,而是将每个音符记录为一个数字,如按了哪一个键、力度多大、时间多录为一个数字,如按了哪一个键、力度多大、时间多长等。因此比较节省空间,可以满足长时间音乐的需长等。因此比较节省空间,可以满足长时间音乐的需要。主要限制是缺乏重现真实自然的能力。要。主要限制是缺乏重现真实自然的能力。WMAWMA的全称是的全称是Windows Media AudioWindows Media Audio,它是微软公司推出,它是微软公司推出的与的与MP
36、3MP3格式齐名的一种新的音频格式。格式齐名的一种新的音频格式。52声音编辑GoldWave是一个专业级的数字音频处理软件。它是一个专业级的数字音频处理软件。它可以以不同的采样频率录制声音,声源可以是可以以不同的采样频率录制声音,声源可以是通过通过CDROM播放的激光音乐盘,也可以是通过播放的激光音乐盘,也可以是通过音频电缆传送过来的录音机信号,还可以通过音频电缆传送过来的录音机信号,还可以通过麦克风直接进行现场录音。麦克风直接进行现场录音。CoolEdit 是一个是一个多轨录混音软件多轨录混音软件, ,功能强大功能强大, ,使用方使用方便便, ,放大、衰减、去噪、淡入淡出、回声、混音、放大、
37、衰减、去噪、淡入淡出、回声、混音、格式转换。格式转换。53实例: 知道了图像的分辨率和颜色深度,就可以计算出图像的知道了图像的分辨率和颜色深度,就可以计算出图像的文件大小。文件大小。文件大小(文件大小(kB)=图像横向点数图像横向点数图像纵向点数图像纵向点数颜色深度颜色深度/8/1024如一幅分辨率为如一幅分辨率为1024768的的16位图像的文件大小为:位图像的文件大小为:102476816/8/1024=1536kB1.5MB54文件格式 BMP是指位图文件是指位图文件(Bitmap File),其文件后缀名是,其文件后缀名是.bmp,是,是微软公司为其微软公司为其Windows环境设置的
38、标准图像格式,随着环境设置的标准图像格式,随着Windows 的不断普及,的不断普及,BMP文件格式事实上也是文件格式事实上也是PC机上机上的流行图像文件格式,一般的图像处理软件都能打开的流行图像文件格式,一般的图像处理软件都能打开该类文件。该类文件。55GIF是是Graphics Interchange Format即图形交换格式的缩写,即图形交换格式的缩写,该格式文件的后缀名为该格式文件的后缀名为.gif,可以用,可以用18位表示颜色,位表示颜色,因此最多为因此最多为256色色.一个一个GIF文件中可以有多幅图像,而且这多幅图像可以按文件中可以有多幅图像,而且这多幅图像可以按一定的时间间隔
39、显示,形成简单的动画。一定的时间间隔显示,形成简单的动画。56JPEG是是Joint Photographic Experts Group的缩写,意思是联的缩写,意思是联合影像专家小组,这是一个由国际标准化组织(合影像专家小组,这是一个由国际标准化组织(ISO)和国际电工委员会(和国际电工委员会(IEC)联合组成的专家组,负责制)联合组成的专家组,负责制定静态的数字图像数据压缩编码标准,这个专家组开定静态的数字图像数据压缩编码标准,这个专家组开发的算法称为发的算法称为JPEG算法,并且成为国际上通用的标准,算法,并且成为国际上通用的标准,相应的文件后缀为相应的文件后缀为.JPG。JPEG标准是
40、一个静态图像数标准是一个静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。据压缩标准,既可用于灰度图像又可用于彩色图像。57TIF是是Tagged Image Format的缩写,意思是标志图像文件,的缩写,意思是标志图像文件,这是一种多变的最复杂的图像文件格式标准,支持的这是一种多变的最复杂的图像文件格式标准,支持的颜色从单色到真彩色,图像文件可以是压缩的和非压颜色从单色到真彩色,图像文件可以是压缩的和非压缩的,其中压缩的文件中,压缩的方法很多,而且还缩的,其中压缩的文件中,压缩的方法很多,而且还可以扩充,有很大的选择余地,由于这种灵活性,这可以扩充,有很大的选择余地,由于这种灵活性,
41、这种格式是图像处理软件支持的格式之一,大部分的种格式是图像处理软件支持的格式之一,大部分的OCR软件也采用这种格式。软件也采用这种格式。 58图像编辑Micorsoft的的“画图画图”程序是程序是Windows操作系统附带的一个图像处理操作系统附带的一个图像处理软件,使用软件,使用“开始开始程序程序附件附件画图画图”命令启动。该软件简单、命令启动。该软件简单、方便,虽比不上其他专业软件功能强大,但其非常小巧,做一方便,虽比不上其他专业软件功能强大,但其非常小巧,做一些图形的绘制、擦除、裁剪非常方便。如果不是对图像做很多些图形的绘制、擦除、裁剪非常方便。如果不是对图像做很多艺术上的加工,艺术上的
42、加工,“画图画图”是个很好的软件。是个很好的软件。Photoshop是美国是美国Adobe公司的图像处理软件。公司的图像处理软件。Photoshop可以对图可以对图像的各种属性,如色彩的明暗、浓度、色调、透明度等进行细像的各种属性,如色彩的明暗、浓度、色调、透明度等进行细致的调整,使用变形功能可以对图像进行任意角度的旋转、拉致的调整,使用变形功能可以对图像进行任意角度的旋转、拉伸、倾斜等变形操作,使用滤镜可以产生特殊效果,如浮雕效伸、倾斜等变形操作,使用滤镜可以产生特殊效果,如浮雕效果、动感效果、模糊效果、马赛克效果等等,图层、蒙板和通果、动感效果、模糊效果、马赛克效果等等,图层、蒙板和通道处
43、理功能提供丰富的图像合成效果。道处理功能提供丰富的图像合成效果。 59视频人的眼睛有一种视觉暂留的生物现象,即人们观察的物人的眼睛有一种视觉暂留的生物现象,即人们观察的物体消失后,物体的影像在眼睛的视网膜上会保留一个体消失后,物体的影像在眼睛的视网膜上会保留一个非常短暂的时间非常短暂的时间(大约大约0.1秒秒)。利用这一现象,将一系列。利用这一现象,将一系列物体位置或形状变化很小的图像以足够快的速度连续物体位置或形状变化很小的图像以足够快的速度连续播放,人眼就会感觉画面变成了连续活动的场景。播放,人眼就会感觉画面变成了连续活动的场景。 连续地随时间变化的一组图像就称为视频。连续地随时间变化的一
44、组图像就称为视频。 60RMRM格式是格式是RealNetworksRealNetworks公司开发的一种流媒体视频文公司开发的一种流媒体视频文件格式件格式 .可以根据网络数据传输的不同速率制定不同的压缩比可以根据网络数据传输的不同速率制定不同的压缩比率,从而实现在低速率的率,从而实现在低速率的InternetInternet上进行视频文件上进行视频文件的实时传送和播放的实时传送和播放 .在数据传输过程中可以边下载边播放,而不必完全下在数据传输过程中可以边下载边播放,而不必完全下载后再播放。也可以利用载后再播放。也可以利用RealVideoRealVideo对重大事件进行对重大事件进行实时转播
45、。实时转播。61ASF(Advanced Streaming Format)ASF(Advanced Streaming Format)是由是由MicrosoftMicrosoft公司推出的一种高级流媒体格式,也是一个可公司推出的一种高级流媒体格式,也是一个可以在以在InternetInternet上实现实时播放的标准,使用上实现实时播放的标准,使用MPEG-4MPEG-4的压缩算法。的压缩算法。62FLV流媒体格式是一种新的视频格式,全称为流媒体格式是一种新的视频格式,全称为Flash Video。由于它形成的文件极小、加载速度极快,使得网络观由于它形成的文件极小、加载速度极快,使得网络观看
46、视频更加流畅。看视频更加流畅。63视频编辑Premiere是是Adobe公司的专业非线性编辑软件。公司的专业非线性编辑软件。Premiere提提供与线性编辑机一致的操作方式,可以组接多种格式供与线性编辑机一致的操作方式,可以组接多种格式的视频和图像,提供多种镜头切换方式、视频叠加方的视频和图像,提供多种镜头切换方式、视频叠加方式,可对图像的色调和亮度等色彩参数进行调整,方式,可对图像的色调和亮度等色彩参数进行调整,方便地在视频图像上添加字幕或徽标,也可以进行音频便地在视频图像上添加字幕或徽标,也可以进行音频的编辑和合成,很方便地为图像配音或为语音添加背的编辑和合成,很方便地为图像配音或为语音添加背景音乐,支持多种视频格式的导入和导出,如景音乐,支持多种视频格式的导入和导出,如avi格式、格式、mpge格式、格式、mov格式、格式、wmv格式、格式、flv格式等。格式等。