1、2多媒体信息处理第第8章章 数字媒体文件格式数字媒体文件格式3主要内容n多媒体文件的基础知识多媒体文件的基础知识n常用图像文件格式常用图像文件格式n常用动画文件格式常用动画文件格式n常用视频文件格式常用视频文件格式n常用音频数据格式常用音频数据格式4图像文件的格式n计算机中存储多媒体数据的方式计算机中存储多媒体数据的方式多媒体数据以计算机数据文件方式存储多媒体数据以计算机数据文件方式存储编码方式:无压缩,无损压缩、有损压缩编码方式:无压缩,无损压缩、有损压缩类型:图像、动画、视频、音频类型:图像、动画、视频、音频n常用的图像文件格式常用的图像文件格式BMP、JEPG、TIFF、GIF、n常用的
2、动画文件格式常用的动画文件格式GIF、Flic、SWF、n存储视频数据的方式存储视频数据的方式AVI、MPEG、MOV、RMVB、ASF、WMV、YUV、 n存储音频数据的方式存储音频数据的方式MIDI、WAVE、MP1/2/3/4/AAC、 位图和调色板n位图又称光栅图、点阵图,是使用像素阵列来表示的图像。位图又称光栅图、点阵图,是使用像素阵列来表示的图像。n每个像素的色彩信息由每个像素的色彩信息由RGB组合或者灰度值表示。组合或者灰度值表示。n根据颜色信息所需的数据位分为根据颜色信息所需的数据位分为1、4、8、16、24及及32位等。位等。n其中使用其中使用1位表示一个像素颜色的位图因为一
3、个数据位只能表位表示一个像素颜色的位图因为一个数据位只能表示两种颜色,所以又称为二值位图。示两种颜色,所以又称为二值位图。5位图和调色板n存储了图像的位图信息的文件称为位图文件。位图文件分为DDB位图(Device-dependent bitmap,设备相关位图)与DIB位图(Device-independent bitmap,设备无关位图)。nDDB位图的固有问题。DIB不依赖于具体设备,可以用来永久性地保存图像。DIB文件后缀:BMP或DIB。DIB位图与逻辑调色板。nDIB位图包含下列的颜色和尺寸信息:原始设备(即创建图片的设备)的颜色格式;原始设备的分辨率;原始设备的调色板;一个位数组
4、,由红、绿、蓝(RGB)三个值代表一个像素;一个数组压缩标志,用于表明数据的压缩方案(如果需要的话)。n以上信息保存在BITMAPINFO结构中,该结构由BITMAPINFOHEADER结构和两个或更多个RGBQUAD结构所组成。BITMAPINFOHEADER结构所包含的成员表明了图像的尺寸、原始设备的颜色格式、以及数据压缩方案等信息。RGBQUAD结构标识了像素所用到的颜色数据。6位图和调色板n调色板(Palette)一词来源于油画工具,其实它是一个表:表中的每一行记录一种颜色的R、G、B值。在描述一个像素的颜色时,只要指出该颜色在表中的索引值即可。因此,调色板又称为颜色查找表LUT(Lo
5、ok Up Table)。n调色板存在于位图文件、窗体的DC(Device Context,设备上下文)或OS(Operate System,操作系统)中。nWindows操作系统中存在着三种调色板:硬件调色板、逻辑调色板和系统调色板。nOS使用“调色板管理器”机制来管理调色板。硬件调色板就是显卡适配器所能实际表达的颜色深度;逻辑调色板就是Windows操作系统通过调色板管理机制为每个窗体应用程序DC分配的调色板。系统调色板只有一个,而逻辑调色板可以有多个。7图像文件结构n一般的图像文件主要包含文件头、文件体和文件尾等三部分。n文件头的主要内容包括产生或编辑该图像文件的软件的信息以及图像本身的
6、参数。n文件体主要包括图像数据以及颜色变换查找表或调色板数据。n文件尾可包含一些用户信息。文件尾是可选项。n几乎所有的图像文件都采用各自简化的格式名作为文件扩展名。8资源交换档案标准RIFFnRIFF(Resource Interchange File Format,资源交换档案标准)是一种把资料存储在被标记的区块(tagged chunks)中的档案格式。nRIFF由Microsoft和IBM在1991年共同提出,是1985年Electronic Arts提出的Interchange File Format的翻版。n这两种标准的唯一不同处是多位元整数的储存方式。RIFF使用的是little-
7、endian,这是IBM的PC机使用的处理器80 x86中使用的格式,而IFF储存整数的方式是使用big-endian,这是Amiga和Apple Macintosh电脑使用的处理器可处理的整数型态。nMicrosoft在AVI和WAV这两种著名的档案格式中,都使用RIFF的格式当成它们的基础。9资源交换档案标准RIFFnRIFF文件使用四字符码FOURCC(four-character code)来表征数据类型,比如RIFF、AVI、LIST等。nRIFF文件首先含有一个如下图所示的文件头结构。n文件大小值的计算方法为:实际数据长度 + 4(文件类型域的大小);也就是说,文件大小的值不包括“
8、RIFF”域和“文件大小”域本身的大小。RIFF文件的实际数据中,通常还使用了列表(List)和块(Chunk)的形式来组织。列表可以嵌套子列表和块。10RIFF文件大小文件类型数据4字节4字节4字节资源交换档案标准RIFFn列表的结构为 LIST listSize listType listData。nLIST是一个四字符码,表示这是一个列表;listSize占用4字节,记录了整个列表的大小;listType也是一个四字符码,表示本列表的具体类型;listData就是实际的列表数据。nlistSize值的计算方法为:实际的列表数据长度 + 4(listType域的大小)。n块的结构为ckID
9、 ckSize ckData。ckID是一个表示块类型的四字符码;ckSize占用4字节,记录了整个块的大小;ckData为实际的块数据。ckSize值指的是实际的块数据长度,不包括ckID域和ckSize域本身的大小。1112BMP文件nBMP文件格式文件格式Windows操作系统的标准文件格式操作系统的标准文件格式BMP是一种与硬件设备无关的图像文件格式,使是一种与硬件设备无关的图像文件格式,使用非常广用非常广 压缩和非压缩两种,一般采用行程长度编码压缩和非压缩两种,一般采用行程长度编码(RLE)BMP图像文件包含图像文件头、图像信息头、调图像文件包含图像文件头、图像信息头、调色板、图像数
10、据色板、图像数据13BMP文件nBMP图像文件头图像文件头字段名字段长度字段说明bfType2Byte指定文件类型,必须是0 x424D,即字符串“BM”,即所有.bmp文件的头两个字节都是“BM”bfSize4Byte指定文件大小,包括这14个字节bfReserved12Byte保留字,不用考虑bfReserved22Byte保留字,不用考虑bfOffBits2Byte从文件头到实际的位图数据的偏移字节数,即前三个部分的长度之和14BMP文件nBMP图像的信息头图像的信息头typedef struct tagBITMAPINFOHEADERDWORD biSize; LONG biWidth
11、; LONG biHeight; WORD biPlanes; WORD biBitCount DWORD biCompression; DWORD biSizeImage; LONG biXPelsPerMeter; LONG biYPelsPerMeter; DWORD biClrUsed; DWORD biClrImportant; BITMAPINFOHEADER; 字段名字段长度字段说明biSize4字节指定这个结构的长度,为40biWidth4字节指定图像的宽度,单位是像素biHeight4字节指定图像的高度,单位是像素biplanes2字节必须是1,不用考虑biBitCount2
12、字节指定表示颜色时要用到的位数,常用的值为1(黑白二色图);4(16色图);8(256色);24(真彩色图)等biCompression4字节指定位图是否压缩,有效的值为BI_RGB,BI_RLE8,BI_RLE4,BI_BITFIELDS(这些是由Windows定义的常量)。BI_RGB表示不压缩;Windows位图可以采用RLE4和RLE8的压缩格式,但用的不多。biSizeImage4字节指定实际的位图数据占用字节数,如biCompression为BI_RGB,则该项可为零biXPelsPerMeter4字节指定目标设备的水平分辨率,单位是每米的像素个数biYPelsPerMeter4字
13、节指定目标设备的垂直分辨率,单位同上biClrUsed4字节指定本图像实际用到的颜色数,如果该值为零,则用到的颜色数为2biBitCountbiClrImportant4字节指定本图像中重要的颜色数,如果该值为零,则认为所有的颜色都是重要的15BMP文件nBMP图像的调色板和图像数据图像的调色板和图像数据nBMP的图像数据的图像数据从下到上,从左到右按行排列。从下到上,从左到右按行排列。每一行的字节数是每一行的字节数是4的倍数,不足的字节补的倍数,不足的字节补016TIFF文件nTIFF文件格式文件格式TIFF是一个广为应用的光栅图像文件格式,是一是一个广为应用的光栅图像文件格式,是一个非常稳
14、定的文件格式个非常稳定的文件格式是为存储扫描图像设计的,图像格式复杂、存储是为存储扫描图像设计的,图像格式复杂、存储信息多信息多TIFF的特点的特点支持从高端到低端的设备支持从高端到低端的设备可扩展性强,支持公共和私用的标记结构可扩展性强,支持公共和私用的标记结构支持各种压缩格式支持各种压缩格式有公共软件库支持有公共软件库支持多种扩展功能:二值图、灰度图、调色板、真彩色多种扩展功能:二值图、灰度图、调色板、真彩色17JPEG文件nJPEG静止图像压缩静止图像压缩采用有损编码方式采用有损编码方式应用于数码相机应用于数码相机nJPEG2000为为JPEG的升级版,其压缩率比的升级版,其压缩率比JP
15、EG高约高约30%支持有损压缩和无损压缩支持有损压缩和无损压缩能实现渐进传输:即先传输图像的轮廓,然后逐能实现渐进传输:即先传输图像的轮廓,然后逐步传输数据,让图像由朦胧到清晰显示步传输数据,让图像由朦胧到清晰显示应用于数码相机、网络传输、无线通信应用于数码相机、网络传输、无线通信JPEG文件nJPEG委员会在制定JPEG标准时,定义了许多标记来区分和识别图像数据及其相关信息,但对JPEG文件交换格式没有明确的定义。目前使用比较广泛的是JPEG文件交换格式(JPEG File Interchange Format,JFIF)是1992年9月由在C-Cube Microsystems公司的Eri
16、c Hamilton提出的,版本号为1.02。n在JFIF文件格式中,图像样本的存放顺序是从左到右和从上到下,即文件中的第一个图像样本是图像左上角的样本。JFIF文件格式直接使用JPEG标准为应用程序定义的许多标记,因此JFIF格式成了事实上JPEG文件交换格式标准。JPEG的每个标记都是由2个字节组成,其前一个字节是固定值0 xFF。每个标记之前还可以添加数目不限的0 xFF填充字节。18标记名称标记的16进制值标记含义1SOI0 xD8图像开始2APP00 xE0JFIF应用数据块3APPn0 xE1 - 0 xEF其他的应用数据块(n, 115)4DQT0 xDB量化表5SOF00 xC
17、0帧开始6DHT0 xC4霍夫曼(Huffman)表7SOS0 xDA扫描线开始8EOI0 xD9图像结束JPEG文件nAPP0标记(Marker)标识JFJF应用数据块(APP0域)的开始,其后的APP0域中顺序包含了下列字段: APP0长度(length),2个字节; 标识符(identifier),5个字节,格式为“JFJF0”,用于识别APP0的标记; 版本号(version),2个字节,其中第一个字节为主要版本号,如版本1.02中的1,第二个字节为次要版本号,如版本1.02中的02; X和Y的密度单位,1个字节,units=0表示无单位,units=1表示单位为点数/英寸,units
18、=2表示单位为点数/厘米; X方向像素密度(X density),2个字节; Y方向像素密度(Y density),2个字节; 缩略图水平像素数目(thumbnail horizontal pixels),1个字节; 缩略图垂直像素数目(thumbnail vertical pixels),1个字节; 缩略图RGB位图(thumbnail RGB bitmap),3n个字节,其中n为缩略图的像素数。nAPPn标记(Markers)分别标识其它的应用数据块(APPn域)的开始,其中n=115(任选)。每个APPn域包含两部分: APPn长度(length);标识符(identifier),5个字
19、节,格式为“JFXX0”; 缩略图格式,1个字节,指定什么数据格式为指图使用,其中0 x10表示JPEG格式,0 x11表示采用每个像素点1个字节的palettised格式,0 x13表示采用每个像素点3字节的RGB格式; 缩略图数据,长度会根据格式的不同而变化,具体参见JPEG标准。19JPEG文件n量化表DQT部分可包含一个或者多个量化表。每个量化表都是以0XFFDB开始,其后跟2个字节的量化表长度字段;后面是一个字节的量化表序号;最后是64个字节的量化表,量化表的系数是按照Z型扫描所得的8*8量化系数的顺序存储的。n帧图像开始SOF0(Start of Frame)之后有6个固有字段,分
20、别是: 帧开始长度,2个字节; 精度,每个颜色分量每个像素的位数,1个字节; 图像高度,2个字节; 图像宽度,2个字节; 颜色分量数,1个字节; 各颜色分量量化设置,共9字节,对每个颜色分量有3个字节的设置,分别是ID,垂直方向的样本因子和水平方向的样本因子,量化表号。n霍夫曼表DHT部分也可包含一个或者多个表,每个表均以0XFFC4开始,包含以下5个部分: 霍夫曼表的长度; 类型,AC或者DC; 索引; 位表; 值表。n扫描开始SOS(Start of Scan)部分存储实际的编码数据,每个扫描的长度会有所不同,由紧随其后的2个字节的扫描开始长度表示,后面是1个字节的颜色分量数,后面还包括针
21、对每个颜色分量的描述,每个分量的内容有ID号、交流系数表号和直流系数表号。在这之后就是压缩图像的数据。文件以图像结束EOI(End of Image)标识符作为文件的结束。2021GIF文件n采用复杂的LZW编码方式n一个GIF文件可以存储多幅图像nInternet上大量采用的彩色动画文件多为此格式nGIF文件格式的以下一些特性:使用彩色查找表或者叫做调色板可支持256种颜色的彩色图像。流式读写性能(streamability)。图像文件格式允许连续读出和写入图像数据,这个特性很适合于在通信过程中生成和显示图像。逐次逼近显示(progressive display)。这种特性可使在通信链路上传
22、输图像文件的同时就在终端上显示图像,把整个轮廓显示出来之后逐步显示图像的细节,也就是先用低分辨率显示图像,然后逐步提高它的分辨率。透明性(transparency)。这个性能可使图像中某些部分不显示出来,用来创建一些有特色的图像。辅助信息(ancillary information)。这个特性可用来在图像文件中存储一些文本注释信息。独立于计算机软硬件环境。使用无损压缩。PNG文件nPNG(Portable Network Graphic Format,便携式网络图像格式)是W3C联盟(World Wide Web Consortium)在1996年10月1日正式公布的专门针对网页设计的一种无损
23、位图文件存储格式,是一种轻便、无法律障碍、压缩性能好且规范好的一个标准。PNG名称来源于非官方的“PNGs Not GIF”,是一种位图文件存储格式,读成“ping”。它的特点主要有:压缩效率通常比GIF要高,提供Alpha通道控制图像的透明度,支持校正机制用来调整图像的亮度等。nPNG文件格式支持3种主要的图像类型:真彩色图像、灰度图像以及颜色索引数据图像。用来存储灰度图像时,灰度图像的深度可多到16 bit;存储彩色图像时,彩色图像的深度可多到48 bit,并且还可存储多到16 bit的Alpha通道数据。PNG使用从LZ77派生的无损数据压缩算法。nPNG文件格式中增加了下列GIF文件格
24、式所没有的下列特性:每个像素为48 bit的真彩色图像。每个像素为16 bit的灰度图像。可为灰度图和真彩色图添加Alpha通道。使用循环冗余码(CRC)检测破损的文件。更优化的逐次逼近显示方式。22PCX文件nPCX是由Zsoft公司在80年代初期为其图像处理软件Paint Brush(画笔)配套推出的一种图像文件格式,后缀为.pcx。n在Windows尚未普及时,DOS下的绘图、排版软件都用PCX文件格式。后来,Microsoft将PC Paint Brush移植到Windows环境中,PCX图像文件格式也就得到了更多的图形图像处理软件的支持。nPCX的图像深度可选为1、4、8 bit,分
25、别为单色、不超过16种颜色和具有256种颜色的PCX图像文件。可以看出,PCX图像文件不支持真彩色。其存储方式采用RLE(Run Length Encoding,游程编码)压缩编码,读写PCX文件时需要先进行RLE编、解码。23TIFF文件nTIFF(Tag Image File Format,标记图像文件格式)是由Aldus和Microsoft公司为扫描仪和桌上出版系统研制开发的一种较为通用的图像文件格式。n它是Macintosh和PC机上使用最广泛的位图格式,在这两种硬件平台上移植TIFF格式的图像十分便捷,大多数扫描仪也都可以输出TIFF格式的图像文件。该格式支持的色彩数最高可达16M种
26、。TIFF格式的图像文件后缀一般是*.tif/*.tiff。n其特点是:1)存储的图像质量高,但占用的存储空间也大;2)文件格式灵活易变,有四类不同的格式:TIFF-B适用于二值图像;TIFF-G适用于黑白灰度图像;TIFF-P适用于带调色板的彩色图像;TIFF-R适用于RGB真彩色图像;3)支持多种编码方法,其中包括RGB无压缩、LZW无损压缩、RLE压缩及JPEG压缩等。24PSD文件nPSD(Photoshop Document)图像文件格式是Adobe公司的图像处理软件Photoshop的专用文件格式,后缀为*.psd,可以存储成RGB或CMYK颜色空间模型,还能够自定义颜色数并加以存
27、储。PSD格式文件其实是Photoshop进行平面设计的一张“草稿图”,其中包含各种图层、通道、蒙板等多种设计的样稿,以便下次打开文件时可以修改上一次的设计和制作的各种特殊效果。n在Photoshop所支持的各种图像格式中,以自定义的PSD格式打开和保存图像的速度比其他格式都快。PSD格式还提供了无损图像压缩功能。Photoshop格式的缺点在于除了Photoshop之外,其他程序很少支持这种格式。如果要与其他程序交换图像,可使用TIFF、JPEG或其他通用格式。通常,对于尚未制作完成的图像,最好选择PSD格式存盘,以后再转换成占用磁盘空间较小、存储质量较好的其他文件格式。25GIF动画文件n
28、考虑到网络传输中的实际情况,GIF图像格式除了一般的逐行显示方式之外,还增加了渐显方式,也就是说,在图像传输过程中,用户可以先看到图像的大致轮廓,然后随着传输过程的继续而逐渐看清图像的细节部分,从而适应了用户的观赏心理,这种方式以后也被其他图像格式所采用,如JPEG/JPG等。n最初,GIF只是用来存储单幅静止图像,称GIF87a,后来,又进一步发展成为GIF89a,可以同时存储若干幅静止图像并进而形成连续的动画,目前Internet上大量采用的彩色动画文件多为这种格式的GIF文件。26Flic文件nFlic文件是Autodesk公司在其出品的2D/3D动画制作软件中采用的彩色动画文件格式,是
29、FLC和FLI的统称。n*.fli是最初的基于320200分辨率的动画文件格式,*.flc则是*.fli的扩展,采用了更高效的数据压缩技术,其分辨率也不再局限于320200。nFlic文件采用RLE压缩算法和Delta算法进行无损的数据压缩,首先压缩并保存整个动画序列中的第一幅图像,然后逐帧计算前后两幅相邻图像的差异或变化部分,并对这部分数据进行RLE压缩。由于动画序列中前后相邻图像的差别通常不大,因此采用行程编码可以得到较高的数据压缩率。nFlic文件的结果可分为3个层次:文件层、帧层和块层。文件层描述Flic文件的基本特征;帧层定义了帧的缓冲和块中块的数目;块层包括了块的大小、类型和实际数
30、据。27SWF文件nSWF(ShockWave Flash)文件格式是二维动画软件Flash中的矢量动画格式,主要用于Web页面上的动画发布。目前已成为网上动画的事实标准。nSWF文件是一种MIME(多用途的网际邮件扩充协议)类型的应用程序。它经历了若干个版本。在第5个版本中,SWF的标签设置经过了一次较大规模的充实和完善。从第6个版本之后,文件格式变化就不大了。SWF文件由头部和其后的许多标签组成,下面是SWF文件头文件头的格式。28字段字段长度(长度(bit)说明说明头标记8“F”表示未压缩,“C”表示已压缩(版本6或后续版本)头标记8此标识通常为“W”头标记8此标识通常为“S”版本8版本
31、号不是ASCII字符,而是8位数字如,SWF4文件的版本号是0 x04,不是ASCII字符”(0 x35)文件长度32整个文件的字节长度。包括文件头整个文件的总长度如果是一个未压缩的SWF文件(FWS标识),文件长度字段表示文件的精确大小;如果是一个压缩的SWF文件(CWS标识),文件长度字段表示解压后文件大小 帧大小16表示影片的宽度和高度,存在一个RECT结构中,影片大小可以根据坐标(四个点的坐标)数值的变化而变化,通常采用如下形式:Xmin和Ymin成员都为0;Xmax和Ymax成员声明宽度和高度帧速率16表示理想的每秒播放帧数。如果SWF文件包含声音流数据,或者Flash播放器运行在一
32、个慢的CPU上,这个速率是不能保证的帧数16影片的总帧数AVI文件及AVI格式nAVI(Audio Video Interleaved,音频视频交错)是Microsoft公司开发的一种符合RIFF文件规范的数字音频与视频文件格式,最早用于Microsoft Video for Windows环境,现在已被Windows 95/98、OS/2等多数操作系统直接支持。nAVI格式允许视频和音频交错在一起同步播放,支持256色和RLE压缩,图像质量好,可以跨多个平台使用,其缺点是体积过于庞大,而且更加糟糕的是压缩标准不统一。因此,AVI文件格式只是作为控制界面上的标准,不具有兼容性,用不同压缩算法生
33、成的AVI文件,必须使用相应的解压缩算法才能播放出来。nAVI文件的格式中,文件类型用一个四字符码AVI 来表示。AVI文件的结构包括一个RIFF头、两个列表和一个可选的索引块,具体结构如下:29AVI文件及AVI格式nAVI表示文件类型是AVI。然后是AVI文件必需的第一个列表:hdrl列表,用于描述AVI文件中各个流的格式信息。hdrl列表嵌套了一系列块和子列表:首先是一个avih块,存储主AVI信息头数据,用于记录AVI文件的全局信息,如流的数量、视频图像的宽和高等;然后,就是一个或多个strl子列表。每个strl子列表至少包含一个strh块和一个strf块,而strd块(保存编解码器需
34、要的一些配置信息)和strn块(保存流的名字)是可选的。Strh块用于说明这个流的头信息;strf块用于说明流的具体格式。n然后是AVI文件必需的第二个列表:movi列表,用于保存真正的媒体流数据。这些数据块可直接嵌在movi列表里面,也可将几个数据块分组成一个rec列表后再编排进movi列表。n数据块使用了一个四字符码来表征它的类型,这个四字符码由2个字节的类型码和2个字节的流编号组成。标准的类型码定义如下:db(非压缩视频帧)、dc(压缩视频帧)、pc(改用新的调色板)、wb(音缩视频)。比如00wb,00db或00dc。n最后就是AVI文件可选的索引块。这个索引块为AVI文件中每一个媒体
35、数据块进行索引,并且记录它们在文件中的偏移。索引块使用一个四字符码idx1来表征。30DV-AVI格式nDV(Digital Video,数字视频)是由索尼、松下、JVC等多家厂商联合提出的一种家用数字视频格式。目前非常流行的数码摄像机就是使用这种格式记录视频数据的。nWINDOWS操作系统中,DV-AVI文件有两种类型:TYPE-1和TYPE-2。如果需要最小的文件和最低的CPU处理能力,TYPE1是首选;TYPE-2的兼容性较好,只是文件较大。两种文件类型在画面和声音质量上是一样的。nType-1 DV-AVI文件简单地将一个AVI文件头加到这个数据流的前面,其它什么都不变。TYPE-1
36、DV-AVI文件里视频和音频都在一个DV格式数据流中。nTYPE-2 DV-AVI是将音频由DV流中抽取出来后作为一个独立的AVI格式流加到AVI文件中,因此比TYPE-1AVI文件兼容性较好,但比TYPE-1 DV-AVI文件稍大,且在采集或回录时对CPU的要求高。31MPEG/MPG/DAT格式nMPEG文件格式是运动图像压缩算法的国际标准,它采用有损压缩方法减少运动图像中的冗余信息,同时保证每秒30帧的图像动态刷新率,已被几乎所有的计算机平台共同支持。MPEG标准包括MPEG视频、MPEG音频和MPEG系统(视频、音频同步)三个部分。n这类格式是影像阵营中的一个大家族,也是我们平时所见到
37、的最普遍的一种视频格式。由它衍生出来的格式尤其多,包括以mpg、mpe、mpa、m15、m1v、mp2等等为后缀名的视频文件都是出自这一家族。Video CD (VCD)、Super VCD (SVCD)、DVD (Digital Versatile Disk)则是全面采用MPEG技术所产生出来的新型消费类电子产品。32MPEG/MPG/DAT格式n一个完整的一个完整的MPEG-2文件就是一个文件就是一个PS流文件。流文件。n文件以文件以0 x0000 01B9结束,即结束,即MPEG_Program_end_code,之前有很多个,之前有很多个0 x0000 00BA字段,即为字段,即为pr
38、ogram pack的开始标志。的开始标志。program pack由由3部部分组成:分组成:pack_header,system_header和和PES_packets。33MPEG/MPG/DAT格式nsystem_header当且仅当当且仅当pack是第一个数据包时才存在。是第一个数据包时才存在。34MOV格式nMOV文件又称QuickTime文件,是Apple计算机公司开发的一种音频、视频文件格式,用于保存音频和视频信息,具有先进的视频和音频功能,被包括Apple Mac OS、Microsoft Windows 95/98/NT在内的所有主流电脑平台支持。nQuickTime文件格式
39、支持25位彩色,支持RLE、JPEG等领先的集成压缩技术,提供150多种视频效果,并配有提供了200多种MIDI兼容音响和设备的声音装置。n新版的QuickTime包含了基于Internet应用的关键特性,能够通过Internet提供实时的数字化信息流、工作流与文件回放功能,此外还采用了一种称为QuickTime VR(Virtual Reality,虚拟现实)的技术,使得用户通过鼠标或键盘的交互式控制可以观察某一地点周围360的景像,或者从空间任何角度观察某一物体。nQuickTime以其领先的多媒体技术和跨平台特性、较小的存储空间要求、技术细节的独立性以及系统的高度开放性,得到业界的广泛认
40、可,目前已成为数字媒体软件技术领域的事实上的工业标准。国际标准化组织(ISO)最近选择它作为开发MPEG4规范的统一数字媒体存储格式。35MOV格式nQuickTime中用来构建等级数据结构的基本容器,称为原子(atom)。新创建的QuickTime原子就像树的根,随后的每个原子都包含在根中。原子的结构非常简单,包含一个原子头(原子大小和原子类型)和原子数据。36RM/RMVB格式n目前被广泛使用的RealVideo文件采用RM/RMVB格式。RealVideo文件是RealNetworks公司开发的流式视频文件格式,它包含在RealNetworks公司所制定的音频视频压缩规范RealMedi
41、a中,主要用来在低速率的广域网上实时传输活动视频影像,可以根据网络数据传输速率的不同而采用不同的压缩比率,从而实现影像数据的实时传送和实时播放。RealVideo除了可以以普通的视频文件形式播放之外,还可以与RealServer服务器相配合,在数据传输过程中边下载边播放视频影像,而不必像大多数视频文件那样,必须先下载然后才能播放。nRMVB格式是一种由RM视频格式升级延伸出的新视频格式,它的先进之处在于RMVB视频格式打破了原先RM格式那种平均压缩采样的方式,在保证平均压缩比的基础上合理利用比特率资源,就是说静止和动作场面少的画面场景采用较低的编码速率,这样可以留出更多的带宽空间,而这些带宽会
42、在出现快速运动的画面场景时被利用。这样在保证了静止画面质量的前提下,大幅地提高了运动图像的画面质量,从而图像质量和文件大小之间就达到了微妙的平衡。另外,相对于DVDrip格式,RMVB视频在压缩率上也是有着较明显的优势,大小约为DVD的50%。不仅如此,这种视频格式还具有内置字幕和无需外挂插件支持等独特优点。37RM/RMVB格式38ASF格式nASF(Advanced Streaming format)是微软为了和Real Player竞争而推出的一种视频格式,用户可以直接使用Windows自带的Windows Media Player对其进行播放。音频、视频、图像以及控制命令脚本等多媒体信
43、息通过这种格式,以网络数据包的形式传输,实现流式多媒体内容发布。nASF最大优点是文件小,适合网络传输。用户可以将图形、声音和动画数据组合成一个ASF格式的文件,也可以将其他格式的视频和音频转换为ASF格式,并且还可以通过声卡和视频捕获卡将诸如麦克风、录像机等等外设的数据保存为ASF格式。另外,ASF格式的视频中可以带有命令代码,用户指定在到达视频或音频的某个时间后触发某个事件或操作。nASF文件基本的组织单元叫做ASF对象,它是由一个128位的全球唯一的对象标识符(Object ID),一个64位整数的对象大小(Object Size)和一个可变长的对象数据(Object Data)组成。对
44、象大小域的值是由对象数据的大小加上24比特之和。39WMV格式nWMV(Windows Media Video)格式文件也是微软推出的一种采用独立编码方式并且可以直接在网上实时观看视频节目的文件压缩格式。nWMV格式的主要优点包括:本地或网络回放、可扩充的媒体类型、部件下载、可伸缩的媒体类型、流的优先级化、多语言支持、环境独立性、丰富的流间关系以及扩展性等。nWMV文件与ASF文件的区别仅仅在于文件扩展名和MIME类型的区别。WMV文件的MIME类型是video/x-ms-wmv,WMA文件的MIME类型是audio/x-ms-wma,而ASF文件的MIME类型是video/x-ms-asf。
45、三者的文件基本内部机构是完全相同的。下图给出了WMV/WMA文件的结构。40MIDI文件nMIDI是乐器数字接口,是数字音乐/电子合成器的统一国际标准,它定义了计算机音乐程序、电子合成器和其他电子设备之间交换信息与控制信号的方式,还规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议。可用于不同乐器创建的数字声音,可模拟大提琴、小提琴、钢琴等常见乐器。nMIDI文件存储MIDI消息的标准文件格式,文件中包含多达16个通道的乐器定义以及每个通道的演奏音符信息:键、通道号、音长、音量和力度(击键时,键达到最低位置的速度)。所以,MIDI文件记录的不是乐曲本身,而是一些描述乐曲演奏
46、过程中的指令。计算机将这些指令发送给声卡,声卡按照指令将声音合成出来,MIDI声音在重放时可以有不同的效果,取决于音乐合成器的质量。n由于MIDI文件记录的是一系列指令而不是数字化后的波形数据,因此它占用存储空间比Wave文件要小很多。41WAVE文件nWave格式是Microsoft和IBM公司开发的一种波形音频文件格式,符合RIFF文件规范,被Windows平台及其应用程序所广泛支持。nWave 文件所存储的音频数据是对声音模拟波形进行采样所得的PCM样值数据,因此也称为波形文件。Wave文件的大小采样频率(Hz)量化比特数(bit)(声道数/8)录音时间。例如,44.1 kHz的采样频率
47、,采样点的量化比特数用16bit,1s的立体声其wav 文件的大小为176.4KB。实践表明,用22.05 kHz采样频率和8 bit的量化精度,可取得较好的音质,其效果可以达到相当于调幅(AM)广播的音质。nWave 文件格式支持CCITT A律和律、ADPCM等压缩算法,是PC机上最为流行的音频文件格式。nWindows的convert工具也可以将PCM音频文件转换成*.wav 文件。Microsoft公司的Sound System软件Sound Finder可以将*.aif 和*.voc 文件转换成*.wav 文件。42MPEG音频文件nMPEG音频文件指的是MPEG标准中的声音部分,即
48、MPEG音频层。文件后缀有MP1/MP2/MP3/MP4/AAC。目前INTERNET上的音乐格式以MP3最为常见。它是一种有损压缩,但是其最大优势是以极小的声音失真换来了较高的压缩比。nMPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为4 1和6 1 8 1,而MP3的压缩率则高达10 1 12 1,即一分钟CD音质的音乐,未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,其音质基本保持不失真。nMP3的开放性最终导致了版权之争,文件更小、音质更佳,同时还能有效保护版权的MP4就应运而生。MP4采用的是美国电话电报公司(AT&T)开发的以“感知编码”为关键技术的
49、音乐压缩技术,由美国网络技术公司(GMO)及RIAA联合公布的新的音乐格式。MP4在文件中采用保护版权的编码技术,只有特定用户才可播放,有效保证了音乐版权的合法性。另外MP4的压缩比达到了15 1,体积比MP3更小,但音质并没有下降。nAAC是由德国Fraunhofer 研究所、Dolby(杜比)和AT&T共同开发的音频格式,是MPEG-2 规范的一部分。它同时支持多达48个音轨、15个低频音轨、更多种采样频率和数码率、多种语言的兼容能力、更高的解码效率。43小结n常用的图像文件格式常用的图像文件格式BMP、JEPG、TIFF、GIF、n常用的动画文件格式常用的动画文件格式GIF、Flic、SWF、n存储视频数据的方式存储视频数据的方式AVI、MPEG、MOV、RMVB、ASF、WMV、YUV、 n存储音频数据的方式存储音频数据的方式MIDI、WAVE、MP1/2/3/4/AAC、 44