1、第4章 多媒体信息输入输出及存储技术内容 4.1 多媒体信息输入输出技术 4.2 多媒体信息存储技术 4.3 多媒体数据库 4.1 多媒体信息输入输出技术 4.1.1 音频信息输入输出技术音频信息输入输出技术 音频信息的输入输出主要是由声卡来完成的。声卡或音频卡(audio card)是负责录音、播音和声音合成的计算机硬件插卡,是计算机进行所有与声音相关处理的硬件设备。声卡的结构声卡的结构 声卡的结构如图4-1所示。总线接口芯片为声卡的各个部分与计算机系统总线间提供握手信号,同时总线接口芯片还起到对指令和数据的缓冲器作用,完成声卡与计算机系统总线之间指令和数据的传送。数字音频处理芯片完成各种音
2、频信号的记录和播放任务,处理工作还包括ADPCM音频信号的压缩和解压缩、采样频率改变、MIDI指令解释等。音乐合成器负责MIDI的合成音效,可以即时创造声音,将数字音频的波形数据和MIDI信息合成为声音。一般声音的变化是用一些电压、电流这样的模拟信号的变化来反映的,而计算机只能处理数字信号,声卡中的AD转换器负责将接收的模拟信号转成数字信号供计算机处理或将数字化的音频信号转换为模拟信号送出去,驱动音箱或耳机发音。混音器将从话筒、线性输入、CD输入的不同途径声音信号进行混合,还提供用软件控制音量的功能。图4-1 声卡的结构声卡的主要功能有:n音频的录制与播放。声卡能将来自麦克风、收录机、激光唱盘
3、等的声源采样,在软件的帮助下以数字声音文件的形式存放。在需要的时候,只要调出相应声音文件播放即可。此外,声卡与CD-ROM驱动器相连,可以实现对CD唱盘的播放;n声音效果合成。可以给声音添加诸如淡入淡出、回声、音调变化等特效,这些对音乐爱好者都是非常有用的;n对声音文件的压缩和解压缩。直接通过采样得到的波形声音文件都很大,这样会占据太多有用的磁盘空间,需要用压缩编码的方法对这些文件压缩。有的声卡上有固化的压缩算法,有的是向用户提供压缩软件;n语音合成。通过语音合成技术将计算机中储存的文本文件转换成可以听到的语音,即让计算机来朗读文本;n语音识别。语音合成使人能够听到计算机的声音,相反语音识别能
4、使计算机识别出人的声音。语音识别技术可以实现让计算机听懂人的声音信息,主要应用于需要用语音作为人机交互的场合;nMIDI音乐录制和合成。MIDI接口是乐器接口的国际标准,MIDI规定了电子乐器与计算机之间相互进行数据通信的协议,以保证双方有效的数据通信。通过相应的软件可以直接利用计算机完成对外部电子乐器的操作和控制。声卡的相关技术标准声卡的相关技术标准n声卡的采样技术 声卡的主要作用之一是对声音信息进行录制与回放。在这个过程中,采样的位数和采样的频率决定了声音采集的质量。n采样精度。它决定了记录声音的动态范围,以位(bit)为单位,比如8bit、16bit。8bit可以把声波分成256级,16
5、bit可以把同样的声波分成65536级的信号。采样位数可以理解为声卡处理声音的解析度。这个数值越大,解析度就越高,录制和回放的声音就越真实。如今的主流产品都是16bit的声卡。n采样频率。当今的主流声卡,采样频率一般分为22.05kHz、44.1kHz、48kHz共3个等级,22.05kHz只能达到FM广播的声音品质,44.1kHz则是理论上的CD音质界限,48kHz则更加精确一些。对高于48kHz的采样频率,人耳已无法辨别出来了。n声道数 声卡所支持的声道数也是技术发展的重要标志,从单声道到最新的环绕立体声,这里介绍不同的声道数对声卡的影响。n单声道。单声道是比较原始的声音复制形式,早期的声
6、卡采用得比较普遍。当通过两个扬声器回放单声道信息的时候,可以明显感觉到声音是从两个音箱中间传递到我们耳朵里的。n立体声。立体声技术的声音在录制过程中被分配到两个独立的声道,从而达到很好的声音定位效果。这种技术在音乐欣赏中显得尤为有用,听众可以清晰地分辨出各种乐器来自的方向,从而使音乐更富想象力,更加接近于临场感受。n准立体声。准立体声声卡的基本概念就是:在录制声音的时候采用单声道,而播放有时是立体声,有时是单声道。n4声道环绕。随着技术的进一步发展,人们逐渐发现双声道已经越来越不能满足需求。因为PCI声卡的宽带带来了许多新的技术,其中发展最快的当数三维音效。新的4声道环绕音频技术规定4个发音点
7、:前左、前右,后左、后右,听众则被包围在这中间。就整体效果而言,4声道系统可以为听众带来来自多个不同方向的声音环绕,可以获得身临各种不同环境的听觉感受。n5.1声道。5.1声音系统来源于4.1环绕,不同之处在于它增加了一个中置单元。这个中置单元负责传送低于80Hz的声音信号,有利于加强人声,把对话集中在整个声场的中部,增加整体效果。5.1声道包括中央声道、前置左/右声道、后置左/右环绕声道,及所谓的0.1声道重低音声道总共可连接6个扬声器,让人感觉置身于整个场景的正中央。目前,5.1声道已广泛运用于各种传统影院和家庭影院中,一些比较知名的声音录制压缩格式,譬如杜比AC-3(Dolby Digi
8、tal)、DTS等都是以5.1声音系统为技术蓝本的。n7.1声道。更强大的7.1系统已经达到了应用阶段。它在5.1的基础上又增加了中左和中右两个发音点,以求达到更加完美的境界,但是成本比较高。n电子乐器数字化接口 电子乐器数字化接口(Musical Instrument Digital Interface,MIDI)是电子乐器之间以及电子乐器与计算机之间的统一交流协议。是MIDI生产商协会制定给所有MIDI乐器制造商的音色及打击乐器的排列表。包括总共128个标准音色和81个打击乐器排列。由于MIDI只是记录乐曲每一时刻的音乐变化,它只是将需要演奏的乐曲信息记录下来,例如:演奏的乐器、演奏的音调
9、伴奏等,并不包括任何可供回放的声音信息,所以MIDI文件的容量比较小。进行声音回放时需要通过声卡进行回放处理。通常有FM合成和波表合成两种方法。目前,在一些游戏软件和娱乐软件中我们经常发现很多以mid,rmi为扩展名的音乐文件,这些就是在计算机上最为常用的MIDI格式。n信噪比 信噪比(Signal to Noise Ratio,SNR)是一个诊断声卡抑制噪声能力的重要指标。通常用信号和噪声信号功率的比值,即SNR,单位是dB。SNR值越大,则声卡的滤波效果越好。从AC97开始,声卡上的ADC,DAC必须和混音工作及数字音效芯片分离。n兼容性 兼容性有软件兼容和硬件兼容之分。兼容性对声卡很重要
10、,特别在游戏方面。目前很多PCI声卡在放CD、MP3时,放大或缩小窗口都会有杂音出现,这主要是PCI显示卡也使用PCI总线的PCI Bus Master技术进行加速。若使用的是AGP显卡则绝对不会出现这些问题。4.1.2 视频信息输入输出技术 视频卡视频卡 视频采集、显示播放是通过视频卡、播放软件、显示设备来实现的。视频卡是基于PC机的一种多媒体视频信号处理平台,它可以汇集视频源、录像机(VCR)、摄像机(Camera)等的信息,经过编辑或特技处理而产生非常漂亮的画面。这些画面还可以被捕捉、数字化、冻结、存储、输出及进行其他的操作。对画面的修整、像素显示调整、缩放功能等都是视频卡支持的标准功能
11、。多媒体视频卡除了可以实现视频信号数字化、捕捉特定镜头外,还可以在VGA上开窗口并与VGA信号叠加显示。视频卡的基本工作原理 视频卡的基本工作原理如图4-2所示。图4-2 视频卡的工作原理 为了适应多种视频源的应用,视频卡一般都具有多个不同视频接口,分别对应录像机、影碟机和摄像机等视频源,可以通过相应的视频软件来选择所需视频源。图中的选择视频源完成对相应视频源的选择。ADC完成视频解码,主要是模拟图像信号至数字图像信号的转换和解码。视频处理芯片是用于视频信号的捕获、播放和显示的专用控制芯片,可以完成视频输入信号的裁减、比例变化、VGA同步、色键控制、PC总线接口和对帧存储器的操作。视频处理器输
12、出的是经过处理的RGB信号,与VGA显示卡输出的RGB信号是完全同步的,通过某种方法完成两路信号的叠加。视频随机访问存储器(VRAM)是专门为视频显示设计的存储器,可提供两个端口的同步读写能力,比一般的DRAM方式快得多。DAC主要完成数模转换,将叠加的信号转换成模拟信号,最后在显示器中进行显示。视频卡的分类 目前市场上常见视频卡有如下3类:n视频采集卡 将视频信号连续转换成计算机存储的数字视频信号(离散)保存在计算机中或在VGA显示器上显示,完成这种功能的视频卡称之为视频采集卡,或称为视频转换卡。如果能够实时完成压缩,则称实时压缩卡。通常可将外部视频输入信号叠加在显示器上,并将视频输入信号变
13、换成计算机可存储的信息保存在硬盘中。只能单帧捕获的,称为图像卡。视频采集卡的结构如图4-3所示。视频信号源、摄像机、录像机等信号首先经过A/D变换,通过多制式数字解码器得到YUV数据,然后由视频窗口控制器对其进行剪裁,改变比例后存入帧存储器。帧存储器的内容在窗口控制器的控制下与VGA同步信号或视频编码器的同步信号同步,再送到D/A变换器变成模拟的RGB信号,同时送到数字式视频编码器进行视频编码,最后输出到VGA监视器及电视机或录像机。图4-3 视频采集卡的结构n视频播放卡 将压缩保存在计算机中的视频信号数据在计算机的显示器上播放出来的这种卡称之为视频播放卡,或称解压缩卡。n电视转换卡 电视转换
14、卡分为两类:电视卡和TV编码器。电视卡是将标准的NTSC、PAL、SECAM电视信号转换成VGA信号在计算机屏幕上显示,这类卡也称为TV-VGA卡或电视调谐卡(TV Turner)等,它带一个高频头,可将计算机变成一台电视机,收看不同频道的电视节目。TV编码器将计算机的VGA信号转换为NTSC、PAL、SECAM等标准的信号在电视上播放或进行录像这类卡也叫做PC-TV卡、VGA-TV卡等。摄像头摄像头 随着宽带网络逐渐深入到人们的工作和生活中,利用网络进行视频对话和可视电话的使用也越来越多。数字摄像头作为数字摄像机的一个特殊分支,在网络视频应用中正发挥着越来越重要的作用。摄像头分为模拟摄像头和
15、数字摄像头两类。模拟摄像头获得的模拟视频信号必须经过计算机的视频卡进行数字化转换,并经过压缩后才可以送入计算机进行处理,数字摄像头也称为网络摄像头,可以直接捕捉视频图像,然后通过USB或IEEE1394高速接口输入到计算机,而不再需要视频卡。摄像头的基本工作原理是:外界景物通过摄像头的镜头(透镜)生成光学图像,再投射到图像传感器表面转换为模拟电信号,经过A/D变换转换为数字图像信号,送到数字处理芯片(DSP)进行加工处理,再通过与计算机的接口传输到计算机中进行处理,最后,通过显示器就可以看到图像了。摄像头的主要性能指标有:n摄像器件。按照感光元件的不同,摄像器件可以分为CCD(电磁耦合组件)和
16、CMOS(金属氧化物半导体组件)两类。这两类摄像器件在技术上有很大的差异,但性能的差别不是很大。一般来说,CCD的成像质量较高,用于对影像要求较高的场合,而CMOS用于对影像要求较低的应用场合。n像素分辨率。像素是影响数字摄像头成像质量的重要指标,像素的大小关系着图像的分辨率。在早期的摄像头中所使用的像素值一般只有10万左右,成像后的分辨率是352288(CIF)。因其分辨率太低且性能不佳而遭市场淘汰。目前市场上的主流产品的像素有30万像素(VGA,640480)和130万像素(SXGA,12801024),成像质量也有了很大提高。n颜色深度。大多数数字摄像头的颜色深度采用24位真彩色,质量更
17、好的甚至会采用30位的真彩色。采用的颜色深度越大,所得到的图像色彩越丰富,细节也更加的清晰;n视频捕获速度。捕获速度也叫帧率,表示单位时间内图像帧的显示速度,单位是帧/秒。视频捕获速度是摄像头对视频图像捕获、处理和传输的能力,直接关系到动态图像的流畅度。由于摄像头捕获的是运动图像,因此帧率对图像主观感受影响较大。捕获速度一般是指摄像头采用最大分辨率时的流畅度。通常所采用的摄像头的帧率在20帧/秒,高档摄像头的帧率在30帧/秒。帧率太低会出现跳帧的现象。一般数字摄像头视频捕获的最大分辨率为640480,若帧率要达到30帧/s,宽带网的传输速率要达到10Mbit/s;n接口方式。早期的数字摄像头是
18、接在计算机的并口上,速率达到1Mbit/s,现在流行的数字摄像头都是接在计算机的USB口上。USB速度快、连接简单、即插即用并提供外接电源。现在的数字摄像头功耗都很低,依靠USB提供电源即可工作。4.1.3 其他输入输出技术 扫描仪扫描仪 扫描仪(Scanner)是一种图像输入设备,利用光电转换原理,通过扫描仪光电的移动或原稿的移动,把黑白或彩色的原稿信息数字化后输入到计算机中。扫描仪一般由电荷耦合器件(Charge Coupled Device,CCD)阵列、光源及聚焦透镜组成。CCD排成一行或一个阵列,阵列中的每个器件都能把光信号变为电信号,光敏器件所产生的电量与所接收的光量成正比。扫描仪
19、的图像数字处理过程(以平面式扫描仪为例):把原件面朝下放在扫描仪的玻璃台上,扫描仪内发出光照射原件,反射光线经一组平面镜和透镜导向后,照射到CCD的光敏器件上,由CCD将光信号转换成相应电信号。来自CCD的电信号送到模数转换器中,将电压转换成代表每个像素色调或颜色的数字值。步进电机驱动扫描头沿平台作微增量运动,每移动一步,即获得一行像素值。扫描彩色图像时分别用红、绿、蓝滤色镜捕捉各自的灰度图像,然后把它们组合成为RGB图像。有些扫描仪为了获得彩色图像,扫描头要分3遍扫描。另一些扫描仪中,通过旋转光源前的各种滤色镜使得扫描头只需扫描一遍。扫描仪的主要性能指标有:n光学精度。这是最重要的技术指标之
20、一,它直接影响到扫描效果。光学精度分横向精度和纵向精度,其中横向精度由扫描仪内的CCD点数来决定,而纵向精度通过步进电机来控制。所以通常是用横向精度来判定扫描仪的精度,用分辨率来做为定量描述。分辨率表示了扫描仪对图像细节的表现能力,定义为每英寸长度上扫描图像所含的像素点的个数,单位是dpi,数值越大,精度越高。n色彩位数(bit)。它是扫描仪所能捕获色彩层次信息的指标,由模数转换电路来决定。位数是由一次扫描过程中R、G、B三原色分别曝光(共三次)来定义的,例如三原色分别为28=256种色彩,则它们的组合色彩为282828=224=16M种颜色,即色彩位为24bit,灰度定义为256阶。在目前流
21、行的扫描仪产品中,36bit的扫描仪性能最好,在高性能显卡、高处理速度的计算机和先进图像处理软件的配合下,可以达到完美的效果。n硬件接口标准。扫描仪主要有SCSI、EPP和USB三种接口方式与计算机相连。EPP(增打印并口)接口方式简单,可以使扫描仪和打印机串联使用同一计算机并口,但传输速率较低。USB(通用串行总线)是最新的连接方式,目前流行的计算机主板都有USB接口,这种方式真正支持即插即用,而且支持热插拔功能;n动态密度(单位D)。动态密度表示扫描仪从白色到黑色的色调值宽度范围。大范围的扫描仪可以分辨出图像的暗部层次和亮部区域细节,因此反映了色彩的真实性。通常大于2.8D的扫描仪就可以满
22、足工作需要了。高动态密度的扫描仪应用于专业领域。数码相机数码相机 数码相机是一种高新技术数字图像捕捉设备。作为多媒体外设的一个新的扩充,几百万级像素和操作日趋简单的数码相机使图像的保存和处理更加方便,越来越受到人们的喜爱。它使用CCD阵列,把来自CCD阵列的电压信号送到模数转换器后,变换成图像的像素值。数码相机的主要部件:nCCD矩形网格阵列。数码相机的关键部件是CCD。与扫描仪不同,数码相机的CCD阵列不是排成一条线,而是排成一个矩形网格分布在芯片上,形成一个对光线极其敏感的单元阵列,使照相机可以一次摄一整幅图像,而不像扫描仪那样逐行地慢慢扫描图像。CCD表面的光敏单元就像计算机屏幕上的像素
23、一样按行、列编排。每个单元将根据照射到其上的光量,按比例聚集一定强度的电荷。n存储介质。数码相机都有内部的存储介质。典型的存储介质由普通的动态随机存取存储器、闪速存储器或小型硬盘组成。它们都像硬盘一样无需电池供电也可以把信息存储很长一段时间。图像数据被传送到照相机内部的存储介质上,存储介质可供存放图像,并把数据成组传送到计算机中。n接口。图像数据通过一个串行口、SCSI接口或USB接口从照相机传送到计算机。数码相机的成像原理 被摄物体的光信号通过数码相机光学透镜成像,由快门对光通量控制,在相机内专用感光成像的CCD阵列上成像,再由电子部件扫描成像信息,将这些信息的细节转变成相应的模拟电信号,而
24、后由模数转换器完成模拟信号到数字信号的转换,最后将这些数字影像信号进行数据压缩处理后保存在相机内部专用或通用的存储器中。可以根据需要将图像数据传输至计算机,或打印输出,或显示输出。现在的数码相机一般都配有小尺寸LCD彩色液晶显示屏,可随时查看图像效果。数码相机的主要技术指标n分辨率。数码相机图像质量由CCD的像素数来决定,像素数越多则相机的分辨率越高,画质就越好。同时像素数还可决定打印输出照片的大小。像素数越多,相同画质条件下打印照片的尺寸就越大。但分辨率越高,图像文件数据量就越大,在数码相机的有限内存空间内存储的照片就越少;n色彩浓度。色彩浓度即色彩位(bit),一般数码相机都能达到24bi
25、t,可生成真彩色图像。若色彩位要达到36bit或48bit,那么其像素数必须在200万级或500万级以上;n存储介质。除相机内部的内存卡之外,还有像PC卡、硬盘这样的存储媒体,它们的存储量、方便性、存储速度各不相同;n变焦镜头。变焦方式分为自动对焦和辅助手动对焦两种。高档数码相机一般都能实现光学变焦和数码变焦功能且变焦倍数高;n图像存储格式。主要有BMP格式、JPEG格式和TIFF格式。BMP格式容量大但画质较好;JPEG格式可调整图像压缩比例,但画质有所下降;TIFF格式是无损压缩(可逆压缩);n接口标准。普通数码相机采用USB(通用串行总线)数据接口;而专业数码相机采用IEEE1394数据
26、接口,这种接口传输速度很高;nLCD显示屏。这一功能使数码相机使用起来非常方便,因此也作为数码相机的一个指标,特别是显示屏尺寸这个指标比较重要。触摸屏触摸屏 触摸屏(Touch Screen)是一种定位设备。当用户用手指或其它设备触摸安装在计算机显示器前面的触摸屏时,所摸到的位置(以坐标形式)被触摸屏控制器检测到,并通过串行口或者其它接口送到CPU,从而确定用户所输入的信息。触摸屏可以附在CRT显示器,LCD显示器上。触摸屏的引入主要是为了改善人机交互方式,特别是非计算机专业人员,使用计算机时可以将注意力集中在屏幕上,免除了人们对键盘不熟悉的苦恼。在有的情况下(例如在公共场所的计算机),不希望
27、使用者用鼠标或键盘操作它,只提供在某个应用程序下的操作)。触摸屏系统一般包括触摸屏控制卡、触摸检测装置和驱动程序三部分。安装在触摸屏表面前端的触摸检测装置用来检测用户手指的触摸位置,并将相应信息传送给触摸控制卡。触摸控制卡接收从触摸检测装置送来的信息并转换成触点信息再传送给主机,同时还接收主机发送来的命令。按工作原理,可把触摸屏分为红外线式、电阻式、电容式、声表面波式等类型:n红外线式触摸屏。红外触摸屏是在普通显示器的前面安装一个外框。通过外框中的电路板在屏幕四边排布红外发射管和红外接收管,对应形成横竖交叉的红外线矩阵。当用户触摸屏幕时,手指就会挡住经过该位置的横竖两条红外线,从而利用X、Y方
28、向上密布的红外线矩阵来检测并定位用户的触摸位置,并将此信号通过串口或键盘端口输送给计算机,完成一个指令过程;n电阻式触摸屏。这种屏的传感器是一块覆盖电阻性栅格的玻璃,再蒙上一层涂有导电涂层并有特殊摸压凸缘的聚酯薄膜。凸缘避免其表面的涂层与玻璃的涂层接触。当屏幕被触摸时,压力使聚脂薄膜凹陷而与玻璃上的导电层接触。控制器向玻璃的两个邻角加5V电压,并把对面两角接地,于是电阻栅格使玻璃上形成从矩形的一边到另一边线性变化的电压阶梯,控制器从两个方向测出触摸点的电压值,从而计算出坐标位置;n电容式触摸屏。触摸屏由一个模拟感应器和一个智能双向控制器组成。感应器是一块表面涂有导电层的透明玻璃,上面覆盖一层保
29、护性外层。通电工作时产生分布电场,当手指或其它导体接触导电涂层时,电容改变,电场则随之变化。控制器检测变化的电场,确定触点的坐标位置。感应器安装在监视器内部,工作可靠性高;n声表面波触摸屏。声表面波是应变能沿物体表面传播的弹性波。触摸屏在一片玻璃的每个角上各安装两个发射器和接收器,反射声波的反射器被嵌进玻璃中,声波沿两面从顶端至底端穿过玻璃发射器朝一个方向发射5MHz的高频脉冲。当脉冲离开一角后,就会被反射器反射回来一部分声波。当触摸某点位置时,阻碍了脉冲在那点的反射,接收器接收的脉冲信号出现一缺口。脉冲的起始点至下落点间的时间长度就确定了触摸点的坐标。声波传播速度乘以时间就得到了距离。控制器
30、通过互换两对发射器和接收器,则可测定触点的坐标。手写笔手写笔 手写笔(又称为电子笔)在文字输入领域的研究与发展是前所未有的,目前市场上功能各异的“笔”产品不断出现。出现这种现象的主要原因就是手写笔有着键盘和鼠标无法与之相比的优点:(1)使用手写笔不需要专门培训,节省了大量时间;(2)自由作图功能强;(3)作为指针功能,在点击、拖动等操作方便,比鼠标更加直观;(4)在某些较复杂的数据输入场合(如表格数据输入),手写笔已成为人们操作方便快捷的工具。目前流行的通用型手写笔系统包括:笔、图形输入板、接口(一般利用计算机串口,与串口鼠标的接法相似)、笔驱动程序和识别管理程序等相关软件。当用笔在图形输入板
31、(又称为数字化仪)写字或作简单图形时,输入板对笔画的坐标点进行扫描和编码,编码不但要反映笔画的形状,而且还要兼顾笔画的力度、角度等状态,因此输入板实际就是一个光栅向量转化器。图形输入板将笔画数据综合量化后传输给计算机,在相关软件的帮助下进行识别处理。图形输入板的分辨率(单位dpi,这点类似于扫描仪的分辨率)是极为重要的一个指标,同时对笔画的采样速率也决定了笔画是否流畅,速率越高,对笔画的跟踪就越精细。图形输入板基本上分为电磁型和静电型两种类型。电磁型板面上有坐标格状导线,当笔靠近坐标格时,导线感应出电压,从而产生信号。而静电型板面采用绝缘透明写字板面,当笔靠近板面时,通过板面的电容耦合产生电压
32、信号,以确定坐标位置。当然还有一种不用笔的输入板,也是靠人的手指来触摸表面,感应生成所需要的信号。但这种类型只适合于比较简单的指令操作,分辨率很低。在众多手写笔的技术中,采用激光跟踪技术是较新的一种精确定位技术,相应产品的性能很好,当然结构相对复杂,成本较高。4.2 多媒体信息存储技术 多媒体存储最主要的特点是要考虑多媒体对象的庞大数据量及实时性的要求。目前,大型多媒体文档存储的主要介质是光盘存储系统和高速磁存储器。4.2.1 光存储技术 光存储技术发展很快,特别是近10年来,近代光学、微电子技术、光电子技术及材料科学的发展为光学存储技术的成熟及工业化生产创造了条件。光存储以其存储容量大、工作
33、稳定、密度高、寿命长、介质可换、便于携带、价格低廉等优点,已成为多媒体系统普遍使用的设备。1980年,日本的KDD公司推出了世界上第一台光存储系统。从那时候起,世界各先进工业国就致力于光存储系统的开发和研究下作。光存储系统由光盘驱动器和光盘盘片组成。光存储的基本特点是用激光引导测距系统的精密光学结构取代硬盘驱动器的精密机械结构。光盘驱动器的读写头是用半导体激光器和光路系统组成的光学头,记录介质采用磁光材料。驱动器采用一系列透镜和反射镜,将微细的激光束引导至一个旋转光盘上的微小区域。由于激光的对准精度高,所以写入数据的密度要比硬磁盘高得多。光存储系统工作时,光学读/写头与介质的距离比起硬盘磁头与
34、盘片的距离要远得多。光学头与介质无接触,所以读/写头很少因撞击而损坏。虽然长时间使用后透镜会变脏,但灰尘不容易直接损坏机件,而且可以清洗。与磁盘或磁带相比,光学存储介质更安全耐用,不会因受环境影响而退磁。硬盘驱动器使用5年以后失效是常见的事情,而磁光型介质估计至少可使用30年、读/写1000万次,只读光盘的寿命更长,预计为100年。光存储的类型光存储的类型常用的光存储系统有只读型、一次写型和可重写型光存储系统3大类。n只读型光存储系统。只读型(ReadOnly)光盘上的数据是在生产制作时生成的,用户可以根据需要选读光盘上的信息,但是不能擦除、更改或者再写入新的数据。它主要用于作为电子出版物、素
35、材库和大型软件的载体。常见的有CD-ROM、激光唱片(CD-DA),激光视盘(LD)以及存储视频图像和电影的VCD,DVD等。n一次写型光存储系统。一次写多次读型(Write Once Read Many,WORM)光存储系统的存储单元的状态只能改变一次,而且一旦改变就不能回到原来状态,即写是不可逆的,但是可重复多次读,即可一次写人,任意多次读出。使用寿命为1050年。它主要用于档案存储。常用的WORM光盘有CD-R光盘,使用C D-R刻录机写人数据,它支持逐次写人光盘内容,但对于已写人空间不允许重新写人。n可重写型光存储系统。可重写光盘(Erasable-Read/Write,E-R/W)像
36、硬盘一样,可以任意读写数据,即允许在擦除了盘片上原有的数据以后重新写人新的数据,主要用于多媒体应用开发系统和多媒体信息系统中。光存储系统技术指标光存储系统技术指标光存储系统的主要技术指标包括尺寸、存储容量、数据传输率、缓存和平均存取时间。n尺寸。光盘的尺寸多种多样。LV(Laser Vision)的直径为12in,CD激光唱盘和CD-ROM的直径为4.72in。光盘正在向小尺寸方向发展。n容量。容量指按照某种光盘标准进行格式化后的容量。采用不同的光盘标准就有不同的存储格式,容量也不一样。如果改变每个扇区的字节数,或采用不同的驱动程序,则会影响格式化容量。例如,SONY公司的SMO-D501光盘
37、,如果格式化使每个扇区为1024B,则格式化容量是325MB;如果采用每扇区为512B,则格式化容量只有297 MB。目前,光盘正朝着高密度、大容量和小体积方向发展。n数据传输率。数据传输率是指从光盘驱动器上读取数据到系统存储中的速度,或单位时间内从光道上传送的数据位数(Kbit/s),也可以表示为数据字节数(KB/s)。最初颁布的MPC-1标准规定光驱的数据传输率为150KB/s。随后以此速率作为衡量光盘数据传速率的单位,出现了2倍速、4倍速、8倍速,例如8倍速的光驱其数据传输率是1.2MB/s。目前已经达到64倍速,即9.6MB/s。n高速缓存。由于光盘驱动器读数的速度远比硬盘驱动器慢,因
38、而在光盘驱动器中需要设置读出数据的高速缓冲器。从光盘读数据时,将读出的数据存入高速缓存,存满后可以立即输出到计算机的RAM中,接着继续读出数据并存人高速缓存,这样可以提高光盘的读取速度。64KB的缓存可将CD-ROM的读取速度提高230倍。原则上讲,缓冲区的容量越大越好。一般有64KB,128KB,256KB,也有1MB或更大的缓冲区。n平均存取时间。平均存取时间是指从计算机向光盘驱动器发出命令开始,到光盘驱动器在光盘上找到读写信息的位置,并接收读写命令为止的一段时间。包括光学头寻道时间、稳定时间和旋转延时。早期的单速150KB/s光盘驱动器的平均存取信息所需要的时间为350ms,甚至更长的时
39、间。而2倍速光驱的查找时间平均在200ms左右,4倍速光驱的平均存取时间大约为100160ms。可见,平均存取时间的减少意味着通过光驱从光盘上查找资料的速度加快了。光盘库光盘库 光盘库系统是一种带有自动换盘装置(机械手)的光盘存储共享设备,一般由放置光盘的光盘架、自动换盘机构(机械手)和驱动器三部分组成。光盘库系统包含一个或多个光驱动器,由精确伺服控制的机电机械手自动升降器机构来在盘片堆找上的槽和驱动器之间来回移动光盘。当用户访问光盘库时,自动换盘机构首先将驱动器中的光盘取出并放置在指定的盘架位置上,然后将光盘送入驱动器。在盘播放完毕后机械手机构从驱动器上将盘卸下并放回堆栈上它的槽内。在程序控
40、制下,机械手设备可操作和管理多个驱动器。一套光盘库一般由212个盘仓组成,每个盘仓可容纳50片光盘,最多可以容纳多达600张光盘,总容量可以达到几百GB甚至TGB。光盘库通过高速SCSI接口与网络服务器连接,光盘驱动器通过自身接口与主机交换数据。当用户需要对光盘中的数据进行访问时,自动换盘装置先将驱动器中的光盘取出并按照要求放置在光盘架指定位置,然后再从光盘架中取出所需要的光盘并送入驱动器中。自动换盘装置的换盘速度迅速,一般是在秒级,光盘库所用的盘片一般是以VCD或DVD为主。DVD光盘库的主要特点如下:n高容量,每张DVD盘片容量达到5.2GB,总容量达到TGB;n检索速度快,换盘时间在秒级
41、,支持跨盘存取;n高可靠性,光盘的寿命为100年;n与各系统无缝连接,可应用于Windows NT,Net Ware,Unix,IBM等系统;n安装简便,易于管理。4.2.2 存储区域网络存储区域网络 存储区域网络(Storage Area Network,SAN)是通过专用高速网将一个或多个网络存储设备和服务器连接起来的专用存储系统。SAN在最基本的层次上定义为互连存储设备和服务器的专用光纤通道网络,它在这些设备之间提供端到端的通讯,并允许多台服务器独立地访问同一个存储设备。SAN通过单独的高速光纤网络将存储设备和局域网上的服务器群连接起来,数据的存取通过存储区域网在服务器和海量存储设备间进
42、行高速传输。存储区域网络是一种可满足海量(TBPB数量级)数据存储、大量的I/O吞吐量和高端应用需求的网络式存储技术。应用计算机通过标准的网络(如以太网)连接到SAN的存储设备上。存储区域网络以光纤通道(FC:Fiber Channel)为基础,实现了存储设备的共享,突破了现有传输距离的限制和存储容量的限制;服务器通过存储网络直接与存储设备交换数据,释放了宝贵的局域网资源。SAN采用光纤通道技术彻底改变了服务器和存储设备之间的连接关系,实现以前无法实现的应用模式。SAN的出现使服务器和存储设备之间的连接方式产生了根本的变化。SAN是一种可以使服务器与大型存储设备(磁盘阵列或磁带库)之间进行任意
43、连接通信的存储网络系统,它通过一个单独专用的网络将存储设备和服务器连接在一起。由于在SAN中服务器可以和网络中的任何存储设备连接,所以数据存放在何处,服务器都可以直接存取所需要的数据。SAN中的各种设备是分散在网络中的。光纤通道技术可以支持多种网络拓扑结构,使用全双工串行通信原理传输数据,速度快且延迟小。现在,采用光纤通道(FC)技术硬盘存取速度实际上达到200MB/s。光纤通道采用同轴线时的传输距离达到30m,采用单模光纤时的传输距离可以达到10km。从具体实现的角度来说,存储区域网络(SAN)由四部分组成:终端用户、服务器群、存储系统和光纤通道,其结构如图4-4所示。用户终端通过局域网和广
44、域网与单独的服务器或服务器群连接。在某些特殊情况下也可以直接通过光纤通道网联到存储设备。在小型和大型网络应用中,服务器以单机或群的方式接入存储区域网络。光纤通道网络是特有的技术,光纤通道是由光纤集线器、光纤交换机等设备组成。存储设备通过光纤通道与服务器群连接。图4-4 存储区域网络结构存储区域网络(SAN)的特点如下:n实现大容量存储设备的共享和高速的数据传输。SAN所提供的大容量存储设备共享方式可以形成共享数据存储池,满足当前计算机所要求的海量数据存储要求。由于SAN采用光纤网,提供了主机与存储设备之间的高速连接,提升了主机系统的存储带宽;n连接方便和远距离传输。光纤通道FC技术的采用使SA
45、N的设备连接距离可以达到10km(SCSI只有25m);n实现主机与存储设备的分离。主机与存储设备的分离是当今计算机技术发展的一大趋势。由于多台服务器共享SAN上的存储设备,大大改善了向服务器分配磁盘空间的方式。存储设备与服务器的分离,使得SAN中的主机、存储设备不但在物理位置的安排上可以十分灵活,而且还可以方便地将各种设备进行逻辑上的划分,还允许用户随时添加应用所需要的存储空间;n提高数据的可靠性和安全性。在SAN中可以采用双环方式建立存储设备和计算机之间的多条通路,从而提高数据的可用性。还可以通过建立双机容错、多机集群,实现RAID检验等方式,进一步保证数据的安全性。4.3 多媒体数据库
46、4.3.1 多媒体对数据库设计的影响 在传统的数据库中引入多媒体数据和操作,是一个极大的挑战。这不只是把多媒体数据入到数据库中就可以完成的问题。传统的字符数值型的数据虽然可以对很多的信息进行管理,但由于这一类数据的抽象特性,应用范围毕竟十分有限。为了构造出符合应用需要的多媒体数据库,我们必须解决从体系结构到用户接口等一系列的问题,多媒体对数据库设计的影响主要表现在以下几个方面。n数据库的组织和存储。数据库的组织和存储。多媒体数据量巨大,且媒体之间量的差异也极大,从而影响数据库的组织和存储方法。如动态视频压缩后每秒仍达上百KB的数据量,而字符数值等数据可能仅有几个Byte。只有组织好多媒体数据库
47、中的数据,选择设计好合适的物理结构和逻辑结构,才能保证磁盘的充分利用和应用的快速存取。数据量的巨大还反映在支持信息系统的范围的扩大,应用范围的扩大,显然不能指望在一个站点上就存储上万兆的数据,而必须通过网络加以分布,这对数据库在这种环境下进行存取也是一种挑战;n媒体种类的增多增加了数据处理的困难。媒体种类的增多增加了数据处理的困难。每一种多媒体数据类型都要有自己的一组最基本的概念(操作和功能)、适当的数据结构和存取方法、以及高性能的实现。但除此之外也要有一些标准的操作,包括各种多媒体数据通用的操作及多种新类型数据的集成。虽然前面列出了几类主要的媒体类型,但事实上,在具体实现时往往根据系统定义、
48、标准转换等演变成几十种媒体格式。不同媒体类型对应不同数据处理方法,这便要求多媒体数据库管理系统能不断扩充新的媒体类型及其相应的操作方法。新增加的媒体类型对用户应该是透明的;n数据库的多解查询。数据库的多解查询。传统的数据库查询只处理精确的概念和查询。但在多媒体数据库中非精确匹配和相似性查询将占相当大的比重。因为即使是同一个对象若用不同的媒体进行表示,对计算机来说也肯定是不同的;若用同一种媒体表示,如果有误差,在计算机看来也是不同的,与之相类似地还有诸如纹理、颜色和形状等本身就不易于精确描述的概念,如果在对图像、视频迸行查询时用到它们,很显然是一种模糊的、非精确的匹配方式对其他媒体来说也是一样。
49、媒体的复合、分散、时序性质及其形象化的特点,注定要使数据库不再是只通过字符进行查询,而应是通过媒体的语义进行查询。然而,我们却很难了解并且正确处理许多媒体的语义信息。这些基于内容的语义在有些媒体中是易于确定的(如字符、数值等),但对另一些媒体却不易确定,甚至会因为应用的不同和观察者的不同而不同;n用户接口的支持。用户接口的支持。多媒体数据库的用户接口肯定不能用一个表格来描述,对于媒体的公共性质和每一种媒体的特殊性质,都要在用户的接口上、在查询的过程中加以体现。例如对媒体内容的描述、对空间的描述、以及对时间的描述。多媒体要求开发浏览、查找和表现多媒体数据库内容的新方法,使得用户可以很方便地描述他
50、的查询需求井得到相应的数据。在很多情况下,面对多媒体的数据,用户有时甚至不知道自己要查找的是什么,不知道如何描述自己的查询。所以,多媒体数据库对用户的接口要求不仅仅是接收用户的描述,而是要协助用户描述出他的想法,找到他所要的内容,并在用户接口上表现出来。多媒体数据库的查询结果将不仅仅是传统的表格,而将是丰富的多媒体信息的表现,甚至是由计算机组合出来的结果“故事”;n多媒体信息的分布对多媒体数据库体系带来了巨大多媒体信息的分布对多媒体数据库体系带来了巨大的影响。的影响。这里所说的分布,主要是指以WWW全球网络为基础的分布。Internet网的迅速发展,网络上的资源日益丰富,传统的固定模式的数据库
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。