1、2022-8-1112.1 多媒体计算机2.2 多媒体信息的存储环境光存储设备2.3 音频接口2.4 视频接口2.5 多媒体I/O设备 2.6 小结2022-8-112多媒体计算机系统 硬件系统 软件系统 各种功能卡 主机 I/O 接口 多媒体光存储器 外部设备 外存储设备 各种输入设备 各种输出设备 多媒体操作系统 多媒体应用软件 图 2.1.1 多媒体计算机系统组成 多媒体处理器 2022-8-1132.1.1 2.1.1 多媒体计算机硬件组成多媒体计算机硬件组成2.1.2 2.1.2 多媒体处理器(多媒体处理器(CPU)2.1.3 2.1.3 多媒体计算机总线技术多媒体计算机总线技术 2
2、.1.4 多媒体个人计算机(MPC)2022-8-114 硬件是构成计算机系统的各种实体的总称,是组成计算机系统的电子和机械装置,它是计算机系统的物质基础。硬件的组成部分(1)运算器(算术、逻辑运算单元)在计算机中,执行算术和逻辑的部件叫做运算器。(2)控制器(控制单元)控制器是多媒体计算机的指挥中心,负责对控制指令进行分析,然后发出操作控制信号,控制并协调多媒体计算机各部分的工作。2022-8-115(3)存储器 在多媒体计算机中,起着记忆作用的部件叫存储器。必须将操作系统、应用程序和需要处理的数据等装入内存才能被CPU调用和处理。(4)外存储器 外存储器是指硬盘、软盘、磁带、光盘、移动存储
3、器等外部存储设备。(5)各种功能卡 各种功能卡是计算机中用来处理特定多媒体的板卡。(6)输入设备 输入设备是指把数据输入计算机的设备。2022-8-116(7)输出设备 输出设备是指从计算机中输出数据的设备。(8)总线(Bus)在多媒体计算机中CPU、内存储器、外存储器、输入、输出设备等都是连接在一条称为总线的公共通道上的,总线实际上是一束导线,它是计算机各部件之间传送信息的公共通道,允许各部件共同使用它传送数据、指令、地址及控制信号等信息。2022-8-117 多媒体硬件的主要性能指标(1)时钟频率 通常用时钟周期的倒数时钟频率(MHz/s)来表示多媒体各处理部分的运行速度。(2)数据带宽
4、数据带宽是指每秒最大数据传输量。(3)分辨率 分辨率是衡量设备处理信息的精细程度的指标。2022-8-118 在原有的计算机体系结构中,增加多媒体和通信功能的设计原则是:采用国际标准的设计原则;把多媒体和通信功能的单独解决变成集中解决;体系结构设计和算法相结合;把多媒体和通信技术做到CPU芯片中。2022-8-119 几种典型的多媒体处理器 目前,在多媒体处理器领域比较领先的厂商包括MicroUnity、Philips、Chromatic research 和Nvidi 4家公司,它们的多媒体微处理器产品依次是Mediaprocessor、Trimedia、Mapact MediaEngine
5、和NVI。2022-8-1110 多媒体处理器的主要性能、技术指标(1)主频、外频、倍频 主频是CPU工作的时钟频率,也就是CPU在单位时间(1秒钟)内的时钟周期数,主频越高,CPU的运行速度越快。外频是CPU的外部频率,由于CPU是通过外部总线与其他部件进行信息传递,所以外频越高,CPU与其他部件之间的信息传递速度越快。倍频是指CPU外频与主频相差的倍数,CPU的主频等于外频乘以倍频系数,即:主频外频倍频系数 2022-8-1111(2)高速缓存L1和L2Cache的容量和频率 L1 Cache是集成在CPU芯片内,称为片内Cache或一级Cache(L1),L1的容量相对较小,一般为16k
6、B和32kB,工作频率与CPU主频相同。L2 Cache在CPU外部,称为片外Cache或二级Cache(L2)。运行频率与CPU外频相同的L2称之为“全速L2高速缓存”。2022-8-1112(3)支持的多媒体扩展指令集 扩展指令是为提高CPU处理多媒体数据的能力而设计的。用扩展指令集,一条指令可对2个以上的数据流进行处理计算。这样就成倍的提高了多媒体信息的处理能力。2022-8-1113(4)CPU内部工作电压 CPU内核工作电压指的是CPU正常工作所需的电压。CPU的制造工艺水平越高,内核工作电压就越低。(5)制造工艺水平 CPU的制造工艺主要指平常所说的0.25微米、0.18微米技术等
7、。微米值越小,表明CPU的制造工艺越先进。(6)字长 通常所说的16位机、32位机,就是指CPU可以同时处理16位、32位的二进制数据。2022-8-1114 为了简化硬件电路设计、简化系统结构,常用一组线路,配置以适当的接口电路,与各部件和外围设备连接,这组共用的连接线路被称为总线。多媒体微机中总线一般有内部总线、系统总线和外部总线。内部总线是微机内部各外围芯片与处理器之间的总线,用于芯片一级的互连;系统总线是微机中各插件板与系统板之间的总线,用于插件板一级的互连;外部总线则是微机和外部设备之间的总线,微机作为一种设备,通过该总线和其他设备进行信息与数据交换,它用于设备一级的互连。2022-
8、8-1115 目前比较流行的总线技术:ISA总线 (industrial standard architecture)PCI总线(Peripheral Component Interconnect)AGP总线(Accelerated Graphics Port)USB总线(universal serial bus)2022-8-1116 所谓多媒体个人机就是具有多媒体功能的个人计算机。从硬件设备来看,在PC机上增加声音卡和光盘驱动器,这就是人们一般所指的早期的多媒体个人计算机。对广大用户而言,就是把具有上述功能的PC机或把现有增加多媒体升级套件的PC机叫MPC。2022-8-1117 3个MP
9、C标准:MPC Level 1(MPC1)、MPC Level 2(MPC2)和MPC Level3(MPC3)1MPC规范 MPC联盟规定多媒体计算机包括5个基本的部件:个人计算机(PC)、只读光盘驱动器(CD-ROM)、声卡、Windows操作系统和一组音箱或耳机。2022-8-11182022-8-11192MPC的性能(1)图像处理能力 多媒体计算机对图像的处理包括图像获取、编辑和变换。计算机中的图形是数字化的,分为矢量图(Vector Graphics)和点阵图(Bitmap)。2022-8-1120硬件MPC-1 MPC-2MPC-3 CPU 16MHz 386SX(推荐386DX
10、或486SX)25MHz 486SX或兼容芯片(486DX推荐或X2)75MHz Pentium或兼容芯片(推荐100MHz以上奔腾)RAM(推荐4MB)2MB(推荐4MB)4MB(推荐8MB)8MB(推荐16MB)硬盘容量 30MB(推荐80MB)160MB(推荐400MB)540MB(推荐800MB)2022-8-1121CD-ROM 150KB/s最大寻址时间1s 300KB/s最大寻址时间400ms 600KB/s最大寻址时间200ms CD-ROM XA 声音卡 8bit数字声音、8个合成音MIDI 16bit数字声音、8个合成音MIDI 16bit数字声音、WaveTable(波表
11、)MIDI 显示器 640*480 16色(推荐256色)640*480 65536色(推荐65536色)60*480 65536色(推荐图形加速卡)2022-8-1122视频播放 325*240 30f/s(325*288 25f/s)15bit/pixel I/O端口 MIDI I/O,摇杆端口,串并联端口 MIDI I/O,摇杆端口,串并联端口 MIDI I/O,摇杆端口,串并联端口操作系统 DOS版本3.1以上 Windows 3.0带多媒体扩展 DOS版本3.1以上 Windows 3.1 Windows98 2022-8-1123(2)声音的处理能力 声音的数字化方法是采样。采样频
12、率越高,保真度就越高。声音的处理还分单声道和立体声道两种。(3)MIDI乐器数字接口 MIDI规定了电子乐器之间电缆的硬件接口标准和设备之间的通信协议。MIDI信息的标准文件格式包括音乐的各种主要信息,合成器可以根据MIDI文件奏出相应的音乐。2022-8-1124(4)动画处理能力 计算机动画有两种,一种叫造型动画(Cast Based Animation),另一种叫帧动画(Frame Animation)。后者由一帧帧位图组成连续的画面;前者是对每一个活动的物体分别进行设计,赋予每个物体一些特征(如形状、大小、颜色等),然后用这些物体组成完整的画面。2022-8-1125 有3种方法可以播
13、放动画 使用多媒体应用程序接口MMP DLL(Multimedia Movie Player Dynamic Link Library),这时必须自己写一个放映动画的程序;使用Windows的Media Player软件,该软件是可直接放映动画的应用软件;使用任何含MCI(Media Control Interface)接口并支持动画设备的应用软件。2022-8-1126(5)多媒体数据的存储 对多媒体的数据存储问题考虑的基本点是:存储介质的容量、速度和价格。有3类大容量存储器可以考虑。硬盘工作介质,其平均存取时间为1028ms,传送速度为40KB/s28KB/s,且越快越好。光盘介质,光盘可
14、分CD-ROM、CD-R等类型。磁带备用介质,优点是便宜、容量大;缺点是速度慢、顺序存储。2022-8-1127(6)MPC之间的信息传递。传递方法有以下几种:可移动式硬盘:包括便携式硬盘片、打印口外接硬盘、抽拉式硬盘盒;可移动光盘:CD-ROM、WORM、可擦写光盘;网络:电子邮件、局域网、远程网;串口通信。2022-8-11282.2.1 光存储的类型 2.2.2 光存储设备的技术指标 2.2.3 光存储格式标准和类型 2.2.4 光盘塔 2022-8-1129 只读型光存储系统(CD-ROW)只读型光盘包括LV和CD-ROM(Compact Disc-Read Only Memory)等
15、。用户只能从CD-ROM读取信息,而不能往盘上写信息。CD-ROM中的内容在光盘生成时就已经决定,而且不可改变。2022-8-1130 一次写型光存储系统(CD-R)一次写(Write Once Read Many,WORM)光存储系统可一次写入多媒体信息,任意多次读出,与CD-ROM相比,它具有由用户自己确定记录内容的优点。可重写型光存储系统(CD-RW)可 重 写 型 光 存 储 系 统(R e w r i t a b l e 或Erasable,E-R/W)像磁盘一样可任意读写数据。它又分磁光型(Magnetic Optical,MO)和相变形(Phase Change,PC)两种形式。
16、2022-8-1131(1)尺寸 光盘的尺寸多种多样。LV的直径为12英寸(300mm),CD激光唱盘和CD-ROM为4.72英寸(120mm),WORM一次写光盘为14.12英寸和5.25英寸,可擦写光盘向小尺寸方向发展,主要尺寸为5.25英寸和3.5英寸。2022-8-1132(2)容量 格式化容量 格式化容量是指按某种光盘标准进行格式化后的容量。采用不同的光盘标准就有不同的存储格式,容量也不同。用户容量 用户容量是指盘片格式化后允许对盘片执行读写操作的容量。由于格式、校正、检索等比特需要占用一定的容量空间,因此用户容量小于格式化容量。2022-8-1133(3)平均存取时间、平均寻道时间
17、和平均等待时间 平均存取时间是指从计算机向光盘驱动器发出命令开始,到光盘驱动器在光盘上找到需读/写的信息的位置并接受读/写命令为止的一段时间。光学头沿半径移动全程1/3长度所需的时间为平均寻道时间。盘片旋转半周的时间为平均等待时间。把平均寻道时间、平均等待时间和读/写光学头稳定时间相加,就得到平均存取时间。2022-8-1134(4)数据传输率 数据传输率一般是指单位时间内光盘驱动器送出的数据比特数。通常用光驱在1s时间内所能读取的数据量来表示,用千字节/秒(KB/s)表示。同步传输率、异步传输率和DMA传输率 数据传输率也指控制器与主机之间的传输速率。它与接口规范和控制器内的缓冲器大小有关。
18、SCSI接口的同步传输率为4MB/S,异步传输率为1.5MB/S。AT总线规定的DMA方式的传输率为1MB/S。2022-8-1135 突发传输率 为了提高数据传输率,读数据过程中先把数据存入缓冲器,再进行集中传送;如果下次读取同一内容,就不必从光盘上去读取,直接把缓冲区中的数据传送给主机就可以了,这种传输率称为突发传输率。持续传输率 当传送的数据量很大时,缓冲器就起不到提高传输率的作用了,这时的传输率称为持续传输率。2022-8-1136(5)容错能力 由于光盘是移动存储设备,并且盘片的表面没有任何保护,因此难免会出现划伤或沾染上杂物的情况,这些小毛病都会影响数据的读取。为了提高光驱的读盘能
19、力,人们提出了各种纠错技术。一些光驱为了提高容错能力,还相应地加大了激光头的功率。当光头功率增大后,读盘能力确实有了一定提高,但长时间“超频”使用会导致光头老化,严重缩短光驱的寿命。2022-8-1137(6)缓存 缓存主要用于临时存放从光盘中读取的数据,然后再发送给计算机系统进行处理。这样就可以确保计算机系统能够一直接收到稳定的数据流量。使用缓存缓冲数据可以允许驱动器提前进行读取操作,满足计算机的处理需要,缓解控制器的压力。2022-8-1138(7)系统接口 所谓系统接口就是指驱动器用来与计算机系统进行通讯的连接方式。目前可以用来连接CD-ROM和计算机的接口主要有以下几种:SCSI 接口
20、(Small Computer System Interface)即小型计算机系统接口,是一种可以在一条线缆上同时连接多台设备的特殊总线。2022-8-1139 IDE 接口 我们可以把IDE看作是SCSI的衍生技术,两者主要的区别在于IDE不需要中央控制器。IDE设备本身就包含了总线的控制电路。并行端口USB和PCMCIA USB是一种完全兼容即插即用技术的总线协议,理论上可以连接上千个外部设备。当用户接入新设备时,一旦操作系统获得该设备的信息,就不再需要用户进行任何干预。2022-8-1140 国际标准化组织(ISO)对光存储的数据格式作了详细规定。ISO标准包括数据格式、编码方法、物理尺
21、寸以及CD技术等方面的说明。记载各种光盘数据格式的规范文本的封面用不同颜色加以区别,人们也就习惯了把光盘的标准以其文本的封面颜色来划分。2022-8-1141光盘标准 光盘类型 标准的基本内容 红皮书Red Book CD-CD-DADACD-G CD标准的第一个文本,是一种用于CD音乐的规范。采样频率为44.1kHz,每个样本为16bit。还定义了CD的尺寸、物理特性、编码和错误校正方法等。遵循该标准的光盘能在任意激光唱机中播放。黄皮书Yellow Book CD-ROM 即ISO9660标准,规定了CD-ROM的基本数据格式,是红皮书标准的扩充。又可细分为MODE1和MODE2两组标准。M
22、ODE1包括ISO9660和HFS,MODE2为CD-ROM XA(扩展结构)。CD-ROMXA提供了声音压缩和声音质量水平的选择。2022-8-1142绿皮书Green BookCD-I用于家庭娱乐的交互式CD的专用格式。它把高质量的声音、文字、动画、图形及静止的图像都以数字形式存放于CD-ROM盘上,并实现了交互式操作。1992年推出第二代CD-I,可播放交互式视频图像。橙皮书(Orange Book Photo CD 在黄皮书的基础上增加了可写入CD的格式标准,包括可写光盘、盒式光磁系统和柯达光电CD(Photo CD)的标准。橙皮书允许多段写入并在第二部分中描述了刻录CD-R盘的条件。
23、2022-8-1143蓝皮书Blue BookCD-WORMCD-WORM可一次写入,多次读出,弥补了光盘不能写入用户信息的缺陷。白皮书White BookCD-V 采用了CD-ROM XA格式,主要应用于全动态MPEG音、视频信息的存储。目前,VCD(VCD1.1、VCD1.2)节目均采用这种格式。CD-ROM XA规范 CD-ROM XA 1998年制定,允许数据和音频信号交替地在盘上放置。这种格式便于开发人员制作丰富多彩的多媒体节目。1991年又制定了 CD-ROM XA II规范它对应于ISO 9660 II。2022-8-1144 CD-ROM光存储系统 1CD-ROM盘片的物理层次
24、 CD-ROM有标准的物理规格,它由直径为120mm,厚度为1.2mm的聚碳酸酯盘组成,中心有一个15mm的主轴孔。聚碳酸酯的表面覆盖着反射铝合金或金以增加记录面的反射性。反射面由防止氧化的漆膜层保护。2022-8-1145 CD-ROM的物理层次 聚碳酸酯衬底含有凸区和凹坑区。每个凹坑区都深100nm,宽500nm。两个相邻凹坑区之间的地方称为凸区。凸区表示二进制的零,从凸区到凹坑区和从凹坑区到凸区的过渡由二进制的1表示。2022-8-11462.CD-ROM驱动器的构造,内部主要部件包括如下6个部分:(1)激光头:激光头(Optical Pickup)是CD-ROM驱动器的关键部件。它的功
25、能是把存储在CD-ROM盘上的信息转换成点信号。(2)聚焦伺服:为使激光束的聚焦点落在光盘的信息面上,CD-ROM驱动器采用自动聚焦伺服系统来实现。自动聚焦伺服系统通过产生聚焦误差信号,调整光头和光盘之间的距离,以保证聚焦点落在光盘的信息面上。2022-8-1147(3)道跟踪伺服:为了确保聚焦光束能沿着道间距为16um、凹坑宽为0.5um左右的螺旋形光道正确读出信息,CD-ROM采用径向光道跟踪技术,以克服光盘可能多达30um的偏心,使道跟踪精确度达到0.1um。(4)CLV伺服:由于CD-ROM盘要以恒定线速度(CLV)旋转,这就意味着驱动光盘旋转的驱动马达的速度要随光头所处的位置而变化。
26、在CD-ROM标准中,线速度为1.2m/s,为保持这个恒定的速度,光头从导入区移到导出区,光盘驱动马达的速度从500r/min降到200r/min。2022-8-1148(5)EFM解调:从聚焦伺服系统输出的数据信号是经过EFM调制后的信号,EFM解调过程是EFM调制过程的逆过程。这个过程要从通道位中检测出同步位、去掉合并位、把14位通道位变成8位数据,最后还原成原始的帧格式。(6)错误检测和校正处理:CD-ROM采用二级错误校正;一级是CIRC,另一级是ECC。对那些由CIRC检测出来但不能纠正的错误,将由内插和噪声抑制功能部件处理,这对于以CD-ROM扇区方式2记录的像声音、图像一类的数据
27、做内插处理就可以了。但对于像程序一类的数字数据就还要做ECC校正。2022-8-11493CD-ROM驱动器的工作原理 CD-ROM其实是从CD演变而来的,CD是将模拟数据通过光刻机,在光盘上刻出一个个小坑,这些坑很小,用肉眼是看不到的,然后,在另一面涂上反光材料,就制成了CD(数据CD或音乐CD),而音乐CD和数据CD区别就是,音乐CD要把数字信号转变成模拟信号输出,而电脑用的数据CD仍是输出数字信号。从CD-ROM光头射出来的激光照到盘片平的地方和小坑的地方反射率不同,这时在激光头旁边的光敏元件,感应到强弱不同的反射光,就产生高低电平,输出到光驱的数字电路,而高低电平在计算机中分别用0,1
28、表示,这就是CD-ROM把数据光盘转换成数据输出的原理和过程。2022-8-11504.CD-ROM驱动器的安装(1)硬件连接:将接双硬盘的40芯信号电缆分别连至IDE接口(注意接口两端的方向要一致),并将40芯音频信号线的两端分别插入光驱和声卡上的音频信号插座中,光驱后面的跳线设置放在“Slave”处,把光驱设置为从盘,最后连接光驱电源。2022-8-1151(2)DOS环境下驱动程序安装 步骤1:将光驱附带的安装盘插入软驱中;步骤2:在提示符下运行安装程序,键入INSTALL,按回车键;步骤3:根据屏幕的提示完成软件的安装;步骤4:重新启动计算机,更新系统设置,以便系统识别光驱。(3)WI
29、NDOWS环境下驱动程序的安装 应先在DOS中安装好光驱,然后从光盘安装Windows 98,安装成功后,Windows 98中的光驱驱动程序将替代DOS的驱动程序,光盘符自动保留;不过现在光驱全是自启动的将光驱硬件连接好后,系统可以自动识别出光驱,并自动安装光驱的驱动程序。2022-8-1152 CD-R光存储系统 1CD-R盘片的物理层次 CD-R光盘与普通CD光盘有相同的外观尺寸。CD-R光盘上除了含有合成塑胶层与保护漆层外,将反射用的铝层改为24K黄金层(也可能是纯银材料),另外再加上有机染料层和预置的轨道凹槽。2022-8-11532CD-R的刻录和读取原理 CD-R刻录是将刻录光驱
30、的写激光聚焦后,通过CD-R空白盘的聚碳酸酯(polycarbonate)层照射到有机燃料(通常是箐蓝或酞箐蓝燃料)的表面上,激光照射使产生的热量将有机染料烧熔,并使其变成光痕(mark)。当CD-ROM驱动器读取CD-R盘上的信息时,激光将通过聚碳酸酯和有机染料层照射镀金层的表面,并反射到CD-ROM的光电二极管检测器上。光痕会改变激光的反射率,CD-ROM驱动器根据反射回来的光线的强弱来分辨数据0和1。2022-8-1154 磁光(MO)存储系统 1.磁光盘的物理层次 磁光盘片用树脂做基盘,其上集积了保护层(氮化硅)、记录层(铽、铁钴合金)和反射层(铝合金)而构成。数据记录在记录层上。形成
31、记录的磁粒子(小磁铁)相对于记录而形成垂直排列(垂直磁记录方式)。由于磁粒子非常细长,垂直排列可以获得较高的记录密度。2022-8-11552.磁光存储系统读写原理 当数据要写入磁光盘时,利用凸透镜进行聚焦,将高功率激光以极小的光点照射在磁光盘记录层上,当其表面温度上升到约300C的距离点时,用外部磁场的作用而改变其远磁化方向。然后终止激光光束让记录冷却,形成不受外磁场影响的牢固记录层。当要进行数据重写时,需经过“擦”和“写”两步,先利用中功率激光照射介质段区中的所有数据,使段区中的数据点都沿着和介质表面垂直的方向均匀磁化,即通过写入“0”来抹去原有数据,然后再根据要求用高功率激光在“0”位置
32、写入数据“1”,这样就完成了数据的重写。数据的读取是利用低功率激光探测盘片表面,通过分析反射回来的偏振光的偏振面方向是顺时针或是逆时针,来决定读取的数据是“1”还是“0”。2022-8-1156 相变(PD)光存储系统 1.物理层次 在基盘上沉积电介质层、相变记录层、冷却层和保护层等形成多层结构。PD光存储系统读、写和擦除原理 利用物质的状态变化即所谓的相变进行数据的读、写和擦除。相变记录层由一种银合金材料组成,视其加热温度的不同,它可以形成晶体,也可以形成非晶体。适当调整加热温度可以自由地控制记录层的结晶状态。在晶体状态中原子整齐排列,光反射率高;相反,在非晶体状态原子排列不整齐,光的反射率
33、低。2022-8-1157 DVD光存储设备 1.DVD盘片的物理结构 按单/双面与单/双层结构的各种组合,DVD可以分为单面单层、单面双层、双面单层和双面双层4种物理结构。2DVD光盘驱动器的种类 (1)DVD-ROM (2)DVD-R与DVD-RW (3)DVD-RAM (4)DVD-Audio (5)DVD-Video 2022-8-1158 光盘塔系统的组织是大容量存储的重要一步,多媒体信息量非常大,需要研究海量信息存储技术,光盘塔系统就是其中的一个解决方案。光盘塔系统包含一个或多个光驱动器,由精确伺服控制的机电机械手自动升降器机构来在盘片堆栈上的槽和驱动器之间来回移动光盘。在盘播放完
34、毕后(通常是驱动器请求另一张盘片时)机械手机构从驱动器上将盘卸下并放回堆栈上它的槽内。在程序控制下,机械手设备可操作和管理多个驱动器。2022-8-1159 光盘塔系统也许含有各种不同类的驱动器,包括CD-ROM、WORM、可重写式或多功能驱动器。光盘塔系统可含有一个或多个驱动器(通常最多为四个)。驱动器在SCSI总线上与它们自己的SCSIID菊花式链接。机械手设备也作为一种SCSI设备并有它自己的SCSIID,这样就可用程序来控制设备。光盘塔系统的大小可从较小尺寸的小型桌面型变化到较大的尺寸的全19英寸立柜型(至少需要两个立柜)。随着盘密度的增大,光盘塔系统的尺寸已逐步趋向5.25英寸。光盘
35、塔堆栈可能存放50200张光盘。由于单张盘的存储容量已高达10GB(取决于盘尺寸),光盘塔系统可存储几个TB的数据。2022-8-11602.3.1 音频卡的工作原理 2.3.2 2.3.2 音频卡芯片的分类音频卡芯片的分类2.3.3 2.3.3 音乐合成和音乐合成和MIDI2.3.4 2.3.4 声卡的性能指标与选购声卡的性能指标与选购2.3.5 语音合成 2.3.6 2.3.6 语音识别语音识别2022-8-1161 处理音频信号的PCI插卡是音频卡(Audio Card),又称声卡,声音卡处理的音频煤体有数字化声音(Wave)、合成音乐(MIDI)、CD音频。1音频卡的功能和分类 功能:
36、(1)录制、编辑和回放数字声音文件 (2)编辑和合成 (3)MIDI接口和音乐合成 (4)文-语转换和语音识别 (5)游戏接口 (6)具备CD-ROM驱动器接口 (7)支持全双工功能 2022-8-11622音频卡的体系结构 音频卡组成:MIDI输入/输出电路,MIDI合成器芯片用来把CD音频输入与线性输入相混合电路 带有脉冲编码调制电路的模数转换器用于把模拟信号转换为数字信号以生成波形文件 压缩芯片用来压缩和解压音频文件 语音合成器用来合成语音输出 语音识别电路用来识别语音输入 音频输出或线输出的输出电路输出立体声2022-8-1163PCI声卡 2022-8-1164 数字化声音处理、合成
37、器和混音器的工作原理(1)数字化声音处理 声音卡用数字信号处理器DSP芯片管理所有声音输入、输出和MIDI操作 声音卡的数字化声音接口有两种传输方式:直接传输方式,即声音数据由应用程序直接通过DSP输入输出,数据是8位或16位脉冲编码调制PCM数据 DMA传送方式,采用DMA方式把声音数据输出到DSP或从DSP中输入声音数据,除8位或16位PCM数据外,声音输入、输出时也支持压缩数据格ADPCM。模拟声音 前置放大器 程序可控制的放大器 抗混滤波器 模拟/数字化(A/D)和采样保持(S/H)电路 DSP处理器 计算机磁盘 2022-8-1165(2)混音器 音频卡上的混音器(Mixer)芯片可
38、以对以下音频源进行混合:数字化声音(DAC);调频FM合成音乐(FM);CD-Audio音频(CD-ROM);线路输入(AUX);话筒输入(MIC);PC扬声输出(SPK);混音器还提供以下I/O功能 可选择声音I/O模式,即单声道或立体声模式;从话筒、CD或线路输入中选择输入源;可选I/O滤波器,即低、高通滤波器或关闭滤波器功能,用滤波器对声音做过滤处理。2022-8-1166(3)合成器 标准的多媒体PC机平台通过内部合成器(Synthesizer)或通过外接到计算机MIDI端口的外部合成器播放MIDI文件。MIDI合成器的类型目前有两种:频率调制FM合成(中级仅要求掌握该种合成器原理);
39、波形表(Wave Table)合成。2022-8-1167 音频卡数字信号编解码器(CODEC)芯片一般分为 8位声道、8位立体声、通常的16位立体声 多通道16位立体声,将来还会有多通道24位立体声(DVD音频标准)。位数越高、采样频率越高,精度就越好。图2.3.2声卡芯片2022-8-1168 音效芯片的技术指标包括:声道数,即单声道、双声道和多声道等;采用的总线方式,包括ISA、PCI总线等;MIDI合成方式;3D音效。2022-8-11691音乐合成与MIDI MIDI(Musical Instrument Digital Interface)是指乐器数字接口,是数字音乐的国际标准。电
40、子乐器是靠电子电路产生波动的电流,送到扬声器发生。声音的发源地就是合成器。目前声卡的音乐合成主要有两种方法:一种是常用的调频(FM)合成法,另一种就是波表(Wave Table)合成法。2022-8-1170 衡量声卡的音乐合成器的性能好坏的参数主要有以下几种:音色数目:音色越多,音乐的表现力就越强。发音数:发音数决定了声卡同时最多能发出多少个音符,发音数越多播放交响乐的能力越强。音乐的兼容性:是指音色在排列顺序上的兼容性。2022-8-11712.MIDI术语 术 语 解 释 MIDI文件 记录MIDI信息的标准文件格式。MIDI文件中包含音符、定时和多达16个通道的乐器定义。文件中含有每个
41、音符的信息,包括键、通道号、持续时间、音量和力度(击键时键达到它最低位置的快慢程度)通道Channels MIDI规范可为16个通道提供数据,每个通道都对应于一个逻辑合成器,Microsoft用通道110作为扩充合成器,通道1316作为基本合成器 音序器Sequencer 是为MIDI 作曲而设计的计算机程序或电子设备,可用来记录、播放和编辑MIDI文件。多数音序器可输入、输出MIDI文件2022-8-1172合成器Synthesizer 是一种使用数字信号处理器(DSP)或其他生成音乐和声音的芯片的电子设备。DSP可生成并修改波形,然后通过一个声音生成器和扬声器输出。合成器发生的质量和声音范
42、围取决于下列因素:合成器芯片可同时演奏独立波形(乐器)的个数;合成器电路中的存储空间 乐器Instrument 合成器可产生的一种特定的声音。不同的合成器,乐器的音色号和声音质量也不同。例如,多数合成器可演奏钢琴的声音。但与实际钢琴声音是有差异的,况且,不同的合成器使用的音色号也不同 通道映像Channel Mapping 通道映像将MIDI通道号从发送设备转变成接收设备相应的通道。例如,编排在15号设备上的鼓可映射到鼓机的6号通道上,鼓机只用6号接收消息 2022-8-1173复音Polphony 复音是指一个合成器每次可支持的最多音符个数。例如,具有6音符复音的4种乐器合成器,可同时演奏分
43、布于4个不同声音的6个音符,这4种不同的声音可能产生4个钢琴和弦音符,一个长笛和一个小提琴音符。音色Tinbre 音色就是音质,是由形成该音质频率的组合决定的。在非正式的用法中,它是指与某特定的乐器相关联的特有的声音。低音提琴,钢琴或小提琴的声音均有其各自的音色。音轨Track 一种把MIDI数据分成单独组与并行组的文件概念,通常用通道来分离,0号格式MIDI文件将这些音轨混合成一个音轨。1号格式的MIDI文件保留不同的音轨。合成音色映射程序Patch Mapper 是一种软件,它将与某合成器相关连的乐器合成音色重新分配给相应的标准合成音色号。这里,标准音色号是在Microsoft标准MIDI
44、分配表中指定的。多媒体Windows的Patch Mapper软件可将乐器合成音色映射到任意MIDI设备上。2022-8-11743.MIDI接口 MIDI标准中规定MPC包括一个内部合成器和标准MIDI端口。MIDI装置应有一个或多个下列端口:MIDI In,MIDI Out和MIDI Thru。MIDI In(输入口):接收从其他MIDI装置传来的消息。MIDI Out(输出口):发送某装置生成的原始MIDI消息。向其他设备发送MIDI消息。MIDI Thru(转发口):传送从输入口接收的消息到其他MIDI装置。向其他设备发送MIDI消息。2022-8-11754.MIDI技术规范 MID
45、I规定合成器、音序器、微机和鼓乐等能通过一个标准的接口连接。每个符合MIDI规定的乐器通常包含一个接受器或一个发送器,或皆有之。接受器接收MIDI格式的消息,并执行MIDI命令。它由光耦合器、通用异步接收发送器(UART)及其他必须的硬件组成。发送器以MIDI格式生成MIDI消息,并按照UART和总线驱动器格式传送MIDI消息。2022-8-11761.先进的接口方式 采用PCI接口的声卡产品,其最大数据传输率为133MB/s,借助PCI接口,声卡可以实现更多的技术特性,它可以将波表样本存放在系统硬盘中,借助PCI的较高带宽实现即用即取,这就使得波表声卡的成本大大减低。在即插即用方面,不会受到
46、诸如中断分配等问题的困扰。2022-8-11772.优秀的音色和较高的信噪比 PCI声卡一般拥有较高的信噪比(大多数可以轻易达到90dB)。较高的信噪比保证了声音输出时的音色更纯,可以将杂音减少到最低限度。而音色的好坏则取决于产品所选用的音效芯片和卡的加工工艺(良好的布线和接口材料可以有效避免外界信号的干扰)。如果可能的话,购买声卡前最好先进行试听,耳朵对音色的判断永远是最准确的。2022-8-11783.MIDI合成效果 PCI声卡的优势之一是可使用先进的DLS(Down Loaded Sound)技术,将波表音色储存于硬盘中,通过声卡芯片处理,在播放MIDI时调入内存。这样不但提供了良好的
47、MIDI合成效果又可免去ISA波表声卡上必须配备的音色库内存,减少了制作成本。除了大容量的波表,好的MIDI合成效果还取决于声卡上波表合成芯片支持的最大复音数。2022-8-1179 4.3D音效的支持 在ISA时代就有不少标榜“3D音效”的声卡,但由于ISA接口声卡的带宽较小,其处理和回放三维音效的能力十分有限。目前PCI声卡产品的3D音效支持分为两大派,A3D(Aureal Semiconductor开发的一种突破性的互动3D定位音效技术)和EAX(Environmental Audio Extensions环境音效扩展集,主要职责是为游戏加入3D混响效果)。A3D技术声称只要两个音箱即可
48、营造出不凡的三维效果(4音箱当然更好),而EAX则必须有4音箱方能有良好的表现。除此之外,还有使用CRL公司的Sensaura技术处理三维音效,但效果不是十分理想。2022-8-11805.其他注意事项 虽然PCI声卡性能表现非常不错,但同时也存在不少问题,如用户使用MVP3和ALI5芯片组主板,有些声卡可能和主板不兼容。另外主板集成的声音芯片,很多属于低档产品,对音质有较高要求的用户建议不要购买这类主板,以免今后更换声卡造成资源的浪费。对于中高档的声卡,绝不要选配廉价音箱,否则音质卡再好也无法表现出来。2022-8-1181 一般来讲,实现计算机语音输出有两种方法:一是录音/重放,二是文-语
49、转换。第二种方法是基于声音合成技术的一种声音产生技术。它可用于语音合成和音乐合成。计算机话语输出按实现的功能可以分为两个档次。(1)有限词汇的计算机语音输出 它可以采用录音/重放技术,或针对有限词汇采用某种合成技术,对语言理解没有要求。可用于语音报时、汽车报站等。(2)基于语音合成技术的文字-语音转换(TTS)进行由书面语言到语音的转换,它并不只是由正文到语音信号的简单映射,它还包括了对书面语言的理解,以及对语音的韵律处理。2022-8-11821.合成方法 从合成采用的技术讲可分为;(1)发声器官参数语音合成;(2)声道模型参数语音合成;(3)波形编辑语音合成技术;从合成策略上讲可分为频谱逼
50、近和波形逼近。2022-8-11832.语音基元数据库的构建 任何一个计算机言语输出系统都有语音数据库,用于存储语音基元。构建语音基元数据库重点要考虑两个问题:基元的选择和语音数据的存储形式(1)基元的选择 基元的选择有多种方案,目前常用的有次音素、音素、音节、词汇、双音素、三音素等。基元选得大,容易获得较好的音质;基元选得小,数据量小,拼接灵活,但韵律修饰复杂。2022-8-1184(2)语音数据的存储形式 语音数据的存储形式可分为两大类:波形存储和参数存储,这取决于合成算法。为减少数据量,一般要对语音数据进行压缩。波形存储方式存储;参数存储方式存储。3.韵律模拟(1)自然语言中的韵律特征;