1、1第九章第九章 输入输出设备输入输出设备29.1 I/O9.1 I/O设备概述设备概述 主机(主板及内存)以外的设备,也称外部设备。辅主机(主板及内存)以外的设备,也称外部设备。辅助存储器也属于外设。助存储器也属于外设。 外设向多样化、智能化、功能复合化、高可靠性的方外设向多样化、智能化、功能复合化、高可靠性的方向发展,人类将最终通过向发展,人类将最终通过 能听会说能听会说,“ 能读会能读会写写”的外部设备,使智能计算机成为现实。的外部设备,使智能计算机成为现实。 输入设备输入设备 主要完成输入程序、数据、操作命令、主要完成输入程序、数据、操作命令、各种图形、图像、声音等信息。各种图形、图像、
2、声音等信息。 输出设备输出设备 输出计算机的处理结果或操作提示。可输出计算机的处理结果或操作提示。可以是数据、文字、表格、图形、图像或语言。以是数据、文字、表格、图形、图像或语言。 随着电子器件集成度的提高和价格的下降,主机价格不断下随着电子器件集成度的提高和价格的下降,主机价格不断下降,使得输入输出设备的成本相对提高,约占整个计算机的降,使得输入输出设备的成本相对提高,约占整个计算机的70%70%以上。以上。3计算机计算机i/oi/o系统结构演示系统结构演示4输入设备输入设备字符输入设备:键盘字符输入设备:键盘图形输入设备:鼠标、光笔图形输入设备:鼠标、光笔图象:扫描仪、传真机、摄象机图象:
3、扫描仪、传真机、摄象机模拟设备:语音输入、模拟设备:语音输入、AD转换转换外设外设输出设备输出设备打印机打印机击打式击打式非击打式非击打式活字式活字式点阵式点阵式激光激光喷墨喷墨绘图仪绘图仪语音输出语音输出显示器显示器CRT液晶、等离子体显示器液晶、等离子体显示器多媒体多媒体终端设备终端设备外存储器外存储器通信设备通信设备磁盘磁盘磁带磁带光盘光盘59.2 9.2 常用的输入设备常用的输入设备 鼠标器、跟踪球和操作杆输入鼠标器、跟踪球和操作杆输入 键盘键盘 触摸屏触摸屏 图像输入设备(摄像机和数字照相机)图像输入设备(摄像机和数字照相机) 扫描仪扫描仪 条形码及其技术条形码及其技术 光学字符识别
4、技术和语音文字输入系统光学字符识别技术和语音文字输入系统l光笔、图形板和画笔(或游动标)输入光笔、图形板和画笔(或游动标)输入69.2.1 9.2.1 键盘键盘 按结构原理划分:按键分有触点和无触点类型按结构原理划分:按键分有触点和无触点类型 触点式触点式 利用机械触点的分离与闭合判断电路的通断,由利用机械触点的分离与闭合判断电路的通断,由于磨损、氧化等易产生接触不良等故障于磨损、氧化等易产生接触不良等故障 无触点式,通过按键上下运动使电容的电量发生变化,无触点式,通过按键上下运动使电容的电量发生变化,达到检测开关的通断,不存在磨损和接触不良等问题,且密达到检测开关的通断,不存在磨损和接触不良
5、等问题,且密封组装有防尘特性封组装有防尘特性 按与主机通信信息划分按与主机通信信息划分: : 编码键盘和非编码键盘编码键盘和非编码键盘 编码键盘就是当某个键被按下后,能够提供一个与之相编码键盘就是当某个键被按下后,能够提供一个与之相对应的的编码信息,功能全部由硬件完成。对应的的编码信息,功能全部由硬件完成。 非编码键盘是用较为简单的硬件和专用的程序来识别被非编码键盘是用较为简单的硬件和专用的程序来识别被按键的位置,提供一个与位置相对应的中间代码(扫描码),按键的位置,提供一个与位置相对应的中间代码(扫描码),然后又专用软件将其转换成规定的编码。即功能由软件完成。然后又专用软件将其转换成规定的编
6、码。即功能由软件完成。7微机键盘组成原理微机键盘组成原理 计算机键盘常采用电容式无触点键盘,计算机键盘常采用电容式无触点键盘,由由8311083110个键组成,排列成个键组成,排列成1616行行* *8 8列列的长方矩阵,内部由单片机控制。的长方矩阵,内部由单片机控制。 PCPC机键盘用单片机机键盘用单片机80488048负责键盘控制负责键盘控制 键盘自检、键盘扫描、键盘与主机通信键盘自检、键盘扫描、键盘与主机通信 键盘缓冲区配合工作键盘缓冲区配合工作l采用采用PS/2PS/2接口方式,引脚定义为接口方式,引脚定义为+5V+5V、信、信号线、时钟线、地线等号线、时钟线、地线等6 6针小圆口结构
7、。针小圆口结构。81 1、键盘扫描原理、键盘扫描原理单片微型计算机单片微型计算机D0D1D2D3D4 D5 D6 D7列列 0 1 2 40123主机主机键盘常用扫描方法:行扫描法键盘常用扫描方法:行扫描法行扫描法过程:第行扫描法过程:第1步先进行全行扫描,步先进行全行扫描,即即4位行线都输出位行线都输出“0”。通过。通过4位列线输位列线输入,进行检查。入,进行检查。若没有按键按下,若没有按键按下,则输入全为则输入全为“1”。若有键被按下,若有键被按下,相应相应列数入为列数入为“0”。第第2步在进行逐行扫步在进行逐行扫描来获得扫描位置码。描来获得扫描位置码。+5V+5V92 2、按键抖动扫描、
8、按键抖动扫描+5V+5VQK硬件硬件软件软件启动扫描程序启动扫描程序键盘全行扫描键盘全行扫描有闭合键?有闭合键?延时并重扫描延时并重扫描有闭合键?有闭合键?键盘逐行扫描键盘逐行扫描输出按键扫描代码输出按键扫描代码扫描结束扫描结束NNYY103 3、IBM-PCIBM-PC机的键盘操作过程机的键盘操作过程 1 1)初始化:由复位信号禁止键盘工作,并清除移位)初始化:由复位信号禁止键盘工作,并清除移位寄存器和中断请求触发器,准备接收寄存器和中断请求触发器,准备接收80488048送来的扫送来的扫描码。描码。 2 2)键盘扫描:由)键盘扫描:由80488048执行行列扫描程序,得到扫执行行列扫描程序
9、,得到扫描码后以串行方式送接口中的移位寄存器。描码后以串行方式送接口中的移位寄存器。80488048中中有一个有一个2020字节的缓冲区,能存字节的缓冲区,能存2020个扫描码,快速按个扫描码,快速按键时,若干个按键的扫描码可置入缓冲区暂存,按先键时,若干个按键的扫描码可置入缓冲区暂存,按先进先出的原则从缓冲区取出扫描码送往接口。进先出的原则从缓冲区取出扫描码送往接口。 3 3)传送扫描码:扫描码由一位标志位和)传送扫描码:扫描码由一位标志位和8 8位数码位位数码位组成。组成。8 8位数码在移位寄存器中组成位数码在移位寄存器中组成8 8位并行扫描码,位并行扫描码,一位标志位置一位标志位置1 1
10、中断请求触发器,向中断请求触发器,向CPUCPU发出中断请发出中断请求求IRQ1IRQ111 4 4)中断处理过程:)中断处理过程:CPUCPU响应键盘中断后,执行由响应键盘中断后,执行由BIOSBIOS提供的键盘中断处理程序,首先从接口并行提供的键盘中断处理程序,首先从接口并行接收扫描码,并将键盘复位,解除对接收扫描码,并将键盘复位,解除对80488048的封锁,的封锁,键盘可向接口传送下一个扫描码。在中断处理程序键盘可向接口传送下一个扫描码。在中断处理程序中经查表将扫描码转换成相应的中经查表将扫描码转换成相应的ASCIIASCII码,并在屏码,并在屏幕上显示出来后返回主程序。幕上显示出来后
11、返回主程序。 其中,其中,ASCIIASCII码码(American Standard (American Standard Code For Information Interchange,Code For Information Interchange,美国国美国国家信息交换标准字符码家信息交换标准字符码) ),每字符用一个字节表示,每字符用一个字节表示, ,共有共有128128个字符个字符( (最高位为最高位为0)0)。其中。其中 9595个字符供显个字符供显示、打印使用,余下示、打印使用,余下3333个个 为控制字符。如表为控制字符。如表9.29.2所所示示: (: (见第见第2962
12、96页页) )扩展扩展ASCIIASCII码可表示码可表示256256个编码个编码(EBCDIC(EBCDIC码码), ),目目前微机上就采用。前微机上就采用。129.2.2 9.2.2 鼠标器鼠标器 鼠标器是控制计算机显示器上光标移动的输入设鼠标器是控制计算机显示器上光标移动的输入设 备。一般有备。一般有2 2个键,个键,PS/2PS/2接口和接口和USBUSB接口方式。接口方式。 特点:快速、精确地光标定位,优良的人机交互。特点:快速、精确地光标定位,优良的人机交互。 分类分类 机电式机电式 一个外涂橡胶的钢球,两对发光、光电管和栅一个外涂橡胶的钢球,两对发光、光电管和栅轮组成,进行代表轮
13、组成,进行代表X X、Y Y方向的定位和测距方向的定位和测距光电式光电式 没有机械滚动部分,代之以两对互为直角的光没有机械滚动部分,代之以两对互为直角的光电探测器,分别代表电探测器,分别代表X X、Y Y方向进行定位。方向进行定位。与计算机通信方式与计算机通信方式 有线和无线有线和无线( (红外和无线电红外和无线电) ) 指标指标 : 分辨率、轨迹速度等分辨率、轨迹速度等 在操作系统中安装鼠标器的驱动程序,就可在系统中配在操作系统中安装鼠标器的驱动程序,就可在系统中配置使用鼠标器。置使用鼠标器。IBM-PCIBM-PC机,通过软中断机,通过软中断INT33HINT33H调用鼠调用鼠标器驱动程序
14、,可进行的操作有鼠标器初始化、开始显示标器驱动程序,可进行的操作有鼠标器初始化、开始显示光标、停止显示光标、读光标位置与按钮状态、设置光标光标、停止显示光标、读光标位置与按钮状态、设置光标位置、读鼠标位移量等。位置、读鼠标位移量等。139.2.3 9.2.3 扫描仪扫描仪 扫描仪是把图形图像和字符变为二进制图像扫描仪是把图形图像和字符变为二进制图像数据的计算机输入设备。数据的计算机输入设备。 分类分类 台式、手持台式、手持 黑白和彩色黑白和彩色 指标指标 分辨率、扫描幅面、扫描速度分辨率、扫描幅面、扫描速度 原理与接口原理与接口 配有专用软件的扫描仪可以配有专用软件的扫描仪可以把图形、图像和文
15、字、字符变为二进制图像把图形、图像和文字、字符变为二进制图像数据存入计算机存储器,另一方面通过显示数据存入计算机存储器,另一方面通过显示器将输入的图形、图像显示出来。其接口有器将输入的图形、图像显示出来。其接口有并行口和并行口和SCSISCSI接口两种形式。接口两种形式。14 9.2.4 9.2.4 数字相机数字相机 当想把一幅美丽的风景变成计算机能够处理当想把一幅美丽的风景变成计算机能够处理的图像,传统的处理过程是:通过使用胶片相的图像,传统的处理过程是:通过使用胶片相机把风景拍摄下来,冲成照片,再通过扫描仪机把风景拍摄下来,冲成照片,再通过扫描仪把照片扫描成计算机能够处理的图像。现在,把照
16、片扫描成计算机能够处理的图像。现在,有了数字相机,这一系列工序变得简单多了,有了数字相机,这一系列工序变得简单多了,当数字相机把某个风景拍摄下来时,它已经是当数字相机把某个风景拍摄下来时,它已经是计算机能够处理的图像了。计算机能够处理的图像了。 数字相机与扫描仪类似数字相机与扫描仪类似, ,采用数千个微小的采用数千个微小的光传感器将反射光转换为电脉冲。不过光传感器将反射光转换为电脉冲。不过, ,数字数字相机面临的困难要大一些,因为要在很短的时相机面临的困难要大一些,因为要在很短的时间里获取全部信息间里获取全部信息, ,而扫描仪可以花几十秒甚而扫描仪可以花几十秒甚至几分钟的时间扫完一页。至几分钟
17、的时间扫完一页。 15 数字拍摄时,数字相机的镜头和普通胶片相机一数字拍摄时,数字相机的镜头和普通胶片相机一样打开,但在相机后面接受反射光的不是基于卤化银样打开,但在相机后面接受反射光的不是基于卤化银的胶卷,而是一个布满成千上万个光敏晶体管的微型的胶卷,而是一个布满成千上万个光敏晶体管的微型芯片芯片, ,这些晶体管就是著名的电荷耦合设备这些晶体管就是著名的电荷耦合设备CCDCCD,将,将光转换成电脉冲,光线越强光转换成电脉冲,光线越强, ,电荷量越大。电荷量越大。CCDCCD可以可以把亮度分级,但并不认识颜色。和所有的数字设备一把亮度分级,但并不认识颜色。和所有的数字设备一样,这些产品通过把三
18、个基本色混合到一个像素来产样,这些产品通过把三个基本色混合到一个像素来产生自然的彩色。为了做到这一点数字相机必须分三生自然的彩色。为了做到这一点数字相机必须分三次来完成一幅彩色相片。次来完成一幅彩色相片。 数字相机用三个彩色滤色镜来为数字相机用三个彩色滤色镜来为CCDCCD提供合适提供合适的光线的光线: :红色、绿色、蓝色。对每一种颜色红色、绿色、蓝色。对每一种颜色, ,数字相机数字相机存储存储8 8位颜色信息(即位颜色信息(即256256种颜色),这样每个像素种颜色),这样每个像素经过三次拍摄经过三次拍摄, ,最后可以达到最后可以达到2424位的颜色信息(即位的颜色信息(即16701670万
19、种颜色),这个数值远远超过了人眼能够分万种颜色),这个数值远远超过了人眼能够分辨的颜色数量。辨的颜色数量。 16 CCD CCD的精度决定了最高分辨率,这是选购数字的精度决定了最高分辨率,这是选购数字相机时就考虑的一个重要参数,当然镜头的质量和图相机时就考虑的一个重要参数,当然镜头的质量和图像处理技术也是一个重要的性能指标。像处理技术也是一个重要的性能指标。 一旦按下快门,镜头和一旦按下快门,镜头和CCDCCD完成了相应的感光完成了相应的感光工作工作, ,最后的彩色图像便以压缩图像的格式存放在数最后的彩色图像便以压缩图像的格式存放在数字相机的存储器里。一个专门的压缩芯片(通常采用字相机的存储器
20、里。一个专门的压缩芯片(通常采用标准的标准的JPEGJPEG压缩方法压缩方法) )使原始位图图像压缩到只有使原始位图图像压缩到只有原来大小的几十分之一甚至更小,然后数据存入数字原来大小的几十分之一甚至更小,然后数据存入数字相机的存储器里。大多数字相机允许用户设置图像质相机的存储器里。大多数字相机允许用户设置图像质量量, ,至少有两种:高质量和低质量。高质量相片通常至少有两种:高质量和低质量。高质量相片通常可达到可达到800800* *600600个像素甚至更高。一般的数字相机个像素甚至更高。一般的数字相机只能存放有限的高质量图像,通常只有几十张,这主只能存放有限的高质量图像,通常只有几十张,这
21、主要是由数字相机存储器的大小决定的。如果是存储低要是由数字相机存储器的大小决定的。如果是存储低质量的图像照片质量的图像照片, ,那么可以存储上百张或几百张。那么可以存储上百张或几百张。 17 数字相机多数使用集成的硅存储器。现在数字相机多数使用集成的硅存储器。现在IntelIntel、KodakKodak和其它一些厂商推出基于和其它一些厂商推出基于PCPC卡的存储器规范作为数字相机的标准卡的存储器规范作为数字相机的标准, ,主要的主要的特点是模块化。当数字相机的存储器用完时特点是模块化。当数字相机的存储器用完时只要插入另一块只要插入另一块PCPC卡卡, ,就像以前装一个新的就像以前装一个新的胶
22、卷一样。而如果采用的是集成存储器保存胶卷一样。而如果采用的是集成存储器保存相片,当存储器用完时相片,当存储器用完时, ,必须连上计算机必须连上计算机, ,把相把相片传给计算机后片传给计算机后, ,才能拍摄新的照片。才能拍摄新的照片。 数字相机的照片是以数字相机的照片是以0 0、1 1来保存的数字图来保存的数字图像信息像信息, ,所以如果数字相片不送入计算机那就所以如果数字相片不送入计算机那就没有多少价值了。有几种方法可以把图像从没有多少价值了。有几种方法可以把图像从数字相机传送到计算机中:使用串行电数字相机传送到计算机中:使用串行电缆缆,USB,USB电缆、闪存卡。电缆、闪存卡。18 现在,大
23、部分数字相机使用标准的串行电缆现在,大部分数字相机使用标准的串行电缆, ,串口连接意味串口连接意味着任何台式计算机或笔记本计算机均能与数字相机通信(当着任何台式计算机或笔记本计算机均能与数字相机通信(当然需要有相应的软件)。但是,串行连接也意味着速度慢然需要有相应的软件)。但是,串行连接也意味着速度慢, ,可可能会发生冲突,电缆也比较粗大笨拙。更新的数字相机具有能会发生冲突,电缆也比较粗大笨拙。更新的数字相机具有USBUSB总线功能。总线功能。USBUSB提供了更快的传输速度提供了更快的传输速度, ,可以达到可以达到12MB12MBS S,而串口通信最多只能达到每秒几百,而串口通信最多只能达到
24、每秒几百KB,KB,所以传送所以传送照片时照片时USBUSB的数字相机比基于串行方式连接的数字相机快得的数字相机比基于串行方式连接的数字相机快得多。同时,采用多。同时,采用USBUSB方式的相机与计算机相连时,不需要拨方式的相机与计算机相连时,不需要拨下调制解调器或其它串行设备下调制解调器或其它串行设备, ,因为它采用另外的端口。因为它采用另外的端口。 另一个正在发展的选项是使用前面提到过的标准的另一个正在发展的选项是使用前面提到过的标准的PCPC卡模卡模块块, ,这是一种闪存卡,可以存储高达几十这是一种闪存卡,可以存储高达几十MBMB的数据,而且存的数据,而且存储满后可以换卡,当暂时没有计算
25、机用来传送数据时,这种储满后可以换卡,当暂时没有计算机用来传送数据时,这种进项就极为重要了,这种卡对一个常在郊外或山地进行摄影进项就极为重要了,这种卡对一个常在郊外或山地进行摄影工作的摄影工作者来说是非常有意义的。工作的摄影工作者来说是非常有意义的。199.2.5 9.2.5 数字摄像机数字摄像机 数字摄像机的工作和普通摄像机非常相似数字摄像机的工作和普通摄像机非常相似, ,但有更多的功能和更快的速度。它和数字相机但有更多的功能和更快的速度。它和数字相机类似,采用电荷耦合器件类似,采用电荷耦合器件CCDCCD获取光线井将获取光线井将其转换成模拟电脉冲其转换成模拟电脉冲, ,然后再转换成然后再转
26、换成0 0、1 1的数的数字信息。彩色摄像机通常用三个字信息。彩色摄像机通常用三个CCDCCD芯片来芯片来建立真彩色合成。建立真彩色合成。 数字摄像机必须在数字摄像机必须在1S1S内拍摄内拍摄3030幅图像,把幅图像,把光转换成电,再转换成二进制的数字信息,这光转换成电,再转换成二进制的数字信息,这样各个图像就可以连在一起成为相应的视频。样各个图像就可以连在一起成为相应的视频。 摄像机还必须获取模拟的声音摄像机还必须获取模拟的声音, ,对波形进行对波形进行采样获取相应的数字信息。采样获取相应的数字信息。 20 数字摄像机使用基于磁带的介质或小数字摄像机使用基于磁带的介质或小硬盘硬盘, ,而不是
27、数字相机中所用的静止不动的而不是数字相机中所用的静止不动的存储器存储器, ,原因是视频动态文件太大了原因是视频动态文件太大了, ,用芯片用芯片存放过于昂贵。存放过于昂贵。 同时同时, ,数字摄像机也面临把数据传送至数字摄像机也面临把数据传送至计算机的挑战,即使是计算机的挑战,即使是USBUSB的的12MB12MBs s数据传输速率也不足以传送巨大的视频动数据传输速率也不足以传送巨大的视频动态文件。正是由于这个原因,许多厂商看态文件。正是由于这个原因,许多厂商看中了中了IEEE1394IEEE1394总线标准,即它的传输速总线标准,即它的传输速率可以达到率可以达到200-800MB200-800
28、MBs,s,而且还有即而且还有即插即用的安装。插即用的安装。219.2.6 9.2.6 语音与文字输入系统语音与文字输入系统 目前计算机输入字符与数据,主要用键盘敲入,目前计算机输入字符与数据,主要用键盘敲入,人们正在研究如何让机器能够听懂话,识别字的功人们正在研究如何让机器能够听懂话,识别字的功能。为了达此目的,一系列相应学科正在形成与发能。为了达此目的,一系列相应学科正在形成与发展。其中包括模式识别、人工智能、信号处理和图展。其中包括模式识别、人工智能、信号处理和图像处理,并在此基础上产生了语音识别、文字识别、像处理,并在此基础上产生了语音识别、文字识别、自然语言理解与机器视觉等学科。自然
29、语言理解与机器视觉等学科。 语音与文字输入的实质是要让计算机从语音的声语音与文字输入的实质是要让计算机从语音的声波和文字的形状中领会到含义,并将它转换成计算波和文字的形状中领会到含义,并将它转换成计算机可以处理的代码。其核心环节是对声波和文字图机可以处理的代码。其核心环节是对声波和文字图形的识别,从学科上说这属于模式识别(形的识别,从学科上说这属于模式识别(Pattern Pattern recognitionrecognition)范畴。例如每个英文字母在书写时,)范畴。例如每个英文字母在书写时,其形状大小都有变化。同一个字不同地区的人发音其形状大小都有变化。同一个字不同地区的人发音很不一样
30、,但它们属于同一类。很不一样,但它们属于同一类。22 这里把待辨认的一段声波或一个文字图形这里把待辨认的一段声波或一个文字图形称为称为样本样本,把它们的类别叫做模式,把它们的类别叫做模式(natternnattern)。实现将样本划定其模式的系)。实现将样本划定其模式的系统叫做模式识别系统,具体来讲就称为语音统叫做模式识别系统,具体来讲就称为语音识别系统或文字识别系统。图识别系统或文字识别系统。图9.39.3是其系统是其系统构成,由信息获取、预处理、特征提取、分构成,由信息获取、预处理、特征提取、分类器学习和分类决策等环节组成。类器学习和分类决策等环节组成。 信息获取利用传感器(信息获取利用传
31、感器(sensorsensor)将语)将语音或文字转换成电信号,并进一步将模拟量音或文字转换成电信号,并进一步将模拟量转换成数字量,这就是信息获取过程。转换成数字量,这就是信息获取过程。23 语音与文字识别系统的系统构成语音与文字识别系统的系统构成24 语音通过空气振动产生的声波,传到话筒引起话筒内语音通过空气振动产生的声波,传到话筒引起话筒内部簧片振动,又转换成电流变化,在这里话筒就是传感部簧片振动,又转换成电流变化,在这里话筒就是传感器。至于文字常用扫描器(器。至于文字常用扫描器(scannerscanner)作传感器,当文)作传感器,当文 件放入扫描器中时,扫描器从上到下对文件进行逐行件
32、放入扫描器中时,扫描器从上到下对文件进行逐行 扫描,从纸面上反射的光强与该点的黑、白有关。根扫描,从纸面上反射的光强与该点的黑、白有关。根 据光的强弱转换成二进制码。据光的强弱转换成二进制码。 一般从传感器输出的是模拟量,要将它转换成数字一般从传感器输出的是模拟量,要将它转换成数字 量。量。 预处理预处理 从传感器采集到的信号,往往有畸变或噪音,预处从传感器采集到的信号,往往有畸变或噪音,预处 理阶段的一个主要任务是消除或削弱噪音。例如用对理阶段的一个主要任务是消除或削弱噪音。例如用对 同一页纸扫描若干次,再取平均值等方法来减轻噪音同一页纸扫描若干次,再取平均值等方法来减轻噪音 的影响。的影响
33、。 预处理阶段还包含对输入信息进行划分的内容。例预处理阶段还包含对输入信息进行划分的内容。例 如,按字符、单词或词组进行分段,以便进一步识如,按字符、单词或词组进行分段,以便进一步识 别。别。 25 特征提取特征提取 语音或文字输入到计算机后,通过与机内语音或文字输入到计算机后,通过与机内已存入的标准语音或文字相比较。找出其最已存入的标准语音或文字相比较。找出其最相似者而实现识别。所以机器内存有标准语相似者而实现识别。所以机器内存有标准语音库或文字库,统称模型库。音库或文字库,统称模型库。 但识别过程并不是将输入信号,例如某一但识别过程并不是将输入信号,例如某一汉字直接与模型库中每个汉字比较,
34、实际上汉字直接与模型库中每个汉字比较,实际上存在机器内的模型是根据该文字的特点并按存在机器内的模型是根据该文字的特点并按某一规律转换成的某种代码或向量。待识别某一规律转换成的某种代码或向量。待识别的输入信号也按同一规律转换成相应的代码的输入信号也按同一规律转换成相应的代码或向量,比较是在这种代码或向量的基础上或向量,比较是在这种代码或向量的基础上进行的。在模式识别中,把这种代码或向量进行的。在模式识别中,把这种代码或向量称之为称之为“特征表示特征表示”。26 分类器学习分类器学习 分类器学习是将作为标准的文字或语音送入分类器学习是将作为标准的文字或语音送入机器,它的方法是人们一方面用键盘敲入某
35、个机器,它的方法是人们一方面用键盘敲入某个字符的代码。另一方面同时用传感器送入它的字符的代码。另一方面同时用传感器送入它的语音或文字,计算机将该字符的代码及从语音语音或文字,计算机将该字符的代码及从语音或文字抽取得到的特征表示,一起存到模型库或文字抽取得到的特征表示,一起存到模型库内以备样本比较用。内以备样本比较用。 文字输入系统要送入不同字体或手写体模型。文字输入系统要送入不同字体或手写体模型。语音输入系统若按使用者来分,有特定人专用语音输入系统若按使用者来分,有特定人专用与非特定人使用两类。特定人专用,则要让指与非特定人使用两类。特定人专用,则要让指定的使用人按所用词汇逐个对机器进行训练;
36、定的使用人按所用词汇逐个对机器进行训练;非特定人使用的系统需要选择若干口音不同的非特定人使用的系统需要选择若干口音不同的人对机器进行训练。人对机器进行训练。 27 分类决策分类决策 分类决策是对输入信号进行识别,并赋分类决策是对输入信号进行识别,并赋予识别结果、此时输入信号已转换成特征予识别结果、此时输入信号已转换成特征表示方式。有两种分类决策方法:表示方式。有两种分类决策方法: 1 1、将输入的特征表示与模型库中的模型、将输入的特征表示与模型库中的模型(特征表示)逐个进行比较,找出最相似(特征表示)逐个进行比较,找出最相似者,输出其类别代号。者,输出其类别代号。 2 2、根据模型库所有模型特
37、点设计出一些、根据模型库所有模型特点设计出一些决策规则并使用这些规则对输入信号进行决策规则并使用这些规则对输入信号进行计算,确定其类别。计算,确定其类别。289.2.7 9.2.7 汉字识别汉字识别 汉字识别主要分为脱机手写汉字识别、联机手写汉字识别主要分为脱机手写汉字识别、联机手写 汉字识别和印刷体汉字识别三类,其难易程度也按上汉字识别和印刷体汉字识别三类,其难易程度也按上 述次序从难到易排列。述次序从难到易排列。 汉字识别实际上是一个模式识别问题,其困难首汉字识别实际上是一个模式识别问题,其困难首 先在于常用汉字的数量极大,相似字较多;其次是汉先在于常用汉字的数量极大,相似字较多;其次是汉
38、 字字形的多变性,不仅手写体如此,即使是印刷体汉字字形的多变性,不仅手写体如此,即使是印刷体汉 字,不同字体(宋、仿宋、黑、楷等)、不同字号字,不同字体(宋、仿宋、黑、楷等)、不同字号 (从特大号到小七号)不同印刷方法(铅印、激光打(从特大号到小七号)不同印刷方法(铅印、激光打 印、胶印和计算机打印等)和不同印刷厂所印刷的汉印、胶印和计算机打印等)和不同印刷厂所印刷的汉 字也是不同的。由于印刷文本的输入工作量很大,因字也是不同的。由于印刷文本的输入工作量很大,因 此迫切需要解决自动输入问题。目前我国已有几个商此迫切需要解决自动输入问题。目前我国已有几个商 品化的印刷汉字识别系统出现,其识别率可
39、达到品化的印刷汉字识别系统出现,其识别率可达到9595 9898、如要实现完全的印刷文本自动输入,还、如要实现完全的印刷文本自动输入,还 有相当多困难待解决有相当多困难待解决。29 印刷汉字识别系统又有单一字体印刷汉印刷汉字识别系统又有单一字体印刷汉字识别系统和多种字体印刷汉字识别系统之字识别系统和多种字体印刷汉字识别系统之分。后者可以用同一字库实现对宋、仿宋、分。后者可以用同一字库实现对宋、仿宋、黑、楷四大字体的识别,对字形变化有一定黑、楷四大字体的识别,对字形变化有一定的适应能力,适应范围较宽,是研究方向。的适应能力,适应范围较宽,是研究方向。一个实用的印刷汉字识别系统,除了要有良一个实用
40、的印刷汉字识别系统,除了要有良好的核心,即识别算法以外,还有更大量的好的核心,即识别算法以外,还有更大量的工作要在识别以前的工作要在识别以前的预处理模块预处理模块和识别和识别之后的之后的预处理模块预处理模块”中完成。预处理模块中完成。预处理模块主要包括字的正确切分,人的认字过程是将主要包括字的正确切分,人的认字过程是将字的切分识别和对字的理解在瞬间同时完成字的切分识别和对字的理解在瞬间同时完成的,从而保证了字符切分的正确性。的,从而保证了字符切分的正确性。30 而计算机是串行工作的,使字符的正确切分变得而计算机是串行工作的,使字符的正确切分变得很困难。在目前的识别系统中,大约有很困难。在目前的
41、识别系统中,大约有3030误识来误识来自切分错误。对计算机来说,识别一篇文章是逐段、自切分错误。对计算机来说,识别一篇文章是逐段、逐行、逐字地从上至下和从左到右进行的。对于报逐行、逐字地从上至下和从左到右进行的。对于报纸和杂志等版面较复杂的文章(即除了文字外,还纸和杂志等版面较复杂的文章(即除了文字外,还有图或表格),则需要将一个版面分成很多块将图有图或表格),则需要将一个版面分成很多块将图和表格区分出来,并把文字一行一行、一字一字划和表格区分出来,并把文字一行一行、一字一字划分开来。分开来。 预处理模块的作用是利用上下文关系对若干个尚预处理模块的作用是利用上下文关系对若干个尚无完全确定的字(
42、或词组),识别出正确结果;同无完全确定的字(或词组),识别出正确结果;同时还要进行类似于人工校稿的工作,诸如编排文字、时还要进行类似于人工校稿的工作,诸如编排文字、调整结构和修改错误等。调整结构和修改错误等。 至于联机手写输入(笔至于联机手写输入(笔输入)指的是以手写的形式实现人与计算机交互的输入)指的是以手写的形式实现人与计算机交互的手段,它除了上述各特点外,还具有以下功能。手段,它除了上述各特点外,还具有以下功能。31 笔输入由硬件和软件两部分组成,硬件部分包括笔输入由硬件和软件两部分组成,硬件部分包括“笔笔与供书写和定位的与供书写和定位的手写板手写板、手写板又有电、手写板又有电磁式和电阻
43、式两种。对于电磁式手写板必须与电磁式磁式和电阻式两种。对于电磁式手写板必须与电磁式专用笔(有线与无线均可)相配合,而电阻式手写板,专用笔(有线与无线均可)相配合,而电阻式手写板,可以用一般的尖状硬物作为笔。笔输入技术采用绝对可以用一般的尖状硬物作为笔。笔输入技术采用绝对定位技术,使得手写板上写入的内容能以自然的方式定位技术,使得手写板上写入的内容能以自然的方式从上到下、从左到右出现在计算机显示器屏幕上。从上到下、从左到右出现在计算机显示器屏幕上。 笔迹保留是笔输入技术所提供的独特功能同时能笔迹保留是笔输入技术所提供的独特功能同时能方便地完成绘画、作图等功能。方便地完成绘画、作图等功能。 手写字
44、符识别是笔输入技术中的核心问题、定位手写字符识别是笔输入技术中的核心问题、定位控制、笔迹保留和字符识别等功能均由软件完成。控制、笔迹保留和字符识别等功能均由软件完成。329.2.8 9.2.8 语言识别语言识别 语言信息处理技术包括自动语言识别、语言合语言信息处理技术包括自动语言识别、语言合成、语言理解、自动电话查询和翻译等,是当今世成、语言理解、自动电话查询和翻译等,是当今世界上研究的一个重要方面。自从日本在界上研究的一个重要方面。自从日本在19811981年提出年提出第五代计算机的研制计划以后,人机语言通信越来第五代计算机的研制计划以后,人机语言通信越来越受到重视尽管最终没有取得预期结果,
45、但产生了越受到重视尽管最终没有取得预期结果,但产生了巨大宣传效果。巨大宣传效果。 语言识别系统,有孤立单词识别系统和连续语言语言识别系统,有孤立单词识别系统和连续语言识别系统两种。在语言理解系统中要求适应自然语识别系统两种。在语言理解系统中要求适应自然语言,自然语言的语法不很规范并带有习惯性的无意言,自然语言的语法不很规范并带有习惯性的无意义的发音。语言识别系统根据使用范围的不同又可义的发音。语言识别系统根据使用范围的不同又可分成供特定人使用的和供任意人使用的两种。孤立分成供特定人使用的和供任意人使用的两种。孤立单词和连续语言又有词汇量大小问题,美国的某些单词和连续语言又有词汇量大小问题,美国
46、的某些公司和大学,在大词汇量语言识别方面取得了较好公司和大学,在大词汇量语言识别方面取得了较好的成绩。的成绩。33 80 80年代中期中国在汉语孤立音节识别年代中期中国在汉语孤立音节识别系统方面获得迅速发展。西方语言单音节系统方面获得迅速发展。西方语言单音节词很少,孤立音节识别没用处。而汉语,词很少,孤立音节识别没用处。而汉语,一个音节就是一个单位,至少对应一个汉一个音节就是一个单位,至少对应一个汉字(因有同音字),但到目前为止,识别字(因有同音字),但到目前为止,识别率都没超过率都没超过9090,孤立词语言识别率取决,孤立词语言识别率取决于同汇量的大小,可达于同汇量的大小,可达9595以上。
47、以上。 语言识别系统至今还没有达到真正实用语言识别系统至今还没有达到真正实用水平。还有许多问题要研究。例如前面提水平。还有许多问题要研究。例如前面提到过的切分问题、训练问题等。到过的切分问题、训练问题等。349.2.9 9.2.9 条形码及其技术条形码及其技术 条形码又叫条码。条码的定义是由一组宽度和条形码又叫条码。条码的定义是由一组宽度和反射率不同的平行相邻的反射率不同的平行相邻的“条条和和“空空”,按照预,按照预先规定的编码规则组合起来,用以表示一组数据的先规定的编码规则组合起来,用以表示一组数据的符号。这组数据可以是数字、字母或某些符号。符号。这组数据可以是数字、字母或某些符号。 条码元
48、素用以组成条码符号的条和空,统称条条码元素用以组成条码符号的条和空,统称条码元素。码元素。 条与空可规定几种不同的宽度,由若干条和空条与空可规定几种不同的宽度,由若干条和空组成一个字符。组成一个字符。 条码是表示数据的符号,在市场上即表示某种条码是表示数据的符号,在市场上即表示某种商品的代号,这个符号可由机器自动识别并送入计商品的代号,这个符号可由机器自动识别并送入计算机中。在超级市场中的商品,都用条码识别。条算机中。在超级市场中的商品,都用条码识别。条码也可应用于仓库管理、图书管理等领域。码也可应用于仓库管理、图书管理等领域。35 条码技术主要包括条码编码规则及标条码技术主要包括条码编码规则
49、及标准、条码译码技术、印刷技术、光电扫描准、条码译码技术、印刷技术、光电扫描技术、通信技术、计算机技术等。技术、通信技术、计算机技术等。 要阅读条码符号所包含的信息需要一要阅读条码符号所包含的信息需要一个扫描装置,根据目前的印刷技术。条码个扫描装置,根据目前的印刷技术。条码符号最窄元素的宽度可达到符号最窄元素的宽度可达到 0. 15mm0. 15mm左左右,扫描器的分辨率应与之对应。在正常右,扫描器的分辨率应与之对应。在正常工作时,扫描器与条码符号之间要保持的工作时,扫描器与条码符号之间要保持的距离称为工作距离,而允许的最大工作距距离称为工作距离,而允许的最大工作距离和最小工作距离之差称为扫描
50、景深。离和最小工作距离之差称为扫描景深。36 扫描器将扫描得到的脉冲数字信号送到译码器译扫描器将扫描得到的脉冲数字信号送到译码器译码,按照一定的编码规则解释成计算机可识别的信号,码,按照一定的编码规则解释成计算机可识别的信号,并通过数据通信接口送入计算机。通常条码译码器采并通过数据通信接口送入计算机。通常条码译码器采用微处理器及相应硬件来完成译码工作。用微处理器及相应硬件来完成译码工作。8080年代后年代后期已有专用译码芯片上市。期已有专用译码芯片上市。 扫描器和译码器合起扫描器和译码器合起来称为阅读器。来称为阅读器。 一个完整的条码符号由两侧静区、起始字符、数一个完整的条码符号由两侧静区、起