1、图书馆信息技术图书馆信息技术内容内容 图书馆信息技术概述图书馆信息技术概述 图书馆现代信息技术基础图书馆现代信息技术基础 图书馆自动化系统图书馆自动化系统 网络技术及其在图书馆的应用网络技术及其在图书馆的应用 数字图书馆数字图书馆 1 图书馆信息技术概述图书馆信息技术概述 图书馆信息技术图书馆信息技术的定义传统信息技术现代信息技术 图书馆现代信息技术的应用与发展 图书馆现代信息系统1.1 图书馆现代信息技术图书馆现代信息技术 图书馆信息技术:完成信息存储、加工、处理、传递等信息自动化处理的技术。传统信息技术:印刷与排版、复印技术、缩微技术现代信息技术:计算机技术、通信技术、高密度存储技术、多媒
2、体技术、数字化技术 图书馆现代信息技术计算机技术高密度存储技术:磁盘存储技术和光学存储技术通信技术:计算机与通信技术相结合形成网络技术多媒体技术:综合处理多媒体信息,使多种媒体建立联系,并具有交互功能的信息处理技术。特点:集成性、交互性、数字化。关键支撑技术:数字压缩与还原技术;海量存储技术;多媒体操作系统;数据库技术;支持多媒体的硬件与网络;数字技术:将信息以数字的方式进行存储、加工、处理、传递的技术。1.2 图书馆现代信息技术的应用与发展图书馆现代信息技术的应用与发展 图书馆现代信息技术发展的三个阶段初级阶段(20世纪60年代80年代)机读目录的出现与应用图书馆计算机管理系统的普及网上电子
3、文献信息服务阶段局域网络在图书馆的广泛应用光盘数据库的广泛应用图书馆自动化集成系统向网上文献系信息服务发展图书馆电子文献信息服务的全球化(基于Internet)数字图书馆阶段图书馆资源的数字化信息服务的网络化特色技术三个阶段的关系P131.3 图书馆现代信息系统图书馆现代信息系统 定义:利用现代信息技术对图书馆工作的各个环节实现自动化管理,对文献信息实现快速查询与提供,实现资源共享的全过程。研究内容P14 实现目标读者快速获得所需的文献资源馆藏资源共享图书馆的计算机化管理 功能图书馆业务自动化管理系统电子文献服务系统图书馆办公自动化系统2 图书馆现代信息技术基础 计算机硬件系统 计算机软件系统
4、 文献信息编码与存储 汉字信息处理与编码2.1 计算机硬件系统 计算机基本结构:五大组成部分;计算机主机:内存储器、运算器、控制器;其中运算器、控制器合称中央处理单元(CPU)计算机的外围设备:外存储器、输入和输出设备。分清常见的外围设备。图书馆对计算机硬件的要求:内外存的容量;数据处理能力;运算速度快。2.2 计算机软件系统 软件系统组成:系统软件和应用软件。其中系统软件是指合理组织计算机资源、最大限度发挥计算机效率、方便用户使用和管理的软件总称。系统软件:操作系统、编译程序、数据库等;图书馆自动化系统应用软件:针对图书馆业务管理而设计的软件,如采购、编目、典藏、流通、期刊管理、书目查询和参
5、考咨询等业务。发展趋势:单一功能系统集成管理系统信息开发和网络服务 操作系统:数据库2.3 文献信息编码与存储 信息编码及其表示二进制编码表示:二进制计数法(以2为基数的计数系统)字符编码表示:采用一定数目的二进制数位表示字符。标准:ASCII(1个字节的0、1表示一个字符);汉字编码:两个字节,又称双字节编码。文献信息记录的存储格式文献信息在存储介质中所表现的内容、属性和逻辑结构。文献属性,即著录项目,例如:书名、作者、出版项、ISBN号等;一个著录项目即一个字段;相关字段集合就是记录;若干相关记录集合就称之为文件。文献信息存储方式固定格式固定长度固定格式可变长度可变格式可变长度;例如:IS
6、O2709;机读目录(MARC)格式及特点常见的MARC 其它文本描述格式SGMLHTMLXML2.4 汉字信息处理及编码 汉字信息处理利用计算机、通信、激光照排技术,对汉字信息进行输入、存储、加工、转换、传输、印刷等处理的技术。汉字信息处理方式:采用输入编码输入,转换成机内码存储和处理,采用输出编码显示和打印。研究内容:输入编码:区位码、音码、形码、音形码等 汉字输入键盘设计汉字字模的存储汉字输出技术与设备 汉字编码汉字输入码汉字内码汉字交换码:国标GB2312-80用于不同计算机系统之间交换。汉字输出编码:字形码(字模)汉字编码字符集GB2312-80GB12345-90(GB2312的繁
7、体版)GBK(国际规范的汉字代码集)BIG-5(台湾和香港地区)ISO10646或Unicode3 图书馆信息系统 图书馆业务自动化系统 文献信息服务自动化系统 图书馆办公自动化系统3.1 图书馆业务自动化系统 业务自动化的内容基础业务自动化:采访、编目、查询、流通、典藏等信息开发自动化:信息的再加工、建库等读者工作自动化:公共查询 系统组成采访子系统编目子系统流通子系统连续出版物管理子系统公共信息查询子系统:OPAC3.2 文献信息服务自动化 文献信息服务自动化的发展面向用户的文献信息服务自动化系统基于网络的文献信息服务体系数字化文献信息服务体系数字图书馆 面向用户的文献信息服务自动化OPA
8、C馆际联合目录数据库建设及提供检索服务馆际互借电子出版物服务公共信息查询服务参考咨询自动化 基于网络的文献信息服务体系特点打破单一图书馆的界限分布式虚拟化文献资源共享为基本特征4 网络技术及其在图书馆的应用 网络技术 网络设备与传输介质 图书馆网络的建立 综合布线系统 网络安全与管理4.1 网络技术 计算机网络的概念互联的自治的计算机系统的集合。互联互连(物理上连接起来)信息交换自治系统协议(双方认可的通信规则)通信技术模拟通信数字通信 网络形成与发展 计算机网络结构拓扑结构系统结构局域网广域网局域网 三个特征范围:有限,几千米范围内;传输技术:共享传输介质、广播式;拓扑结构 局域网 广播式局
9、域网必须解决的问题:共享介质分配问题静态分配动态分配集中式:Token Ring非集中式:CSMA/CD(Carrier Sense Multiple Access)协议先听后发边发边听冲突停止延迟再发以太网IEEE802标准制定5种接口标准,P173快速以太网:100Mbps千兆位以太网:1GbpsFDDIATM(异步传输方式)广域网 由远程通信网络将地理位置不同网络局域网连接而形成的网络。组成资源子网、通信子网广域网 通信子网通信线路交换设备(比如:路由器)交换技术(Switching)交换:按照某种方式动态分配传输线路资源;电路交换存储转发交换(目前计算机网络普遍采用的方式)电路交换 当
10、电话机的数量增多时,就要使用很多彼此连接当电话机的数量增多时,就要使用很多彼此连接起来的交换机来完成全网的交换任务。起来的交换机来完成全网的交换任务。电路交换过程:建立连接电路交换过程:建立连接通信通信释放连接。采释放连接。采用 这 三 个 步 骤 的 连 网 方 式 称 为 面 向 连 接 的用 这 三 个 步 骤 的 连 网 方 式 称 为 面 向 连 接 的(connection-oriented)(connection-oriented)。这里我们要指出,。这里我们要指出,电电路交换路交换必定是面向连接的必定是面向连接的。分组交换 分组交换基于邮政系统:分组交换基于邮政系统:不先建立连
11、接,而是随时发送;不先建立连接,而是随时发送;分组交换则采用分组交换则采用存储转发技术存储转发技术结点交换机处理分组的过程是:将收到的分组先放入结点交换机处理分组的过程是:将收到的分组先放入缓存,再查找转发表缓存,再查找转发表(转发表中写有到何目的地址应转发表中写有到何目的地址应从何端口转发的信息从何端口转发的信息),然后由交换机构从缓存中将,然后由交换机构从缓存中将该分组取出,传递给适当的端口转发出去。该分组取出,传递给适当的端口转发出去。信元交换 网络体系结构和协议OSI互联参考模型TCP/IP模型物理层 物理层是OSI/RM的最底层,它直接面向实际承担数据传输的物理媒体。设立物理层的目的
12、是实现两个网络物理设备之间的透明二进制比特流透明二进制比特流(比特:表示信息的最小单位)的传输的传输,对数据链路层屏蔽物理传输介质的特性。对数据链路层屏蔽物理传输介质的特性。物理层的主要功能有:为数据终端设备提供传送数据的通路;准确传输数据以及完成物理层的一些管理工作。OSI/RM中的物理层并不是指物理设备或物理传输介质,而是物理设备通过物理传输介质进行互物理设备通过物理传输介质进行互连的描述和规定连的描述和规定。物理层协议规定了与建立、维持及断开物理信道有关的特性,这些特性包括接口的机械特性接口的机械特性(规定接口部件的尺寸、规格、插脚数和分布等)电气特性电气特性(规定接口部件的信号电平、阻
13、抗、传输速率等)功能特性功能特性(规定接口部件的信号线,如数据线、控制线、定时线等的用途)规程特性规程特性(规定接口部件的信号线在建立、维持、释放物理连接和传输比特流时的时序)。这些特性确保物理层能通过物理媒体在相邻网络节点之间正确地收、发比特流。数据链路层 虽然物理层为终端设备间的数据通信提供了传输媒体及其连接,但在物理媒体上传输的数据信号难免受到传输媒体本身的质量(如信号衰减)以及外部的因素(如干扰信号)等不可靠因素的影响而产生差错,也就是说物理层物理层提供的是一条原始的、有差错的物理链路提供的是一条原始的、有差错的物理链路。设立数据链路层的目的就是弥补物理层的不足弥补物理层的不足,为网络
14、为网络层提供无差错的数据传输。数据链路的建立、拆除、对层提供无差错的数据传输。数据链路的建立、拆除、对数据的差错检测与控制、流量控制是数据链路层的基本数据的差错检测与控制、流量控制是数据链路层的基本任务。任务。链路层的主要功能有:链路管理,包括链路连接的建立、链路层的主要功能有:链路管理,包括链路连接的建立、维护、拆除;帧定界和帧同步维护、拆除;帧定界和帧同步(链路层的数据传输单元为链路层的数据传输单元为帧帧);差错检测;差错检测(采用检错码或纠错码采用检错码或纠错码)与控制;数据流量与控制;数据流量控制等等控制等等。网络层 数据链路层虽然提供了理论上的可靠传输服务,但这种数据链路层虽然提供了
15、理论上的可靠传输服务,但这种服务仅发生在相邻的结点之间服务仅发生在相邻的结点之间。而用户的数据传输则是在端到端之间进行,用户应当具而用户的数据传输则是在端到端之间进行,用户应当具有和网络内所有其他用户通信的能力,其中需要经过多有和网络内所有其他用户通信的能力,其中需要经过多个结点个结点(提供中继功能的结点,例如交换机提供中继功能的结点,例如交换机)的合作和转发。的合作和转发。网络层的内在功能网络层的内在功能就是利用各种路由选择算法使得中继就是利用各种路由选择算法使得中继结点能够根据数据分组中的地址信息做出决策,尽快转结点能够根据数据分组中的地址信息做出决策,尽快转发收到的分组,使得用户的数据尽
16、快地穿越网络到达接发收到的分组,使得用户的数据尽快地穿越网络到达接收端。收端。网络层的主要功能有:路由选择和中继;网络连接建立网络层的主要功能有:路由选择和中继;网络连接建立与管理;差错检测与恢复;排序、流量控制;服务选择;与管理;差错检测与恢复;排序、流量控制;服务选择;网络管理等网络管理等。传输层 网络通信的实质是实现互连的主机进程之间的通信。网络通信的实质是实现互连的主机进程之间的通信。互连主机进程通信还面临着下面几个问题:如何在一条网络连接上实现多个进程之间的通信?如何在一条网络连接上实现多个进程之间的通信?如何解决多个互连的通信子网协议的差异和提供的服务功能的不如何解决多个互连的通信
17、子网协议的差异和提供的服务功能的不同?同?如何解决网络层及以下两层自身不能解决的传输错误如何解决网络层及以下两层自身不能解决的传输错误?设立传输层的主要目的就是:提供可靠的端到端的通信;提供可靠的端到端的通信;向会话层提供独立于网络的传输服务。对高层用户来说,向会话层提供独立于网络的传输服务。对高层用户来说,两个传输层实体之间存在一条端到端可靠的透明的通信两个传输层实体之间存在一条端到端可靠的透明的通信连接。连接。传输层 传输层的主要功能有传输层的主要功能有:采用适当的差错检测与恢复技术、流量控制和连接管采用适当的差错检测与恢复技术、流量控制和连接管理等机制提供可靠有效的网络连接理等机制提供可
18、靠有效的网络连接;采用多路复用技术在网络中建立多重连接,包括向下采用多路复用技术在网络中建立多重连接,包括向下多路复用和向上多路复用多路复用和向上多路复用。向下多路复用是指将用户数据进行分段,传送到不同的网络节点,沿不同的路径穿越网络到达目的地。向上多路复用是指几个传输用户共享同一单一节点。总之,传输层的最终目的是为会话提供可靠的、无误的数据传输,保证传送信息正确地到达目的地。会话层 控制用户信息的交互过程(如数据交换的时序,如何保证数据交换的完整性等),网络应当提供相应的功能来协助用户管理和控制用户之间的信息交换,从而进一步满足用户应用的要求。会话层主要功能有:利用令牌技术保证数据交换、会话
19、同步的有序性;利用活动和同步技术来保证用户数据的完整性;让用户知道整个交换的过程,同时支持传输过程中的故障恢复。表示层 表示层为异种机之间通信提供一种公共语法(语言),使得异种机在信息交换时首先进行本地语法和公共语法之间的相互转换,这样,双方就会有一致的数据形式,能够互相认识。表示层主要用于解决通信实体之间的信息用于解决通信实体之间的信息表示问题,屏蔽不同系统在数据表示方面表示问题,屏蔽不同系统在数据表示方面的差异,将自己具有的数据结构转换成传的差异,将自己具有的数据结构转换成传送的、必要的、通用的数据结构。送的、必要的、通用的数据结构。应用层 应用层中包含了若干独立的、用户通用的服务协议模块
20、,是网络可向最终用户提供应用服务的唯一窗口。之所以称它为应用层,是因为它包含网络应用。典型的网络应用包括Web应用、电子邮件、文件传输、虚拟终端协议和分布系统等。TCP/IP模型 四层模型应用层:HTTP、FTP、SMTP、Telnet等传输层:TCP、UDP、网络层:IP、ICMP、ARP、RARP、ICMP网络接口层4.2 网络设备与传输介质 网络服务器 网络操作系统平台 网络连接设备网卡(网络适配器)中继器:信号功能放大、延伸网络距离;属于物理层设备网桥:数据链路层设备路由器网关集线器交换机 网络传输介质双绞线、同轴电缆、光缆4.3 图书馆计算机网络的建立 图书馆局域网的建立 图书馆广域
21、网的建立图书馆局域网的建立 利用TCP/IP协议完成网络连接。图书馆业务工作局域网光盘数据库检索局域网办公自动化局域网三网融合P188图书馆广域网的建立 馆际网络的建立利用电信网络组建(CHINAPAC、CHINADDN、CHINANET)加入已有的信息网,例如科研教育网。与因特网连接,方式如下:公共电话交换网分组交换网公用数字数据网公用计算机交换网有线电视网络4.4 综合布线系统 综合布线的概念在建筑群中综合数据的网络系统,它将建筑物中的语音交换系统、数据通信系统以及数据处理系统相互连接起来,进行统一编制和管理。功能传输模拟和数字的语音传输高速或低速的数据传输传真、图形和图像资料传输电视会议
22、和安全监视系统传输建筑物中安全监视系统和空调控制系统 综合布线系统的组成 P192工作区子系统水平子系统设备间子系统管理子系统干线子系统建筑物入口设施子系统4.5 网络安全与管理 网络面临的安全隐患恶意攻击恶意程序(computer virus)(computer worm)(Trojan horse)(logic bomb)网络安全的措施设置防火墙信息加密数字签名:验证信息来源的真实性;服务器和客户端的双向认证存取控制计算机病毒的防治防火墙 防火墙定义:加强网络间访问控制的技术措施(设备、软件系统)职责:根据设置的安全策略,对进出本网络的信息进行过滤。类型 P198数据包过滤(作用在网络层)
23、线路中继器(作用在传输层)应用网关计算机病毒防治 计算机病毒定义特征传染性隐藏性潜伏性破坏性分类P200网络管理 控制复杂的计算机网络,使之更高效运行的过程。5个功能域失效管理:发现故障并解除之;配置管理:通过管理工具对网络配置进行控制安全管理:网络的访问控制;性能管理:测试网络中硬件、软件、媒体的性能,采取相应措施保证网络畅通;计费管理 网络管理模型:“管理者代理”模型 网络管理协议SNMP:提供管理者与代理之间交换管理信息的方法;CMIS/CMIP P203 网络管理系统5 数字图书馆 数字图书馆概述 数字图书馆体系结构 我国数字图书馆建设5.1 数字图书馆概述 数字图书馆产生的背景 数字
24、图书馆的定义 数字图书馆的功能 关于数字图书馆的实验项目 产生背景图书馆内部环境的变革20世纪60年代开始的图书馆自动化系统,替代手工作业,提供服务效果和工作效率;70年代开始的联机革命,进入书目数字化阶段;80年代开始局域网应用,实现远程文献信息服务,为文献数字化的网络查询、检索、传输打下基础。90年代,先进国家迈向数字图书馆建设。总之,信息技术的应用改变了图书馆的内部环境,适应了社会对数字图书馆的需求。社会环境的变革经济结构的变动:信息资源成为战略资源、知识经济出现、信息产业兴起;技术结构的变革文化结构变动信息资源的数字化、电子化数字图书馆的定义 数字图书馆定义 电子图书馆P209 虚拟图
25、书馆P2121 代表性定义代表性定义 要素说(研究图书馆协会要素说(研究图书馆协会(ARL)1995(ARL)1995年)年)The digital library is not a single entity;The digital library requires technology to link the resources of many;The linkages between the many digital libraries and information services are transparent to the end users;Universal access t
26、o digital libraries and information services is a goal;Digital library collections are not limited to document surrogates:they extend to digital artifacts that cannot be represented or distributed in printed formats.)特定功能的组织机构说(美国数字图书特定功能的组织机构说(美国数字图书馆联盟馆联盟 )Digital libraries are organizations provi
27、de the resources,including the specialized staffto select,structure,offer intellectual access to,interpret,distribute,preserve the integrity of,and ensure the persistence over time of collections of digital works they are readily and economically available for use by a defined community or set of co
28、mmunities.这一定义将数字图书馆规定为一种具有特定功能这一定义将数字图书馆规定为一种具有特定功能的组织机构,同时强调了数字资源是数字图书馆的组织机构,同时强调了数字资源是数字图书馆的核心。的核心。数字图书馆是一个拥有专业数字图书馆是一个拥有专业人员等相关资源的组织,该人员等相关资源的组织,该组织对数字资源进行挑选、组织对数字资源进行挑选、组织、提供智能化存取、解组织、提供智能化存取、解译、传播、保持其完整性和译、传播、保持其完整性和永存性等工作,从而使得这永存性等工作,从而使得这些数字资源能够快速且经济些数字资源能够快速且经济地被特定的用户或群体所利地被特定的用户或群体所利用。用。信息
29、收藏说信息收藏说(代表:美国著名数字图书(代表:美国著名数字图书馆专家阿姆斯馆专家阿姆斯 康奈尔大学计算机科学教康奈尔大学计算机科学教授授 )A managed collection of information,with associated services,where the information is stored in digital formats and accessible over a network.A crucial part of this definition is that the information is managed.这一定义将数字图书馆界定为一种信息收
30、藏,这一定义将数字图书馆界定为一种信息收藏,兼顾了数字资源和网络服务,并强调了数字兼顾了数字资源和网络服务,并强调了数字图书馆的信息管理,简洁性和综合性较好图书馆的信息管理,简洁性和综合性较好 数字图书馆是具有服务功能的整理过的信息收藏,其中信息以数字化格式存储并可通过网络存取。该定义的关键在于信息是整理过的。其他说法:其他说法:数字图书馆是图书馆在线服务系统;数字图书馆是图书馆在线服务系统;数字图书馆是以数字形式存贮和处理信息的图书数字图书馆是以数字形式存贮和处理信息的图书馆;馆;数字图书馆是以数字形式提供信息服务的机构或数字图书馆是以数字形式提供信息服务的机构或组织;组织;数字图书馆是指图
31、书馆所有的工作流程都基于计数字图书馆是指图书馆所有的工作流程都基于计算机,而且馆藏资源都实现数字化;算机,而且馆藏资源都实现数字化;数字图书馆就是图书馆馆藏实现数字化管理,并数字图书馆就是图书馆馆藏实现数字化管理,并上网服务,供读者随时随地查阅;上网服务,供读者随时随地查阅;数字图书馆是指通过多种技术将各种文献数字化,数字图书馆是指通过多种技术将各种文献数字化,并将其组织起来在网上提供信息服务的信息中心并将其组织起来在网上提供信息服务的信息中心或数据库或数据库 总之:总之:数字图书馆是一个数字化系统。它将分散于不数字图书馆是一个数字化系统。它将分散于不同载体,不同地理位置的信息资源以数字化的同
32、载体,不同地理位置的信息资源以数字化的形式贮存,以网络化的方式互相连接,提供及形式贮存,以网络化的方式互相连接,提供及时利用,实现资源共享,其核心是时利用,实现资源共享,其核心是数字化数字化资源资源和网络化和网络化存取存取;其实质则是形成有序的信息空;其实质则是形成有序的信息空间;间;数字图书馆是一个大系统,它具有数字图书馆是一个大系统,它具有分布分布的、大的、大规模的和有组织数据库和知识库,用户或用户规模的和有组织数据库和知识库,用户或用户团体可对系统内的数据库和知识库进行一致性团体可对系统内的数据库和知识库进行一致性的访问,获得自己所需的最终情报的访问,获得自己所需的最终情报;(分布式分布
33、式管理管理)数字图书馆三要素:数字化资源、网络化数字图书馆三要素:数字化资源、网络化存取、分布式管理存取、分布式管理数字图书馆的功能 基本功能资源的数字化、数字化资源的存储与管理、数字对象的查询与检索、数字化信息的发布与传输、权限管理与版权保护 IBM图书馆的功能 P213 因特网的连接 联机书目查询功能 电子出版物资源的利用 网络服务功能5.2 数字图书馆的体系结构 数字图书馆的特征 数字图书馆的信息结构 数字图书馆的结构模型 关键技术数字图书馆的特征 资源的数字化 数字化资源的计算机管理 数字化资源的存储、检索、传递网络化 广泛的可存取性 资源共享5.2.2 信息体系结构的基础信息体系结构
34、的基础 数字图书馆中的数字信息数字图书馆中的数字信息D-Lib中包含的内容五花八门,有文本、图片、音乐作品、电脑程序、数据库、模型和设计、影视节目以及由多种类型构成的复合作品。在D-Lib 中,信息存储为数字对象信息存储为数字对象。数字对数字对象由两部分构成:内容和元数据象由两部分构成:内容和元数据。一个数字对象可含有多种类型的内容,如文字、图像、声频。复杂的数据类型可由简单类型构造。元数据是描述数据的数据,包括句柄、权限、访问方法、数字签名、交易日志等。一个句柄是用于标识数字对象的唯一的一个句柄是用于标识数字对象的唯一的一个字一个字符串,独立于其存储位置且长期有效符串,独立于其存储位置且长期
35、有效。在数字图书馆中,为了表现数字信息的复杂性,同类的数字对象可组合在一起,称为数字对象数字对象集(集(set of digital objects)。)。对于不同类型的数字化信息,均要求按照描述数字对象或数字对象集的条例和规则加以描述,从而使计算机程序能够理解信息的结构,完成用户的各种查询要求。数字信息的特点数字信息的特点相关性:相关性:是指与其它数字化资料之间存在的部分/整体、系列等的关联关系。数字格式数字格式:同一个项目可能采用几种数字格式进行存储,例如一些未经压缩采用TIFF格式的图象,经无损压缩以GIF格式或经有损压缩以JPEG格式进行存储。数字对象的变化数字对象的变化:数字对象是容
36、易改变的,如一个web网页每月更新数次。权限与许可权权限与许可权:数字对象的每一个元素都有与之相关的不同版权和许可权。例如页的文字和图片可以分属不同的作者所拥有。结构元数据与元对象结构元数据与元对象信 息 组 织 结 构 基 于 三 个 简 单 概 念:数据类型数据类型:数据的每一个项目都有一个相关的数据类型,用来描述数据的技术性质,如数据的存储格式或处理方法。结构元数据结构元数据:是描述数字信息的类型、标题、著者、版本、相关关系及其它特性的元数据,结构性元数据不可再分。如机读目录MARC就是一种结构元数据。元对象元对象:是为数字对象集提供基准或参照的一种对象。最简单的形式便是数字对象的一个句
37、柄列表或调度码最简单的形式便是数字对象的一个句柄列表或调度码清单清单。如一部诗歌集中的诗歌可以一首一首地用不同的数字对象来描述,一个数字对象对应一首诗,而用于描述诗歌集的元对象则是一个将所有诗歌列表的数字对象集。或者一个版本号就是一个元对象。结构元数据和元对象在描述各类信息时都需要遵循一定的规范和协议。所有数据均需给定一个显式明确的数据类型。所有元数据均应显式明确编码。每个具有知识产权的单独项均应赋予句柄标识每个具有知识产权的单独项均应赋予句柄标识:作为一个数字对象,有了这个标识,该信息项目就可被访问。元对象用于聚集数字对象元对象用于聚集数字对象,特别是项目的所有版本和相关的所有结构元数据。句
38、柄用于识别元对象中的列表项句柄用于识别元对象中的列表项。Dublin Core Dublin Core是多类型的文献资源元数据描述格式的母本母本,可以使各种资源元数据描述格式的主调一致,让不同的文档可以在互联网上自由流通、交换、整合、分析、收集与检索。它不仅适用于图书馆、博物馆、档案馆等资源中心,还适用于网络资源。一、一、Dublin Core的特征的特征简化资源描述与维护工作,著录项目少,简单易行。元数据元素少,涵盖面广,有着广泛的应用前景。它可以用于检索文本与音像资源,描述电子文档、物理文本与超链接文本。具有国际性,DC已经得到全世界的认可,各大软件公司与信息服务部门纷纷采用DC元数据。可
39、扩展性,适应数字资源描述的简单性与检索准确性的要求。句法独立性与可选择性。可重复性,同一DC元素可以在一份文档中反复出现。可修改性,各专业的元数据元素集可以在DC的基础上适当增减。与其它元数据的映射衔接性。二、DC的基本元素集的基本元素集 都柏林元数据核心元素集共有15个元素,这是描述资源的最基本的元素集。分别是:(1)题名(Title)定义:资源属性的名称 说明:特别是一份资源正式认可的名称。(2)创造者(Creator)定义:生成资源内容的主要责任人 说明:它包括个人、组织、服务者,特别是创造者的名称,可以作为该资源的标识款目。(3)主题(Subject)定义:资源内容的最具代表性的词 注
40、释:主题可以表达为关键词、关键词组或分类号,最好是参照受控词表(主题词表)或正式的分类表。(4)描述(Description)定义:描述资源中一些主要内容 说明:不局限于文献、内容目录、内容的文字叙述,或资源中的自然段落。(5)出版者(publisher)定义:资源生成有效责任者款目。说明:包括个人、组织、或服务者,特别是可以表明其款目的出版者。(6)其他责任者(contributor)定义:对于资源内容的生成作了贡献的人。说明:该项包括个人、组织或服务者,特别是能指明款目含义的名称。(7)日期(Date)定义:资源在有效期内某个事件的日期。说明:日期可以是资源创造期,也可以是资源有效期,最好
41、按照ISO8601W3CDTF写入日期数值。(8)资源类型(Resource Type)定义:资源内容的实质类型、样式。说明:该项包括表明范畴、功能、种类、层次的陈述性语言,建议根据已经有的受控词表标识(例如DCMI Type Vocabulary)(9)格式(Format)定义:资源的物质或数字的表现形式。说明:格式包括资源载体类型、尺寸、大小。它可以区分为:软件、硬件、其它显示及管理资源的设备,例如尺寸和使用期限。建议使用受控词表,例如:互联网文档类型目录对于计算机文档格式的界定。(10)标识(Resource Identifier)定义:在相关资源中可以反映某一资源唯一特征的标识符。说明
42、:最好来自正式的(规范的)标识系统的字符串或数码。如:URI、URL、DOI(Digital Object Identifier)、ISBN,使用这些规范性标识系统,但又不局限于这些标识系统。(11)来源(Source)定义:标明资源来自哪里。说明:现有的资源可以是原文的含义,也可以是其中一部分。建议使用规范化标识系统的字符串或数码。(12)语言(language)定义:资源知识信息内容使用的语言。说明:建议使用RFC3066,结合ISO639,使用23个字符的语言标签及附标签,例如“英语”“en”或“eng”,“enGB”(英国人用的英语)。(13)关联(Relation)定义:与其它资源的
43、关系。说明:建议使用规范化标识系统的字符串或数码。(14)覆盖范围(Coverage)定义:资源内容的程度与范围。说明:覆盖范围包括:地理位置(地名、地理坐标点)、时间(时代符号、日期、时区)、管辖区。建议使用受控词表,例如:地名字典,规范化的时空符号。(15)权限(Rights)定义:资源拥有的或被赋予的权限信息。说明:可以是权限管理标识与陈述,或资源管理服务器的标识。如果资源中权限元素空缺,不可以凭空捏造。该项包括资源权限管理状况,或提供以下资源管理服务状况的信息:知识产权(IPR)、版权、以及各种所有权。如果资源中权限元素空缺,不可对于资源拥有或赋予的权限作任何假设与推测。DC的元数据元
44、素类型内 容知识产权资源属性覆盖范围其他责任者日期描述创建者格式类型出版者标识关联权限语言来源主题题名 举例(1)题名Title“中国藏书文化”(2)创建者(作者)Creator“数字图书馆课题组”(3)主题Subject“奥运会”(4)描述Description研究了信息商品的特征、信息商品的价值、信息商品的交换价值,信息商品交换价值的判断模式。作者在论文中拟出了确定信息商品交换价值的计算公式。(5)出版者Publisher“中华书局”(6)其他责任者见:Creator(7)日期Date“20030728”(8)资源类型Type“图象”(9)格式Format“图象JPEG”Title“黄山迎
45、客松”Identifier“http:/ 1996”RC607.A26W574 1996的新版(电子版)(12)语言languageen或者language“en;fr”或者language“primarily English,with some abstracts also in French”(13)关联Title“数字图书馆”Relation“教育部推荐九种图书馆学教材之一”(14)覆盖范围Coverage=“18世纪”Coverage=“陕西北部”(15)权限管理Rights=“Access limited to members”5.2.3 数字图书馆系统的结构模型数字图书馆系统的结构
46、模型 综合美国国家数字图书馆计划的试验模型和我国各图书馆试验模型,并考虑我国的实际情况,这里构建一个数字图书馆的结构模型,见下图。这是一个面向对象的、分布式的网络结构模式,它可适应多种不同的计算机系统,是由用户界面、调度系统(预处理系统)、检索系统、图书馆服务器、对象库和资源加工系统六个部分组成的数字图书馆系统。用户界面用户界面是用户与数字图书馆的接口。用户界面有两种类型:供图书馆读者使用的和面向最终用户使用的用户界面。用户界面与客户服务器相连,该服务器管理数字对象间的关系,组织数字对象信息,管理用户使用情况等。图书馆工作人员使用的用户界面,要设计成一种管理工具,它能生成一种编辑器,可存取、增
47、加、删除数字对象。在NDLP项目中,每个用户界面包括两个部分:一个标准的Internet浏览器,被用于用户的真实交互;另一个浏览器与客户服务软件相连,提供浏览器与本系统其他部分的中介功能。用户界面应有如下功能:可支持各种浏览器;提供管理接口,以生成、编辑、查询、删除数字对象(图书馆员专用);可操作复杂的数字对象,把数字对象间的联系变换为html hyperlinks的模式;能处理调度码,识别数字对象的调度码(图书馆员专用);对元数据可查重,以便存入新对象(图书馆员专用);允许用户查询含有其他数字对象的信息;使用容易、直观,用户能方便存取数字对象;用户可以自由使用调度码的基本条款和条件或者查询方
48、法,调度码的识别等;数字对象结构对用户是不透明的。二、查询系统查询步骤:第一步是检索符合条件的数字照片,返回结果是数字对象清单。第二步是用户选择浏览数字化图片,返回结果是一个命中结果的清单。该清单标识了基本的元数据信息,如题名、责任者、载体类型、来源、简要说明,常有拇指图或小图符,可以在其中选择用户确实需要的结果。第三步是用户最终获取有关图片对象。三、调度系统调度码调度码在数字图书馆系统中,用调度码识别数字对象和对象库,作为一种数字对象的标识符,用于确认数字资源的唯一性,并对数字对象进行定位。调度码作为长期要使用的名称,需要一个权威机构制定命名规则和命名。调度码由命名管理机构创建,其管理设备被
49、授权创建和编辑调度码。调度系统是判断、识别和操控调度码的系统,该系统是一个存储调度码和相关数据的分布式计算机系统,它可用于定位或访问由调度码命名的项目。四、图书馆服务器图书馆服务器 图书馆服务器是数字图书馆管理的核心,其功能包括用户信息的管理、信息对象的索引、访问权限的控制和用户查询请求的执行。图书馆服务器从信息对象服务器中获取符合检索要求的信息对象,并将其传送给图书馆用户。图书馆用户既可从书目数据库查找文献资料线索而获取原始文献,也可以直接检索数字对象库,获取多媒体资料 五、对象库对象库结构对象库结构对象库是由对象库外层、永久存储对象信息层、对象库管理层组成的三层结构。对象库外层:是对象库与
50、外部接口的部分,它执行对象库访问协议(RAP)协议,进行数字对象内部与外部格式的转换,管理版权和权限。永久存储层:对象库的信息在该层永久存储,实现永久存储是完全与外层分隔的。可通过RAP界面与之联系。永久存储层的执行,对外部是完全隐蔽的,而对象库外层被明确设计以便与范围非常广泛的永久存储层协同工作。对象管理层:对象管理层在永久存储层所提供的服务设施与对象库外层所需的面向对象的功能之间提供一种接口。该层实现数字对象和它们的存储位置之间的映射以及为可靠性操作提供系统级服务。对象库访问协议对象库访问协议对象库通过库存取协议RAP与外界交互,也就是说所有访问对象库的操作活动,都须先执行RAP协议。有下