1、L o g oL o g o第第12章章 数字图书馆信息组织数字图书馆信息组织v数字图书馆是以数字形式去存储大量的信数字图书馆是以数字形式去存储大量的信息,并能对存储的信息资源进行高效的操息,并能对存储的信息资源进行高效的操作,如收集、选择、组织、检索提供访问作,如收集、选择、组织、检索提供访问接口、信息保护等。接口、信息保护等。12.1数字图书馆概述数字图书馆概述v12.1.1数字图书馆的概念数字图书馆的概念v数字图书馆数字图书馆(Digital Library)的概念,最早的概念,最早可以上溯到可以上溯到1975年年R.W.Christian在在电电子图书馆:书目数据库:子图书馆:书目数据
2、库:1975-1976一书一书中提出电子图书馆,一般认为电子图书馆中提出电子图书馆,一般认为电子图书馆是数字图书馆的早期提法。是数字图书馆的早期提法。12.1数字图书馆概述数字图书馆概述v12.1.1数字图书馆的概念数字图书馆的概念v数字图书馆是由现代高新技术所支持的数数字图书馆是由现代高新技术所支持的数字信息资源系统,以数字形式去存储大量字信息资源系统,以数字形式去存储大量的信息并能对存储的信息资源进行高效的的信息并能对存储的信息资源进行高效的操作,如收集、选择、组织、检索、提供操作,如收集、选择、组织、检索、提供访问接口、信息保护等。信息载体的数字访问接口、信息保护等。信息载体的数字化、信
3、息传播的网络化、信息资源共享化、化、信息传播的网络化、信息资源共享化、服务项目的用户化是数字图书馆的重要特服务项目的用户化是数字图书馆的重要特征,征,12.1数字图书馆概述数字图书馆概述v12.1.2数字图书馆的特征数字图书馆的特征v1数字图书馆信息资源特点数字图书馆信息资源特点v从信息组织的角度来看,数字图书馆的信从信息组织的角度来看,数字图书馆的信息资源具有以下一些特征:息资源具有以下一些特征:v(1)经过选择的数字化信息资源经过选择的数字化信息资源v(2)多媒体的信息资源多媒体的信息资源v(3)海量的信息资源海量的信息资源v(4)分布式的信息资源分布式的信息资源v(5)按需提供的信息资源
4、按需提供的信息资源12.1数字图书馆概述数字图书馆概述v12.1.2数字图书馆的特征数字图书馆的特征v2数字图书馆信息组织的特点数字图书馆信息组织的特点v(1)以用户为中心以用户为中心v(2)采用自动化手段对信息资源进行加工采用自动化手段对信息资源进行加工v(3)提供对信息内容的智能检索服务提供对信息内容的智能检索服务12.1数字图书馆概述数字图书馆概述v12.1.3国外数字图书馆的发展概况国外数字图书馆的发展概况v1992年美国在制定年美国在制定“高性能计算机与通信高性能计算机与通信(HPCC)”国家攻关项目中,将发展数字图国家攻关项目中,将发展数字图书馆列入书馆列入“国家级挑战国家级挑战”
5、。v除了美国,英、法、日、德、加等国也都除了美国,英、法、日、德、加等国也都非常重视数字图书馆的研制与开发,纷纷非常重视数字图书馆的研制与开发,纷纷制定了本国的信息社会发展计划,展开了制定了本国的信息社会发展计划,展开了对数字图书馆的研究。对数字图书馆的研究。v从国外发展看、数字图书馆建设必须以高从国外发展看、数字图书馆建设必须以高新技术作支撑。新技术作支撑。12.1数字图书馆概述数字图书馆概述v12.1.4我国数字图书馆的进展概况我国数字图书馆的进展概况v我国从我国从20 世纪世纪90 年代后期开始了数字图书馆的年代后期开始了数字图书馆的实质性研制开发。实质性研制开发。v1997 年年8 月
6、,国家图书馆、上海图书馆等月,国家图书馆、上海图书馆等7个图个图书馆联合承担了国家重点科技项目书馆联合承担了国家重点科技项目中国试验中国试验型数字式图书馆,在我国创建了一个分布式、可型数字式图书馆,在我国创建了一个分布式、可扩展、可互操作的、内容资源横跨全国扩展、可互操作的、内容资源横跨全国7个省市个省市3 0个以上的数字资源库群的试验型数字图书馆,个以上的数字资源库群的试验型数字图书馆,并在因特网上实现了良好的运行。并在因特网上实现了良好的运行。v2000年年6月月30日,中国数字图书馆网站正式开通。日,中国数字图书馆网站正式开通。12.1数字图书馆概述数字图书馆概述v12.1.4我国数字图
7、书馆的进展概况我国数字图书馆的进展概况v(1)数字式图书馆试验项目数字式图书馆试验项目v (2)基于特征的多媒体信息检索系统的研究基于特征的多媒体信息检索系统的研究开发项目开发项目v (3)SGML的图书馆应用的图书馆应用v(4)中国试验型数字式图书馆项目中国试验型数字式图书馆项目v(5)知识网络知识网络数字图书馆系统工程项目数字图书馆系统工程项目12.2数字图书馆结构数字图书馆结构v12.2.1数字图书馆系统的基本结构数字图书馆系统的基本结构v数字图书馆系统从逻辑结构来看主要由对数字图书馆系统从逻辑结构来看主要由对象数据库、元数据库、数据加工子系统、象数据库、元数据库、数据加工子系统、查询服
8、务子系统、调度子系统等组成。查询服务子系统、调度子系统等组成。(如如图图12-1)v 12.2数字图书馆结构数字图书馆结构v12.2.1数字图书馆系统的基本结构数字图书馆系统的基本结构v其中,元数据库和对象数据库是数字图书其中,元数据库和对象数据库是数字图书馆的资源库,存储和管理数字对象的数据馆的资源库,存储和管理数字对象的数据体、元数据及其他信息。资源库常常分布体、元数据及其他信息。资源库常常分布于不同地点。于不同地点。12.2数字图书馆结构数字图书馆结构v12.2.1数字图书馆系统的基本结构数字图书馆系统的基本结构v数据加工子系统负责对数字信息数据加工子系统负责对数字信息(数字化的数字化的
9、文本、图片、声音、影像等文本、图片、声音、影像等)进行加工整进行加工整理,理,并将描述数字信息的元数据并将描述数字信息的元数据(即数字对即数字对象的象的元数据元数据)归人元数据库,归人元数据库,12.2数字图书馆结构数字图书馆结构v12.2.1数字图书馆系统的基本结构数字图书馆系统的基本结构v查询服务子系统负责为用户提供查询服务。查询服务子系统负责为用户提供查询服务。v调度子系统是一个为数字图书馆资源提供调度子系统是一个为数字图书馆资源提供分布式目录服务的计算机系统。分布式目录服务的计算机系统。12.2数字图书馆结构数字图书馆结构v12.2.2数字图书馆的信息体系结构数字图书馆的信息体系结构v
10、CSTR最重要的贡献是提出了数字图书馆体最重要的贡献是提出了数字图书馆体系结构建设的八条原则性问题:系结构建设的八条原则性问题:v(1)统一对数字图书馆有关概念的规范统一对数字图书馆有关概念的规范v(2)作为基础的体系结构应和保存在数字图作为基础的体系结构应和保存在数字图书馆中的信息内容相分离书馆中的信息内容相分离v(3)名字和标识符是数字图书馆的基础建构名字和标识符是数字图书馆的基础建构块块 12.2数字图书馆结构数字图书馆结构v12.2.2数字图书馆的信息体系结构数字图书馆的信息体系结构v(4)数字图书馆数字对象的构成数字图书馆数字对象的构成v(5)数字图书馆对象使用时和存储时的形态数字图
11、书馆对象使用时和存储时的形态可能完全不同可能完全不同v(6)仓储必须保管好所特有的信息仓储必须保管好所特有的信息v(7)用户需要的是供人利用的知识作品,而用户需要的是供人利用的知识作品,而非供机器处理的数字对象非供机器处理的数字对象v(8)数字图书馆的技术框架存在于法律和社数字图书馆的技术框架存在于法律和社会的框架之内会的框架之内12.2数字图书馆结构数字图书馆结构v12.2.3数字图书馆体系结构的评价标准数字图书馆体系结构的评价标准v数字图书馆体系结构的评价标准有很多,数字图书馆体系结构的评价标准有很多,但应该包含以下的内容:但应该包含以下的内容:v(1)开放性开放性v(2)互操作性互操作性
12、v(3)扩展性扩展性v(4)可伸缩性可伸缩性12.3数字图书馆信息组织的基本原理数字图书馆信息组织的基本原理与方法与方法v12.3.1数字图书馆信息组织的基本原则数字图书馆信息组织的基本原则 v信息资源是数字图书馆建立的基础,对数信息资源是数字图书馆建立的基础,对数字图书馆信息资源组织时应遵循以下几个字图书馆信息资源组织时应遵循以下几个原则:原则:v(1)科学性原则。科学性原则。v(2)系统性原则。系统性原则。v(3)标准化原则。标准化原则。v(4)多维揭示与非线性组织原则。多维揭示与非线性组织原则。12.3数字图书馆信息组织的基本原理数字图书馆信息组织的基本原理与方法与方法v12.3.1数字
13、图书馆信息组织的基本原则数字图书馆信息组织的基本原则 v(5)选择性与完备性原则。选择性与完备性原则。v(6)共享性原则。共享性原则。v(7)安全性原则。安全性原则。v(8)知识组织的原则。知识组织的原则。12.3数字图书馆信息组织的基本原理数字图书馆信息组织的基本原理与方法与方法v12.3.2数字图书馆信息组织过程与框架数字图书馆信息组织过程与框架v数字图书馆资源组织主要要经过以下几个数字图书馆资源组织主要要经过以下几个步骤:步骤:v(1)规划规划v(2)收集、整理收集、整理v(3)描述描述v(4)标引标引v(5)归档归档12.3数字图书馆信息组织的基本原理数字图书馆信息组织的基本原理与方法
14、与方法v12.3.3数字图书馆的信息组织方法数字图书馆的信息组织方法v 1 分类标引法分类标引法v 数字图书馆在分类体系的结构及类目的展开上有很大的改进,数字图书馆在分类体系的结构及类目的展开上有很大的改进,主要表现在:主要表现在:v 重视以重视以事物为中心事物为中心设置类目,根据用户的需求,按问题组设置类目,根据用户的需求,按问题组织相应的资源;织相应的资源;v 多维展开类目多维展开类目,对于具有从属于多个上位类的类目,分别,对于具有从属于多个上位类的类目,分别在相应的类目下予以展开;在相应的类目下予以展开;v 利用利用超文本技术超文本技术连接类目,有效反映知识之间的联系,以连接类目,有效反
15、映知识之间的联系,以利于对资源的选择查找;利于对资源的选择查找;v 及时调整类目的设置,及时调整类目的设置,动态维护动态维护分类体系。分类体系。12.3数字图书馆信息组织的基本原理数字图书馆信息组织的基本原理与方法与方法v12.3.3数字图书馆的信息组织方法数字图书馆的信息组织方法v2主题标引法主题标引法12.4数字图书馆的信息检索数字图书馆的信息检索v12.4.1数字图书馆数字信息的检索数字图书馆数字信息的检索v文本信息的检索,就是将文本中的每个字、文本信息的检索,就是将文本中的每个字、词都进行标引,提供检索。目前有两种方词都进行标引,提供检索。目前有两种方式式v1文本信息的检索文本信息的检
16、索12.4数字图书馆的信息检索数字图书馆的信息检索v12.4.1数字图书馆数字信息的检索数字图书馆数字信息的检索v2图像检索方法图像检索方法v(1)基于图像可视特征的检索方法:利用计算基于图像可视特征的检索方法:利用计算机分析图像在颜色、纹理、形状等方面的特机分析图像在颜色、纹理、形状等方面的特征,征,作为图像的内容进行匹配、查找。作为图像的内容进行匹配、查找。v(2)基于对象和区域的检索方法:利用图像的基于对象和区域的检索方法:利用图像的全局和局部特征,如总的色调、所包含的对象全局和局部特征,如总的色调、所包含的对象的数目、图像的总体视觉结构等特征进行检索。的数目、图像的总体视觉结构等特征进
17、行检索。12.4数字图书馆的信息检索数字图书馆的信息检索v12.4.1数字图书馆数字信息的检索数字图书馆数字信息的检索v(3)基于综合特征及其关系的检索方法:将基于综合特征及其关系的检索方法:将上述两种基于内容特征的检索和语义检索上述两种基于内容特征的检索和语义检索的方法结合起来进行复杂的检索,实现图的方法结合起来进行复杂的检索,实现图像的全内容检索。像的全内容检索。12.4数字图书馆的信息检索数字图书馆的信息检索v12.4.1数字图书馆数字信息的检索数字图书馆数字信息的检索v3视频检索方法视频检索方法v(1)视频分割。视频分割。v(2)视频聚类。视频聚类。v(3)关键帧抽取。关键帧抽取。v(
18、4)运动特性抽取。运动特性抽取。v(5)视频检索。视频检索。12.4数字图书馆的信息检索数字图书馆的信息检索v12.4.1数字图书馆数字信息的检索数字图书馆数字信息的检索v4音频检索方法音频检索方法v(1)语音检索方法。语音检索是以语音为中语音检索方法。语音检索是以语音为中心的检索,采用语音识别等处理技术。心的检索,采用语音识别等处理技术。v利用语音识别技术进行检索利用语音识别技术进行检索v利用子词单元进行检索。利用子词单元进行检索。v利用识别关键词进行检索。利用识别关键词进行检索。12.4数字图书馆的信息检索数字图书馆的信息检索v12.4.1数字图书馆数字信息的检索数字图书馆数字信息的检索v
19、(2)音乐检索。在检索系统中,音乐分为两音乐检索。在检索系统中,音乐分为两种类型:结构化的音乐和基于样本的音乐。种类型:结构化的音乐和基于样本的音乐。v结构化音乐的检索。结构化音乐的检索。v基于样本的音乐检索。基于样本的音乐检索。12.4数字图书馆的信息检索数字图书馆的信息检索v12.4.2数字图书馆用户获取信息的模式数字图书馆用户获取信息的模式v用户浏览信息的方式主要有三种:用户浏览信息的方式主要有三种:v(1)平坦浏览平坦浏览v(2)结构向导浏览结构向导浏览v(3)超文本浏览超文本浏览12.5数字图书馆实例:美国国会图书数字图书馆实例:美国国会图书馆的数字图书馆馆的数字图书馆v20 世纪世
20、纪80 年代后期,美国就率先开始了数字图年代后期,美国就率先开始了数字图书馆的研究和建设,书馆的研究和建设,“美国记忆美国记忆”(American Memory)是美国国会图书馆的数字图书馆试验计是美国国会图书馆的数字图书馆试验计划,从划,从1989 1994 年,它选择并复制了一部年,它选择并复制了一部分收藏,以数字化的形式在美国国内发布,向用分收藏,以数字化的形式在美国国内发布,向用户提供取自户提供取自100 多个历史收藏的多个历史收藏的700 多万份数字多万份数字化资料,这些资料包括数字化的历史文本、照片、化资料,这些资料包括数字化的历史文本、照片、地图、视频、音频等各种媒体形式。地图、
21、视频、音频等各种媒体形式。v美国国家数字图书馆计划建立在美国国家数字图书馆计划建立在“美国记忆美国记忆”成成功功的基础上,将上百万收藏品转换为数字形式并的基础上,将上百万收藏品转换为数字形式并通过因特网访问。通过因特网访问。12.5数字图书馆实例:美国国会图书数字图书馆实例:美国国会图书馆的数字图书馆馆的数字图书馆v12.5.1“美国记忆美国记忆”采用的文件格式采用的文件格式v对文本采用通用标记语言标准对文本采用通用标记语言标准(Standard for General Markup Language,SGML)编码或采用可移植文档格式编码或采用可移植文档格式(Portable Documen
22、t Format,PDF)。v对图像照片采用标签图像文件格式对图像照片采用标签图像文件格式(Tag Image File Format,TIFF)存储或采用联存储或采用联合图像专家组合图像专家组(Joint Photo-graphic Experts Group,J PEG)编码压缩存储。编码压缩存储。12.5数字图书馆实例:美国国会图书数字图书馆实例:美国国会图书馆的数字图书馆馆的数字图书馆v12.5.1“美国记忆美国记忆”采用的文件格式采用的文件格式v对于没有行业标准的地图数字文件,则对于没有行业标准的地图数字文件,则采用新开发的高清晰图像库采用新开发的高清晰图像库(Multiresolu
23、tion seamless image database,Mrsid)格式技术。格式技术。v对声音文件,采用供下载后使用的微软对声音文件,采用供下载后使用的微软公司声音格式公司声音格式WAVE 和供在线实时传输的和供在线实时传输的RealAudio 两种格式存储。两种格式存储。12.5数字图书馆实例:美国国会图书数字图书馆实例:美国国会图书馆的数字图书馆馆的数字图书馆v12.5.1“美国记忆美国记忆”采用的文件格式采用的文件格式v对于高清晰度视频动画资源采用运动图对于高清晰度视频动画资源采用运动图像专家组像专家组(Motion Pictures Experts Group,MPEG)格式存储,
24、对于清晰度低格式存储,对于清晰度低的动画则采用动态影像的的动画则采用动态影像的QuickTime 格式。格式。12.5数字图书馆实例:美国国会图书数字图书馆实例:美国国会图书馆的数字图书馆馆的数字图书馆v12.5.2“美国记忆美国记忆”的信息检索和浏览的信息检索和浏览v“美国记忆美国记忆”采用了多种信息组织方法,采用了多种信息组织方法,提供多种检索、浏览方式。提供多种检索、浏览方式。【本章习题本章习题】v1.什么是数字图书馆?它有哪些特征?什么是数字图书馆?它有哪些特征?v2.结合其它资料,谈谈我国数字图书馆的结合其它资料,谈谈我国数字图书馆的进展如何?如何发展我国的数字图书馆事进展如何?如何
25、发展我国的数字图书馆事业?业?v3.试述数字图书馆的基本结构和信息体系试述数字图书馆的基本结构和信息体系结构。结构。v4.数字图书馆的评价有哪些标准?数字图书馆的评价有哪些标准?v5.数字图书馆信息组织的基本原则是什数字图书馆信息组织的基本原则是什么?么?【本章习题本章习题】v6.数字图书馆信息组织过程与框架是什么?数字图书馆信息组织过程与框架是什么?v7.数字图书馆的信息组织方法有哪些?数字图书馆的信息组织方法有哪些?v8.数字图书馆各类信息各有什么检索方法?数字图书馆各类信息各有什么检索方法?v9.数字图书馆用户获取的信息有哪些模式?数字图书馆用户获取的信息有哪些模式?v10.请分析美国记忆请分析美国记忆”对美国国民教育的发展对美国国民教育的发展有什么样的作用有什么样的作用?“美国记忆美国记忆”对我国数字图对我国数字图书馆建设有什么启发?书馆建设有什么启发?L o g oL o g oC l i c k t o e d i t c o m p a n y s l o g a n .