1、 0 在线教务辅导网:在线教务辅导网:http:/教材其余课件及动画素材请查阅在线教务辅导网教材其余课件及动画素材请查阅在线教务辅导网QQ:349134187 或者直接输入下面地址:或者直接输入下面地址:http:/信信 息息 检检 索索 教教 程程 王立清王立清 主编主编普通高等教育”十一五”国家级规划教材 2 介绍网络信息资源的概念 阐述网络信息资源的特点与类型论述网络信息资源的分布分析网络信息检索的原理及方法简述了网络信息检索的相关标准探讨网络信息检索的发展趋势本章要点本章要点 互联网已经在网民生活中占据一定的地位。互联网上的信息已是海量,搜索引擎则是网民在汪洋中搜寻信息的工具,是互联网
2、上不可或缺的工具和基础应用之一。在当前网络环境下,网络信息检索已成为人们获取信息的最重要方式。第9章 网络信息检索概述 3 9.1.1 9.1.1 网络信息资源的特点网络信息资源的特点网络信息资源(Network Information Resources)指可在因特网上发布、查询与存取利用的信 息 资 源 的 总 和。它 包 括 在Internet这个平台上可以获得的一切信息资源,如数据库、电子图书、电子期刊、电子报纸和其他的网站、网页等。9.1 9.1 网络网络信息资源分布信息资源分布第9章 网络信息检索概述 4 网络信息资源与传统信息资源相比,有着明显的优势:1.数量巨大,增长迅速2.内
3、容丰富,形式多样3.结构复杂,分布广泛4.开放互动,共享性强5.传播快速,利用方便6.更新速度快,动态性强7.信息使用成本低第9章 网络信息检索概述 5 网络信息资源的缺点:1.网络信息质量参差不齐,良莠不一2.分散无序,缺乏管理3.稳定性差,精确度低,缺乏安全保障第9章 网络信息检索概述 6 9.1.2 9.1.2 网络信息资源的类型网络信息资源的类型依据不同的划分标准,可以对网络信息资源做出如下的分类:按网络信息资源的媒体形式分:第9章 网络信息检索概述文本信息文本信息 图片信息图片信息 音频信息音频信息 视频信息视频信息 三维虚拟三维虚拟影像信息影像信息 7 按照人类信息交流的方式划分:
4、第9章 网络信息检索概述正式出版信息正式出版信息 半正式出版信息半正式出版信息 非正式出版信息非正式出版信息 8 按照信息的加工程度划分:第9章 网络信息检索概述一次网络信息资源一次网络信息资源 二次网络信息资源二次网络信息资源 三次网络信息资源三次网络信息资源 9 按照网络信息的内容和用途划分:第9章 网络信息检索概述普通型普通型 即时资料型即时资料型 数据资料型数据资料型 专门资料型专门资料型 10 按照信息的表现形式划分:第9章 网络信息检索概述全文型全文型 实时活动型实时活动型 书目文献型书目文献型 数值型数值型 11 按照传输协议的不同分:第9章 网络信息检索概述WWW信息资源信息资
5、源 Gopher信息资源信息资源 网络论坛网络论坛 FTP信息资源信息资源 Telnet信息资源信息资源 12 9.1.3 9.1.3 网络信息资源的分布网络信息资源的分布Internet现已成为全世界最大的信息资源库,网络信息资源可谓浩瀚无边,内容涉及各个方面。1.政府信息2.教育科研信息3.网上出版物4.网络数据库5.电子论坛和电子会议6.网上专利信息第9章 网络信息检索概述 13 Internet还有大量的会议信息、学位论文、技术标准、科技政策法规、产品样本目录、科技报告、统计数据、电子论坛、科技新闻、组织机构、通讯讨论组和数据库等,其分布特征主要体现在以下两个个方面:第9章 网络信息检
6、索概述离散性离散性 不均衡性不均衡性 14 9.2.1 9.2.1 网络信息检索原理网络信息检索原理9.2.1.1 9.2.1.1 网络信息检索及其特点网络信息检索及其特点网络信息检索(NIR-Networked Information Retrieval)代表着网络时代获取信息的重要方向。网络信息检索指通过一定的方法,从已存储的网络信息中查找与用户提问相关的信息的过程。它是计算机检索的发展和延伸,是一种基于Internet的新型的信息检索方式。9.2 9.2 网络信息检索原理与方法网络信息检索原理与方法第9章 网络信息检索概述 15 网络信息检索与传统信息检索相比,呈现出新的特点:1.检索的
7、对象得到了极大的丰富2.检索的空间得到了极大的扩展 3.检索趋于简单方便 第9章 网络信息检索概述 16 网络检索与其他类型的计算机检索形式相比,也存在一些不足,主要有:1.信息查准率比较低 2.检索带有一定的盲目性3.各种检索工具的检索方法不统一,造成了用户使用的不便第9章 网络信息检索概述 17 9.2.1.2 9.2.1.2 网络信息资源检索的原理网络信息资源检索的原理当前的网络信息通讯多采用客户端/服务器结构。第9章 网络信息检索概述用户界面网络客户端网络服务器网络服务器网络数据库数据库数据库网络信息检索的基本模型 18 9.2.2 9.2.2 网络信息检索方法网络信息检索方法在Int
8、ernet上查找信息,主要是要找到提供信息源的服务器。在网上检索信息资源的基本方法如下:1.直接浏览网址查询2.利用网络资源目录3.利用以关键词检索为主的搜索引擎4.查询网络文献数据库 5.查询网上图书馆第9章 网络信息检索概述 19 9.3.1 9.3.1 网络信息检索标准网络信息检索标准Z39.50Z39.50Z39.50是一种Client/Server体系结构下描述客户机检索服务器上数据以及获得检索结果的数据结构与交互规则的协议,是网络中的应用层协议,定义了客户机与服务器之间数据交换标准。9.3 9.3 网络信息网络信息检索相关标准检索相关标准第9章 网络信息检索概述 20 9.3.1.
9、1 Z39.509.3.1.1 Z39.50概况概况Z39.50起源于20世纪70年代美国国会图书馆、OCLC(Online Computer Library Center)、研究图书馆信息网络(Research Libraries Information Network)等的书目数据库系统互联项目。在国家信息标准化组织(National Information Standards Organization,NISO)的支持下开始了这一方面的标准化研究工作,于1988年推出第一个版本Z39.50-1988,即图书馆应用系统信息检索服务定义与协议规范(Information Retrieval
10、Service Definition and Protocol Specifications for Library Applications)。第9章 网络信息检索概述 21 9.3.1.2 Z39.509.3.1.2 Z39.50的内容及特点的内容及特点Z39.50是一种基于网络的信息检索标准,主要包括两部分:一部分是信息检索服务的定义,定义了信息检索服务的11种机制,包括Z39.50协议支持的服务功能说明和服务参数说明;另一部分是Z39.50协议的规范,包括协议控制信息定义、信息交换规则和实现协议必备的条件。第9章 网络信息检索概述 22 Z39.50协议是一种网络协议,它由控制和管理计
11、算机之间通讯过程中所涉及的格式和进程的规则所组成,具有以下特点:1.与其他面向传输层的协议不同,Z39.50是基于会话层的协议,是有态的 2.Z39.50是一种开放网络平台上的应用层协议,利用它可以使不同计算机系统之间协同工作 3.Z39.50是一种基于网络的信息检索标准,它允许用户查询远程数据库 4.Z39.50支持分布式Client/Server(客户机/服务器)模式5.Z39.50既可以采用同步方式,又可以采用异步方式进行通讯 第9章 网络信息检索概述 23 9.3.1.3 Z39.50 9.3.1.3 Z39.50的运行机制及实现模型的运行机制及实现模型Z39.50协议是由状态的、面向
12、连接的应用层协议,它描述了两个信息检索服务系统之间的交互,客户端和服务器分别被称为源端和目的端,源端和目标端的交互是在一个会话里进行的,称为Z-连接。第9章 网络信息检索概述 24 第9章 网络信息检索概述源端目的端初始化提交响应提交响应.提交请求查询响应查询请求结束客户端命中记录数、结果集名称结果集记录结果集记录查询服务器端结果集数据库Z-连接基于TCP/IPZ39.50的基本实现过程 25 早先的Z39.50协议采用了典型的两层C/S结构,其实现模型如下图所示。第9章 网络信息检索概述 26 9.3.1.4 Z39.509.3.1.4 Z39.50的主要功能的主要功能及其应用及其应用Z39
13、.50的主要目的在于定义基于客户机/服务器体系结构的数据库的查询与检索的语法,从而使一套存取标准适用于异构系统的数据。Z39.50定义的信息检索系统主要包括11种功能。第9章 网络信息检索概述 (1 1)初始化。)初始化。(2 2)查询。)查询。(3 3)检索。)检索。(4 4)结果删除。)结果删除。(5 5)浏览。)浏览。(6 6)排序。)排序。(7 7)存取控制。)存取控制。(8 8)会计)会计/资源控制。资源控制。(9 9)解释功能。)解释功能。(1010)扩展服务功能。)扩展服务功能。(1111)终止。)终止。功功 能能 27 Z39.50对国外(特别是美国等英语国家)信息系统的发展和
14、服务方式产生了重要影响,尤其在图书馆自动化领域中得到了广泛的应用。国内出现了不少自行开发的支持Z39.50图书馆集成系统同时,也引进了一些国外的大型图书馆管理集成系统。例如,广东省立中山图书馆引进并汉化了Sirsi公司的Unicorn图书馆自动化集成系统,可以利用Z39.50公共查询网关。第9章 网络信息检索概述 28 广东省立中山图书馆公共查询网关 第9章 网络信息检索概述 29 9.3.1.5 Z39.509.3.1.5 Z39.50标准的不足标准的不足作为一个开放系统互连的标准集,Z39.50的主要问题和实现的最大障碍是其定义的协议数据结构稍显简单;其次,Z39.50标准所采用的编码标准
15、主要用于有线通信和无线通信领域。而软件产品开发中很少涉及这样的“底层”开发,甚至无法看懂相关标准文献的含义;再者,Z39.50这个标准是建立在一种比较专门的通讯协议的基础上,增加了这个标准的实施中的技术复杂性。第9章 网络信息检索概述 30 9.3.2 9.3.2 其他网络信息检索标准其他网络信息检索标准实现信息源互联互操作的协议主要有两类。一类为重量级协议,如在图书馆界有较大影响的Z39.50协议,这些协议本身较复杂,往往要求在字段级实现互操作。一类为轻量级协议如OAI等,这些协议一般作为一些应用协议的基础。第9章 网络信息检索概述 31 目前正在使用或处于研究探讨的网络信息检索标准还有一些
16、,具体如下:第9章 网络信息检索概述OAI(Open Archives Initiative)AOpenURL(Open Uniform Resource Locators)B.500CLDAPLightweight Directory Access Protocol D 32 网络信息检索的发展主要体现在:智能检索技术、知识检索技术、多媒体检索技术、新一代搜索引擎技术、自然语言检索技术和基于内容的检索技术。网络信息检索服务呈现出个性化、多样化特点。9.4 9.4 网络信息网络信息检索发展趋势检索发展趋势第9章 网络信息检索概述 33 9.4.1 9.4.1 网络信息检索技术发展网络信息检索技
17、术发展第9章 网络信息检索概述智能检索技术智能检索技术 多媒体检索技术多媒体检索技术 P2PP2P检索技术检索技术 可视化检索技术可视化检索技术 语义检索技术语义检索技术 34 9.4.2 9.4.2 网络信息检索服务发展网络信息检索服务发展第9章 网络信息检索概述多样化信息检索服务多样化信息检索服务 多样化服务包括检索多样化信息形态、多样化检索语种、多样化服务包括检索多样化信息形态、多样化检索语种、服务功能多样化及本地化、一站式服务。服务功能多样化及本地化、一站式服务。个性化信息检索服务个性化信息检索服务 个性化信息服务,是针对不同用户采用不同服务策略和个性化信息服务,是针对不同用户采用不同
18、服务策略和方式提供不同信息内容的服务。方式提供不同信息内容的服务。35 9.4.3 9.4.3 网络信息检索标准发展网络信息检索标准发展标准的网络语言、网络符号和网络输出显示方式,会使网络信息的传播更加方便、快捷,有利于被用户接受与利用,实现信息资源共享。9.4.3.1 Z39.50网关随着Internet的普及,Web浏览器已经对Z39.50标准的应用范围和应用方式产生了很大的影响,为Z39.50的应用提供了另一个应用领域,即作为Web网关,为公众提供跨平台、跨服务器的虚拟目录检索服务。第9章 网络信息检索概述 36 Z39.50网关的工作流程为:(1)用户的查询请求由浏览器通过HTTP发送
19、给Web服务器。(2)Web服务器通过HTTP-Z39.50转换网关把HTTP请求转换为Z39.50请求。(3)客户进程将请求发送给本地或远程的Z39.50服务器,进而访问数据库得到查询结果。(4)以规定的格式将检索结果传送到网关。HTTP-Z39.50协议转换网关收集由Z39.50服务器返回的查询结果,整合后统一以HTML页面的形式返回给用户浏览器。第9章 网络信息检索概述 37 Z39.50-Web网关第9章 网络信息检索概述Web浏 览器mWeb服 务器请求预处理结果后处 理客户进程n数据库1数据库n.HTTPWeb浏 览器1客户进程1Z39.50-Web网关 Z39.50本 地/远程Z
20、39.50服务器n本 地/远程Z39.50服务器1 38 9.4.3.2 新一代Z39.50为了简化Z39.50,以欧美为主的一些Z39.50开发团体,对Z39.50-1995及以前的各个版本,去粗取精,并且做了大量的创新,成果合称为SRW/U,是ZING的核心所在。SRW/U集成了Web和URL技术,对Z39.50作了很大的改进,营造了一个崭新的Z39.50。9.4.3.3 STARTS 9.4.3.4 ZOBRA 9.4.3.5 CIP第9章 网络信息检索概述 39 1.和传统信息资源相比,网络信息资 源有何特点?2.网络信息资源有哪些类型,其分布 特征体现在哪些方面?3.简要分析网络信息检索的原理与方 法。4.与传统信息检索相比,网络信息检 索体现出哪些优势?5.简述网络信息资源检索服务的发展 趋势。思思 考考 题题第9章 网络信息检索概述 40 Thank You!