1、 文献信息资源是知识的宝库 文献检索是开启知识宝库的钥匙 美国化学文摘封面上醒目的印着:Key To The Worlds Chemical Literature 自称是“打开世界化学文献的钥匙”形象地说明文献检索的“钥匙”作用 医学文献检索与利用 郑州大学图书馆郑州大学图书馆 第四讲:计算机信息检索基础第四讲:计算机信息检索基础 一、概念一、概念 计算机信息检索,即利用计算机存贮和检索计算机信息检索,即利用计算机存贮和检索信息的过程。信息的过程。信息存贮信息存贮是将文献、数值、事实等按一定的是将文献、数值、事实等按一定的格式输入到计算机中,加工处理成可供检索的数格式输入到计算机中,加工处理成
2、可供检索的数据库。据库。信息检索信息检索是将检索提问式按一定的要求输入是将检索提问式按一定的要求输入计算机中,经计算机系统与已存贮在计算机中的计算机中,经计算机系统与已存贮在计算机中的数据库进行匹配运算,然后将符合检索提问的数数据库进行匹配运算,然后将符合检索提问的数据按要求的格式输出。据按要求的格式输出。二、计算机信息检索系统的构成二、计算机信息检索系统的构成 计算机信息检索系统通常由计算机硬件、检索软件、数据库和通信网络等软硬件设备构成。其中数据库是计算机信息检索系统的核心。数据库的质量直接影响计算机信息检索系统的功能和效率。对数据库的了解是掌握计算机信息检索技术的前提。三、数据库的概念与
3、结构三、数据库的概念与结构 数据库是指在计算机存贮设备上按一定方式存贮的相互关联的文献信息集合,它可以由一个或多个文档组成。文献信息数据库由文档、记录、字段三个层次构成。1、文档(、文档(File)文档由若干记录构成。是指数据库中的顺排文档和倒文档由若干记录构成。是指数据库中的顺排文档和倒排文档。排文档。顺排文档顺排文档是数据库的主体,又称主文档,它按每条是数据库的主体,又称主文档,它按每条记录的顺序号大小排列。检索结果都来自于顺排文档。记录的顺序号大小排列。检索结果都来自于顺排文档。倒排文档倒排文档是指数据库中的主题词索引、著者索引、是指数据库中的主题词索引、著者索引、刊名索引等,它们按索引
4、词的字顺排列。刊名索引等,它们按索引词的字顺排列。检索时,计算机按输入检索词的字顺先从指定的倒排文检索时,计算机按输入检索词的字顺先从指定的倒排文档中找到相匹配的索引词,然后根据索引词后的记录顺序号档中找到相匹配的索引词,然后根据索引词后的记录顺序号到顺排档中调出相应的记录。到顺排档中调出相应的记录。许多大型数据库往往包含数以万计的记录,为了方便用许多大型数据库往往包含数以万计的记录,为了方便用户检索,常按学科、专业或收录文献的先后时间等,将数据户检索,常按学科、专业或收录文献的先后时间等,将数据库分成若干个文档。一个文档可以构成一个数据库,也可多库分成若干个文档。一个文档可以构成一个数据库,
5、也可多个文档共同构成一个大型数据库。个文档共同构成一个大型数据库。2、记录、记录(Record)记录是由若干字段组成的文献单元,是记录是由若干字段组成的文献单元,是数据库中的基本文献单元。一条记录在数据数据库中的基本文献单元。一条记录在数据库中记录着一篇文献的相关信息。库中记录着一篇文献的相关信息。例如:在书目型数据库中,一条记录相例如:在书目型数据库中,一条记录相当于一条题录或文摘;在全文型数据库中,当于一条题录或文摘;在全文型数据库中,一条记录相当于一篇完整的文献;在其它类一条记录相当于一篇完整的文献;在其它类型数据库中,一条记录则代表一个信息单元。型数据库中,一条记录则代表一个信息单元。
6、记录越多,数据库的容量就越大。记录越多,数据库的容量就越大。3 3、字段(、字段(FieldField)字段是构成记录的基本单元,是对文献某一字段是构成记录的基本单元,是对文献某一方面的特征(包括外表特征和内容特征)进行描方面的特征(包括外表特征和内容特征)进行描述的结果。述的结果。例如:题名、作者、作者地址、出版年、来例如:题名、作者、作者地址、出版年、来源(出处)、主题词、文摘等字段是书目数据库源(出处)、主题词、文摘等字段是书目数据库中必备字段。为识别每一个字段所表达的文献特中必备字段。为识别每一个字段所表达的文献特征,通常每个字段都有固定的名称和缩写(或称征,通常每个字段都有固定的名称
7、和缩写(或称字段标识符),如,题名字段的标识符为字段标识符),如,题名字段的标识符为TITI,作,作者字段的标识符为者字段的标识符为AUAU等。等。字段标识符具有检索的功能,参与编制检索字段标识符具有检索的功能,参与编制检索式,因此,对它要有所了解和掌握。式,因此,对它要有所了解和掌握。四、数据库的类型四、数据库的类型 依据数据库中存贮的信息内容可将其分依据数据库中存贮的信息内容可将其分为以下三种类型:为以下三种类型:1、文献型数据库、文献型数据库 文献型数据库是指以各种文献信息为文献型数据库是指以各种文献信息为存贮内容的数据库。存贮内容的数据库。书目数据库书目数据库 全文数据库全文数据库 图
8、像数据库图像数据库 多媒体数据库多媒体数据库 文献型数据库具有文献型数据库具有结构复杂、数据量大、结构复杂、数据量大、制作要求高、使用广泛制作要求高、使用广泛等特点,是人们获取文等特点,是人们获取文献信息的主要信息源。献信息的主要信息源。2、数值型数据库、数值型数据库 数值型数据库是以数值方式表示的数据数值型数据库是以数值方式表示的数据为存贮内容的数据库。包括各种统计数据、为存贮内容的数据库。包括各种统计数据、科学实验数据、科学测量数据等。例如,医科学实验数据、科学测量数据等。例如,医学上使用的化学制剂或药物的各种理化参数、学上使用的化学制剂或药物的各种理化参数、人体生理上的各种数值等均可建立
9、数值型数人体生理上的各种数值等均可建立数值型数据库。据库。这类数据库除存贮数值之外,还存贮对这类数据库除存贮数值之外,还存贮对应的运算公式和规则应的运算公式和规则,系统按用户的要求作系统按用户的要求作某些必要的计算,为用户提供能够直接使用某些必要的计算,为用户提供能够直接使用的数值型信息。的数值型信息。3、事实型数据库、事实型数据库 事实型数据库是以事物发展过程中产生的事实型数据库是以事物发展过程中产生的事实性信息为存贮内容的数据库。如自然资源事实性信息为存贮内容的数据库。如自然资源数据库、人口数据库、名人数据库和机构名录数据库、人口数据库、名人数据库和机构名录数据库等。数据库等。这类数据库除
10、存贮基本事实数据外,也存这类数据库除存贮基本事实数据外,也存贮数学运算和逻辑运算规则,能同时提供文本贮数学运算和逻辑运算规则,能同时提供文本信息和数值数据。用户只要通过人物、机构或信息和数值数据。用户只要通过人物、机构或事物名称及有关事项进行检索,就可获得特定事物名称及有关事项进行检索,就可获得特定的事实或数值信息。的事实或数值信息。五、计算机信息检索技术五、计算机信息检索技术 计算机信息检索技术,是指由计算机计算机信息检索技术,是指由计算机将输入的检索表达式(用户检索提问)与将输入的检索表达式(用户检索提问)与检索系统中存储的文献信息特征标识及其检索系统中存储的文献信息特征标识及其逻辑组配关
11、系进行类比、匹配的运算方式逻辑组配关系进行类比、匹配的运算方式与规则。与规则。常用的文本信息检索技术有常用的文本信息检索技术有布尔逻辑布尔逻辑检索、位置检索、截词检索、限制检索检索、位置检索、截词检索、限制检索等。等。1、布尔逻辑检索技术、布尔逻辑检索技术 是利用布尔逻辑运算符来表达检索词之间的逻是利用布尔逻辑运算符来表达检索词之间的逻辑运算关系的检索方法。常用的有逻辑与(辑运算关系的检索方法。常用的有逻辑与(AND)、)、逻辑或(逻辑或(OR)、逻辑非()、逻辑非(NOT)三种类型。)三种类型。逻辑与:逻辑与:用于表达概念相交关系的一种组配。用于表达概念相交关系的一种组配。检索式写成检索式写
12、成A AND B,表示检索的文献中必须同时,表示检索的文献中必须同时包含检索词包含检索词A和检索词和检索词B的文献才是命中文献。的文献才是命中文献。作用:作用:是对检索词加以限定,用于缩小检索范是对检索词加以限定,用于缩小检索范围,减少命中文献量,提高查准率。围,减少命中文献量,提高查准率。逻辑或:逻辑或:用于表达概念并列关系的一种组用于表达概念并列关系的一种组配。检索式写成配。检索式写成A OR B,表示检索的文献中包含,表示检索的文献中包含检索词检索词A或包含检索词或包含检索词B,或者同时包含检索词,或者同时包含检索词A或检索词或检索词B的文献为命中文献。的文献为命中文献。作用:作用:是扩
13、大检索范围,增加命中文献量,是扩大检索范围,增加命中文献量,提高查全率。提高查全率。逻辑非:逻辑非:用于表达概念排斥关系的一种组用于表达概念排斥关系的一种组配。检索式写成配。检索式写成A A NOT NOT B B,表示检索的文献中包含,表示检索的文献中包含检索词检索词A A同时不包含检索词同时不包含检索词B B的文献为命中文献。的文献为命中文献。作用:作用:也是缩小检索范围,提高查准率。也是缩小检索范围,提高查准率。逻辑非一般在检索的后期,精选文献时使用。逻辑非一般在检索的后期,精选文献时使用。逻辑运算符的运算优先级逻辑运算符的运算优先级 为了表达复杂的逻辑关系,在一个检索式中为了表达复杂的
14、逻辑关系,在一个检索式中可同时使用多个逻辑运算符,构成一个复合逻辑可同时使用多个逻辑运算符,构成一个复合逻辑检索式。为了控制最终的检索结果,规定了逻辑检索式。为了控制最终的检索结果,规定了逻辑运算符的运算次序,即运算优先级。依次为:括运算符的运算次序,即运算优先级。依次为:括号的运算优级最高(绝大多数检索系统优先处理号的运算优级最高(绝大多数检索系统优先处理括号内的检索式)、括号内的检索式)、NOT次之、次之、AND再次之、再次之、OR最低,即(最低,即()NOTANDOR。例如:。例如:(心脏瓣膜疾病(心脏瓣膜疾病OR心力衰竭)心力衰竭)AND手术并发症手术并发症 2、位置算符检索、位置算符
15、检索 位置算符位置算符 是指表示词与词之间位置是指表示词与词之间位置关系的算符,又称邻近度算符。常用位置关系的算符,又称邻近度算符。常用位置算符有算符有 nearnear、withwith、(、(nWnW)、()、(W W)等)等。作用:作用:是限制词与词之间的位置关是限制词与词之间的位置关系,弥补布尔逻辑算符只是定性规定检系,弥补布尔逻辑算符只是定性规定检索词的范围,更加明确检索词之间的逻索词的范围,更加明确检索词之间的逻辑关系,缩小检索范围,提高检索的查辑关系,缩小检索范围,提高检索的查准率。准率。A with B,表示要求检索词表示要求检索词A A和和B B必须必须同时出现在同一字段中。
16、同时出现在同一字段中。A(nW)B,表示表示A A和和B B两词相隔两词相隔n n个单个单词且前后次序不变;词且前后次序不变;n=0n=0时格式为时格式为A(W)BA(W)B。例如:例如:A near B A near B,表示要求检索词,表示要求检索词A A和和B B必必须同时出现在同一句子中,并且两词出须同时出现在同一句子中,并且两词出现的前后顺序不限。现的前后顺序不限。3 3、截词算符检索、截词算符检索 是指在检索词的合适位置进行截断,是指在检索词的合适位置进行截断,保留相同的部分,用相应的截词算符代替保留相同的部分,用相应的截词算符代替可变化部分进行检索可变化部分进行检索 。常用的截词
17、算符。常用的截词算符(又称通配符)有(又称通配符)有“?”和和“*”两种,两种,也有采用其他符号表示的。也有采用其他符号表示的。作用:作用:主要是解决一个检索词的单复主要是解决一个检索词的单复数、词性的词尾变化,词干相同而词尾不数、词性的词尾变化,词干相同而词尾不同以及英美词汇拼写差异的问题等。同以及英美词汇拼写差异的问题等。按截断的字符数量按截断的字符数量可分为可分为有限截断有限截断和和无限截断无限截断两种:两种:无限截断无限截断是指检索词与被检索词实现部分是指检索词与被检索词实现部分一致,被截断部分的字符不限。常用一致,被截断部分的字符不限。常用“*”表表示(示(*=0-n=0-n个字母)
18、。个字母)。有限截断有限截断是指检索词与被检索词只能在是指检索词与被检索词只能在指定的位置可以不一致。常用指定的位置可以不一致。常用“?”表示(?表示(?=0-1=0-1个字母)。例如,输入个字母)。例如,输入leukemileukemi?可同时?可同时检出检出leukemialeukemia、leukemicleukemic、leukemidleukemid等词的等词的记录;输入记录;输入Wom?nWom?n,可同时检出,可同时检出WomanWoman和和womenwomen这两个词的记录这两个词的记录。按照截词的位置按照截词的位置:无限截断可分为左无限截断可分为左截断(后方一致)、右截断(
19、前方一致)、截断(后方一致)、右截断(前方一致)、左右截断(中间一致)、中间截断(前后一左右截断(中间一致)、中间截断(前后一致)等四种方式。不同的检索系统有不同的致)等四种方式。不同的检索系统有不同的截词方式,但以右截断和中间截断比较常见。截词方式,但以右截断和中间截断比较常见。右截断右截断是指检索词与被检索词的词干相是指检索词与被检索词的词干相同而后缀不同。例如,输入同而后缀不同。例如,输入 computecompute*,可同,可同时检索出时检索出computecompute、computercomputer、computerizedcomputerized、computerizatio
20、ncomputerization等词的记录。等词的记录。中间截断中间截断是指检索词与被检索词的词头和词尾是指检索词与被检索词的词头和词尾相同而中间部分不同。相同而中间部分不同。例如,输入例如,输入leukleuk*icic可同时检索出可同时检索出leukemicleukemic、leukamicleukamic、leukemogenicleukemogenic等词的记录。等词的记录。截词检索截词检索是隐含的布尔是隐含的布尔“逻辑或逻辑或”(OROR)检索,)检索,其功能是减少检索词的输入量、简化检索程序、扩其功能是减少检索词的输入量、简化检索程序、扩大检索范围、防止漏检、提高查全率。在西方语言
21、大检索范围、防止漏检、提高查全率。在西方语言信息检索系统中得到广泛应用。信息检索系统中得到广泛应用。(4)限制符)限制符检索检索 限制符检索限制符检索 是将检索词或检索式限制在数据库记录是将检索词或检索式限制在数据库记录中出现的字段位置。又称为中出现的字段位置。又称为“字段检索字段检索”。作用:作用:是缩小检索范围,提高查准率。是缩小检索范围,提高查准率。常用限制符有常用限制符有“in”in”和和“=”=”。例如,。例如,gene in TIgene in TI,表示检索题名中含有表示检索题名中含有genegene一词的文献。其中一词的文献。其中“TI”TI”是题名是题名字段标识符字段标识符T
22、itleTitle的缩写的缩写。又如,。又如,pypy=2002=2002,表示检索,表示检索20022002年 发 表 的 文 献。其 中年 发 表 的 文 献。其 中“p yp y”是 出 版 年 字 段 标 识 符是 出 版 年 字 段 标 识 符Publication yearPublication year的缩写的缩写。一般情况下,数据库中记录的所有字段均可做限定字一般情况下,数据库中记录的所有字段均可做限定字段检索。在进行字段限制检索时,应参阅有关数据库的使段检索。在进行字段限制检索时,应参阅有关数据库的使用说明,避免产生误检。用说明,避免产生误检。三、检索策略的编制与调整三、检索
23、策略的编制与调整 检索策略检索策略 是指为实现检索目标而制定的全是指为实现检索目标而制定的全盘计划和方案,是对整个检索过程的谋划和指导。盘计划和方案,是对整个检索过程的谋划和指导。由于计算机信息检索是由计算机程序来控制和执由于计算机信息检索是由计算机程序来控制和执行检索匹配操作,检索者与具体的检索过程是分行检索匹配操作,检索者与具体的检索过程是分离的,因此,事前制定适宜的检索策略,是成功离的,因此,事前制定适宜的检索策略,是成功检索的关键。检索的关键。广义的检索策略广义的检索策略包括信息需求分析、选择数包括信息需求分析、选择数据库、确定检索途径和标识、编制检索表达式并据库、确定检索途径和标识、
24、编制检索表达式并准备多种检索方案和步骤等。准备多种检索方案和步骤等。狭义的检索策略狭义的检索策略包括包括确定检索词和根据需要确定检索词和根据需要运用各种运算符编制检索表达式的构思过程。运用各种运算符编制检索表达式的构思过程。检索策略编制流程图检索策略编制流程图信息需求分析信息需求分析选择数据库选择数据库选择检索途径选择检索途径换成系统检索用词换成系统检索用词编制检索式编制检索式检索检索检索结果是否满意检索结果是否满意输出检索结果输出检索结果Yes No调整检索式调整检索式 (一)信息需求分析(一)信息需求分析 信息需求分析是制定检索策略的依据。信息信息需求分析是制定检索策略的依据。信息需求按范
25、围和程度的不同,可分成三种类型:需求按范围和程度的不同,可分成三种类型:普查型:普查型:需要全面收集有关某一主题的文献需要全面收集有关某一主题的文献信息。具有普查、回溯的特点,要求尽可能高的信息。具有普查、回溯的特点,要求尽可能高的查全率。查全率。攻关型:攻关型:需要收集有关某一主题的某一特定需要收集有关某一主题的某一特定方面的文献资料,不强调查得文献的数量,但需方面的文献资料,不强调查得文献的数量,但需要查得的文献具有较强的专指性,即查准率。要查得的文献具有较强的专指性,即查准率。探索型:探索型:需要了解和掌握某一领域的最新研需要了解和掌握某一领域的最新研究动向或研究成果,要求文献具有新颖性
26、和及时究动向或研究成果,要求文献具有新颖性和及时性,即要求检索结果尽可能的新。性,即要求检索结果尽可能的新。在明确课题对查新、查全和查准要求的同时,在明确课题对查新、查全和查准要求的同时,还要明确对信息形式和内容的需求。还要明确对信息形式和内容的需求。形式需求:形式需求:包括所需文献的类型、数量、语种、包括所需文献的类型、数量、语种、年限等。年限等。内容需求:内容需求:包括检索课题涉及的学科范围、主包括检索课题涉及的学科范围、主题内容和有关主题词、关键词、分类号等,以及题内容和有关主题词、关键词、分类号等,以及它们之间的逻辑关系。它们之间的逻辑关系。在上述基础上,确定检索主题,形成若干能在上述
27、基础上,确定检索主题,形成若干能代表信息需求而且具有检索意义的主题概念。为代表信息需求而且具有检索意义的主题概念。为制定检索式做好准备。制定检索式做好准备。(二)选择数据库(二)选择数据库 选择数据库时要充分考虑其是否与信选择数据库时要充分考虑其是否与信息需求结合紧密、学科专业是否对口、信息需求结合紧密、学科专业是否对口、信息覆盖面是否广泛、揭示信息内容是否及息覆盖面是否广泛、揭示信息内容是否及时、检索功能是否完善等方面的问题时、检索功能是否完善等方面的问题。选择合适的数据库,除事先对各数据选择合适的数据库,除事先对各数据库的来源、主题内容结构作充分的调查研库的来源、主题内容结构作充分的调查研
28、究外,还需要通过对各数据库实际检索结究外,还需要通过对各数据库实际检索结果的对比评价,选择出对某一课题最为合果的对比评价,选择出对某一课题最为合适的数据库。适的数据库。(三)选择检索途径(三)选择检索途径 检索途径是指用记录的某一特征为检索切入检索途径是指用记录的某一特征为检索切入点进行检索。检索途径通常体现为字段检索。点进行检索。检索途径通常体现为字段检索。常用的计算机检索途径有:自由词(关键词)常用的计算机检索途径有:自由词(关键词)检索、主题词检索、分类检索、著者检索、引文检检索、主题词检索、分类检索、著者检索、引文检索、机构(地址字段)检索、刊名检索、限定检索、索、机构(地址字段)检索
29、、刊名检索、限定检索、默认(缺省)检索等。默认(缺省)检索等。另外,在一些大型数据库(或检索系统)的主另外,在一些大型数据库(或检索系统)的主页界面提供有:分类浏览、简单检索、高级检索、页界面提供有:分类浏览、简单检索、高级检索、专家检索等检索入口。专家检索等检索入口。(四)编制检索式(四)编制检索式 编制检索式包括选择检索词和编制检索式两编制检索式包括选择检索词和编制检索式两方面的内容方面的内容。1 1、选择检索词、选择检索词 检索词是表达信息需求和检索课题内容的基检索词是表达信息需求和检索课题内容的基本单元,也是与本单元,也是与数据库数据库中有关数据进行匹配运算中有关数据进行匹配运算的基本
30、单元。检索词选择的恰当与否,会直接影的基本单元。检索词选择的恰当与否,会直接影响着检索效果。响着检索效果。在全面分析检索课题的基础上,提炼主要概在全面分析检索课题的基础上,提炼主要概念与隐含概念,排除次要概念,以便确定和选择念与隐含概念,排除次要概念,以便确定和选择检索词。检索词。(1 1)选择检索词要遵循以下原则)选择检索词要遵循以下原则 数据库提供有规范词表时,应依据词表选主题词。数据库提供有规范词表时,应依据词表选主题词。数据库无词表或词表中无相应词时,选最常用的专业术语。数据库无词表或词表中无相应词时,选最常用的专业术语。数据库使用各种代码表示主题范畴时,应选规定的代码。数据库使用各种
31、代码表示主题范畴时,应选规定的代码。同义词、相关词、近义词、缩写词、词形变化等尽量选全。同义词、相关词、近义词、缩写词、词形变化等尽量选全。(2 2)处理好检索词切题性和匹配性的关系)处理好检索词切题性和匹配性的关系 选择较上位的概念词作为检索词,有利于提高检索结果选择较上位的概念词作为检索词,有利于提高检索结果的匹配性(查全率),但却降低了切题性(查准率)。相反,的匹配性(查全率),但却降低了切题性(查准率)。相反,选择较下位的概念词,会提高切题性,但却降低了匹配性。选择较下位的概念词,会提高切题性,但却降低了匹配性。因此,要强调哪一方,需要根据信息需求的类型和检索的具因此,要强调哪一方,需
32、要根据信息需求的类型和检索的具体情况,合理利用主题词的上、下位的关系,正确选择检索体情况,合理利用主题词的上、下位的关系,正确选择检索词。词。2、编制检索表达式、编制检索表达式 检索表达式是计算机信息检索的依据。检索表达式是计算机信息检索的依据。编制检索表达式主要是使用布尔逻辑算符、编制检索表达式主要是使用布尔逻辑算符、位置算符、截词算符、限制符等,将检索词位置算符、截词算符、限制符等,将检索词进行组配,确定检索词之间的概念关系或位进行组配,确定检索词之间的概念关系或位置关系,准确地表达课题需求的内容,以保置关系,准确地表达课题需求的内容,以保证和提高检索的查全率和查准率。证和提高检索的查全率
33、和查准率。常用的文本信息检索表达式编制方法有常用的文本信息检索表达式编制方法有以下三种:以下三种:(1)概念积木法)概念积木法 概念积木法的含义是:把检索课题剖析成概念积木法的含义是:把检索课题剖析成若干个不同的概念面,先分别对这几个概念面若干个不同的概念面,先分别对这几个概念面进行检索,并在每个概念面中尽可能全和多地进行检索,并在每个概念面中尽可能全和多地列举相关词、同义词、近义词,并用逻辑或列举相关词、同义词、近义词,并用逻辑或(OROR)连接成子检索式,)连接成子检索式,然后再用逻辑与然后再用逻辑与(ANDAND)把所有子检索式连接起来,构成一个)把所有子检索式连接起来,构成一个总检索式
34、。总检索式。这种方法能提供比较明确的检索逻辑过程,这种方法能提供比较明确的检索逻辑过程,容易理解和执行,还可部分或全部地用作保留容易理解和执行,还可部分或全部地用作保留检索。适用于较复杂的检索课题。检索。适用于较复杂的检索课题。(2)引文珠形增长法)引文珠形增长法 引文珠形增长法的含义是:从已知的关引文珠形增长法的含义是:从已知的关于检索课题的少数几个专指词开始检索,以于检索课题的少数几个专指词开始检索,以便至少检出一篇命中文献或一条相关信息,便至少检出一篇命中文献或一条相关信息,然后浏览检出的文献或信息条目,从中选出然后浏览检出的文献或信息条目,从中选出一些新的相关检索词,补充到检索式中去,
35、一些新的相关检索词,补充到检索式中去,重新进行检索,获得新的命中结果。这样反重新进行检索,获得新的命中结果。这样反复进行,直到找不到其它适合包含于检索式复进行,直到找不到其它适合包含于检索式的附加词为止,或者已经得到了数量适宜的的附加词为止,或者已经得到了数量适宜的命中结果。命中结果。这种方法具有很强的人机交互性,可以这种方法具有很强的人机交互性,可以使检索式以比较生动的方式生成并得到不断使检索式以比较生动的方式生成并得到不断丰富。丰富。(3 3)逐次分馏法(或逐步缩小法)逐次分馏法(或逐步缩小法)这种方法的含义是:先确定一个相当大的、这种方法的含义是:先确定一个相当大的、范围较广的初始检索概
36、念进行检索,然后提高范围较广的初始检索概念进行检索,然后提高检索的专指度,得到一个较小的命中结果,继检索的专指度,得到一个较小的命中结果,继续提高检索式的专指度,逐步缩小命中结果,续提高检索式的专指度,逐步缩小命中结果,直到得到满意的命中结果。直到得到满意的命中结果。逐次分馏法的特点是检索操作比较主动,逐次分馏法的特点是检索操作比较主动,漏检较少。漏检较少。(五)实施检索与检索式调整(五)实施检索与检索式调整 1 1、实施检索、实施检索 即将编制好的检索表达式,输入计算机检即将编制好的检索表达式,输入计算机检索系统,由检索系统根据检索式的指令进行逻索系统,由检索系统根据检索式的指令进行逻辑匹配
37、运算,并输出(或显示)检索结果。辑匹配运算,并输出(或显示)检索结果。由于检索课题的千差万别,检索系统的情由于检索课题的千差万别,检索系统的情况各不相同,检索人员的水平不一,所以,输况各不相同,检索人员的水平不一,所以,输入的检索表达式,往往具有较大的局限性、随入的检索表达式,往往具有较大的局限性、随机性和盲目性,有可能导致检索的失误。因此,机性和盲目性,有可能导致检索的失误。因此,应随时根据检索过程中的信息反馈情况,调整应随时根据检索过程中的信息反馈情况,调整检索式,使检索效果达到最佳。检索式,使检索效果达到最佳。2 2、检索式调整、检索式调整(按查准和查全两个原则进行)(按查准和查全两个原
38、则进行)通过缩检和增加限制,提高查准率通过缩检和增加限制,提高查准率 当检出文献量过多,且查准率较低时,可通过缩小检当检出文献量过多,且查准率较低时,可通过缩小检索范围和增加限制概念的方法对检索式进行调整。索范围和增加限制概念的方法对检索式进行调整。减少同义词或同类相关词。减少同义词或同类相关词。将自由词换成主题词,将自由词换成主题词,尽量采用专指性强的主题词。尽量采用专指性强的主题词。增加限制概念,并用逻辑与(增加限制概念,并用逻辑与(ANDAND)进行组配进行组配。选择合适的字段进行限定选择合适的字段进行限定检索检索。使用适当的位置算符使用适当的位置算符检索检索,排除误检。,排除误检。对检
39、出结果对检出结果的年限、文献类型等的年限、文献类型等进行限制。进行限制。利用逻辑非(利用逻辑非(NOTNOT)去除不必要的概念。)去除不必要的概念。通过扩检和减少限制,提高查全率通过扩检和减少限制,提高查全率 当检出文献量太少或等于零时,且查全率较低,可通过扩当检出文献量太少或等于零时,且查全率较低,可通过扩大检索范围和减少限制概念的方法对检索式进行调整。大检索范围和减少限制概念的方法对检索式进行调整。增加同义词或同类相关词,并用逻辑或(增加同义词或同类相关词,并用逻辑或(OROR)连接。)连接。降低检索词的专指度,采用上位概念词或泛指词检索。降低检索词的专指度,采用上位概念词或泛指词检索。减
40、少限制概念,少用逻辑与(减少限制概念,少用逻辑与(ANDAND)运算符,去掉一些)运算符,去掉一些次要的、专指度高、非关键的检索词。次要的、专指度高、非关键的检索词。使用主题词扩展检索,有副主题词时选用全部副主题使用主题词扩展检索,有副主题词时选用全部副主题词组配检索。词组配检索。使用截词检索,取消某些限制过严的字段限制、位置使用截词检索,取消某些限制过严的字段限制、位置算符限制。算符限制。扩大检索年限。扩大检索年限。(六)输出检索结果(六)输出检索结果 通过浏览检索系统显示的检索结果,通过浏览检索系统显示的检索结果,判断是否符合检索课题的要求,若符合要判断是否符合检索课题的要求,若符合要求,即可按检索系统提供的输出方式,根求,即可按检索系统提供的输出方式,根据需要将检索结果按一定的格式(如,题据需要将检索结果按一定的格式(如,题录、文摘或全文)联机录、文摘或全文)联机/脱机打印、下载脱机打印、下载存盘,建立个人资料库。存盘,建立个人资料库。谢 谢!