1、第3章 信息存取技术与信息检索方法 信息存取技术的进步信息存取技术的进步信息信息检索方法与策略检索方法与策略 信息存储与检索相关学科及发展信息存储与检索相关学科及发展 3.1 信息存取技术的进步信息存取技术的进步 光盘存储与检索技术光盘存储与检索技术 联机存取技术联机存取技术 全文存取技术全文存取技术 多媒体存取技术多媒体存取技术 超文本与超媒体存取技术超文本与超媒体存取技术 网络存取技术网络存取技术 视频存取技术视频存取技术 智能检索技术智能检索技术3.2 信息检索方法与策略 提问检索式构造提问检索式构造 检索词、提问检索式与关系算符检索词、提问检索式与关系算符 检索词检索词:信息属性的标识
2、,也是构成检索式的基本单元。:信息属性的标识,也是构成检索式的基本单元。是用户或检索者在检索活动开始前提出的字词或字符。是用户或检索者在检索活动开始前提出的字词或字符。是用于进入系统搜寻所需记录的依据。是用于进入系统搜寻所需记录的依据。提问检索式提问检索式:是一个直接面对数据库或检索系统的完整的:是一个直接面对数据库或检索系统的完整的检索条件表达式,是要求系统执行的检索语句。检索条件表达式,是要求系统执行的检索语句。关系算符关系算符:用于表示检索项在记录中出现的逻辑关系或位:用于表示检索项在记录中出现的逻辑关系或位置关系的符号,主要有逻辑算符和位置算符。置关系的符号,主要有逻辑算符和位置算符。
3、3.2 信息检索方法与策略 检索式构造规则检索式构造规则 布尔逻辑算符布尔逻辑算符 逻辑逻辑“与与”AND 或或*主要用于交叉概念或限定关系概念之间的组配。主要用于交叉概念或限定关系概念之间的组配。逻辑逻辑“或或”OR 或或+主要用于并列关系的概念组配。主要用于并列关系的概念组配。逻辑逻辑“非非”NOT 或或-主要用于排斥与选择关系的组配。主要用于排斥与选择关系的组配。布尔逻辑算符执行的优先顺序为布尔逻辑算符执行的优先顺序为NOT、AND、OR。3.2.1 检索提问式构造 位置逻辑算符:当使用文献记录中的自由词作为检位置逻辑算符:当使用文献记录中的自由词作为检索词进行检索时,词与词之间的逻辑关
4、系使用位置索词进行检索时,词与词之间的逻辑关系使用位置算符组配。算符组配。(W)或或()With (nW)(N)Near (nN)(F)Field (S)Sub field (L)Link (C)Citation (X)和和(nX)在位置算符的前面加上在位置算符的前面加上NOT即可构成位置算符的逻辑即可构成位置算符的逻辑(非非)3.2.1 检索提问式构造 检索字段限定符检索字段限定符 基本索引字段的限定检索。为了指定在基本索引的哪个或哪几个基本索引字段的限定检索。为了指定在基本索引的哪个或哪几个字段中检索,可在检索词或检索式后面加上一斜杠字段中检索,可在检索词或检索式后面加上一斜杠“/”,再加
5、上,再加上所需限定字段标识。一般将加有所需限定字段标识。一般将加有“/”线的字段标识称为后缀代码线的字段标识称为后缀代码(简称后缀)。(简称后缀)。表表3.1 常见后缀代码及其限定查找的字段范围常见后缀代码及其限定查找的字段范围 后缀代码后缀代码 限定查找的字段范围限定查找的字段范围 /TI 题名题名 /AB 文摘文摘 /DE 叙词叙词 /ID 自由标引词自由标引词 /NT 注释注释 /SH 类目标题类目标题3.2.1 检索提问式构造辅助索引字段的限定检索。为了指定在辅助索引字段中进行限辅助索引字段的限定检索。为了指定在辅助索引字段中进行限定检索,可在该检索项(词)的前面加上字段标识与一个等到
6、号定检索,可在该检索项(词)的前面加上字段标识与一个等到号“=”,通常将这种字段标识符称为前缀代码(简称前缀)。,通常将这种字段标识符称为前缀代码(简称前缀)。表表3.2 常见前缀代码及其所限定的字段名称常见前缀代码及其所限定的字段名称 AU =author(著者著者)CS =corporate source(著者所属机构著者所属机构)DT =Document Type(文献类型文献类型)JN =Journal Name(期刊名称期刊名称)CO =Company(公司公司)CC =Classification Code(分类号分类号)SO =Source publication(来源出版物来源
7、出版物)LA =Language(语种语种)PY =Publication year(出版年份出版年份)UD =Update(更新日期更新日期)SP =Conference sponsor(主持单位主持单位)3.2.1 检索提问式构造 截词检索算符截词检索算符 所谓截词检索算符,是指在检索词的某个所谓截词检索算符,是指在检索词的某个局部截断,利用检索词的词干或不完整的词形加局部截断,利用检索词的词干或不完整的词形加上截词符号所进行的检索。上截词符号所进行的检索。后截词后截词前方一致检索前方一致检索 前截词前截词后方一致检索后方一致检索 中截断中截断前后方一致检索前后方一致检索 前后截断前后截断
8、中间一致检索中间一致检索 有限截词有限截词 无限截词无限截词3.2.1 检索提问式构造检索提问式的构造检索提问式的构造句子切分句子切分词汇剔除词汇剔除概念替换概念替换概念限定与补充概念限定与补充组合式检索式组合式检索式3.2.2信息检索一般方法 工具法工具法 又称一般查找法,即利用各类检索系统(工具),包括书本又称一般查找法,即利用各类检索系统(工具),包括书本式与电子文本方式,直接检索信息的方法。工具法又分为式与电子文本方式,直接检索信息的方法。工具法又分为3种情种情况:况:顺查法顺查法 逆查法逆查法 抽查法抽查法 追溯法追溯法 这是一种传统的文献检索方法,即利用文献后面所附参考文这是一种传
9、统的文献检索方法,即利用文献后面所附参考文献,逐一追查被引用文献,然后,再从被引用文献所附参考文献献,逐一追查被引用文献,然后,再从被引用文献所附参考文献目录逐一扩大检索范围的方法。目录逐一扩大检索范围的方法。综合法综合法 亦称循环法或分段法,它指分期分段交替使用上述各种检索亦称循环法或分段法,它指分期分段交替使用上述各种检索方法以达到优势互补,获得理想结果的一种检索方法。方法以达到优势互补,获得理想结果的一种检索方法。3.2.3计算机检索常用法 计算机检索方法:计算机检索方法:菜单检索菜单检索(Easy Menu search)(Easy Menu search)指令检索指令检索(Comma
10、nd Search)(Command Search)浏览式检索浏览式检索(Browsing Search)(Browsing Search)提问提问问答式检索问答式检索(Quiz&Answer Search)(Quiz&Answer Search)根据存取系统的性能与支持的检索功能根据存取系统的性能与支持的检索功能,可将提问可将提问问答式检问答式检索区分为以下方式索区分为以下方式:基本检索基本检索(Basic Search or Simple Search or Quick(Basic Search or Simple Search or Quick Search)Search)二次检索二次检
11、索(Second Search)(Second Search)词组检索词组检索(Word Combination Search)(Word Combination Search)索引词典检索索引词典检索(Catalog Search)(Catalog Search)高级检索高级检索(Advanced Search)(Advanced Search)综合检索综合检索(Synthesis Search)(Synthesis Search)3.2.4 信息检索步骤分析检索课题,明确检索需求。分析检索课题,明确检索需求。检索目的与意图。检索目的与意图。学科范围与主题概念。学科范围与主题概念。文献性质、
12、类型与数量。文献性质、类型与数量。制定检索策略。制定检索策略。选择检索系统与数据库。选择检索系统与数据库。确定检索词和检索途径,编制逻辑检索式。确定检索词和检索途径,编制逻辑检索式。检索策略的调整检索策略的调整.3.3 信息存储与检索相关学科及发展作为一门学科的信息存储与检索作为一门学科的信息存储与检索信息存储与检索相关学科信息存储与检索相关学科 信息管理科学信息管理科学 计算机科学计算机科学 数学数学 系统论系统论 语言学语言学3.3 信息存储与检索相关学科及发展信息存取的发展信息存取的发展 早期书目检索工具的编制早期书目检索工具的编制 科技检索刊物体系的形成科技检索刊物体系的形成 计算机检索的发展计算机检索的发展