1、一、信息检索概述信息检索:依据一定方法,从已经组织好的有关大量信息集合中,查出特定的相关信息的过程。按照检索对象的不同,可分为文献检索、数值检索和事实检索。信息检索利用检索词、检索条件实现过滤。数据:描述事物的符号,包括数字、文字、图表、图像、声音等。数据库:数据的集合。数据库是信息检索系统的核心部分之一,数据库的质量直接影响信息检索系统的功能和效率。信息检索工具:1. 文献信息检索工具:目录、文摘、索引、全文数据库等。2. 数据与事实信息检索工具:百科全书、年鉴、传记资料、地理资料、机构名录、统计资料、字典、词典等。二、文献信息的类型图书:内容系统、成熟、可靠,新颖性差期刊:数量大,覆盖面广
2、;内容新颖、及时;交流影响广泛,信息价值高报纸:出版周期更短;获取时事政策性信息政府出版物:源自官方、权威、可靠;可获取政策性、法规性及科技信息科技报告:反映前沿科技、内容新颖、有密级控制,如美国政府四大报告:AD、NASA、PB、DOE报告专利文献:反映新的技术发明,类型有:专利说明书、专利公报、专利分类表、专利文摘等检索工具会议文献:反映最新成果、最新动向、高水平、前沿发展动态。包括会议论文集、会议录等学位论文:内容专深,有较高的学术参考价值标准文献:反映成熟技术,供研制新产品、改造老产品、改进工艺和操作水平借鉴产品资料:形象、直观、新颖,可了解工艺水平、产品动态等技术档案与图纸:技术性、
3、适用性、保密性三、信息检索的基本方法检索就是实施检索策略、搜寻所得文献信息的过程。查找的方法并没有一定之规可供遵循。对同一个问题不同的检索者可能就有不同的查找方法,这是因为主观上受个人的实际经验、知识结构、对检索工具了解的广度和深度、认识问题的方法等因素的影响,客观上又受制于检索工具、检索时间和数据库等因素的影响。常用法。这是指利用各种类型检索工具,通过技巧查找资料的方法。常用法又可分为顺查和倒查两种。顺查法: 顺查法是指按照时间顺序,由远及近地利用检索系统进行文献检索的方法。这种方法能收集到某一课题的系统文献,它适用于较大课题的文献检索。 例如已知某课题的起始年代,现在需要了解其发展的全过程
4、,就可以用顺查法从最初的年代开始,逐渐向近期查找。该方法优点是漏检率低,但工作量大。倒查法 倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献信息检索的方法。此方法的重点是放在近期文献,只需查到基本满足需要时为止。使用这种方法可以最快地获得新资料,而且近期的资料总是既概括了前期的成果,又反映了最新水平和动向,这种方法工作量小,但漏检率较高,主要用于新课题立项前的调研。循环法循环法又叫分段法。是指常用法和引文法的结合。既要利用检索工具进行常规检索,又要利用文献后所附的参考文献进行追溯检索,分期分段地交替使用几种方法。即先利用检索工具(系统)检索到一批文献,再以这些文献末尾的参考目标为
5、线索逆向查找,如此循环进行,直到满足要求时为止。利用这种方法能够保证所查的资料较全面、系统。抽查法:抽查法是针对检索课题的特点,选择有关该课题的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。它适合于检索某一领域研究高潮很明显的、某一学科的发展阶段很清晰的、某一事物出现频率在某一阶段很突出的课题。该方法是一种花时较少而又能查到较多有效文献的一种检索方法。排除、限定和合取法排除法是指对查找对象的产生和存在的状态在时间上和空间上加以外在否认。通过这种方法极大地收缩检索范围。限定法是相对于排除法而言的,指对查找对象在时间上和空间上加以内在的肯定。令人满意的答案并非完整地记录在某
6、一篇文献中。若把不同资料中涉及到的所需信息的记录都截取下来,汇集在一起,再经过去粗取精、去伪存真的加工就构成一个完整的答案,这种方法叫做合取法。四、信息检索方法1、布尔检索法2、截词检索法3、位置检索法4、字段检索法1、布尔检索法 布尔运算符有三种,分别是 逻辑或 OR; 逻辑与 AND; 逻辑非 NOT逻辑或: A+B、A or B用来连接同义或相关的词可增加检索结果如Railway OR railroad无人机 or 无人驾驶飞机 or UAV逻辑与: A*B 、 A and B表示检索含有这两个词的文献集合用于组配两个不同的概念减少检索结果如 traffic AND controlUAV
7、 and helicopter逻辑非: A-B 、 A not B表示检索含检索词A而不含检索词B的文献用来剔除一些不需要的概念。减少检索结果如fruit NOT apple2、截词检索法截词:是指检索者将检索词在认为比较合适的地方截断,也称模糊检索,又称词干检索法。截词检索:用截断的词的一个局部进行的检索,即利用检索词的词干加上截词符号去数据库中进行检索。凡是满足这个截词的所有字符串的记录,系统都为命中。截词检索法在西文数据库中广泛使用。通常是在词干后可能变化的位置上加上截词符号。检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。截词符号:一般为?或*表示截词的截断符号,
8、各检索系统有不同规定,没有统一标准。种类:按截词位置分:前截断、后截断、中截断;按截词的字符数量分:非限制截断、限制截断后截断:在检索词词干后面加截词符非限制截断:在词干后面加一个截词符,表示不限制词尾可变化的字符位数。例如:comput?可查找到computed、computing、computer、computers等词,注意不宜将词截的过短,否则容易造成误检限制截断:在词干后加若干截词符,限制可变化的位数。例如:educat? 相当于educator、educated中截断:把截词符号置于一个检索词中间,对词中间出现变化的字符数加以限定。一般中截断仅允许有限截断。例如:organi#at
9、ion,可检索到包含organization和organisation的记录。一个?代表零个或任意个字符例如:colo?r,可检索到color、colour、colonizer、colorimeter的记录。一个?和数字,其中的数字代表可替换的字符数。例如:colo?1r,只能检索到包含colour的记录。3、位置检索法1)W-WithW算符是With的缩写,表示在此算符两侧的检索词必须按输入的先后顺序排列,所连接的词之间除可以有一个空格、标点或连接号外不得夹有任何其他单词或字母。例如:intelligent (W) robot?Wn(或nW)表示此算符两侧的检索词必须按输入时的顺序排列,两词
10、间最多插入n个单元词例如:intelligent w1 robot*N-NearN算符是Near的缩写,表示此算符两侧的检索词必须紧密相连,连接的词之间不允许插入任何其他单词或字母,词序可颠倒。例如:intelligent NEAR robot*Nn(或Nn)表示在两个检索词之间最多可插入n个单词,两词词序任意。例如:intelligent N1 robot*4、字段检索法指定检索词出现的字段,系统只对指定字段进行匹配运算。五、信息检索基本过程信息检索就是从信息集合中与用户需求相关的信息 信息集合 找出 用户需求 相关信息使用搜索引擎的经验:输入关键词/句(用户需求) 搜索引擎(信息检索系统)
11、 从数据库中(信息集合) “找出”包含这些关键词的若干记录(相关信息),就是用户体验到的检索流程。信息检索可大致分为五个步骤一是确定检索方向,选择检索工具和途径二是对课题进行主题分析,选择检索词三是制定检索策略,编制检索提问式四是对检索结果进行分析选择五是索取原始文献1.确定检索方向,选择检索工具和途径1)确定检索方向这是使检索获得满意结果的先决条件,为此必须弄清所需信息的特征,如学科归属、主题概念、时间、文献类型、文献语种等。2)确定检索工具根据学科专业、语种等,选择一种或多种检索工具或检索系统。3)确定检索途径主题、分类或作者2、分析检索课题、选择检索词1)注意选择同义词和相关词2)注意适当控制检索词的内涵与外延3)注意选词的规范性3、制定检索策略,编制检索表达式4、对检索结果进行分析选择按照检索式检出结果后,应浏览结果,判断是否符合要求,并加以筛选。若感到不满意,应及时修改检索策略,加以调整,再行检索,直到满意为止。5、索取原文
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。