文献检索-德州学院图书馆课件.ppt

上传人(卖家):晟晟文业 文档编号:5202432 上传时间:2023-02-16 格式:PPT 页数:111 大小:2.73MB
下载 相关 举报
文献检索-德州学院图书馆课件.ppt_第1页
第1页 / 共111页
文献检索-德州学院图书馆课件.ppt_第2页
第2页 / 共111页
文献检索-德州学院图书馆课件.ppt_第3页
第3页 / 共111页
文献检索-德州学院图书馆课件.ppt_第4页
第4页 / 共111页
文献检索-德州学院图书馆课件.ppt_第5页
第5页 / 共111页
点击查看更多>>
资源描述

1、第一节第一节 信息检索及其类型信息检索及其类型第二节第二节 信息检索语言信息检索语言第三节第三节 信息检索技术信息检索技术第四节第四节 信息信息检索策略检索策略第二章第二章 信息检索基础知识信息检索基础知识第一节第一节 信息检索及其类型信息检索及其类型一、信息检索的含义一、信息检索的含义二、信息检索的类型二、信息检索的类型一、信息检索的含义一、信息检索的含义 信息检索:是指将信息信息检索:是指将信息(主要指文献信息)按一定(主要指文献信息)按一定的方式组织和存储起来,并的方式组织和存储起来,并根据用户的需要找出相关信根据用户的需要找出相关信息的过程。息的过程。信息检索信息检索存储存储检索检索存

2、储:是对信息进行著录、存储:是对信息进行著录、标引、整序,编制检索工标引、整序,编制检索工具和建立检索系统的过程。具和建立检索系统的过程。检索:是指面向信息需求检索:是指面向信息需求而进行高度选择性的查找而进行高度选择性的查找过程。过程。原始文献原始文献加工整理加工整理数据库数据库提提 问问检检 索索输输 出出存存 储储检检 索索二、信息检索的类型二、信息检索的类型(一)按检索内容划分(一)按检索内容划分2、数据检索数据检索 是以数据为检索内容的信息检索,要求从检是以数据为检索内容的信息检索,要求从检索系统存储的大量原始调查数据和其它统计数据中索系统存储的大量原始调查数据和其它统计数据中查出所

3、需的数字资料查出所需的数字资料。1 1、书目检索、书目检索 是以文献线索为检索内容的信息检索。是以文献线索为检索内容的信息检索。3 3、事实检索、事实检索 是以具体事项为检索内容的信息检索,要求从检索是以具体事项为检索内容的信息检索,要求从检索系统存储的各种原始信息资源中查出专门的事实材料。系统存储的各种原始信息资源中查出专门的事实材料。4 4、全文检索、全文检索 即检索系统存储的是整篇文章或整本图书。即检索系统存储的是整篇文章或整本图书。5 5、图像检索、图像检索 即以图形、图像或图文信息为检索内容的信息检索。即以图形、图像或图文信息为检索内容的信息检索。6 6、多媒体检索、多媒体检索 是以

4、文字、图像、声音等多媒体信息为检索内容的是以文字、图像、声音等多媒体信息为检索内容的信息检索。信息检索。第二节第二节 检索语言检索语言一、一、检索的基本原理检索的基本原理二、二、检索语言的定义检索语言的定义三、三、检索语言的类型检索语言的类型一、信息检索的基本原理一、信息检索的基本原理 信息检索的核心是用户信息需求与文献信息集合的比较和选择,是两者匹配的过程。为了顺利实现这种匹配,两者必须依赖统一的交流“语言”,以此来描述文献信息内容的特征,同时也以此来描述用户需求特征。只有两者采用共同的“语言”,才能把文献特征的标识与需求特征的标识彼此对应,完成检索的标识匹配过程。这种信息交流中沟通双方的“

5、语言”就是检索语言二、检索语言二、检索语言1.定义:定义:是从自然语言中精选出来的一整套词汇、符号,用来对文献内容和信息特征进行概括和规范的一种人工语言。它是文献信息工作者用来描述文献特征,检索者用来表达检索提问的语言,是沟通存储过程和检索过程的桥梁,是信息检索全过程得以顺利实现的语言保证。2.检索语言所具备的功能检索语言所具备的功能(1)对文献的信息内容及其外表特征加以规范化的标引;(2)对内容相同及相关的文献信息加以集中或揭示其相关性;(3)可使文献信息的存贮集中化、系统化、组织化,便于检索者按一定的排列次序进行有序化检索;(4)便于将标引用语和检索用语进行相符性比较。3.检索语言的类型检

6、索语言的类型检索语言的类型检索语言的类型表述文献外表表述文献外表特征的语言特征的语言表述文献内容表述文献内容特征的语言特征的语言题名题名责任者责任者号码号码引文引文分类法分类法主题法主题法标题词法标题词法叙词法叙词法关键词法关键词法3.1分类检索语言分类检索语言 分类检索语言:是用分类号和相应的分类款目名称来表达信息内容的主题概念,并按学科体系的逻辑次序将信息资源系统地加以划分和组织的语言.分类语言能反映事物的从属派生关系,便于按学科门类进行族检索。3.2主题检索语言主题检索语言 主题检索语言:是采用描述文献主题的语词排列主题标识,提供各种检索词语的途径。一般由主题词表及其编制和使用规则组成。

7、主题检索语言的基本类型主题检索语言的基本类型 1)标题法(System of subject heading)2)单元词法(Uniterm indexing)3)叙词法(Descriptor indexing)4)关键词法(Keyword indexing)第三节第三节 计算机信息计算机信息 检索技术检索技术一、一、布尔逻辑运算符组配检索布尔逻辑运算符组配检索二、二、截词检索截词检索三、三、字段限制检索字段限制检索四四、位置运算符位置运算符一、一、布尔逻辑算符组配检索布尔逻辑算符组配检索 布尔逻辑组配运算是采用布尔代数中的布尔逻辑组配运算是采用布尔代数中的逻辑逻辑“与与”逻辑逻辑“或或”、逻辑

8、、逻辑“非非”等运算等运算符,将检索提问式转换成逻辑表达式,限定符,将检索提问式转换成逻辑表达式,限定检索词在记录中必须存在的条件或不能出现检索词在记录中必须存在的条件或不能出现的条件。凡符合布尔逻辑所规定的条件的文的条件。凡符合布尔逻辑所规定的条件的文献,既为命中文献。献,既为命中文献。布尔逻辑运算符布尔逻辑运算符1、逻辑、逻辑“与与”2、逻辑、逻辑“或或”3、逻辑、逻辑“非非”1.逻辑与(逻辑与(AND)*缩检缩检 假设A和B是两个检索词,则A*B表示A与B必须同时存在。运用“逻辑与”表达式,有助于明确限定检索范围。逻辑与(逻辑与(AND)*缩检缩检 例如用户想在题名中检索有关新闻美学的文

9、献,如只输入“新闻”或“美学”,则命中文献太多,且有许多不是自己所要的。如果输入“新闻*美学”,则检索出题名中同时含有“新闻”和“美学”的文献,检索结果大大缩小。1.逻辑与(逻辑与(AND)*缩检缩检 换一个角度看,“逻辑与”又能防止漏检。例如,用户输入“新闻美学”作为检索词,可命中戈公振的新闻美学实践这样的文献,但漏检了新闻的美学属性、新闻标题中的美学这些文献。如果用“新闻*美学”来进行检索,则上述三篇文献都检中。2.逻辑或(逻辑或(OR)+扩检扩检 A+B,表示A或B中任何一个词存在都可以(当然A和B同时存在也可以)。“逻辑或”表达式,有助于提高查全率2.逻辑或(逻辑或(OR)+扩检扩检

10、例如某用户想查找研究杜甫的文献,检索途径选择题名后,输入“杜甫”,命中540篇。但考虑到研究杜甫的文献题名中未必都出现“杜甫”两字,也可能会出现“杜诗”、“李杜”,于是改用“杜甫+杜诗+李杜”表达式,结果命中608篇。3.逻辑非(逻辑非(NOT)-缩检缩检 A-B,表示A必须存在,但不能有B。“逻辑非”表达式,主要用于排除那些与检索意图无关的文献。例如:“计算机”NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。4.逻辑检索的优先级别逻辑检索的优先级别 当布尔运算符在一个检索式中连续出现时,它们的“级别”是不同的。大部分数据库是这样规定的:-优先级最高,*次

11、之,+最低。例如要查找研究唐宋诗歌的文献,可以用“(唐+宋)*诗”、“唐*诗+宋*诗”,而不能用“唐+宋*诗”。“唐+宋*诗”查找的是含有“唐”的文献或者同时含有“宋”和“诗”的文献,这样就把涉及到的唐代、唐姓的文献都找出来了。二、截词检索二、截词检索 截词检索是预防漏检提高查全率的一种常用截词检索是预防漏检提高查全率的一种常用检索技术,大多数系统都提供截词检索的功检索技术,大多数系统都提供截词检索的功能。能。截词是指在检索词的合适位置进行截断,然截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。

12、的字符数目,又可达到较高的查全率。截词符一般用截词符一般用“?”、“*”、“#”表示表示二、截词检索二、截词检索 (一)(一)根据截词的位置可以分为根据截词的位置可以分为1、后方截词、后方截词:用于前方一致的派生词检索。:用于前方一致的派生词检索。如:信息如:信息?则表示在数据库中含有信息、信息技术、信息检索等则表示在数据库中含有信息、信息技术、信息检索等方面的文献记录均为命中文献。方面的文献记录均为命中文献。2、前方截词、前方截词:用于后方一致的派生词检索。:用于后方一致的派生词检索。如:?经济如:?经济 则数据库中含有经济、工业经济、农业经济等方面的则数据库中含有经济、工业经济、农业经济等

13、方面的文献均为命中文献。文献均为命中文献。二、截词检索二、截词检索 3.中截词中截词 中截词也称屏蔽词。一般来说,中截词仅允许有限截词,主要用于英、美拼写不同的词和单复数拼写不同的词。如organi?ation可检索出含有organisation和organization的记录。由此可知,中截词使用的符号为?,即用?代替那个不同拼写的字符。u有限截词有限截词 在检索词后面加上一个或一个以上(最多在检索词后面加上一个或一个以上(最多4个)的个)的“?”,空一格,再加一个,空一格,再加一个“?”。如:。如:Comput?可检索出:可检索出:Computer,Computers,Computingu

14、无限截词无限截词截去某个词的尾部,是词的前方一致比较,也称前方一致检截去某个词的尾部,是词的前方一致比较,也称前方一致检索。在检索词(关键词、主题词)干后加索。在检索词(关键词、主题词)干后加1个截词符个截词符“?”或或“*”。表示该词尾允许变化的字符数不受任何限制。表示该词尾允许变化的字符数不受任何限制。(二)按所截断的字符数目来分,分为按所截断的字符数目来分,分为三、字段限制检索三、字段限制检索 为了缩小检索范围,可利用字段代码来限制为了缩小检索范围,可利用字段代码来限制检索词出现的字段,以提高检索速度和命中率。检索词出现的字段,以提高检索速度和命中率。如:如:rice in ti(表示只

15、在题目字段中查找文献)(表示只在题目字段中查找文献)rice in de(只在主题词中查找)(只在主题词中查找)rice in ab(只在文摘中查找)(只在文摘中查找)au=Smith,J.C(查作者为查作者为Smith,J.C 的的 文章文章)py=1998(只查只查1998年的文章年的文章)la=Chinese(只查语种为中文的文献只查语种为中文的文献)四、位置运算符四、位置运算符WithWith:设定需检索的两个词或词组在同一字段中,但设定需检索的两个词或词组在同一字段中,但不限制位置的先后。不限制位置的先后。NearNear:设定需检索的两个词或词组在同一语句中,相设定需检索的两个词或

16、词组在同一语句中,相对于对于“with”with”更接近。此外,在使用更接近。此外,在使用“near”near”运算符运算符时,还可以在该运算符后添加一个数字以便进一步限时,还可以在该运算符后添加一个数字以便进一步限定两个词之间的邻近程度,如定两个词之间的邻近程度,如“near3”near3”设定需检索设定需检索的两个词或词组在同一句子中且相隔不超过的两个词或词组在同一句子中且相隔不超过3 3个单词。个单词。第四节第四节 信息检索策略信息检索策略 信息检索的要领信息检索的要领What?找什么?找什么?Where?哪里找?哪里找?How?怎样找?怎样找?第四节第四节 信息检索策略信息检索策略 一

17、、什么是检索策略一、什么是检索策略 二、常见的检索策略类型二、常见的检索策略类型 三、检索策略的制定三、检索策略的制定 四、检索效果的评价四、检索效果的评价 五、信息检索的实施五、信息检索的实施信息检索的核心信息检索的核心 是用户信息需求与文献信息集合的比较和选择,是两者匹配(match)的过程。通过检索语言匹配检索与查找、搜索有什么区别?检索检索查找、查找、搜索搜索英文Retrival 或 RetrievalSearch概念是从信息集合中识别与获取所需信息的过程。过程有一定的策略,是系统的查找资料。随机或更随意一些。技能需要一定的专门知识和技能简单,任意词用途课题或专题日常生活、学习一、什么

18、是检索策略一、什么是检索策略 所谓检索策略广义上是指为实现检索目的而制所谓检索策略广义上是指为实现检索目的而制订的全盘计划和方案;狭义讲是指检索式。订的全盘计划和方案;狭义讲是指检索式。具体而言就是在明确检索目的、分析课题特征具体而言就是在明确检索目的、分析课题特征 的基础上,选择合适的数据库和检索系统,拟的基础上,选择合适的数据库和检索系统,拟 定检索方案,确定检索词,构建检索提问式,定检索方案,确定检索词,构建检索提问式,执行检索并调整检索式,直至获得较满意的检执行检索并调整检索式,直至获得较满意的检 索结果的全过程。索结果的全过程。一、什么是检索策略一、什么是检索策略 狭义的检索策略 特

19、指检索过程中构建检索式的环节。包含检索词的确定,运算符的选择,检索字段 的设定及限制选项的设置等 检索式是用来表达用户提问的逻辑表达式,是检索策略的综合体现,通常由检索词和各种逻辑算符、位置算符及检索系统中规定的其他连接符号构成。二、常用的检索策略类型二、常用的检索策略类型 计算机检索策略是近几年才得到人们的重视和广泛研究的,很多检索策略只不过是某种检索方式或检索式构造方法,真正称得上检索策略的还不多。其中,美国人鲍纳(Charles Bourne)提出的检索策略影响较大:二、常用的检索策略类型二、常用的检索策略类型 1.积木型积木型(Building Block)把检索课题剖析成若干个不同的

20、概念面。逐个 查找各个概念。在每个概念面检索时尽可能全地列举同义词、近义词和相关词,用“OR”连接,构成针对每个 概念面的检索式,即多个子检索式 最后根据课题要求,选用合适的布尔算符把所 有子检索式连接起来,构成一个总的检索式 这种策略类似把各个积木块拼成完整图案,因 此称为积木型检索策略 例如:例如:以检索以检索“文献检索课与大学生信息素质培养的研究文献检索课与大学生信息素质培养的研究”课题为课题为例。例。分析主题:分析主题:1)确定检索本课题的主要概念:文献检索、信息素质、大学生)确定检索本课题的主要概念:文献检索、信息素质、大学生2)“文献检索文献检索”的同义词、近义词或相关词:文献检索

21、、信息检索、的同义词、近义词或相关词:文献检索、信息检索、资源检索、情报检索、文检课、信检课等;资源检索、情报检索、文检课、信检课等;3)“信息素质信息素质”的同义词、近义词或相关词有:信息素养、信息能的同义词、近义词或相关词有:信息素养、信息能力、信息意识、检索能力等;力、信息意识、检索能力等;4)“大学生大学生”的同义词、近义词或相关词:高校、高等院校、高等的同义词、近义词或相关词:高校、高等院校、高等学校等学校等5)(文献检索信息检索情报检索资源检索数据库检索文)(文献检索信息检索情报检索资源检索数据库检索文检课信检课)检课信检课)(信息素质信息素养信息意识信息能力(信息素质信息素养信息

22、意识信息能力信息道德检索能力)信息道德检索能力)(大学生高校高等院校高等学校)(大学生高校高等院校高等学校)二、常用的检索策略类型二、常用的检索策略类型 2.引文珠形增长引文珠形增长(Citation Pearl-Growing)首先检索课题中较为核心的、最专指的概念 面,以便至少检出一篇命中文献或相关信息 浏览检出文献,从中选出新的相关检索词,补充到检索式中,重新检索出更多的命中文献 然后再重复进行浏览选词再检索的过程,直到 获得理想的最终检索结果为止 这种策略最具交互性,检索词更具这种策略最具交互性,检索词更具针对性,检针对性,检 索式在变化中完善,不索式在变化中完善,不足是检索费时较多足

23、是检索费时较多二、常用的检索策略类型二、常用的检索策略类型 3.逐次分馏逐次分馏(Successive Fractions)先用较宽泛的检索式,确定一个范围较广的命先用较宽泛的检索式,确定一个范围较广的命 中文献初始集中文献初始集 然后逐步利用各种检索限制或限定措施,逐然后逐步利用各种检索限制或限定措施,逐渐渐 提高检索式的专指度,缩小命中文献集,提高检索式的专指度,缩小命中文献集,直到直到 得到数量适宜、用户满意的命中文献集得到数量适宜、用户满意的命中文献集为止为止 例如:要检索有关例如:要检索有关“钙通道阻滞剂钙通道阻滞剂”的文献,其要求是的文献,其要求是1994年用英文发表的,且仅仅是有

24、关人的,检出文献量最多不能年用英文发表的,且仅仅是有关人的,检出文献量最多不能超过超过20篇,篇,步骤如下:步骤如下:扩检主题词扩检主题词“Calcium Channel Blockers”,以便将钙通道阻滞剂及其下属主题词的有关文献全部检索出以便将钙通道阻滞剂及其下属主题词的有关文献全部检索出来;来;分别用特征词人类(分别用特征词人类(Human)和文献语种限制;)和文献语种限制;当当文献量还大于所要求的数量时,再用年代限制;文献量还大于所要求的数量时,再用年代限制;最后再用最后再用主要标引主题词(主要标引主题词(Major MeSH)限制)限制。这种策略有利于平衡检索的全面性和准确性,如能

25、较好地掌握检索限制和限定的尺度,可取得相当好的检索效果检索策略检索策略 在计算机检索中,检索策略直接关系到检索结果的成败,要想构造高水平的检索策略,不仅要求用户对检索系统十分了解,还需要对检索课题进行深入的分析并能灵活运用各种检索方法和技巧。三、检索策略的制定三、检索策略的制定(1)列出检索课题的学科范围,主题内容及其检索目标。列出检索课题的学科范围,主题内容及其检索目标。(2)选择相关数据库。选择相关数据库。(3)对检索提问进行概念分析,选择能代表各概念面的检索项,对检索提问进行概念分析,选择能代表各概念面的检索项,把提问的主题概念转换成适合检索系统的检索词,完成由概把提问的主题概念转换成适

26、合检索系统的检索词,完成由概念表达到计算机系统所能接受的检索标识的转换。念表达到计算机系统所能接受的检索标识的转换。(4)拟订检索表达式拟订检索表达式(5)编排具体的检索程序编排具体的检索程序 以上步骤不一定按顺序执行,可根据所检课题和所使用的检索系统的情况以上步骤不一定按顺序执行,可根据所检课题和所使用的检索系统的情况灵活运用。其中(灵活运用。其中(3)和()和(4)是比较重要的)是比较重要的。信息检索效果,就是利用检索系统进行检索服信息检索效果,就是利用检索系统进行检索服务时所获得的有效结果。它对用户利用信息的效果务时所获得的有效结果。它对用户利用信息的效果产生直接的影响,是对检索系统的性

27、能和质量检验产生直接的影响,是对检索系统的性能和质量检验的尺度。评价信息检索效果,目的是为了准确掌握的尺度。评价信息检索效果,目的是为了准确掌握检索系统的各种性能水平,分析影响检索效果的因检索系统的各种性能水平,分析影响检索效果的因素,调节检索策略,改进检索系统的性能,提高检素,调节检索策略,改进检索系统的性能,提高检索效果,满足用户信息检索的需求。索效果,满足用户信息检索的需求。检索效果评价检索效果评价(一)查全率(二)查准率(三)查全率与查准率的关系(四)影响查全率和查准率的因素查全率查准率 系统文献库中相关系统文献库中相关文献总量文献总量对于用户来讲对于用户来讲几乎无从得知。由此可几乎无

28、从得知。由此可见,查全率和查准率很见,查全率和查准率很难成为用户自我评价检难成为用户自我评价检索效率的准绳索效率的准绳 查全率指标和查准率指标的评价标准查全率指标和查准率指标的评价标准 经验评价标准理论评价标准检出相关文献量-100%检索系统中相关文献总量检出相关文献量-100%检出文献总量p 通过相关领域从业的人员情况p 通过手头掌握的信息资料 查全率查全率R,查准,查准率率P A点:点:检索词泛指性强,检索词泛指性强,查全率较高,但查准率却查全率较高,但查准率却非常低;非常低;B点:点:检索词专指性较强,检索词专指性较强,查准率高,查全率降低;查准率高,查全率降低;C,D两点:两点:两种极

29、端的折两种极端的折衷,查全率一般在衷,查全率一般在60一一70,查准率一般在,查准率一般在40一一50。查全率指标和查准率指标的评价标准查全率指标和查准率指标的评价标准 例:垃圾填埋中渗透液的处理例:垃圾填埋中渗透液的处理 方案一方案一:检索词选择:检索词选择“垃圾垃圾”、“处理处理”,则查全率较高,但查准,则查全率较高,但查准率较低,即处于率较低,即处于A点;点;方案二方案二:检索词选择:检索词选择“垃圾垃圾”、“填埋填埋”、“渗透液渗透液”、“处理处理”,则查准率较高,而查全率却较低,则查准率较高,而查全率却较低,即处于即处于B点;点;方案三方案三:检索词选择:检索词选择“垃圾垃圾”、“填

30、埋填埋”、“渗透液渗透液”,或选择,或选择“垃圾垃圾”、“渗透液渗透液”,则查全率,则查全率和查准率处于折衷点,即和查准率处于折衷点,即C、D点。点。查全率与查准率的关系查全率与查准率的关系 查全率与查准率之间为互逆的关系查全率与查准率之间为互逆的关系 通常采取措施提高查全率时会降低查准率通常采取措施提高查全率时会降低查准率 反之,采取措施提高查准率时则会降低查全率反之,采取措施提高查准率时则会降低查全率 在检索中要根据课题的实际需求,确定以查准在检索中要根据课题的实际需求,确定以查准为主还是以查全为主,或是寻求查准与查全之为主还是以查全为主,或是寻求查准与查全之间的平衡。间的平衡。p 注意注

31、意相关领域相关领域(如近缘学科、交叉学科和边缘学科)的检(如近缘学科、交叉学科和边缘学科)的检索,这是扩大检索范围、提高查全率非常重要而有效的途索,这是扩大检索范围、提高查全率非常重要而有效的途径。径。p 采用采用分类法或规范化词分类法或规范化词检索检索 p 分类检索时可以采用更加宽泛的分类检索时可以采用更加宽泛的上位类号上位类号来检索来检索 p 增加增加同义词同义词或或近义词近义词 如:如:(lung cancer or lung carcinoma)p 计算机检索时可采用计算机检索时可采用模糊检索模糊检索或运用或运用逻辑逻辑“或或”检索,放检索,放宽条件。减少使用逻辑宽条件。减少使用逻辑“

32、与与”、逻辑、逻辑“非非”运算符运算符 p 尽可能选择信息尽可能选择信息收全率高的检索工具收全率高的检索工具,如果一个工具不能,如果一个工具不能满足信息查全率上的要求,应精心挑选多个工具进行检索满足信息查全率上的要求,应精心挑选多个工具进行检索 p 选词选词不全是很重要的漏检原因。选词时除参阅相关词表以不全是很重要的漏检原因。选词时除参阅相关词表以外,还应参阅已在手的相关文献或征询有关专家的意见。外,还应参阅已在手的相关文献或征询有关专家的意见。提高查全率的方法提高查全率的方法提高查全率的方法p将检索词限定到文摘、全部字段等p使用截词符。如:transplant*p查全同义单词的不同拼写方式如

33、:fibre or fiberp查全缩写与全称如:“ang 1 7”OR“angiotensin 1 7”p变词组检索为邻近检索如:“acute pancreatitis”改为 acute adj2 pancreatitisu提高检索词的专指度u利用逻辑“非”剔除不需要出现的词语u多使用逻辑“与”,减少逻辑“或”运算符u限制检索词的出现字段u利用文献外表特征进行限制。如增加机构名、人名、地名、出版物名称等作为限制检索项提高查准率的方法提高查准率的方法提高查准率的方法提高查准率的方法将检索词限定到标题、关键词字段将检索词限定到标题、关键词字段设定在数据库的某个或若干个子集中检索设定在数据库的某个

34、或若干个子集中检索例:例:core clinical journals子集子集(Medline)Clinical Medicine大类(大类(Elsevier)使用词组精确匹配运算符使用词组精确匹配运算符“”例:例:“renal failure”五、信息检索的实施五、信息检索的实施信息检索五步走信息检索五步走 如何选择信息源如何选择信息源使用航海指南针使用航海指南针信息获取的思路信息获取的思路 问题应按照什么步骤完成信息检索?信息检索过程是一个检索的操作过程,如选择数据库、确定关键词、构造检索式等?这种对信息检索过程公式化的理解,不能帮助我们真正把握解决问题的思考方式,也就无法产生一个全局的检

35、索思路,以至于最终无法有效实现检索目标。(一)信息检索的一般步骤5 索取原始文献4 查找和阅读文献线索3 确定检索途径、检索方法2 选择检索工具或检索系统1 分析检索课题、明确检索要求(一)信息检索五步走 信息检索实质是信息问题解决,信息检索的一般步骤也应是一个问题解决的过程。需要具备一定信息素养,结合一定信息技术使用能力,并在检索过程中将信息成功应用于批判性思考中,最终解决问题。信息检索五步走分析和利用信息 选择信息源 界定问题 制定策略并实施检索 评价信息 信息检索五步走 假定这样一个生活场景:你所在的单 位主要从事车用燃料的生产和销售,近年来由于生产原材料的上涨导致利润率有所下降,开始考

36、虑结合现有市场形式开拓车用替代燃料的生产。需要你在较短时间内初步对目前车用替代燃料的应用情况做一个预调研,并以报告形式提供给相关同事参考。这一任务该如何完成?信息检索五步走 第一步:界定问题第一步:界定问题 界定问题过程首先需要根据待完成的任务,界定问题过程首先需要根据待完成的任务,确定信息问题。确定信息问题。然后根据信息问题,确定信息需要。然后根据信息问题,确定信息需要。自己是否完全理解待解决问题的相关概念含义?需要查找哪些方面的信息?需要第一手即时消息还是经过加工的信息?最终问题解决后应该是一个什么样的报告类型?信息检索五步走 第一步:界定问题第一步:界定问题 如何选用恰当的分类方式描述要

37、解决的问题?如何选用恰当的分类方式描述要解决的问题?如何选用恰当的主题词描述要解决的问题?如何选用恰当的主题词描述要解决的问题?对问题的主题进行分析,形成相关的检索词对问题的主题进行分析,形成相关的检索词(关键词)(关键词)主要概念词主要概念词 次要概念词次要概念词 检索词检索词信息检索五步走 第二步:选择信息源第二步:选择信息源需要考虑可能存在那些信息源?需要考虑可能存在那些信息源?哪些信息源又是我可获得的?哪些信息源又是我可获得的?在这些可获得的资源中,在这些可获得的资源中,哪些是比较易得而有意义的?哪些是比较易得而有意义的?最终完成拟定策略的过程。最终完成拟定策略的过程。选择信息源主要是

38、个信息源的确定过程。首先确定所有可能的信息源,然后加以比较,确定其优先顺序。信息检索五步走 第三步:制定检索策略并实施检索第三步:制定检索策略并实施检索 信息源中包含的信息可能是海量的,如果在着手开始检索之前没有一个确定的检索策略,可能很快你就会在信息中“迷失”。确定好需要查找的信息源及查找的顺序之后,就需要确定具体的检索策略,根据拟定好的优先顺序检索文献信息。信息检索五步走 第四步:评价信息第四步:评价信息在对不同信息源进行检索之后,取得的文献在对不同信息源进行检索之后,取得的文献信息数量可能相当庞大,内容也有相互重复甚信息数量可能相当庞大,内容也有相互重复甚至冲突的地方。这就需要有一定的评

39、价方法对至冲突的地方。这就需要有一定的评价方法对信息进行筛选,找到那些来源可靠,内容相关信息进行筛选,找到那些来源可靠,内容相关且详尽的文献,剔除错误、过时、不相关的信且详尽的文献,剔除错误、过时、不相关的信息。息。信息检索五步走 第五步:分析、利用信息第五步:分析、利用信息 筛选后的检索结果来源广泛,内容涉及方方面面。筛选后的检索结果来源广泛,内容涉及方方面面。如何有效组织整理,以提炼出一个综合性的信息内如何有效组织整理,以提炼出一个综合性的信息内容,完成报告的编撰是这一步骤的主要工作。容,完成报告的编撰是这一步骤的主要工作。此时选用相关的工具将检索结果有效组织,将极大此时选用相关的工具将检

40、索结果有效组织,将极大减少工作量。同时进一步通过阅读确定:哪些信息减少工作量。同时进一步通过阅读确定:哪些信息是切合需要的?哪些信息表述内容之间存在冲突,是切合需要的?哪些信息表述内容之间存在冲突,需要进一步考察?并依据相关规范正确引用文献资需要进一步考察?并依据相关规范正确引用文献资源,最终形成文字性的研究成果。源,最终形成文字性的研究成果。(二)如何选择信息源使用航海指南针 信息检索无时不有、无处不在信息检索无时不有、无处不在 信息源种类繁多、特点各异信息源种类繁多、特点各异以下将主要介绍:如何界定问题如何选出最有效的信息源1.界定问题 界定问题是信息检索的第一步 其内涵主要包括:)分析研

41、究问题 )建立背景知识 )拟定主题概念1)分析研究问题 确定研究问题需要查找的类型、所属领域、地域范围和哪一时期的文献资料 明确研究目标,以确定检索的深度和广度 对研究问题的了解越多,所走的弯路越少1)分析研究问题(1 1)明确检索的目的与要求明确检索的目的与要求 撰写论文?项目研究?技术跟踪?申请撰写论文?项目研究?技术跟踪?申请专利?专利?分析问题分析问题 研究目标研究目标 时间范围时间范围 地域范围地域范围 前景前景/事件事件(2 2)明确课题的主题或主要内容:明确课题的主题或主要内容:要形成若干要形成若干个既能代表信息需求又具有检索意义的主题概个既能代表信息需求又具有检索意义的主题概念

42、,包括所需的主题概念有几个、概念的专指念,包括所需的主题概念有几个、概念的专指度是否合适,哪些是主要的,哪些是次要的,度是否合适,哪些是主要的,哪些是次要的,概念之间的关系如何,等等。概念之间的关系如何,等等。(3 3)课题涉及的学科范围:课题涉及的学科范围:搞清楚课题所涉及搞清楚课题所涉及的学科领域,是否是跨学科研究,以便按学科的学科领域,是否是跨学科研究,以便按学科选择信息资源。选择信息资源。(4 4)所需信息的数量、语种、年代范围、类型所需信息的数量、语种、年代范围、类型等具体指标。等具体指标。1)分析研究问题 研究问题分析以“车用替代燃料的应用情况研究”为例首先分析研究问题本身包含的主

43、题概念有哪些?首先分析研究问题本身包含的主题概念有哪些?研究问题中可能包括哪些子问题,涉及哪些学科领域?研究问题中可能包括哪些子问题,涉及哪些学科领域?子问题是否过多,需要缩小研究问题的范围?子问题是否过多,需要缩小研究问题的范围?研究问题是否过于狭窄,意义不大,需要扩大研究问题的研究问题是否过于狭窄,意义不大,需要扩大研究问题的范围?范围?需要原始资料或经过专家学者整理过的资料?一般性信息需要原始资料或经过专家学者整理过的资料?一般性信息还是学术性信息?还是学术性信息?对信息的新颖性要求多高?对信息的新颖性要求多高?地域范围的选择是应该越宽泛越好,还是越典型越好?地域范围的选择是应该越宽泛越

44、好,还是越典型越好?2)建立背景知识 研究问题分析过程中的许多问题往往不能一步回答得比较准确 这时就需要通过初步的检索,建立背景知识2)建立背景知识 阅读与研究主题相关的概览性资料,是建立背景知识的最佳渠道 概览性资料通常出现在我们所说的三次文献中,如百科全书、字词典及年鉴等参考资源中 建立背景知识的过程往往也是辨别待解决信息问题研究的必要性及可行性的重要时机 2)建立背景知识 以以“车用替代燃料的应用情况研究车用替代燃料的应用情况研究”为例为例 Amy对于对于“车用替代燃料车用替代燃料”的具体含义的具体含义并不清楚,需要查找资料进一步理解并不清楚,需要查找资料进一步理解 登录百度登录百度-知

45、道、百科搜索引擎,使用知道、百科搜索引擎,使用“车用替车用替代燃料代燃料”为检索词,为检索词,查到的内容查到的内容车用清洁替代燃料包括天然气、液化石油气、车用清洁替代燃料包括天然气、液化石油气、氢能源、二甲醚、醇类燃料及生物燃料氢能源、二甲醚、醇类燃料及生物燃料 进一步的阅读文献研究得知进一步的阅读文献研究得知车用替代燃料包括的能源类型十分丰富车用替代燃料包括的能源类型十分丰富 2)建立背景知识在规定的时间内能完成么?2)建立背景知识3.如果继续上面的研究,将需要对列表中的概念如果继续上面的研究,将需要对列表中的概念进行逐一检索,工作量很大。这种情况下,考进行逐一检索,工作量很大。这种情况下,

46、考虑到时间等成本因素,可以虑到时间等成本因素,可以缩小研究问题的范缩小研究问题的范围围,例如以,例如以“乙醇燃料乙醇燃料”为研究对象为研究对象4.进一步了解乙醇燃料的含义,例如可以登录进一步了解乙醇燃料的含义,例如可以登录百百度百科度百科,查得:,查得:车用乙醇燃料也称为乙醇汽油乙醇汽油,是指在不含MTBE含氧添加剂的专用汽油组分油(由炼油厂或石油化工厂生产的用于调合车用乙醇汽油的调合油)中,按体积比加入一定比例(我国目前暂定为10%)的变性燃料乙醇,由车用乙醇汽油定点调配中心按国标GB183512004的质量要求,通过特定工艺混配而成的新一代清洁环保型车用燃料清洁环保型车用燃料。3)拟定主题

47、概念拟定主题概念 对主题进行分析,形成相关的检索词对主题进行分析,形成相关的检索词 上位词(概念范围大于它的词语)下位词(小于)同义词及相关词 翻译检索词如要查找外文资料 详细列出检索词详细列出检索词 既能极大地提高后续检索的查全率,也是避免漏检的重要方法。如何拟定主题概念 结合背景知识,用一小段话概括和阐述研究问题,从中找出有明确含义的专指名词,结合一定的查询操作逐个考虑该词能否作为检索词使用。得到主题概念之后,选取它的上位词(扩大检索范围)、下位词(缩小检索范围)、或者同义词(提高查准率)及相关词,将取决于检索策略。利用相关参考书(如中国分类主题词表等)帮助查找。3)拟定主题概念以“车用乙

48、醇燃料的应用情况研究”为例 主题概念分析方法之一:抽取检索词 案例二:查找吸烟与肺癌关系研究的中文文献案例二:查找吸烟与肺癌关系研究的中文文献包含包含两个概念:吸烟两个概念:吸烟、肺癌;检索式:吸烟、肺癌;检索式:吸烟 AND 肺癌肺癌 吸烟与肺癌吸烟与肺癌检索式:(吸烟检索式:(吸烟 OR OR 抽烟)抽烟)AND AND(肺癌(肺癌 OR OR 肺部肿瘤肺部肿瘤 OR OR 肺肿瘤)肺肿瘤)吸烟吸烟抽烟抽烟肺癌肺癌肺部肿瘤肺部肿瘤肺肿瘤肺肿瘤主题概念分析方法之二:考虑同义词主题概念分析方法之三-选取上下位类概念词垃圾的处理垃圾的处理废弃物废弃物同义词下位类词检索式:检索式:(垃圾垃圾 OR

49、 废弃物)废弃物)AND(回收回收 OR 利用利用 OR 填埋填埋 OR 掩埋掩埋 OR 焚烧焚烧)回收回收利用利用掩埋掩埋填埋填埋焚烧焚烧 案例三:查找垃圾的处理研究的中文文献案例三:查找垃圾的处理研究的中文文献主题概念分析 之四:舍弃重复概念案例四:全息防伪技术在包装方面的运用案例四:全息防伪技术在包装方面的运用全息全息防伪防伪包装包装and检索式检索式:全息全息 and 包装包装主题概念分析注意事项排除比较泛指、检索意义不大的概念排除比较泛指、检索意义不大的概念如如“发展发展”、“趋势趋势”、“现状现状”、“关系关系”少用外延十分宽广的概念少用外延十分宽广的概念如如“工艺工艺”、“分析分

50、析”、“应用应用”、“有机物有机物”、“无机物无机物”、“重金属重金属”有些检索概念已经体现在所使用的专业数据有些检索概念已经体现在所使用的专业数据库中,这些概念也应该予以排除库中,这些概念也应该予以排除如在物理文献数据库中检索,如在物理文献数据库中检索,“物理物理”一词应禁用一词应禁用3)拟定主题概念使用宽泛的“自由词”作为主题概念进行检索?还是使用规范的、被数据库生产商用来做标引的“主题词”进行检索?自由词在检索初期可尽量使用。使用关键词作为主题概念进行检索。它的选取可以非常宽泛,只要在文章中出现过,就能被检索到。但由于是自由词,作者的使用非常随意,这就需要我们把可能出现的所有自由所有自由

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(文献检索-德州学院图书馆课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|