1、文献信息检索基础琼州学院胡爱民Email:一、文献检索基本知识、文献检索含义 、文献检索语言 、文献检索途径 、文献检索方法 、文献检索步骤 、手工检索工具 1、文献检索含义文献信息检索或情报检索,是指将文献信息按一定的方式组织和储存起来,并能根据用户的需要取出所需特定信息的整个过程。它的全名为信息存储与检索。通常所说的信息查询或检索只是名称的后一半,或是狭义的信息检索。文献检索分为数据检索:以文献中的数据为对象的一种检索。如某公式、某化学分子式等。事实检索:以文献中的事实为对象,检索某一事物发生的时间、地点或过程 文献检索:以文献为对象,查找某个课题的有关文献的一种检索。用检索标识与文献的存
2、储标识相比,如果能够取得一致,就叫匹配,就可得到命中文献。 信息的存储与检索的基本原理信息存储收集选择著录加工标引加工存储标识信息检索分析需求检索提高提供标识检索标识检索语言存储与检索系统进行匹配输出信息检索的分类根据检索对象形式的不同,信息检索分为:文献检索:课程重点数据检索事实检索2、文献检索语言文献检索语言是一种人工语言,用于各种检索工具的编制和使用、并为检索系统提供一种统一的、作为基准的、用于信息交流的一种符号化或语词化的专用语言。因其使用的场合不同,检索语言也有不同的叫法。例如在存储文献的过程中用来标引文献,叫标引语言;用来索引文献则叫索引语言;在检索文献过程中则为检索语言。检索语言
3、按原理可分为4大类:(1)、分类语言 (2)、主题语言 (3)、关键词语言 (4)、自然语言:分类语言它是将表达文献信息内容和检索课题的大量概念,按其所属的学科性质进行分类和排列,成为基本反映通常科学知识分类体系的逻辑系统,并用号码(分类号)来表示概念及其在系统中的位置,甚至还表示概念与概念之间关系的检索语言。 中国图书馆图书分类法是我国图书分类法的基础,中图法把一切知识门类按五分法分为马列、毛泽东思想;哲学;社会科学;自然科学;综合性图书这五大部类。在此基础上建成由22个大类组成的体系系列。 主题语言是指经过控制的,表达文献信息内容的语词。主题词需规范,主题词表是主题词语言的体现,词表中的词
4、作为文献内容的标识和查找文献的依据关键词语言指从文献内容中抽出来的关键的词,这些词作为文献内容的标识和查找目录索引的依据关键词不需要规范化,也不需要关键词表作为标引和查找图书资料的工具。自然语言指文献中出现的任意词。 制定检索式一 检索式和运算符二 运算符的类型一、检索式和运算符一、检索式和运算符l检索式:用检索式:用运算符运算符将将检索词检索词连接起来构连接起来构成成 的能让计算机识别的式子。的能让计算机识别的式子。运算符和检索词是构运算符和检索词是构成检索式的关键成检索式的关键运算符:运算符:又称逻辑算符,是表达检索词之间逻辑关系和限制关系的运算符号,它是复合检索式中必不可缺的构件运算符类
5、型布尔逻辑运算符 位置符截词符限定符布尔逻辑运算符布尔逻辑运算符又称为“布尔算符”,由英国数学家 乔治布尔提出 用来连接两个或多个检索标识的符号用来连接两个或多个检索标识的符号 包括:包括:ANDAND、OROR、NOTNOT。1、布尔算符 AND 的含义及应用(1)含义:AND又称为逻辑“与”,表示“相交”关系,用于缩小缩小检索范围(查准率)AB例如:用查找干扰素治疗白血病的文献 检索式为:干扰素 AND 白血病 (2)应用:表示形式:A AND BA AND B2 2、布尔算符、布尔算符 OR OR 的含义及应用的含义及应用(1)含义:“OROR”又称为逻辑“或”,表示“并列”关系,扩大检
6、索范围(查全率)例如:查找2006年有关干扰素的文献 检索式为:干扰素 OR IFN A AB B(2)应用 表示形式:A OR B (1)含义:NOT又称为逻辑“非”,用于排 除不需要的检索结果 (2)应用 表示形式:A NOT BA NOT B 3 3、布尔算符、布尔算符 NOT NOT 的含义及表示形式的含义及表示形式AB 例如:白血病治疗 NOT 放疗4 4、运用、运用“布尔算符布尔算符”的注意事项的注意事项1 1)运算符遵循数学运算法则)运算符遵循数学运算法则; ; 布尔逻辑运算符运算顺序为:布尔逻辑运算符运算顺序为: NOTNOTANDANDOROR2 2)在检索式中只有)在检索式
7、中只有ANDAND、OROR前后的检前后的检 索标识可以交换;索标识可以交换; 3 3)检索式中有)检索式中有NOTNOT时前后检索词不能交换。时前后检索词不能交换。要 点 1 1、缩小检索时使用:、缩小检索时使用:AND;扩大检索使用:扩大检索使用:OR;排除检索时使用:排除检索时使用:NOT。 2、 AND AND 、OR OR 、NOTNOT在在同一个检索式中出现时,同一个检索式中出现时, 其其运算顺序为:运算顺序为: NOTANDOR,如果如果需改需改 变运算顺序,应将先变运算顺序,应将先运算的部分运算的部分加上加上括号。括号。 注注: : ( )( )必须在必须在半角半角和和英文英文
8、状态下输入状态下输入(二)位置符作用作用: 用于表示两个检索词之间用于表示两个检索词之间位置位置的检索符。用的检索符。用于于缩缩 小小检索范围检索范围( (仅限于仅限于外文外文数据数据库库) )包括包括:NEARNEAR1、表示、表示左右左右两个检索词出现在两个检索词出现在同一个句子同一个句子中;中;2、near后加上后加上数字数字时,表示左右两个检索词之间时,表示左右两个检索词之间 所间隔单词的数量所间隔单词的数量最多不能超过最多不能超过该数字减该数字减1WITHWITH要求左右两个检索词出现在同一个字段中要求左右两个检索词出现在同一个字段中。应用举例(一)NEAR形式: A NEAR(n)
9、 B实例:如用检索乳腺肿瘤的检索式可简化为: breast near1 (cancer or neoplasms or Tumor or sarcoma or carcinoma)应用举例(二)WITH形式: A WITH B实例:Leukemia with complications“* *”的应用的应用如:如:1 1、急性、急性* *胰腺炎:可检出胰腺炎:可检出急性胰腺炎、急性急性胰腺炎、急性重症重症胰腺胰腺 、急性、急性胆源性胆源性胰腺炎、急性胰腺炎、急性出血出血 坏死型坏死型胰腺炎、急性胰腺炎、急性出血性出血性胰腺炎胰腺炎 等等急性胰腺炎急性胰腺炎的所有文献。的所有文献。 2 2、im
10、mun* *: : 可检出可检出immune、 immunity、 immunology、 immunohistochemical 等所有含等所有含immun前缀前缀的检索词的文的检索词的文献献。“? ?”的应用的应用例如例如:拉拉?夫定夫定:可检出含可检出含拉拉米米夫定夫定和和拉拉咪咪夫夫 定定的文章的文章; ; ProteinProtein?:可检出含:可检出含 ProteinProteins s 和和 ProteinProtein的所有文章的所有文章 注:注:“? ?”必须在必须在半角半角或或英文英文状态下输入状态下输入 作用作用:对对特定特定字段的字段的限定限定检索,检索,包括包括:i
11、nin、= =、等等表现形式表现形式:检索标识检索标识 限定符限定符 字段名字段名 实例实例:PYPY= =20032003; 石京山石京山 inin 著者;著者; shi shi j sj s auau 文献检索途径(1)、著者途径许多检索系统备有著者索引、机构(机构著者或著者所在机构)索引,专利文献检索系统有专利权人索引,利用这些索引从著者、编者、译者、专利权人的姓名或机关团体名称字顺进行检索的途径统称为著者途径。 (2)、题名包括书名、刊名、篇名等途径。一些检索系统中提供按题名字顺检索的途径,如书名目录和刊名目录。文献检索途径(3)、分类途径按学科分类体系来检索文献。这一途径是以知识体系
12、为中心分类排检的,因此,比较能体现学科系统性,反映学科与事物的隶属、派生与平行的关系,便于我们从学科所属范围来查找文献资料,并且可以起到触类旁通的作用。从分类途经检索文献资料,主要是利用分类目录和分类索引。 (4)、主题途径通过反映文献资料内容的主题词来检索文献。由于主题法能集中反映一个主题的各方面文献资料,因而便于读者对某一问题、某一事物和对象作全面系统的专题性研究。我们通过主题目录或索引,即可查到同一主题的各方面文献资料。 文献检索途径(5)、引文途径 文献所附参考文献或引用文献,是文献的外表特征之一。利用这种引文而编制的索引系统,称为引文索引系统,它提供从被引论文去检索引用论文的一种途径
13、,称为引文途径。 (6)、序号途径 有些文献有特定的序号,如专利号、报告号、合同号、标准号、国际标准书号和刊号等。文献序号对于识别一定的文献,具有明确、简短、唯一性特点。依此编成的各种序号索引可以提供按序号自身顺序检索文献信息的途径。 文献检索途径(7)、代码途径 利用事物的某种代码编成的索引,如分子式索引、环系索引等,可以从特定代码顺序进行检索。 (8)、专门项目途径从文献信息所包含的或有关的名词术语、地名、人名、机构名、商品名、生物属名、年代等的特定顺序进行检索,可以解决某些特别的问题。文献检索方法(1)、直接法又称常用法,是指直接利用检索系统(工具)检索文献信息的方法。它又分为顺查法、倒
14、查法和抽查法。 (2)、追溯法是指不利用一般的检索系统,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献信息范围,一环扣一环地追查下去的方法。它可以像滚雪球一样,依据文献间的引用关系,获得更好的检索结果。 (3)、循环法又称分段法或综合法。它是分期分交替使用直接法和追溯法,以期取长补短,相互配合,获得更好的检索结果。文献检索步骤文献检索是一项实践性很强的活动,它要求我们善于思考,并通过经常性的实践,逐步掌握文献检索的规律,从而迅速、准确地获得所需文献。一般来说,文献检索可分为以下步骤: (1)明确查找目的与要求。 (2)选择检索工具
15、(3)确定检索途径和方法 (4)根据文献线索,查阅原始文献 手工检索工具指印刷型检索工具,主要有以下类型:(1)、目录、索引、文摘 目录,也称书目。它是著录一批相关图书或其它类型的出版物,并按一定次序编排而成的一种检索工具。 索引,是记录一批或一种图书、报刊等所载的文章篇名、著者、主题、人名、地名、名词术语等,并标明出处,按一定排检方法组织起来的一种检索工具。索引不同于目录,它是对出版物(书、报、刊等)内的文献单元、知识单元、内容事项等的揭示,并注明出处,方便进行细致深入的检索。 文摘,是以提供文献内容梗概为目的,不加评论和补充解释,简明、确切在记述文献重要内容的短文。汇集大量文献的文摘,并配
16、上相应的文献题录,按一定的方法编排而成的检索工具,称为文摘型检索工具,简称为文摘。(2)、百科全书 参考工具书之王。它是概述人类一切门类或某一门类知识的完备工具书,是知识的总汇。它是对人类已有知识进行汇集、浓缩并使其条理化的产物。百科全书一般按条目(词条)字顺编排,另附有相应的索引,可供迅速查检。手工检索工具(3)、年鉴 按年度系统汇集一定范围内的重大事件、新进展、新知识和新资料,供读者查阅的工具书。它按年度连续出版,所收内容一般以当年为限。它可用来查阅特定领域在当年发生的事件、进展、成果、活动、会议、人物、机构、统计资料、重要文件或文献等方面的信息。(4)、手册名录 手册,是汇集经常需要查考
17、的文献、资料、信息及有关专业知识的工具书。 名录,是提供有关专名(人名、地名、机构名等)的简明信息的工具书。(5)、词典(字典) 词典是最常用的一类工具书。分为语言性词典(字典)和知识性词典。 (6)、表谱、图录 表谱,采用图表、谱系形式编写的工具书,大多按时间顺序编排。主要用于查检时间、历史事件、人物信息等。 图录,包括地图和图录两类。(7)、类书、政书 文献信息检索方法和步骤一、文献信息检索方法一、文献信息检索方法二、二、文献信息检索的步骤文献信息检索的步骤文献信息检索方法1 1、常用法顺查法顺查法顺查法指以检索课题的起始年代为起点,按照时间的顺序,由顺查法指以检索课题的起始年代为起点,按
18、照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法。远及近地利用检索系统进行文献信息检索的方法。这种方法能收集到某一课题的系统文献,它适用于较大课题的文献检索。它适用于较大课题的文献检索。例如,已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找。优点是漏检,误检率低,但劳动量较大。如:查找“五四”时期马克思主义在中国传播情况的文献,可采用该法,利用五四时期期刊介绍(中共中央马恩列斯著作编译局研究主编,人民出版社,1958-1959年版)一书报有的157种期刊的篇目索引,便可查到从1916年开始至1921年中国共产党成立青年新青年杂志所发表的
19、全部有关宣传马克思主义的文献篇目,为该课题的提供基本材料。文献信息检索方法1 1、常用法倒查法倒查法倒查法是由近及远,从新到旧,逆着时间的顺序利倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献信息检索的方法。用检索工具进行文献信息检索的方法。此法的重点是放在近期文献,只需查到基本满足需要时为止。使用这种方法可以最快地获得新资料,而且近期的资料总是即概括了前期的成果,又反映了最新水平和动向,这种方法劳动量较小。但是容易造成漏检。此法可用于新课题立项前的调研。此法可用于新课题立项前的调研。如查找关于爱因斯坦广义相对论的哲学意义的探索文献,可利用人大复印资料索引(年刊),从现在开始上溯
20、逐年查找到1978年止,就可得到相关篇目,因为国内对该课题的研究基本上从1978年开始的文献信息检索方法1 1、常用法抽查法抽查法抽查法是针对检索课题的特点,选择有关抽查法是针对检索课题的特点,选择有关该课题的文献信息最可能出现或最多出现该课题的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的的时间段,利用检索工具进行重点检索的方法。方法。它适合于检索某一领域研究高潮很明显的,某一学科的发展阶段很清晰的,某一事物出现频率在某一阶段很突出的课题。这是一种花费较少时间能查得较多有效文献的一种检索方法。文献信息检索方法2 2、追溯法是利用已有文献后面所附的是利用已有文献后面所附的“参
21、考文献参考文献”进行追溯查找的方法。进行追溯查找的方法。如我毕业论文是关于数学课改的课题,已查到2007年一篇论文是李静.新课改下中学数学学习过程评价的理解J教育实践与研究2006.(01)而它的参考文献为郑毓信. 数学课程改革深入发展之若干关键问题J中学教研(数学) , 2003,(12) 文献信息检索方法3 3、综合法是将常用法与追溯法交替使用的一种方法。是将常用法与追溯法交替使用的一种方法。既利用工具书检索文献,又利用文献后面的参考文献进行追溯。选择检索方法的原则1、要看检索条件 检索工具缺乏而原始文献收藏丰富宜用追溯法,有成套检索工具则宜用直接法,其查全率、查准率都比追溯法高。2、要看
22、检索要求 1)要求收集某一课题的系统资料,要求全面,不能有重大遗漏,最好用顺查法 2)要解决某一课题的关键性技术,不要求全面,只要能解决这个关键问题就行,要快,针对性强,要准,宜用倒查法,迅速查得最新资料3 、要看检索学科的特点,古老学科,开始年代很早,只好用倒查法,新兴学科,起始年代不远,可用顺查法,波浪发展的学科,可选择发展高峰,用循环法文献信息检索的步骤1 1、分析研究课题,明确文献需求、分析研究课题,明确文献需求当我们要研究和查找的课题确定之后,首先要将该课题的内容实质与所涉及的学科范围及其相互之间的关系进行周密的分析研究,明确课题所需文献的内容,性质和水平以及出版国别,语种和年限等。
23、同时还要在分析的基础上形成主题概念。分析出哪些是主要的,哪些是次要的。在着手检索之前,首先要明确检索目的,了解检索课题的内容及性质,明确其学科或专业范围等。这些主要通过对研究课题的分析来确定,在此基础上形成检索的主题概念,明确课题主要解决什么问题,需要什么性质和内容的文献,并根据检索目的确定检索范围(包括学科范围,文献类型范围,时间范围)。最后要分析哪些是已知检索线索,了解和掌握有关学科的专家学者以及研究机构等目前的有关课题,为检索提供充分而有利的条件。 查找某概念的确切含义:如“什么是猪流感” 查找某概念的背景知识如:“最先发现了猪流感的世界地区” 查找某些事物的数值及量化指标:如“2003
24、-2004我国肺癌的发病率”如“阿司匹林的中毒剂量” 查找某一类学科一般知识:如“有关海南旅游文化的专著” 查找学科专业领域的新进展:“有关端粒酶与白血病相关性研究的综述文献” 查找专业课题相关的研究文献;“端粒酶在诊断白血病方面的价值评估”特征型知识(事实、数值类数据库、搜索引擎)关联型知识(文献数据库)文献信息检索的步骤2 2、制定检索策略、制定检索策略 检索策略是指为实现检索目标而制定的全盘计划或方案,一般包括以下6个方面:1 1)确定回溯年限和查找范围。)确定回溯年限和查找范围。从某年起或某个时间段,范围可以是国内或国外,也可以是指某个文种;2)2)选择检索手段选择检索手段。检索手段包
25、括:手工检索(效率最低)、联机检索(花费高昂)、光盘检索(检索范围受限)和网络检索(缺乏系统有序化)。检索手段的选择,一方面取决于本人或本单位掌握的有关资源,同时受到课题目的和要求等课题因素的影响。文献信息检索的步骤3)3)选择检索检索工具或数据库选择检索检索工具或数据库。如上所述,每种检索手段都有自己的优势,亦有缺陷,当我们选择检索工具时,就要利用检索手段的优势而避其短,在分析课题的基础上,基于对检索工具的认知,选择最能帮助我们直接达到检索目标的检索工具(或数据库)。 手工检索手工检索可选择的检索工具大体有:书目;印刷型索引(如全国报刊索引)、文摘、综述等;参考型工具书;专著;教科书等。光盘
26、检索光盘检索可利用的检索工具有:各种光盘版的文献数据库(如中国学术期刊全文数据库光盘版、人大复印资料全文数据库光盘版等)。联机检索联机检索可选择的检索工具有:各种联机文献数据库(如Dialog、ORBIT、ISA-IRS、MEDLINE联机文献检索系统等) 网络检索网络检索可选择的检索工具有:各图书馆的书目检索系统(如惠州学院图书馆馆藏检索系统)、数字图书馆书目检索系统(如超星数字图书馆馆藏检索)、期刊论文文摘或全文数据库(如中国期刊网)、学位论文文摘或全文数据库(如中国优秀博硕士论文数据库),等网上可靠的可利用的一切资源。 文献信息检索的步骤4 4)选择检索方法。)选择检索方法。检索方法分为
27、常用法、追溯法及综合法常用法、追溯法及综合法。常用法常用法:倒查法检索年代由近及远,这是最基本的检索方法。顺查法检索年代由远及近。主要用于有确切起始年代的文献的查找。抽查法选择课题内容最活跃、成果最多的时期做重点查找。追溯法:追溯法:利用引文索引或综述、述评、专著等文后所附的参考书目信息,追溯查找原文,再由此大检索面的方法。综合法:综合法:是常用法与追溯法结合起来使用的方法。 5 5)确定检索途径)确定检索途径大多数检索工具都能提供几种主要的检索途径,如分类、主题词、著者、机构、刊名、关键词、摘要等等。可根据课题要求和已掌握的信息来决定选择何种检索途径,输入检索词。检索词就是文献加工的标引词,
28、也是我们在文献检索过程中所使用的“钥匙词”。它必须在课题分析的基础上,提取出来,尽可能地全部拟出,首先选择与检索意图最为切合的词作为检索词,再根据检索结果需要进行检索调整时,再按照切合程度而修正检索词的选择。 6 6)构造检索式)构造检索式构造检索式,主要在计算机检索中使用,这里介绍的是布尔逻辑算式,由ANDAND、OROR、NOTNOT或其他算符连接检索词而构成。文献信息检索的步骤3 3、索取原文、索取原文 尽可能完整记录文献线索;通过图书馆馆藏查找原文;通过数据库获取全文;透过馆际互借获取资料;查找原文收藏单位,再联系借阅或复制;根据著者及单位名称和地址,向著者索取;向出版机构购买。注:资
29、源的搜寻注:资源的搜寻传统资源:传统资源:人、书籍、杂志、影视是探究学习很好的资源网络资源网络资源:适合探究学习需要的资源,往往来自教育外部的专业机构网站,一些教育内部建设的教育网站有时会提供教育信息的代理服务资源导航。需要掌握一些必要的搜索引擎使用技巧信息检索效率一、衡量信息检索效率的指标二、检索效率的基本特性三、影响信息检索效率的基本因素四、提高查全率的措施五、提高查准率的措施衡量信息检索效率的指标一、衡量信息检索效率的指标 被检出的文献: 有关文献 a 无关文献 b 未被检出的文献: 有关文献 c 无关文献 d 查全率R 查准率P 总量存储的某一课题的文献查出的有关文献量查出的文献总量查
30、出的有关文献量%100 baa%100 caa 漏检率 O 误检率N 查全率和漏检率是互补的,查准率和误检率是互补的%100 cac总量存储的某一课题的文献未被查出的有关文献量查出的文献总量查出的无关文献量%100 bab如图所示:P高则R底;R高则P底要取得较好的检索效果应兼顾二者,一般,查全率为:6070 查准率为:4050 RP0影响信息检索效率的基本因素1、检索系统的质量(数据库)和所用的检索语言2、检索人员的知识和技能 文献检索知识 知识 外语知识 三方面的知识都要 科技专业知识检索技能的高低表现在: 1)了解和熟悉有关专业领域的各类检索工具,具备选择检索工具的能力 2)准确分析信息
31、需求 3)准确表达信息需求 4)善于利用各种检索途径 5)善于辨识信息来源 6)善于调节查全率和查准率提高查全率的措施1、控制同义词、近义词 众多同义词中只能有一个词作为正式主题词。 众多的近义词中,选择一个词代替其它词,把这个词的定义放宽,这样相关的内容、接近的文献都集中到一个主题词下面,这样查全率提高,但准确率下降了。2、词的关联法,利用上位词进行标引与检索,提高查全率3、字形控制法,利用截词手段使同一词根的词组合在一起便于检索,提高查全率4、利用倒置排列把同一类物体集中在一起提高查准率的措施提高查准率的措施1、用下位概念词2、采用概念组配法,把两个或两个以上的概念组配在一起,表达内涵深的主题内容,即提高专指度3、联号法4、职号法5、加权法
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。