1、第一章第一章 绪论绪论 教学目的和要求教学目的和要求 了解医学信息资源的基本概念和知识;了解医学信息资源的基本概念和知识;熟悉信息检索的基本理论和方法;掌握计算机检索的原熟悉信息检索的基本理论和方法;掌握计算机检索的原理和技术。理和技术。主要内容:主要内容:第一节第一节 信息、知识、情报与文献信息、知识、情报与文献 第二节第二节 信息资源的类型与特征信息资源的类型与特征 第三节第三节 图书馆文献利用图书馆文献利用 第四节第四节 文献检索文献检索 第五节第五节 文献检索工具与步骤文献检索工具与步骤(自学)自学)第六节第六节 计算机文献检索的基本技术计算机文献检索的基本技术第一节第一节 信息、知识
2、、情报与文献信息、知识、情报与文献一、信息一、信息1概念:物质存在或运动方式与状态的表现。概念:物质存在或运动方式与状态的表现。2 特点:(特点:(1)不同事物具有不同的存在状态和运动方)不同事物具有不同的存在状态和运动方式,会表现出不同的信息;(式,会表现出不同的信息;(2)信息必须借助某种介)信息必须借助某种介质才能表现和传递;(质才能表现和传递;(3)广泛存在。)广泛存在。3 医学信息医学信息:通过观察、实验或其它工具对健康:通过观察、实验或其它工具对健康/疾病疾病人体生理或病理或疾病状态特征的认识及其反映。例如:人体生理或病理或疾病状态特征的认识及其反映。例如:人体脉搏、呼吸、温度、疾
3、病状态下的各种体征与症状、人体脉搏、呼吸、温度、疾病状态下的各种体征与症状、医学实验室的检测数据。医学实验室的检测数据。4分类:分类:二、知识1 概念概念 知识是指人类在改造世界的实践中所获得的认识和经验的总和即被人理解和认识、系统化了的信息。2分类三、情报情报1 概念概念 指以一定的方式传递、交流有一定指以一定的方式传递、交流有一定的用途和时效的信息。的用途和时效的信息。2属性属性 由于情报是人们为一定目的进行搜集由于情报是人们为一定目的进行搜集的有价值的知识或信息,因此,它具有的有价值的知识或信息,因此,它具有传递性、知识性有效用性。传递性、知识性有效用性。3分类分类四、文献文献1概念概念
4、记录有信息并起到传递知识、情报作记录有信息并起到传递知识、情报作用的载体。用的载体。2四要素:信息、知识与情报(内容);四要素:信息、知识与情报(内容);载体(存在方式);记录手段;符号载体(存在方式);记录手段;符号(表现方式)。(表现方式)。文献知识情报信息五、信息、知识、情报与文献的关系第二节 信息资源的类型与特征一、文献信息资源类型的划分(一)按载体划分1书写型2 印刷型3缩微型4视听型5电子或数字型(二)按出版形式划分1.图书;2.期刊;3.科技报告;4.专利文献;5.会议文献;6.国际机构及政府出版物;7.学位论文;8.标准文献;9.技术档案;10.产品资料;11.其他文献(三)按
5、文献内容加工深度1一次文献 以作者本人的工作经验、观察或实际科研成果为依据而创作的已经正式发表的文献。特点:内容新颖、成熟;叙述具体、详尽;数量庞大、分散。2二次文献 对一次文献进行加工整序后形成的文献。特点:有汇集性、工具性、综合性、系统性等。(三)按文献内容加工深度3三次文献 利用二次文献的基础上对一次文献做出的系统整理和概括论述,并加以分析、综合编写而成的文献。包括:综述、参考工具书、文献指南。特点:浓缩、针对、具有参考性和指引性。4零次文献 没有正式发表或未进行社会交流的原始文献。特点:内容新颖但不成熟。不公开,较难获得(也叫特种文献)。(四)按内容的公开程度划分1.白色文献:公开发表
6、的文献。出版社、书店、邮 局正规渠道发行2.灰色文献:非公开发现的内部文献或限制流通的 文献,例如:内部期刊、产品资料等。3.黑色文献:具有密级性质,非公开发表和交流的 文献,例如:未解密的档案等。二、医学信息资源的特点1数量庞大2载体多样化3语言障碍增加4重复发表、学科交叉与出版分散5知识、信息更新加快6出版时滞严重第三节 图书馆文献利用一、图书分类与排架 图书分类是按照图书内容的学科性质或其他特征将馆藏图书予以揭示并分门别类组织排列的一种手段。我馆采用中国图书馆图书分类法(简称中图法)。实行分类排架。二、中图法简介中图法中图法基本部类基本部类5 5个,基本大类个,基本大类2222个,其体系
7、结构如下:个,其体系结构如下:1.马列、毛邓:A 马列、毛泽东思想2.哲 学 :B 哲学3.社会科学 :C 社会科学总论;D 政治、法律;E 军事;F 经济;G 文化、科学、教育;H 语言、文字;I 文学;J 艺术;K 历史、地理。4.自然科学:N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学;R 医学、卫生 S 农业科学;T 工业技术 U 交通运输;V 航空、航天 X 环境科学、劳动保护科学5.综合性图书:Z 综合性图书 R R 医药卫生医药卫生R1 R1 预防医学、卫生学预防医学、卫生学R2 R2 中国医学中国医学R3 R3 基础医学基础医学R4 R4 临床医学临床
8、医学R5 R5 内科学内科学R6 R6 外科学外科学R75 R75 皮肤病学与性病学皮肤病学与性病学R76 R76 耳鼻咽喉科学耳鼻咽喉科学 R77 R77 眼科学眼科学R8 R8 特种医学特种医学R9 R9 药学药学每个二级类目又分为若干三级、四级、五级类目,如每个二级类目又分为若干三级、四级、五级类目,如R2R2中国医学中国医学 :(三级类)(三级类)(四级类)(四级类)(五级类)(五级类)R21 中医预防、卫生学中医预防、卫生学 R241中医诊断学中医诊断学 R246.1内科内科R22 中医基础理论中医基础理论 242中医治疗学中医治疗学 R246.2外科针刺麻醉法外科针刺麻醉法 245
9、针灸学、针灸疗法针灸学、针灸疗法 R246.3妇产科妇产科R24 中医临床学中医临床学 R246.4小儿科小儿科R25 中医内科中医内科 246针灸疗法临床应用针灸疗法临床应用 R246.5肿瘤科肿瘤科R26 中医外科中医外科 247其他疗法其他疗法 R246.8五官科五官科R271 中医妇产科中医妇产科 248中医护理学中医护理学 R246.82眼科眼科R272 中医儿科中医儿科 249医案医话医案医话 R246.83口腔科口腔科R273 中医肿瘤科中医肿瘤科 R246.9其他其他R274 中医骨伤科中医骨伤科 R275 中医皮肤科中医皮肤科R276 中医五官科中医五官科R277 中医其他学
10、科中医其他学科R278 中医急症学中医急症学R28 中药学中药学R289 方剂学方剂学R29 中国少数民族医学中国少数民族医学三、索书号索书号的结构 中图法的索书号的结构一般由字母数字混合号码组成,前面的为分类号,后面的为种次号或著者号。分类号反映学科属性,书次号由种次号、版次号和卷次号组成。有的时候,图书馆有一些本馆使用规定,在书次号会进一步区分。索书号举例(一)红楼梦红楼梦索书号索书号I242.4/192I242.4/192索书号举例索书号举例(二)(二)化学工程实验化学工程实验索书号索书号TQ02-33/2TQ02-33/2索书号举例(三)索书号举例(三):我校图书馆的索书号我校图书馆的
11、索书号循证医学实践和教学循证医学实践和教学(詹思延译)索书号(詹思延译)索书号R4/4224R4/4224第四节 信息检索一、基本概念 1广义:包括两个过程 一是信息存储,即把大量分散的无序的信息集中起来,经过加工,使之有序化、系统化,成为有功能的检索工具或检索系统。二是信息检索,利用已组织好的检索工具或检索系统,按照课题的要求将所需信息查找出来。2狭义:只包含信息检索二、检索原理与检索语言二、检索原理与检索语言1、检索原理、检索原理 是指通过一定的方法和手段,使信息存储与检索两个过程所采用的特征和标识达到一致,以便有效地获取和利用文献。存储过程对文献进行标引 检索过程根据需求,确定提问式2、
12、检索语言、检索语言 (1)含义与作用 含义:检索语言是一种在文献存储和检索过程中共同使用的语言。用它来描述文献特征,表达信息提问,并使两者能相互沟通。作用:通过它标引文献的研究内容,表达出文献的主题内容及其外部特征。(2)检索语言的分类反映文献外部特征 著者索引、篇名索引、序号索引、引文 索引等反映文献内容特征 分类检索语言、主题检索语言(主题词、关键词)、代码检索语言等。三、检索途径1篇名途径2著者途径3主题词途径4关键词途径5分类途径6刊名途径7序号途径8其它途径第六节第六节 计算机检索原理和检索技术计算机检索原理和检索技术 一、一、计算机检索原理计算机检索原理 二、二、数据库知识数据库知
13、识三、计算机检索技术三、计算机检索技术四、四、计算机检索步骤计算机检索步骤五、五、检索策略的制定检索策略的制定、检索举例检索举例六、检索技巧六、检索技巧七、检索效果评价七、检索效果评价打开数据库打开数据库输入检索提问输入检索提问(检索式)(检索式)在索引词典文档中比较和匹配在索引词典文档中比较和匹配从记录号倒排文档中调取记录号集合从记录号倒排文档中调取记录号集合记录号集合间的逻辑运算记录号集合间的逻辑运算顺排文档中调取记录顺排文档中调取记录输出命中记录输出命中记录结束检索结束检索 记录内容不合要求记录内容不合要求重新调整检索策略重新调整检索策略 篇数不合要求篇数不合要求 结果不匹配结果不匹配重
14、新输入检索标识重新输入检索标识 另选数据库另选数据库一、计算机信息检索原理(参考下图)一、计算机信息检索原理(参考下图)需需要要指指出出的的是是,用用户户在在检检索索过过程程中中,如如果果发发现现有有以以下下三三种种情情况况:(1 1)对对所所输输入入的的检检索索词词,系系统统响响应应为为“0 0”,即即检检索索词词与与索索引引词词典典中中标标识识词词不不匹匹配配;(2 2)对对所所输输入入的的检检索索词词,系系统统响响应应的的篇篇数数或或者者太太多多,或或者者太太少少;(3 3)对对所所输输入入的的检检索索词词,系系统统最最后后给给出出的的记记录录并并不不合合乎乎课课题题要要求求。可可以以通
15、通过过或或者者换换用用其其他他数数据据库库,或或者者重重新新输输入入检检索索词词,或或者者调调整整检检索索策策略略的的办办法法予予以以解解决决。二、数据库知识(一)二、数据库知识(一)类型(按内容性质分)类型(按内容性质分)1、文献型数据库、文献型数据库(全文数据库;书目型数据库)(全文数据库;书目型数据库)如:如:VIP、CNKI、CBM 2、非文献型数据库、非文献型数据库(数值型、事实型、(数值型、事实型、概念型、图像型概念型、图像型等数据库。)等数据库。)数值型数据库:存贮有科学数据,统计资料等数据。数值型数据库:存贮有科学数据,统计资料等数据。事实型数据库:存贮有企业名录、百科全书、人
16、名录事实型数据库:存贮有企业名录、百科全书、人名录 等有利用价值的信息。等有利用价值的信息。概念型数据库:存贮有各种名词属于或语言资料,一概念型数据库:存贮有各种名词属于或语言资料,一 般来源于词典等。般来源于词典等。图像型数据库:存贮有某些图象信息,如图片、云图、图像型数据库:存贮有某些图象信息,如图片、云图、工程设计图等。工程设计图等。数据库由文档组成;文档由记录组成;记录由字段组成。数据库由文档组成;文档由记录组成;记录由字段组成。字段:字段:字段的构成字段的构成=字段标识符字段标识符+字段值字段值 字段的类型:字段的类型:三种三种 检索系统存取号检索系统存取号AN(Accession
17、Number)基本索引字段(基本索引字段(Basic index fields)如)如Ti、Ab、De等等 (表达的文献的内容特征)表达的文献的内容特征)辅助索引字段(辅助索引字段(Addition Index Fields)如:)如:Au、Py、Jn、La、Dt等等,表达的是文献的外部特征。,表达的是文献的外部特征。常用文献数据库的字段代码及其表示法(见下页)常用文献数据库的字段代码及其表示法(见下页)(二)(二)数据库的结构:数据库的结构:以书目数据库为例以书目数据库为例字段代码字段代码 字段名字段名 表示方法表示方法TI Title apple?in tiAB Abstract mach
18、ine in ab DE Descriptors building in deAU Author au=liuBN ISBN bn=0-5635-0144-4CC CAL Classification(分类号)分类号)cc=921CD Conference Date cd=19960501CL Conference Location(会址)会址)cl=hangzhouCT Conference Title ct=robotics and au tomationCY Conference Year cy=1996DT Document Type dt=bookLA Language la=eng
19、lishPY Publication Year py=1990SN ISSN sn=1060=9857SO Source Publication so=power记录记录:由字段组成。:由字段组成。分类号:分类号:R512.91 记录号:记录号:2008062702 著著 者:者:李新萍李新萍等等篇篇 名:营养支持疗法对改善艾滋病病人营养状况的名:营养支持疗法对改善艾滋病病人营养状况的效果观察效果观察 刊刊 名:名:护理研究护理研究 信息出处:信息出处:2007;21(11A):2861-2863 关键词关键词艾滋病艾滋病;效果效果;营养支持营养支持文档文档:由记录组成,根据记录在文档内的组织
20、方式由记录组成,根据记录在文档内的组织方式和存取方法,文档分为:顺排文档和倒排文档。和存取方法,文档分为:顺排文档和倒排文档。顺排文档(也称主档)顺排文档(也称主档):按文献存取号先后顺序排按文献存取号先后顺序排列的,列的,相当于检索工具正文部分。相当于检索工具正文部分。倒排文档倒排文档:相当于检索工具中根据需要而编制的各相当于检索工具中根据需要而编制的各种索引。种索引。数据库是由若干文档构成。数据库是由若干文档构成。三、计算机检索技术(见教材计算机检索技术(见教材P20)1、布尔逻辑检索功能、布尔逻辑检索功能 2、词间位置检索功能、词间位置检索功能 3、截词检索功能、截词检索功能 4、字段限
21、定检索功能、字段限定检索功能1、布尔逻辑检索功能布尔逻辑检索功能:用布尔逻辑算:用布尔逻辑算符来组配检索词以确定文献的命中与符来组配检索词以确定文献的命中与否。其算符的相互匹配方式一共有否。其算符的相互匹配方式一共有8种,用来进行文献检索的主要有种,用来进行文献检索的主要有3种:种:逻辑与(逻辑乘)逻辑与(逻辑乘)逻辑或逻辑或 逻辑非逻辑非 (1)逻辑与(逻辑乘)逻辑与(逻辑乘)用运算符号:用运算符号:AND 或或*连接检索词连接检索词 例查例查 “有关计算机在图书馆中的应用有关计算机在图书馆中的应用”的文献,的文献,检索式检索式=计算机计算机 AND 图书馆图书馆 例查例查 “艾滋病鸡尾酒疗
22、法艾滋病鸡尾酒疗法”检索式检索式=艾滋病艾滋病*鸡尾酒鸡尾酒 用文氏图表示:图用文氏图表示:图1-1 A AND B A B(2)“逻辑或逻辑或”用运算符号用运算符号“OR”或或“+”连接两检索词连接两检索词 例例1 查查“乙肝或病毒性肝炎乙肝或病毒性肝炎”方面的文献方面的文献 检索式检索式=乙肝乙肝 OR 病毒性肝炎病毒性肝炎 它在同义词检索中使用,能提高查全率。它在同义词检索中使用,能提高查全率。例例2 查查“计算机或机器人计算机或机器人”方面的文献方面的文献 检索式检索式=计算机计算机+机器人机器人 用文氏图表示如下:用文氏图表示如下:A OR B A B(3)“逻辑非逻辑非”用运算符号
23、用运算符号“NOT”或或“”连接两检索词连接两检索词 A AND NOT B 有的书上也称为有的书上也称为“与非与非”关系,即关系,即“逻辑乘逻辑乘”与与“逻辑非逻辑非”例例1 查查“非病毒性肝炎非病毒性肝炎”方面的文献。方面的文献。检索式检索式=肝炎肝炎 NOT 病毒性肝炎病毒性肝炎 例例2 查查“不是铝合金的合金不是铝合金的合金”方面的文献。方面的文献。检索式检索式=合金合金铝铝 用文氏图表示:用文氏图表示:图图1-3 A NOT B A B总结:总结:布尔逻辑检索是把任何检索课题加布尔逻辑检索是把任何检索课题加工成可以进行逻辑运算的表达式,这是工成可以进行逻辑运算的表达式,这是计算机检索
24、的一种被广泛采用的匹配方计算机检索的一种被广泛采用的匹配方式。布尔逻辑运算的优点是简单明确、式。布尔逻辑运算的优点是简单明确、易于理解、符合人们的思维习惯易于理解、符合人们的思维习惯2、词间位置检索功能、词间位置检索功能 文献记录中词语的相对次序不同,所表达的意文献记录中词语的相对次序不同,所表达的意思就可能不同。同样在检索式中,检索词的相思就可能不同。同样在检索式中,检索词的相对次序不同,表达的检索意图也不一样,布尔对次序不同,表达的检索意图也不一样,布尔逻辑运算符有时难以表达某些检索课题的确切逻辑运算符有时难以表达某些检索课题的确切提问要求,用词间位置算符来限定和组配检索提问要求,用词间位
25、置算符来限定和组配检索词,可弥补布尔逻辑算符只是定性规定检索词词,可弥补布尔逻辑算符只是定性规定检索词的范围,而没有限定检索词位置关系,易造成的范围,而没有限定检索词位置关系,易造成误检的不足。误检的不足。词间位置检索技术词间位置检索技术就是利用一些特定的就是利用一些特定的位位置算符置算符来表达检索词之间的位置关系,并来表达检索词之间的位置关系,并且可以不用叙词表而直接使用自由词进且可以不用叙词表而直接使用自由词进行检索的方法。有的书上还把这种检索称行检索的方法。有的书上还把这种检索称为原文检索。这种检索在利用为原文检索。这种检索在利用TI和和AB途径途径检索时,对检索质量影响很大。检索时,对
26、检索质量影响很大。例:检索例:检索“小麦中氨基酸小麦中氨基酸”(determination of amino acids in wheat)检索式:检索式:determination with amino acids with wheat 词间位置算符在不同系统中的使用方法不同:词间位置算符在不同系统中的使用方法不同:L在在Dialog 系统中主要位置算符及其使用方法:系统中主要位置算符及其使用方法:L在在SPIRS系统中,位置算符只使用两个:系统中,位置算符只使用两个:with、near其含义见书。其含义见书。那么,位置算符的应用,能缩小检索范围那么,位置算符的应用,能缩小检索范围 提高查准
27、率。提高查准率。3、截词检索功能截词检索功能 截词运算符号有两个截词运算符号有两个:“?、?、*”L其在不同系统中表示的含义不同。其在不同系统中表示的含义不同。见书见书111 L在在SPIRS系统中?为有限截断、系统中?为有限截断、*为无限截断;为无限截断;L在中刊库中只有?表示无限截断。在中刊库中只有?表示无限截断。例:例:1、teen*teen,teens,teenage,teenager等等。2、teen?Teen,teens,teenage(在词尾加?号,以?号的个数表示词后最多(在词尾加?号,以?号的个数表示词后最多可跟字母的个数)可跟字母的个数)L截词方式有很多,按截词位置可以分为
28、:截词方式有很多,按截词位置可以分为:L前截断(后方一直检索)前截断(后方一直检索):?Chemistry chemistry、biochemistry、electrochemistry physicochemistry(物理化学)等。(物理化学)等。注:注:在在SPIRS系统和中刊库中无系统和中刊库中无L后截断后截断(前方一直检索)(前方一直检索)例见书例见书111,chem*chemical(化学制品)、(化学制品)、chemism(化学机理)、(化学机理)、chemomorphosis(化学诱变)、(化学诱变)、chemosynthesis(化学(化学合成)等。合成)等。L中间截断中间截
29、断:wom?n 分别检出了分别检出了 woman,women两词两词fib?board 分别检出了分别检出了 fiberboard,,fibreboard两词。两词。L截词检索在中文数据库中截的是词意,截词检索在中文数据库中截的是词意,例:广西?例:广西?分别检出了:广西医科大学学报、广西大学、分别检出了:广西医科大学学报、广西大学、广西中医学院学报等。广西中医学院学报等。L在外文数据库中截的是词的后缀,截断在外文数据库中截的是词的后缀,截断派生出的词汇和原来的词义基本一致。派生出的词汇和原来的词义基本一致。例例“金属金属”metal*metal、metals、metaled、metalist
30、等。等。L利用截词检索时,注意截词的部位,一定不能截的太利用截词检索时,注意截词的部位,一定不能截的太深,否则误检率会很大。深,否则误检率会很大。4、字段限定检索功能字段限定检索功能 将将检索词限定检索词限定在某一字段中,检索时,计算机只对限定字在某一字段中,检索时,计算机只对限定字段进行运算,以提高检索效果。常用的检索符号有:段进行运算,以提高检索效果。常用的检索符号有:in、=、例例1:English in la 例例2:py1992 总结总结:在一个复杂的检索式中,不仅可以有多个运算符,:在一个复杂的检索式中,不仅可以有多个运算符,也可以使用括号来指定运算的优先顺序、以及体也可以使用括号
31、来指定运算的优先顺序、以及体 现概念的完整性。现概念的完整性。例例3:查:查“玉米方面的英文玉米方面的英文”文献文献 检索式检索式=(maize or zea-mays or corn)in de and(English in la)l 所以,计算机检索就是使用这些检索所以,计算机检索就是使用这些检索技术来实现文献情报的有无、多少、异技术来实现文献情报的有无、多少、异同的比较,以达到检索的目的,在结合同的比较,以达到检索的目的,在结合使用这些方法的时,一定要注意,每一使用这些方法的时,一定要注意,每一个概念表达的完整性,注重括号的使用个概念表达的完整性,注重括号的使用。四、计算机检索步骤四、计
32、算机检索步骤1、分析、理解课题、分析、理解课题2、选择检索系统和数据库、选择检索系统和数据库3、选择检索词、构造检索式、选择检索词、构造检索式4、上机实检、上机实检1、分析、理解课题、分析、理解课题(1)了解用户信息需求的目的和意图)了解用户信息需求的目的和意图目的和意图不同,检索式、范围就不同目的和意图不同,检索式、范围就不同(2)分析主题要求)分析主题要求分析检索课题涉及的学科范围、以便选定合适分析检索课题涉及的学科范围、以便选定合适的检索系统和数据库。的检索系统和数据库。分析主题内容:主题的广度和深度。分析主题内容:主题的广度和深度。(3)时间要求)时间要求 2、选择检索系统和数据库、选
33、择检索系统和数据库光盘检索系统比联机检索系统数据库更新周期长,光盘检索系统比联机检索系统数据库更新周期长,INTERNET 网上的各种信息查询工具,对网上许多免费的数网上的各种信息查询工具,对网上许多免费的数据库进行检索和下载。据库进行检索和下载。3、选检索词、构造检索式、选检索词、构造检索式 (1)检索词:是表达文献信息需求的基本元素,是计算机检索)检索词:是表达文献信息需求的基本元素,是计算机检索 系统系统 中有中有 关数据库进行匹配的基本单元。关数据库进行匹配的基本单元。(2)检索式的构造)检索式的构造 检索式:检索式:就是指计算机信息检索系统中用来表达检索提问的逻就是指计算机信息检索系
34、统中用来表达检索提问的逻 辑表,由检索词和各种运算符及系统规定的其它组配辑表,由检索词和各种运算符及系统规定的其它组配 符构成。符构成。4、上机实检、上机实检 四、检索策略的制定:四、检索策略的制定:(一)检索策略:(一)检索策略:是全盘计划与方案,为了尽是全盘计划与方案,为了尽 可能不失真地把拥护的信息需求转换成检索系统可能不失真地把拥护的信息需求转换成检索系统 允许接受的形式,首先要了解用户的检索目的和允许接受的形式,首先要了解用户的检索目的和 要求,对用户提出的检索课题进行全面的分析研要求,对用户提出的检索课题进行全面的分析研 究,为选择检索词,编写检索式作好准备,然后究,为选择检索词,
35、编写检索式作好准备,然后 根据检索课题的要求选择合适的数据库和检索系根据检索课题的要求选择合适的数据库和检索系 统,开始检索后,要根据检索的具体情况及时调统,开始检索后,要根据检索的具体情况及时调 整检索策略,使检索结果符合用户的要求整检索策略,使检索结果符合用户的要求。即(即(1)列出待检课题的学科范围、主题范)列出待检课题的学科范围、主题范围等。围等。(2)确定检索词和词的截断部位,调整)确定检索词和词的截断部位,调整词之间的位置关系及组配关系。词之间的位置关系及组配关系。(3)选择相关数据库,确定检索途径。)选择相关数据库,确定检索途径。(4)拟定检索式。)拟定检索式。(5)实检与反馈调
36、节)实检与反馈调节。(二)、选择检索词应注意问题。(二)、选择检索词应注意问题。(1)该词的所有拼写形式和方法(包括同义词,元素和元)该词的所有拼写形式和方法(包括同义词,元素和元素符号、缩写和全称等)素符号、缩写和全称等)(2)该词的广义词、狭义词、相关词及多义词等。)该词的广义词、狭义词、相关词及多义词等。(3)该词的最佳截断部位该词的最佳截断部位(4)应包括那些非主题的词。如;)应包括那些非主题的词。如;LA,PY等。等。(5)参考有关的叙词表(汉语主题词表),在)参考有关的叙词表(汉语主题词表),在SPIRS系统系统中应充分利用中应充分利用INDEX=F5(检查人名的正确表示方式和检查
37、拼写等)和叙词表(检查人名的正确表示方式和检查拼写等)和叙词表THESAURUS=F9(选准同义词和相关词)(选准同义词和相关词)(6)对于泛指的主题概念词,应选用其包容特性的具体内)对于泛指的主题概念词,应选用其包容特性的具体内容来表达:容来表达:例:癌症治疗例:癌症治疗方面的文献方面的文献 (liver or lung or)and cancer and therapy 例:例:哺乳动物胚胎发育方面的文献哺乳动物胚胎发育方面的文献(sheep or pig or cow or.)and embryo and development 代替代替 mammal animal and embryo
38、 and development(7)具有层次结构或等级关系的主题概念,应用其包容)具有层次结构或等级关系的主题概念,应用其包容特性的名称来表达:特性的名称来表达:例例:手足真菌方面的文献手足真菌方面的文献 (hand or foot)and fungi(8)当课题面窄,提问专指度高,而数据库中对文献)当课题面窄,提问专指度高,而数据库中对文献的标引深度可能不足时,对检索词可进行粗化,取其的标引深度可能不足时,对检索词可进行粗化,取其上位检索词上位检索词例:例:玉米同功酶方面的文献:玉米同功酶方面的文献:isozymes enzymes(三)、拟定检索式要求:(三)、拟定检索式要求:(1)表达
39、课题要求)表达课题要求(2)必须与数据库文献标识相匹配)必须与数据库文献标识相匹配(3)简单明了)简单明了(4)检索效果的要求)检索效果的要求 即检索结果的查全率、查准率。所需文献的即检索结果的查全率、查准率。所需文献的大概数大概数 量是否提供原始文献等。量是否提供原始文献等。查全率要求较高时:选择检索词的主题概念查全率要求较高时:选择检索词的主题概念范围要宽一些。范围要宽一些。查准率要求较高时:选择检索词的主题范围查准率要求较高时:选择检索词的主题范围要窄一些,专指度要高一些。要窄一些,专指度要高一些。对于同时提供原文:选用全文数据库对于同时提供原文:选用全文数据库(5)检索费用及其他要求检
40、索费用及其他要求:例:癌症治疗例:癌症治疗方面的文献方面的文献 (liver or lung or)and cancer and therapy 例:例:哺乳动物胚胎发育方面的文献哺乳动物胚胎发育方面的文献(sheep or pig or cow or.)and embryo and development 代替代替 mammal animal and embryo and development(7)具有层次结构或等级关系的主题概念,应用其包容)具有层次结构或等级关系的主题概念,应用其包容特性的名称来表达:特性的名称来表达:例例:手足真菌方面的文献手足真菌方面的文献 (hand or foo
41、t)and fungi(8)当课题面窄,提问专指度高,而数据库中对文献)当课题面窄,提问专指度高,而数据库中对文献的标引深度可能不足时,对检索词可进行粗化,取其的标引深度可能不足时,对检索词可进行粗化,取其上位检索词上位检索词例:例:肝肿瘤方面的文献:肝肿瘤方面的文献:肝肿瘤肝肿瘤 消化系肿瘤消化系肿瘤(三)、拟定检索式要求:(三)、拟定检索式要求:(1)表达课题要求)表达课题要求(2)必须与数据库文献标识相匹配)必须与数据库文献标识相匹配(3)简单明了)简单明了 六、检索技巧六、检索技巧检索技巧检索技巧主要是对逻辑运算符、词间位置算符、检索主主要是对逻辑运算符、词间位置算符、检索主题概念的提
42、取方法等的综合应用,其目的是保证查全题概念的提取方法等的综合应用,其目的是保证查全和查准率和查准率.(一一)扩大检索结果的方法扩大检索结果的方法 1、同义词检索技术、同义词检索技术:应考虑:应考虑 (1)元素和元素符号,例:元素和元素符号,例:“AI”和和“Aluminium”(2)缩写和全称,例:缩写和全称,例:“计算机辅助设计计算机辅助设计”和和“CAD”和和“Computer Aided Design”同时在外文数据库中仅用同时在外文数据库中仅用CAD作为主题词,误检率较大,作为主题词,误检率较大,“检验分析词典检验分析词典”、“弹药动力装置弹药动力装置”等都被检出。等都被检出。(3)相
43、关词,例:相关词,例:“Database”,其相关词有,其相关词有“Expert System”、“software”等。等。2、截断技术截断技术 3、布尔逻辑或、布尔逻辑或“OR”(二)缩小检索结果的方法(二)缩小检索结果的方法 1、布尔逻辑与布尔逻辑与“AND”2、布尔逻辑非、布尔逻辑非“NOT”3、字段限定检索、字段限定检索七、检索效果评价七、检索效果评价 检索效果是文献检索结果的有效程度,反映文献检索的有效性。文献检索效果评价的指标有查全率、查准率、漏检率和误检率。被检出相关文献量被检出相关文献量查全率:查全率:R=R=相关文献总量相关文献总量 被检出相关文献量被检出相关文献量查准率:查准率:P=P=被检出文献总量被检出文献总量 未检出相关文献量未检出相关文献量漏检率:漏检率:M=M=相关文献总量相关文献总量 被检出非相关文献量被检出非相关文献量误检率:误检率:N=N=被检出文献总量被检出文献总量 小结1.信息、知识、情报和文献的概念及其关系。2.文献的类型和特征。3.中图法4.信息检索语言与检索途径。5.数据库的基本知识与计算机检索的4种基本技术、检索策略的制定。6.检索效果的评价。