1、文献检索课文献检索课 三三文献信息检索步骤及技术文献信息检索步骤及技术v分析检索课题,明确检索需求分析检索课题,明确检索需求v选择检索工具或检索系统选择检索工具或检索系统v确定检索途径与检索方法确定检索途径与检索方法v选择合适的检索词选择合适的检索词v构造检索式构造检索式v根据文献线索查找全文根据文献线索查找全文v评价检索结果,调整检索策略,改善检索结评价检索结果,调整检索策略,改善检索结果果 v检索步骤示意图检索步骤示意图用户明确信息需求选择检索工具和方法确定检索途径和标识拟定检索式检索匹配输出结果用户评价获取信息不满意满意分析检索课题,明确检索需求分析检索课题,明确检索需求v目的一:目的一
2、:分析检索课题的主题要求。分析检索课题的主题要求。将检索课题分解将检索课题分解为多个层次的主题概念,明确用户对查全、查准、查为多个层次的主题概念,明确用户对查全、查准、查新方面的要求新方面的要求v目的二:目的二:明确检索课题所要求的各种范围或限定条件。明确检索课题所要求的各种范围或限定条件。包括要求的文献类型、语种、年代跨度等,以及对检包括要求的文献类型、语种、年代跨度等,以及对检索费用、检索时间等其他方面的要求。索费用、检索时间等其他方面的要求。选择检索工具或检索系统选择检索工具或检索系统v选择恰当的检索工具和检索系统是成功实施检索的关选择恰当的检索工具和检索系统是成功实施检索的关键步骤。检
3、索工具选择是否恰当、相关程度如何,直键步骤。检索工具选择是否恰当、相关程度如何,直接影响检索结果的好坏和检索效率的高低。接影响检索结果的好坏和检索效率的高低。v要熟悉各种检索工具的类型、特点和功用。比如馆藏要熟悉各种检索工具的类型、特点和功用。比如馆藏目录主要用于检索一馆或多馆收藏的文献资料;书目、目录主要用于检索一馆或多馆收藏的文献资料;书目、索引、文摘主要用于文献检索和事实检索。索引、文摘主要用于文献检索和事实检索。确定检索途径和检索方法确定检索途径和检索方法v一般检索工具都会提供多种检索途径,如主题、分类、一般检索工具都会提供多种检索途径,如主题、分类、著者、题名以及其他途径。著者、题名
4、以及其他途径。v检索途径的选择要根据检索需求和目前所掌握的检索检索途径的选择要根据检索需求和目前所掌握的检索条件来确定。条件来确定。如,检索要求泛指性强,所需文献范围较广,则适宜选择分如,检索要求泛指性强,所需文献范围较广,则适宜选择分类途径;若检索要求专指性强,则适宜选择主题途径;若事类途径;若检索要求专指性强,则适宜选择主题途径;若事先知道文献著者、题名、分子式、专利号等条件,则可利用先知道文献著者、题名、分子式、专利号等条件,则可利用著者途径、题名途径、分子式途径、专利号途径等进行检索。著者途径、题名途径、分子式途径、专利号途径等进行检索。v根据检索目的、期望的文献数量以及有关主题在学科
5、根据检索目的、期望的文献数量以及有关主题在学科中的发展状况来选择适当的检索方法。中的发展状况来选择适当的检索方法。若以查新为目的,则适宜选择逆查法,若要全面检索某个主若以查新为目的,则适宜选择逆查法,若要全面检索某个主题的相关资源,则适宜使用顺查法。题的相关资源,则适宜使用顺查法。选择合适的检索词选择合适的检索词v概念的分析概念的分析:任何一个特定的检索课题,往往都是用任何一个特定的检索课题,往往都是用若干个概念表达的若干个概念表达的,将检索课题从不同角度对课题内,将检索课题从不同角度对课题内容进行概念分析,并针对每一个概念,选择尽可能多容进行概念分析,并针对每一个概念,选择尽可能多的检索词。
6、主题概念转化而成的检索词应能准确、完的检索词。主题概念转化而成的检索词应能准确、完整地表达检索课题的内容。整地表达检索课题的内容。v实例实例:v如:检索课题:如:检索课题:“土壤环境条件对豆科作物固氮作用土壤环境条件对豆科作物固氮作用的影响的影响”v如果就从课题的题目中选择主题词:土壤环境、豆科如果就从课题的题目中选择主题词:土壤环境、豆科作物、固氮作用,这显然会造成很大的漏检率。我们作物、固氮作用,这显然会造成很大的漏检率。我们应利用自已所学的专业知识对课题进行深入细致的分应利用自已所学的专业知识对课题进行深入细致的分析,把那些与课题关系密切、能全面、准确表达课题析,把那些与课题关系密切、能
7、全面、准确表达课题内容实质的词一起作主题词。内容实质的词一起作主题词。v决定土壤环境条件的温度、湿度、决定土壤环境条件的温度、湿度、PH值等;值等;v豆科作物中的大豆、花生等;豆科作物中的大豆、花生等;v固氮作用中起重要作用的根瘤菌、固氮菌等。固氮作用中起重要作用的根瘤菌、固氮菌等。v隐含概念的分析隐含概念的分析有些课题的实质性内容往往很难从课题的名称上反映出来,有些课题的实质性内容往往很难从课题的名称上反映出来,有些课题单从字面上选择主题词会失之偏颇。课题的隐含的有些课题单从字面上选择主题词会失之偏颇。课题的隐含的概念和相关的内容需要从课题所属的专业角度作深入分析,概念和相关的内容需要从课题
8、所属的专业角度作深入分析,才能够提炼出能够确切反映课题内容的检索概念。才能够提炼出能够确切反映课题内容的检索概念。如如:检索检索“人造金刚石人造金刚石”方面的文献,其中方面的文献,其中“人造人造(manmade)的含义包括有)的含义包括有“人工合成(人工合成(synthetic)在内,)在内,单选用单选用“manmade”检索会漏掉许多有用的文献检索会漏掉许多有用的文献;检索检索“古代古代家具设计家具设计”的相关文献,古代包括明代、清代、宋代等朝代,的相关文献,古代包括明代、清代、宋代等朝代,不能仅以古代作为检索词。不能仅以古代作为检索词。v同义词应尽量选全:同一概念的几种表达式同义词应尽量选
9、全:同一概念的几种表达式v同一名词的单数、复数、动名词、过去分词等用截词同一名词的单数、复数、动名词、过去分词等用截词解决,如:解决,如:child,childrenv规范称谓、俗称、全称、简称等,如:盘丽鱼俗称七规范称谓、俗称、全称、简称等,如:盘丽鱼俗称七彩神仙鱼彩神仙鱼v充分利用选定主题概念的上位或下位概念,找不到课充分利用选定主题概念的上位或下位概念,找不到课题对应的主题词时,可采用最近一级的上位词。题对应的主题词时,可采用最近一级的上位词。如:如:“山核桃产品加工山核桃产品加工”方面的文章,如果方面的文章,如果“山山核桃加工核桃加工”没有检索记录的话,就得选没有检索记录的话,就得选“
10、核桃加工核桃加工”作检索词作检索词v充分考虑相关的词,如研究三带双锯鱼的生活习性,充分考虑相关的词,如研究三带双锯鱼的生活习性,假如找不到相关的文献,可以查找同属或同种的鱼类假如找不到相关的文献,可以查找同属或同种的鱼类的研究资料,借以参考。的研究资料,借以参考。v少用或不用对检索课题意义不大的词少用或不用对检索课题意义不大的词一般不选用动词、形容词、禁用词,少用或不用不能表达课一般不选用动词、形容词、禁用词,少用或不用不能表达课题实质的高频词。题实质的高频词。词义泛指过度大的词:如词义泛指过度大的词:如“展望展望”趋势、现状、近况等,趋势、现状、近况等,“应用应用”作用、用途、用法等作用、用
11、途、用法等词义延伸过多的词:如词义延伸过多的词:如“制造制造”制备、生产、加工、工制备、生产、加工、工艺等,艺等,“提炼提炼”精炼、提取、萃取、回收,以及诸如精炼、提取、萃取、回收,以及诸如“有机物有机物”、“无机物无机物”、“病虫害病虫害”等外延十分宽的概念等外延十分宽的概念等,一般都应转换成具体的方法或材料、化合物及具体的病等,一般都应转换成具体的方法或材料、化合物及具体的病害与虫害的名称表示。害与虫害的名称表示。构造检索式构造检索式v检索提问式是在计算机检索过程中用来表达用户检索检索提问式是在计算机检索过程中用来表达用户检索提问的逻辑表达式提问的逻辑表达式,由检索词和各种连接组配符号按照
12、由检索词和各种连接组配符号按照特定检索系统的语法组配在一起。特定检索系统的语法组配在一起。布尔检索式布尔检索式位置检索式位置检索式布尔逻辑检索布尔逻辑检索v利用布尔逻辑算符将一些具有简单的、利用布尔逻辑算符将一些具有简单的、表达某一主题概念的检索单元(或检索表达某一主题概念的检索单元(或检索标识)组配成一个具有复杂概念的检索标识)组配成一个具有复杂概念的检索式,以满足课题检索的要求。主要通过式,以满足课题检索的要求。主要通过“和和(and,*)”、“或或(or,+)”、“非非(not,-)”等将检索词联络起来等将检索词联络起来。逻辑算符逻辑算符含义含义表示关系表示关系作用及表达作用及表达“与与
13、”(AND 或或*)检索出的记录必检索出的记录必须同时含有所有须同时含有所有的检索词的检索词概念交叉和限定概念交叉和限定缩小检索范围缩小检索范围,提提高查准率高查准率A and B或或A*B“或或”(OR或或+)检出的结果中只检出的结果中只需满足检索项中需满足检索项中的任何一个或同的任何一个或同时满足即可时满足即可并列关系并列关系组配相同概念的组配相同概念的检索词,如同义检索词,如同义词、近义词等。词、近义词等。扩大检索范围扩大检索范围,提提高查全率高查全率A or B或或A+B“非非”(NOT或或-)检出的记录中只检出的记录中只能含有能含有NOT算符算符前的检索词,不前的检索词,不能同时含有
14、其后能同时含有其后的检索词的检索词概念删除关系概念删除关系缩小检索范围,缩小检索范围,提高检索的专指提高检索的专指度度A not B或或ABv逻辑算符举例逻辑算符举例查找关于查找关于“动物保护动物保护”的文献:的文献:“动物动物”和和“保护保护”可以用可以用“逻辑与逻辑与”组配,表示为组配,表示为“动动物物 AND 保护保护”,检出记录中既涉及动物又涉及保护的相关,检出记录中既涉及动物又涉及保护的相关文献。文献。查找有关冬虫夏草的文献:查找有关冬虫夏草的文献:冬虫夏草又称冬虫草、虫草冬虫夏草又称冬虫草、虫草,“冬虫夏草冬虫夏草”、“冬虫草冬虫草”、“虫草虫草”三者要用逻辑或组配,表示为三者要用
15、逻辑或组配,表示为“冬虫夏草冬虫夏草 or 冬虫冬虫草草 or 虫草虫草”,检索出文献中包含三者任意一种即被检出。,检索出文献中包含三者任意一种即被检出。查找关于国外建筑特色的文章查找关于国外建筑特色的文章:国外即不包括中国国外即不包括中国,建筑和中国之间为逻辑非的关系,表,建筑和中国之间为逻辑非的关系,表示为示为“建筑建筑 not 中国中国”,检索结果排除了中国建筑的相关文,检索结果排除了中国建筑的相关文献。献。检索西红柿种植技术的相关文章检索西红柿种植技术的相关文章:西红柿西红柿”又称又称“番茄番茄”,表示为,表示为“西红柿西红柿+番茄番茄”;“种植种植”的同义词有的同义词有“栽培栽培”、
16、“培育培育”,表示为,表示为“种植种植+栽培栽培+培培育育”;检索表达式为检索表达式为:(西红柿西红柿+番茄番茄)*(种植种植+栽培栽培+培育培育)v截词算符截词算符 截词检索主要是利用检索词的词干或不完整的词形进行检索。截词检索主要是利用检索词的词干或不完整的词形进行检索。截词符一般用截词符一般用“?”、“:”、“#”表示表示 1、后方截词、后方截词:用于前方一致的派生词检索。:用于前方一致的派生词检索。如:信息?如:信息?则表示在数据库中含有信息、信息技术、信息检索等方面的文献记录均则表示在数据库中含有信息、信息技术、信息检索等方面的文献记录均为命中文献。为命中文献。2、前方截词、前方截词
17、:用于后方一致的派生词检索。:用于后方一致的派生词检索。如:?经济如:?经济 则数据库中含有经济、工业经济、农业经济等方面的文献均为命中文献则数据库中含有经济、工业经济、农业经济等方面的文献均为命中文献3、中间截词、中间截词 将截词符放于一个字符串的中间,表示这个位置上的任意字符不影响将截词符放于一个字符串的中间,表示这个位置上的任意字符不影响该字符串的检索。它对于解决英美不同拼写、不规则的单复数变化等很该字符串的检索。它对于解决英美不同拼写、不规则的单复数变化等很有用。例如:有用。例如:analy?er可表示可表示analyzer和和analyser等不同拼写。等不同拼写。4、前后截词、前后
18、截词 字符串前后都有截词符,检索词与被检索词之间只需任意部分匹配即字符串前后都有截词符,检索词与被检索词之间只需任意部分匹配即可。例如:可。例如:“*computer*”或表示或表示“minicomputer”、“minicomputers”、“microcomputer”、“microcomputers”或或“computer”等词等词。截词检索在不同的计算机检索工具中规截词检索在不同的计算机检索工具中规定不同,请使用时请注意先了解。定不同,请使用时请注意先了解。v字段限制检索字段限制检索 为了缩小检索范围,可利用字段代码来限制为了缩小检索范围,可利用字段代码来限制 检索词出现的字段,以提高
19、检索速度和命中率。检索词出现的字段,以提高检索速度和命中率。字段符字段符=检索词检索词 如:如:au=Smith,J.C(查作者为查作者为Smith,J.C 的文章的文章)v位置运算符位置运算符vWith:设定需检索的两个词或词组必须按前后顺序出现在记设定需检索的两个词或词组必须按前后顺序出现在记录中。且两词之间不允许插入其它词;其扩展为录中。且两词之间不允许插入其它词;其扩展为nW,表示其表示其两侧的检索词之间最多可插入两侧的检索词之间最多可插入n个词。个词。v例例:dyslexia with childvNear:设定需检索的两个词或词组在同一语句中,相对于设定需检索的两个词或词组在同一语
20、句中,相对于“with”更接近。此外,在使用更接近。此外,在使用“near”运算符时,还可以在运算符时,还可以在该运算符前添加一个数字以便进一步限定两个词之间的邻近该运算符前添加一个数字以便进一步限定两个词之间的邻近程度,如程度,如“nN”设定需检索的两个词或词组在同一句子中且设定需检索的两个词或词组在同一句子中且相隔不超过相隔不超过3个单词。个单词。v例例:tongue near3 base,检索出来的结果就包括检索出来的结果就包括 tongue base;base of tongue;base of the tongue vIN:是用以限定某一个检索词必须出现在特定字段中的运算是用以限定某
21、一个检索词必须出现在特定字段中的运算符号。符号。例如:例如:cancer in TI表示检出文献必须满足表示检出文献必须满足cancer出现在记出现在记录的标题字段。录的标题字段。v命中文献量:命中文献量:ANDWITHNEARv词间相关性:词间相关性:NEARWITHAND根据文献线索,索取全文根据文献线索,索取全文v应用检索工具实施检索后,获得检索结果即为文献线应用检索工具实施检索后,获得检索结果即为文献线索,对文献线索进行整理,分析其相关程度,根据需索,对文献线索进行整理,分析其相关程度,根据需要,可利用文献线索中提供的文献出处,索取原文。要,可利用文献线索中提供的文献出处,索取原文。评
22、价结果,调整检索策略,改善检索结果评价结果,调整检索策略,改善检索结果v对检索结果进行评价,若检索结果不能满足用户的检对检索结果进行评价,若检索结果不能满足用户的检索需求,则需要对检索策略进行调整,以改善检索结索需求,则需要对检索策略进行调整,以改善检索结果。果。如何评价信息检索效果?准全检索效果评价检索效果评价 检索效果评价检索效果评价v查全率查全率是衡量系统在实施某一检索作业时检出相关文献能力是衡量系统在实施某一检索作业时检出相关文献能力的一种测度指标,其计算方法为:的一种测度指标,其计算方法为:查全率查全率(R)=(R)=被检出的相关文献量被检出的相关文献量a/a/库中所有的相关文献量库
23、中所有的相关文献量 (a+c)X100%(a+c)X100%由于在系统的数据库中,针对某一提问的全部相关文献数量由于在系统的数据库中,针对某一提问的全部相关文献数量不能精确获知,因此不能精确获知,因此R R的计算结果一般都是近似值。的计算结果一般都是近似值。v查准率查准率是衡量系统在实施某一检索作业时检索精确度的一个是衡量系统在实施某一检索作业时检索精确度的一个测度指标,其计算方法为:测度指标,其计算方法为:查准率查准率(P)=(P)=被检出的相关文献量被检出的相关文献量a/a/被检出的文献总篇数被检出的文献总篇数(a+b)X100%(a+b)X100%扩大检索以便提高查全率选全同义词、相关词
24、,或采用分类号检索,增加网罗度;调整位置算符,由严变松去掉次要的或太专指的概念组面,减少AND运算;取消某些过严的限制符缩小检索以便提高查准率提高检索提问式的专指度调整位置算符,由松变严增加概念组面,进行AND运算采用字段限制符,将检索词限定在某一特定字段中查全率与查准率的曲线关系查全率与查准率的曲线关系 实验得出如下查全率R与查准率P曲线,并且证明RP之间存在着“互逆”关系。A点:检索词数量多,泛指性强,查全率较高,但查准率却很低B点:检索词专指性较强,查准率高,查全率降低;C,D两点:两种极端的折衷。R和P各自的最佳状态是逼近100%,但同时只能满足一个。要提高查全率,则要付出查准率降低的
25、代价;要提高查准率,也要使查全率下降。l查全率一般在6070%,查准率一般在4050。查全率与查准率的关系 在实际检索中,从不同检索语言出发得到的试验结果都表明了查全率与查准率之间存在互逆关系。即查全率越高时,查准率越低,反之亦然。例如:心理学是包括教育心理学的大概念,把“心理学”作为检索词具有泛指性,能提高查全率,但是正因为检索范围的扩大使得查准率降低。同样把“教育心理学”作为检索词则更具有针对性,能提高检索词的专指性,排除非相关信息,但同样也降低了查全率。R和P各自的最佳状态是逼近100%,但同时只能满足一个。要提高查全率,则要付出查准率降低的代价;要提高查准率,也要使查全率下降。因此,用户根据用户的具体信息需求来决定其取舍。