信息检索课件研究生课件:第二章 信息检索方法.ppt

上传人(卖家):罗嗣辉 文档编号:2040744 上传时间:2022-01-19 格式:PPT 页数:98 大小:1.79MB
下载 相关 举报
信息检索课件研究生课件:第二章 信息检索方法.ppt_第1页
第1页 / 共98页
信息检索课件研究生课件:第二章 信息检索方法.ppt_第2页
第2页 / 共98页
信息检索课件研究生课件:第二章 信息检索方法.ppt_第3页
第3页 / 共98页
信息检索课件研究生课件:第二章 信息检索方法.ppt_第4页
第4页 / 共98页
信息检索课件研究生课件:第二章 信息检索方法.ppt_第5页
第5页 / 共98页
点击查看更多>>
资源描述

1、第二章信息检索方法 2.1 2.1 检索的概念及原理检索的概念及原理2.2 2.2 检索工具概述检索工具概述2.3 2.3 检索方法及检索途径检索方法及检索途径2.4 2.4 检索式的拟订检索式的拟订2.5 2.5 检索步骤检索步骤 2.1 2.1 信息检索的概念信息检索的概念一、信息检索的基本概念一、信息检索的基本概念狭义:是指依据一定的方法,从已经组织好的大量狭义:是指依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的相关文献有关文献信息集合中,查找并获取特定的相关文献信息的过程。信息的过程。广义:将信息按照一定的方式组织和广义:将信息按照一定的方式组织和存储存储起来,

2、并起来,并根据用户的需求根据用户的需求找出找出有关信息的过程。有关信息的过程。 (根据不同的检索对象):(根据不同的检索对象):一、一、数据检索:数据检索: 检索的结果是数据。如某种材料的电阻;某变压器的参数;化学分子式、检索的结果是数据。如某种材料的电阻;某变压器的参数;化学分子式、数据图表等数据图表等(手册手册), 某地方某地方GDP增长情况增长情况(年鉴年鉴)二、二、事实检索:事实检索: 检索的结果是事实结论。查询某一事物(事件)的性质、定义、原理以检索的结果是事实结论。查询某一事物(事件)的性质、定义、原理以及发生的时间、地点过程等。如某产品是哪个厂家生产,哪个牌子的最好;及发生的时间

3、、地点过程等。如某产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫星是什么时候升空的第一颗人造卫星是什么时候升空的(年鉴年鉴)三、三、文献检索:文献检索: 检索的结果是文献资料。查找相关文献的内容、出处、收藏单位等。如检索的结果是文献资料。查找相关文献的内容、出处、收藏单位等。如系统地查找信息检索方面的相关文献系统地查找信息检索方面的相关文献(论文论文)文献检索是信息检索的一种最基本的、最主要的形式。文献检索是信息检索的一种最基本的、最主要的形式。 检索工具是人们用来存储、报道和查找各类信息的工具 。v按著录信息的特征划分 著录是指编制检索工具时对文献的内容和形式特征进行分析、选择和记录的过程

4、。目录型检索工具 文摘型检索工具索引型检索工具全文型检索工具 一、检索工具的定义及类型2.2 2.2 检索工具概述检索工具概述目录能反映一定历史时期科学文化发展的概貌目录能反映一定历史时期科学文化发展的概貌作用:作用:了解本学科的研究历史和研究现状。了解本学科的研究历史和研究现状。通过各类书目,可查寻与研究课题密切相关的通过各类书目,可查寻与研究课题密切相关的事实和资料。事实和资料。按收录的范围可分为:馆藏目录、出版社目录、国按收录的范围可分为:馆藏目录、出版社目录、国家书目、联合目录。家书目、联合目录。1 1、目录型检索工具、目录型检索工具2 2、文摘型检索工具、文摘型检索工具 特点:具有摘

5、要,提供文献的外表特特点:具有摘要,提供文献的外表特征和内容特征。如:征和内容特征。如: 中国生物学文摘中国生物学文摘、美国美国化学文摘化学文摘 作用:作用:帮助读者快速判断文献内容,节省阅读时间帮助读者快速判断文献内容,节省阅读时间替代原文替代原文图图2-2 EI的一例文摘的一例文摘3 3、索引型检索工具、索引型检索工具 索引一般是附在专著或年鉴、百科全书等工具书索引一般是附在专著或年鉴、百科全书等工具书之后以及收录内容较多的二次文献之后,按主题词、人之后以及收录内容较多的二次文献之后,按主题词、人名、地名、事件、概念等内容要项编排,按其内容可分名、地名、事件、概念等内容要项编排,按其内容可

6、分为主题索引、分类索引、关键词索引、引文索引。为主题索引、分类索引、关键词索引、引文索引。 图图2-3 中国大百科全书中国大百科全书的一例索引的一例索引特点特点: :提供全文下载提供全文下载4 4、全文型检索工具、全文型检索工具v按所收信息的学科内容划分按所收信息的学科内容划分: : 综合性检索工具综合性检索工具 我国的综合性数据库其加工深度不及专业性检我国的综合性数据库其加工深度不及专业性检索工具,检索途径少。索工具,检索途径少。 专科性检索工具专科性检索工具 能够比较集中、迅速准确和全面地反映某学科能够比较集中、迅速准确和全面地反映某学科领域的最新发展状况和最前沿的科研水平。详细完领域的最

7、新发展状况和最前沿的科研水平。详细完整的专业信息极具针对性。整的专业信息极具针对性。 数据库的类型数据库的类型书目数据库全文数据库文摘数据库按信息处理层次划分期刊论文数据库书目及图书全文数据库专利数据库学位论文数据库产品数据库按收录的文献类型划分图像数据库 文本数据库数值数据库 声音数据库 视频数据库多媒体数据库按媒体信息划分综合性数据库专业性数据库按收录文献信息的范围划分单机数据库联机数据库网络数据库按服务模式划分二二 、检索工具的选择检索工具的选择v 考虑学科范围、信息类型和数据量考虑学科范围、信息类型和数据量【例题例题】用用_检索检索-呋喃甲醇羧酸酯的合成、含有碳和氢元素呋喃甲醇羧酸酯的

8、合成、含有碳和氢元素的化合物的英文综合学术性文献。的化合物的英文综合学术性文献。 A.A.外文外文ElsevierElsevier数据库数据库 B.B.外文农业类外文农业类CABCAB文摘数据库文摘数据库 C.C.外文农业类外文农业类AGRICOLAAGRICOLA数据库数据库 D.D.外文食品科技文摘数据库外文食品科技文摘数据库FSTAFSTAv 了解收录的文献类型了解收录的文献类型【例题例题】已知参考文献:王涛已知参考文献:王涛. .土木工程土木工程CAD.CAD.中国水利水电出版中国水利水电出版社社 .2012.2012.要找原文,使用要找原文,使用_检索检索土木工程土木工程CADCAD

9、。 A.A.中文科技期刊数据库中文科技期刊数据库 B.B.中国人民大学报刊全文数据库中国人民大学报刊全文数据库 C.C.国务院发展研究中心国务院发展研究中心 D.D.图书馆的馆藏查询图书馆的馆藏查询 信息网信息网【例题例题】使用使用检索检索CN200920135079.3CN200920135079.3一种土木连一种土木连锁建筑结构。锁建筑结构。A.A.维普中文科技期刊数据库维普中文科技期刊数据库 B.B.图书馆馆藏查询图书馆馆藏查询C.C.中国人民大学报刊全文数据库中国人民大学报刊全文数据库D.D.中国国家知识产权中国国家知识产权 大大 局专利数据库局专利数据库E.E.中国国家科技图书文献中

10、心中国国家科技图书文献中心(NSTL)(NSTL)【例题例题】用用检索编号是检索编号是GB/T17302.2-1998GB/T17302.2-1998的文献的文献A.A.中国国家知识产权局中国国家知识产权局 B.B.中国国家科技图书中国国家科技图书 专利数据库专利数据库 文献中心文献中心(NSTL)(NSTL)C.C.国务院发展研究中心信息网国务院发展研究中心信息网 D. D. 中国标准信息服务网中国标准信息服务网v考虑信息的时间范围考虑信息的时间范围 同一个数据库版本不同,时效性也不一定相同。同一个数据库版本不同,时效性也不一定相同。 例如清华大学图书馆收藏的例如清华大学图书馆收藏的工程索引

11、工程索引(EIEI)各种)各种载体及馆藏的简况比较:载体及馆藏的简况比较: 印刷版(印刷版(EIEI)月刊,年度更新,收录文献源)月刊,年度更新,收录文献源26002600种,种,馆藏年限馆藏年限1968-19961968-1996。 光盘版(光盘版(Ei CompendexEi Compendex)季度更新,收录文献源)季度更新,收录文献源26002600种,馆藏年限种,馆藏年限1970197019971997年。年。 网络版(网络版(Ei CompendexWebEi CompendexWeb)包括光盘版()包括光盘版(Ei Ei CompendexCompendex)和)和Ei Page

12、OneEi PageOne两部分,半月更新,收录文献两部分,半月更新,收录文献源源50005000种,馆藏年限种,馆藏年限19701970至今。至今。 因此网络版(因此网络版(Ei CompendexWebEi CompendexWeb)信息更新最快,量最大。)信息更新最快,量最大。2.3 2.3 检索方法及检索途径检索方法及检索途径v检索方法检索方法: :1 1常规法:常规法: 所谓常规法就是利用常规检索工具查找有关所谓常规法就是利用常规检索工具查找有关文献的方法文献的方法 顺查法、倒查法、抽查法顺查法、倒查法、抽查法 2 2引文法引文法 就是查找参考文献或引用文献的方法。由远就是查找参考文

13、献或引用文献的方法。由远及近地搜寻及近地搜寻 ; ;由近及远地追溯由近及远地追溯 3 3综合法综合法 引文法和常规法结合引文法和常规法结合v思考:信息检索就是从一定的文献集合(即检索系统)中查找出符合特定需要的文献,那么这个过程是如何实现的呢?标引检索输出存储过程一次信息信息特征信息特征标识检索过程检索课题检索提问检索提问标识分析分析标引输入图图2-1 信息检索原理图信息检索原理图 检检 索索 结结 果果信息检索语言检索系统存储信息与检索信息所依据的规则不一致v检索途径检索途径 常用字段缩写:常用字段缩写:TITITitle Title 文章题目文章题目ABABAbstract Abstrac

14、t 文章摘要文章摘要KWKWKey Word Key Word 关键词关键词AUAUAuthor Author 作者作者AFAFAffiliation Affiliation 作者单位作者单位SOSOSource Source 文章来源(刊名信息等)文章来源(刊名信息等)ISSN(ISBN)ISSN(ISBN) International standard Serial (book) Number International standard Serial (book) Number PYPYPublication year Publication year 出版年出版年LALALanguag

15、e Language 语种语种1 1、主题途径主题途径2 2、分类途径分类途径3 3、责任者责任者/ /刊名途径刊名途径4 4、号码途径号码途径v检索途径检索途径 主题途径是采用反映文献主题概念的主题途径是采用反映文献主题概念的检索词作为检索入口的一种检索途径检索词作为检索入口的一种检索途径, ,也也是最常用、最重要的检索途径。是最常用、最重要的检索途径。 主题主题“是一组具有共性事物的总称,是一组具有共性事物的总称,用以表达文献所论述和研究的具体对象和用以表达文献所论述和研究的具体对象和问题问题”,即文献的,即文献的“中心内容中心内容”。 每种文献都包含着若干主题,研究或每种文献都包含着若干

16、主题,研究或阐述一个或多个问题。阐述一个或多个问题。1 1、主题途径、主题途径 主题途径的优缺点主题途径的优缺点 通常适合特性检索,查准率高;不适合通常适合特性检索,查准率高;不适合族性检索,查全率低族性检索,查全率低【实例实例】主题词主题词“C C语言语言程序设计程序设计”就比分就比分类号类号TP312TP312表达得更准表达得更准 希望专指度高时采用主题途径。希望专指度高时采用主题途径。 【获取主题词的技巧获取主题词的技巧】在图书的版权页可以找在图书的版权页可以找到在版编目里面的主题词和分类号码。或者到在版编目里面的主题词和分类号码。或者在图书馆的馆藏数据找到主题词。在图书馆的馆藏数据找到

17、主题词。【实例实例】版权页版权页样例如右图所样例如右图所示示2 2、分类途径、分类途径(1 1)图书期刊分类法)图书期刊分类法 (2 2)专利分类法)专利分类法 (3 3)标准文献分类法)标准文献分类法(4 4)分类途径的优缺点)分类途径的优缺点(1 1)图书期刊分类法)图书期刊分类法 世界三大图书分类法:世界三大图书分类法:杜威十进分类法杜威十进分类法(DDC)(DDC)(Dewey decimal ClassificationDewey decimal Classification)国际十进分类法国际十进分类法(UDC)(UDC)(Universal Decimal Universal D

18、ecimal Classification)Classification)国会图书馆图书分类法国会图书馆图书分类法(LCC)(LCC)(Library congress Library congress classification)classification)中国图书分类法:中国图书分类法: 中国图书馆分类法中国图书馆分类法(中图法)(中图法)中国科学院图书馆分类法中国科学院图书馆分类法(科图法)(科图法)中国人民大学图书馆分类法中国人民大学图书馆分类法(人大法)(人大法)中图法中图法介绍介绍中图法中图法中国图书馆分类法中国图书馆分类法,以学科来组织知,以学科来组织知识,将全部知识领域划分

19、为识,将全部知识领域划分为5 5个基本部类,个基本部类,2222大类。大类。 五大部类分别为:五大部类分别为: 马列主义、毛泽东思想;马列主义、毛泽东思想; 哲学;哲学; 社会科学;社会科学; 自然科学;自然科学; 综合性图书。综合性图书。A 马克思主义、列宁主义 毛泽东思想、 邓小平理论B 哲学、宗教C 社会科学总论D 政治、法律E 军事F 经济G 文化、科学、教育、体育 H 语言、文字I 文学J 艺术K 历史、地理N 自然科学总论O 数理科学和化学P 天文学、地球科学Q 生物科学R 医药、卫生S 农业科学T 工业技术U 交通运输V 航空、航天X 环境科学、安全科学Z 综合性图书U1 综合运

20、输U2 铁路运输U4 公路运输U6 水路运输U8 航空运输U41 道路工程U44 桥涵工程U45 隧道工程U46 汽车工程U48 其他道路 运输工具U49 交通工程与公路 运输技术管理U441 结构原理、结构力学U442 勘测、设计与计算U443 桥梁构造U444 桥梁建筑材料U445 桥梁施工U446 桥梁试验观测与检定U447 桥梁安全与事故U448 各种桥型U449 涵洞工程图图 2-42-4 中图法中图法结构示意图结构示意图简表简表马列哲学社会科学自然科学综合基本大类基本大类详表详表T T类又可分为以下几类类又可分为以下几类 TB TB 一般工业技术 TD TD 矿业技术 TETE 石

21、油、天然气工业 TFTF 冶金工业 TG TG 金属学、金属工艺 THTH 机械、仪表工艺 TJ TJ 武器工业 TK TK 动力工程 TLTL 原子能技术 TMTM 电工技术 TNTN 无线电电子学,电信技术 TPTP 自动化技术,计算机技术 TQ TQ 化学工业 TS TS 轻工业、手工业 TUTU 建筑科学 TVTV 水利工程 中图法中图法从大类到小类,层层展开,不断细分,从大类到小类,层层展开,不断细分,形成完整的知识体系。形成完整的知识体系。例如:例如: 关于红楼梦研究资料的分类为关于红楼梦研究资料的分类为 I207.411I207.411 I I 文学文学 I2 I2 中国文学中国

22、文学 I207 I207 文学评论和研究文学评论和研究 I207.4 I207.4 小说研究小说研究 I207.41 I207.41 古代小说研究古代小说研究 I207.411 I207.411 红楼梦红楼梦研究与评论研究与评论【例题例题】哲学辞典哲学辞典类号为:类号为:B-61【例题例题】法国的货币与银行法国的货币与银行 的类号为:的类号为:F825.65【例题例题】v在图书馆公共查询系统中检索游记小说: I267.4(2 2)专利分类法)专利分类法 专利分类法是根据专利的功能(效果)或专利分类法是根据专利的功能(效果)或其用途所属的行业部分来分类,目前,世界上其用途所属的行业部分来分类,目

23、前,世界上大部分国家采用国际专利分类法(大部分国家采用国际专利分类法(Interna-Interna-tional Patent Classificationtional Patent Classification,简称,简称IPCIPC)国际专利分类法国际专利分类法( (简称简称IPC)IPC),IPCIPC是世界上应用是世界上应用最广泛的专利分类体系最广泛的专利分类体系,覆盖了世界所有,覆盖了世界所有专专利利文献的文献的95%95%。 IPCIPC适用于适用于发明发明和和实用新型实用新型专利的分类。专利的分类。 我国于我国于19971997年正式加入年正式加入IPCIPC联盟。联盟。部部号

24、号部名部名分部名分部名部号部号部名部名分部名分部名A人类生活必需农业E固定建筑物建筑食品;烟草钻进;采矿个人或家用物品保健;娱乐B作业;运输分离;混合F机械工程;照明;采暖;武器;爆破发动机和泵成型一般工程印刷照明;加热交通运输武器;爆破C化学;冶金化学G物理仪器冶金核子学D纺织;造纸纺织或未列入其他类的柔性材料H电学 造纸IPC分类简表 第第 2 2 讲讲 信息检索基信息检索基础础 (3 3)标准文献分类法标准文献分类法 世界各国的标准分类法同文献资料分类法类似,或以数字为标记、世界各国的标准分类法同文献资料分类法类似,或以数字为标记、或以字母为标记、或以字母和数字混合为标记。或以字母为标记

25、、或以字母和数字混合为标记。 我国的标准分类法采用混合标记,一级类目以专业划分,用字母表我国的标准分类法采用混合标记,一级类目以专业划分,用字母表示类号,二级类目采用等级列类方法用双位制数字表示。排检时先按照示类号,二级类目采用等级列类方法用双位制数字表示。排检时先按照字母顺序,大类相同再按双位数字顺序排列。中国标准分类法字母顺序,大类相同再按双位数字顺序排列。中国标准分类法(Chinese Classification for StandardsChinese Classification for Standards,简称,简称CCSCCS) 【部分分类部分分类】 A 综合0009 标准化管

26、理与一般规定1019 经济、文化2039 基础标准4049 基础学科5064 计量6574 标准物质7579 测绘B 农业林业0009 农业、林业综合1014 土壤与肥料1519 植物保护2029 粮食与饲料作物3039 经济作物4049 畜牧5059 水产、渔业(4 4)分类途径的特点)分类途径的特点1 1)通常适合族性检索,查全率高;不适合特)通常适合族性检索,查全率高;不适合特性检索,查准率低性检索,查准率低2 2)不能适应学科发展中的变化,难以反映新)不能适应学科发展中的变化,难以反映新学科和新名词术语学科和新名词术语 【实例实例】食品风险分析是保证食品安全的一种食品风险分析是保证食品

27、安全的一种新模式,同时也是一门正在发展中的新兴学新模式,同时也是一门正在发展中的新兴学科。风险分析的目标在于保护消费者的健康科。风险分析的目标在于保护消费者的健康和促进公平的食品贸易。目前的文章在分类和促进公平的食品贸易。目前的文章在分类上暂时归入上暂时归入 R155.5 R155.5 食品卫生与检验和食品卫生与检验和 TS201.6 TS201.6 食品安全与卫生。没有一个专食品安全与卫生。没有一个专门的门的“食品风险分析食品风险分析”分类号。分类号。 英文版著者索引中人名规则英文版著者索引中人名规则 按姓、名次序排列:一般为原文中所使用的名字,按姓、名次序排列:一般为原文中所使用的名字,姓

28、在前,接着是逗号,然后是名。姓在前,接着是逗号,然后是名。 例如:例如:Arrow B. Smith 著录为:著录为: Smith , Arrow B.3 3、责任者、责任者/ /刊名途径刊名途径作者无疑是最佳检索途径之一。欧美人的姓名大量使用简称,作者无疑是最佳检索途径之一。欧美人的姓名大量使用简称,姓氏一般用全称,而名则以简写居多。姓氏一般用全称,而名则以简写居多。例如例如: :v以著名物理学家史蒂芬以著名物理学家史蒂芬威廉威廉霍金霍金(Stephen William (Stephen William Hawking)Hawking)为例,在为例,在Google ScholarGoogle

29、 Scholar中检索输入中检索输入“SW HawkingSW Hawking”较较“Stephen William HawkingStephen William Hawking”检索效果更为理想。检索效果更为理想。v同样万维网之父蒂姆同样万维网之父蒂姆伯纳斯伯纳斯李的名字。除输入李的名字。除输入“Tim Tim BernersBernersLeeLee”外,还应输入外,还应输入“T BernersT BernersLeeLee”或是或是“T B T B LeeLee”。v若无法确定作者准确姓名,可仅输入作者的姓氏。如若无法确定作者准确姓名,可仅输入作者的姓氏。如20072007年年诺贝尔经济

30、学奖获奖者之一莱昂尼德诺贝尔经济学奖获奖者之一莱昂尼德赫维奇赫维奇(Leonid (Leonid Hurwicz)Hurwicz)。在。在Google ScholarGoogle Scholar中仅输入中仅输入“HurwiczHurwicz”,其查准,其查准率、查全率也是非常高的。率、查全率也是非常高的。 翻译为英文的中国著者姓名翻译为英文的中国著者姓名(1 1)翻译的规则)翻译的规则分为音译和意译。中国著者姓名和团体机构名称的音译,一般分为音译和意译。中国著者姓名和团体机构名称的音译,一般用汉语拼音。用汉语拼音。【实例实例】原西南师范大学在欧洲专利数据库就有三种写法:原西南师范大学在欧洲专利

31、数据库就有三种写法: Southwest China Normal University Southwest China Normal University Southwest Normal University Southwest Normal University Xinan Teachers, University Xinan Teachers, University有的数据库例如有的数据库例如工程索引工程索引常将常将UniversityUniversity缩写成缩写成UnivUniv。中国人名翻译成英文名字基本上是用汉语拼音。中国人名翻译成英文名字基本上是用汉语拼音。v以杨振宁为例,可

32、输入以杨振宁为例,可输入“Yang ZhenningYang Zhenning”或或输入输入“Zhen Ning YangZhen Ning Yang”,以输入,以输入“CN YangCN Yang”命中的文献最多。命中的文献最多。v同样,要查询李政道的文献,可分别输入同样,要查询李政道的文献,可分别输入“TD LeeTD Lee”、“Tsung Dao LeeTsung Dao Lee”、“li li zhengdaozhengdao”。v刊名也是有效的检索途径之一,并大量使用刊名也是有效的检索途径之一,并大量使用缩略语。缩略语。IEEEIEEE系列期刊的刊名均为系列期刊的刊名均为“IEEE

33、 IEEE Transactions on Transactions on ”。v以以IEEE Transactions on SystemsIEEE Transactions on Systems为例,仅为例,仅输入其全称是不够的,还应输入输入其全称是不够的,还应输入“IEEE IEEE TransTransSystSyst”。v以以“Knowledge and Information Systems Knowledge and Information Systems ”一刊为例,除输入全称外,还需输入一刊为例,除输入全称外,还需输入“know1know1infinfsystsyst”。(2

34、 2)拼写形式)拼写形式【例题例题】在英文数据库检索作者在英文数据库检索作者“金长青金长青”的论文,作者名除的论文,作者名除了了“Jin, ChangQingJin, ChangQing”还有其他拼写形式?还有其他拼写形式?【题解题解】 ChangQing Jin ChangQing Jin Jin, Chang-Qing Jin, Chang-Qing Jin CQ Jin CQ CQ CQ,JinJin Jin, C.Q Jin, C.Q Jin, C.Q. Jin, C.Q. Jin, C.-Q Jin, C.-Q4 4、 号码途径号码途径 常见的号码索引:常见的号码索引:ISBNISB

35、N号、索书号、号、索书号、ISSNISSN号、专利号、入藏号、报告号、标准编号号、专利号、入藏号、报告号、标准编号常见的专用符号代码索引:常见的专用符号代码索引:元素符号、分子式、结构式等元素符号、分子式、结构式等常见的专用名词术语索引常见的专用名词术语索引地名、机构名、商品名、生物属名等地名、机构名、商品名、生物属名等 种次号种次号中图分类号中图分类号 2.4 2.4 检索式的拟订检索式的拟订2.4.12.4.1布尔逻辑检索算符布尔逻辑检索算符 2.4.22.4.2位置检索算符位置检索算符2.4.32.4.3截词检索算符截词检索算符2.4.42.4.4字段揭示及限制算符字段揭示及限制算符2.

36、4.52.4.5其它符号其它符号2.4.62.4.6注意事项注意事项精确与模糊检索精确与模糊检索 基本技术基本技术词间位置检索词间位置检索 加权检索加权检索 布尔逻辑检索布尔逻辑检索 限定字段检索限定字段检索 限定范围检索限定范围检索 截词检索截词检索 1. 1.逻辑逻辑 “与与” (AND)(AND),表示为,表示为 A and B A and B 或或 A A * * B B 2. 2.逻辑逻辑 “或或”(OR)(OR),表示为,表示为 A or B A or B 或或 A + B A + B 3. 3.逻辑逻辑 “非非”(NOT)(NOT),表示为,表示为 A not B A not B

37、 或或 A - BA - B 2.4.1 2.4.1 布尔逻辑检索算符布尔逻辑检索算符 逻辑逻辑“与与” 用“and”、“*”或者空格表示。在网络搜索引擎中习惯用空格代替“and”。表示检出的记录必须同时包含所有的检索词,可以缩小检索范围,减少命中文献量,提高查准率。ABA and B例:检索例:检索“太阳能太阳能”文献文献太阳太阳能源能源 【实例实例】检索课题检索课题“前视红外图像分割方前视红外图像分割方法研究法研究”【实例实例】检索课题检索课题“中国外汇储备规模的中国外汇储备规模的研究研究” 逻辑逻辑“或或” 用“or”、“”或逗号表示。在网络搜索引擎中习惯用逗号代替“OR”。表示检出的记

38、录中至少含有多个检索词中的任何一个,可以扩大检索范围,增加命中文献量,防止漏检。常用于连接同义词,相关词等。ABA or B例:检索例:检索“光盘和磁盘光盘和磁盘”文献文献光盘光盘磁盘磁盘【实例实例】在搜索引擎中输入在搜索引擎中输入“计算机计算机OROR多多媒体媒体OR Windows98OR Windows98”则查询至少包含则查询至少包含“计计算机算机”、“多媒体多媒体”、“Windows 98Windows 98”三三者之一的信息。者之一的信息。 逻辑逻辑“非非”(NOT)(NOT) 表示检索结果中排除含有某些词的记录,可以缩小检索范围,减少文献输出量,但并不一定能提高查准率。ABA n

39、ot B例:检索例:检索“除核能以外有关能源除核能以外有关能源”文献文献能源能源核能核能【实例实例】输入:输入:automobile not carautomobile not car,就,就要求查询的结果中包含要求查询的结果中包含automobileautomobile(汽(汽车),但同时不能包含车),但同时不能包含carcar(小汽车)。(小汽车)。【实例实例】在搜索引擎中输入:电视台在搜索引擎中输入:电视台- -中央中央电视台,查询结果不包含电视台,查询结果不包含“中央电视中央电视台台”。相同的检索词在不同的字段中检索到的结果不同。相同的检索词在不同的字段中检索到的结果不同。【实例实例】

40、用用中文科技期刊数据库中文科技期刊数据库检索机械产品采用计算机检索机械产品采用计算机辅助设计的论文。辅助设计的论文。用不同字段作为途径,如下所示:用不同字段作为途径,如下所示:选择选择”u=u=任意字段任意字段” 输入输入“计算机辅助计算机辅助* *产品产品”,查出,查出30903090篇;篇;选择选择”m=m=题名或关键词题名或关键词” 输入输入“计算机辅助计算机辅助* *产品产品”,查出,查出665665篇;篇;选择选择“t=t=题名题名”输入输入“计算机辅助计算机辅助* *产品产品”,查出,查出149149篇;篇;选择选择“k=k=关键词关键词”输入输入“计算机辅助计算机辅助* *产品产

41、品”,查出,查出576576篇;篇; 检索入口检索入口 选择选择“c=c=分类号分类号”输入输入“机械产品机械产品”的分类号的分类号“TH122TH122”年限设定,查到年限设定,查到1237912379条。条。 也叫也叫邻接检索邻接检索”, 表示两个或多个检索词之间的关表示两个或多个检索词之间的关系检索方式,常用的位置算符有系检索方式,常用的位置算符有: : 1. w (with)1. w (with) 表示两个检索词前后次序固定,二者之间只能间隔连表示两个检索词前后次序固定,二者之间只能间隔连字符、空格或者是逗号。字符、空格或者是逗号。 【实例实例】在在OCLCOCLC中输入中输入comm

42、unication w satellitecommunication w satellite; 2 2 . wN (with N) wN (with N) 表示两个检索词前后次序固定,二者之间最多间隔表示两个检索词前后次序固定,二者之间最多间隔N N个个字符。字符。 【实例实例】在在EBSCOEBSCO中输入中输入communication w3 satellitecommunication w3 satellite; 3. n( Near) 3. n( Near)表示两个检索词可以互换顺序,表示两个检索词可以互换顺序,二者之间只能间隔连字符、空格或者是逗二者之间只能间隔连字符、空格或者是逗号

43、。号。【实例实例】在在OCLCOCLC中输入中输入communication n communication n satellitesatellite; 4. nN( Near N)4. nN( Near N)表示两个检索词可以互换表示两个检索词可以互换顺序,二者之间最多间隔顺序,二者之间最多间隔N N个字符。个字符。【实例实例】在在EBSCOEBSCO中输入中输入communication n3 communication n3 satellite;satellite;比较:在比较:在EBSCOEBSCO中输入中输入source and lawsource and law、source w2

44、 lawsource w2 law又称精确检索又称精确检索 1. 1.机构名称机构名称 如:如:The World Intellectual Property OrganizationThe World Intellectual Property Organization 2. 2.人名人名 如:如:George W.WashingtonGeorge W.Washington 3. 3.地名地名 如:如:San FranciscoSan Francisco 4. 4.专用名称专用名称 如如 i information retrievalnformation retrieval 中文数据库选择:

45、精确检索中文数据库选择:精确检索 外文数据库采用:双引号外文数据库采用:双引号2.4.2.4.4 4 截词检索算符截词检索算符v检索检索colorcolorv检索检索computercomputer、microcomputermicrocomputer、minicomputerminicomputerv英语词根英语词根ologyology 截词符(通配符)截词符(通配符)提高查全率,防止漏提高查全率,防止漏检的有力手段,也可以简化输入,包括有限截词检的有力手段,也可以简化输入,包括有限截词和无限截词,常用的截词符有:和无限截词,常用的截词符有:* *, ?, #,!, ?, #,!,$ $ 有

46、限截词有限截词一个符号表示一个字符,一般使用一个符号表示一个字符,一般使用“?”(英文半角问号)代表(英文半角问号)代表0-10-1个字符。个字符。 比如比如: chip? : chip? 可检索出:可检索出:chipschips(右截断)(右截断)无限截词无限截词一个符号表示任意多个字符,标准符号一个符号表示任意多个字符,标准符号是是“* *”,代表,代表0-n0-n个字符,也称为通配符。个字符,也称为通配符。 比如比如:comput:comput* * 可检出:可检出:compute, Computer, compute, Computer, computers, computing, C

47、omputerizecomputers, computing, Computerize等等. .注:不同的数据库所用的截词符不一样,使用应先查注:不同的数据库所用的截词符不一样,使用应先查一下各数据库的帮助加以确认一下各数据库的帮助加以确认2.4.2.4.4 4 截词检索算符截词检索算符后截断无限截断无限截断如:physic?截词检索与截词检索算符PhysicphysicsphysicstphysicalismPhysicphysicsphysicst如:physic*有限截断有限截断中截断中截断前截断前截断m?nmanmenvOnelook(在线词典) 例如:查找后缀为:ologyvTitl

48、e (ti)=computervPy=2008vLa=englishv限定网站:site: link:whitehouse.govv限定网页:inurl:flash 小苹果v限定文件类型:filetype:ppt 通信 2.4.2.4.5 5 字段限制检索字段限制检索2.4.2.4.6 6 其它符号其它符号1 1括号括号 括在其中的操作符先起作用。括在其中的操作符先起作用。 三聚氰胺三聚氰胺* *( (农产品农产品 + +鸡蛋鸡蛋+ +牛奶牛奶 + +大米大米) ) 2 2个别数据库使用的特殊符号个别数据库使用的特殊符号 某些搜索引擎使用加号(某些搜索引擎使用加号(+ +)表示该单词必须出现。

49、)表示该单词必须出现。 在某些搜索引擎中输入在某些搜索引擎中输入“+ +电脑电脑+ +电话电话+ +传真传真”就表示要查找的内容必就表示要查找的内容必须要同时包含须要同时包含“电脑、电话、传真电脑、电话、传真”这三个关键词。这三个关键词。 个别数据库例如个别数据库例如“国研网国研网”、山东标准网使用、山东标准网使用“& &”代替代替“andand”;欧;欧洲专利局光盘数据库的洲专利局光盘数据库的“withoutwithout”、美国专利商标局数据库的、美国专利商标局数据库的“andnotandnot”就是通用的就是通用的“notnot”。 4.4.英语或汉语中都有许多虚词,不能作为检索词。英语

50、或汉语中都有许多虚词,不能作为检索词。如:汉语中如:汉语中“的、地、得、了的、地、得、了”等助词等助词; ; 英语中的英语中的a about also and any as at be a about also and any as at be between by both for some so not this withbetween by both for some so not this with等等介词或冠词等介词或冠词等思考:比较3个检索式检索结果的不同v“Information retrieval”/Ti vInformation AND retrieval /Ti vInfo

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(信息检索课件研究生课件:第二章 信息检索方法.ppt)为本站会员(罗嗣辉)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|