1、第六讲第六讲:信息检索策略与课题分析信息检索策略与课题分析2013本讲内容本讲内容 1.基本概念1.1 检索课题1.2 检索工具1.3 主题词1.4 关键词2.信息检索策略1.检索步骤2.课题分析3.检索途径4.时间范围5.检索方法3.信息检索效果评价4.经验分享20131 .1 基本概念:检索课题基本概念:检索课题u检索要解决的问题或待解决的重大事项l一个论文题目l一个任务l一个解决方案20131 .2 基本概念:检索工具基本概念:检索工具u检索工具又称检索系统。是人们用来报道、存储和查找各类信息的工具。包括印刷型、缩微型等。u网络信息检索工具类型l搜索引擎 l搜索软件 l网络目录 l学科信
2、息门户 l数据库 lOPAC l网络参考工具20131 .3 主题词主题词u主题词l主题词(subject word subject terms)又称叙词,是专门为文献标引或检索而从自然语言的主要词汇中挑选出来并加以规范化的词或词组。 l主题词是以自然语言为基础,经过标准化处理的词语。它能直接表达文献所论及或涉及的事物(即主题),而不管该文献是从哪个角度、从什么学科来论述该事物(即主题)。 u用主题词检索往往能比用关键词检索得到更多的检索结果。 20131.4 基本概念:关键词基本概念:关键词u概念l关键词是指那些出现在文献的标题(篇名、章节名)以至摘要、正文中,对表达文献具有实质意义的语词,
3、亦即对揭示和描述文献主题内容来说是重要的、带关键性的(可作为检索“入口”的)那些词语。u注意l一般是两个(不可再分的词)组成一个关键词,如“金融危机”。如:“犯罪的心理”-犯罪心理l关键词可以在题名、关键词、主题词、摘要、全文等中进行检索。20132 信息检索策略信息检索策略u执行一个课题的检索是有过程、分步来完成的,称为检索策略(retrieval strategy),它是为实现检索目标而制定的全盘计划或方案。u【广义】检索策略:是在充分分析课题内容实是在充分分析课题内容实质的基础上质的基础上, 选择检索工具与检索径、发掘检选择检索工具与检索径、发掘检索点、确定检索词及其相互间的逻辑关系索点
4、、确定检索词及其相互间的逻辑关系, 到到给出检索顺序的最佳实施方案给出检索顺序的最佳实施方案等一系列的科学措施。u【狭义】检索策略:把检索提问标识(检索途径+检索词+逻辑组配)与检索提问式(即检索检索式式)的构造称作信息检索策略。20132.1 信息检索步骤信息检索步骤2013信息检索步骤示意图信息检索步骤示意图1.主题内容2.时间范围3.信息类型4.检索语种主 题 概 念1.分类途径2.主题途径3.题名途径4.著者途径5.其它途径1.顺查法2.倒查法3.抽查法4.追溯法5.交替法信 息 线 索确定一次信息出处1.缩写还原为全称2.音译转换成原名3.信息类型选择检索工具1.馆藏目录2.图书馆
5、信息检索系统获取一次信息1.索引、文摘2. 全文数据库 20132.2 课题分析课题分析u检索课题的分析,即主题分析,以明确课题所包含的概念成份及其相互关系。这是检索策略制定的根本出发点,也是检索效率高低或成败的关键。检索课题的分析要明确以下问题:l分析课题的主要内容其所涉及的学科范围。l确定关键词(同义词、近义词、上词)。l所需文献的类型、语种、年代及文献量的范围。l对查新、查准、查全的指标要求,及其侧重。 20132.2.1 检索需求检索需求一般检索需求类型查找某概念的确切含义 如:什么是“blog” 查找某概念的背景知识 如:谁最先发现青霉素查找某些事物的数值及量化指标 特征型知识一般通
6、过事实型、数值型数据库和搜索引擎获得。2013查找某一学科的一般知识 如:关于分子生物学有哪些专著查找学科专业领域的新进展 如:有关纳米技术的研究综述查找课题相关的专业文献 最常见的!关联型知识文献数据库。2013更多更多u电子元器件的技术特性数据,可用有关的电子元器件类手册、产品目录、样本或书查找;u查过去某年度某种电气电子类产品的产销、贸易、市场概况,可用有关年鉴类资料;u查国内外哪些大学招收电气电子类研究生,可查大学类的机构名录或校方的招生简章资料;u查“自动化”一词的概念与含义,可用百科全书、学科术语类解释辞典和相关手册;u查电子产品的电路图,可用相应的电路图集或手册;u查钱学森的主要
7、论著和贡献,可用名人录;等等。 u毕业论文写作查文献数据库。u日常信息检索用搜索引擎。u20132.2.2 主题分析:主题概念与检索词主题分析:主题概念与检索词u你得到什么检索结果,取决于你怎么提问。u看一则幽默:有一位女子,开出的征男友条件有三条:l1.要帅l2.要有车l3.要有海外背景帅+车+海外数据库帮她搜索的结果会是什么?u你拿什么到数据库中去检索?20132.2.2.1 主题分析的一般技巧主题分析的一般技巧主题:论述的对象和研究的问题1.明确检索课题(信息需求)。进行简单的主题概念分析后,得到几个关键词。2.从自己的信息环境中选择任何形式的信息源(课本、笔记、图书馆、数据库、参考工具
8、书、网络、人),去查阅资料,了解检索课题相关的一些知识与信息,找到准确、全面的主题概念(同义词、近义词、上位词、下位词、相关词等),分析检索词间的逻辑关系,选择合适的数据库。3.边检索边学习。不但地明确自己的信息需求,对检索结果进行评价,适时调整检索策略。 信息检索是在掌握全面知识(如:信息环境、检索知识、检索策略等的要求高)的基础上的灵活运用。20132.2.2.2 概念组配概念组配u 概念组配是叙词语言的基本原理。l概念组配与字面组配在形式上有时相同,有时不同;而从性质上来看两者区别是很大的。字面组配是词的分析与组合();概念组配是概念的分析与综合()。例如: 字面组配模拟+控制-模拟控制
9、香蕉+苹果-香蕉苹果 概念组配模拟+控制-模拟控制香蕉味食品+苹果-香蕉苹果汉语主题词表 10个分册20132.2.2.3 分析检索的内容实质分析检索的内容实质u从镀锌残渣中回收锌l工艺?l实际是:从高品位镀锌残渣中分离铁l所以检索需求可以这样表述:“从锌块中分离铁”20132.2.2.4 隐性主题的处理隐性主题的处理-主题概念具体化主题概念具体化u请分析主题概念。“耐热钢”课题:高温下使用的不锈钢“不锈钢”2013隐性主题具体化隐性主题具体化如:酸洗费液的处理:“回收”、“再生”如:煤灰利用具体利用:?检索式:(粉煤灰+煤炭)*(利用+砖+水泥+混凝土+路基+)20132.2.2.5 找出核
10、心概念,简化逻辑关系找出核心概念,简化逻辑关系u并不是概念越多越好!u抓住主题的核心:最能表达检索课题内容,而且具有实际检索意义的关键词。u如“利用稻米皮糠提取天然食品色素”l稻米、皮糠、提取、天然、食品色素l稻米、食品色素2013排除检索意义不大的词排除检索意义不大的词u排除检索意义不大而且比较泛指的概念l如:展望、发展趋势、现状、近况、生产工艺、应用、利用、作用、方法、影响、制备、结果u不要望词生义20132.2.2.6 明确概念间的逻辑关系明确概念间的逻辑关系u同义词、近义词是或的关系u用上位词 即扩检,如“教育心理学”u用下位词 即缩检,如“智育心理”、“德育心理”、“美育心理”、“教
11、学心理学”、“学习心理学”、“教师心理学”、“学生心理学”等。l若多个下位词都用来检索,相对于一个上位词来说,一般是扩检。l一个下位词相对于一个上位词来说,一般是缩检。20132.2.2.7 一般可以选择的词一般可以选择的词u表示具体事物名称的名词术语,如汽车、变压器、反应堆、水稻、坐标仪等;u表示事物的状态或现象的名词术语,如强度、失真、土壤熟化、日冕、船舶过载等;u表示科学分类的名词术语,如数学、物理学、中医学、电子学、建筑工程、水利工程等;u表示研究方法、技术方法的名词术语,如分析(化学)、针刺手法、有限元法、结构功能法、力学性能试验等;本页面内容参考本页面内容参考汉语主题词表汉语主题词
12、表2013u表示工艺方法、加工技术的名词术语,如铸造、锻造、热处理、焊接、酿造、取心钻进、爆破成型、激光切割等;u 表示化学元素、化合物、金属材料与合金的名词术语,如钠、氧原子、族元素、钠化合物、硅化物、硫酸、钛络合物、钉胺、呋喃、吡啶、醇聚四氟乙烯、丁二酸()以及如金属板耐蚀钢、耐蚀合金等;u 表示国家名称、地名、组织机构名称及人名的专有名词以及文献类型、文献载体的名词术语, 20132.2.2.8 课题分析实例课题分析实例u1.检索课题:网络资源的知识产权保护关 键 词:网络资源/网络信息资源/知识产权保护/版权/著作权限/合理使用u2.检索课题:经济领域犯罪的心理分析关 键 词:经济犯罪
13、/犯罪心理分析u3.检索课题:关于经济领域诈骗行为心理剖析关 键 词:经济诈骗/诈骗心理 /经济犯罪/犯罪心理分析20132.2.2.9专业词的翻译问题专业词的翻译问题uhttp:/u例:中外网络文化比较研究lWeb2.0、博客文化、网络社区、大众文化 l网络:network、internet、net、web、netwarel文化:culture、cultural、l其它词:web2.0 、blog、community、 pop 2013试一试:试一试:u东南亚家电市场研究20132.3 检索途径(检索项目)检索途径(检索项目)u分类途径u主题途径 l关键词、主题词l摘要、全文u著者途径:作者
14、,可以是人名、单位名u题名途径 :篇名、题目、标题等u机构途径:单位u代码途径 : ISSN号、专利号、报告号、合同号u其他途径 l来源:文献出处。如期刊名称,出版社等信息20132.4 时间范围时间范围u对文献发表的时间范围进行限定是检索中常用的策略u文献老化规律的应用l文献的半衰期:某学科领域现时还在利用的全部文献中的一半是在多长的时间内发表的。例如:物理学文献的半率期是4.6年,即是说:现时仍在利用的物理学文献的50,其出版年龄不超过4.6年。l学术信息的半衰期一般是35年。许多信息的老化如艺术品、经济信息、市场信息等表现出跳跃性。有时突然失效,有时永不失效。l查阅文献信息时尽量选取较新
15、的文献。同时要顾及较早的文献。一般性研究可选择近10年来的文献即可。了解背景资料的则要长得多。l对发达国家的文献的利用可以在中文文献年限的基础上增加310年。20132.5 检索方法检索方法u检索方法一般有:l直接检索法l间接检索法顺查法 倒查法 抽查法 l追溯检索法l交替检索法;2013直接检索法直接检索法u是指直接通过浏览、查阅文献原文而获取所需文献信息的方法。这种方法不依靠检索工具,所以不是严格意义上的检索方法l优点:能够明确判断文献所包含的信息是否需要l缺点:是难以获得全面的文献,且费时费力,具有一定的盲目性和偶然性。l如果检索课题单一,文献相对集中,又熟悉检索书刊,可用这种检索方法。
16、l对于有多个主题、文献离散度较大的课题,则不宜用此法u由于直接检索具有准确性和实用性优势,能满足用户直接获取文献的要求,因而是文献检索的必要手段。2013间接检索法间接检索法u间接检索法是借助于检索工具查获所需文献的方法,包括顺查法、倒查法和抽查法。l顺查法 是经过分析,确定查找的起始年代,再利用选定的检索工具由远及近地逐年查找文献的方法。它适用普查一定时间的全部文献,查全率较高,并能掌握课题的来龙去脉,了解其研究历史、研究现状和发展趋势。 l倒查法 此法与顺查法相反,是按照时间范围,利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止。由于这种方法重点是查检近期文献,所以能获得较新的文
17、献信息,节省检索时间。然而不如顺查法查全率高,容易产生漏检的现象。2013u抽查法 l是根据检索需求,针对所属学科处于发展兴旺时期的若干年进行文献查找。l用这种方法能获得一批具有代表性、反映学科发展水平的文献,检索效果和效率较高,但必须熟悉学科发展的特点。2013追溯检索法追溯检索法u追溯检索法也叫扩展法、追踪法。此法不是利用确定的检索工具,而是利用已知文献的某种指引,如文献附的参考文献、有关注释、辅助索引、附录等,追踪查找文献。l根据已知文献的指引,查找到一批相关文献;再根据相关文献的有关指引,扩大并发现新的线索,去进一步查找。如此反复追踪扩展下去,直到检索到切题的文献。l用追溯法检索文献,
18、最好利用与研究课题相关的专著与综述,因为它们所附的参考资料既多且精。l在检索工具不全、文献线索很少的情况下,可采用此法。u作用l用较少的文献引出较多的文献l了解科学研究的前期工作基础、相关文献、经典著作、主要作者、重点期刊等。2013追溯检索的更多应用追溯检索的更多应用u文章参考文献更多文章u文章作者文章u作者文章u作者团体更多作者文章u链接网站更多链接u期刊论文图书u图书期刊论文2013小结小结u顺查法:时间上, 查全率高u到查法:时间上, 查准率高u抽查法:研究的高级阶段 检索效率高u追溯法(引文法) :A.一次文献参考文献一次信息参考文献 B.一次文献引用该一次信息的文献新的一次文献 实
19、际是由“ ”越查文献越新u交替法(综合法)2013交替检索法交替检索法u交替检索法是间接检索法和追溯检索法的结合l先利用检索工具查得一批相关文献,然后再利用这批文献所附的参考资料进行追溯查找,扩大线索,从而得到更多的相关文献,如此交替使用,直至满足检索需求为止。20132.6 检索工具检索工具u与检索主题相关的检索工具有哪些?*(主要看数据库的学科覆盖范围)u与检索需求的文献类型相关的检索工具有哪些?(如:哪些数据库或网站中含有会议论文)u语种、年限、结果形式(全文还是文摘)(如检索19891994年的文献,选择维普还是CNKI)2013如何了解检索工具如何了解检索工具u注重信息环境的了解和平
20、时积累。u在利用新的检索工具前花几分钟了解一下数据库是一个良好的信息素质。u如何获得数据库的检索帮助l一般数据库界面上都有“帮助”或者“检索指南”。l图书馆等文献机构发布数据库时提供的使用帮助。l通过Google等搜索引擎搜索。如:filetype:ppt 读秀39逻辑算符逻辑组配检索项题名|主题分类|主题|文献类型精确|模糊 |截词检索初级检索|高级|专家排序|选择|获取|使用20133 信息检索效果评价信息检索效果评价u在信息检索过程中要经常提醒自己:l查全率:相关信息是否都检索出来了?有没有遗漏的?查全率=(检索出的相关信息量/系统中的相关信息总量)x100%l查准率:检索出来的信息是否
21、密切相关?无关信息多否?查准率=(检索出的相关信息量/检索出的信息总量)x100%2013u课题检索中的应用l若要了解科技的最新动态、学科的进展、了解前沿、探索未知,则强调一个“新”字;l若要解决研究中的具体问题,则要强调一个“准”字; l若要了解一个全过程,撰写综述、作鉴定、报成果,就要回溯大量文献,要求检索的全面、详尽、系统,则要强调一个“全”字。20134 经验分享经验分享u经常提醒自己:是否真的完全知道自己需要什么样的信息?u检索是用词去检索,而不是一个句子。u检索词的选取和逻辑组配u信息检索是一个多步骤的过程!u在检索过程中实时选择和保存合适的文献。u要有大的信息环境观uAsk Libraries2013撰写论文的文献检索一般方法撰写论文的文献检索一般方法u从搜索引擎入手到数据库检索 u从综述论文开始到具体研究内容的论文 u针对要撰写论文大纲中的小标题去检索 u从中文文献(数据库)到外文文献(数据库) u先检索出较少的经典文献,再扩大检索、阅