信息检索原理课件.ppt

上传人(卖家):晟晟文业 文档编号:4530010 上传时间:2022-12-17 格式:PPT 页数:128 大小:1.42MB
下载 相关 举报
信息检索原理课件.ppt_第1页
第1页 / 共128页
信息检索原理课件.ppt_第2页
第2页 / 共128页
信息检索原理课件.ppt_第3页
第3页 / 共128页
信息检索原理课件.ppt_第4页
第4页 / 共128页
信息检索原理课件.ppt_第5页
第5页 / 共128页
点击查看更多>>
资源描述

1、1本章要点:本章要点:信息检索的五个步骤信息检索的五个步骤 归纳课题主题,提取检索概念的一般方法归纳课题主题,提取检索概念的一般方法 课题的分类号和主题词的确定方法课题的分类号和主题词的确定方法 汉语词语的切分方法汉语词语的切分方法 课题概念的扩展方法课题概念的扩展方法 文献信息数据库文档、记录、字段的概念文献信息数据库文档、记录、字段的概念 逻辑、截词、优先、位置算符和字段限制逻辑、截词、优先、位置算符和字段限制2第章 信息检索原理2.1 2.1 信息检索的定义和原理信息检索的定义和原理2.1.1 2.1.1 信息检索的定义信息检索的定义 “检索检索”(RetrievalRetrieval)

2、一词是一个外来词,来源于英语)一词是一个外来词,来源于英语“I Information Retrieval”nformation Retrieval”(信息检索)(信息检索)“检索就是查找检索就是查找”,这仅仅是一种狭义的解释。从广义的角度讲,这仅仅是一种狭义的解释。从广义的角度讲,检索包括,检索包括“存贮存贮”和和“查找查找”两个过程。没有存贮就没有查两个过程。没有存贮就没有查找,存贮是为了查找,但查找必须有存贮,两者缺一不可。找,存贮是为了查找,但查找必须有存贮,两者缺一不可。31.1.信息检索的定义信息检索的定义 狭义:是指根据特定课题的需要,运用科学的方法,在大量信息(文献)集合中查获

3、所需信息(狭义:是指根据特定课题的需要,运用科学的方法,在大量信息(文献)集合中查获所需信息(文献文献)的过程。的过程。是指从任何信息集合中查找所需信息的活动、过程与方法。是指从任何信息集合中查找所需信息的活动、过程与方法。广义:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程,广义:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程,其全称是信息存储与检索。其全称是信息存储与检索。广义的信息检索包括信息存贮和信息检索两个部分,两者又往往合并称为广义的信息检索包括信息存贮和信息检索两个部分,两者又往往合并称为“信息存贮与检索信息存贮与检索”

4、。4补充补充:文献检索的含义:就是利用文献信息检索系统,从一个特定的文献集合中,查找特定用户所需的特定时间、特定区域和特定主题的文献的程序和方法。5 第章 信息检索原理 2.2.信息检索的一般原理信息检索的一般原理 信息检索包括存储存储和检索检索两个过程。信息检索过程的实质实质是将检索提问标检索提问标识识与存储在检索系统(检索工具)中的检索检索标识标识(标引标识标引标识)进行比较,含有两者一两者一致致或信息存储的标识信息存储的标识包含包含着检索提问标识的信息就是检索命中的信息。这就是信息检索原理。6信息处理人员信息处理人员检索结果检索结果检索检索 工具工具检索课题检索课题用用 户户原始信息原始

5、信息信息分析、著录信息分析、著录和标引和标引课课 题题 分分 析析检索语言检索语言(主题词主题词/分类号分类号)信息检索原理示意图:信息检索原理示意图:存贮过程存贮过程 检索过程检索过程存入存入检索检索检出检出7 3.3.信息检索的类型信息检索的类型 以检索内容区分:以检索内容区分:根据检索对象不同,信息检索可分为文献检索、事实检索和数据检索三种类型。根据检索对象不同,信息检索可分为文献检索、事实检索和数据检索三种类型。(1)(1)文献检索(文献检索(Document RetrievalDocument Retrieval)是以文献为检索对象的信息检索。也就是说文是以文献为检索对象的信息检索。

6、也就是说文献检索是以图书、期刊、资料、数据库中的篇章或献检索是以图书、期刊、资料、数据库中的篇章或全书刊为检索对象的一种检索。全书刊为检索对象的一种检索。如:检索有关如:检索有关“花卉组织培养技术花卉组织培养技术”的文献。的文献。文献检索是一种相关性检索,检索结果不直接文献检索是一种相关性检索,检索结果不直接回答用户提出的技术问题,只是提供与之相关的文回答用户提出的技术问题,只是提供与之相关的文献信息供用户参考。献信息供用户参考。8(2)(2)事实检索(事实检索(Fact RetrievalFact Retrieval)是以事实为检索对象的一种检索,查找某一事物发生的时间、地点及过程。是以事实

7、为检索对象的一种检索,查找某一事物发生的时间、地点及过程。如检索如检索“日本松下电器公司近年来进行了那些新产品的开发研究日本松下电器公司近年来进行了那些新产品的开发研究”“”“IBMIBM公司所在地、总裁是公司所在地、总裁是谁、下设哪些分公司、从事哪些业务谁、下设哪些分公司、从事哪些业务”等等。等等。(3)(3)数据检索(数据检索(Date RetrievalDate Retrieval)是以数据为检索对象的一种检索,包括数值、图表等。是以数据为检索对象的一种检索,包括数值、图表等。查找科学技术参数、统计数字、财政信息数据、市场行情数据等都属于数据检索。查找科学技术参数、统计数字、财政信息数据

8、、市场行情数据等都属于数据检索。9 事实检索和数据检索都是确定性的检索。检索结果要直接回答用户提出的技术事实检索和数据检索都是确定性的检索。检索结果要直接回答用户提出的技术问题,即直接提供用户有关某一问题的确切的事实情况或具体的数据,检索结果一般是问题,即直接提供用户有关某一问题的确切的事实情况或具体的数据,检索结果一般是确定性的。确定性的。信息检索三种类型的区别:信息检索三种类型的区别:1.检索对象不同 2.检索结果不同 3.性质不同 4.借助工具不同10第章 信息检索原理 以检索方式区分以检索方式区分,信息检索又可分为:信息检索又可分为:(1)(1)手工检索手工检索 手工检索即是用人工来处

9、理和查找所需信息的检索方式。手工检索即是用人工来处理和查找所需信息的检索方式。(例如:利用各种文摘、索引、题录等刊物)(例如:利用各种文摘、索引、题录等刊物)(2)(2)计算机检索计算机检索 计算机检索是利用计算机和一定的通信设备查找所需信息的检索方式。计算机检索是利用计算机和一定的通信设备查找所需信息的检索方式。(例如:利用各种文献信息数据库)(例如:利用各种文献信息数据库)11 2.1.2 2.1.2 检索语言检索语言 1 1 检索语言及其定义检索语言及其定义 检索语言是用来描述文献的内容特征、外表特征和表达情报提问的一种人工语言。检索语言是用来描述文献的内容特征、外表特征和表达情报提问的

10、一种人工语言。检索语言主要有以代码语言为特征的分类语言和以事物名称术语为特征的主题语言两大类检索语言主要有以代码语言为特征的分类语言和以事物名称术语为特征的主题语言两大类。其中主题语言分为叙词语言和关键词语言。其中主题语言分为叙词语言和关键词语言。文献的内容特征:是文献的内容特征:是与文献信息主题内容密切相关的信息。文献的外部特征:是文献的外部特征:是与文献信息主题内容没有关系或关系不大的信息。12检索标识种类检索标识种类反映文献外部特征反映文献外部特征检索标识检索标识反映文献内容特征反映文献内容特征检索标识检索标识著者著者 文献序号文献序号篇名篇名出版社出版社分类号分类号主题词主题词关键词关

11、键词单元词单元词标题词标题词叙词叙词人工语言人工语言自然语言自然语言分类语言分类语言13第章 信息检索原理 特性检索:特性检索:从具体事物或主题出发所进行的文献检索。广义地说,凡是狭窄范围内的检索皆可视为从具体事物或主题出发所进行的文献检索。广义地说,凡是狭窄范围内的检索皆可视为特性检索。特性检索。(指某人、某事物所特有的性质:如我们讲一个民族的特性。)(指某人、某事物所特有的性质:如我们讲一个民族的特性。)族性检索:族性检索:从学科、专业出发所进行的文献检索,是与特性检索相对的、范围较广泛的检索。从学科、专业出发所进行的文献检索,是与特性检索相对的、范围较广泛的检索。属于体系分类法的各种检索

12、语言的功能,主要都是满足族性检索的要求。属于体系分类法的各种检索语言的功能,主要都是满足族性检索的要求。14 2.2.分类语言分类语言(1 1).分类语言的定义和特点分类语言的定义和特点 分类语言,也称分类法或分类表。所谓分类法(具有族性检索的特点)就是按照文献信息分类语言,也称分类法或分类表。所谓分类法(具有族性检索的特点)就是按照文献信息的内容、形式、体裁和读者用途等的内容、形式、体裁和读者用途等,根据科学学科之间的逻辑归属关系根据科学学科之间的逻辑归属关系,采用层次型或树杈采用层次型或树杈型结构型结构,列举人类所有的知识类别列举人类所有的知识类别,并对每一种知识门类分别标以相对固定的分类

13、号,从而并对每一种知识门类分别标以相对固定的分类号,从而形成的分类表。形成的分类表。因此,分类法通常是指一种从总到分、从一般到具体、层层划分、逐级展开并具有某种符因此,分类法通常是指一种从总到分、从一般到具体、层层划分、逐级展开并具有某种符号代码体系的知识体系表。号代码体系的知识体系表。如如:中图法的符号代码体系是拼音字母加数字。中图法的符号代码体系是拼音字母加数字。15第章 信息检索原理国内通用分类法有:国内通用分类法有:中国图书馆图书分类法中国图书馆图书分类法(简称中图法简称中图法)中国图书资料分类法中国图书资料分类法(简称资料法简称资料法)中国科学院图书分类法中国科学院图书分类法(简称科

14、图法)(简称科图法)国外通用的分类法有:国外通用的分类法有:杜威十进分类法杜威十进分类法(DDC)(DDC)、国际十进分类法国际十进分类法(简称简称UDC)UDC)、美国国会图书馆图书分类法美国国会图书馆图书分类法(简称简称LCC)LCC)常见的专业分类法:物理学分类法等。常见的专业分类法:物理学分类法等。16(2 2)中图法中图法和分类表:和分类表:中图法中图法将人类知识分为马列、哲学、社会科学、自然科学、综将人类知识分为马列、哲学、社会科学、自然科学、综合五大基本部类,合五大基本部类,2222个大类。个大类。大类类目设置情况如图:大类类目设置情况如图:具体类号、类目展开情况如图所示:具体类

15、号、类目展开情况如图所示:检索标识即分类号,由拼音字母和数字组成检索标识即分类号,由拼音字母和数字组成 采用等级列举表达从属关系采用等级列举表达从属关系 上位类目与下位类目的关系:上位类目与下位类目的关系:上位类目一定包含各个下位类目,上位类目一定包含各个下位类目,下位类目一定带有上位类目的属性。下位类目一定带有上位类目的属性。分类号越长,表示的学科范围越窄。分类号越长,表示的学科范围越窄。为了清楚醒目为了清楚醒目,通常分类号的第三位数字后,隔以通常分类号的第三位数字后,隔以“.”,如,如F279.712F279.712,TQ032.4TQ032.42022-9-2717C C社会科学总论社会

16、科学总论D D政治、法律政治、法律E E军事军事 F F经济经济 G G文教、科学、体育文教、科学、体育 H H语言、文字语言、文字 J J艺术艺术 I I文学文学 K K历史、地理历史、地理 自然科学总论自然科学总论 N NR R S S T TO O数理化数理化P P天文学、天文学、地球科学地球科学Q Q生物科学生物科学 医药、卫生医药、卫生农业科学农业科学工业技术工业技术U U交通运输交通运输V V航空、航天航空、航天X X环境科学环境科学Z Z综合性图书综合性图书社会科学社会科学自然科学自然科学机械、仪表机械、仪表建筑科学建筑科学 马列主义、毛泽东思想马列主义、毛泽东思想A A马列马列

17、B B哲学哲学哲学哲学综合综合TBTB TDTD TETE TFTF TGTG THTH TJTJTLTLTKTKTMTMTNTNTPTP TQTQ TSTS TUTU TVTV一般工业技术一般工业技术 矿业工程矿业工程石油石油冶金工业冶金工业无线电电子学、无线电电子学、电讯技术电讯技术自动化技术自动化技术化学工业化学工业轻工业、手工轻工业、手工业业金属学金属学武器工业武器工业动力工程动力工程原子能技术原子能技术电工技术电工技术水利工程水利工程18检索语言分类法中图法O O 数理化数理化 一级类目一级类目 O1 O1 数学数学 二级类目二级类目 O3 O3 力学力学 二级类目二级类目 O31

18、O31 理论力学理论力学 三级类目三级类目 O311 O311 运动学运动学 四级类四级类目目 .1 .1 质点运动质点运动 五五级类目级类目 O4 O4 物理学物理学 二级类目二级类目19 中国图书馆图书分类法类号和类目示例中国图书馆图书分类法类号和类目示例 O1 O1 数学数学 O11 O11 古典数学古典数学 O12 O12 初等数学初等数学 O13 O13 高等数学高等数学 总论性著作入此;专论入以下有关类,例:微积分入总论性著作入此;专论入以下有关类,例:微积分入O172 O172 O15 O15 代数、数论、组合理论代数、数论、组合理论 151 151 代数方程式论、线性代数代数方

19、程式论、线性代数 .1.1 代数方程式论代数方程式论 .2.2 线性代数参见线性代数参见O241.6O241.6 .21.21 矩阵论矩阵论 .26.26 线性代数的应用线性代数的应用 152 152 群论群论 O3 O3 力学力学 O31 O31 理论力学理论力学 20第章 信息检索原理 分类法途径的特点:分类法途径的特点:它体现了学科的系统性,便于它体现了学科的系统性,便于从学科或专业的角度出发进行族性检索从学科或专业的角度出发进行族性检索,但缺乏进行多概念灵活组配的能力。,但缺乏进行多概念灵活组配的能力。21 索书号又称为排架号索书号又称为排架号 反映了某种图书在整个图书组织反映了某种图

20、书在整个图书组织中的排列次序和在书库中的具体位置中的排列次序和在书库中的具体位置(架位)(架位)组成:分类号书次号组成:分类号书次号 O651.21-44/L631O651.21-44/L631 分类号:按学科分类图书分类号:按学科分类图书 书次号:同类书的排列书次号:同类书的排列 条码号条码号O651.21-44O651.21-44L631L631SDT01420521SDT0142052122 (3 3)确定课题分类号的方法确定课题分类号的方法 分类途径是按文献信息所属的学科类型来查找文献的一种方法。分类途径是按文献信息所属的学科类型来查找文献的一种方法。从分类途径检索(同时它也是一从分类

21、途径检索(同时它也是一种族性检索)文献的检索步骤一般为:族性检索)文献的检索步骤一般为:分析待查课题的主题内容,根据主题内容在类目索引中找到相应的类目,在分类表中提取分析待查课题的主题内容,根据主题内容在类目索引中找到相应的类目,在分类表中提取分类号。在相应的检索工具中用该类号检索所需的文献,再根据所需要的文摘提供的出处查分类号。在相应的检索工具中用该类号检索所需的文献,再根据所需要的文摘提供的出处查找原文。找原文。从分类途径的检索步骤可见,确定课题的分类号是从分类途径检索文献的关键。从分类途径的检索步骤可见,确定课题的分类号是从分类途径检索文献的关键。23第章 信息检索原理 (3 3)确定课

22、题分类号的方法确定课题分类号的方法 1).1).单概念课题确定课题分类的一般方法单概念课题确定课题分类的一般方法 所谓单概念课题是指课题涉及主题概念只有一个。例如:所谓单概念课题是指课题涉及主题概念只有一个。例如:“函数函数”、“齿轮齿轮”等都属于单等都属于单概念。概念。方法是:方法是:a.a.了解分类表的体系结构,重点掌握大类的分布,了解分类表的体系结构,重点掌握大类的分布,b.b.在相关的大类中,由大而小,逐步查在相关的大类中,由大而小,逐步查找最接近于课题要求的分类号。找最接近于课题要求的分类号。C.C.注意表中用于帮助确定分类号的类目注释和类目指引。注意表中用于帮助确定分类号的类目注释

23、和类目指引。24 2).2).多概念课题的一般分类方法多概念课题的一般分类方法 涉及两个或两个以上概念的课题即为多概念课题。如:涉及两个或两个以上概念的课题即为多概念课题。如:“计算机在机械工程方面的应用计算机在机械工程方面的应用”含含“计算机计算机”、“机械工程机械工程”两个概念。两个概念。应注意以下几点:应注意以下几点:a.a.并列概念课题。对于涉及同一研究对象的几个方并列概念课题。对于涉及同一研究对象的几个方面或者涉及几个并列研究对象的课题,凡是有主次者,面或者涉及几个并列研究对象的课题,凡是有主次者,应取其重点或主要研究对象归类。如果涉及同一研究对应取其重点或主要研究对象归类。如果涉及

24、同一研究对象的几个方面都需检索时,应在涉及的几个类中同时查象的几个方面都需检索时,应在涉及的几个类中同时查 找。找。b.b.应用性课题。研究一种理论、方法、工艺、材应用性课题。研究一种理论、方法、工艺、材料、设备、产品等在某方面应用或对某方面影响的课题料、设备、产品等在某方面应用或对某方面影响的课题,应在所应用或受影响的类目中查找。在多方面应用,应在所应用或受影响的类目中查找。在多方面应用,则在该理论、方法、工艺等本身所属的类目中查找。则在该理论、方法、工艺等本身所属的类目中查找。25练习题:练习题:1.1.如果需要给如果需要给“计算机在人口预测方面的应用计算机在人口预测方面的应用”这个课题标

25、引这个课题标引中图法中图法类号,应该归入类号,应该归入“TP39TP39计计算机的应用算机的应用”,还是归入,还是归入“C923C923人口预测人口预测”?并请说明理由。?并请说明理由。2.2.切分课题切分课题“当前数理统计模型研究当前数理统计模型研究”和和“当前乌鲁木齐、石河子的流动人口的流动规律分析当前乌鲁木齐、石河子的流动人口的流动规律分析”的的概念,并用布尔逻辑算符构成检索策略。概念,并用布尔逻辑算符构成检索策略。3.3.针对课题针对课题“古代文学研究古代文学研究”和和“古代历史研究古代历史研究”,下面的布尔逻辑符的应用是否合理?应如何修,下面的布尔逻辑符的应用是否合理?应如何修正?正

26、?1 1)古代文学)古代文学 OR OR 古代诗歌古代诗歌2 2)历史)历史 AND(AND(中国古代历史中国古代历史 OR OR 世界古代历史世界古代历史)26第章 信息检索原理 3).3).上位类分类方法上位类分类方法 这种归类法也是一种常用的分类方法。它适应于欲查课题无现成类目或无符合要求的专指类这种归类法也是一种常用的分类方法。它适应于欲查课题无现成类目或无符合要求的专指类目时,可以归入它从中分化出来的上位类。这种分类方法的关键是确定合适的上位类号。目时,可以归入它从中分化出来的上位类。这种分类方法的关键是确定合适的上位类号。3 3 叙词语言叙词语言(1 1)叙词语言的定义和特点)叙词

27、语言的定义和特点 叙词语言是以规范化科学名词为基础的一种主题法检索语言。所谓叙词是从自然语言中优选叙词语言是以规范化科学名词为基础的一种主题法检索语言。所谓叙词是从自然语言中优选出来的经过规范化的名词术语。出来的经过规范化的名词术语。27 所谓规范化,是指对自然语言中的同义词进行优选,对词的不同形式进行归一。所谓规范化,是指对自然语言中的同义词进行优选,对词的不同形式进行归一。对同义词进行合并,即一个概念只用一个标题词来表达,排除多词一义的现象。例如:对同义词进行合并,即一个概念只用一个标题词来表达,排除多词一义的现象。例如:“玉米玉米”又叫又叫“苞米苞米”、“苞谷苞谷”“”“玉蜀黍玉蜀黍”、

28、“玉茭玉茭”、“棒子棒子”等,等,对多义词进行注释,即一个标题词只表达一个概念。排除一词多义的现象。例如对多义词进行注释,即一个标题词只表达一个概念。排除一词多义的现象。例如“茶茶”既既可以表示一种树木可以表示一种树木(植物植物),又可表示一种饮料,又可表示一种饮料.28 叙词语言其原理是:按主题集中文献;用经过规范叙词语言其原理是:按主题集中文献;用经过规范化的语词来组配描述文献主题;用参照系统间接显示主化的语词来组配描述文献主题;用参照系统间接显示主题之间的相互关系;用字顺序列直接提供主题检索途径题之间的相互关系;用字顺序列直接提供主题检索途径.叙词和分类语言的异同点。叙词和分类语言的异同

29、点。同:都对基本的事物有正式的、规范的表达形式;同:都对基本的事物有正式的、规范的表达形式;异:主题词可以自由组配,用以表达复杂的概念。异:主题词可以自由组配,用以表达复杂的概念。(2 2)叙词表和)叙词表和汉语主题词表汉语主题词表 叙词语言的体现形式是叙词表。国内常用的叙词表主要有我国许多检索刊物使用的叙词语言的体现形式是叙词表。国内常用的叙词表主要有我国许多检索刊物使用的汉语主题汉语主题词表词表。叙词表是叙词的汇编,它是进行文献主题标引和主题叙词表是叙词的汇编,它是进行文献主题标引和主题检索的依据,一般由一个主表和若干个索引组成。检索的依据,一般由一个主表和若干个索引组成。29第章 信息检

30、索原理汉语主题词表汉语主题词表的卷册划分如下:的卷册划分如下:第一卷第一卷 社会科学社会科学 第一分册第一分册 主表(字顺表)主表(字顺表)第二分册第二分册 索引索引第二卷第二卷 自然科学自然科学 第一至第四分册第一至第四分册 主表(字顺表)主表(字顺表)第五分册第五分册 词族索引词族索引 第六分册第六分册 范畴索引范畴索引 第七分册第七分册 英汉对照索引英汉对照索引第三卷第三卷 附表附表30 汉语主题词表汉语主题词表的主表称字顺表,所有主题词都按汉语拼音字顺排列,每一个主题词的著录的主表称字顺表,所有主题词都按汉语拼音字顺排列,每一个主题词的著录都构成一条款目。都构成一条款目。汉语拼音汉语拼

31、音 Wei sheng su B que fa bingWei sheng su B que fa bing 款目主题词款目主题词 维生素维生素B B缺乏病缺乏病 英文译名英文译名 Vitamin B deficiencyVitamin B deficiency 参照项参照项(代项)(代项)D D 糙皮病糙皮病 非叙词非叙词 参照项参照项(分项)(分项)F F 维生素维生素B1B1缺乏病缺乏病 下位叙词下位叙词 参照项参照项(属项)(属项)S S 维生素缺乏病维生素缺乏病 上位叙词上位叙词 参照项参照项(族首词)(族首词)Z Z 营养缺乏病营养缺乏病 参照项参照项(参项)(参项)C C 多发性

32、神经炎多发性神经炎 相关叙词相关叙词31第章 信息检索原理 等同关系参照项:等同关系参照项:“用(用(Y Y)”就是从非正式主题词指引到正式主题词。就是从非正式主题词指引到正式主题词。“代(代(D D)”则是从正式主题词则是从正式主题词指引到非正式主题词,也就是指明叙词所代替的非叙词。如指引到非正式主题词,也就是指明叙词所代替的非叙词。如 马铃薯(叙词)马铃薯(叙词)D D 土豆土豆 土豆(非叙词)土豆(非叙词)Y Y 马铃薯马铃薯32第章 信息检索原理 等级关系参照项:等级关系参照项:“属(属(S S)”项是指明该词的上位概念是什么;项是指明该词的上位概念是什么;“分(分(F F)”项则是指

33、明下位概念有哪项则是指明下位概念有哪些词,如些词,如 肥料(属概念)肥料(属概念)F F 氮肥、钾肥氮肥、钾肥 氮肥(分概念)氮肥(分概念)S S 肥料肥料 钾肥(分概念)钾肥(分概念)S S 肥料肥料 叙词法的特点:叙词法的特点:使用的是规范化的单词、词组;概念组配;使用的是规范化的单词、词组;概念组配;(3 3)确定课题叙词的一般方法)确定课题叙词的一般方法 分课题分析、查表选词、试查定词三步。分课题分析、查表选词、试查定词三步。33第章 信息检索原理 4.4.关键词语言的定义和特点关键词语言的定义和特点 所谓关键词是指那些出现在文献的所谓关键词是指那些出现在文献的标题、摘要以及正文中,对

34、表征文献主标题、摘要以及正文中,对表征文献主题内容有实质意义的词语。题内容有实质意义的词语。关键词是一种自然语言性质的主题关键词是一种自然语言性质的主题语言。语言。34第章 信息检索原理 关键词索引的原理是关键词索引的原理是:它只将出现在文献的标题(篇名、它只将出现在文献的标题(篇名、章节名)以至摘要、正文中,对表达文章节名)以至摘要、正文中,对表达文献主题内容具有实质意义的关键词排在献主题内容具有实质意义的关键词排在检索入口,同时提供文献地址(即正文检索入口,同时提供文献地址(即正文中文献顺序号)以满足检索者的检索要中文献顺序号)以满足检索者的检索要求。求。35第章 信息检索原理 关键词属自

35、然语言。如:关键词属自然语言。如:“光学纤光学纤维传感器维传感器”这个课题可分成这个课题可分成“光学光学”、“纤维纤维”、“传感器传感器”。优点:自然性优点:自然性 缺点:随意性缺点:随意性 关键词语言的特点:非规范化语词关键词语言的特点:非规范化语词的自由标引;的自由标引;36第章 信息检索原理 从课题出发确定关键词的方法:从课题出发确定关键词的方法:涉及:涉及:分析提取课题主要概念和辅助分析提取课题主要概念和辅助概念概念 检索概念的扩展方法检索概念的扩展方法 汉语课题概念的切分方法汉语课题概念的切分方法37 概念分析的结果应以概念组为单元的词或词组形式列出,以便下一步制订检索策略。实际检索

36、中,主要概念、辅助概念体现为主要检索词、辅助检索词。共同出现的还有禁用词。有些检索词中已经含有的某些概念,在概念分析中应予以排除。例如:课题“内弹道高温高压高密度的气体状态方程”,如果把“内弹道”,“高温”,“高压”,“高密度”,“气体”,“状态方程”六个概念全部组配起来,会造成大量漏检。本课题只须采用“内弹道”和“状态方程”这两个主要概念即可。38 又如:课题又如:课题“芸豆天然食用色素的提取芸豆天然食用色素的提取”这个课题有五个概念:芸豆、天然、食用、色这个课题有五个概念:芸豆、天然、食用、色素、提取。素、提取。只要把只要把“芸豆芸豆”与与“色素色素”这两个概念组面进这两个概念组面进行组配

37、,行组配,有关提取、制造、利用等方面的文献都会检索有关提取、制造、利用等方面的文献都会检索出来。出来。391.1.如果需要给如果需要给“计算机在人口预测方面的应用计算机在人口预测方面的应用”这这个课题标引个课题标引中图法中图法类号,应该归入类号,应该归入“TP39TP39计计算机的应用算机的应用”,还是归入,还是归入“C923C923人口预测人口预测”?并?并请说明理由。请说明理由。2.2.当当“磁光盘磁光盘”应用于计算机信息存储时,可使用应用于计算机信息存储时,可使用中图法中图法类号是:类号是:A.TP333.4A.TP333.4光存储器光存储器 B.TN946B.TN946录象录象系统系统

38、 C.TN912.2C.TN912.2电声技术与设备电声技术与设备 D.G356.4D.G356.4情报载体情报载体 3.“3.“计算机在机械设计中应用计算机在机械设计中应用”这个课题的这个课题的中图中图法法类号,应使用:类号,应使用:A.TP339A.TP339计算机技术的应用计算机技术的应用 B.TH122B.TH122机械设计机械设计 C.TP3 C.TP3 计算机技术计算机技术 D.TH1 D.TH1 机机械工程械工程40 1 1、查找农六师草地及饲草料资源调查与利用评价的、查找农六师草地及饲草料资源调查与利用评价的文献文献 2 2、酸奶油脂分离机的研制、酸奶油脂分离机的研制 3 3、

39、天府肉鹅与霍尔多巴吉鹅的饲养与繁育、天府肉鹅与霍尔多巴吉鹅的饲养与繁育 4 4、甜菜气吸式铺膜播种机、甜菜气吸式铺膜播种机 5 5、固体碱催化棉籽油制备生物柴油的研究、固体碱催化棉籽油制备生物柴油的研究 6 6、夹持式棉花精密穴(点)播轮、夹持式棉花精密穴(点)播轮 7 7、巴州地区葡萄阿小叶蝉的研究、巴州地区葡萄阿小叶蝉的研究 8 8、滴灌专用复合液肥、滴灌专用复合液肥 41第章 信息检索原理 2.1.3 2.1.3 信息检索系统信息检索系统 实现信息检索的必备条件是信息检索实现信息检索的必备条件是信息检索系统。系统。信息检索系统是为满足各式各样的信信息检索系统是为满足各式各样的信息需求而建

40、立的一整套文献信息的收集、息需求而建立的一整套文献信息的收集、加工、存储和检索使用的完整系统。加工、存储和检索使用的完整系统。这种系统可以是提供手工检索使用的这种系统可以是提供手工检索使用的书目、索引等检索书刊,也可以是计算机书目、索引等检索书刊,也可以是计算机检索使用的数据库系统。检索使用的数据库系统。421.1.信息检索系统的类型信息检索系统的类型 以报道文献的内容层次区分,信息检索系统可分为目录、题录、文摘、全文四种类型。以报道文献的内容层次区分,信息检索系统可分为目录、题录、文摘、全文四种类型。(1)(1)目录目录 (Bibliography)(Bibliography)是揭示和报道整

41、本文献外表特征的检是揭示和报道整本文献外表特征的检索工具。索工具。目录以单位出版物目录以单位出版物(整本文献整本文献)为基本的著录对象,所谓单位出版物是指以文献独自的为基本的著录对象,所谓单位出版物是指以文献独自的名称作为一个完整的出版单位的出版物,如:一种图书、一种期刊等,都是以文献独立名称作名称作为一个完整的出版单位的出版物,如:一种图书、一种期刊等,都是以文献独立名称作为文献单位的名称。为文献单位的名称。43 目录以文献的目录以文献的“本本”、“种种”或或“件件”为报道单位。为报道单位。它是系统积累和提供图书、期刊和其它是系统积累和提供图书、期刊和其它单行本的名称、收藏单位和索取号等外它

42、单行本的名称、收藏单位和索取号等外表特征的工具。表特征的工具。目录的著录项目通常包括:目录的著录项目通常包括:出版名称、责任者(著者或编者或译出版名称、责任者(著者或编者或译者)出版项(出版者、出版地、出版时间者)出版项(出版者、出版地、出版时间、版次等)和稽核项(页数、开本、价格、版次等)和稽核项(页数、开本、价格)。)。44目录的条目著录格式 例1:检索结果:检索结果:数控机床及应用/古文生编著.-第二版(修订版).-北京:电子工业出版社,2002.04.-208页;26cm.-中等职业学校电子信息类教材.ISBN7-5053-7272-6:18.00注明各项:注明各项:书名;责任者(编著

43、者);版次(版本形式);出版地;出版者;出版时间;总页数;尺寸(开本);附注;国际标准书号;价格45 目录按类型分:目录按类型分:有图书、报刊、资料目录。有图书、报刊、资料目录。按目录种类分:按目录种类分:有分类、著者、书名、刊名目录。有分类、著者、书名、刊名目录。按编制单位划分:按编制单位划分:有国家书目、出版社与书店目录、图有国家书目、出版社与书店目录、图书馆馆藏目录、联合目录。如:书馆馆藏目录、联合目录。如:全国全国新书目新书目等等46(2)(2)题录:题录:是揭示和报导单篇文献外表特征是揭示和报导单篇文献外表特征的检索工具。的检索工具。题录是在目录的基础上发展起来的,它与目录的主要不同

44、点在于著录的对象不同。目录题录是在目录的基础上发展起来的,它与目录的主要不同点在于著录的对象不同。目录的著录对象是单位出版物,而题录的著录对象是单位出版物中的单篇文献。的著录对象是单位出版物,而题录的著录对象是单位出版物中的单篇文献。例如:一本名为例如:一本名为超导材料论文集超导材料论文集的图书汇集了的图书汇集了2525篇研究论文。篇研究论文。目录著录的对象是目录著录的对象是超导材料论文集超导材料论文集一书,而题录著录的对象则是书中的一书,而题录著录的对象则是书中的2525篇论文,篇论文,著录的结果是目录著录的结果是目录1 1条;题录条;题录2525条。条。47l 再如美国著名刊物再如美国著名

45、刊物自然自然,目录著,目录著录的对象就是录的对象就是自然自然这一刊物,而题录著这一刊物,而题录著录对象则是录对象则是自然自然这一刊物中刊载的成千这一刊物中刊载的成千上万篇论文。上万篇论文。题录是以题录是以单篇文献单篇文献 为著录对象。为著录对象。48题录的条目著录格式:例1检索结果检索结果:020713110 可视化信息的建模与实现/章丽(华东师范大学计算机科学系),李强/计算机工程.-2002,28(3).-92-93,236 注明各项:注明各项:文献顺序号(年份+流水 号);文献题名;第一责任者;第一责任者所在单位;其它责任者;刊名;出版年、卷(期)、起止页49(3)(3)文摘:文摘:是以

46、精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。文摘是系统揭示和报道单篇文献的文摘是系统揭示和报道单篇文献的外表特征和内容特征的检索工具。外表特征和内容特征的检索工具。文摘的著录对象可以是期刊中的单篇文章,或一种会议录中的某个章节或某篇论文,还可文摘的著录对象可以是期刊中的单篇文章,或一种会议录中的某个章节或某篇论文,还可以是一件专利、标准或一份科技报告。以是一件专利、

47、标准或一份科技报告。文摘的著录项目包括了题录的所有项目和对文献内容所作的摘要。文摘的著录项目包括了题录的所有项目和对文献内容所作的摘要。50文摘的条目著录格式:文摘的条目著录格式:例例1 1:TG526.1 950369利用变速切削提高机床切削系统稳定性 刊/于骏(吉林工业大学)/机械工艺师.1994,15(2):7-9,34对利用变速切削技术来表6参11 (江静波)注明各项:注明各项:分类号;顺序号;文献题名;文献类型;责任者(责任者所在单位);刊名;出版年,卷(期),起止页;文献摘要;表格数及参考文献条数;文摘员51例例2 2:47030 02080997 MPI燃料供给方式的天然气喷流可

48、视化研究=Visualization of Natural Gas Jet Used in MPI System.刊,中/许伯彦(山东建筑工程学院,济南250014),张兰/内燃机学报.2002,20(2).-99102 使用纹影照相法观察定容装置。图10参2关键词:天然气;多点燃料喷射;可视化;山东省自然科学基金资助(Y2000F07)注明各项:学科代码(如著录格式为TP319,则为分类号)文献顺序号文献中文题名=外文题名文献类型,原文语种第一责任者第一责任者所在单位及地址其他责任者刊名出版年、卷(期)、起止页文献摘要原文插图及参考文献数关键词资助基金种类和编号52以下文后参考文献的著录格式

49、有哪些错误:以下文后参考文献的著录格式有哪些错误:1 1袁庆寿袁庆寿 牛德林主编牛德林主编中国边疆经济发展概中国边疆经济发展概 略略,黑龙江人民出版社,黑龙江人民出版社,19931993年版年版 1 吴宝国、王龙等.北京大学学报北京大学学报J.2004,J.2004,40(5):7-9 40(5):7-922全国报刊索引全国报刊索引编辑部编辑部.高电化技术高电化技术J.J.自自 然科学出版社,然科学出版社,20032003【篇名篇名】双异构法制备晶体甘露醇的研究双异构法制备晶体甘露醇的研究【刊名刊名】化学工程师化学工程师,ChemicalChemical EngineerEngineer,20

50、05,2005年年3 3期期【作者作者】赵光辉赵光辉;王关斌王关斌;贺东海贺东海;李俊平李俊平 【机构机构】山东福田药业有限公司山东福田药业有限公司 山东禹城山东禹城;【关键词关键词】甘露醇甘露醇;山梨醇山梨醇;催化还原催化还原;异构反应异构反应【中英文摘要中英文摘要】文中研究了以葡萄糖为原料文中研究了以葡萄糖为原料,53(4)(4)全文全文 全文系统的主体内容是文献的全文。全文系统的主体内容是文献的全文。检索过程中,全文系统通常先提供题录和检索过程中,全文系统通常先提供题录和文摘信息,同时给出全文链接,供读者选文摘信息,同时给出全文链接,供读者选择。择。(5)(5)索引索引 (index)(

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(信息检索原理课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|