1、 重点:文献重点:文献记录有知识的一切记录有知识的一切载体载体。 文献构成三要素文献构成三要素知识、载体、记录方式知识、载体、记录方式2、现代科技文献的类型、现代科技文献的类型 (1) 按文献按文献出版类型出版类型:图书、期刊、会议文献、学位论文、专利文:图书、期刊、会议文献、学位论文、专利文献、标准文献、科技报告、技术档案、政府出版物、产品资料献、标准文献、科技报告、技术档案、政府出版物、产品资料 (2) 按文献按文献载体形式载体形式 :印刷型、缩微型、音像型、电子型:印刷型、缩微型、音像型、电子型1、 信息、知识、文献、情报的概念及之间的关系信息、知识、文献、情报的概念及之间的关系上节回顾
2、上节回顾产生产生实践活动实践活动大脑加工大脑加工事物运动事物运动信息信息知识知识存储存储文献文献情报情报为一定目的传递为一定目的传递(3)按文献按文献加工级别加工级别 一次文献:一次文献:又称原始文献,又称原始文献,是以作者本人的研究或研制成果是以作者本人的研究或研制成果为依据而创作或撰写的文献。如图书、期刊论文、会议论文、为依据而创作或撰写的文献。如图书、期刊论文、会议论文、学位论文等。学位论文等。二次文献:二次文献:又称检索性文献,又称检索性文献,是将大量的、分散的、无序的是将大量的、分散的、无序的一次文献,按照一定的方法进行整理、加工,使之系统化而一次文献,按照一定的方法进行整理、加工,
3、使之系统化而形成的具有汇集性和检索性特点的文献。形成的具有汇集性和检索性特点的文献。只提供一次文献的只提供一次文献的线索,本身不提供具体的知识和内容。线索,本身不提供具体的知识和内容。三次文献:三次文献:又称参考性文献,又称参考性文献,是围绕某一主题利用二次文献是围绕某一主题利用二次文献找到大量一次文献,经过阅读、分析、整理、找到大量一次文献,经过阅读、分析、整理、提炼、重组而提炼、重组而生成的一种生成的一种评述性或综述性文献,评述性或综述性文献,本身具有参考价值。本身具有参考价值。 从知识加工角度来看:从知识加工角度来看: 一次文献:对知识进行的第一次加工一次文献:对知识进行的第一次加工(
4、(创造性、原始性创造性、原始性) ) 二次文献:对知识的第二次加工二次文献:对知识的第二次加工( (有序化、检索性有序化、检索性) ) 三次文献:对知识的再加工三次文献:对知识的再加工( (有序化有序化+ +创造性、参考性创造性、参考性) ) 从检索的角度来看:从检索的角度来看: 一一次文献:检索的目标次文献:检索的目标 二次文献:检索的工具二次文献:检索的工具( (手段手段) ) 三次文献:检索目标三次文献:检索目标+ +检索工具检索工具从文献产生状况来看:从文献产生状况来看:生产者生产者生产工艺生产工艺产品形态产品形态一次文献一次文献科研人员科研人员科研实验科研实验科研论文、报告科研论文、
5、报告二次文献二次文献文献工作人员文献工作人员加工整理加工整理目录、题录、文摘等目录、题录、文摘等三次文献三次文献专家学者专家学者浓缩重组浓缩重组百科全书、年鉴等百科全书、年鉴等一次文献、二次文献、三次文献的关系一次文献、二次文献、三次文献的关系 工程力学学报、信息检索教程工程力学学报、信息检索教程 一次文献一次文献 工程索引工程索引EI、 科学引文索引科学引文索引SCI 二次文献二次文献 中国大百科全书、辞典中国大百科全书、辞典 三次文献三次文献3、期刊影响因子、核心期刊、统计源期刊、期刊影响因子、核心期刊、统计源期刊 影响因子(影响因子(IF):国际上通用的期刊评价指标):国际上通用的期刊评
6、价指标 中文核心期刊:中文核心期刊:中文核心期刊要目总览中文核心期刊要目总览 北京大学图书馆北京大学图书馆与与北京高校图书馆期刊工作研究会北京高校图书馆期刊工作研究会联合出版联合出版 包括:包括:社会科学社会科学和和自然科学自然科学等各种学科类别的中文期刊等各种学科类别的中文期刊 中文统计源期刊:中文统计源期刊:中国科技期刊引证报告中国科技期刊引证报告 中国科技信息研究所中国科技信息研究所出版出版 专指:中文科技类期刊。专指:中文科技类期刊。 南大中文核心期刊:南大中文核心期刊:社会科学引文索引社会科学引文索引 南京大学中国社会科学研究评价中心南京大学中国社会科学研究评价中心组织评定组织评定
7、专指:人文社会科学领域期刊。专指:人文社会科学领域期刊。 各种类型文献的参考文献格式各种类型文献的参考文献格式:文献标识:文献标识:M、J、 C、D、P、R、 S等等第二节第二节 信息检索的基础知识信息检索的基础知识2.1 信息检索的概念信息检索的概念广义:广义:指将信息按一定的方式组织和存储起来,并根据用户的指将信息按一定的方式组织和存储起来,并根据用户的需要检出所需信息的过程。包括需要检出所需信息的过程。包括信息存储信息存储和和信息检索信息检索两个过程。两个过程。信息存储信息存储:将大量无序的信息集中起来,根据其:将大量无序的信息集中起来,根据其外表特征外表特征和和内内容特征容特征,经过加
8、工,使其系统化、有序化,并按一定的技术要,经过加工,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或系统。求建成一个具有检索功能的工具或系统。信息检索信息检索:指运用编制好的检索工具或系统,查找并获取与用:指运用编制好的检索工具或系统,查找并获取与用户提问相关的信息的过程户提问相关的信息的过程 。狭义狭义指指以数值或数据为对象的检索,也称为数值检索。以数值或数据为对象的检索,也称为数值检索。如:如: 某地方某地方20152015年年GDPGDP增长情况、某种材料的电阻增长情况、某种材料的电阻系数、计算公式、数据图表,化学分子式等。系数、计算公式、数据图表,化学分子式等。数据检
9、索指指以某一客观事实为对象以某一客观事实为对象的检索的检索。如:查找某一名人、机构的基本情况;某一事件发如:查找某一名人、机构的基本情况;某一事件发生的时间、地点、过程等;鲁迅、微软公司、七七生的时间、地点、过程等;鲁迅、微软公司、七七事变等。事变等。事实检索指以指以文献线索或文献线索或文献文献原文原文为对象为对象的检索的检索。如:查找哪里有关于如:查找哪里有关于 “信息检索信息检索”的书的书? ? 查找有关查找有关“图书馆资源整合图书馆资源整合”方面的文章。方面的文章。 文献检索2.2 信息检索的类型信息检索的类型 根据检索对象的不同,信息检索分为:根据检索对象的不同,信息检索分为:信息检索
10、的类型文献检索与数据检索、事实检索的关系文献检索与数据检索、事实检索的关系文献检索:文献检索:相关性检索相关性检索,只检索出包含所需知识信息的文献,只检索出包含所需知识信息的文献,不直接解答用户所提出的具体问题。不直接解答用户所提出的具体问题。数据与事实检索:数据与事实检索:确定性检索确定性检索,检索出包含在文献中的知识,检索出包含在文献中的知识信息,检索结果可供用户直接利用。信息,检索结果可供用户直接利用。 通常,通常,文献检索通过文献检索通过二次文献二次文献来实现来实现,是信息检索中最基,是信息检索中最基本、最主要的形式。而数据与事实检索则是通过本、最主要的形式。而数据与事实检索则是通过三
11、次文献三次文献来来完成。完成。2.3 信息检索工具信息检索工具 2.3.1 概述概述 指用来存储、报道和查找各类指用来存储、报道和查找各类信息线索信息线索或或特定数据和事实特定数据和事实的的工具或系统。工具或系统。 主要包括:主要包括: (1) 二次、三次印刷型手工检索工具二次、三次印刷型手工检索工具 (2) 面向计算机和网络的各种数据库检索系统面向计算机和网络的各种数据库检索系统 (3) 搜索引擎等各种网络检索工具搜索引擎等各种网络检索工具 2.3.2 检索工具的作用检索工具的作用 a. 报道作用:报道作用:报道报道已经公开或发表的相关领域的信息及线已经公开或发表的相关领域的信息及线索。索。
12、 b. 存储作用:存储作用:将已经公开或发表的信息及线索按一定方式将已经公开或发表的信息及线索按一定方式存储存储起来,供用户检索利用。起来,供用户检索利用。 c. 检索作用:检索作用:供读者供读者查找查找信息及线索。信息及线索。 信息检索工具2.4 二次文献的分类二次文献的分类 (1) 目录目录(Catalog):是以是以“本本”为报道单位为报道单位,揭示,揭示出版物出版物(图书、图书、期刊等期刊等)外部特征外部特征(题名、著者、出处等题名、著者、出处等)的检索工具。的检索工具。 例:馆藏目录、联合目录、全国新书目、出版社目录等。例:馆藏目录、联合目录、全国新书目、出版社目录等。石家庄铁道大学
13、图书馆馆藏目录,点石家庄铁道大学图书馆馆藏目录,点击题名可查看馆藏地址。击题名可查看馆藏地址。二次文献(2) 题录题录(Title):是以是以 “篇篇” 为报道单位,为报道单位,揭示揭示文献文献(期刊论文、期刊论文、会议论文、学位论文、专利文献等会议论文、学位论文、专利文献等)外部特征外部特征(篇名、作者、出篇名、作者、出处等处等)的检索工具。的检索工具。中国学术期刊网络出版总库中国学术期刊网络出版总库中的部分题录信息中的部分题录信息CCC中的部分题录信息中的部分题录信息二次文献 (3) 文摘文摘(Abstract):也:也是以是以 “篇篇” 作为报道单位,作为报道单位,描述描述文献文献外部特
14、征和内容特征外部特征和内容特征的检索工具。比题录多了一个的检索工具。比题录多了一个内容摘要内容摘要项。项。中国学术期刊网络出版总库中国学术期刊网络出版总库中的部分文摘信息中的部分文摘信息 SCISCI中的部分文摘信息中的部分文摘信息二次文献(4) 索引索引(Index):是将文献中具有检索意义的事项,按照一定是将文献中具有检索意义的事项,按照一定方式有序编排起来,注明出处,供读者查检使用的方式有序编排起来,注明出处,供读者查检使用的检索工具检索工具。常用的索引类型有:分类索引、主题索引、著者索引、引文索常用的索引类型有:分类索引、主题索引、著者索引、引文索引等。引等。二次文献超星数字图书馆的分
15、类索引超星数字图书馆的分类索引EI的的 主题词(受控词)索引主题词(受控词)索引EI的作者索引的作者索引SCI的某篇文章的引文索引的某篇文章的引文索引2.5 文献检索的方法文献检索的方法(1) 追溯法追溯法 指以已有的指以已有的文献后面所附的参考文献文献后面所附的参考文献为线索查找相关文献为线索查找相关文献的方法。的方法。 向前追溯法:从一篇有价值的论文出发,利用其后所附的向前追溯法:从一篇有价值的论文出发,利用其后所附的参考文献,查找其引用了哪些文献。由近及远的回溯,越查参考文献,查找其引用了哪些文献。由近及远的回溯,越查越深,获取更多相关文献。越深,获取更多相关文献。来龙来龙 向后追溯法:
16、找到一篇有价值的论文后,进一步查找该论向后追溯法:找到一篇有价值的论文后,进一步查找该论文被哪些其它文献引用过。由远及近地追寻,越查资料越新,文被哪些其它文献引用过。由远及近地追寻,越查资料越新,研究也就越深入。研究也就越深入。去脉去脉 美国美国科学引文索引科学引文索引(SCI ) 通过揭示文献的引用与被引用通过揭示文献的引用与被引用关系来报道文献。关系来报道文献。文献检索方法 (2) 常用法:常用法:利用常规检索工具查找有关文献的方法利用常规检索工具查找有关文献的方法 顺查法顺查法 按课题的起始年代,按时间顺序由远及近逐年查找。用于按课题的起始年代,按时间顺序由远及近逐年查找。用于掌握课题研
17、究的进展及过程,一般用于撰写研究综述。掌握课题研究的进展及过程,一般用于撰写研究综述。 倒查法倒查法 以当前时间为起点,由近及远逐年查找文献。一般用于新以当前时间为起点,由近及远逐年查找文献。一般用于新开课题,以便掌握最近一段时间该课题达到的水平及研究动向。开课题,以便掌握最近一段时间该课题达到的水平及研究动向。 抽查法抽查法 根据课题所属学科研究发展的某一高峰时期,抽出一个时根据课题所属学科研究发展的某一高峰时期,抽出一个时间段,进行集中查找。能以较少的时间获得较多的文献。间段,进行集中查找。能以较少的时间获得较多的文献。文献检索方法(3) 综合法综合法(循环法或分段法循环法或分段法) 常用
18、法常用法+追溯法。即利用常用法检索出一批有用文献,然后追溯法。即利用常用法检索出一批有用文献,然后利用这些文献所附的参考文献由近及远或由远及近地查找,利用这些文献所附的参考文献由近及远或由远及近地查找,扩大文献线索。如此分段交替循环进行,从而可得到大量相扩大文献线索。如此分段交替循环进行,从而可得到大量相关文献。关文献。文献检索方法2.6 文献检索的途径文献检索的途径 指利用文献的各种特征指利用文献的各种特征检索标识,检索标识,通过检索工具查找所通过检索工具查找所需文献的过程。需文献的过程。 (1) 分类途径分类途径 按文献内容所属的学科类别来检索文献,使用的检索语言是按文献内容所属的学科类别
19、来检索文献,使用的检索语言是分类语言分类语言。分类法体现知识的系统性,它能把同一学科的信息。分类法体现知识的系统性,它能把同一学科的信息集中在一起。集中在一起。 缺点缺点: 新兴学科、边缘学科在分类时往往难于处理,查找不便。新兴学科、边缘学科在分类时往往难于处理,查找不便。 读者读者必须了解学科体系,否则在将概念变换为分类号的过程必须了解学科体系,否则在将概念变换为分类号的过程中常易发生错误中常易发生错误。中国知网:分类号中国知网:分类号TU37混凝土结构方面的文章混凝土结构方面的文章 (2) 主题途径主题途径 从文献内容的主题概念出发,按确定的主题词来检索文献从文献内容的主题概念出发,按确定
20、的主题词来检索文献 主题法主题法打破了传统的学科分类的框框,把分散于各个学科的打破了传统的学科分类的框框,把分散于各个学科的有关信息集中于有关信息集中于同一主题词同一主题词之下之下。文献检索途径EI:主题词:主题词Civil Engineering土木工程方面的文章土木工程方面的文章文献检索途径(3) 题名途径题名途径 书名、刊名、篇名等书名、刊名、篇名等(4) 关键词途径关键词途径(5) 作者途径作者途径(5) 机构途径机构途径(6) 引文途径引文途径 从文献的引用和被引用关系查找相关文献。从文献的引用和被引用关系查找相关文献。(7) 序号途径序号途径 文献号码文献号码(报告号、专利号、标准
21、号等报告号、专利号、标准号等) (8) 其他途径其他途径 例:美国例:美国化学文摘化学文摘中的中的“分子式索引分子式索引”2.7 文献检索的步骤文献检索的步骤(1) 分析研究课题,确定查找要求分析研究课题,确定查找要求a. 分析研究课题的主题内容分析研究课题的主题内容 即研究课题的所属学科、主题概念。即研究课题的所属学科、主题概念。 例:例:“混凝土断裂力学混凝土断裂力学”方面的文献方面的文献 学科:力学学科:力学断裂力学;土木工程断裂力学;土木工程混凝土与钢筋混混凝土与钢筋混凝土结构凝土结构 主题:断裂力学、混凝土主题:断裂力学、混凝土b. 确定研究课题所需的文献类型确定研究课题所需的文献类
22、型 基础理论性研究基础理论性研究 期刊、会议论文期刊、会议论文 尖端科学技术尖端科学技术 科技报告科技报告 发明创造、技术革新发明创造、技术革新 专利文献专利文献 产品定型设计产品定型设计标准文献及产品样本标准文献及产品样本c. 根据研究课题的背景确定出文献检索的时间范围根据研究课题的背景确定出文献检索的时间范围 查找查找“失冷事故失冷事故”方面的文献方面的文献 “核电站事故核电站事故”或或“核反应堆安全防护核反应堆安全防护” 1979年年3月美国宾西法尼亚州的三里岛核电站月美国宾西法尼亚州的三里岛核电站 1986年年4月苏联乌克兰的切尔诺贝利核电站月苏联乌克兰的切尔诺贝利核电站 2011年年
23、4月日本福岛核电站月日本福岛核电站文献检索步骤(2) 选择检索工具选择检索工具 a. 根据检索课题的学科、专业特点以及所需文献类型,充分根据检索课题的学科、专业特点以及所需文献类型,充分考虑检索工具报道文献的学科专业范围、文献类型、文种是否考虑检索工具报道文献的学科专业范围、文献类型、文种是否符合需要。符合需要。 b. 了解所选检索工具对文献揭示的深度、提供的检索途径、了解所选检索工具对文献揭示的深度、提供的检索途径、报道的时差等因素。报道的时差等因素。 c. 注重利用权威性的检索工具,同时注重将综合性与专业性、注重利用权威性的检索工具,同时注重将综合性与专业性、单一性的检索工具结合使用。单一
24、性的检索工具结合使用。 d. 对科技信息的检索,在检索手段上应优先选择和利用时效对科技信息的检索,在检索手段上应优先选择和利用时效性强的现代化检索工具。性强的现代化检索工具。 文献检索步骤(3) 确定检索途径确定检索途径 a. 根据文献外部特征提供的检索途径有:根据文献外部特征提供的检索途径有:题名、著者、机构、题名、著者、机构、引文途径,序号途径引文途径,序号途径(报告号、专利号等报告号、专利号等)。b. 根据文献内部特征提供的检索途径有:根据文献内部特征提供的检索途径有:分类途径、主题途分类途径、主题途径和其他途径径和其他途径(化学分子式等化学分子式等)。 文献检索步骤(4) 选择检索方法
25、选择检索方法 追溯法、常用法、追溯法、常用法、 综合法综合法(5) 查找文献线索查找文献线索 判断检索出的文献的参考价值,准确记录文献的分类号、判断检索出的文献的参考价值,准确记录文献的分类号、题名、著者、题名、著者、出处出处等信息,以便索取原始文献。等信息,以便索取原始文献。 (6) 查找原始文献查找原始文献 根据检索到的文献线索,利用各种类型的全文数据库、馆根据检索到的文献线索,利用各种类型的全文数据库、馆藏目录、联合目录去找文献原文。藏目录、联合目录去找文献原文。文献检索步骤CALIS(即中国高等教育文献保障系统即中国高等教育文献保障系统) (1) 全国中心全国中心 北京大学北京大学(文
26、理文理)、清华大学、清华大学(工程工程)、中国农业大学、中国农业大学(农学农学)、北京医科大学北京医科大学(医学医学) (2) 地区分中心地区分中心 上海交通大学、南京大学、中山大学、武汉大学、四川大上海交通大学、南京大学、中山大学、武汉大学、四川大学、西安交通大学和吉林大学。学、西安交通大学和吉林大学。 哈尔滨工业大学设有东北哈尔滨工业大学设有东北地区国防科技文献信息中心地区国防科技文献信息中心 (3) 成员馆成员馆 公共图书馆、公共图书馆、 高校图书馆和科研院所图书馆。高校图书馆和科研院所图书馆。一、概述一、概述二、分类语言二、分类语言三、关键词语言三、关键词语言四、主题词语言四、主题词语
27、言第三节第三节 检索语言检索语言 3.1 概述概述 检索语言是根据文献信息的存储和检索的需要而创制的一种检索语言是根据文献信息的存储和检索的需要而创制的一种人工语言,又称检索标识。人工语言,又称检索标识。 信息存储:用来描述文献的内容特征和外部特征,形成信息存储:用来描述文献的内容特征和外部特征,形成检索检索标识标识。 信息检索:用来描述检索提问,形成信息检索:用来描述检索提问,形成提问标识提问标识。 当提问标识与检索标识完全匹配或部分匹配时,即可命中所当提问标识与检索标识完全匹配或部分匹配时,即可命中所需信息。需信息。 检索语言 自然语言自然语言检索语言的分类检索语言的分类标题词标题词叙叙
28、词词描述内容描述内容特征语言特征语言分类号分类号检检索索语语言言主题词主题词 描述外表描述外表特征语言特征语言关键词关键词检索语言人工语言人工语言 分类语言分类语言 题名(书名题名(书名/ /刊名刊名/ /篇名)篇名)著者(作者)著者(作者)出版事项(出版者、出版地)出版事项(出版者、出版地)代码(标准号、专利号、报告号、代码(标准号、专利号、报告号、 ISBNISBN号、号、ISSNISSN号)号)3.2 分类语言分类语言 按按学科范畴学科范畴从上至下、从总体到局部层层划分、展开,形成从上至下、从总体到局部层层划分、展开,形成一种直接体现知识分类的等级制概念的标识系统。一种直接体现知识分类的
29、等级制概念的标识系统。 每个学科类目都用相对固定的代码作为标识每个学科类目都用相对固定的代码作为标识分类号。分类号。 每一个分类号代表一个特定的知识概念。每一个分类号代表一个特定的知识概念。 分类语言是一种分类语言是一种先组式先组式检索语言。检索语言。 特点:集中体现学科的系统性,反应事物的从属、派生关特点:集中体现学科的系统性,反应事物的从属、派生关系,便于按学科门类进行系,便于按学科门类进行族性检索族性检索。 最常见的是体系分类语言最常见的是体系分类语言检索语言3.2.1 体系分类语言体系分类语言 国内:国内:中国图书馆分类法中国图书馆分类法(简称简称“中图法中图法”)中国科学院图书馆分类
30、法中国科学院图书馆分类法(简称简称“科图法科图法”) 中国人民大学图书馆分类法中国人民大学图书馆分类法(简称简称“人大法人大法”)。 国外:国外: 杜威十进分类法杜威十进分类法 国际十进分类法国际十进分类法等。等。 中国图书馆分类法中国图书馆分类法是国家推荐统一使用的分类法是国家推荐统一使用的分类法分类语言3.2.2 中图分类表的结构中图分类表的结构(1) 基本部类基本部类 (5个个)(2) 基本大类基本大类 (22个个)(3) 简表简表(4) 详表详表(5) 辅助表辅助表分类语言中国图书馆分类法中国图书馆分类法基本部类基本部类 (5)基本大类基本大类 (22) 一、马列主义、毛泽东思想一、马
31、列主义、毛泽东思想 A 马、列、毛泽东、邓小平理论马、列、毛泽东、邓小平理论 二、哲学二、哲学 B 哲学哲学 三、社会科学三、社会科学 C 社会科学社会科学D 政治政治E 军事军事F 经济经济G 文化、科学、教育、体育文化、科学、教育、体育H 语言、文字语言、文字I 文学文学J 艺术艺术K 历史、地理历史、地理分类语言基本部类基本部类 (5)基本大类基本大类 (22) 四、自然科学四、自然科学 N 自然科学总论自然科学总论 O 数理科学和化学数理科学和化学 P 天文学、地球科学天文学、地球科学 Q 生物科学生物科学 R 医药、卫生医药、卫生 S 农业科学农业科学 T 工业技术工业技术 U 交通
32、运输交通运输 V 航空航天航空航天 X 环境科学环境科学 五、综合性图书五、综合性图书 Z 综合性图书综合性图书 中国图书馆分类法中国图书馆分类法分类语言 其中其中“T工业技术工业技术”大类范围广泛,内容繁多,故又在该类基大类范围广泛,内容繁多,故又在该类基础上采用了双位拉丁字母标记其所属的础上采用了双位拉丁字母标记其所属的16个二级类目。个二级类目。 TB 一般工业技术一般工业技术 TD 矿业工程矿业工程 TE 石油、天然气工业石油、天然气工业 TF 冶金工业冶金工业 TG 金属学与金属工艺金属学与金属工艺 TH 机械、仪表工业机械、仪表工业 TJ 武器工业武器工业 TK 能源与动力工程能源
33、与动力工程 TL 原子能技术原子能技术 TM 电工技术电工技术 TN 无线电电子学、电信技术无线电电子学、电信技术 TP 自动化技术、计算机技术自动化技术、计算机技术 TQ 化学工业化学工业 TS 轻工业、手工业轻工业、手工业 TU 建筑科学建筑科学 TV 水利工程水利工程分类语言 简表:简表:又称为基本类目表,是分别对每个基本大类,依据它又称为基本类目表,是分别对每个基本大类,依据它的某些属性,作进一步划分后而形成的二、三级类目表的某些属性,作进一步划分后而形成的二、三级类目表 。 如:如:O 数理科学和化学数理科学和化学 一度划分:一度划分: O1 数学数学 O3力学力学 O4物理学物理学
34、 O6化学化学 O7晶体学晶体学分类语言O1 数学,二度划分:数学,二度划分: O11古典数学古典数学O12初等数学初等数学O13高等数学高等数学O14数理逻辑、数学基础数理逻辑、数学基础O15代数、数论、组合理论代数、数论、组合理论O17数学分析数学分析O18几何、拓扑几何、拓扑O19动力系统理论动力系统理论 分类语言 详表:详表:整个分类法的正文,亦称主表或正表,由简表进一步整个分类法的正文,亦称主表或正表,由简表进一步细分而成的最小概念性分类表。它是类分信息资料的依据。细分而成的最小概念性分类表。它是类分信息资料的依据。两万个。两万个。 O17 数学分析数学分析 O171分析基础分析基础
35、 O172微积分微积分 O172.1微分学微分学 O172.2 积分学积分学分类语言41文学文学 0 文学理论文学理论 1 世界文学世界文学 2 中国文学中国文学 3/7 各国文学各国文学22诗歌、韵文诗歌、韵文23戏剧文学戏剧文学24小说小说25报告文学报告文学26散文散文27民间文学民间文学.222 古代至近代作品古代至近代作品(1919年年)226 当代作品当代作品(19191949年年)227 现代作品现代作品(1949年年) 227.1 自由诗自由诗 227.2 抒情诗抒情诗 227.3 叙事诗叙事诗 227.7 格律诗格律诗 227.8 词词 227.9 其他其他举举 例例 中国图
36、书馆分类法中国图书馆分类法 比如:比如:房屋建筑工程房屋建筑工程索书号:索书号:TU22/61=分类号分类号TU22+种次种次号号61TU22/61T:工业技术:工业技术TU:建筑科学:建筑科学TU2:建筑设计:建筑设计TU22:房屋构造设计:房屋构造设计61:种次号,即属于本馆房屋构造设计类第:种次号,即属于本馆房屋构造设计类第61种种图书图书分类语言3.2.3 杜威十进分类法(杜威十进分类法(DDC) 世界上流传最广影响最大的分类法。世界上流传最广影响最大的分类法。 在美国有在美国有95的公共图书馆在使用。的公共图书馆在使用。分类语言DDC第第21版的类目共有版的类目共有10大类大类 00
37、0 计算机、信息及总论计算机、信息及总论 100 哲学和心理学哲学和心理学 200 宗教宗教 300 社会科学社会科学 400 语言语言 500 自然科学自然科学 600 技术技术 700 艺术和娱乐艺术和娱乐 800 文学文学 900 历史和地理历史和地理分类语言每一大类之下又有每一大类之下又有9个类和个类和1个个“总论总论”,合成,合成10个类,称之为个类,称之为“门门”。 600 技术技术 610 医学医学 620 工程学工程学 630 农业农业 640 家政家政 650 管理和公共关系管理和公共关系 660 化学工程化学工程 670 制造业制造业 680 特殊产品的制造特殊产品的制造
38、690 建筑工程建筑工程分类语言 每一每一“门门”之下,又有之下,又有9个小类及个小类及1个个“总论总论”性的类目,称性的类目,称之为之为“纲纲”;如此逐级细分,三位数分满后,加上小数点用;如此逐级细分,三位数分满后,加上小数点用其下一位小数,直到不再有文献为止。其下一位小数,直到不再有文献为止。 630 农业和相关技术农业和相关技术 636 动物饲养动物饲养 636.7 狗狗 636.8 猫猫分类语言 从文献的题名和内容中抽取出来的,能够表达主题内容的具从文献的题名和内容中抽取出来的,能够表达主题内容的具有检索意义的关键性词汇。有检索意义的关键性词汇。 属于自然语言,未经过规范处理。属于自然
39、语言,未经过规范处理。(由文献作者提取由文献作者提取) 没有固定词表,标引文献时根据文献内容选择恰当的词汇进没有固定词表,标引文献时根据文献内容选择恰当的词汇进行组配,以表达文献的内容特征。行组配,以表达文献的内容特征。 优点:优点: 一是有利于计算机自动抽词标引,适合于电子信息资源的一是有利于计算机自动抽词标引,适合于电子信息资源的标引和检索。标引和检索。 二是符合习惯、容易接受。二是符合习惯、容易接受。3.3 关键词语言关键词语言关键词语言 缺点:查全率、准确率较差。缺点:查全率、准确率较差。 同义词标引同义词标引引起漏检;多义词标引引起漏检;多义词标引引起误检引起误检 例:同义词,飞机:
40、例:同义词,飞机: Airplane、Aircraft、Planes 多义词,多义词, cell : 电池、细胞电池、细胞 为了避免上述现象,采用规范化的词进行标引。为了避免上述现象,采用规范化的词进行标引。 所谓规范化,即词所谓规范化,即词(或词组或词组)和概念一一对应,一个词和概念一一对应,一个词(或词组或词组)表达一个概念。表达一个概念。关键词语言3.4 主题词语言主题词语言定义:定义:在标引和检索中用以表达文献主题的规范化的词或词组。在标引和检索中用以表达文献主题的规范化的词或词组。( (由文献加工者提取由文献加工者提取) ) 属于人工语言,经规范化处理。属于人工语言,经规范化处理。(
41、 (由文献加工者提取由文献加工者提取) ) 常用主题检索语言:标题词、叙词常用主题检索语言:标题词、叙词。主题词语言 标题词标题词:是从文献的题目和内容中抽选出来,经过规范处理,:是从文献的题目和内容中抽选出来,经过规范处理,用以描述文献内容特征的词和词组。用以描述文献内容特征的词和词组。是最早使用的一种主题是最早使用的一种主题语言。语言。l受标题词表控制受标题词表控制 如:电脑、微机(不规范词)如:电脑、微机(不规范词)计算机(规范词)。计算机(规范词)。 是一种是一种先组式的规范词语言先组式的规范词语言,即在检索前已经将概念之间的,即在检索前已经将概念之间的关系组配好。关系组配好。如:计算
42、机网络(计算机如:计算机网络(计算机+网络),信息资源网络),信息资源(信息(信息+资源)资源) 具有较好的通用性、直接性和专指性,但灵活性较差。具有较好的通用性、直接性和专指性,但灵活性较差。之后之后逐步被叙词语言代替。逐步被叙词语言代替。主题词语言 叙词语言叙词语言:国内称主题词国内称主题词。是以概念为基础,经过严格规范是以概念为基础,经过严格规范化,通过化,通过概念组配方式概念组配方式表达文献主题的词和词组表达文献主题的词和词组。是目前使是目前使用最广泛的主题语言。用最广泛的主题语言。l受叙词表控制受叙词表控制l是一种是一种后后组式的规范词语言,组式的规范词语言,即在检索即在检索时再进行
43、时再进行概念之间的概念之间的关系组配。如:计算机关系组配。如:计算机、系统系统、网络,可组成、网络,可组成计算机系统计算机系统、计算机计算机网络、网络、计算机系统计算机系统网络。网络。l检索结果准确而全面,较适合于计算机检索。检索结果准确而全面,较适合于计算机检索。 常用的叙词表有:常用的叙词表有:INSPEC的词表的词表INSPEC Thesaurus、Ei的的EI Thesaurus及我国编辑出版的及我国编辑出版的汉语主题词表汉语主题词表等。等。主题词主题词是经过人工规范的词汇是经过人工规范的词汇关键词关键词是没有经过规范的自然语言词汇是没有经过规范的自然语言词汇如:图书馆在标引如:图书馆
44、在标引“土豆土豆”、“洋芋洋芋”等方面的文献时用等方面的文献时用“马马铃薯铃薯”这一规范词。这一规范词。 主顾、顾客、购物者、消费者、使用者、读者等用主顾、顾客、购物者、消费者、使用者、读者等用“用户用户”这一规范词来表达。这一规范词来表达。主题词可以很好地避免漏检,提高检全率。主题词可以很好地避免漏检,提高检全率。主题词与关键词的区别主题词与关键词的区别 分类法与主题法的区别分类法与主题法的区别 分类法分类法以学科性质类分文献,它以学科性质类分文献,它以学科集中文献以学科集中文献,属于,属于族性族性检索检索,可能造成事物主题文献的分散。,可能造成事物主题文献的分散。 主题法主题法以主题词概括
45、文献内容,以主题词概括文献内容,以事物主题集中文献以事物主题集中文献,属于,属于特性检索特性检索, 它可能造成学科文献的分散。它可能造成学科文献的分散。 例如:例如: 地下工程系统分析与设计地下工程系统分析与设计这本书进行标引这本书进行标引 分类标引:考虑本文主题内容所属学科及隶属关系:分类标引:考虑本文主题内容所属学科及隶属关系:“工业工业技术技术建筑科学建筑科学地下建筑地下建筑”,相应分类号,相应分类号TU92。 主题标引:不需考虑其所属学科专业,直接用描述内容主题主题标引:不需考虑其所属学科专业,直接用描述内容主题词词“地下工程地下工程“、”系统分析系统分析”标引即可。标引即可。第四节第
46、四节 计算机检索技术计算机检索技术一、计算机检索系统一、计算机检索系统二、检索提问式二、检索提问式三、计算机检索步骤三、计算机检索步骤 依检索手段,信息检索分为:依检索手段,信息检索分为: 手工检索:手工检索:使用印刷型(书本式)的检索工具使用印刷型(书本式)的检索工具 计算机检索:计算机检索:运用计算机技术、网络通信技术,通过数据库运用计算机技术、网络通信技术,通过数据库系统实现检索。系统实现检索。 检索手段检索手段 信息信息载体载体 存储存储方式方式检索检索途径途径检索策检索策略实现略实现 检索检索效率效率手工检索手工检索纸张纸张印刷型印刷型较少较少人脑人脑低低计算机检索计算机检索磁盘磁盘
47、光盘等光盘等电子型电子型较多较多计算机计算机高高4.1 计算机检索系统计算机检索系统4.1.1 发展历程发展历程 脱机批处理信息检索脱机批处理信息检索 联机检索系统联机检索系统 光盘检索系统光盘检索系统 基于基于web的联机检索系统的联机检索系统 网络数据库网络数据库 脱机批处理信息检索脱机批处理信息检索(50年代中期至年代中期至60年代中后期年代中后期)l利用单台计算机进行检索的系统。由计算机硬件、检索软件利用单台计算机进行检索的系统。由计算机硬件、检索软件和数据库三部分构成。和数据库三部分构成。l过程:检索机构把多个用户的检索提问汇总到一起,进行批过程:检索机构把多个用户的检索提问汇总到一
48、起,进行批量检索,然后把检索结果通知各个用户。量检索,然后把检索结果通知各个用户。l特点:特点: (1) 委托专业人员批量检索,可处理关系复杂的检索词汇。委托专业人员批量检索,可处理关系复杂的检索词汇。 (2) 用户不能在检索过程中与主机进行用户不能在检索过程中与主机进行“对话对话”和浏览文献,和浏览文献,不能及时修改检索策略。不能及时修改检索策略。 (3) 不能及时获得检索结果。不能及时获得检索结果。发展历程 联机信息检索联机信息检索(从从60年代中后期开始年代中后期开始)l C/S 结构,即客户机和服务器结构结构,即客户机和服务器结构。是一台主机带多个终端。是一台主机带多个终端的计算机信息
49、检索系统。能使许多相互独立的终端同时进行的计算机信息检索系统。能使许多相互独立的终端同时进行检索。由检索系统主机、数据库、通讯网、检索软件、检索检索。由检索系统主机、数据库、通讯网、检索软件、检索终端组成。终端组成。l特点:特点: (1) 无需委托。检索过程是无需委托。检索过程是“人人机对话机对话”式,用户直接检索,式,用户直接检索,及时修改检索策略。及时修改检索策略。 (2) 数据库数量多,质量高。检索速度快,查全和查准率高。数据库数量多,质量高。检索速度快,查全和查准率高。 (3) 检索指令复杂检索指令复杂,多为专业检索人员才能熟练使用。,多为专业检索人员才能熟练使用。 (4) 只对授权用
50、户开放。联机检索按时计费,检索费用昂贵。只对授权用户开放。联机检索按时计费,检索费用昂贵。发展历程 光盘信息检索(光盘信息检索(80年代中期开始)年代中期开始) 利用计算机设备对只读式光盘数据库进行检索。利用计算机设备对只读式光盘数据库进行检索。 单机光盘检索系统:单机光盘检索系统:提供单用户、单机的使用,系统结构简提供单用户、单机的使用,系统结构简单,但数据量少。单,但数据量少。 光盘网络系统光盘网络系统 :将光盘放在光盘塔或光盘库中,由服务器管将光盘放在光盘塔或光盘库中,由服务器管理运行。一般只提供理运行。一般只提供在局域网上在局域网上检索,如图书馆网、校园网检索,如图书馆网、校园网等,网