1、 文献检索(信息检索)文献检索(信息检索) 第三章第三章 信息检索概述信息检索概述第二节信息检索基础知识第二节信息检索基础知识G252.7/160=21谢谢观赏2019-8-21一、信息检索的概念一、信息检索的概念( (一一) )信息检索的概念信息检索的概念信息检索有广义和狭义之分:信息检索有广义和狭义之分:广义的信息检索广义的信息检索是指将信息按一定的方式组是指将信息按一定的方式组织和存储,根据信息用户的需求从信息集合中织和存储,根据信息用户的需求从信息集合中找出信息的过程和找出信息的过程和技术技术。其全称为:。其全称为:信息存储信息存储和检索和检索。存储存储的过程是信息组织加工和记录的的过
2、程是信息组织加工和记录的过程,即建立检索系统(编制检索工具)的过过程,即建立检索系统(编制检索工具)的过程程输入输入的过程;的过程;检索检索的过程是按一定的方法的过程是按一定的方法从检索系统(检索工具)中查出信息用户需要从检索系统(检索工具)中查出信息用户需要的特定信息的过程的特定信息的过程输出输出的过程。的过程。狭义的信息检索狭义的信息检索是对信息用户而言,就是信是对信息用户而言,就是信息集合中找出所需的信息。息集合中找出所需的信息。2谢谢观赏2019-8-21二、信息检索的类型二、信息检索的类型(一)按存储和检索的内容划分(一)按存储和检索的内容划分1.1.文献检索文献检索:以:以文献全文
3、文献全文为检索对象的一种检为检索对象的一种检索,从文献集合中检索出所需的、切题的文献索,从文献集合中检索出所需的、切题的文献的过程、方法和策略。凡是查找某一主题、学的过程、方法和策略。凡是查找某一主题、学科时代、地区、著者等相关文献圴属此类。科时代、地区、著者等相关文献圴属此类。2.2.事实检索事实检索:从文献中抽取的:从文献中抽取的事项事项为检索内容为检索内容的检索。亦即从存储有大量的检索。亦即从存储有大量知识信息知识信息、事实信事实信息息和和数据信息数据信息的检索工具和检索系统中获取某的检索工具和检索系统中获取某一事物的现状、结果、发生的时间、地点和过一事物的现状、结果、发生的时间、地点和
4、过程的检索,如程的检索,如查找某产品的生产企业、性能、查找某产品的生产企业、性能、人物的基本情况、历史变迁等人物的基本情况、历史变迁等。3谢谢观赏2019-8-213.3.数据检索:数据检索:从存储大量数据、图表的检索系从存储大量数据、图表的检索系统中获取统中获取数值数值型信息,检索结果是经过评估型信息,检索结果是经过评估的各种数据,可直接应用于比较分析、定性的各种数据,可直接应用于比较分析、定性或定量分析。或定量分析。4.4.多媒体检索多媒体检索:随着计算机和网络技术的发展:随着计算机和网络技术的发展而产生的新的检索类型,是利用特定的而产生的新的检索类型,是利用特定的搜索搜索引擎引擎从从存储
5、有多媒体文件的检索系统存储有多媒体文件的检索系统中获取中获取多媒体信息的一种检索方式。其检索结果是多媒体信息的一种检索方式。其检索结果是文字、图像、声频、视频等或静、或动的信文字、图像、声频、视频等或静、或动的信息形式。息形式。事实检索和数据检索是以事实检索和数据检索是以从文献中提取从文献中提取出来出来的各种事实、数据为检索对象的一种的各种事实、数据为检索对象的一种确确定性检索定性检索。4谢谢观赏2019-8-21( (二)按检索手段划分二)按检索手段划分1.1.手工检索手工检索手工检索手工检索(manual retrieval)(manual retrieval)使用的多使用的多为为印刷型或
6、书本型检索印刷型或书本型检索(paper-based paper-based retrievalretrieval) 工具工具,早些时候有检索卡片,现,早些时候有检索卡片,现在使用最多的是在使用最多的是检索刊检索刊,它们定期地将最新收,它们定期地将最新收集到的信息、文献加以汇总、组织和报道。手集到的信息、文献加以汇总、组织和报道。手检的技术要求不高,以人的劳动为本,由人来检的技术要求不高,以人的劳动为本,由人来翻阅,由人来进行比较、选择,完成匹配。翻阅,由人来进行比较、选择,完成匹配。 以以印刷文献印刷文献为主要检索对象,以各类为主要检索对象,以各类文摘、题文摘、题录和目录性工具书为可利用的主
7、要检索工具录和目录性工具书为可利用的主要检索工具,以图书馆的以图书馆的参考咨询部参考咨询部为开展信息检索服务的为开展信息检索服务的中心机构。中心机构。5谢谢观赏2019-8-212.2.计算机检索计算机检索计算机的信息检索主要经历了计算机的信息检索主要经历了早期的脱机批早期的脱机批处理处理,后来的,后来的联机实时检索联机实时检索、联机网络化和多元联机网络化和多元化化信息检索,到目前的信息检索,到目前的以因特网的搜索引擎以因特网的搜索引擎为核为核心的网络化检索时期。心的网络化检索时期。检索过程是在检索过程是在人与机器的合作、协同下完成人与机器的合作、协同下完成的,的,它们经常用实时的、交互的方式
8、从计算机存它们经常用实时的、交互的方式从计算机存贮的大量数据中自动分拣出用户所需要的信息。贮的大量数据中自动分拣出用户所需要的信息。计算、比较、选择的匹配任务是由机器来执行的,计算、比较、选择的匹配任务是由机器来执行的,而而人则是整个检索方案的设计者和操纵者人则是整个检索方案的设计者和操纵者。检索用户由专业检索人员向个人终端用户转移。检索用户由专业检索人员向个人终端用户转移。6谢谢观赏2019-8-21三、信息检索工具三、信息检索工具(一)信息检索工具的概念(一)信息检索工具的概念信息检索工具是用来信息检索工具是用来报道、存储和查找的报道、存储和查找的工具工具. .也是借以鸟瞰科技发展历程以及
9、学科进展也是借以鸟瞰科技发展历程以及学科进展状况的重要工具。由专业人士状况的重要工具。由专业人士将文献的外表和将文献的外表和内容特征转换成具有检索意义的标识,为信息内容特征转换成具有检索意义的标识,为信息检索者提供有章可循的途径检索者提供有章可循的途径。检索系统检索系统由一定的由一定的检索设备检索设备和加工整理好和加工整理好并存储在相应的载体上的并存储在相应的载体上的文献集合文献集合(如文献数(如文献数据库)及其他必要设备共同构成的,具有据库)及其他必要设备共同构成的,具有存储存储和检索功能的信息服务设施。和检索功能的信息服务设施。7谢谢观赏2019-8-21检索系统和检索工具的区别检索系统和
10、检索工具的区别(1 1)检索工具检索工具常指常指纸质纸质的书本或卡片,的书本或卡片,检索检索系统系统指多个指多个子系统子系统构成的,需借助专门机器构成的,需借助专门机器进行检索的设施。进行检索的设施。(2 2)检索工具结构简单,需要依靠)检索工具结构简单,需要依靠人的智力人的智力和知识和知识进行信息比较和选择;检索系统依靠进行信息比较和选择;检索系统依靠机器语言机器语言来进行信息服务。来进行信息服务。注:二者之间没有绝对的界线。注:二者之间没有绝对的界线。8谢谢观赏2019-8-21检索工具必备条件:检索工具必备条件:(1)(1)对所收录的对所收录的文献的各种特征文献的各种特征(包括外部特征(
11、包括外部特征和内容特征)有详细的和内容特征)有详细的描述描述;(;( 体现报道和体现报道和存储功能)存储功能)(2 2)每条记录有可供)每条记录有可供检索检索用的用的标识标识;(体现查;(体现查找功能)找功能)(3 3)全部记录)全部记录科学地组织科学地组织成一个有机的整体;成一个有机的整体;( 查找功能,使记录存放有序)查找功能,使记录存放有序)(4 4)具有)具有多种多种必要的必要的检索手段。检索手段。(查找功能,(查找功能,满足用户多角度查找文献)满足用户多角度查找文献)9谢谢观赏2019-8-21知识的产生知识的产生 记录记录 原始文献原始文献 文献整理文献整理 知识重组知识重组 知识
12、浓缩知识浓缩书目、目录书目、目录 词典、名录词典、名录 述评、专著述评、专著索引、文摘索引、文摘 指南、手册指南、手册 教科书、论文丛书教科书、论文丛书新书通报新书通报 年鉴年鉴 百科全书百科全书 二次整理二次整理 研究、实验研究、实验 书目之书目书目之书目 实践、综合实践、综合 词典的指南词典的指南 文献指南文献指南 知识的创新知识的创新 传传 播播 科技信息的利用科技信息的利用 检索工具在文献结构系统中的位置检索工具在文献结构系统中的位置10谢谢观赏2019-8-21(二)常用检索工具的类型(二)常用检索工具的类型1.1.目录目录,也称书目,也称书目,以整本图书、期刊作为报以整本图书、期刊
13、作为报道单元道单元,收录文献的题名、著者、出版者、,收录文献的题名、著者、出版者、收藏情况等外部特征信息,收藏情况等外部特征信息,按类编排按类编排。亦就。亦就是对一批相关是对一批相关文献外表特征文献外表特征(文献名称、著(文献名称、著者、文献出处等)的加以整理和分编,并按者、文献出处等)的加以整理和分编,并按一定顺序组织起来形成的一种检索工具。根一定顺序组织起来形成的一种检索工具。根据编制目的和用途的不同,目录可分为据编制目的和用途的不同,目录可分为国家国家目录、馆藏目录、联合目录、出版商目录目录、馆藏目录、联合目录、出版商目录等。等。11谢谢观赏2019-8-21传统的卡片式目录传统的卡片式
14、目录12谢谢观赏2019-8-21电子目录电子目录13谢谢观赏2019-8-21题录著录格式题录著录格式 如下:030301007 网络时代的管理创新/高维钫(北京邮电大学文法经济学院)/经济管理.2002,13(6),53-55记录号记录号题名题名著者姓名著者姓名著者单位著者单位原文出处原文出处2.2.题录题录,与目录基本相同,也是对文献外部特,与目录基本相同,也是对文献外部特征(如文献题名、著者、文献出处等)的揭示征(如文献题名、著者、文献出处等)的揭示和报道,只是内容上是以和报道,只是内容上是以独立的单篇文献独立的单篇文献(如(如一篇文章或书中某一部分以至整个出版物)一篇文章或书中某一部
15、分以至整个出版物)为为著录单元著录单元。(广、快、新)。(广、快、新)14谢谢观赏2019-8-21 与目录区别与目录区别著录对象不同著录对象不同目录目录单位出版物单位出版物题录题录单篇文献单篇文献15谢谢观赏2019-8-213.3.索引索引将收录范围内的文献中的将收录范围内的文献中的题名题名、主题主题、人名人名、地名等名词术语地名等名词术语以及其他有关款目抽以及其他有关款目抽出,注明出处,并出,注明出处,并按一定的排检方式组织而按一定的排检方式组织而成成的一种的一种检索系统检索系统。是。是以文献中的以文献中的“知识单知识单元元”为单位为单位,揭示各种文献外部特征或内容,揭示各种文献外部特征
16、或内容特征的系统化记载工具。特征的系统化记载工具。索引揭示文献内容比目录更为深入和细索引揭示文献内容比目录更为深入和细致,比目录应用更广泛。致,比目录应用更广泛。16谢谢观赏2019-8-214.4.文摘文摘也提要、摘要,文摘不仅描述文献的也提要、摘要,文摘不仅描述文献的外表特征,而且还揭示文献的内容特征,是外表特征,而且还揭示文献的内容特征,是带带有文摘内容的、扩展了的题录有文摘内容的、扩展了的题录 。可以获取文献可以获取文献的核心内容观点,是一种经济的文献形式。的核心内容观点,是一种经济的文献形式。印刷版本文摘著录格式如下:印刷版本文摘著录格式如下:9807471 OODB中的模式更改框架
17、刊,中/郭 江/计算机应用与软件.1997,14(3).23-34 模式演化是面向对象系统中的一个关键问题。由于OODB(面向对象数据库系统)的应用。参4文摘号文摘号题名文献类型文种著著者者姓姓名名原始文献的出处摘要参考文献数目17谢谢观赏2019-8-21电子版本文摘著录格式电子版本文摘著录格式 如下如下:18谢谢观赏2019-8-21文摘的作用文摘的作用(1 1)通报最新通报最新的科学文献;的科学文献;(2 2)深入)深入提示文献内容提示文献内容,吸引读者去阅读原文;,吸引读者去阅读原文;(3 3)节约节约阅读阅读时间时间;(4 4)确定原文内容)确定原文内容与课题的相关程度与课题的相关程
18、度;(5 5)帮助用户)帮助用户克服语言障碍克服语言障碍 ;(6 6)有助于)有助于提高标引质量提高标引质量;(7 7)便于读者进行)便于读者进行回溯性检索回溯性检索;(8 8)是撰写)是撰写综述、述评、研究科技发展史的重综述、述评、研究科技发展史的重要素材。要素材。19谢谢观赏2019-8-215.5.参考工具书参考工具书是汇集某一方面的是汇集某一方面的知识和资料知识和资料,按某种体例编排,按某种体例编排的专供的专供查考和检索查考和检索特定知识或信息,而特定知识或信息,而不需要不需要系统阅读的工具性著作系统阅读的工具性著作,如字、词(辞)典,如字、词(辞)典,百科全书、年鉴、手册、名录、类书
19、、政书、百科全书、年鉴、手册、名录、类书、政书、表谱、图录等表谱、图录等(1)(1)字、词典字、词典:字典解释字形、读音、含义和用法;:字典解释字形、读音、含义和用法;词典解释词语的概念、意义及用法,可分语文词典解释词语的概念、意义及用法,可分语文词典、专科词典和综合词典三大类。语文词典词典、专科词典和综合词典三大类。语文词典有有现代汉语词典现代汉语词典、汉语大字典汉语大字典、汉汉语大词典语大词典;专科词典有;专科词典有经济大词典经济大词典、数学词典数学词典;综合性词典有;综合性词典有辞源辞源(18841884年以前)和年以前)和辞海辞海(兼顾古今)(兼顾古今)20谢谢观赏2019-8-21(
20、2 2)百科全书)百科全书是以是以条目条目的形式,全面、系统地的形式,全面、系统地概述概述各学科各学科(人类一切门类)或某一学科领域(人类一切门类)或某一学科领域知识知识,并,并按词典形式编排的工具书按词典形式编排的工具书,有,有“工具书之王工具书之王”之称。之称。百科全书可供一般阅读和学习使用,具有百科全书可供一般阅读和学习使用,具有教教育性育性;它有完善的目录、索引和参见系统,;它有完善的目录、索引和参见系统,具有具有检索性检索性;它的再版、补编等工作,保证;它的再版、补编等工作,保证其所含内容的其所含内容的新颖性新颖性。百科全书是人类最有。百科全书是人类最有用的知识的系统概述。用的知识的
21、系统概述。世界三大著名的英语百科全书世界三大著名的英语百科全书不列颠百科不列颠百科全书全书、美国百科全书美国百科全书、科里尔百科科里尔百科全书全书21谢谢观赏2019-8-21(3 3)年鉴)年鉴是是按年度按年度连续出版的工具书,是对一年内的连续出版的工具书,是对一年内的重重大事件大事件、最新成果和、最新成果和统计数据统计数据等汇集。等汇集。年鉴的内容和数据主要取材于年鉴的内容和数据主要取材于政府公报政府公报、相关相关文件文件、部门统计部门统计、重要报刊的报道重要报刊的报道以及以及专业专业撰述撰述等,具有专业性、权威性、资料性、时等,具有专业性、权威性、资料性、时效性和新颖性。效性和新颖性。年
22、鉴可分为年鉴可分为综合性综合性和和专业性专业性两大类,前两大类,前者如者如中国百科年鉴中国百科年鉴,后者如,后者如中国经济中国经济年鉴年鉴、中国法律年鉴中国法律年鉴等。等。22谢谢观赏2019-8-21(4 4)手册)手册它汇集某一主题或学科领域的各种它汇集某一主题或学科领域的各种基础知识基础知识和基本数据资料和基本数据资料,通常针对当前实践所需,通常针对当前实践所需,供随时翻检查阅供随时翻检查阅之用,是一种之用,是一种便捷的查检便捷的查检参考工具书参考工具书。故又称。故又称“便览便览”,也常冠以,也常冠以“概览概览”、“大全大全”、“要览要览”、“指指南南”、“必备必备”等名称。等名称。(5
23、 5)名录)名录是一种系统编排的是一种系统编排的个人或机构名单个人或机构名单,用以指,用以指示示地址及相关资料地址及相关资料,是人们进行经济、文,是人们进行经济、文化、学术交流的参考工具书。有机构名录化、学术交流的参考工具书。有机构名录和人名录。和人名录。23谢谢观赏2019-8-21(6 6)类书)类书根据一定的意图,根据一定的意图,把群书中可供参考的文献资料把群书中可供参考的文献资料辑录出来辑录出来,分类编排(也有分韵编排)的工具,分类编排(也有分韵编排)的工具书,书,类似于百科全书式的资料汇编类似于百科全书式的资料汇编。类书主要。类书主要用于查找用于查找辞藻典故辞藻典故和和诗词文句诗词文
24、句出处,查考出处,查考史实史实和事物掌故和事物掌故,亦可用于辑佚和校勘古籍。,亦可用于辑佚和校勘古籍。百科全书百科全书是以条目形式,对各种知识作概述性是以条目形式,对各种知识作概述性的介绍,着重反映科学文化的最新成就;的介绍,着重反映科学文化的最新成就;类书类书是文献资料的分类辑存,以继承传统文化为主是文献资料的分类辑存,以继承传统文化为主要目的。要目的。三国曹丕三国曹丕皇览皇览、虞世南、虞世南北堂书钞北堂书钞、解缙、解缙永乐大典永乐大典(2287722877卷)、陈梦雷卷)、陈梦雷古今图古今图书集成书集成(1 1万卷)万卷)24谢谢观赏2019-8-21(7 7)政书)政书辑集历代或某一朝代
25、有关辑集历代或某一朝代有关典章制度典章制度方面的文献方面的文献资料,分类编排与叙述。资料,分类编排与叙述。唐杜佑唐杜佑通典通典、宋马端临、宋马端临文献通文献通考考、南宋郑樵、南宋郑樵通志通志,清,清续通典续通典、续通志续通志、续文献通考续文献通考,清朝通清朝通典典、清朝通志清朝通志、清朝文献通考清朝文献通考,刘锦藻刘锦藻清朝续文献通考清朝续文献通考,以上十部大书,以上十部大书,著名的著名的“”“”十通。十通。还有一类断代型政书,还有一类断代型政书,记某一朝代或某一时期记某一朝代或某一时期典章制度,称典章制度,称“会要会要”,如,如西汉会要西汉会要等等。25谢谢观赏2019-8-21(8 8)表
26、谱)表谱用用编年、表格编年、表格等形式来等形式来揭示时间概念或谱列历揭示时间概念或谱列历史事实史事实的工具书。特点是眉目清晰,简要易的工具书。特点是眉目清晰,简要易查。查。纪年表纪年表:不同的纪年系列进行对照。如:不同的纪年系列进行对照。如中国中国历史纪年表历史纪年表历表历表:将:将不同历法不同历法的年月日进行对照。的年月日进行对照。大事年表大事年表:按:按年月编录大事年月编录大事,又称,又称大事记。大事记。专门性表谱专门性表谱:为某学科、某专题、某人物编撰:为某学科、某专题、某人物编撰的表谱。如的表谱。如查官制查官制历代职官表历代职官表,查地理查地理沿革沿革历代地理沿革表历代地理沿革表,查人
27、物查人物历代人历代人物年里碑传综表物年里碑传综表,个人年谱个人年谱、年表等。、年表等。26谢谢观赏2019-8-21(9 9)图录)图录以以图像图像为主体,为主体,辅以文字说明辅以文字说明的工具书,又的工具书,又称图谱。称图谱。地图:地图:中国历史地图集中国历史地图集历史地图:历史地图:中国古代史参考图录中国古代史参考图录文物图录:文物图录:中国历代货币中国历代货币、中国古代中国古代服饰研究服饰研究、中国版刻图录中国版刻图录人物图录:人物图录:明清人物肖像画选明清人物肖像画选、中国中国历代名人图鉴历代名人图鉴、中国历代人物图像集中国历代人物图像集以及科技图录、艺术图录等以及科技图录、艺术图录等
28、27谢谢观赏2019-8-216.6.全文数据库全文数据库全文数据库是以全文数据库是以原始文献为著录单元原始文献为著录单元,文献中每文献中每个有意义的实词均可用作检索词个有意义的实词均可用作检索词,信息用户可得,信息用户可得到到文献的全文或其中的某些部分文献的全文或其中的某些部分。全文数据为是。全文数据为是近年来发展最快的检索工具,极受信息用户欢迎。近年来发展最快的检索工具,极受信息用户欢迎。7.7.搜索引擎搜索引擎以以网页为著录单元网页为著录单元,在,在WebWeb中自动搜索信息(搜索中自动搜索信息(搜索网页上的网页上的单词单词和简短的和简短的特定的描述内容特定的描述内容)并将其)并将其自动
29、索引的自动索引的WebWeb服务器。为了搜集这些信息,网服务器。为了搜集这些信息,网页页搜索软件沿着搜索软件沿着WebWeb的超链的超链,搜索整个,搜索整个WebWeb上的主上的主页,页,将主页上的每个文字建立索引将主页上的每个文字建立索引并返回集中管并返回集中管理的理的索引数据库索引数据库,索引信息包括文档的,索引信息包括文档的WebWeb地址地址、每个每个文档中单字出现的频率文档中单字出现的频率、位置位置等。等。28谢谢观赏2019-8-21四、信息检索工具结构四、信息检索工具结构(一)手工检索工具结构(一)手工检索工具结构一般由一般由使用说明、目次表、正文、辅助索引、使用说明、目次表、正
30、文、辅助索引、附录附录组成。(首次使用新检索工具,阅使用组成。(首次使用新检索工具,阅使用说明,并据所查的学科,利用目次表从分类说明,并据所查的学科,利用目次表从分类途径查或利用索引中主题、著者等查)途径查或利用索引中主题、著者等查)1.1.使用说明使用说明:有称:有称凡例凡例、包括编制、包括编制目的目的、收录、收录范围范围、著录格式著录格式、代号说明代号说明、使用举例使用举例及及注注意事项意事项等,是用户使用前必读内容。等,是用户使用前必读内容。2.2.目次表目次表:检索工具的:检索工具的正文一般按分类组织编正文一般按分类组织编排排,前面大多有详简不同的目次表,作为,前面大多有详简不同的目次
31、表,作为从从分类查找文献的依据分类查找文献的依据。29谢谢观赏2019-8-213.3.正文正文:检索工具记录的:检索工具记录的不是文献的全文不是文献的全文,仅,仅著著录文献的外部特征和内容特征录文献的外部特征和内容特征,包括文献篇名、,包括文献篇名、著者、出处或文摘等。著者、出处或文摘等。4.4.辅助索引辅助索引:检索工具正文只提供单一线性检索:检索工具正文只提供单一线性检索方式,为了快、准、全地查找所需信息,检索方式,为了快、准、全地查找所需信息,检索工具都编有索引,工具都编有索引,提供从主题、著者、序号等提供从主题、著者、序号等多种途径检索所需信息。多种途径检索所需信息。(掌握检索工具的
32、实(掌握检索工具的实质就是熟悉各种辅助索引的使用方法)质就是熟悉各种辅助索引的使用方法)5.5.附录附录:主要是使用该检索工具时必须:主要是使用该检索工具时必须参考的一参考的一些内容些内容,如,如引用期刊一览表引用期刊一览表、文献来源名称缩文献来源名称缩写写与与全称的对照表、缩略语的解释以及全称的对照表、缩略语的解释以及收藏单收藏单位代码位代码等。等。30谢谢观赏2019-8-21(二)计算机检索工具结构(二)计算机检索工具结构一般由一般由检索软件检索软件和和数据库数据库组成。组成。检索软件检索软件确定了该检索工具的确定了该检索工具的检索方式检索方式,规定,规定了检索系统的了检索系统的检索算符
33、检索算符,不同的计算机检索,不同的计算机检索工具采用不同的检索软件。工具采用不同的检索软件。数据库主要由字段、记录、文档、帮助文件等数据库主要由字段、记录、文档、帮助文件等组成。组成。1.1.字段字段:是:是数据库最基本的著录单元数据库最基本的著录单元。如题名、。如题名、著者、文摘、主题词、关键词字段等。著者、文摘、主题词、关键词字段等。每一每一个字段均有其个字段均有其标志符标志符,其,其内容是字段值内容是字段值或属或属性值。性值。31谢谢观赏2019-8-212.2.记录记录:多个字段组成记录多个字段组成记录。不同数据库中其。不同数据库中其记录的字段数多少不同。记录的字段数多少不同。记录是按
34、一定标准格记录是按一定标准格式化的,以便于计算机识别和存储式化的,以便于计算机识别和存储。3.3.文档文档:经过:经过有序化外理并附有检索标志的信有序化外理并附有检索标志的信息集合称为文档息集合称为文档,包括顺排文档和倒排文档。,包括顺排文档和倒排文档。顺排文档顺排文档:又称:又称线性文档线性文档,由,由每件信息的全记每件信息的全记录按一定顺序组成录按一定顺序组成,是数据为的,是数据为的主文档主文档,相当,相当于手工检索工具的正文部分。于手工检索工具的正文部分。倒排文档倒排文档:又称:又称索引文档索引文档,将将记录中可检索字记录中可检索字段及其属性值段及其属性值提取出来提取出来,按一定的顺序组
35、织起,按一定的顺序组织起来,成为用作索引的文档。来,成为用作索引的文档。4.4.帮助文件帮助文件:使用户了解数据库的使用方法。:使用户了解数据库的使用方法。32谢谢观赏2019-8-21五、信息检索语言五、信息检索语言(一)检索语言概念(一)检索语言概念信息检索语言是信息检索语言是信息资源信息资源存储存储和和检索检索的共的共同语言同语言。 其实质是其实质是从自然语言中精选出来并从自然语言中精选出来并加以规范化的一套词汇符号加以规范化的一套词汇符号,是概括信息资源,是概括信息资源内容特征或外在特征及相互关系的内容特征或外在特征及相互关系的概念标识体概念标识体系系。它是用于描述信息系统中信息的内容
36、特征它是用于描述信息系统中信息的内容特征及外部特征和表达用户信息提问的一种专门语及外部特征和表达用户信息提问的一种专门语言。它要求言。它要求文献的标引者和检索者共同遵守文献的标引者和检索者共同遵守。在信息在信息存储存储时,检索语言用来描述信息的内容时,检索语言用来描述信息的内容和外部特征,从而形成和外部特征,从而形成检索标识检索标识;在检索过程;在检索过程中,检索语言用来描述检索提问,然后形成提中,检索语言用来描述检索提问,然后形成提问标识问标识。33谢谢观赏2019-8-21(二)信息检索语言种类(二)信息检索语言种类1 1、按规范化(受控)程度划分按规范化(受控)程度划分人工语言人工语言
37、人为对标引词和检索词人为对标引词和检索词加以控制和规范,使每个加以控制和规范,使每个检索词只能表达检索词只能表达一个概念一个概念 自然语言自然语言直接从原始信息中抽取出直接从原始信息中抽取出自自由词由词作为检索点的检索语言作为检索点的检索语言 34谢谢观赏2019-8-212.按检索时组配方式按检索时组配方式先组式语言先组式语言 指在检索前检索词已按固定关系组配好,并编制在词表中 后组式语言后组式语言 是指在检索前,检索词在词表中没有被预先组配,检索时用户可根据不同的检索需求对某些词进行任意组配35谢谢观赏2019-8-213.3.按描述信息外部特征的检索语言划分按描述信息外部特征的检索语言划
38、分是指文献信息的是指文献信息的题名题名(书名、刊名、篇(书名、刊名、篇名)、名)、著者姓名著者姓名/ /单位名称单位名称、出版者、代码、出版者、代码/ /序序号(专利号、标准号、报告号)等,将不同的号(专利号、标准号、报告号)等,将不同的文献信息按照题名、著者等字顺进行排列或按文献信息按照题名、著者等字顺进行排列或按报告号、专利号等顺序进行排列,就形成了以报告号、专利号等顺序进行排列,就形成了以文献题名、著者、号码等检索途径来满足用户文献题名、著者、号码等检索途径来满足用户的需求的,用来描述文献特征和表达信息提问的需求的,用来描述文献特征和表达信息提问内容的人工语言。内容的人工语言。(1 1)
39、题名语言)题名语言(2 2)责任者语言)责任者语言(3 3)文献信息编号语言)文献信息编号语言36谢谢观赏2019-8-21检索语言的类型检索语言的类型表述文献外表表述文献外表特征的语言特征的语言表述文献内容表述文献内容特征的语言特征的语言题名题名(书名、刊名、篇名)(书名、刊名、篇名)责任者(个人、机构名称)责任者(个人、机构名称)号码(号码(如专利号、标准号、报告号、如专利号、标准号、报告号、ISBNISBN号、号、ISSNISSN号等号等)引文引文分类法分类法主题法主题法体系分类法体系分类法组配分类法组配分类法标题词语言标题词语言单元词语言单元词语言叙词语言叙词语言关键词语言关键词语言3
40、7谢谢观赏2019-8-21(1 1)分类语言)分类语言它是一种体现它是一种体现知识分类等级概念知识分类等级概念的的标识标识系统系统,具有按,具有按学科或专业学科或专业集中地、系统地揭集中地、系统地揭示信息或文献内容的功能。它是以示信息或文献内容的功能。它是以数字、字数字、字母或字母与数字母或字母与数字相结合作为基本字符,采用相结合作为基本字符,采用字符直接连接并以字符直接连接并以圆点圆点作为分隔符号的书写作为分隔符号的书写法,以基本类目作为基本词汇,以类目的法,以基本类目作为基本词汇,以类目的从从属关系属关系来表达复杂概念的一种检索语言。来表达复杂概念的一种检索语言。以以知识属性知识属性来描
41、述和表达信息内容的信息处理来描述和表达信息内容的信息处理方法称为分类法方法称为分类法,著名的分类法有,著名的分类法有国际十国际十进分类法进分类法、杜威分类法杜威分类法、中国图书中国图书馆分类法馆分类法等。等。38谢谢观赏2019-8-21体系分类法(体系分类语言) 直接体现直接体现知识分类的等级制概念的检索系知识分类的等级制概念的检索系统统,是按文献内容特征进行分类的检索语言。,是按文献内容特征进行分类的检索语言。科学分类科学分类基基 础础 对对 象象文献内容的学科性质文献内容的学科性质按照知识门类的逻辑次序按照知识门类的逻辑次序知识知识类类1类类2类类3类类21类类22类类23上位类上位类(
42、母类)(母类)同位类同位类下位类下位类(子类)(子类)指具有许多共同属性的集合。39谢谢观赏2019-8-21分类语言的优缺点:分类语言的优缺点:优点:便于优点:便于查全查全某一学科专业的所有信息或文某一学科专业的所有信息或文献;分类语言有献;分类语言有等级结构等级结构,便于扩大或缩小,便于扩大或缩小检索范围;用分类检索,检索范围;用分类检索,不受文种限制不受文种限制;分;分类语言既可用于类语言既可用于组织检索工具和检索系统组织检索工具和检索系统,又可用来组织书刊资料的又可用来组织书刊资料的分类排架分类排架。缺点:将缺点:将检索的内容转换成分类号检索的内容转换成分类号,要熟悉分,要熟悉分类法,
43、否则可能发生误差;类法,否则可能发生误差;分类语言修订的分类语言修订的周期性周期性,与科技发展不同步;,与科技发展不同步;分类语言单维分类语言单维式直线序列结构式直线序列结构,难于处理交叉、相互渗透,难于处理交叉、相互渗透的多维空间的课题检索等。的多维空间的课题检索等。40谢谢观赏2019-8-21中国图书馆分类中国图书馆分类法法使用简介使用简介中国图书馆分类法中国图书馆分类法简称简称中图法中图法是我是我国文献分类标引工作国文献分类标引工作的国家标准。被我国的国家标准。被我国图书信息行业广泛应图书信息行业广泛应用。用。41谢谢观赏2019-8-21一一中图法中图法历史历史l19571957年年
44、中小型图书馆分类表草案中小型图书馆分类表草案 l19641964年年中国图书馆图书分类法草案中国图书馆图书分类法草案(下册)(下册) l19751975年年中国图书馆图书分类法中国图书馆图书分类法第第1 1版版l19801980年年中国图书馆图书分类法中国图书馆图书分类法第第2 2版版l19901990年年中国图书馆图书分类法中国图书馆图书分类法第第3 3版版l19991999年年中国图书馆图书分类法中国图书馆图书分类法第第4 4版起版起改名为改名为中国图书馆分类法中国图书馆分类法l20102010年年 中国图书馆分类法中国图书馆分类法第第5 5版版 42谢谢观赏2019-8-21二二中图法中
45、图法基本序列及基本大类基本序列及基本大类五大部类序列:五大部类序列:马克思主义、列宁主义、毛泽东思想、邓小平马克思主义、列宁主义、毛泽东思想、邓小平理论理论 (指导我们的思想的理论基础)(指导我们的思想的理论基础)l哲学、宗教哲学、宗教(自然知识、社会知识的概括和总结)(自然知识、社会知识的概括和总结) l社会科学社会科学 l自然科学自然科学 l综合性图书(综合性图书(内容庞杂、类无专属,无法按某一学科内内容庞杂、类无专属,无法按某一学科内容性质分类的图书容性质分类的图书) 五大部类序列:五大部类序列:(又称大部。这是编制分类法时,对图书首先作的最概括的区分又称大部。这是编制分类法时,对图书首
46、先作的最概括的区分)43谢谢观赏2019-8-21中图法中图法22个基本大类个基本大类A 马列、毛泽东思想N 自然科学总论B 哲学、宗教O 数理科学和化学C 社会科学总论P 天文学、地球科学D 政治、法律 Q 生物科学E 军事R 医药、卫生F 经济S 农业科学G 文化、科学、教育T 工业技术H 语言、文字U 交通运输I 文学V 航空、航天J 艺术X 环境科学、安全科学K 历史、地理Z 综合性图书44谢谢观赏2019-8-21l C C 社会科学总论社会科学总论 C8 C8 统计学统计学 C91 C91 社会学社会学 C92 C92 人口学人口学 C93 C93 管理学管理学 C931 C931
47、 管理技术方法管理技术方法 .1 .1 管理数学管理数学 .2 .2 管理的方式方法管理的方式方法 C933 C933 领导学领导学 C934 C934 决策学决策学 C935 C935 管理计划和控制管理计划和控制 C936 C936 管理组织学管理组织学 C939 C939 应用管理学应用管理学45谢谢观赏2019-8-21将将T类展开类展开46谢谢观赏2019-8-21三三. . 类目之间的关系类目之间的关系 示例 O1 数学 O11 古典数学 从属关系 O12 初等数学 O121 算 术 从属关系 O122 初等代数 O123 初等几何 并列关系 O13 高等数学上位类与下位类之间的关
48、系.一个类与其直接细分出来的小类之间的关系,称从属关系. 在类目表中,下位类一定要带有上位类的属性,上位类一定能包括它所属的各级下位类,他们之间是属种的总体和部分的关系.指处在同一划分层次上的不同类目的关系指处在同一划分层次上的不同类目的关系,一一个上位类分出若干个小类,这些小类之间的个上位类分出若干个小类,这些小类之间的关系关系,是用并列的方式来表达的是用并列的方式来表达的,称为并列关系称为并列关系.47谢谢观赏2019-8-21四四. .中图法标记系统中图法标记系统基本遵循基本遵循层累制层累制, ,又称又称等级标记制等级标记制,是类号位数,是类号位数与类目等相适应、层次分明的与类目等相适应
49、、层次分明的一种标记制度一种标记制度。用一位或两位符号标记一个大类,再加一位符用一位或两位符号标记一个大类,再加一位符号标记二级类目,号标记二级类目,如此如此层层累加,表示层层累加,表示类目的类目的层层划分层层划分。中图法中图法采用采用 大写拉丁字母与阿拉伯数字相大写拉丁字母与阿拉伯数字相结合的混合制号码结合的混合制号码。用字母标志一个大类,以。用字母标志一个大类,以字母的顺序反映大类的序列。在字母后用数字字母的顺序反映大类的序列。在字母后用数字表示大类下类目的划分。表示大类下类目的划分。数字的数字的编号制度编号制度,使用小数制,使用小数制,即首先顺,即首先顺序字母后的第一位数字,然后顺序第二
50、位,以序字母后的第一位数字,然后顺序第二位,以此类推。此类推。分类号的排列,严格按照小数制的排分类号的排列,严格按照小数制的排列方法列方法。 48谢谢观赏2019-8-21 辅助标记符号辅助标记符号(1)间隔符号间隔符号“.” 在字母段之后在字母段之后, ,自左向右每三位数字自左向右每三位数字加一圆点加一圆点, ,当最后一段正好为三位的时候当最后一段正好为三位的时候, ,就不在加圆就不在加圆 F830.31 F299.F299.712712(2) 总论复分符号(总论复分符号(排在数字“0”的前面,是总论复分号的前置标识符)(3) : 组配符号(主类号之间的概念交叉关系组配符号(主类号之间的概念