1、第二章 信息组织原理1、对信息组织的要求、对信息组织的要求2、信息组织中的控制与规范、信息组织中的控制与规范本章提示本章提示3、规范控制的依据、规范控制的依据一、对信息组织的要求1、检全率(查全率)、检全率(查全率)系统实施检索时检出的与某一检索提问相系统实施检索时检出的与某一检索提问相关的信息资源数与检索系统中与该提问相关的关的信息资源数与检索系统中与该提问相关的实有信息资源总数之比。实有信息资源总数之比。检出相关信息资源量检出相关信息资源量检全率检全率=100%系统相关信息资源总量系统相关信息资源总量表示系统检出相关信息资源的能力。表示系统检出相关信息资源的能力。一、对信息组织的要求2、检
2、准率(查准率)、检准率(查准率)系统实施检索时检出的与某一检索提问相系统实施检索时检出的与某一检索提问相关的信息资源数与检出的信息资源总数之比。关的信息资源数与检出的信息资源总数之比。检出相关信息资源量检出相关信息资源量检准率检准率=检出信息资源总量检出信息资源总量100%表示检索系统排除与检索提问无关信息表示检索系统排除与检索提问无关信息资源的能力。资源的能力。一、对信息组织的要求检全率与检准率的关系检全率与检准率的关系?检全率与检准率之间呈互逆检全率与检准率之间呈互逆关系关系?检索系统对检全率与检准率检索系统对检全率与检准率的权衡,应考虑检索系统的任的权衡,应考虑检索系统的任务、服务对象的
3、需求、信息资务、服务对象的需求、信息资源集合的规模等多种因素,并源集合的规模等多种因素,并根据使用需要提供选择的可能根据使用需要提供选择的可能性。性。检检全全率率%检准率检准率%一、对信息组织的要求3、检索速度和系统的及时性、检索速度和系统的及时性检索速度指用户实施检索时获得检索结果检索速度指用户实施检索时获得检索结果花费的时间。这一指标不仅与系统响应检索提花费的时间。这一指标不仅与系统响应检索提问的速度有关,同时也涉及查全、查准等因素,问的速度有关,同时也涉及查全、查准等因素,与信息资源的组织是否合理直接相关。与信息资源的组织是否合理直接相关。系统的及时性指检索工具能否在较短时系统的及时性指
4、检索工具能否在较短时间内将信息资源纳入系统,尽快提供使用。间内将信息资源纳入系统,尽快提供使用。一、对信息组织的要求4、系统的易用性、系统的易用性对标引者而言,指系统是否便于进行描述对标引者而言,指系统是否便于进行描述和标引操作,是否需要掌握复杂的专门技能才和标引操作,是否需要掌握复杂的专门技能才能使用,在处理过程中为减少处理差错能否得能使用,在处理过程中为减少处理差错能否得到各种提示和帮助等。到各种提示和帮助等。对广大检索用户而言,则是指系统检索是对广大检索用户而言,则是指系统检索是否易于使用,操作是否复杂,是否需要预先学否易于使用,操作是否复杂,是否需要预先学习才能实施检索习才能实施检索;
5、检索界面是否友好,是否配备检索界面是否友好,是否配备有相应说明,并提供各种具有启发性的帮助等。有相应说明,并提供各种具有启发性的帮助等。一、对信息组织的要求5、检索的成本效益、检索的成本效益指检索系统的成本和效益之比。指检索系统的成本和效益之比。成本一般指检索系统设备费用、标引处理成本一般指检索系统设备费用、标引处理费用、检索运行费用。费用、检索运行费用。效益则是指检索系统的性能及因此产生的效益则是指检索系统的性能及因此产生的效益,包括获取信息能取得的经济效益和社会效益,包括获取信息能取得的经济效益和社会效益。效益。二、信息组织中的控制与规范信信息息组组织织的的控控制制?对信息资源的描述控制对
6、信息资源的描述控制?标引和检索的词汇控制标引和检索的词汇控制?标引和检索的句法控制标引和检索的句法控制二、信息组织中的控制与规范?描述控制描述控制描述记录一般概要记录资源各种基本特征描述记录一般概要记录资源各种基本特征的数据,可以以浓缩的方式集中反映资源的特的数据,可以以浓缩的方式集中反映资源的特征和内容。征和内容。(1)描述项目的控制)描述项目的控制根据资源特点选择具有组织和揭示价值的资源特征根据资源特点选择具有组织和揭示价值的资源特征作为描述的项目。描述项目应该充分反映信息资源的基作为描述的项目。描述项目应该充分反映信息资源的基本特征和数据。本特征和数据。二、信息组织中的控制与规范(2)描
7、述文字的控制)描述文字的控制规定描述信息资源时所采用的文字,应当准确、精规定描述信息资源时所采用的文字,应当准确、精炼、统一、规范。炼、统一、规范。二、信息组织中的控制与规范(3)描述级别的控制)描述级别的控制规定对信息资源进行描述的详略程度。应根据不同规定对信息资源进行描述的详略程度。应根据不同的使用对象和需求,信息资源的特点、设备条件加以确的使用对象和需求,信息资源的特点、设备条件加以确定。定。二、信息组织中的控制与规范(4)描述格式的控制)描述格式的控制包括各种描述项目的次序、描述的标识、描述项目包括各种描述项目的次序、描述的标识、描述项目的表达形式等。对此做统一规定的目的是方便不同类型
8、的表达形式等。对此做统一规定的目的是方便不同类型信息系统之间的交流。信息系统之间的交流。二、信息组织中的控制与规范?描述控制描述控制根据上述各项控制要求做具体的规定,就根据上述各项控制要求做具体的规定,就形成了各种信息描述规范。形成了各种信息描述规范。分类法和主题法也可以说是从主题角度提分类法和主题法也可以说是从主题角度提出的信息描述规范。出的信息描述规范。二、信息组织中的控制与规范?词汇控制词汇控制词汇控制是根据信息资源标引和检索的需词汇控制是根据信息资源标引和检索的需要,对自然语言中的词汇进行选择、规范并揭要,对自然语言中的词汇进行选择、规范并揭示其相关性的过程。示其相关性的过程。二、信息
9、组织中的控制与规范?词汇控制词汇控制为什么要进行词汇控制?为什么要进行词汇控制?因为对信息的描述离不开自然语言。但是自然因为对信息的描述离不开自然语言。但是自然语言做为日常交流的语言,存在很多问题:语言做为日常交流的语言,存在很多问题:?表达不够精确一致,语词与概念不是一一对应表达不够精确一致,语词与概念不是一一对应一词多义:一词多义:e.g.疲劳一词,在医学和物理学领域各自疲劳一词,在医学和物理学领域各自有不同的含义有不同的含义一义多词:一义多词:e.g.土豆土豆&马铃薯;电脑马铃薯;电脑&计算机计算机词义含糊:词义含糊:e.g.笔记本(本子?便携式电脑?)笔记本(本子?便携式电脑?)二、信
10、息组织中的控制与规范?词汇控制词汇控制为什么要进行词汇控制?为什么要进行词汇控制??自然语言词汇没有明确地表达词间关系,很难自然语言词汇没有明确地表达词间关系,很难适合检索系统显示概念间联系的要求。适合检索系统显示概念间联系的要求。e.g.浮游生物与水生生物是包含与被包含的浮游生物与水生生物是包含与被包含的关系;浮游生物与水底生物是并列关系等。关系;浮游生物与水底生物是并列关系等。e.g.“湖广熟,天下足湖广熟,天下足”二、信息组织中的控制与规范?词汇控制词汇控制为什么要进行词汇控制?为什么要进行词汇控制??词汇量过大,给词汇的加工、管理增加困难,在词汇量过大,给词汇的加工、管理增加困难,在描
11、述信息的选词和检索时确定检索用词时都造成困描述信息的选词和检索时确定检索用词时都造成困难。难。鉴于上述原因,一般必须根据检索系统的需要,对词汇鉴于上述原因,一般必须根据检索系统的需要,对词汇进行必要的选择和处理。进行必要的选择和处理。二、信息组织中的控制与规范?词汇控制词汇控制词汇控制包括下述内容:词汇控制包括下述内容:?同义控制同义控制?词义控制词义控制?词间关系控制词间关系控制二、信息组织中的控制与规范?词汇控制词汇控制词汇控制包括下述内容:词汇控制包括下述内容:?同义控制同义控制目的:克服一义多词现象,将同一内容、特目的:克服一义多词现象,将同一内容、特征的资源集中在相同的标识下。征的资
12、源集中在相同的标识下。方法:选定一个规范词,建立用代参照方法:选定一个规范词,建立用代参照举例:电脑举例:电脑 Y 计算机计算机计算机计算机D 电脑电脑二、信息组织中的控制与规范?词汇控制词汇控制词汇控制包括下述内容:词汇控制包括下述内容:?词义控制词义控制目的:克服一词多义现象目的:克服一词多义现象方法:加限义词、增设含义注释和范围注释方法:加限义词、增设含义注释和范围注释举例:疲劳(生理);疲劳(物理)举例:疲劳(生理);疲劳(物理)举例:举例:“下次你跟着出租车跑回来,还可以下次你跟着出租车跑回来,还可以省掉十块钱省掉十块钱”二、信息组织中的控制与规范?词汇控制词汇控制词汇控制包括下述内
13、容:词汇控制包括下述内容:?词间关系控制词间关系控制目的:用于扩检、缩检、改变检索方向目的:用于扩检、缩检、改变检索方向方法:设置参照、倒置标题、使用副标题、方法:设置参照、倒置标题、使用副标题、通过类目体系揭示词间关系通过类目体系揭示词间关系举例:害虫举例:害虫 S 杀虫剂杀虫剂无损检验无损检验 S 无损探伤仪无损探伤仪血管血管F 动脉动脉二、信息组织中的控制与规范?句法控制句法控制句法控制是指根据信息资源标引和检索的句法控制是指根据信息资源标引和检索的需要,所作出的组词造句的规则,是对检索语需要,所作出的组词造句的规则,是对检索语词的组合方式的规定。词的组合方式的规定。二、信息组织中的控制
14、与规范?句法控制句法控制为什么要进行句法控制?为什么要进行句法控制?因为仅有规范的语词是不够的,语词只能表达简单因为仅有规范的语词是不够的,语词只能表达简单的概念。语词的组合才能表达复杂的概念。特别是信息的概念。语词的组合才能表达复杂的概念。特别是信息组织的一种重要方法组织的一种重要方法主题法,就是通过对相应语词主题法,就是通过对相应语词的组配来实现对复杂概念的表达的。但是汉语非常灵活,的组配来实现对复杂概念的表达的。但是汉语非常灵活,语词之间的组合方式多种多样,如下例。语词之间的组合方式多种多样,如下例。?计算机控制遥感系统对大地测量计算机控制遥感系统对大地测量?遥感系统在计算机控制下对大地
15、测量遥感系统在计算机控制下对大地测量?大地测量在计算机控制下通过遥感系统进行大地测量在计算机控制下通过遥感系统进行?遥感系统对大地测量在计算机控制下进行遥感系统对大地测量在计算机控制下进行为了以明确、统一的方式对信息资源进行组织,需为了以明确、统一的方式对信息资源进行组织,需要对语词之间的组合方式,即句法进行控制。要对语词之间的组合方式,即句法进行控制。二、信息组织中的控制与规范?句法控制句法控制句法控制的内容:句法控制的内容:?引用次序引用次序?辅助符号辅助符号?句式转换句式转换二、信息组织中的控制与规范?句法控制句法控制?引用次序引用次序亦称组配次序,指复合主题标引和检索时,各个亦称组配次
16、序,指复合主题标引和检索时,各个主题因素的组合次序。主题因素的组合次序。分类法分类法指类目划分标准使用次序或不同分面指类目划分标准使用次序或不同分面r 的概念在组织时被引用的先后次序。的概念在组织时被引用的先后次序。主题法主题法指字顺标题检索系统中主标题与各级指字顺标题检索系统中主标题与各级子标题使用的次序。在先组式手工检索工具中,子标题使用的次序。在先组式手工检索工具中,引用次序决定复合主题的类聚方式和排检位置,引用次序决定复合主题的类聚方式和排检位置,是进行句法控制的重要手段。是进行句法控制的重要手段。二、信息组织中的控制与规范?句法控制句法控制?辅助符号辅助符号亦称组配符号,是检索语言揭
17、示主题概念之间关亦称组配符号,是检索语言揭示主题概念之间关系、意义,进行检索操作的标识手段。辅助符号系、意义,进行检索操作的标识手段。辅助符号是检索系统进行句法控制的重要句法手段,它根是检索系统进行句法控制的重要句法手段,它根据系统的特点和使用需要设置,可分别用于先组据系统的特点和使用需要设置,可分别用于先组式检索系统和后组式检索系统。式检索系统和后组式检索系统。二、信息组织中的控制与规范?句法控制句法控制?辅助符号辅助符号?关系符号关系符号用于揭示语词组配中形成的关系用于揭示语词组配中形成的关系类型的符号,常用于先组式检索一同。类型的符号,常用于先组式检索一同。?联系符号联系符号用于揭示同一
18、文献主题之间联系用于揭示同一文献主题之间联系强度的专用符号,目的是防止主题词之间出现强度的专用符号,目的是防止主题词之间出现错误的组配关系。错误的组配关系。?职能符号职能符号用以标识主题标识在组配中的句用以标识主题标识在组配中的句法只能的辅助符号,作用是明确主题标识的句法只能的辅助符号,作用是明确主题标识的句法含义,以便正确进行组配,提高查准率。法含义,以便正确进行组配,提高查准率。?逻辑组配符号逻辑组配符号使用逻辑符号对组配关系实使用逻辑符号对组配关系实施控制。施控制。二、信息组织中的控制与规范?句法控制句法控制?句式转换句式转换简单地说,就是转换语词的排列顺序。简单地说,就是转换语词的排列
19、顺序。为什么需要句式转换?为什么需要句式转换?因为复杂的主题要提高其被查全率和查因为复杂的主题要提高其被查全率和查准率需要提供多个检索入口;引用次序准率需要提供多个检索入口;引用次序的选择有可能导致文献的分散。这些问的选择有可能导致文献的分散。这些问题的解决可以通过句式转换来实现。题的解决可以通过句式转换来实现。二、信息组织中的控制与规范?句法控制句法控制?句式转换句式转换句式转换的目的是通过对语句中语词位置的变动句式转换的目的是通过对语句中语词位置的变动解决上述两个问题。解决上述两个问题。句式转换的形式通常有三种:句式转换的形式通常有三种:(1)轮排转换)轮排转换(2)链式转换)链式转换(3
20、)分析转换)分析转换二、信息组织中的控制与规范?句法控制句法控制?句式转换句式转换链三、规范控制的依据体现于主题法的体现于分类法的类目确立及归类组配和分类法的类目确立及归类信息资源的组织和检索一般是以信息资源的组织和检索一般是以概念逻辑概念逻辑为工为工具,以具,以知识分类知识分类为基础,根据为基础,根据信息资源的特点和设信息资源的特点和设备条件的状况备条件的状况进行的。因此,要有效地对信息组织进行的。因此,要有效地对信息组织进行规范控制必须依据如下三方面因素:进行规范控制必须依据如下三方面因素:?逻辑知识逻辑知识?知识分类知识分类?信息资源组织的特点信息资源组织的特点三、规范控制的依据?逻辑知
21、识逻辑知识1、概念及其内涵和外延、概念及其内涵和外延概念概念是表达事物对象的特有属性或本质属性的思维是表达事物对象的特有属性或本质属性的思维形式,是检索系统交流的内容。按照形式逻辑,一形式,是检索系统交流的内容。按照形式逻辑,一个概念一般包括内涵和外延两个方面。个概念一般包括内涵和外延两个方面。概念的内涵概念的内涵指概念的含义,即概念所反映对象的指概念的含义,即概念所反映对象的本质属性的总和。本质属性的总和。概念的外延概念的外延则是指具有该属性的事物对象,即所则是指具有该属性的事物对象,即所包括的范围。包括的范围。三、规范控制的依据?逻辑知识逻辑知识1、概念及其内涵和外延、概念及其内涵和外延概
22、念及其内涵、外延的知识是各种信息组织概念及其内涵、外延的知识是各种信息组织形式进行标引和检索的基本依据,同时也是形式进行标引和检索的基本依据,同时也是检索语言编制时词汇控制的依据。检索语言检索语言编制时词汇控制的依据。检索语言中语词的选择一般应含义明确,对含义不明中语词的选择一般应含义明确,对含义不明确的语词,通常需要通过明确内涵或指明其确的语词,通常需要通过明确内涵或指明其外延的方法加以限定。外延的方法加以限定。三、规范控制的依据?逻辑知识逻辑知识2、概念之间的关系、概念之间的关系概念之间按照其是否存在共有的外延,可以分为相概念之间按照其是否存在共有的外延,可以分为相容关系与不相容关系两类容
23、关系与不相容关系两类并列关系矛盾关系三、规范控制的依据?逻辑知识逻辑知识2、概念之间的关系、概念之间的关系?相容关系:至少有一部分外延相同的概念之间的关系。相容关系:至少有一部分外延相同的概念之间的关系。?同一关系:具有相同外延的概念之间的关系。同一关系:具有相同外延的概念之间的关系。?包含关系:一个概念在另一个概念外延之中,并且包含关系:一个概念在另一个概念外延之中,并且是另一个概念的组成部分。是另一个概念的组成部分。?交叉关系:部分外延重合的概念之间的关系。交叉关系:部分外延重合的概念之间的关系。三、规范控制的依据?逻辑知识逻辑知识2、概念之间的关系、概念之间的关系?不相容关系:不存在共有
24、外延的概念之间的关系。不相容关系:不存在共有外延的概念之间的关系。?矛盾关系:外延之和等于上位概念的两个不相容概矛盾关系:外延之和等于上位概念的两个不相容概念之间的关系。念之间的关系。?反对关系:外延之和小于属概念的两个相互对立概反对关系:外延之和小于属概念的两个相互对立概念之间的关系。念之间的关系。?并列关系:一个属概念下几个不存在共有外延的并并列关系:一个属概念下几个不存在共有外延的并列属概念之间的关系。列属概念之间的关系。三、规范控制的依据?逻辑知识逻辑知识2、概念之间的关系、概念之间的关系检索语言对词汇进行规范化处理和词间控制时,一检索语言对词汇进行规范化处理和词间控制时,一般均以上述
25、概念关系为基础进行,包括对等同关系,般均以上述概念关系为基础进行,包括对等同关系,等级关系,相关关系的处理等。等级关系,相关关系的处理等。三、规范控制的依据?逻辑知识逻辑知识3、概念的限制与概括、分析与综合、概念的限制与概括、分析与综合概念的内涵与外延之间是一种反比关系。概念的内涵与外延之间是一种反比关系。概念的限制概念的限制:加深内涵、缩小外延的过程。:加深内涵、缩小外延的过程。概念的概括概念的概括:减少内涵、扩大外延的过程。:减少内涵、扩大外延的过程。概念的分析概念的分析:将复合主题概念分解成若干个子概念。:将复合主题概念分解成若干个子概念。概念的综合概念的综合:通过对子概念的组配,表达复
26、合主题:通过对子概念的组配,表达复合主题概念概念。三、规范控制的依据?逻辑知识逻辑知识3、概念的限制与概括、分析与综合、概念的限制与概括、分析与综合概念范围可以通过对概念的限制和概括来概念范围可以通过对概念的限制和概括来进行调整,这是进行调整,这是信息组织的原理信息组织的原理;而概念;而概念的分析与综合则是实现概念范围的调整的的分析与综合则是实现概念范围的调整的具体方法,即具体方法,即信息组织的方法信息组织的方法。三、规范控制的依据?逻辑知识逻辑知识3、概念的限制与概括、分析与综合、概念的限制与概括、分析与综合对概念的划分一般可以依据明确的划分属性,将一对概念的划分一般可以依据明确的划分属性,
27、将一个母项划分为若干子项,从一个属概念分出若干个个母项划分为若干子项,从一个属概念分出若干个子概念,如此连续进行,以此为基础就可以建立起子概念,如此连续进行,以此为基础就可以建立起等级性的概念体系。等级性的概念体系。根据概念的构成,将复合主题概念分解成若干个子根据概念的构成,将复合主题概念分解成若干个子概念,并通过对子概念的组配,表达复合主题概念,概念,并通过对子概念的组配,表达复合主题概念,进行概念逻辑运算。概念的划分、概念的分析与综进行概念逻辑运算。概念的划分、概念的分析与综合是信息资源组织检索中使用十分普遍的逻辑方法。合是信息资源组织检索中使用十分普遍的逻辑方法。分分类类法法原原理理主主
28、题题法法原原理理三、规范控制的依据?逻辑知识逻辑知识3、概念的限制与概括、分析与综合、概念的限制与概括、分析与综合三、规范控制的依据?知识分类知识分类1、什么是知识分类体系、什么是知识分类体系知识分类体系是建立在人类对外部世界的探知识分类体系是建立在人类对外部世界的探索和发现的基础之上的,是根据对知识之间索和发现的基础之上的,是根据对知识之间关系的了解建立起来的系统。是进行主题之关系的了解建立起来的系统。是进行主题之间关系处理的重要依据。间关系处理的重要依据。三、规范控制的依据?知识分类知识分类2、信息组织为什么需要依据知识分类、信息组织为什么需要依据知识分类因为单靠逻辑知识只能解决若干个概念
29、之间因为单靠逻辑知识只能解决若干个概念之间有限的关系,不能很好的体现上下级概念的有限的关系,不能很好的体现上下级概念的关系,不能建立一个严格的、体系化的等级关系,不能建立一个严格的、体系化的等级系统。而只有建立起这样一个系统才能对信系统。而只有建立起这样一个系统才能对信息资源有一个全面的、整体的把握。息资源有一个全面的、整体的把握。三、规范控制的依据?知识分类知识分类3、知识分类体系的内容、知识分类体系的内容科学分类依据特定原则,确定知识门类划科学分类依据特定原则,确定知识门类划分和组织的总体性框架,可以用作建立信分和组织的总体性框架,可以用作建立信息组织中整体知识关系的依据。息组织中整体知识
30、关系的依据。科学分类体系科学分类体系(!)!)学科分类体系学科分类体系事物分类体系事物分类体系行业分类体系行业分类体系三、规范控制的依据?知识分类知识分类4、知识分类对信息组织的意义、知识分类对信息组织的意义信息资源组织以知识分类为基础,可以较好信息资源组织以知识分类为基础,可以较好揭示各个领域知识之间的关系和规律性,及揭示各个领域知识之间的关系和规律性,及时反映知识领域的进展。时反映知识领域的进展。三、规范控制的依据?信息资源组织的特点信息资源组织的特点1、为什么信息组织中要依据信息资源组织的特点、为什么信息组织中要依据信息资源组织的特点因为虽然知识分类对信息组织有很大帮助,但由于知识因为虽
31、然知识分类对信息组织有很大帮助,但由于知识分类与信息资源组织的对象和功能不尽相同,信息组织分类与信息资源组织的对象和功能不尽相同,信息组织对知识分类成果也不能全盘照搬。一般来说,信息资源对知识分类成果也不能全盘照搬。一般来说,信息资源组织比各种专门分类体系涉及的成分更广,因素更多、组织比各种专门分类体系涉及的成分更广,因素更多、更复杂,必须考虑信息资源处理的各种需要,因此信息更复杂,必须考虑信息资源处理的各种需要,因此信息资源组织在汲取知识分类成果的同时,应根据系统的信资源组织在汲取知识分类成果的同时,应根据系统的信息资源特征和处理需求,将其有机地纳入系统。息资源特征和处理需求,将其有机地纳入系统。三、规范控制的依据?信息资源组织的特点信息资源组织的特点2、信息资源组织除应采用逻辑的方法,以知识分、信息资源组织除应采用逻辑的方法,以知识分类为基础外,同时还必须根据信息资源的特点和类为基础外,同时还必须根据信息资源的特点和检索进行控制,一般应考虑以下各个方面因素:检索进行控制,一般应考虑以下各个方面因素:?文献保证原则文献保证原则?用户保证原则用户保证原则?与设备条件相适应与设备条件相适应?重视规范控制技术方法的完善和使用重视规范控制技术方法的完善和使用