1、第四章信息组织主题法 第三节叙词表的结构与编制本节主要内容一、叙词表的宏观结构二、叙词表的微观结构三、叙词表结构的变化四、叙词表的编制与维护一、叙词表的宏观结构(以汉表为例)叙词表的一般宏观结构(一)字顺表 字顺表,一般是叙词表的主表,它是将叙词和非叙词完全按字顺排列,并有标注事项和显示词间关系的参照系统 字顺表的基本功能是为标引和检索人员提供直接从概念名称的字面形式出发,按字顺迅速查找所需叙词的途径;并且通过参照系统及有关标注项帮助查词者判定叙词的含义,找到更恰当的词或更多的词(二)专有叙词表 专有叙词的范围较广,如地区索引、人物索引、机构索引、产品索引等 单独设立专有叙词表的目的主要有两个
2、:一是压缩字顺表的篇幅,方便从字顺表查词;二是便于用户迅速查到所需的专有叙词,不必去词量较多的主表中查找(三)轮排索引 轮排索引又称轮排表,是利用字面成族原理揭示叙词之间的联系,将叙词按其词素的字顺轮流排列到检索入口,使含有相同词素的词集中在一起的索引 轮排索引可以发挥两个功能:一是提供查找词组叙词的多个字顺入口;二是集中含有相同词素的叙词。(四)双语种对照索引 双语种对照索引,是将全部或大多数叙词和非正式叙词与其外语译名相对应,按外语译名字顺排列的索引。我国的叙词表多编制英汉对照索引 双语种对照索引的功能:提供从对照语言的语词字顺入手查词的途径;帮助查找对照语种文献。(五)字顺索引 字顺索引
3、是将叙词(或包括非正式叙词)按字顺排列,而不包含叙词款目中的其他项目的一种索引 字顺索引的功能:提高主表查词速度。(六)入口词表 入口词表,是将非正式叙词按字顺排列,并指出其对应叙词的索引。入口词表的功能:提高查词速度;减少选词错误。(七)范畴索引 范畴索引,是按叙词表全部叙词和非正式叙词所属学科或范畴编制的词汇分类索引 范畴索引的功能:便于从学科或专业角度查找叙词;用于组织分类主题目录(索引)式的检索工具。(八)词族索引 词族索引,是将字顺表中具有等级关系的叙词按属分等级构成词族,并按各词族的族首词字顺排列的词汇索引 词族索引的功能:提供从族首词出发,查找所需叙词的途径;借助上位词、下位词和
4、同位词,明确词义;方便进行扩检和缩检。(九)叙词关系图 叙词关系图,是用图形显示叙词之间关系的一种工具 叙词关系图的功能:形象、直观揭示位于某一词族内叙词间的各种关系。(十)分类表 分类表。是指实现分类主题一体化的词表中,与字顺表相配合的分类表,它不同于叙词分类索引 分类表的功能:帮助从学科分类的角度查表选词。二、叙词表的微观结构(一)字顺表的微观结构(二)范畴索引的微观结构(三)词族索引的微观结构(四)双语种对照索引的微观结构(五)轮排索引的微观结构(一)字顺表的微观结构 叙词(主题词)款目的著录项目一般包括:款目叙词项;汉语拼音和对应的外语(英语)译名;标注项;参照项。非正式叙词(又称非正
5、式主题词)款目包括:款目词项;标注项,不包含注释项;参照项,仅有“用”参照项,指出代替它的叙词。(二)范畴索引的微观结构 范畴索引中设置哪些类目,一方面应以学科分类为基础,另一方面应该考虑词汇分类的需要。一级类目一般是较大的学科、专业领域,类目细分一般只到二级或三级 范畴索引的类目大多是按类目内容的逻辑联系加以组织,类似于等级分类体系,我国的叙词表均是如此 范畴索引收入主表的全部叙词和非正式叙词,附表的词因本身具有明显的范畴划分性质,一般不再收入范畴索引。叙词和非正式叙词只放入每个类系的最下一级类,并在类下按字顺排列汉表自然科学(增订本)范畴索引片段(三)词族索引的微观结构 词族索引只收字顺表
6、和附表中具有等级关系的叙词。没有等级关系的叙词不收入,非正式叙词不收入 族首词应是外延较宽、内涵较浅并且有实际检索意义的叙词 各词族内的叙词先按等级关系分级排列,并且前置小园点表示等级:族首词前不加小园点,二级词前置一个小园点,三级词前置两个小园点,依此类推 每个词族依其族首词字顺排列,汉语词族索引一般按族首词的汉语拼音排序汉表自然科学(增订本)词族索引(B)片段汉表社会科学卷词族索引(C)片段(四)双语种对照索引的微观结构 译名的范围 一般应收录全部叙词及非正式叙词的译名。但是,如果有些叙词难以找到合适的译名,也允许空缺。译名的单复数形式 对于一般科技名词,其英译名依英文习惯,可数名词用复数
7、,不可数或集合名词用单数;对表示学科专业领域、工艺过程以及事物的性质、状态、特性的词,一般用单数形式。译名与叙词的对应关系 两种语言的词或词组之间并不总是一一对应。双语种对照索引按译名的字顺排列。一般采用逐词字顺排列法。汉表自然科学(增订本)英汉对照索引片段(五)轮排索引的微观结构 收词范围 轮排索引最好是将叙词表的全部叙词和非正式叙词都予以编排;轮排索引也可以只收词组叙词,不收单词素叙词和非正式叙词。轮排形式 轮排索引可以选择的轮排形式至少有三种:词内轮排、词外轮排词、倒置轮排。其中,以词内轮排形式采用较多。款目包含因素 轮排索引的款目因素,除了被轮排的词之外,可以或多或少地包含这些因素:词
8、在字顺表中的位置、范畴号、参照项、外文译名等。汉表自然科学(增订本)轮排索引片段三、叙词表结构的变化叙词表又逐步向功能增强、结构简明的方向发展。具体表现为:字顺表与词族索引合并,即在字顺表中进行等级关系全显示,或至少在字顺表的族首词款目中采用等级关系全显示。范畴索引与词族索引合并,即各范畴(类目)之下的叙词不按字顺排,而按其等级编排。字顺表与专有叙词表(附表)合并,许多词表不设专有叙词表。以详细的分类表(分面分类表或等级列举式分类表)取代范畴索引和词族索引,实现分类主题一体化。四、叙词表的编制与维护(一)叙词表的编制程序(二)叙词表的一般收词原则(三)叙词表的修订内容(四)计算机在叙词表编制、
9、管理和使用中的应用(一)叙词表的编制程序 一般的编表程序为:总体设计制定编制规范拟订收词范畴收集词汇整理词汇编制字顺表编制其他辅助索引全面审查初稿、试标引和征求意见、定稿及出版 叙词表编制流程Select SourcesAssign codesSelect TermsRecord Selected TermsSort TermsMerge identical TermsDefine Broad SubjectFields Merge Terms in SameConcept classSort Terms into BroadSubject FieldsDefine Subfields wit
10、hinone Subject FieldWork out detailed structureof the Subject FieldSelect Preferred TermsAll Subfields of BroadSubject finished?All BroadSubjects finished?Improve Class StructureYesYesNoNoPrint Classified Indexand reviewDiscuss with Experts andUsersSelect descriptors andchecklist itemsProduce Full T
11、hesaurusand Check referencesAssign NotationReview and TestMany Modifications?Based on Soergel,pp 327-333YesNoRevise asneeded(二)叙词表的一般收词原则 叙词表的质量很大程度上取决于收词质量。为保证叙词表的收词质量,应该遵循以下一般原则:1目标性原则2文献保证原则3用户保证原则4组配优先原则5基本词汇完备和精炼原则6兼容性原则1目标性原则词汇收集应紧扣词表的使用目标:首先,应根据词表的学科专业范围进行收词 对于综合性词表和多科性词表,应保持各领域词汇的数量和专指性的大致平衡
12、;对于专业性词表,应重点收集本专业领域的词汇,适当收集相关领域的词汇。其次,要考虑叙词对检索系统的适应性 一般而言,用于计算机检索系统的叙词表应该多收一些内涵较浅,外延较广,组配能力强的基本词汇(单词叙词);用于手工检索系统或机检、手检兼顾的叙词表,则应适当多收一些词组叙词,以减少组配级别。再次,应注意待标引的文献类型对收词的要求 标引学术论文的叙词表比标引图书的叙词表要收集更多的词和更专指的词。2文献保证原则 收集词汇时的文献保证原则,是指应以语词在表达文献主题概念时的出现频率为重要依据 一般来说,出现频率过高和过低的词,因相关的文献太多或太少而失去聚集文献的意义,不应收入词表作为叙词(有时
13、可以作为非正式叙词)对那些反映新学科、新事物的词,即使初期的频率不高,也应予以收集,以适应将会很快出现的需要 根据将要标引的文献数量及其发展趋势而收词,是文献保证原则的必然要求。文献数量与叙词和专指叙词的数量应该成正比(三)叙词表的修订内容叙词表修订的内容主要有:增补语词及词间关系 需要增补的主要是:表示新学科、新事物、新概念的词及相应的词间关系;原先漏选而又有必要补上的词和词间关系;更多入口词及其与对应叙词的等同关系;更专指下位词及相应词间关系,以代替使用频率过高的组配用词和上位标引词。删除不必要的词及词间关系 对标引和检索频率过低甚至长期没被使用过的词;与其他词区别不大而导致相同或相近主题
14、的文献过于分散的重复多余词。修改款目词及其著录项目微观和宏观结构的调整 改变款目词的排列方法;增加注释类型或者改变注释形式;合并辅助索引;增加辅助索引等。(四)计算机在叙词表编制、管理和使用中的应用1计算机在叙词表编制过程的应用2计算机在叙词表管理中的应用3机读叙词表在计算机、网络中的使用1计算机在叙词表编制过程的应用 在词表编制的词汇收集阶段,计算机可以:提供各种数据库或计算机检索系统所记录的标引词、检索词及其使用频率,作为词汇选择的重要依据;可以依据一定的算法直接从文献题名、文摘、正文中抽词,供词表选词参考;可以记录从各种来源收集的词汇,进行多种排列、统计、分析,为词汇优选、词间关系确定提
15、供参考。在叙词表的生成方面,计算机可以:根据输入的基本数据,自动生成反参照,自动检查参照关系的正确性,自动生成字顺表及各种索引的款目并排序。可以为印刷输出词表数据甚至制版,或者直接为机读词表输送数据。2计算机在叙词表管理中的应用 计算机在叙词表管理中的应用主要是建立叙词表的计算机管理系统进行词表的日常维护和修订 利用叙词表的计算机管理系统,既可以随时进行叙词的增、删、改,又自动积累增、删、改数据,便于词表的版本更新。3机读叙词表在计算机、网络中的使用在计算机和网络中使用机读叙词表,可以:将词表与数据库连接或整合;允许用户远程联机查询词表;检查标引人员和检索人员用词的正确性,发现用词错误并推荐正确的语词;将非正式叙词自动转换为叙词,进行标引或检索;联动提供所查叙词在词表各部分显示,方便用户选词;针对输入主题概念的自然语言表述,推荐标引或检索用的叙词;统计叙词标引和检索的使用频率,为词表管理和检索策略优化提供依据;根据叙词变化的沿革记录,进行自动换词或增词检索;依据词表中的等级结构或参照系统,进行自动的扩检或缩检。结束