信息组织学-ppt课件.ppt

上传人(卖家):三亚风情 文档编号:2747988 上传时间:2022-05-23 格式:PPT 页数:87 大小:1.70MB
下载 相关 举报
信息组织学-ppt课件.ppt_第1页
第1页 / 共87页
信息组织学-ppt课件.ppt_第2页
第2页 / 共87页
信息组织学-ppt课件.ppt_第3页
第3页 / 共87页
信息组织学-ppt课件.ppt_第4页
第4页 / 共87页
信息组织学-ppt课件.ppt_第5页
第5页 / 共87页
点击查看更多>>
资源描述

1、1.1 信息组织的内涵 定义1:所谓信息组织,即指采用一系列的方法与手段使大量信息系统化和简明化的过程。信息组织通常是根据事物信息之间的共同性、包含性、交叉性和相关性等特征对信息实施序化与处理的信息加工过程。 定义2:信息组织是指采用一定的方式,将某一方面大量的、分散的、杂乱的信息按其外部特征和内容特征加以整序、优化,然后进行重新控制,形成一个便于有效利用的系统的过程。1.2 信息组织的意义(1)信息组织是令信息成为资源的基本手段(2)信息组织有助于减少社会信息流的混乱程度。 (3)信息组织有助于提高信息产品质量及利用效率第1章 绪论1.3 信息组织的作用(1)信息组织是科学研究的必要条件(2

2、)信息组织是管理决策的支撑(3)信息组织是经济发展的保障 1)信息资源本身具有较大的经济意义。 2)信息组织是知识经济持续发展的保障。 3)经过系统组织的信息资源通过社会流通体系直接创造经济效益。(4)信息组织有助于提高社会生活的质量 1)信息组织是保留人类文化遗产的重要手段。 2)现代信息组织是沟通社会联系的纽带。(5)信息组织是信息查询与检索的基础1.4 信息组织的发展1.4.3 后工业文明时期的信息组织 这是指以现代信息技术的诞生、发展及在信息组织的全 过程广泛应用为主要特征的时期。 时间跨度:20世纪50年代至今。 特点:以现代信息技术为工具,以自动化信息存取系统建设为主要特征,信息组

3、织的目标从微观文献整序扩展到宏观社会信息流控制;信息组织活动逐步社会化;信息组织的产业化趋势日趋明显;信息组织标准化进一步深化;信息组织的手段与方式对现代信息技术的依赖性越来越强。 信息组织的主要内容包括: 对信息的外在特征(也称语法特征)进行选择、记录与描述; 对信息的内容特征(也称语义特征)进行揭示、标引与编码; 对信息记录进行存储与特征排序; 针对用户需求对特定信息进行重组与开发以提高信息质量,促进信息增值。 第2章 信息描述与著录 2.1 2.1 概述概述 对信息进行描述与著录主要着眼于信息的外在特征和物质形态特征,如题名、责任人、出版事项等。在这一过程中,若干著录事项按照一定的规则和

4、格式组织起来,便形成了关于某文献的信息款目。成千上万条信息款目再按一定的规则进行排列与组织即成为信息加工的最终产品之一目录、题录、文摘、索引和数据库等。 (1)ISBDs(国际标准书目著录规则) 对信息的描述规定了统一的描述格式、内容、符号,其核心是统一描述内容。其描述内容包括八大项: 1)题名与责任者项。 2)版本项。 3)文献特殊细节项。 4)出版发行项。 5)载体形态描述项。 6)丛编项。 7)附注项。 8)文献标准号与获得方式项。 9)提要项(中文文献书目描述所加)。 (2)SGML(通用标记语言及相关标准) 是一种关于电子文献格式描述的计算机语言。此处的“文献”包括一切电子格式的文档

5、。SGML从结构和内容提供了描述文献的格式,其核心是文献类型定义DTD。 SGML规模庞大,功能丰富,具有各种选项,用其标记文献使文献不依赖特定的软硬件,具有方便的可互操作性和格式的可转换功能,以适合多种应用或反复使用的目的。 (3)HTML(超文本标记语言) HTML是SGML的一种简化应用,是目前Web在Internet上使用的出版语言,其主要功能是发布、获取、交流信息。 (4)XML(可扩展标记语言) XML是SGML在Web应用服务上的一个重要分支,它是一种元标记语言,可提供描述结构化资料的格式,它避免了SGML的繁琐但仍保持其威力,同时也克服了HTML因过于简单而给网络信息应用带来的

6、不便。其优点有简洁、开放、可扩充、国际共享等。(5)Metadata(元数据)(重点) 元数据也称为描述数据的数据,这是一种专门用来描述数据的特征和属性的语言标准,它也是描述和组织Internet信息资源,发现Internet信息资源的工具。2.2 2.2 元数据信息描述(重点)元数据信息描述(重点)2.2.1 元数据的产生背景 (1)MARC的局限: MARC的标准太复杂,不方便使用;MARC需要专用平台,不能跨平台使用;MARC描述内容仅局限与文献书目数据,不适应多媒体格式信息;MARC仅局限于数据描述部分,其他相关数据的管理信息较少。2.2.2 元数据的基本含义 最常见的:元数据是关于数

7、据的数据。 哈佛大学数字图书馆项目:元数据是帮助查找、存取、 使用和管理信息资源的信息。 美国图书馆协会编目、描述和存取委员会:元数据是结构、编码数据,描述信息款项的特征,辅助描述数据的标识、发现、评估和管理。 2.2.3 元数据的体系(重点) (1)元数据的框架 核心:编码数据 中间:XML和RDF表达层 外层:各种链接,包括连接、索引、显示、编辑、交换 和映射。 (2)元数据的类型(重点) 按图书馆的文献描述:书目描述元数据、档案描述元数据、政府出版物描述元数据、地图描述元数据、图像描述元数据、全文描述元数据等; 按信息资源利用功能:描述性的元数据、管理性的元数据、保存性的元数据、技术性的

8、元数据和使用性的元数据。 (3)元数据的功能 揭示、发现、定位、检索、过滤、共享、评估、管理。 2.2.4 元数据的应用与发展(了解p59-60) (1)元数据的应用 (2)元数据的发展 1)各种应用元数据大量产生 2)元数据的深度开发 3)元数据实现技术的研究和应用2.2.5 国内外常用元数据(了解) (1)MARC元数据 (2)DC元数据 (3)CNMARC元数据 2.2.6 元数据信息的描述 元数据信息的描述是针对专门数字对象类型,建立相应的专门数字对象元数据格式及编码体系、使用指南、使用范例、编制模块并选择合适的技术平台,由数字信息资源加工人员进行元数据的选择、著录、审校、维护、管理,

9、生成能提供给网络信息资源管理人员进行元数据整合的数据,建立网上信息检索、发现、共享的元数据库的系列程序。 (1)元数据应用规范的构建 1)确定元数据标准 2)建立元数据标准使用规范 3)考虑元数据的表达语言 4)确定元数据应用规则 (2)元数据信息构建步骤(重点) 1)需求调查 2)建立规范 3)实现平台 4)人员培训 5)组织数据 6)数据维护 3.1 3.1 概述概述 标引起源于文献工作,是指采用一个或若干个信息标识(词语或代号)表示或替代信息内容特征的过程。 广义的信息标引即指将信息单元所包含的内容特征转换成简明的替代符号或标识的过程。 3.1.1 信息标引意义(了解p87) 可以从四个

10、方面来认识。 第3章 信息揭示与标引3.1.2 信息标引分类 (1)按标引对象划分 1)文献标引 2)多媒体数据库标引 3)网络信息标引 (2)按使用的标引工具划分(重点) 1)分类标引 2)主题标引 (3)按标引工作的不同执行者划分 1)手工标引 受控标引、自由标引、自由词补充标引。 2)自动标引 自动抽词标引、自动赋词标引、自动分类、自动聚类。 (4)按揭示信息内容的范围划分(重点) 1)整体标引 浅标引方式。 2)全面标引 深标引方式。 3)综合标引 4)分散标引 5)重点标引 6)分析标引(5)按标引所采用的不同标识划分 1)受控语言标引 2)自然语言标引 3)混合标引 3.1.3 信

11、息标引工作流程(了解) (1)查重 (2)主题分析 (3)标引 (4)标注 (5)审核 3.1.4 标引质量评价标准 应该确保三点: 选用确切标识;不遗漏有价值信息;前后一致。 3.1.5 标引深度(判断题p95) 标引深度是指在揭示与表达信息记录的主题内容及外表形式特征方面所达到的专指度与网罗度。 标引深度小,查全率高;标引深度大,查准率高。 3.2 3.2 信息分类标引信息分类标引3.2.1 分类标引基本原则(了解) (1)学科属性与知识范畴原则 (2)专指性原则 (3)实用性原则 (4)系统性原则 (5)逻辑性原则 (6)一致性原则 (7)入“其他”类原则 (8)入上位类、或依论述重点归

12、类原则 (9)新学科、新主题信息分类原则 3.3 3.3 信息主题标引(重点)信息主题标引(重点) 3.3.1 信息主题标引基本程序 (1)主题分析 主题分析是指根据标引和检索的需要,对信息记录内容特 征进行分析,提炼主题概念的过程。 1)分析主题类型 根据信息记录讨论的数量,可分为单主题和多主题。 根据主题概念的数量及其关系,分文为单元主题、复合主题和联结主题。 按照信息记录对主题论述的重要程度,分为主要主题和次要主题。 按照信息记录主题与存取系统专业的相关程度,分为专业主题和非专业主题。 按照信息记录论述的方式,可分为显性主题和隐性主题。 2)分析主题结构(重点) 主题分面公式:A主体因素

13、(A1研究对象、A2材料、A3方法、A4过程、A5条件等)B通用因素C空间因素(或位置因素)D时间因素E文献类型因素 例1:“中国八十年代农田水利规程手册”。 例2:“九十年代法国航空发动机设计”。 例3:“高原桥梁混凝土施工”。 例4:“我国西安使用车床对飞机用铝合金材料加工工艺分析”。 (2)主题概念转换 直接转换与分解转换。 分解转换应注意的问题: 1)进行概念分解,避免字面分析。 优先采用交叉关系分解法。 2)按照从专指到泛指的次序查词。 3)根据概念的含义分析专指的分解形式。 4)主题概念分解的结果不得冗余和缺损。 4.2 4.2 信息排序(重点)信息排序(重点) 信息排序是按照一定

14、的方法将无序的信息组织成为有序信息的过程。 语法信息、语义信息、语用信息及其关系。 4.2.1 信息形式特征排序的类型和特点 这是根据信息的外在特征,使用一套形式化的符号系统来组织信息的方法。 (1)号码法 是用数字符号对信息按一定的规则进行编号排序,具有明确、简便、唯一、标准的特点。第4 4章 信息存储与排序 (2)物名法 是利用事物名称的字顺特征来序化信息。 (3)音序法 音序法是字顺组织法的一种,是对同一类信息更进一步细分的一种方法,其主要依据是汉语拼音知识。 (4)专门代码法 是指在某一专业领域采用的有一定专业含义又形式化了的编码系统。 (5)引证关系法 是利用信息之间的引证与被引证关

15、系来组织信息。 (6)时序法 以信息的形成时间为序化符号,按时间顺序组织信息。 (7)地序法 以信息的形成地区或信息内容所反映的地区为序化符号,按行政区划排列法来组织排列信息。 4.2.2 信息内容特征排序的类型和特点 这是根据信息的内容特征,使用一套含有语义的符号系统来组织信息。 (1)分类法 三种分类对象:实物,如商品;概念,如知识;概念与实物的结合体,如文献。 三种分类方法及其特点、关系。 (2)主题法 主题法是建立在自然语言基础上的一类方法,它用自然语词作符号系统,并在某种控制下使用。 主题法不同于物名法。 (3)分类主题一体化排序 分类法和主题法各有短长,应相互弥补,分类主题一体化排

16、序是信息内容特征排序的重要发展趋势。 4.2.3 信息效用特征排序的类型和特点(实例p155) 这是根据信息的实用价值来组织信息的方法。 (1)权值排序法 按信息的重要性来排序信息。 (2)概率排序法 按信息出现的概率来排序信息。 (3)逻辑排序法 按信息之间的逻辑关系来排序信息。 5.1 5.1 概述概述 信息重组是综合利用信息描述与著录、信息揭示与标引、信息存储与排序、信息分析与研究等方式对加工层次较低的信息进行鉴别、筛选、分析、提炼、浓缩与整序以形成较高层次信息产品的过程。 信息重组的过程就是信息开发的过程,信息重组的实质就是信息开发。 信息重组是更富有创见性与能动性的信息整序活动。第5

17、章 信息重组与开发5.1.1 信息重组与开发原则(重点) (1)社会需求原则 (2)特色原则 (3)效益原则 (4)标准化原则 (5)共享原则5.1.2 信息重组与开发的类型(重点) 按照信息重组的层次划分: (1)一次信息重组 重组对象:零次信息;重组成果:一次信息产品 (2)二次信息重组 重组对象:一次信息产品;重组成果:二次信息产品 (3)三次信息重组 重组对象:一次信息产品;重组成果:三次信息产品 5.1.3 信息重组与开发步骤(了解) (1)选题 选题应具有针对性、适用性和可行性。 (2)制定开发计划 (3)信息收集 对象:文献信息源、非文献信息源。 方法:文献调查、社会调查。 (4

18、)信息评价与整序 信息评价标准。 信息整序的两种情况。 (5)产品研制 文献数据库、信息数据库、信息研究成果。 (6)信息产品的测试与评估 总的评价原则。 5.2 5.2 一次信息产品及其类型一次信息产品及其类型 一次信息产品是在零次信息的基础上经过逻辑结构重组、语言重组、观念与概念重组与优化所产生的原始文献,其内容往往是首次发现或系统总结的新知识、新技术、新观点、新论证或对已知思想观点与事实材料的新理解、新探讨。如期刊论文、科技报告、专利说明书、学术会议论文、技术标准等。5.3 5.3 二次信息产品及其类型二次信息产品及其类型 二次信息产品是对一次信息产品进行优选、提炼、浓缩加工后形成的信息

19、产品。如书目、索引、文摘、提要、搜索引擎、主题目录、超文本系统、超媒体系统、数字图书馆等。 (1)书目数据库 书目数据库是以一次文献为整序单位的各种出版物目录信息的集合,它也是关于一次文献内容和外在特征的浓缩、替代、转换的重组成果形式。 1)题录数据库(重点) 题录数据库又称题名索引,是一种以原始文献的题名信息单元为标目,以表征原始文献形式特征的信息单元为描述对象,按照一定的标准格式进行著录标引组织而成的信息存取系统。 2)文摘数据库 文摘数据库是在题录的基础上以一种精练准确、少加或不加评论的文字简述文献重要内容的信息重组产品。 报道性文摘和指示性文摘。 文摘款目结构:题录部分、文摘正文和补充

20、著录。 3)索引数据库(了解) 信息索引产品是将信息集合中具有检索意义的事物名称及形式或内容特征词等信息单元抽取出来,其后注明地址,按照特征词字顺进行重组排序所形成的信息存取系统。 索引款目的构成:索引款目词、说明语、地址参考。 例: 怀疑论(哲学流派) 综论 B083 索引数据库的类型:见教材表6.2。 (2)全文数据库(了解) 全文数据库是一种存储文献全文或其中主要部分的源数据库,它是一个由完整的信息源全部转换为计算机可以识别处理的信息单元而形成的数据集合。它可与相应的软件配合提供从任意篇章、节、句、词、字及逻辑组合检索的信息存取系统。其主要特点是具备全文编辑、加工和检索功能,允许用户以自

21、然语言进行检索并获取全文。 (3)搜索引擎 搜索引擎是指对WWW站点资源和其他因特网资源进行识别、标引、重组和检索的一类信息存取机制和检索工具。 5.4 5.4 三次信息产品及其类型三次信息产品及其类型 三次信息产品是利用二次信息检索一次信息,再对所获得的一次信息集合进行综合、分析、评述、编写所形成的信息产品,是高度浓缩加工的再生科研信息成果。 根据其编制目的与方式,可将三次信息产品区分为综合研究型和参考工具型两大类,前者如专题述评、总结报告、动态综述、信息预测等,后者如手册、百科全书、年鉴、指南等。 (1)学科与课题现状的信息重组信息综述(重点) 这是针对某一时期某学科领域或某课题研究发展阶

22、段的大量原始信息,根据其内容或逻辑关系上的联系进行甄别、分析、综合、梳理、归纳加工之后所形成的关于某事物或某专题的研究现状和发展趋势等综合浓缩性的一类信息重组。 作用:提供综合信息,指导决策管理和促进科学研究。特征(重点)1)描述信息的客观性。2)信息重组方式的特殊性。3)对大量一次信息记录的整合性。4)信息内容与观点的浓缩性。5)信息阐述的简明性。类型:叙述性综述、事实性综述和预测性综述。文体结构:标题、概述、正文、结束语和参考文献等。 (2)课题与专题评论信息重组信息述评 这是一种以某专题大量的一次信息记录为依据,经过分析、提炼和整序加工,提出综合性的评判意见及建议的信息重组成果。 作用:

23、帮助研究人员确定研究方向,提供完成既定任务的合理方案,为决策管理部门制定方针政策提供依据。 (重点) 与信息综述之比较:共同点在于,两者均属三次信息,且均有一次信息属性,均要求收集一次信息记录必须全面,事实数据必须详实,分析研究必须科学合理;不同点在于,信息综述一般不强调研究者的主观感受或判断,而信息述评则必须明确表明撰写者的态度、建议与评价。6.1 6.1 分类组织概述分类组织概述6.1.1 分类组织基本概念(了解) (1)分类组织 分类组织即采用分类的方式组织信息资源。分类是一种根据事物之间的共性与特性聚集同类事物,区分不同事物的方式与手段。 (2)分类组织法 分类组织法是一种按照事先规定

24、好的学科专业体系或事物范畴,根据某一特性将信息分门别类地组织成系统以便于用户按照学科专业或事物范畴途径查询特定信息的信息组织法。第6章 分类组织系统 6.1.2 分类组织基本特点(重点) (1)系统性 系统性主要通过类目体系纵向从属、横向并列的 形式表现出来。 分类组织的有序形式有: 1)分类号码标识系统 排序方式:顺序排序和层累结构。 2)词语分类标识系统 (2)类聚性 1)依事物聚类 2)依学科专业聚类 3)依词语聚类 (3)多重性 分类组织具有多向成族性,这是由信息的多种属性决定的。一份信息可依其不同的属性划归于不同的类。 信息划分标准的选择及其使用次序,对于形成何种分类体系,提供何种分

25、类检索途径关系极大。 确定分类标准和组织次序应充分考虑用户利用该类信息的习惯及检索要求。 (4)适应性6.1.3 分类组织基本原则(重点) (1)科学性原则 1)利用科学知识分类成果,反映科学技术发展水平及科学之间的联系与区别。 2)内容特征为类目划分主要标准,形式特征辅之。 3)体现学科或事物纵向分化(或综合)与横向并列的基本规律。 (2)充分揭示原则 1)类目体系应由反映目前科技发展状况的各级类目构成。 2)根据类名的内涵与外延确定检索意义最大或较大的内容或形式特征的属性词作为划分标准。 对分类标引的要求:充分揭示、归类正确、方便检索。 (3)简便适用原则 分类组织要根据用户检索需求与习惯

26、进行。分类标引必须充分考虑专业特征及特定需求,将信息记录归入用途最大与专指度较高的类目,应进行附加归类,编制类目索引文档,提供组配复分功能,在信息描述中尽可能展示可检特征。 (4)依法分类原则 分类法(分类表)的职能、作用。 依法分类的两层含义:依据分类法;依据分类标引规则。 6.2 6.2 文献分类法的结构原理(考点)文献分类法的结构原理(考点)6.2.1 等级体系分类系统结构原理 (1)等级体系分类法的特点(重点) 1)以概念划分、概括及知识分类的理论与方法为基础,将概念按照知识分类与逻辑关系进行纵向隶属、横向并列的方式编排成概念等级体系。 2)它是一种先组式定组型标引语言。 3)按照学科

27、专业或事物范畴区分和集中文献,提供按学科或知识分类或事物范畴的检索途径。 4)其标识符号既可以用于组织分类目录与索引,也可用于排书上架。便于国际标准化。 (2)等级体系分类系统的发展及其局限性 等级体系分类法的产生与发展是与科学知识的分化发展相适应的。 其局限性表现在(重点) 1)列举类目与无限增长的科学知识不相适应。 2)类目体系的单向线性与概念多向成族的网状结构不相适应。 3)分类标识的概括性与信息源主题的专指性不相适应。 4)号码标识的有限性与知识单元的无限性不相适应。 5)文献单元标引与知识单元检索不相适应等。 6.2.2 分面组配分类系统结构原理 所谓分面,即按照事物的属性或特征所区

28、分出来的若干组面,或若干组性质相同的概念因素。 分面组配分类系统结构原理如下(重点): (1)以概念的可分析性与可综合性原理为基础,根据概念多向成族的特点建立概念组配体系。 (2)分面组配分类法的类号是散组式的。 例:马铃薯病虫害 J341:438 茶树病虫害 J451:438 从编制原理看,分面组配分类属于后组式检索语言。 (3)分面组配分类法专指度较高,容纳概念的能力较强,能及时反映新概念及细小主题。 (4)分面组配分类法有助于提供多维检索途径。 例:印度的建筑与交通 G2 (印度) D3 (建筑) Q7 (交通) G2D3 (印度建筑) G2Q7 (印度交通) 6.3 6.3 中国图书馆

29、分类法中国图书馆分类法简介(了解)简介(了解) 中国图书馆分类法(简称中图法),原名中国图书馆图书分类法,是为适应我国各类型文献管理部门对文献进行整序与组织的需要而编制的一部大型的综合性分类法。它是由北京图书馆倡导,组织全国图书馆界的力量集体编制而成的,于1975年正式出版,1980年修订第二版,1990年修订第三版,1998年修订第四版,并改名为中国图书馆分类法。 中图法的基本功能是编制分类检索工具、分类存取文献,组织文献分类排架。其体系结构主要由类目表(主表和辅助表)、标记符号和索引部分构成。 6.3.1 中图法类目表结构 (1)主表 1)基本部类 五大基本部类(重点) 马克思主义、列宁主

30、义、毛泽东思想 哲学 社会科学 自然科学 综合性图书2)基本大类22个基本大类:A 马克思主义、列宁主义、毛泽东思想 N 自然科学总论B 哲学 O 数理科学与化学C 社会科学总论 P 天文学、地球科学D 政治、法律 Q 生物科学E 军事 R 医药、卫生F 经济 S 农业科学G 文化、科学、教育、体育 T 工业技术H 语言、文字 U 交通运输 I 文学 V 航空、航天J 艺术 X 环境科学、劳动保护科学K 历史、地理 Z 综合性图书 3)简表 是一个基本类目表、分类法纲要。包括基本大类以及由基本大类进行连续区分所形成的三级类目表。 4)详表 是分类法正文部分,是分类法全部类目的枚举,是图书情报部

31、门标引文献的实际依据。 例: F 经济 一级类目 F5 交通运输经济 二级类目 F51 世界各国概况 三级类目 F53 铁路运输经济 三级类目 F54 陆路、公路运输经济 三级类目 F541 世界陆路、公路运输经济 四级类目 F542 中国陆路、公路运输经济 四级类目 纵向逐级次第,层层细分。 细分方式:特征细分、方面细分和列举细分。 类系、上位类、下位类、同位类。 例: 动物学 动物分类学 无脊椎动物 脊椎动物 鱼纲 两栖纲 爬行纲 哺乳纲 原兽亚纲 后兽亚纲 类目纵向逐级区分,层层展开是概念内涵从一般到特殊,概念外延从大到小的过程。 重点:类系在类目的细分过程中,连续逐级区分所形成的一系列

32、具有从属关系的类目群。 按照某一属性对一类文献进行划分所产生的侠义类目称为下位类,被划分的类称为上位类。 同为类均是有同一个上位类区分出来的子类,两者互称为同为类。 类列一组同为类,称为一个类列。 同级类指在类目表的纵向次第位置上级位相同,同级类可以不属于一个类列。 横向平等列举,并列展开。 类列、同位类、同级类。 同位类的序列原则和方法:自然排序法和人为排序法。中图法对于学科专业同位类目、事物主题同位类目、地区性类目、时代性类目和某些特殊类目各有不同的排序方式。 相关学科的交替与参照。 类目之间除了隶属、并列关系,还有交叉、相关关系。 对于交叉类目,设置“使用类目”和“交替类目”。 使用类目

33、:指定归入的类目。 交替类目:不宜用作标引的类目。 例: P642.3 土力学及岩石力学 宜入TU43及TU45 TU43土力学 TU45岩石力学 对于相关类目,使用类目参照。 例:在“信息光学”类目下注明“参见TB877”,将其与“光全息摄影”联系起来。 类目的从属与并列关系显示了类表纵横方向的系统性,类目的交替与参照则体现了类目多向成族的交叉性。 (4)中图法标识系统的主要特点 1)混合号码、混合标识系统。 2)拉丁字母代表基本大类,阿拉伯数字代表基本大类以下各级类目,超过三位标圆点。 3)对相同性质的类目采用统一划分标准列类以助记忆和列类规范化。 4)间隔标号法。 5)多处使用同位号扩展

34、法。 八分法和双位制。 6)设置辅助符号。 包括推荐符号“a”、总论复分号“”、地区复分号“()”、时代区分号“”、民族区分号“”等。 6.3.3 中图法类目索引 类目索引也叫分类法索引,它是由类目主题概念指向分类号的检索工具,一般附在分类法之后或单独成册。 (重点) 类目索引的作用:对标引人员的作用;对用户的作用;对分类主题一体化的作用。 6.4 6.4 网络信息分类组织(了解)网络信息分类组织(了解) 6.4.1 网络信息分类组织的特点 总的特点:重简便适用原则,不重科学性原则。 具体表现在:类目划分强调易用性;类目设置以实用性为主;类目序列以检索频次与检索习惯为主要依据。 以上特点既有网

35、络信息分类组织所处的网络信息环境方面的原因,如处理对象、使用对象、技术环境发生变化,传统分类法显得不相适应;也有网络信息分类组织尚不成熟,分类思想、方法、技术有待进一步完善方面的原因。实用性与科学性是信息组织的一对永恒的矛盾,不断达成两者新的平衡,则是信息工作者永恒的追求。网络信息分类组织发展的趋势是,在保持和提升实用性的同时,着力增强其科学性。 6.4.2 网络信息分类组织的类型(重点) (1)主题分类等级系统 Yahoo!、搜狐。 (2)学科分类等级系统 网络指南针。 (3)分面组配分类体系 中华网目。 6.4.3 构建网络分类系统应注意的问题 (1)网络信息的著录与标引 (2)类目体系的

36、组建 (3)类目的组织 (4)网站信息的组织 (5)用户界面 7.1 7.1 主题组织概述主题组织概述 7.1.1 主题组织的含义(了解) 主题:指信息记录论述的对象,包括事物、问题、现象等。 主题词:经过分析选择,用来表达信息记录主题的语词。 主题组织:是和分类组织相辅相成的一种从内容角度标引和存取信息的方法,是一种用语词作为概念标识,将概念标识进行字顺排列,并用参照系统等方法间接显示概念之间相互关系的信息组织方法。 7.1.2 主题组织的类型 主题组织包括标题词法、单元词法、叙词法和关键词法等类型。参见图7.1。第7 7章 主题组织系统 标题词法单元词法叙词法关键词法主题法(传统)主题词法

37、主题组织系统主题语言主题法(广义)检索词标引词索引词标题词标题单元词元词叙词(主题词)描述词关键词键词(规范语言)(自然语言)图7.1 主题组织的类型重点重点7.1.3 主题组织的特征(了解) (1)直接性 (2)规范性 多词一义:电子计算机、计算机、电脑。 一词多义:教案(教育)、教案(历史)。 (3)组配性 (4)相关性 (5)通用性 (6)动态性7.2 7.2 主题法系统主题法系统7.2.1 标题词法(1)标题词法的构成原理(重点) 1)按主题(信息记录所论述或涉及的事物)集中信息。 2)用经过规范化的语词直接标引信息记录主题。 3)用参照系统间接显示主题词之间的相互关系。 4)用字顺序

38、列直接提供主题存取途径。(2)标题词表的功用和结构体系 标题词表是标题词的汇编,是一部标题词典。其功用是对概念等同关系的词进行优选,对同一标题词可能有的不同形式进行优选,对多义词(同形异义词)的词义进行限定,对标题词之间以及非标题词与标题词之间的相互关系进行显示,并提供标题标引的方法指示。所以,标题词表是标题词规范化的工具,是对信息进行标题标引和主题检索的依据。 标题词表一般有以下三个组成部分: 1)编制说明。 2)主表。 3)副表。 任何一个标题,都是一个完整的标识,可以独立地标引一个信息主题。所以,标题词法属于先组定组式信息检索语言类型。先组配式标识系统:标题词标识系统和关键词标志系统;后

39、组配式标识系统:单元词标识系统和叙词标识系统。 7.2.2 单元词法 (1)单元词法的构成原理(重要) 单元词法的基本原理是:任何一个复合概念都可分解为若干单元概念,而每个单元概念一般只需用一个单词来表达。因此,任何一个复杂的概念(信息主题),都可用一些单词单元词的组合或组配来表达。 单元词法的特点,在于它的标识是后组式的。它的一些优点都是由这个特点决定的。 (2)单元词表的功用和结构体系 单元词表是一种标准词表。它的功用,主要是进行词汇控制,提供规范化的单元词,以保证单元词系统的统一。 简单的单元词表,只有一个字顺词表。较完备的单元词表,则由一个字顺词表和一个分类词表(单元词范畴表)组成。7

40、.2.3 叙词法(1)叙词法的构成原理(重点) 1)叙词法是多种信息检索语言的原理和方法的综合 它保留了单元词法单词组配的基本原理,也是后组式的。 采用了组配分类法的概念组配来代替单元词法的字面组配,以及适当采用标题词法的预先组配方法(即采用词组)。 采用了标题词法对语词进行严格规范化的方法,以保证词与概念的一一对应。 采用并进一步完善了标题词法的参照系统,采用了体系分类法的基本原理编制叙词分类索引(范畴索引)和等级索引(词族索引),采用了与关键词法类似的方法编制叙词轮排索引,从多方面显示叙词间的相互关系,以保证准确、全面地选用叙词进行标引和检索。 2)概念组配是叙词法的基本原理 概念组配与字

41、面组配在形式上有时相同,有时不同;而从性质上说,两者则区别甚大。字面组配,其实质是词的分拆与组合(拆词);概念组配,其实质是概念的分析与综合(拆义),两者的检索效果有很大差异。 例: 字面组配 概念组配 脑肿瘤脑肿瘤 脑肿瘤脑肿瘤 河北梆子河北梆子 河北地方剧梆子河北梆子 香蕉苹果香蕉苹果 香蕉苹果? 香蕉味食品苹果香蕉苹果(2)叙词表的功用和结构体系 1)叙词表的功用(重点) 对叙词法的严格实施起管理作用。 对周密选用叙词以便准确、全面地标引和检索信息起保证作用。 对信息标引人员和信息检索人员查找所需叙词起方便作用。 2)叙词表的结构体系(重点) 叙词字顺表。 叙词分类索引(分类表或范畴索引

42、)。 叙词等级索引(族系表或词族索引)。 叙词轮排索引(轮排表)。 叙词双语种对照索引。 专有叙词索引。 正式叙词索引和款目词索引。 叙词关系图(词族图或语义关系图)。7.2.4 关键词法 (1)关键词法的构成原理 关键词:是指出现在信息记录的标题以至摘要、正文中,对表征信息主题内容具有实质意义的语词,亦即对揭示和描述信息主题内容来说是重要的、带关键性的语词。 例: 标题:用计算机编制上下文关键词索引 关键词:计算机、上下文、关键词、索引 非关键词:用、编制 关键词法:就是将信息记录原来所用的,能描述其主题概念的那些具有关键性的词抽出,不加规范或只作极少量的规范化处理,按字顺排列,以提供检索途

43、径的方法。 (2)关键词法的性能 优点(重点) 1)标引时不必查表选词,标引速度快、成本低,特别适合网络信息的组织与标引。 2)不需要依赖专职标引人员,可由作者或机器自动标引。 3)较少人为性和滞后性。 缺点: 1)因多词一义,可能造成漏检。 2)因一词多义,可能造成误检。 3)关键词法不显示关键词之间的等级关系和相关关系,增加了检全信息的难度。 4)关键词多限于取自信息记录标题,也会导致漏检。 5)机编索引由于机械地抽词和轮排,不少关键词款目不起检索作用而徒增篇幅。 7.3 7.3 网络信息主题组织系统网络信息主题组织系统7.3.1 网络环境下主题组织的主要特征(重点) (1)机读化 (2)

44、兼容性 (3)适应性 (4)直观性7.3.2 网络主题组织系统的类型(了解) (1)主题引擎 (2)网络信息导航 (3)基于内容的图像组织与检索 (4)指引库与主题树组织与揭示网络信息 (5)组织与揭示自由文本 (6)主题菜单组织与揭示网络信息 7.3.3 主题法系统在网络信息组织中的应用 (1)标题词法的应用 作为后控词表使用。 1)检索前使用 2)检索后使用 (2)叙词法的应用 在网络信息组织中应用叙词法的方案(重点) 1)将超文本技术与叙词表结合。 将叙词表转换为超文本形式。 将超文本技术用于叙词表管理。 利用叙词表将普通文本转换为超文本。 2)将叙词表作为后控词表使用。 (3)关键词法

45、的应用 1)关键词法在搜索引擎中的应用及其局限(问答题) 应用:关键词倒排索引文档。 局限:查全率低,因无受控词表,同义词、近义词得不到控制,词间关系得不到揭示;查准率低,因用户选词不准,更因关键词的形式匹配。 2)改进方法 后控词表:“标引不控制检索控制”模式,入口词表,转换工具和扩展工具,自动编制,控制原理,提高查全率和查准率,实现自由标引。 概念检索:专家系统,知识库,分类树,概念空间语义网络,提高智能程度,突破形式匹配,加强人机交互,体现分类主题一体化。 8.1.3 超文本的三要素(重点) 超文本的三要素:节点、链、网络。 节点:表达信息的基本单位。 表现类节点:文本、图形、图像、声音

46、、视频、混合媒 质及按钮节点等。 组织型节点:目录节点和索引节点。 推理型节点:对象节点和规则节点。 链:将节点联系起来的中介,定义了超文本的结构并提供浏览和检索节点的能力。链的起始节点称为锚节点,终止节点称为目的节点。链是超文本的灵魂。从连接的方式上可分为实链和虚链(或称动态链),从功能上可分为基本结构链、组织链和推理链。 网络:是一个有向图,由节点和链共同构成。第8 8章 网络信息的网页与网站组织 8.1.4 网页和超文本(了解) 网页是超文本在网络环境下的主要应用,网页是用超文本技术制作的,网页信息是以超文本形式组织的,超文本为网页提供了概念模型,利用超文本组织信息是网页开发的前提。 8

47、.1.5 超文本信息组织过程 (1)获取任务信息。 (2)任务信息的理解和分析。 (3)用户界面设计。 8.2 8.2 网站组织网站组织 网站组织是更为高级的网络信息组织形式,应从更高层次对信息进行组织。不论哪种站点,都必须进行信息的收集、分析、筛选。网站的主要实现手段是网页制作,但还应包括对站点内容的规划、模块的划分以及技术的实现。网站建设就是开发超文本系统的过程,需对信息进行超文本分析,然后进行系统建模和实现。 8.2.1 超文本HAM模型(重点,有可能问答题) 用户界面层超文本抽象机层数据库层图8.1 HAM模型 数据库层:提供存储、共享数据和网络访问功能,保证存取操作对超文本抽象机层透

48、明,还要处理其他传统的数据库管理问题,由Web数据库管理系统承担。 超文本抽象机层:决定了超文本系统节点和链的基本特点,记录了节点之间链的关系,保存了节点和链的结构信息,还是超文本输出/输入格式标准化转换的最佳层次,由Web服务器承担。 用户界面层:涉及超文本抽象机层信息的表现,实际站点组织该层的主要体现就是网页,该层风格影响着用户对站点信息的获取信心。8.2.2 网站组织关键技术 超文本技术 数字处理技术 数据库技术 信息收集处理与组织技术 数据挖掘技术 人工智能技术 通信技术 站点实现技术 Web开发技术 8.3.3 XML XML是Extensible Markup Language(可

49、扩展标记语言)的缩写,是W3C组织于1998年2月发布的标准。W3C组织制定XML标准的初衷是,定义一种互联网上交换数据的标准。W3C采取了简化SGML的策略,在SGML基础上,去掉语法定义部分,适当简化DTD部分,并增加了部分互联网的特殊成分。因此,XML也是一种标记语言,基本上是SGML的一个子集。因为XML也有DTD,所以XML也可以作为派生其它标记语言的元语言。 HTML已经这样流行了,为什么还要发展XML?原因很简单,XML所要完成的任务,必须由元标记语言来完成,而HTML只是一个实例标记语言。 在XML发布之前,国际互联网的发展受到HTML如下几个问题的束缚: 1)HTML无法描述

50、数据内容,而这一点恰恰是数据检索、电子商务所必须的。 2)HTML对数据表现的描述能力是十分不够的,如HTML还不能描述矢量图形、科学符号等对象,目前只能通过图象来表现这些对象。 3)HTML实例标记语言的地位,完全不能适应对新标记需求的发展需要。 XML的出现,使上述问题都得到很好的解决。 (1)XML的特性(重点) 1)结构化 DTD,XML语法分析器,更严格的数据结构的两个好处。 2)自描述 元数据。 3)可扩展性 这是XML和HTML最大的区别。普通用户(包括企业和个人)可以运用XML自定义一套标签和DTD,从而产生一个或一套在企业内部通用的文档。这一套自定义的标签就相当于自定义的标记

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(信息组织学-ppt课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|