信息资源管理中的内容管理文稿教学课件.ppt

上传人(卖家):ziliao2023 文档编号:7394520 上传时间:2023-12-20 格式:PPT 页数:174 大小:2.17MB
下载 相关 举报
信息资源管理中的内容管理文稿教学课件.ppt_第1页
第1页 / 共174页
信息资源管理中的内容管理文稿教学课件.ppt_第2页
第2页 / 共174页
信息资源管理中的内容管理文稿教学课件.ppt_第3页
第3页 / 共174页
信息资源管理中的内容管理文稿教学课件.ppt_第4页
第4页 / 共174页
信息资源管理中的内容管理文稿教学课件.ppt_第5页
第5页 / 共174页
点击查看更多>>
资源描述

1、信息资源管理中的内容管理文稿演示优选信息资源管理中的内容管理本章基本内容本章基本内容2.1 信息资源类型信息资源类型2.2 信息采集信息采集2.3 信息组织信息组织2.4 信息检索信息检索2.5 信息分析信息分析2.6 信息资源开发利用信息资源开发利用2.1 信息资源类型信息资源类型2.1.1 信息资源类型概述信息资源类型概述1.按信息载体划分按信息载体划分信息资源按载体材料和存储技术可分为信息资源按载体材料和存储技术可分为n(1)印刷型信息资源)印刷型信息资源n(2)缩微型信息资源)缩微型信息资源n(3)声像型信息资源)声像型信息资源n(4)数字化信息资源)数字化信息资源2.1.1 信息资源

2、类型概述信息资源类型概述2.按加工深度划分按加工深度划分n零次信息:进行中的研究。零次信息:进行中的研究。n一次信息:检索和利用的对象。一次信息:检索和利用的对象。n二次信息:提供一次信息的线索。二次信息:提供一次信息的线索。n三次信息:具有综合性高、系统性好、参考价值三次信息:具有综合性高、系统性好、参考价值高等特点。高等特点。2.1.2 文本类信息资源文本类信息资源文本类信息资源按出版形式划分,可分为:文本类信息资源按出版形式划分,可分为:n1.图书图书n2.期刊期刊n3.会议文献会议文献n4.学位论文学位论文n5.专利文献专利文献n6.研究报告研究报告n7.政府出版物政府出版物n8.标准

3、文献标准文献n9.产品资料产品资料n10.文书档案文书档案2.1.3 数据类信息资源数据类信息资源1.经济数据资源经济数据资源n(1)宏观经济统计数据宏观经济统计数据n(2)微观经济数据微观经济数据 股票市场交易数据股票市场交易数据 上市公司财务指标分析数据上市公司财务指标分析数据 上市公司治理结构研究数据上市公司治理结构研究数据 上市公司兼并收购、资产重组研究数据上市公司兼并收购、资产重组研究数据 证券投资基金研究数据证券投资基金研究数据 上市债券研究数据上市债券研究数据 期货市场研究数据期货市场研究数据 行业研究数据行业研究数据 商品市场数据商品市场数据 2.1.3 数据类信息资源数据类信

4、息资源n(3)经济资源数据经济资源数据n 自然资源数据自然资源数据 n 城市基础数据城市基础数据n 企业法人数据企业法人数据n 人口数据人口数据 2.1.3 数据类信息资源数据类信息资源2.科学数据资源科学数据资源科学数据来源于各部门和各单位的观测、监测、调科学数据来源于各部门和各单位的观测、监测、调查、试验、实验以及研究分析等科技活动,涉及数查、试验、实验以及研究分析等科技活动,涉及数值数据、空间数据、图形数据和文本数据等各种类值数据、空间数据、图形数据和文本数据等各种类型,分布广泛、内容复杂、形式多样、格式不一、型,分布广泛、内容复杂、形式多样、格式不一、数量庞大。数量庞大。n(1)基础科

5、学数据基础科学数据n(2)基础地理数据基础地理数据n(3)空间数据空间数据n(4)地震科学数据地震科学数据2.1.3 数据类信息资源数据类信息资源3.科学数据共享工程科学数据共享工程n中国科学技术部的科学数据共享工程是科技基础中国科学技术部的科学数据共享工程是科技基础条件平台工作的重要组成部分。实施科学数据共条件平台工作的重要组成部分。实施科学数据共享工程,整合并共享现有的海量数据资源,让科享工程,整合并共享现有的海量数据资源,让科技界、学术界能够方便地获得所需要的数据资源,技界、学术界能够方便地获得所需要的数据资源,实现了数据资源的合理流动和充分利用,防止了实现了数据资源的合理流动和充分利用

6、,防止了科研活动的重复进行和科研经费的浪费,有助于科研活动的重复进行和科研经费的浪费,有助于持续提升国家的科技创新能力。国家气象局成为持续提升国家的科技创新能力。国家气象局成为数据共享的先导和示范单位。数据共享的先导和示范单位。2.1.3 数据类信息资源数据类信息资源n科技部又启动了五个科学数据中心即测绘科学数科技部又启动了五个科学数据中心即测绘科学数据共享服务、水文水资源信息共享服务、地震科据共享服务、水文水资源信息共享服务、地震科学数据共享、林业科学数据中心、农业科学数据学数据共享、林业科学数据中心、农业科学数据中心和三个共享服务网(地球系统科学数据共享中心和三个共享服务网(地球系统科学数

7、据共享服务网建设与运行、现代农业技术(农村科技)服务网建设与运行、现代农业技术(农村科技)信息共享服务网、可持续发展信息共享平台)。信息共享服务网、可持续发展信息共享平台)。由此,包括气象科学数据共享在内九大行业的科由此,包括气象科学数据共享在内九大行业的科学数据共享工程开始有条不紊地推进。学数据共享工程开始有条不紊地推进。2.2 信息采集信息采集2.2.1 信息资源的数量和来源信息资源的数量和来源1.图书的数量和来源图书的数量和来源 据据1995年年联合国统计年鉴联合国统计年鉴对对120个国家图个国家图书出版情况的统计,全世界共生产图书书出版情况的统计,全世界共生产图书91万多种。万多种。1

8、997年美国出版图书年美国出版图书8.5万万10万种,英国万种,英国9.5万种,万种,中国大陆中国大陆10万种(初版新书有万种(初版新书有5万种),德国万种),德国78万种,法国万种,法国3万种,日本万种,日本6万种,还有意大利、西班万种,还有意大利、西班牙等国,各有牙等国,各有2万万3万种。近年来上述数字变化不万种。近年来上述数字变化不大。俄罗斯出书也很多,前苏联一年出书大。俄罗斯出书也很多,前苏联一年出书8万种。万种。2.2.1 信息资源的数量和来源信息资源的数量和来源我国(这里仅指大陆地区)我国(这里仅指大陆地区)2003年有出版社年有出版社570家(包括副牌社家(包括副牌社35家),共

9、出版图书家),共出版图书190391种,种,其中新版图书其中新版图书110812种,重版、重印图书种,重版、重印图书79579种,总印数种,总印数66.7亿册。与上年相比图书品种增长亿册。与上年相比图书品种增长11.4%,新版图书品种增长,新版图书品种增长10%,重版、重印图,重版、重印图书品种增长书品种增长13.2%,总印数下降,总印数下降2.9%。2.2.1 信息资源的数量和来源信息资源的数量和来源2.期刊的数量和来源期刊的数量和来源n由于期刊变化太快,所以,全世界的期刊有多少由于期刊变化太快,所以,全世界的期刊有多少种?现在在版期刊有多少种?尚无人精确统计过。种?现在在版期刊有多少种?尚

10、无人精确统计过。美国鲍克公司出版美国鲍克公司出版乌利希国际期刊指南乌利希国际期刊指南(Ulrichs International Periodicals Directory,New York::Bowker,1932-)是目前反映国际是目前反映国际期刊出版动态及订购期刊的重要工具、其收集品期刊出版动态及订购期刊的重要工具、其收集品种几乎囊括了世界上正在出版的全部重要西文期种几乎囊括了世界上正在出版的全部重要西文期刊。刊。n考察几种权威的期刊工具书,目前在版期刊大约考察几种权威的期刊工具书,目前在版期刊大约有有15万种。自有期刊以来,全世界累计出版期刊万种。自有期刊以来,全世界累计出版期刊在在3

11、00万至万至500万种之间。万种之间。2.2.1 信息资源的数量和来源信息资源的数量和来源n我国大陆地区我国大陆地区2003年共出版期刊年共出版期刊9074种,平均期种,平均期印数印数19909万册,总印数万册,总印数29.47亿册。与上年相比亿册。与上年相比种数增长种数增长0.5%,平均期印数下降,平均期印数下降2.44%,总印数,总印数下降下降0.14%。出版报纸。出版报纸2119种,平均期印数种,平均期印数19072.42万份,总印数万份,总印数383.12亿份。与上年相比,亿份。与上年相比,种数下降种数下降0.84%,平均期印数增长,平均期印数增长1.88%,总印,总印数增长数增长4.

12、16%。台湾地区出版的期刊有。台湾地区出版的期刊有5000余种。余种。香港定期出版的期刊有香港定期出版的期刊有670多种,澳门有多种,澳门有20种。种。2.2.1 信息资源的数量和来源信息资源的数量和来源3.专利说明书的数量和来源专利说明书的数量和来源 世界上每年出版的专利说明书约为世界上每年出版的专利说明书约为100-110万万件。根据中国国家知识产权局的统计数据,件。根据中国国家知识产权局的统计数据,2003 年我国专利申请总量为年我国专利申请总量为 30.9 万件,授权量万件,授权量 18.2 万万件,分别比上年增长了件,分别比上年增长了 22%和和 38%。英国国家图。英国国家图书馆书

13、馆2004年累计专利说明书年累计专利说明书5348万件专利说明书,万件专利说明书,是世界上最大的专利库藏。是世界上最大的专利库藏。截止截止2004年底,我国国家知识产权局专利局年底,我国国家知识产权局专利局专利文献馆拥有专利文献馆拥有29个国家个国家3个国际组织的专利说明个国际组织的专利说明书,总量为书,总量为4000多万件;还可提供多万件;还可提供88个国家及国际个国家及国际组织专利信息检索工具。组织专利信息检索工具。2.2.1 信息资源的数量和来源信息资源的数量和来源4.技术标准的数量和来源技术标准的数量和来源 技术标准是一种增长比较缓慢的文献。目前,技术标准是一种增长比较缓慢的文献。目前

14、,国际标准化组织(国际标准化组织(ISO)和国际电工委员会()和国际电工委员会(IEC)颁布的现行有效的国际标准有颁布的现行有效的国际标准有16745项。约有项。约有100多多个国家和地区设有全国性标准化组织。其中有个国家和地区设有全国性标准化组织。其中有90多多个国家和地区制订了国家标准。据统计,截止个国家和地区制订了国家标准。据统计,截止1991年年底,世界上各类标准文献共计年年底,世界上各类标准文献共计120多万件。在多万件。在我国,据统计,到我国,据统计,到2001年底,已颁布国家标准年底,已颁布国家标准19744项,专业(部)标准项,专业(部)标准31900项,地方标准项,地方标准1

15、1660项,企业标准项,企业标准871项。国家标准项。国家标准40%采用国际采用国际标准和国外先进标准。标准和国外先进标准。2.2.1 信息资源的数量和来源信息资源的数量和来源5.其他文献的数量和来源其他文献的数量和来源 据据科技会议录索引科技会议录索引(Index to Scientific&Technical Proceedings,简称,简称ISTP)报道,全)报道,全世界每年要召开上万个科技会议。它每年报道大约世界每年要召开上万个科技会议。它每年报道大约4000多个会议的会议录、收录会议论文约多个会议的会议录、收录会议论文约16万篇。万篇。世界会议世界会议(World Meetings

16、,简称,简称WM)是由)是由美国美国World Meetings Information Center Inc.编编辑,辑,MacMilan Publishing Company出版,专门出版,专门报导未来两年内将要召开的国际学术会议信息。报导未来两年内将要召开的国际学术会议信息。2.2.1 信息资源的数量和来源信息资源的数量和来源n研究报告的数量随着科技和经济的发展而迅速增研究报告的数量随着科技和经济的发展而迅速增长,长,19451950年间年全世界的产量在年间年全世界的产量在7500100000件之间,件之间,20世纪世纪70年代增至每年年代增至每年50万件,万件,80年代每年略有增加。年

17、代每年略有增加。n在我国,中国科学技术情报研究所是收藏国外学在我国,中国科学技术情报研究所是收藏国外学位论文较多的单位。北京图书馆收藏了位论文较多的单位。北京图书馆收藏了1983年由年由美国友好书刊基金会赠送的美国美国友好书刊基金会赠送的美国1938-1977年博年博士论文的缩微胶卷。士论文的缩微胶卷。1986年,清华大学订购了美年,清华大学订购了美国部分著名大学,如麻省理工学院(国部分著名大学,如麻省理工学院(1983年以来年以来的)、加利福尼亚大学伯克利分校、斯坦福大学的)、加利福尼亚大学伯克利分校、斯坦福大学(1984年以来某些系的)博士论文的缩微平片。年以来某些系的)博士论文的缩微平片

18、。中国学位论文通报中国学位论文通报是我国自然科学类学位论是我国自然科学类学位论文的权威性检索工具,文的权威性检索工具,1985年创刊。年创刊。2.2.1 信息资源的数量和来源信息资源的数量和来源6.数据资源的数量和来源数据资源的数量和来源n数据资源数量非常庞大,而且增长迅猛,所以很数据资源数量非常庞大,而且增长迅猛,所以很难统计。据查,世界性的,国家或地区性的,学难统计。据查,世界性的,国家或地区性的,学科或专业性的数据量统计,都很难获得。据报道,科或专业性的数据量统计,都很难获得。据报道,截止截止2004年年10月底,我国大陆科学数据库数据资月底,我国大陆科学数据库数据资源建设已建成专业数据

19、库源建设已建成专业数据库388个,总数据量达个,总数据量达13TB。目前,科学数据库分布在各地的网站。目前,科学数据库分布在各地的网站42个,个,上网专业库上网专业库322个,网上可查询数据量达个,网上可查询数据量达7.7TB,通过通过Internet提供共享服务。提前一年超额完成提供共享服务。提前一年超额完成了了“十五十五”期间数据资源达到期间数据资源达到10TB的建设任务。的建设任务。经济和社会生活领域产生的数据量更加庞大。经济和社会生活领域产生的数据量更加庞大。2.2.1 信息资源的数量和来源信息资源的数量和来源n科学数据的来源一般是科研机构、科学数据中心、科学数据的来源一般是科研机构、

20、科学数据中心、以网络或其他方式提供的科学数据库等。经济和以网络或其他方式提供的科学数据库等。经济和社会统计数据的主要来源有:行业协会、公司、社会统计数据的主要来源有:行业协会、公司、银行、交易所、经纪人、政府部门和国际组织、银行、交易所、经纪人、政府部门和国际组织、独立的调查机构、市场研究机构、数据汇编机构、独立的调查机构、市场研究机构、数据汇编机构、出版商、媒体、非营利性组织、大学、研究中心出版商、媒体、非营利性组织、大学、研究中心等以及它们的网站。行业和一般的商业数据主要等以及它们的网站。行业和一般的商业数据主要来自政府统计部门、国际统计机构、政府调查资来自政府统计部门、国际统计机构、政府

21、调查资料、政府行政管理档案、市场调研报告和行业报料、政府行政管理档案、市场调研报告和行业报告、经济分析师报告、银行报告、新闻报道、贸告、经济分析师报告、银行报告、新闻报道、贸易类期刊。经济数据和财政数据主要来自银行、易类期刊。经济数据和财政数据主要来自银行、信贷机构、保险公司、基金管理公司、政府经济信贷机构、保险公司、基金管理公司、政府经济普查机构、媒体、面谈调查等渠道。普查机构、媒体、面谈调查等渠道。2.2.2 信息采集原则信息采集原则信息采集信息采集是指通过各种方式获取所需要的信息,是信是指通过各种方式获取所需要的信息,是信息资源有效管理和利用的第一步,也是关键的一步。为息资源有效管理和利

22、用的第一步,也是关键的一步。为了保证信息采集的质量,应坚持以下原则:了保证信息采集的质量,应坚持以下原则:n1.系统性原则系统性原则n2.针对性原则针对性原则n3.及时性原则及时性原则n4.可靠性原则可靠性原则n5.方便、经济的原则方便、经济的原则n6.计划性原则计划性原则n7.预见性原则预见性原则2.2.3 信息采集策略信息采集策略1.定向采集与定题采集定向采集与定题采集2.单向采集与多向采集单向采集与多向采集3.主动采集与跟踪采集主动采集与跟踪采集4.建立信息网络建立信息网络5.利用互联网进行信息采集利用互联网进行信息采集6.严格管理与激励措施相结合严格管理与激励措施相结合2.2.4 采集

23、方式采集方式 1.文献型信息资源的采集文献型信息资源的采集购买、交换、接受、征集、申请、复制、网络搜索购买、交换、接受、征集、申请、复制、网络搜索2.实物型信息资源的采集实物型信息资源的采集3.鲜活型信息资源的采集鲜活型信息资源的采集交谈、采访、社会调查等交谈、采访、社会调查等4.数据的采集数据的采集 观察、实验、检测、考察、调查、统计、检索、普观察、实验、检测、考察、调查、统计、检索、普查和科学研究等查和科学研究等2.2.5 新的采集技术新的采集技术n1.全自动电话访谈全自动电话访谈n2.交互式计算机辅助电话访谈交互式计算机辅助电话访谈n3.电脑柜调研电脑柜调研n4.网络调研系统网络调研系统

24、2.3 信息组织信息组织2.3.1 信息表示概述信息表示概述信息表示:信息表示:1.信息表示的来源信息表示的来源 信息从创建到传播利用的每一个阶段都可能产信息从创建到传播利用的每一个阶段都可能产生不同形式的信息表示。生不同形式的信息表示。2.3.2 信息表示概述2.信息表示的生成方法信息表示的生成方法n派生法派生法,是指信息表示直接来自对象信息集合自身,利用,是指信息表示直接来自对象信息集合自身,利用某些识别和分析技术,从对象信息集合中提取出可用于信某些识别和分析技术,从对象信息集合中提取出可用于信息组织和检索的语词符号或其他特征标识。传统的派生法息组织和检索的语词符号或其他特征标识。传统的派

25、生法又称为关键词索引法、自动抽词标引或派生式标引。不同又称为关键词索引法、自动抽词标引或派生式标引。不同的对象信息有不同的特征,所以其特征信息的识别和提取的对象信息有不同的特征,所以其特征信息的识别和提取方法也不同。方法也不同。n指派法指派法,是指信息表示来自对象信息的外部,由信息加工,是指信息表示来自对象信息的外部,由信息加工处理者在对信息内容进行分析的基础上;考虑其潜在用户处理者在对信息内容进行分析的基础上;考虑其潜在用户的知识结构,参考社会的公共知识结构,确定要揭示的信的知识结构,参考社会的公共知识结构,确定要揭示的信息内容属性及表示方式,直至把标识(如标引词、分类号)息内容属性及表示方

26、式,直至把标识(如标引词、分类号)赋予对象信息的过程。赋予对象信息的过程。2.3.2 信息表示语言信息表示语言1.置标语言置标语言 置标语言(置标语言(Markup Language)由一些代码()由一些代码(codes)或控制标记(或控制标记(tags)组成,这些代码或控制标记本身若单独)组成,这些代码或控制标记本身若单独存在是无意义的,它们必须结合文件信息后才能形成一份有存在是无意义的,它们必须结合文件信息后才能形成一份有用的电子文件,而所谓有用的电子文件是针对应用软件来说用的电子文件,而所谓有用的电子文件是针对应用软件来说的,即应用软件能够解读电子文件中的置标语言,并通过置的,即应用软件

27、能够解读电子文件中的置标语言,并通过置标语言的意义对电子文件进行特定的处理。标语言的意义对电子文件进行特定的处理。置标语言不同于一般的控制流程序设计语言,基本上可置标语言不同于一般的控制流程序设计语言,基本上可以被视为是一种数据流的文档结构描述语言。在计算机处理以被视为是一种数据流的文档结构描述语言。在计算机处理过程中,置标语言的标记既可以作为数据,也可以作为控制过程中,置标语言的标记既可以作为数据,也可以作为控制语句来使用。置标语言的产生有多种因素:信息交换语句来使用。置标语言的产生有多种因素:信息交换(Information Exchange)与信息再利用()与信息再利用(Informat

28、ion Reuse)问题。)问题。2.3.2 信息表示语言信息表示语言n置标置标就是给文档中某些具有特殊含义的部分加上标记的过就是给文档中某些具有特殊含义的部分加上标记的过程程 ,置标的符号就是该过程的具体实现。置标的符号就是该过程的具体实现。n在在 20 20 世纪世纪 80 80 年代早期,年代早期,IBM IBM 设计了一种文档系统设计了一种文档系统 ,通通过在文档中附加一些标签过在文档中附加一些标签 ,从而可以标识文档中的各种元从而可以标识文档中的各种元素。素。IBM IBM 把这样的标记语言称为通用置标把这样的标记语言称为通用置标 语语 言言 (Generalized markup

29、Language,GML)(Generalized markup Language,GML)。n1986 1986 年国际标准化组织认为年国际标准化组织认为 IBMIBM提出的概念很好提出的概念很好 ,并发并发布了为生成标准化文档而定义的标识语言标准布了为生成标准化文档而定义的标识语言标准 ,称为标准称为标准通用置标语言通用置标语言 (Standard Generalized Markup(Standard Generalized Markup Language,SGML)Language,SGML)。SGML:SGML 是是 ISO 在在 1986 年所制定的描述文档资料的结年所制定的描述文

30、档资料的结构与内容、实现文档交换和共享的国际标准。它是数据描述、构与内容、实现文档交换和共享的国际标准。它是数据描述、数据模型化和数据交换的标准数据模型化和数据交换的标准,同时又是一种元语言同时又是一种元语言,元语元语言是一套可以用来定义其它更专门性的标记语言的通用规则。言是一套可以用来定义其它更专门性的标记语言的通用规则。普通的普通的 SGML 文档一般由三部分组成文档一般由三部分组成:SGML 声明、文声明、文档类型定义及档类型定义及 SGML 文档实例。文档实例。SGML 声明定义文档使用声明定义文档使用的语言集、参考语法规则、的语言集、参考语法规则、SGML 可选特性等可选特性等;文档

31、类型定文档类型定义义(DTD)描述文档的结构模板、逻辑框架结构以及元素的属描述文档的结构模板、逻辑框架结构以及元素的属性等性等,它确定文档类别、规定文档结构规则、列出文档实例它确定文档类别、规定文档结构规则、列出文档实例中所允许的全部元素及其次序中所允许的全部元素及其次序;SGML文档实例是文档内容文档实例是文档内容的主要部分的主要部分,由许多元素及元素的正文按由许多元素及元素的正文按 DTD 规定的框架规定的框架结构组织而成。结构组织而成。SGML的优点:的优点:n灵活性灵活性 q在在 SGML 中中,置标是不固定的置标是不固定的,用户可以根据自己的理用户可以根据自己的理解来添加置标解来添加

32、置标,可以用置标来标识结构非常复杂的文档。可以用置标来标识结构非常复杂的文档。SGML 能描述任何的信息结构与任何复杂的文件能描述任何的信息结构与任何复杂的文件,其应其应用可以简单如用可以简单如 HTML,也可以复杂得像也可以复杂得像 TEI、EAD、CIMI。n通用性通用性 qSGML与平台独立与平台独立,与系统独立与系统独立,不属于特定的平台和特不属于特定的平台和特定的应用系统。可以在不兼容的系统直接进行数据交换。定的应用系统。可以在不兼容的系统直接进行数据交换。避免数据交换中的信息遗失避免数据交换中的信息遗失,撰写的文档能够长久保存。撰写的文档能够长久保存。n信息的再利用性信息的再利用性

33、 qSGML 文件的内文件的内 容容 可可 以以 重重 复复 利利 用用,或或 者者 被被 其其 它它 的的SGML 文件使用文件使用,不须重新产生内容。同一份文件内容不须重新产生内容。同一份文件内容也可以通过不同的也可以通过不同的 DTD 来定义来定义,用不同的样式表呈现出用不同的样式表呈现出来。来。SGML的局限性:的局限性:n 应用程序不易开发。应用程序不易开发。n SGML 文件不易在文件不易在 Web 上传播。要想传送上传播。要想传送 SGML 文文件件,必须有特定的必须有特定的 DTD 和样式表。和样式表。n 缺乏商家的支持。缺乏商家的支持。HTMLn1989 年年,欧洲粒子物理研

34、究中心使用欧洲粒子物理研究中心使用 SGML 的一个语法的一个语法,以一个以一个 DTD 为基础为基础,开发了开发了 HTML。n HTML 创造出来的文件可在不同的操作平台间移动。可移创造出来的文件可在不同的操作平台间移动。可移植性与简易性是植性与简易性是 HTML 的两大特征。的两大特征。n HTML 标签指明浏览器应该怎样显示文献。通常标签指明浏览器应该怎样显示文献。通常,HTML 标签有两部分标签有两部分,一个标头和一个标尾一个标头和一个标尾,其中含有被定义的文献。其中含有被定义的文献。然而然而,有时标尾是不被要求的。有时标尾是不被要求的。HTML 文献结构包含头标区、文献结构包含头标

35、区、主体区及元素。头标区含有一个标题和其它信息。主体区含主体区及元素。头标区含有一个标题和其它信息。主体区含有正文、图象和链接。有正文、图象和链接。HTML的特点:的特点:n HTML 的的DTD 设计主要是满足网上显示的需求。许多设计主要是满足网上显示的需求。许多标签纯粹是用来指定网页的显示细节标签纯粹是用来指定网页的显示细节,例如例如:br 是换行是换行;hr 是画一条平行线是画一条平行线;b 表示粗体字。表示粗体字。n HTML 有内建的样式有内建的样式(style)。这使得。这使得 H TM L 更为简更为简单易用单易用,但缺点是灵活性差但缺点是灵活性差,同样的文件内容只能设定一同样的

36、文件内容只能设定一种显示样式。种显示样式。n HTML 引用引用 SGML 的标记最简化特征。这是为了尽量的标记最简化特征。这是为了尽量减少减少 HTML 文件标记的数量文件标记的数量,使使H TM L 的标记更简单。的标记更简单。n HTML 没有采用没有采用 SGML 的超链接机制。的超链接机制。H TM L 的超链的超链接是利用标签接是利用标签 的的“href”属性来指向属性来指向W eb 上的任意上的任意文件。文件。HTML的局限性:的局限性:n结构方面:结构方面:HTML 最大的局限就是它的标签集是固定的最大的局限就是它的标签集是固定的,而这些标签主要用来指定网页的显示格式而这些标签

37、主要用来指定网页的显示格式,这个特性使这个特性使得得HTML 只能支持固定、简单的文件结构只能支持固定、简单的文件结构,而且在信息而且在信息再利用、资料交换与机读方面都存在很大的局限。再利用、资料交换与机读方面都存在很大的局限。n在信息的利用方面:统一内容要实现不同的呈现形式需在信息的利用方面:统一内容要实现不同的呈现形式需要有不同的要有不同的Web 版本版本。n信息的交换方面:无法支持精确查询。信息的交换方面:无法支持精确查询。n维护方面:维护方面:HTML 的不断修订增加了许多网站额外的维的不断修订增加了许多网站额外的维护工作。护工作。n XML简介:简介:qXML 是是W3C 在在 19

38、96 年底提出的标准年底提出的标准,它是从它是从 SGML 衍生出来的简化格式衍生出来的简化格式,也是一种元语言也是一种元语言,可以用来定义任可以用来定义任何一种新的标记语言。何一种新的标记语言。qXML是一种可以用于是一种可以用于Web上的标准的、可扩展的数据上的标准的、可扩展的数据格式描述语言。它可以描述各种各样结构的信息,使得格式描述语言。它可以描述各种各样结构的信息,使得用它表示的数据信息可以很方便地被不同的数据使用者用它表示的数据信息可以很方便地被不同的数据使用者使用。使用。XML的出现使得网上数据的使用效率大大地提高。的出现使得网上数据的使用效率大大地提高。XML的优点的优点:n灵

39、活性灵活性:qXML 的灵活性表现在两个方面的灵活性表现在两个方面:一是一是 XML文档也是纯文文档也是纯文本文件本文件,同同 HTML 一样一样,各种编各种编 辑辑 工工 具具 创创 建建 的的 XML 文文 档档 都都 能能 被被WWW 浏览器所显示浏览器所显示;二是二是 XML 允许自定义标允许自定义标签签,这种优势使得这种优势使得 HTML 应用无法与应用无法与XML 的应用相比。的应用相比。n开放性:开放性:qXML 所采用的标准技术在所采用的标准技术在 Web 上是完全开放的上是完全开放的,可以免可以免费获得。费获得。W3C 组织的成员已经较早地得到了这些标准组织的成员已经较早地得

40、到了这些标准,不不过一旦此标准完成了过一旦此标准完成了,结果就是大家都可获得的。结果就是大家都可获得的。XML 文文档自身也较为开放档自身也较为开放,任何人都可以对一个结构良好的任何人都可以对一个结构良好的 XML 文档进行语法分析文档进行语法分析,如果提供了如果提供了DTD,还可以校验这个文档。还可以校验这个文档。n良好的扩展性良好的扩展性 :qXML 在两个意义上是可扩展的。首先在两个意义上是可扩展的。首先,它允许开发者创它允许开发者创建他们自己的建他们自己的DTD,有效地创建可被用于多种应用的有效地创建可被用于多种应用的“可可扩展的扩展的”标签集。其次标签集。其次,使用几个附加的标准使用

41、几个附加的标准,您可以对您可以对XML 进行扩展进行扩展,这些附加标准可以向核心的这些附加标准可以向核心的XML 功能集功能集增加样式、链接和参照能力。增加样式、链接和参照能力。n强大的超链接机制强大的超链接机制:q XML除了支持象除了支持象HTML的简单链接以外,还提供了两种的简单链接以外,还提供了两种更为强大的超链接机制;更为强大的超链接机制;X link和和X pointer;其中,其中,X Link完全支持现有的完全支持现有的Web的的URL链接格式,链接格式,X Pointer则则允许利用文件的结构定址,这一点与允许利用文件的结构定址,这一点与HTML有很大不同,有很大不同,HTM

42、L的文件内部超链接必须指定文件中的绝对位置,一的文件内部超链接必须指定文件中的绝对位置,一旦文件内容改变,通常必须更新链结。旦文件内容改变,通常必须更新链结。X Pointer;利用文利用文件结构来定址所指定的是相对位置,只要文件结构没有件结构来定址所指定的是相对位置,只要文件结构没有改变,就算内容改变了也不会影响链接改变,就算内容改变了也不会影响链接 XML局限性:局限性:n信息的再利用性较差。信息的再利用性较差。三、三、SGML、HTML 和和 XML 的比较的比较 nHTML 是是 SGML 的的 应应 用用,XML 是是SGML 的一个子集。的一个子集。HTML 和和 XML 都是由一

43、个固定的都是由一个固定的 SGML 定义和一个定义和一个 DTD 定义组成。定义组成。XML 不像不像 HTML 只有内建的样式只有内建的样式,XML 提供了样式表标准提供了样式表标准,称为可扩展样式语言。称为可扩展样式语言。XML 除了支除了支持像持像 HTML 的简单链接的简单链接,也提供了几种功能更强大的超也提供了几种功能更强大的超链接机制预算链接机制预算2.3.2 信息表示语言信息表示语言2.元数据元数据n 元数据是关于数据的有结构的数据,或者定义和描述其元数据是关于数据的有结构的数据,或者定义和描述其它数据的数据。本质上说,元数据(它数据的数据。本质上说,元数据(Metadata)是

44、一种数)是一种数据结构标准。元数据据结构标准。元数据(Metadata)是随着因特网上海量和迅速是随着因特网上海量和迅速增长的信息资源和传统的资源组织方式的局限性,而成为人增长的信息资源和传统的资源组织方式的局限性,而成为人们关注的焦点的。们关注的焦点的。2.3.2 信息表示语言信息表示语言根据其功能,元数据可以被划分成三种基本类型:根据其功能,元数据可以被划分成三种基本类型:n知识描述型元数据:用来描述、发现和鉴别数字化信息知识描述型元数据:用来描述、发现和鉴别数字化信息对象,如对象,如MARC等。等。n结构型元数据:用来描述数字化信息资源的内部结构。结构型元数据:用来描述数字化信息资源的内

45、部结构。比前者更侧重于数字化信息资源的内在的形式特征,如目比前者更侧重于数字化信息资源的内在的形式特征,如目录、章节、段落等特征。录、章节、段落等特征。n存取控制型元数据:用来描述数字化信息资源能够被利存取控制型元数据:用来描述数字化信息资源能够被利用的基本条件和期限,以及指示这些资源的知识产权特征用的基本条件和期限,以及指示这些资源的知识产权特征和使用权限。和使用权限。2.3.2 信息表示语言信息表示语言3.都柏林核心元数据格式都柏林核心元数据格式(DC)nDC元数据格式是通过举办一系列研讨会的形式发展元数据格式是通过举办一系列研讨会的形式发展起来的,第一次研讨会于起来的,第一次研讨会于19

46、95年年3月在美国俄亥俄州月在美国俄亥俄州的都柏林举办。这些研讨会和会后相关的工作最终产的都柏林举办。这些研讨会和会后相关的工作最终产生了由生了由Weibel等人于等人于1998年提出的一个精简的元数年提出的一个精简的元数据集据集都柏林核心元素集都柏林核心元素集(Dubiln Metadata Core Elements Set),简称都柏林核心元数据(,简称都柏林核心元数据(DC)。)。2.3.2 信息表示语言信息表示语言nDC元数据所包含的三个大类十五个要素,可基本元数据所包含的三个大类十五个要素,可基本揭示信息资源的特征。第一大类为描述资源内容的揭示信息资源的特征。第一大类为描述资源内容

47、的要素;第二大类为描述知识产权的要素;第三大类要素;第二大类为描述知识产权的要素;第三大类为描述资源外部属性的要素。为描述资源外部属性的要素。DC的创制为专业或非的创制为专业或非专业编目人员、网络信息创编者提供一个简单、实专业编目人员、网络信息创编者提供一个简单、实用而又有效的信息描述工具。用而又有效的信息描述工具。DC元数据所包含的十五个要素元数据所包含的十五个要素n(1)题名()题名(Title):资源的名称,通常由创作者或出版者):资源的名称,通常由创作者或出版者赋予。赋予。n(2)著者或创作者()著者或创作者(Author or Creator):对于创建资):对于创建资源的知识内容负

48、有主要责任的个人或组织,如文献的作者、源的知识内容负有主要责任的个人或组织,如文献的作者、视觉资源的艺术家、摄影师或插图绘画者。视觉资源的艺术家、摄影师或插图绘画者。n(3)主题词和关键词()主题词和关键词(Subject and Keywords):表示):表示资源主题内容的单词或词组。属于主题编目的范围,见下面资源主题内容的单词或词组。属于主题编目的范围,见下面的主题标引小节。的主题标引小节。n(4)描述()描述(Description):资源内容的文本描述,如文):资源内容的文本描述,如文献的文摘、视觉资源的内容描述等。献的文摘、视觉资源的内容描述等。n(5)出版者()出版者(Publi

49、sher):负责使资源能够以现有形式):负责使资源能够以现有形式获得的实体,如出版社、大学里的部门或社团实体。获得的实体,如出版社、大学里的部门或社团实体。DC元数据所包含的十五个要素元数据所包含的十五个要素n(6)其他贡献者()其他贡献者(Other Contributor):在创作者):在创作者(Creator)项中未指明的、对资源作出了重要贡献,但其)项中未指明的、对资源作出了重要贡献,但其贡献次于创作者项中指明的个人或组织所做的贡献的其他个贡献次于创作者项中指明的个人或组织所做的贡献的其他个人或组织(如编者、转录者和说明者)。人或组织(如编者、转录者和说明者)。n(7)日期()日期(D

50、ate):与资源的创建或可获得性相关的日期。):与资源的创建或可获得性相关的日期。n(8)资源类型()资源类型(Resource Type):资源的种类,如网页、):资源的种类,如网页、小说、诗歌、工作报告、技术报告、散文和词典。小说、诗歌、工作报告、技术报告、散文和词典。n(9)形式或格式()形式或格式(Format):资源的数据形式和尺寸):资源的数据形式和尺寸(如大小、持续时间,可选择)。(如大小、持续时间,可选择)。n(10)资源标识符()资源标识符(Resource Identifier):用来唯一标):用来唯一标识资源的字符串或数字,如识资源的字符串或数字,如URL和和URN。n(

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(信息资源管理中的内容管理文稿教学课件.ppt)为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|