1、1 文物数字化的背景、定义、意义文物数字化的背景、定义、意义2 文物数字化的关键技术文物数字化的关键技术 3 文物数字化应用系统组成文物数字化应用系统组成4 文物数字化应用系统的关键技术文物数字化应用系统的关键技术5 文物数字化应用项目文物数字化应用项目6 讨论讨论北京理工大学软件学院数字图书馆实验室 1.1 文物数字化的定义定义 1.2 文物数字化的背景及意义北京理工大学软件学院数字图书馆实验室 利用最新的数字技术如数字化扫描、摄影、数字化编辑、三维动画、虚拟现实以及网络等再现、保存、传播文物,对文物进行数字化加工处理;涉及多学科的技术北京理工大学软件学院数字图书馆实验室计算机网络、通信、计
2、算机等技术的计算机网络、通信、计算机等技术的发展提供了发展基础发展提供了发展基础是文物保护、保存、文化传播的需要是文物保护、保存、文化传播的需要 *文物的唯一性、不可共享和不可再生性相比;文物的唯一性、不可共享和不可再生性相比;*数字化的文物信息是无限的、可共享的、可再生的数字化的文物信息是无限的、可共享的、可再生的 是是NII建设的重要组成部分,急需大规建设的重要组成部分,急需大规模有严密组织的信息资源库模有严密组织的信息资源库北京理工大学软件学院数字图书馆实验室360 Million用户用户 综综 合合数字图书馆数字图书馆Tiny(小型)(小型)Moderate(中型)中型)Immense
3、(巨型)巨型)Content Scale(内容规模)(内容规模)Distribution(地域范围)地域范围)Wide Area(广域广域)Regional(区域)区域)(本地)(本地)LocalHours/Days(数时(数时/数天)数天)Months/Years(数月(数月/数年)数年)Decades/Centuries(数世纪)数世纪)/(数十年(数十年)GeneralDigitalLibraryGlobalDesignDecisionNetworkLocalDesignDecisionNetwork应急管理应急管理知识网络知识网络 全全 球球决策网络决策网络 本本 地地决策网络决策网络
4、Lifetime(生命周期)(生命周期)美国美国NFS(国家科学基金会)关于知识联网的白皮书附图(国家科学基金会)关于知识联网的白皮书附图.图像拍摄技术、扫描技术2.2 虚拟现实2.数字对象表示2.数字化加工编辑处理技术 北京理工大学软件学院数字图书馆实验室 选择感光材料的传统相机为主,或数码相机 图像信息的数字化非数字化的图像经过光学信号转变成数字信号再存入计算机;分辩率和色深度是图像信息化的两个主要技术指标 提高图像的分辩率和突出主题是文物的要点 扫描仪 虚拟现实技术是20世纪末发展起来的一门涉及众多学科的高新技术,从本质上说是一种先进的计算机用户接口技术,给用户提供视觉,听觉,触觉,嗅觉
5、,味觉等各种直观而又自然的实时感知交互手段。Virtual Reality Markup Language 1994年3月在日内瓦召开的第一届WWW大会上,首次正式提出了VRML这个名字。1994年10月在芝加哥召开的第二届WWW大会上公布了规范的VRML1.0草案。2019年8月在新奥尔良召开的优秀3D图形技术会议-Siggraph96上公布通过了规范的VRML2.0第一版。它在 VRML1.0的基础上进行了很大的补充和完善。2019年12月VRML作为国际标准正式发布,2019年1月正式获得国际标准化组织ISO批准简称VRML97。VRML97只是在VRML2.0基础进行上进行了少量的修正
6、。2019年。VRML组织把自己改名为Web3D组织,同时制订了一个新的标准,Extensible 3D(X3D),到了2000年春天,Web3D组织完成了VRML到X3D的转换。X3D整合正在发展的XML、JAVA、流技术等先进技术,包括了更强 大、更高效的3D计算能力、渲染质量和传输速度。VRML文件描述的基于时间的三维空间称为虚拟境界(Virtual World),它由对象构成,而对象及其属性用节点描述,节点是VRML的基本单元。每个节点由类型、域、事件、实现、名字组成,节点按一定规则构成场景图(Scenegraph)。存在感。多感知性。交互性。动态显示。立体感的视觉与听觉效果。脚本功能
7、。数字信息管理的基本术语:1 数字对象:数字信息库中表示信息的基本逻辑单位。如文章,图片,一部音乐作品。2 元数据:描述对象实体的信息。元数据中可包含数字对象的唯一句柄。数字对象头数字对象体A1A2A3An元数据句柄 数字资源加工主要涉及元数据标准的制定与资源的元数据加工、工业化的OCR技术、自动标引、自动文摘、知识概念体系、网上资源的获取与处理、数据压缩、数字版权的管理等。北京理工大学软件学院数字图书馆实验室 建立元数据标准和规范:建立元数据标准和规范:提高数字资源的可访问性和可检索性;为搜索结果提供更加有效的关联度排序;作为某些资源的替代品,如需要花费大量时间下载或浏览的大型文件,需要进行
8、解释才能理解的原始数据,甚至某些无法以电子方式获得的资源;有助于解决知识产权的辨认、跟踪和管理问题。工业化的工业化的OCR技术:技术:为完成大批量的数字化工作,需要可靠的不依靠人工校对的图像处理和OCR技术,该技术要支持汉字大字符集下的工业化扫描和识别,其识别精确度要在99.99%以上。自动标引、自动文摘生成、自动篇名生成自动标引、自动文摘生成、自动篇名生成技术:技术:以现有的主题和分类词表为基础,具有自学习的能力,学习成熟人员的经验,为标引人员自动生成或辅助生成主题和分类,并对人工标引进行必要的校对。同时,要求具有智能化的自动文摘生成技术及自动篇名生成技术来大批量地生成文摘数据和篇名数据。知
9、识概念体系:知识概念体系:建立基于人工智能知识表达的知识概念体系,提供智能化的信息服务。Web挖掘技术:挖掘技术:Web内容的挖掘是对Web中包含的文本、图像、视频等数据元素进行挖掘;Web结构的挖掘是从Web的链结构中发现知识;Web使用的挖掘是追随用户对Web页的交互和操纵,从中挖掘出有价值的用户存取模式。北京理工大学软件学院数字图书馆实验室 多媒体挖掘技术:多媒体挖掘技术:基于多媒体的内容特性以及这些特性相关的语义,从大型多媒体数据集(不仅仅是多媒体数据库)中发现和分析出隐含的、有效的、有价值的、可理解的模式,使多媒体的处理和管理从信息存取上升到知识获取层次,使多媒体内容的利用达到新的高
10、度。北京理工大学软件学院数字图书馆实验室 压缩、解压缩技术:压缩、解压缩技术:在数字资源的建设与使用的过程中,资源的加工必须是一次性的,而经过加工的资源应适应多种不同的用途。数字版权管理技术:数字版权管理技术:通过对数字资源进行处理,有效地管理所有数字资源内容的知识产权,其中包括文字、图像、音频、视频等各种形式的数字对象。综合运用各种加密手段保证数字对象在网络传输过程中的安全,并建立网上授权认证机制,防止传播中的数字资源被非法使用,同时与精确的计费功能结合,提供安全可靠的信息交易平台。数字版权管理技术:数字版权管理技术:通过对数字资源进行处理,有效地管理所有数字资源内容的知识产权,其中包括文字
11、、图像、音频、视频等各种形式的数字对象。综合运用各种加密手段保证数字对象在网络传输过程中的安全,并建立网上授权认证机制,防止传播中的数字资源被非法使用,同时与精确的计费功能结合,提供安全可靠的信息交易平台。3.1文物数字化应用系统文物数字化应用系统定义3.2数字资源管理系统模型3.3文物数字化应用系统体系结文物数字化应用系统体系结构构 根据需求不同,文物数字化应用系统定义多根据需求不同,文物数字化应用系统定义多样样 本报告讨论的是一种具有开放式体系结构的、本报告讨论的是一种具有开放式体系结构的、有组织管理的网络数字文物藏品系统及信息有组织管理的网络数字文物藏品系统及信息服务系统;服务系统;它支
12、持大范围、分布式的数字化文物的信息它支持大范围、分布式的数字化文物的信息服务,用户可在网络上横跨异构的支持知识服务,用户可在网络上横跨异构的支持知识关联的文物资源库,高效访问以多种数字格关联的文物资源库,高效访问以多种数字格式存储在其中的多媒体知识信息。式存储在其中的多媒体知识信息。支持基于局域、互连网的服务支持基于局域、互连网的服务 与其它应用系统或资源库的关连与其它应用系统或资源库的关连元数据服务器对象数据服务器内容管理WEB PORTAL用户权限认证收费管理Web客户端管理工具存储管理北京理工大学软件学院数字图书馆实验室存储与调度库数字资源管理体系用户信息服务体系数字资源建设体系存储与调
13、度库数字资源管理体系用户信息服务体系数字资源建设体系资源创建互连网资源元数据结构定义用户管理数据加工加工资源库用户管理数据加工加工资源库调度注册数据装入数据输入输出XML文件调度注册数据装入数据输入输出XML文件调度库发布资源库调度库发布资源库抓取整理加工文献数字化资源原有资源库标引整合构成子系统用户界面数字化资源加工系统数字信息的存储管理资源调度系统信息访问和查询安全认证版权保护 用户界面1 为用户服务的界面浏览器:与用户交互作用客户服务:浏览器与系统其它部份的中介服务。2 为系统管理员提供的界面。q 数字化资源加工系统1、对文本、图像、音频和视频等信息的数字化采集,加工,处理。2、实现信息
14、资源的一次加工,多次使用。3、信息的表示格式与对系统升级的影响如一幅图像的表示:高分辨率;中分辨;低分辨;元数据q 数字化资源加工系统4、数字化标准 XML/SGMLSGML:标准通用标识语言XML:可括充的标识语言XML工具软件:编译,转换,编辑等5、从MARC到DC的辅助转换数字信息的存储管理实现对所有数据的存储管理,包括标准化的元数据和数字对象的存储格式、存储协议、元数据和对象数据的一致性、分布环境下数据的查询 数字信息的存储管理 LAN/WAN/INTERNET图书馆服务器对象服务器客户 数字信息的存储管理异地存储技术更新 资源调度系统1、建立统一的资源命名规则2、建立调度机制3、为资
15、源加工和用户服务提供调度服务功能信息查询系统 查询界面匹配系统/搜索引擎信息库信息库信息库信息查询系统1、统一检索功能:采取单一界面实现数据的统一检索。2、检索结果的显示过滤功能;信息选择,复杂检索功能;对多数据库的检索功能(结果合并等)3、影像数据的检索 对影像数据进行详细检索的功能。信息查询系统4、人工标引,自动标引,半自动标引,标引转换生成5、多语言处理系统6、自然语言处理,基于语义的检索分类安全认证1、用户身份认证2、访问权限认证版权保护软件系统实现基于分布式环境下垮单位垮库环境下的版权保护和电子商务系统。登记;认证;记费;结算分布式有偿服务的记费模型4.1 数字资源加工编辑相关技术数
16、字资源加工编辑相关技术4.2 应用平台和资源管理应用平台和资源管理4.3 用户服务相关技术用户服务相关技术4.4 应该遵循的相关标准规范应该遵循的相关标准规范见提供对数字资源的管理和开发利用,是为用户提供各种信息与知识服务的后台系统。检索技术:检索技术:包括纯文本的全文检索、概念检索、图像检索、视频检索、音频检索技术等。智能型全文检索技术。智能型全文检索技术。主要解决跨地区、跨数据库的信息资源检索问题。检索软件应该能够根据用户的信息需求,帮助用户分析和制定检索策略,并能智能化地在不同地点、不同数据库中进行搜索,将用户所需信息准确地检索显示出来。命名系统:命名系统:系统中的资源需要具备一个长期的
17、、全球唯一的、独立于地址的标识名,以便于用户对资源的检索。资源调度技术:资源调度技术:主要负责从唯一的资源名到资源的网络地址的解析过程。多媒体处理技术:多媒体处理技术:适于网络传输、多媒体的检索。系统的互操作技术:系统的互操作技术:通过元数据的互操作,促进资源的共享;通过中间件、Agent以及Web Services解决分布式异构系统之间的互操作。数字化信息资源管理技术:数字化信息资源管理技术:主要解决信息资源数字化后海量信息的存储和管理问题,一方面要保证海量信息存储有序,另一方面还要保证不影响信息的读取速度和效果。l 水印技术与密钥技术:水印技术与密钥技术:通过这种技术将对数字资源进行有效的
18、知识产权保护。主要涉及人机交互方面的技术,为用户提供简单、便捷、灵活的友好界面。多语言技术:多语言技术:要保证系统支持多语言技术,同时为满足更大范围的用户的需求,系统要通过机器翻译、多语言浏览等功能为用户提供跨语言的支持。个性化定制服务技术:个性化定制服务技术:根据不同用户的不同需求,向他们提供个性化界面,以便高效、准确的知识服务。北京理工大学软件学院数字图书馆实验室 ISO 10646 信息技术通用多个8比特编码字符集使用场所:底层数据编码标准,采用Unicode 4.0标准 ISO 14721/OAIS 空间数据和信息传送系统开放档案信息系统参考模型使用场所:数字资源组织、管理、预发布参考
19、模型 ISO 15836 信息和文档都柏林核心元数据元素集 Open Archives Initiative 用于元数据收获的开放档案主动协议使用场所:不同系统元数据收获处理北京理工大学软件学院数字图书馆实验室Z39.87数据字典对于数字静止图象的技术元数据使用场所:数字图书馆系统中,数字静止图象加工技术元数据参考Z39.88对于关系敏感服务的开放唯一资源定位的框架GB2312/GB18030 国家中文信息编码标准使用场所:系统中,表现层信息编码中图分类法:中图分类法:中国国家图书馆分类方法使用场所:数据分类规范,数据检索开关控制,参加关联检索北京理工大学软件学院数字图书馆实验室 Adobe
20、PDF使用场所:电子文档表现格式,插件需要嵌入在标准浏览器中 中文图书主题规范数据中文图书主题规范数据/中文图书名称规范数据中文图书名称规范数据/题名规范题名规范/著者规范著者规范/地名规范地名规范/团体单位名称规范数据:团体单位名称规范数据:知识库体系规范数据 其他主流流媒体格式:其他主流流媒体格式:主流的asf、mpeg、wav、mp3、rm等格式使用场所:系统中,用于流媒体数据对象格式或者流媒体转换格式,流媒体表现格式,插件需要嵌入在标准浏览器中 应该遵守W3C、ISO、GB相应的标准和规范;应该参考相关的计算机、网络、安全、信息、软件设计等的标准规范。北京理工大学软件学院数字图书馆实验
21、室 美国:美国:英国英国 法国法国 其他国家其他国家 中国中国 America Memory:已完成:已完成110个资个资源库源库,750万款目,免费使用万款目,免费使用 加洲加洲 世界地图世界地图:十幅十幅,13-20世纪;世纪;珍藏品数字化;珍藏品数字化;政府拨专款政府拨专款2亿英镑用于建设英国亿英镑用于建设英国国家图书馆的数字图书馆系统及数国家图书馆的数字图书馆系统及数字资源库;(国际敦煌学项目、狮字资源库;(国际敦煌学项目、狮与龙项目、早期印本藏品项目等)与龙项目、早期印本藏品项目等)法国文化内容资源数字化规划法国文化内容资源数字化规划2019年,由法国文化与交流部年,由法国文化与交流
22、部统一规划和组织文化内容资源的统一规划和组织文化内容资源的JOUVE数字化计划,政府按年给数字化计划,政府按年给以经费支持。年完成。以经费支持。年完成。拉斯考克斯洞窟水下拉斯考克斯洞窟水下 考古考古 拉斯考克斯洞窟水下考古拉斯考克斯洞窟水下考古 (据今(据今29000年以前)年以前)vIE-2019,AQUARELLE(水彩画水彩画)项目项目 古代剧院古代剧院 数字图书馆数字图书馆数字博物馆数字博物馆文物数字化应用系文物数字化应用系统的统的 发展趋势发展趋势?挑战问题挑战问题?(技术局限性技术局限性保存保存)建立数字博物馆所面临的问题及解决建立数字博物馆所面临的问题及解决对策对策 数字化技术的正面数字化技术的正面/反面反面?数字博物馆的具体内容及数字博物馆与实数字博物馆的具体内容及数字博物馆与实体博物馆的关系体博物馆的关系?欢迎批评指正欢迎批评指正 谢谢大家谢谢大家!
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。