1、第十七章第十七章 档案数字化档案数字化第十七章 档案数字化内容提要本章重点讲四个方面的内容:一、档案数字化的概念和工作流程。二、档案数字化工作的要求。三、档案数字化的关键技术。四、档案数字化案例。第一节 档案数字化的概念和工作流程一、档案数字化的概念二、档案数字化的工作流程一、档案数字化的概念对于档案数字化,有广义和狭义两种理解。狭义的档案数字化,又称数字化加工或数字化转换,是指通过一定的技术手段将存储于传统载体上的、以模拟形态存在的档案信息转化为以数字形态存在的、计算机可以识别和处理的信息的过程。广义的档案数字化,是指通过一定的技术手段将存储于传统载体上的、以模拟形态存在的档案信息转化为以数
2、字形态存在的、计算机可以识别和处理的信息,并加以存储、组织、检索、维护的过程。二、档案数字化的工作流程二、档案数字化的工作流程(一)档案数字化的管理流程1.开展档案数字化工作需求调研2.制订档案数字化工作计划3.组建工作队伍,配备相关条件档案数字化工作的组织形式主要包括以下几种:(1)外包式。(2)自建式。(3)内外组合式。4.监控档案数字化工作的开展5.评估数字化工作成果二、档案数字化的工作流程(二)数字化档案资源建设流程1.预处理 2.数字化加工/转换3.信息处理4.信息组织5.信息存储6.信息服务7.信息维护二、档案数字化的工作流程(三)应用系统开发流程1.系统设计系统设计是开发档案管理
3、系统功能模块的过程。2.系统实施系统实施是安装、应用档案管理系统的过程。3.系统维护系统投入日常使用之后,要保证其持续、安全运行。第二节档案数字化工作的要求一、目标合理二、遵守法规三、遵循标准四、管理集成五、互助协作六、强化核查一、目标合理(一)方便用户查询和利用(二)支持电子化业务流程(三)保护档案原件(四)汇聚分散保存的档案信息二、遵守法规档案数字化工作需要遵守的法规主要包括四类:(一)关于档案公开和保密的法规(二)保护知识产权的法规(三)隐私权保护的法规(四)网络服务行为规范三、遵循标准(一)标准概览三、遵循标准(二)标准的配套与执行相比单个标准的制定,标准之间的配套性、衔接性,以及标准
4、的贯彻落实同样值得重视。四、管理集成“管理集成”也是“注重效益”原则的要求,即将档案数字化融入档案馆(室)的整体工作中,与其日常管理工作相结合。具体体现在三个方面:(一)基础工作集成(二)信息服务集成(三)管理系统集成五、互助协作加强档案部门、业务部门、技术部门、咨询部门以及其他信息资源管理部门等有关方面的互助合作,发挥优势互补,共享成果和经验,可以避免不必要的重复劳动,提高档案数字化的效率。各有关方面的互助协作主要体现在以下几个方面:(一)档案数字化成果的交换共享(二)档案数字化工作经验的交流共享(三)档案数字化课题的联合攻关(四)档案数字化业务的外包共建六、强化核查(一)数字化档案原文质量
5、核查通过将数字化档案与其原件对比,检查数字化转换后的信息质量,包括对文字内容的校对,图像、音频、视频质量的检查,密级校核等。如发现遗漏、数据失真、数据错误,应及时弥补。(二)机读目录核查机读目录是档案检索的依据,应确保准确、完整。为此需要加强数据录入的校对和审核,有时需要开展多次校核。六、强化核查(三)数据挂接核查用户若要最终能够获取档案原文信息,除了目录要准确之外,还需要在档案数字化原文与机读目录之间建立准确的挂接。一般采用抽查的方法来进行数据挂接核查,抽检比率不低于5%。(四)安全审查安全审查贯穿于档案数字化业务全过程。第三节 档案数字化的关键技术一、数字化加工技术二、自动识别技术和方法一
6、、数字化加工技术(一)扫描技术扫描是通过扫描仪获取档案原文图像的技术。1.扫描仪的技术指标(1)光学分辨率。(2)色彩位数。(3)灰度级。(4)扫描幅面。(5)扫描速度。(6)接口类型。一、数字化加工技术2.扫描仪的类型档案数字化工作用到的扫描仪类型主要包括平板式扫描仪、胶片扫描仪、鼓式扫描仪等。3.扫描件技术参数的选择扫描件主要的技术参数包括分辨率、色彩模式、色彩位数、文件格式、压缩算法等。一、数字化加工技术(二)录音档案的模数转换技术通过由放音设备、音频采集卡(声卡)、音频输入线、计算机等设备以及相应的音频数字化软件搭建而成的录音档案数字化转换系统,可以将模拟声音信号转化为数字音频信号。其
7、主要工作过程包括采样、量化和编码。通过系统的设置,该过程可以批量化、自动化进行。二、自动识别技术和方法(一)光学字符识别技术1.光学字符识别简介2.光学字符识别技术的工作过程光学字符识别技术的主要工作过程包括图像采集、图像预处理、特征抽取、对比特征、判断识别、人工校正和成果输出。(二)图形矢量化技术(三)语音识别技术第四节档案数字化案例一、内阁大库档案管理沿革自2002年起,为了提高内阁大库档案数据库的质量和检索效率,加强与其他数字信息的互通和共享,“内阁大库档案数位化计划”的重点转为研究档案整理工作、档案著录格式及著录方式,建立符合国际标准的档案元数据及规范文件,以及规划数据库及著录模块的系
8、统架构。第四节档案数字化案例二、内阁大库档案数字化的保障(一)人力保障(二)设备、技术和规范保障设备、技术和规范保障,由史语所“资源共享计划”及“数位典藏计划”中的“技术研发分项计划”支持,内容包括档案管理技术、数字影像技术、检索技术、其他技术、法律要求、其他相关管理规则、其他网络服务功能七个方面第四节档案数字化案例(三)经费保障史语所将此分支计划与史语所里原有档案业务进行了区分,主要经费重点用于档案的增值分析及数字化档案的制作(含影像与目录)、系统的整合规划上,原有业务经费主要用于档案的整理维护、管理及提供利用上。三、内阁大库档案数字化的流程(一)实体整理阶段实体整理阶段主要开展以下五个方面
9、的工作:1.原件检查 2.原件扫灰 3.修复、裱褙 4.原件校核登录5.入库上架 三、内阁大库档案数字化的流程(二)数字化阶段1.影像处理(1)原件扫描、数字摄影。(2)数字影像校对、修正。(3)数字影像后期制作。2.目录编制(1)目录著录。(2)目录校对。3.增值分析(1)规范文件著录。(2)规范文件校对。(三)应用阶段1.系统挂接 2.开放利用四、内阁大库档案数字化的成果 内阁大库档案数字化成果主要表现在系统模块、规范、系统规格、数字化档案数量四个方面。至2006年计划一期结束时,建成了整合式档案管理自动化系统以及明清档案主题分析webgis测试系统,制定了明清档案著录规则、明清档案人名规
10、范文件著录规则、明清档案地名规范文件著录规则等规范,编制了整合式档案管理自动化系统架构、功能需求书、元数据需求规格书等系统规格,建成并提供在线利用206 434笔已整合好的内阁大库档案的目录和影像,以及5 809笔人名规范文件。目前,中国台湾的“数位典藏计划”已进入二期,“珍藏历史文物数位化典藏计划”的二期为“数位知识总体经营计划”,“内阁大库档案数位化计划”的二期为“明清档案数位知识网络”,在已有数字化成果的基础上继续深入,并征集明清档案数字内容,开展数据库系统与网络平台规划,整合明清学术研究资源。思考与复习题1.如何理解档案数字化的概念?2.简述档案数字化工作中的管理流程。3.简述档案数字化工作中的业务流程。4.简述档案数字化工作的目标。5.我国现有法律法规的相关规定对档案数字化工作有哪些影响?6.我国现有标准对档案数字化工作有哪些影响?思考与复习题7.在档案数字化领域,档案部门如何与其他部门开展互助协作?8.扫描仪的技术指标有哪些?9.如何选择扫描件的技术参数?10.简述录音、录像档案数字化加工过程。11.自动识别技术有哪些?在档案数字化工作中的应用如何?12.结合本章第四节的案例,谈谈档案数字化工作的关键因素有哪些。