1、档案数字化档案数字化技术要求及归档流程技术要求及归档流程档案数字化加工依据:中华人民共和国行业标准DA/T312005纸质档案数字化技术规范省、市档案政策浙江省省直单位纸质档案数字化实施细则台州市市直单位纸质档案数字化实施细则工作流程:工作流程:扫描扫描-图像处理图像处理-文件合成文件合成-OCR处处理理图像存储图像存储-数据质检数据质检-(数据挂接)(数据挂接)-归档移交归档移交一、扫描一、扫描(一)扫描前处理(一)扫描前处理1、拆除装订物、拆除装订物 务必在扫描前仔细检查装订物,把钉书针拆除,否务必在扫描前仔细检查装订物,把钉书针拆除,否则会损坏扫描仪。拆除装订物时应注意保护档案不受则会损
2、坏扫描仪。拆除装订物时应注意保护档案不受损害。损害。 2、编印页码、编印页码 有文字的页面均需编上页码,这样才能准确知道每有文字的页面均需编上页码,这样才能准确知道每件文件的页数。件文件的页数。3、不要装订、不要装订 扫描以后再装订,这样可以免除拆卷、重新组卷的扫描以后再装订,这样可以免除拆卷、重新组卷的麻烦。麻烦。4、区分扫描件和非扫描件、区分扫描件和非扫描件(二)技术参数:(二)技术参数:扫描色彩模式扫描色彩模式 :彩色模式:彩色模式扫描分辨率扫描分辨率 :300dpi (三)仪器设备:(三)仪器设备: “档案数字查阅处理中心档案数字查阅处理中心” 柯达高速扫描仪柯达高速扫描仪A4幅面幅面
3、 清华紫光高速仪清华紫光高速仪幅面小于等于幅面小于等于A4; 爱普生平板扫描仪爱普生平板扫描仪幅面小于等于幅面小于等于A4; 清华紫光平板扫描仪清华紫光平板扫描仪幅面幅面A3;(四)具体操作(四)具体操作以柯达高速扫描仪为例:以柯达高速扫描仪为例:启动扫描仪启动扫描仪 设置参数设置参数 放入纸质文档放入纸质文档 扫描扫描完成。完成。l(五)注意事项(五)注意事项1、由于操作不当,造成扫描的图像文件不完整、由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。或无法清晰识别时,应重新扫描。 2、发现文件漏扫时,应及时补扫并正确插入图、发现文件漏扫时,应及时补扫并正确插入图像位置。像
4、位置。补扫图像插入:重命名补扫图像。重命名时,先补扫图像插入:重命名补扫图像。重命名时,先把补扫图像按前一顺序图像的文件名命名,再在把补扫图像按前一顺序图像的文件名命名,再在文件名后面按顺序加文件名后面按顺序加a、b、c 3、发现扫描图像的排列顺序与档案原件不一致、发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。时,应及时进行调整。二、图像处理二、图像处理(一)图像偏斜度、清晰度、失真度等不符合图(一)图像偏斜度、清晰度、失真度等不符合图像质量要求时,应进行图像处理。像质量要求时,应进行图像处理。 1、纠偏 对出现偏斜的图像应进行纠偏处理,以达到对出现偏斜的图像应进行纠偏处理,以达到
5、视觉上基本不感觉偏斜为准。对方向不正确的图视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。像应进行旋转还原,以符合阅读习惯。2、去污 对图像页面中出现的影响图像质量的杂质,对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、黑边等应进行去污处理。如黑点、黑线、黑框、黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展现处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。档案原貌的原则。(二)采用软件(二)采用软件Photoshop7.01、纠偏:导入文件、纠偏:导入文件矩形选择工具矩形选择工具自由变换(自由变换(ctrl+A+T)旋转合适角度旋
6、转合适角度确定确定2、旋转:导入文件、旋转:导入文件图像图像旋转旋转选选取角度取角度3、去污:导入文件、去污:导入文件矩形选择工具矩形选择工具框选出污点框选出污点按删除键按删除键三、文件合成三、文件合成将几个将几个JPEG图像文件合并成图像文件合并成1个个PDF多页文多页文件件1、采用软件、采用软件Adobe Acrobat 9 Pro2、具体操作、具体操作启动启动Adobe Acrobat 9 Pro 选中一个文件选中一个文件包含的所有图像文件包含的所有图像文件点右键,选择点右键,选择“在在Acrobat中合并支持的文件中合并支持的文件”合并文件合并文件命名保存到相应文件夹。命名保存到相应文
7、件夹。四、四、OCR文字识别文字识别将合并得到的将合并得到的PDF文件进行文字层与图像文件进行文字层与图像层剥离处理。层剥离处理。1、采用软件、采用软件Adobe Acrobat 9 Pro2、具体操作、具体操作启动启动Adobe Acrobat 9 Pro 导入导入PDF文文件件点击菜单栏点击菜单栏“文档文档”点击点击“OCR识识别别”完成完成启动启动Adobe Acrobat 9 Pro 点击点击“文档文档” OCR文本识别文本识别使用使用OCR识别多个文件识别多个文件中的文本中的文本点击点击“添加文件夹添加文件夹” 点击点击“确定确定” 五、图像存储五、图像存储1、存储格式:采用、存储格
8、式:采用PDF格式存储。格式存储。2、图像文件的命名、图像文件的命名 以案卷为单位,建立相应的电子文件夹,文件夹以案卷为单位,建立相应的电子文件夹,文件夹以案卷标题命名。该案卷下的每份文件以所在案以案卷标题命名。该案卷下的每份文件以所在案卷的卷内目录顺序号(件号)命名。卷的卷内目录顺序号(件号)命名。2009年会议记录1234六、数据质检六、数据质检七、数据挂接(由档案馆统一挂接)七、数据挂接(由档案馆统一挂接)八、归档移交八、归档移交1、电子文件拷贝一份、电子文件拷贝一份2、电子版案卷目录一份、电子版案卷目录一份3、电子版卷内目录一份、电子版卷内目录一份2009年会议记录1234卷内目录卷内
9、目录案卷目录Word文档转化成文档转化成PDF文档文档具体操作:打开具体操作:打开Word文档文档在菜单栏在菜单栏里点击里点击“ Adobe PDF ”选择选择“转换为转换为Adobe PDF ”点击保存到目标文件夹点击保存到目标文件夹完成。完成。EXCEL文档转化成文档转化成PDF文档文档具体操作:具体操作: 打开打开EXCEL文档文档在菜单栏里点击在菜单栏里点击“ Adobe PDF ”选择选择“转换为转换为Adobe PDF ”转换范围转换范围选择选择“工作表工作表” 点击点击“转换为转换为PDF ”点击保点击保存到目标文件夹存到目标文件夹完成。完成。 备注:在选择工作表时,如果备注:在选择工作表时,如果EXCEL文档有文档有若干张工作表,且同为一个文件,那么全部选取,若干张工作表,且同为一个文件,那么全部选取,再点击再点击“转换为转换为PDF ”;如果;如果EXCEL文档有若干文档有若干张工作表,分属不同的文件,那么逐一选取单张张工作表,分属不同的文件,那么逐一选取单张表格,再点击表格,再点击“转换为转换为PDF ”。