浅析档案信息数据库的建设

来源:岁月联盟 作者:白晶 时间:2014-03-26

  一 档案信息化的相关概念
  
  档案信息数据库的概念
  档案信息数据库是在计算机存储设备上合理存放的、可以共享的、具有共同存取方式和一定组织方式的、相互关联的档案信息数据的集合。“相互关联” 、“共同存取方式和一定组织方式”、“共享”是档案信息数据库本质的三个要素。数据库中储存的是一系列相互关联的档案信息数据,而不是杂乱无章的数据。这些数据包括档案题名、责任者、分类号、主题词、内容摘要等,还包括全文、图像、声音、影像等。这些相互关联的数据是经过调查、试验、统计、整理和归纳后得到的,并经合理分类和规范化处理之后,以记录的形式存储。
  
  二 当前档案信息数据库建设的关键问题
  
  (一)明确数据库建设目的
  对于档案信息数据库建设,主要用于档案目录、全文、多媒体等实体信息,明确建设档案信息数据库是为了检索、建立档案信息管理系统的需要。
  
  (二)实现档案目录数据库建设
  档案目录数据库的建设是数据库建设的第一个目标。信息化建设的切入点和工作重心,首先是抓好目录数据库的建设。目录数据库可以比较全面地反映档案信息,有助于实现全方位的、动态的、完整的档案信息服务。
  在档案目录数据库建立的基础上,可以考虑建立档案目录中心,实现一定范围内档案内容互补和档案信息资源整合,更大限度地发挥档案效益。
  
  三 档案信息数据库建设步骤
  
  (一)档案信息的收集
  档案信息的主要来源是传统档案的数字化和电子文件。除此之外,档案机构和管理部门也是数值数据和事实数据的重要来源。在建立相应的数据库时,必须确定档案信息的收集范围和来源,按要求进行全面地收集。
  档案信息主要来源于两个方面:一是对各种以传统载体形式存在的档案信息进行数字化处理后形成的数字副本,二是直接通过计算机生成和处理的、并由档案机构进行收信归档的电子文件。
  
  (二)档案信息前期处理
  这是一项基础工作,为数据库提供经过加工处理的数据。主要是将档案的内容特征和形式特征著录、标引出来。著录标引必须达到规范化、标准化的要求。这是建立数据库的必要过程,也是保证检索质量的前提条件。
  1、档案信息数字化
  数字化是指把一切信息都变成只用O和1这两个数字组成的、用不连续的数位表示的二进制代码。档案信息数字化是指为了使纸质档案、音像档案等以传统载体形式承载的档案信息能够通过计算机进行管理的提供利用,而利用高速扫描技术、数据压缩技术等信息处理手段,将其进行转换处理,形成数字信息,并以数字代码方式存储起来。这些数字信息可以通过计算机进行操作处理,通过网络进行传输。纸质档案、音像档案等各种载体的档案都可以以文本文件格式、图像文件格式,音频文件格式或视频文件格式转换成数字信息。
  2、电子文件的收集归档
  随着计算机技术与办公自动化技术的结合,诞生了一个新生儿一电子文件。电子文件一经产生其信息就是以数字代码形式表达。所以在功能上电子文件等同于经过数字化处理的文件。由此,直接在计算机中生成和处理的电子文件是重要的档案信息来源。
  
  (三)数据录入
  将档案信息前处理的结果转化成机读数据。录入过程需要较严格的校对审核。如审查字段的数据形式是否正确;字段长度与确定的结构长度是否符合;各种标识符号是否有误等。这其中可能包括对不同格式的数据进行转换。
  
  (四)数据库的完善
  由于计算机硬件能力奇迹般地不断更新,计算机技术爆炸般地迅猛发展,数据库系统发生着剧烈的变化。虽然它的基本组成部分仍然是数据、软件和硬件,但是它们的范围、规模和复杂性都大大地扩展了。数据库是信息资源存储和开发利用的基础,是信息资源共享的先决条件,是信息系统的核心。因此把数据库建设作为当前档案信息发布的核心工作,档案数据库建设越有成效,档案信息管理与服务也就越有保证。

图片内容