数字图书馆的体系结构模式探析

来源:岁月联盟 作者:马奎林 韦华昌 时间:2010-07-05

  摘 要:主要探讨了数字图书馆的体系结构与数字图书馆信息组织的主要模式,并分析了各个模式的特点。?
  关键词:数字图书馆;结构;模式;体系结构?
  
  1 数字图书馆的基本概念?
  
  关于数字图书馆的定义, 目前而言,还是仁者见仁,知者见者,说法不一。但大多数研究者认为, 数字图书馆并不是空间意义上的“馆”, 而是一种拥有多媒体内容的信息资源, 它的存在方式是将文字、图像、声音等信息数字化, 并通过互联网向用户方便快捷地提供信息知识的服务技术。数字图书馆与传统图书馆的最大不同就在于: 它变用户的集中为信息服务的集成。对于不同的使用对象来说, 数字图书馆表现出不同的特征和功能, 因而对数字图书馆的理解就各不相同。所以, 数字图书馆的共有特征可以概括为:收藏数字化;操作机化;传递化;信息资源存取自由化;信息资源共享化; 结构连结化。基于此, 我们可以把数字图书馆简述为: 对有高度价值的文本、图像、语音、音响、影像、影视、软件和数据等多媒体信息进行收集, 进行规范性的整理加工, 进行高质量的保存和管理,实现知识增值, 并提供在广域网上高速横向跨库连接的存取服务系统。?
  
  2 数字图书馆的体系结构?
  
  体系结构是数字图书馆建设的关键, 它关系到系统的信息组织(即数字对象的存储) 和检索方式。影响数字图书馆体系结构的因素有很多, 包括社会与环境、通讯基础设施和网络技术、软件工程、硬软件环境、系统安全、访问权限、数字对象类型和数量等方面。美国数字图书馆研究的重要成果之一是提出了建设数字图书馆的八项原则, 并得到了学术界的普遍认同。这八项原则是:?
  (1)数字图书馆的技术框架存在于法律和社会的框架之内。
  由于社会网络进程的不断加快, 数字图书馆将存在于一个广泛的、社会和法律框架内。这就意味着:法律体系必须根据迅速变化的经济和社会框架制定新的法律,包括知识产权、通讯法、国际法等; 数字图书馆的体系结构必须能够保护著者和所有者的权利, 考虑所涉及的经济、社会和法律问题。?
  (2)数字图书馆概念的统一理解。
  数字图书馆中的对象称为数字对象(Digital Object),它们存储在仓储(Repository), 用句柄(Handle) 来标识。存储在数字对象中的信息称为内容(Content), 内容被分为数据(Data), 关于数据的信息称为属性( Property) 或元数据(Metadata)。作为基础的体系结构应和保存在数字图书馆中的信息相分离数字图书馆中的内容是多种多样的, 可以是文本、图片、动画、音频资料、计算机程序、模型设计或多种类型构成的复合资料。存储在数字图书馆中的这些信息内容往往和数字图书馆的体系结构相分离。适合于各种资料类型的特征是由体系结构规定的。这种特征通常包括适用于某类资料的特定的格式、协议和权限管理等。?
  (3)名字和标识符是数字图书馆的基本建构块。
  名字用于标识数字对象, 登记数字对象中的知识产权, 记录所有权的变化, 在引用、检索和对象链接中不可缺少。名字是唯一的, 长期保持。句柄系统用于标识数字对象。用于标识用的字符串称为标识符。?
  (4)数字图书馆不仅仅是二进制数位的集合在数字图书馆中信息存储为数字对象, 不能简单地把数字对象看成是二进制数位的集合。数字对象可由两部分构成: 内容和元数据。一个数字对象可含有多种类型的内容如文字、图像、声频等。复杂的数据类型可由简单类型构成。元数据包括句柄、权限、访问方式、数字签名、交易日志等。(5)数字图书馆对象使用时和存储时的形态可能完全不一样。
  数字对象在使用时的形态和存储形态可能完全不同。例如, 图像可以小波形态存储, 使用时利用小波生成图像。作品可以曲谱的形式直接传送给用户, 也可在仓储中用合成器演奏后将声频信号传给用户。数字图书馆的体系结构必须仔细区分生成的原始数字对象、存储在仓储中的数字对象和提交用户的数字图像。?
  (6)仓储应保管好所存储的信息。
  数字对象包含有价值的知识产权, 仓储中的数字对象含有是否允许其在特定的经济和社会框架中被存储的信息。仓储必须妥善管理, 提供引用、安全控制等措施, 以确保对数字对象的操作的合法性。用户通过仓储访问协议与仓储交互, 以屏蔽仓储的内部结构和数字对象的存储形式。?
  (7)用户需要的是供人利用的知识作品, 而非供机器处理的数字对象数字对象是数字图书馆的基本元素, 但用户需要的往往是更为抽象的数据项。?

  3 数字图书馆的主要模式?
  
  目前, 图书馆用来处理数字存取的主要模式是以为中心的用户机P服务器(CPS) 模式和由此而演化来的Web 为中心的浏览器PWeb 服务器P数据库(BPSPD) 模式,后者也称为Web 模式。世界上已运行的数字图书馆系统大多采用这两种模式。用户机P服务器模式通过消息传递机制对话, 由用户机向服务器提出请求, 服务器进行相应处理后将结果传递回用户机。在此种模式中, 服务器往往只负责数据库的管理和查询, 因此客户机任务比较繁重, 须配备大量的软件, 尤其是较多的客户机软件和应用程序。在这种结构中, 传统的服务器被分成两部分, 即Web 服务器和数据库服务器。Web 服务器负责Web 页面的管理、组织、传递和数据库查询请求的提出, 而数据库服务器则负责接受Web 服务器的查询请求并提供运算处理结果。因此,在这种模式中, 客户机的任务比较轻松, 只要配备操作系统、网络协议和浏览器等软件即可。浏览器的作用只是从Web 服务器下载Web 页面。Web 模式在资源配置、系统安全等方面比简单的客户机P服务器模式要好得多。Web 模式的系统结构如图1 所示。?

  
  国内外已被图书馆采用了的IBM 数字图书馆系统就是在浏览器PWeb 服务器P数据库模式的基础上实现的。其系统基本框架如图2 所示。?

 
  在这种系统中, 图书馆服务器管理图书馆的索引信息, 负责执行查询及将用户的请求转交给相应的对象服务器, 对象服务器管理数字对象, 用户通过网络访问服务器。用户、图书馆服务器和对象服务器构成系统信息传递的三角形框架。用户登录图书馆服务器, 并进行查询, 图书馆服务器将客户的请求转交给相应的对象服务器, 对象服务器则将查询到的信息直接传送给用户, 这样就实现了数字对象的发布。在IBM数字图书馆的三角形构架中, 用户只能访问图书馆服务器, 这保证了存储在对象服务器中的数据的安全性。图像、声音和动画等数字对象的数据量比较大, 数据量大的数据对象及频繁使用的数字对象可以放在接近用户的地方, 这样可以减少数字对象复制和传达的次数, 减少网络的数据传递量, 提高系统的性能。?
  加快我国数字图书馆的建设是互联网上中文知识信息的基础建设, 它将迅速扭转互联网上中文知识信息匮乏的状况, 形成我国知识信息的资源优势。这对于正在实施西部大开发的信息基础建设和文化建设更具有前瞻性的战略意义。因此, 数字图书馆的建设, 既代表着化图书馆的方向, 更代表着先进文化的前进方向。?
  
  ?
  [1]鄂云龙. 数字图书馆——信息时代发展新阶段的国家级挑战[J]. 情报资料工作, 2001, (5) : 16 - 20.[2]王军, 杨冬青, 唐世渭. 数字图书馆的研究内容和方向[J]. 图书馆学报, 2001, (6) : 33 - 38.?
  [3]盛小平. 国内外数字图书馆发展的比较研究[J]. 中国图书馆学报, 2001, (6) : 39 - 44.