构建中医药数据资源结构图谱的探讨

来源:岁月联盟 作者:作者:尹爱宁,何前锋 时间:2015-06-05

  3.2.3  数据层整合 

  旨在屏蔽各数据源异构性,使得各数据源之间能够进行数据的交换与交互,令用户可透明地访问多个数据源。要实现数据整合,必须对数据进行跨数据源的收集、组织、处理与集成。根据整合系统与数据源之间交互的特点,又可以分为3种形式:基于联邦的整合、基于采集的整合、基于链接的整合;数据层整合协议的重点是解决系统之间的数据交换和数据交互。

    整合揭示以下功能。①不同文献层次、级别的指引关系:题录信息→标引信息→文摘信息→全文→结构信息,一次文献和二次文献之间的对应联系。②中心数字资源和网络数字资源之间的交叉、重复和互补关系:全文数据库与中心文献相重复的部分;又如PUBMED的生物医学资源中的期刊包括绝大多数的馆藏期刊,并提供了大部分题录和部分免费全文。③数字资源之间的主题相关或学科相关,内容上的重合和互补关系:引用和被引用及共同引用的关系,说明资源在内容上的相互关联。④数字资源与服务之间的关系:共建资源与服务资源之间存在密切联系,但因服务层次需求分为全文、结构、粗表、细表、分析表等资源。

  3.2.4  具体整合要求 

  数据库资源的详细描述与统一管理,包括数据库元数据管理、每个中医药相关的数据库涉及表的管理、每个表的数据元管理3个部分。数据库的元数据管理需要对数据制作相关的信息如制作人、起始日期、制作背景、目标、更新周期等信息进行管理,并可以使用中医药的分类词表对数据库进行描述;表的数据元管理需要指明字段的名称、类型、大小、取值范围以及所对应的标准。此外,多个数据库之间也存在一定的关系,如方剂数据相关的数据库,就有中国方剂数据库、方剂现代应用数据库等,对于方剂类数据库需要制定统一的方剂数据库制作标准,并对这些库之间的关系进行描述。

    要求研制管理工具,能够增、删改每个数据库的元数据、数据元,以及每个数据库之间的关系,并能够逐层次的展示各层的信息以及关系。能够使用检索方式、分类方式来具体的定位到相关的信息。

    应用软件的详细描述与统一管理,包括应用软件的描述、应用软件使用数据库资源的描述。应用软件包括软件开发的起始日期、目标、版本、开发语言、开发人员、源代码、可运行包、状态、安装运行条件、软件描述、使用者、帮助文档、安装文档等信息。

    管理工具需要管理这些信息并能够映射数据库资源,能够看到每个软件所使用的数据资源,并能够从数据库资源导航到相关的软件。

    服务器信息的管理主要指数据库资源在具体服务器上的分布以及存贮信息,包括服务器的编号、所安装的数据库、数据量、可存贮量、实际的数据存贮情况、每个数据库的超级管理员帐号、数据库表空间的帐户信息等。每个数据库资源需要映射到相应的服务器。
  
  3.3  中医药数据资源结构图谱功能

    由于中医药数字资源的内在联系不是单向或线性的,而是呈网状的复杂关系,因此,不可能通过单一的线索或统一的机制描述全局的状况。建立中医药资源结构图谱目标是要通过多种模式,多角度和多层次地挖掘和揭示这些内在关系,通过链接、集成和嵌入实现资源之间、资源和服务的整合。其实现的主要功能如下。

  3.3.1  数据库资源管理功能 

  该项功能主要实现对数据库元数据的管理和展示,主要分数据库管理、单个数据库管理、单个表的管理以及数据库信息展示4个子功能。

    ①数据库管理。提供对数据库信息的管理,包括以下功能:a.增加和删除数据库元数据,并可以对其进行编辑(元数据包括制作人,起始日期,制作背景,目标,更新周期等);b.管理不同数据库之间的关系,实现数据库之间关系的增加、删除、编辑功能;c.通过中医药分类词表对数据库进行描述。

    ②数据库中表的管理。提供对指定数据库中所属表信息的管理,包括对数据库中所属表信息的管理。

    ③单个表对应信息的管理。提供对单个表对应元数据的管理,包括以下功能:a.对单个表的元数据进行管理,表中的字段信息可以直接从数据库中得到;b.管理表对应的标准。
   
  ④元数据的定位和展示功能。实现对元数据的定位和展示,包括可以对元数据进行逐层展示。根据数据资源分类标准进行元数据目录分类的分层,并定位元数据。

  3.3.2  数据库应用软件管理功能 

  这项功能主要实现对具体应用程序的描述和管理,包括以下子功能:①应用软件自身信息的展示,包括软件开发的起始日期、目标、版本、开发语言、开发人员、源代码、可运行包、状态、安装运行条件、软件描述、使用者、帮助文档、安装文档等信息。②应用软件使用数据资源的描述,可以查看软件对应的数据资源。③增添元数据管展示功能,可以通过数据资源导航到相关软件。

  3.3.3  应用程序信息管理功能 

  实现对应用程序相关信息的管理,包括以下子功能:①增加、删除和编辑应用程序的元数据;②管理应用程序与其数据资源之间的关系,可以建立、删除、编辑应用程序与数据资源(数据库中的表)之间的关联。

  3.3.4  服务器信息的管理 

  实现对服务器上数据资源信息的管理,包括以下子功能:①建立、删除、编辑服务器元数据,包括服务器的编号、所安装的数据库、数据量、可存贮量、实际的数据存贮情况,每个数据库的超级管理员帐号,数据库表空间的帐户信息等;②建立、删除、编辑数据库与服务器之间的关系。
  
  随着网络信息的海量增长,信息资源的有序化和信息的可用性问题已经成为以数字化为核心的中医信息资源建设中的一个关键问题。中医药科学数据中心与互联网包容的信息内容在数量和覆盖内容方面日趋全面,我们期待着设计更加科学、结构更加完备、管理更加规范、功能更加强大的资源整合系统,为网络资源的发现、整合与利用提供一个全新而高效的技术平台,为中医药信息服务开辟更加广阔的发展前景。

【参考文献】
  1] 李希明.从信息孤岛的形成谈数字资源整合的作用[J].图书馆论坛, 2003,(6):121-122.

  [2] 高新陵,谢友宁.基于用户的数字资源整合模式研究[J].图书馆杂志, 2005,(5):44-45.

  [3] 李 毅.基于多层次概念语义网络结构的中文医学信息语义标引体系和语义检索模型研究[J].情报学报,2003,(4):403-411.

图片内容