数字图书馆智能化服务及其关键技术探析

来源:岁月联盟 作者:程风刚 时间:2014-06-25
  [摘 要] 智能化服务是一种全新的信息服务模式,它主要借助于网络并通过计算机模拟 或 实现类似于人的智能行为,为用户提供信息服务。同传统图书馆服务相比,数字图书馆 智能化服务具有明显的优势,而先进的技术则是推动其发展的主要动力,本文着重对 智能化服务所涉及的关键技术进行了分析。
  [关键词]数字图书馆;智能化服务;关键技术
  
  随着现代信息技术的迅速发展,传统图书馆逐步向数字图书馆转变。为了不断满足读者 需求 ,图书馆应不断引进并整合智能代理、数据挖掘、专家系统、机器 学习 等先进技术,加快人工智能和信息服务的融合,积极为用户提供智能化服务。本文试从智能 化服务的概念入手,着重对智能化服务所涉及的关键技术进行分析。
  1 智能化服务的概念及特征
  智能化服务是指在网络环境下通过计算机模拟或实现类似于人的智能行为,为不同用户提 供信息服务。这是一种全新的信息服务模式,服务系统能迅速、准确地理解用户的意图,自 主或交互地执行各种模拟任务,为不同用户提供自动化、网络化、数字化服务,真正体现 以用户为中心的服务理念。
  在智能化服务过程中,智能是整个服务的灵魂,是区别于传统服务、纯网络服务的重要标志 。先进的智能化服务应具备以下几个特征:能主动分析、预测用户需求及期望目标,把 相关问题描述出来并提供给用户;强调服务与被服务之间的一一对应,强调量体裁衣式的 个 性化服务;集成了专家系统、机器学习、人机接口等功能,能自我学习和自我调整,知识库 更新较快。
  智能化服务系统不是一个简单的系列操作过程,它是由智能断定、获取、精练、开发创新、 提供信息和信息应用效益评估等系统组成的完整的有机统一体。[1]
  2 智能化服务关键技术分析
  技术是推动数字图书馆发展的主要动力,数字图书馆的智能化服务正是在计算机、网络通信 、人工智能等新技术的基础上发展起来的。目前,智能化服务主要涉及智能代理、数据挖掘 、资源整 合、智能检索、信息过滤、智能推送、信息安全等关键技术。
  2.1 智能代理技术
   智能代理(Intelligent Agent)常被称为“会思维的软件”。它具有以下主要特征: 1)智能性。具有与执行任务相关的知识,能够进行相关的推理、判断或计算,比较准确地 理解用户需求,提供针对性服务;2)代理性。能引导并代替用户完成某些任务;3)自主性 。在没有外界干预的情况下,能自主决策,自主完成任务;4)通讯能力。每个智能代理都有 标准的接口,采用统一的通信语言进行信息的交流,以便获取信息,充实和更新知识库;5) 推理能力。能利用当前知识和经验,根据环境变化,以一种类似于人的思维方式进行推理和 规划。这是智能代理区别于其他软件的关键所在;6)自适应性。为了维护自治和推理能力, 智能代理必须能评估外部环境的当前状态并将其融入下一步行动的有关决策之中;7)可信赖 性。智能代理必须准确可信地代表用户,这是智能代理能否被用户接受的关键。[2 ]
  智能代理作为一种新型的人工智能技术,其快速发展无疑为数字图书馆开展智能化服务提供 了强大的技术支持。但由于智能代理技术还不完善,图书馆界对智能代理的研究和利用目前 还主要集中在信息导航、信息检索等方面。
  2.2 数据挖掘技术
  数据挖掘(Data Mining)也称数据库的知识发现(Knowledge Discover Database),就是 利用信息技术和信息分析手段从大量的数据中提取有用信息和知识的过程。数据挖掘所得到 的结果,一定是潜在的、事先未知的。通过数据挖掘,可以从各种数据库、数据仓库或其他 信息存储中提取有用的知识、规律或高层信息,并从不同角度加以观察或浏览。数据挖掘的 主要 功能包括发现、预测、关联分析、聚类、概念描述、偏差分析等。[3]
  数据挖掘在数据组织与分析、知识发现及信息深层挖掘等方面具有强大优势,图书馆可以运 用关联规则分析、聚类分析、决策树、时间序列分析等数据挖掘方法,找出数据库中蕴藏的 对于服务有用的规则、描述、预测,为图书馆改进服务措施、提高服务质量提供决策支持。 如利用关联规则分析从图书馆借阅记录中发现规律,并利用这些规律改进图书推荐服务;利 用时间序列分析方法对图书馆流通数据库或者Web日志进行挖掘,找出图书流通规律,以便 科学安排流通部门的服务工作;利用分类模式挖掘方法对图书馆用户管理数据库中的历史数 据进行挖掘,分析不同用户群体的特征,细分群体的偏向爱好,开展个性化服务。
  2.3 数字资源整合技术
  随着图书馆资源数量的增加以及类型的丰富,将会出现越来越多异质、异构的数字资源。 图 书馆需要整合这些资源,建立相关联的数字资源体系,为用户提供迅速、方便、简洁的智能 化服务。
  数字资源整合就是对各种自主的、异构的乃至离散式分布的数字资源采用各种整合技术实 现透明无缝集成,以便用户在统一的界面下获取和利用各种资源。目前,在国外SFX作为 一种比较先进的数字资源整合技术被提出并开始应用。运用SFX,可以把不同来源和不同通 信协议的数字信息完全融合起来,使不同类型、格式的数字资源实现无缝链接。国内对异 构资源整合技术的研究稍晚,主要有CALIS资源统一检索平台、汇文一站式文献检索系统、 同 方USP统一检索平台等。MetaLib内嵌的SFX是目前数字资源整合最优良的解决方案。MetaLib 中 的SFX扩展服务实现了各种资源之间的透明链接和导航,并且可以与图书馆现有的全文传递 、馆际互借、参考咨询等服务无缝集成。它同时整合了技术、服务、资源等功能,这是Meta Lib区别于其他资源整合系统的显著优势。哈佛大学、麻省理工学院以及国内的 清华大学、复旦大学等高校的图书馆都已应用了这一技术。 此外,南 京师范大学、北京理工大学等图书馆也实现了MetaLib内嵌SFX的整合检索。[4]
  2.4 智能检索技术
  智能检索是信息检索和人工智能研究的一个交叉领域。它将信息检索从目前基于关键词的层 面 提高到基于知识(或概念)层面,对知识有一定的理解和处理能力,能够正确运用分词技术 、同义词技术、概念搜索、短词识别以及机器翻译等技术。因而,智能检索更具有信息服务 的智能化、人性化特征,能为用户提供更方便、准确地搜索服务。
  随着人工智能技术广泛应用于信息检索领域,现已产生多种智能检索系统模型。归纳起来, 主 要有2大类:一类是基于机器学习的大范围信息检索系统,一类是智能化的用户个性化信息 检索系统。这些检索系统需要依赖许多先进的技术来实现它的各项功能,所涉及的关键技术 主要包括:1)信息收集和存储技术,分人工和自动2种方式。其中自动方式是由“网络Robo t”来完成的;2)信息预处理技术,包含信息格式支持、转换和信息过滤;3)信息索引技术 ,建立索引涉及的信息语词切分和语词语法分析,进行词性标注及相关自然语言处理,建立 检索项索引及检索结果处理技术。其中检索结果处理技术是关键技术,其核心是依据计算结 果与查询词的相关程度来排序。[5]

图片内容