基于语义网的知识管理研究

来源:岁月联盟 作者:张东伟1 赵津津2 时间:2010-08-30
摘  要  随着知识型的出现,知识己逐渐成为企业首要的生产要素。企业如何通过对知识实施有效管理来效益最大化,增强竞争能力,已经引起人们的普遍重视。本文从知识管理目前存在的问题出发,提出了语义网相关技术在知识管理中的作用,给出基于语义网的知识管理方法。     关键词  语义Web;知识管理;信息查询 
    在人类社会进入新世纪的同时,人类也进入了一个全新的时代——知识时代。随着知识型企业的出现,知识逐渐成为首要的生产要素。企业如何通过对知识实施有效管理来效益最大化,增强竞争能力,已经引起人们的普遍重视。企业知识管理已成为当今管界和企业管理者们最为关注的课题之一。

1  知识管理

1.1  知识管理的出现

    所谓“知识经济”,就是“以知识为基础的经济”,这个术语来自于对知识和技术在经济增长中所起作用的充分了解,体现了人力资本和技术中的知识是经济的核心,强调了知识作为一种资源在新的经济社会形态中所具有的基础特征。就企业管理来讲,知识管理的影响主要有四个方面:    (1)经济全球化给组织(企业)产生了巨大压力。    (2)知识密集型产业成为经济增长的主导力量。对传统产业来说“知识化”将是其维持现有地位或实现创新的惟一出路。    (3)知识作为一种独立的生产要素在各种要素投入中占据主导地位,与此相应地“知识工人”在企业中的地位不断强化。    (4)信息技术的飞速发展和信息基础设施的极大改善为组织运作提供了与化时代在本质上不同的基本环境。    在上述背景下,管理学家和企业管理者们日益认识到,知识及其学习代表着企业(组织)竞争优势的重要源泉,“企业知识管理”便由此应运而生。

1.2  目前存在的问题

    在互连网上有数以百亿计的文档被超过上亿的用户使用,这些文档中有很多是在企业或组织内部的Intranet上。随着的不断发展,这些为企业服务的文档会越来越多地出现在网络上,所以我们有理由相信未来企业对于信息和知识的管理都会偏向于网络。但是目前基于网络知识管理系统都存在着明显的不足:    1) 信息检索    目前的信息检索方式主要是基于关键词的检索而并非语义。显然这种方式缺点在于它并不能处理同义词。造成这种结果的原因是传统的基于关键词的检索只关注检索与数据存储之间的关系。这种检索是不涉及词汇的语义的。    2) 信息的集成    目前对于网络上的信息集成主要靠人工处理。存在这个问题的主要原因是目前的自动代理软件不能处理文本代表的常识知识,并且它们不能处理分布式的资源。    3) 维护半结构化文件目前组织的很多文档都是半结构化的,但维护这种信息的准确和一致是一件既困难又费时的工作,所以我们需要有某种自动化的机制帮助我们自动监测错误。

1.3  语义Web在知识管理中的应用

    以前对于信息集成的研究主要集中在如何整合不同的数据库和知识库,这些数据库和知识库都是结构化的,所以这些集成方法并不能很好的适应目前互联网上的半结构化数据,我们需要的知识管理工具必要整合分布在网上的半结构化的信息资源。    语义Web是对当前互连网的扩展。语义Web上的信息具良好的含义,使机之间以及人类能够更好的协同合作。语义Web有这样的定义:机器可以理解数据含义的下一代互连网,称之为语义Web。语义Web的目的就在于把互联网变成一个巨大的知识库,这个知识库不仅可以被人理解而且还可以被机器理解。如果它实现的话,我们可以想象这样的互联网将会怎样影响我们的生活。

2  相关技术

2.1  传统的知识表示方法

    所谓知识的表示实际上就是对知识的一种描述,或者说是一组约定,一种计算机可以接受的用于描述知识的数据结构。对知识进行表示的过程就是把知识编码成某种数据结构的过程。知识的表示方法多种多样,主要有:①一阶谓词逻辑表示法;②产生式表示法;③框表示法;④语义网络表示法;⑤脚本表示法;⑥过程表示法;⑦Petri网表示法;⑧面向对象表示法等。    对同一知识的表示可以用多种方法,但各自的效果却不相同。因此我们常把几种表示形式并用,以取得优势互补的效果。例如一阶谓词、产生式规则、框架和语义网络等己经应用于知识管理系统的开发中。随着面向对象技术的发展,面向对象的知识表示方法也被应用于知识管理系统的设计之中。

2.2  语义Web的框架

    姆·伯纳斯·李(Tim.Berners-Lee)一直致力于语义Web技术的研究,并一直关注语义Web技术的发展,在综合了语义Web研究领域的最新成果的基础上,提出了语义Web模型。这一模型得到了语义Web研究者的认同,图1就是伯纳斯·李提出的语义Web分层结构图。图1中,XML层作为语法层;RDF(Resource Description Framework)层作为数据层;本体层(Onto1ogy Layer)作为语义层;逻辑层(Logic Layer)提供了智能推理的规则;证据层(Proof Layer)支持代理间通讯的证据交换。


图1  语义Web层次结构

2.3  RDF和RDF Schema

    RDF是Resource Description Framework(资源描述框架)的缩写,提供了用于描述元数据,特别是Web元数据的技术。而RDF Schema(简称RDFS)则是用来定义描述所用到的“主语”、“谓词”、“宾语”的。这里可以用面向对象的思想来类比它们之间的关系。如果说RDF是用来完成实际工作的对象,那么RDF Schema就是用来定义对象的类。    RDF通过三元组的方式来描述资源,包括“主语”,“谓词”,“宾语”。描述三元组有很多方式,其中最重要的是以XML方式。以XML方式描述的好处就在于,这种方式不仅可以使人理解,而且可以使机器自动处理,更重要的是它可以在网络上自由的交互。    RDFS定义RDF词汇采用一种类似于面向对象的机制,也就是说我们需要定义的类都是预先定义的rdfs:Resource的子类,也可以是某个我们已经定义好的某个类的子类。这样做的好处就是任何人都可以利用现有的词汇来定义新词汇,从而大大节省工作量,并成为一种面向对象中重用思想的体现。

2.4  Ontology和OWL

    Ontology的概念最初起源于领域,可以追溯到公元前古希腊哲学家亚里士多德它在哲学中的定义为“对世界上客观存在物的系统地描述,即存在论”,是客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质。近年来,计算机界关于本体论研究的成果数量正逐步增多,质量也逐渐提高。并且在1998年6月召开了关于本体论的第一次国际会议— “信息系统中的形式化本体论国际会议”,标志着这一研究领域正在走向繁荣和成熟。    语义网是对未来网络的一个设想,在这样的网络中,信息都被赋予了明确的含义,机器能够自动地处理和集成网上可用的信息。语义网使用XML来定义定制的标签格式以及用RDF的灵活性来表达数据,下一步需要的就是一种Ontology的网络语言(比如OWL)来描述网络文档中的术语的明确含义和它们之间的关系。OWL是w3c推荐的语义网络“栈”中的一部分,这个“栈”被表达如下:
名称描述
XML结构化文档的表层语法,对文档没有任何语义约束。
XML Schema定义XML文档的结构约束的语言。
RDF对象(或者资源)以及它们之间关系的数据模型,为数据模型提供了简单的语义,这些数据模型能够用XML语法进行表达。
RDF Schema描述RDF资源的的属性和类型的词汇表,提供了对这些属性和类型的普遍层次的语义。
OWL添加了更多的用于描述属性和类型的词汇,例如类型之间的不相交性(disjointness),基数(cardinality),等价性,属性的更丰富的类型,属性特征(例如对称性,symmetry),以及枚举类型(enumerated classes)。

3  基于Ontology的知识管理

3.1  Ontology在知识管理中的作用

    Ontology是语义Web中的一项关键技术,它的理论基础是人工智能。Ontology被广泛应用主要是因为“它可以使人和机器之间进行有效的沟通”,对于一个组织来说(特别是比较大的组织)运用本体思想和相应的工具就可以更有效的对知识进行管理。Ontology主要应用于智能信息集成、企业信息系统、信息恢复、商务等领域。    我们用以下三个步骤应用本体思想对知识进行管理:    (1)首先我们要建立各个领域内的本体,然后把这些相对孤立的本体链接起来。这里的各个领域应在较小的范围内,在建立本体的时候我们基于人工智能和语言处理的知识,并有相应的开发工具。    (2)存储与表示本体。对于本体的描述方法有很多,但是我们要解决的问题是如何在当今的环境下进行知识管理,所以描述本体的方法必须适合于网络的传输。正如前文提到的,XML是一个解决这个问题很好的方法,在XML的基础上我们建立了RDF和RDFS对本体进行描述,这样我们就可以很好的对本体进行管理。    (3)搜索和浏览本体的信息。在对本体描述和储存之后我们要建立相应的搜索引擎对本体进行查询,当然这种查询不是我们现在基于关键词的查询,而是基于语意的查询。

3.2  RDF的语法简介

    RDF一般的表示形式有三种:XML形式、标示图、三元组。它们虽然表示方法不同,但表示的模型都是一样的,既包括主语、谓词和宾语。如:<rdf:RDF   xmlns:rd=”http://www.w3c.org/1999/02/22-rdf-syntax- ns#” xmlns:dc=”http://purl.org/meta data/Dublin_core#”> <rdf:Description about=” ”>  <dc:creator>Mick Hume< /dc:creator ></rdf:Description><rdf:Description about=” ”>  <dc:creator>Mick Hume< /dc:creator ></rdf:Description></rdf:RDF>    这个声明的意思很明显,就是列出了Mick Hume所写的两篇文章。我们可以完整地看一下使用这个语法的不同的元数据模型。    首先使用这个句型:Mick Hume is the creator of Mick Hume is the creator of    其次标示如图2所示。图2    最后是作为三元组集合的本质的元数据模型:{author,[ ], “Mick Hume”}{author,[ ], “Mick Hume”}    下面是构成语法的元素:    元素rdf:Description    属性元素    容器    关于声明的声明

3.3  RDFS简介

    RDF Schema的作用就是允许用户自定义一些词汇来描述资源,并且使用某些特定属性来描述资源和资源之间的关系。例如Spiked公司想描述一个类ex:book,并且使用属性spiked:Name、spiked:Author、spiked:Pages等来描述这个类的若干个实例。类似的还有那些对图书资源比较感兴趣的RDF开发人员可能会描述 ex2:Book或者ex2:MagazineArtical这样的类,并使用ex2:author、 ex2:title 、ex2:subject之类的属性来描述这些类。这些类和属性被称为RDF词汇,它们需要通过RDF词汇描述语言:RDF Schema来定义。

3.4  RDF/RDFS查询

    对RDF/RDFS的查询有三个层次:在语法层次上的查询;在结构层次上的查询;在语意层次上的查询。3.4.1 语法层次上的查询    任何一个格式正确的RDF或是RDFS文档都是一个XML文件,所以在对于语法这个层次上的查询,本质上与在不理解语义的情况下对XML文件的查询没有什么不同,所以现在比较成熟的XQuery技术完全可以解决这个层次上的查询。    XQuery是一个从XML格式的文档中获取数据的查询语言,起源于XML数据查询语言Quilt。并将XPath版本2.0作为其子集。Quilt有很多非常优秀的特性,集SQL、 ODMG、XPath1.0、XQL以及XML-QL的诸多特性于一身。随着存储在XML文档中的信息量的增长,对于能高效的存取和查询XML的信息,Quilt显示出了它的不足,于是全新的XQuery数据查询语言诞生了。3.4.2 结构层次上的查询    这种方法的好处在于它是直接基于模型,可独立于特定的语法。只要是符合模型的数据都可以查询出来。RDQL是RDF Data Query Language的缩写,是一种以模型为向导的类似于SQL的专门用于检索RDF的查询语言。目前一些实际的应用已经使用了RDQL。RDQL的是由多种语言演进而来,包含由R.V. Guha、 Ora Lassila、 Eric Miller 及Dan Brickley等人于1998年所撰写的W3C查询语言会议报告:Enabling Inference。


首先查询Wrox公司有一些什么文章:SELECT ?xWHERE (?x  “Wrox”  "John Smith")结果是:x                            =============================……/Articles/00064d3.htm 然后是一个复杂的查询,查询文章和作者的对应关系:SELECT ?article  ?NameWHERE (?article  “Author”   ?z)      (?z  “Name”  ?Name)article                        | Name============================================……/Articles/00054c3.htm   | " Mick Hume"   ……/Articles/00064d3.htm | " Hellen"    这种查询方式对比与第一种方式有优点,但也有不足,例如我们用RDFS定义FirstAuthor是Autor的一个SubProperty,如果我们想查询一本书的作者是谁的时候我们只能知道他的Author是谁,而他的第一作者可能就查不到。这是因为对于FirstAuthor与Author之间的关系我们只在RDFS中定义,而在RDF文件中没有。

4  结束语

    语义Web是未来Web的发展方向,目前基于Web的一切应用的未来也必然基于语义Web,由于语义Web是一个比较新的思想,目前的研究还不是很成熟,我们所做的是一些有益的探索,希望能对今后的研究给予帮助和启发。

[1]RDF/XML Syntax Specification (Revised). W3C Recommendation 10 February 2004: http://www.w3.org/TR/ rdf-syntax-grammar[2]RDF Vocabulary Description Language 1.0: RDF Schema. W3C Recommendation 10 February 2006,http://www.w3.org/TR/rdf-primer[3]RDF Primer.W3C Recommendation 10 February 2004,http://www.w3.org/TR/rdf-primer/[4]RDQL - A Query Language for RDF. W3C Member Submission 9 January 2004,http://www.w3.org/Submission/ RDQL/[5]A Programmer's Introduction to RDQL. Andy Seaborne 2005,Jena Tutorial[6]Mark Birbeck等. XML高级编程(第二版).机械出版社,2002[7]Dr John Davies,The Semantic Web A Guide to the Future of XML Web Services and Knowledge Management

图片内容