摘要:随着信息技术的不断发展,知识组织的技术手段也逐渐趋于丰富,Ontology就是一种新型的知识组织方法工具。对Ontology的概念、构成和分类进行了简单介绍,并对它与传统知识组织工具进行了辨析,最后还具体分析了Ontology在知识组织中的应用。
关键词:Ontology 知识组织 应用
中***分类号:TP3文献标志码:A文章编号:1673-291X(2011)27-0215-03
一、Ontology概述
1.Ontology的起源和概念。Ontology(本体)原本是一个哲学上的概念,是表述哲学理论的一个术语,由希腊ontos(存在)与logos(学说、言论)派生而来。在西方哲学史中,它被解释为“关于存在及其本质和规律的学说、言论”。可以这样理解,作为一个哲学概念,Ontology是对客观世界的一个特定的分类体系,这个体系不依赖于任何特定的描述语言。
近一二十年来,Ontology也逐渐受到计算机科学科学界的关注,从研究的情况可以看出,把现实世界的某个应用领域抽象或概括成一组概念及概念间的关系,构造这个领域的本体,会使计算机对该领域的知识的处理与组织大为方便。因此本体论现在已被广泛应用在知识工程、知识表示、信息检索、信息摘要、知识管理等领域。
在知识工程领域,Neches等人最早给出了对于Ontology的定义,他认为,“一个Ontology定义了组成相关领域词汇的基本术语和关系,以及用于组合术语和关系以定义词汇的外延的规则。”(Neches R,1991)
此后,很多学者都对ontology给出了自己的定义,但是始终没有形成一个统一的认识。美国斯坦福大学的知识系统实验室的学者Gruber指出,“An ontology is an explicit specification of a conceptualization”(Gruber,1993),即“本体是概念化的一个明确的规范说明”,几年后,学者Borst对这个定义作了进一步的修改,认为,“Anontology is a explicitly formal specification of shared conceptualization”(Borst,1997),即“本体是对共享概念模型的明确的形式化的规范说明”。这两个定义后来成为人们经常引用的对于本体的定义。
其中,“明确(explicitly)”是指所用的概念的类型及其约束都必须是明确定义的,“形式化(formal)”是指Ontology必须是计算机可读的,“conceptualization”是指通过抽象客观世界的概念而得到的一些概念模型,“共享(shared)则表示Ontology代表的是该领域所接受的共性知识,是公认的概念集合。
2.Ontology的构成。Ontology本身可以看作是对现实世界的一种表示思想和方法,这种方法用本体的思想来分析该领域的概念集合,而后将这些概念集合使用一定的表示方法进行组织。本体的研究方法认为,本体表示一般具有以下共同的特征:该领域存在着对象(object);对象具有属性(property or attribute),属性可以赋值(value);对象可存在于不同关系(relation)之中;属性和关系会随时间的推移而变化;不同的时刻会有不同的事件(event)发生;在某一时刻存在着某一特定的过程(process),对象参与过程其中;领域及其对象处于不同的状态(state);某一事件能对其它事件和状态产生影响(effect);对象由部分(part)组成。
因此,按照上述方法分析,一个Ontology应该包括以下几个方面的内容:(1)该领域对象类的层次体系,即不同对象之间存在着is-a、kind-of、part-of的关系。根据上面的特征,这里的类就是上述对象经抽象加工后的集合。本体能够通过这个层次体系将该领域的概念组织成一个树形体系。(2)对象类的属性以及属性的取值范围。上面提到,属性可以赋值,因此属性的值存在取值范围的问题,而属性及其取值范围是由具体的对象决定的,并且这些属性可以根据对象间等级关系继承和改变。(3)对象之间除了层级关系之外的其他语义关系。对象除了属性之外,还有相互之间的关系。除了一般的层次关系外,对象间还可能存在很多种关系,例如cause-by,result-in等等。语义关系广泛的存在于知识本体当中。(4)本体还包括一定的推理规则,也就是所谓的公理(axiom),这些公理代表永真的事实,再用本体的语义关系进行逻辑推理时,可以起到很大的作用。
二、Ontology的分类
根据描述对象的不同,可以将Ontology分为以下几类:(1)领域本体(Domain Ontology):领域本体在一个特定的领域内可重用,它们提供该特定领域的概念定义和概念之间的关系,提供该领域中发生的活动以及该领域的主要理论和基本原理等。对特定领域的本体研究和开发目前已涉及许多领域,包括企业本体、医学概念本体、酶催化生物医学本体、陶瓷材料机械属性本体等等。(2)通用本体(Generic Ontology):它覆盖了若干个领域或者具有通用性,通常也叫作核心本体(Core Ontology)。它包括的是关于世界的一般性知识和概念,比如时间、空间、状态等等。因此,通用本体可以跨学科领域使用。比较有代表性的通用本体当属CYC。(3)语言学本体(Terminological Ontology):语言学本体,顾名思义是指关于语言、词汇等的本体。典型的实例有GUM(generalized upper model)和WordNet。Wordnet是基于心理语言规则的英文词典, 由Pronceton大学研制,它以synsets为单位组织信息,其中synsets是指特定的上下文环境中可互换的同义词的集合。(4)知识表示本体(Representational Ontology):并不将其本身限定于任何特定领域,这些Ontology规定实体的表示方式却不规定什么应该表示。一种众所周知的表示Ontology就是框架Ontology,其中定义框架、槽、槽约束,并允许以面向对象或基于框架的方式表达知识。(5)任务本体(Task Ontology)或应用本体(Application Ontology):这是为某一特定的应用而建立的本体。与上述本体所不同的是,任务本体主要涉及动态知识,而不是静态知识。比如,在某***书馆建立数字***书馆的过程中,可以建立该***书馆的数字资源的本体,应用于该***书馆的信息表示与检索中。
除此之外,还有人根据Ontology对概念意义说明的形式化程度对其进行了分类,具体的将本体划分为以下几种:(1)完全非形式化的(highly informal): 完全采用自然语言表示的本体。(2)结构非形式化 (structred informal): 采用受限的或结构化的自然语言表示,以减少二义性。比如Enterprise ontology文字版本。(3)半形式化的(half informal):这是一种用人工定义的形式语言表达本体。比如Enterprise ontology的Ontolingua版本。(4)严格形式化的(rigorously informal):在这种本体中,所有术语都具有形式化的语义,并能在某种程度上证明包括一致性和完整性等方面的属性。比如:TOVE(T Oronto Virtual Enterprise)。
三、知识本体与传统知识组织工具的关系
知识本体作为一种知识组织工具,与传统的知识组织工具――叙词表,分类法似乎有着很大的相同之处。但是,知识本体又不同于叙词表和分类法,具体的讲,知识本体与传统的知识组织工具有着以下的区别和联系:(1)传统的知识组织工具中的术语均是规范的科学语言,而Ontology中的概念、术语可以用自然语言和半自然语言来表达。这是两者在逻辑表达形式上的区别。(2) 分类法、叙此表中确实反映了术语之间的一些语义关联,但是Ontology包含的术语之间的关系更为丰富、深入、全面和细致,也正是因为这些关系,才使我们能够无需借助专业领域术语,实现语义检索以及对领域知识的自然、半自然语言表达。(3)传统知识组织工具中,知识点的组织分布一般是线性的、一维的,而Ontology中的知识点、概念分布是网状的,它不单纯是一***面的网格,而是一个在四维空间中伸缩动态的、跨时空的网状结构。(4)Ontology是一个开放集成的体系,它的底层知识库与概念集可以随着学科领域的更新和发展随时进行修正和更新,在这一点上,传统知识组织工具“望尘莫及”。(5)传统知识组织工具相对稳定,结构保守而单一,不可能经常修订。而Ontology的结构应该是一个基于XML的开放体系,可以被复用,可以增加或减少枝节,可以对每个枝节处进行修改和校验,可以对原有的模式进行保存。 而且,将概念内容掏空后的框架skeleton又可以用作其它领域本体的框架。譬如,花卉学本体一旦构建完成,如果将其中的木本植物分类部分去掉,就变成为“草本花卉本体”;如果将植物分类树的其它不属于观赏植物的部分添加完整,那么就可以成为一个完整的植物学本体;再将植物学本体推而广之,添加上分类体系框架相同的微生物学和动物学的知识与术语词汇,就会成为完整的宏观生物学本体。
四、Ontology对于知识组织的作用及未来发展方向
从前面的介绍我们可以看出,Ontology对于知识组织而言,可以作为一个较有效的组织工具。尤其是Ontology所建立起来的概念体系,往往是进行知识组织的基础。它在思维、信息传播、组织和检索中都到了十分关键的作用。总的来说,ontology对知识组织而言具有以下几个方面的作用(Dagobert Soergel,1999):(1)为各个领域以及领域间的关系提供了一种语义路径***,因此可以在组织知识时提供方向性的指引或者作为一种参考工具。具体的,包括以下几项具体的功能:1)将概念和术语进行联系并提供定义;2)在分类/本体的体系环境下对概念进行阐述与解释;3)有助于跨学科、跨语言和跨文化的概念、术语建立关联。(2)促进交流与学习。通过提供概念体系结构,来帮助作者和读者;支持各种学习过程和培训资料的开发,并可以激励学生去创造新的概念结构。(3)为研究项目和实施方案的设计提供概念基础:帮助研究者和实施人员了解该研究项目、***策、计划或实施方案的概念语境,并将问题结构化;为更多类似的、长期性的研究及成果中所涉及的变量和指标提供一致的定义。(4)为各种活动提供分类指南:例如对疾病诊断的分类,用来安排任务的员工技能分类表以及供顾客使用的商品分类表等。(5)支持情报检索:为终端用户检索(end-user searching)提供基于知识的支持(例如,目录树、搜索主题的指南性分类,为了找到检索概念而对分层或概念***进行的浏览,将用户提问术语映射为数据库中使用的标识符或是自由文本索引中使用的多种自然语言的表达式);支持等级式扩展检索;支持检索结果的结构化显示;为标引提供工具(词表控制,面向用户或问题的标引)。
另外,知识本体还可以为KBS(知识库系统)提供概念基础;为软件系统中数据共享的定义和对象层次提供概念基础;可以跨学科、跨语言、跨文化的进行上述工作;可以作为单语、双语或多语种字典供人们使用,并且可以作为自然语言处理的字典/知识库―对数据抽取和自动摘要/标引进行机器翻译和自然语言理解。
从知识组织的角度来看,知识本体的确比传统的知识组织工具更适合于网络环境下的知识组织与表达,但是不管怎样,其目的都是为了有助于信息检索和沟通,因而如何将本体这一知识组织工具的研究继续深入下去,实现信息的智能化检索以及语义网络这一第三代网络系统,将是知识组织专家未来的研究方向。
参考文献:
[1]常春.Ontology在信息管理领域的研究背景[J].现代***书情报技术,2003,(6).
[2]邓志鸿,唐世渭,等.Ontology研究综述[J].北京大学学报:自然科学版,2002,(5).
[3]赖茂生.Ontology与知识组织[C].信息构建与情报学理论方法新发展学术研讨会论文集,2003:11.
[4]李景,钱平.叙词表与本体的区别与联系[J].中国***书馆学报,2004,(1).
[5]阮明淑,温达茂.Ontology应用于知识组织之初探[J].佛教***书馆馆讯,2002,(12).
[6]王昕.综述:本体的概念、方法和应用[EB/OL].省略/papers/knowledge/Ontology%20overview.htm.
[7]夏祖奇.Ontology与信息检索[C].信息构建与情报学理论方法新发展学术研讨会论文集,2003:11.
[8]B.Chandrasekaran,John R.Josephson,V.Richard Benjamins.What are Ontologies,and Why do we need them.IEEE Intelligent Systems.
January/February 1999.
[9]B.C.Vickery.Ontologies.Journal of Information Science.23(4)1997,pp.277-286.
[10]Dagobert Soergel.The rise of ontologies or the reinvention of classification.Journal of the American Society for Information Science, October 1999,(12).
转载请注明出处学文网 » Ontology及其在知识组织中的应用