Ontology及其在知识组织中的应用

摘要:随着信息技术的不断发展,知识组织的技术手段也逐渐趋于丰富,Ontology就是一种新型的知识组织方法工具。对Ontology的概念、构成和分类进行了简单介绍,并对它与传统知识组织工具进行了辨析,最后还具体分析了Ontology在知识组织中的应用。

关键词:Ontology 知识组织 应用

中***分类号:TP3文献标志码:A文章编号:1673-291X(2011)27-0215-03

一、Ontology概述

1.Ontology的起源和概念。Ontology(本体)原本是一个哲学上的概念,是表述哲学理论的一个术语,由希腊ontos(存在)与logos(学说、言论)派生而来。在西方哲学史中,它被解释为“关于存在及其本质和规律的学说、言论”。可以这样理解,作为一个哲学概念,Ontology是对客观世界的一个特定的分类体系,这个体系不依赖于任何特定的描述语言。

近一二十年来,Ontology也逐渐受到计算机科学科学界的关注,从研究的情况可以看出,把现实世界的某个应用领域抽象或概括成一组概念及概念间的关系,构造这个领域的本体,会使计算机对该领域的知识的处理与组织大为方便。因此本体论现在已被广泛应用在知识工程、知识表示、信息检索、信息摘要、知识管理等领域。

在知识工程领域,Neches等人最早给出了对于Ontology的定义,他认为,“一个Ontology定义了组成相关领域词汇的基本术语和关系,以及用于组合术语和关系以定义词汇的外延的规则。”(Neches R,1991)

此后,很多学者都对ontology给出了自己的定义,但是始终没有形成一个统一的认识。美国斯坦福大学的知识系统实验室的学者Gruber指出,“An ontology is an explicit specification of a conceptualization”(Gruber,1993),即“本体是概念化的一个明确的规范说明”,几年后,学者Borst对这个定义作了进一步的修改,认为,“Anontology is a explicitly formal specification of shared conceptualization”(Borst,1997),即“本体是对共享概念模型的明确的形式化的规范说明”。这两个定义后来成为人们经常引用的对于本体的定义。

其中,“明确(explicitly)”是指所用的概念的类型及其约束都必须是明确定义的,“形式化(formal)”是指Ontology必须是计算机可读的,“conceptualization”是指通过抽象客观世界的概念而得到的一些概念模型,“共享(shared)则表示Ontology代表的是该领域所接受的共性知识,是公认的概念集合。

2.Ontology的构成。Ontology本身可以看作是对现实世界的一种表示思想和方法,这种方法用本体的思想来分析该领域的概念集合,而后将这些概念集合使用一定的表示方法进行组织。本体的研究方法认为,本体表示一般具有以下共同的特征:该领域存在着对象(object);对象具有属性(property or attribute),属性可以赋值(value);对象可存在于不同关系(relation)之中;属性和关系会随时间的推移而变化;不同的时刻会有不同的事件(event)发生;在某一时刻存在着某一特定的过程(process),对象参与过程其中;领域及其对象处于不同的状态(state);某一事件能对其它事件和状态产生影响(effect);对象由部分(part)组成。

因此,按照上述方法分析,一个Ontology应该包括以下几个方面的内容:(1)该领域对象类的层次体系,即不同对象之间存在着is-a、kind-of、part-of的关系。根据上面的特征,这里的类就是上述对象经抽象加工后的集合。本体能够通过这个层次体系将该领域的概念组织成一个树形体系。(2)对象类的属性以及属性的取值范围。上面提到,属性可以赋值,因此属性的值存在取值范围的问题,而属性及其取值范围是由具体的对象决定的,并且这些属性可以根据对象间等级关系继承和改变。(3)对象之间除了层级关系之外的其他语义关系。对象除了属性之外,还有相互之间的关系。除了一般的层次关系外,对象间还可能存在很多种关系,例如cause-by,result-in等等。语义关系广泛的存在于知识本体当中。(4)本体还包括一定的推理规则,也就是所谓的公理(axiom),这些公理代表永真的事实,再用本体的语义关系进行逻辑推理时,可以起到很大的作用。

二、Ontology的分类

根据描述对象的不同,可以将Ontology分为以下几类:(1)领域本体(Domain Ontology):领域本体在一个特定的领域内可重用,它们提供该特定领域的概念定义和概念之间的关系,提供该领域中发生的活动以及该领域的主要理论和基本原理等。对特定领域的本体研究和开发目前已涉及许多领域,包括企业本体、医学概念本体、酶催化生物医学本体、陶瓷材料机械属性本体等等。(2)通用本体(Generic Ontology):它覆盖了若干个领域或者具有通用性,通常也叫作核心本体(Core Ontology)。它包括的是关于世界的一般性知识和概念,比如时间、空间、状态等等。因此,通用本体可以跨学科领域使用。比较有代表性的通用本体当属CYC。(3)语言学本体(Terminological Ontology):语言学本体,顾名思义是指关于语言、词汇等的本体。典型的实例有GUM(generalized upper model)和WordNet。Wordnet是基于心理语言规则的英文词典, 由Pronceton大学研制,它以synsets为单位组织信息,其中synsets是指特定的上下文环境中可互换的同义词的集合。(4)知识表示本体(Representational Ontology):并不将其本身限定于任何特定领域,这些Ontology规定实体的表示方式却不规定什么应该表示。一种众所周知的表示Ontology就是框架Ontology,其中定义框架、槽、槽约束,并允许以面向对象或基于框架的方式表达知识。(5)任务本体(Task Ontology)或应用本体(Application Ontology):这是为某一特定的应用而建立的本体。与上述本体所不同的是,任务本体主要涉及动态知识,而不是静态知识。比如,在某***书馆建立数字***书馆的过程中,可以建立该***书馆的数字资源的本体,应用于该***书馆的信息表示与检索中。

除此之外,还有人根据Ontology对概念意义说明的形式化程度对其进行了分类,具体的将本体划分为以下几种:(1)完全非形式化的(highly informal): 完全采用自然语言表示的本体。(2)结构非形式化 (structred informal): 采用受限的或结构化的自然语言表示,以减少二义性。比如Enterprise ontology文字版本。(3)半形式化的(half informal):这是一种用人工定义的形式语言表达本体。比如Enterprise ontology的Ontolingua版本。(4)严格形式化的(rigorously informal):在这种本体中,所有术语都具有形式化的语义,并能在某种程度上证明包括一致性和完整性等方面的属性。比如:TOVE(T Oronto Virtual Enterprise)。

三、知识本体与传统知识组织工具的关系

知识本体作为一种知识组织工具,与传统的知识组织工具――叙词表,分类法似乎有着很大的相同之处。但是,知识本体又不同于叙词表和分类法,具体的讲,知识本体与传统的知识组织工具有着以下的区别和联系:(1)传统的知识组织工具中的术语均是规范的科学语言,而Ontology中的概念、术语可以用自然语言和半自然语言来表达。这是两者在逻辑表达形式上的区别。(2) 分类法、叙此表中确实反映了术语之间的一些语义关联,但是Ontology包含的术语之间的关系更为丰富、深入、全面和细致,也正是因为这些关系,才使我们能够无需借助专业领域术语,实现语义检索以及对领域知识的自然、半自然语言表达。(3)传统知识组织工具中,知识点的组织分布一般是线性的、一维的,而Ontology中的知识点、概念分布是网状的,它不单纯是一***面的网格,而是一个在四维空间中伸缩动态的、跨时空的网状结构。(4)Ontology是一个开放集成的体系,它的底层知识库与概念集可以随着学科领域的更新和发展随时进行修正和更新,在这一点上,传统知识组织工具“望尘莫及”。(5)传统知识组织工具相对稳定,结构保守而单一,不可能经常修订。而Ontology的结构应该是一个基于XML的开放体系,可以被复用,可以增加或减少枝节,可以对每个枝节处进行修改和校验,可以对原有的模式进行保存。 而且,将概念内容掏空后的框架skeleton又可以用作其它领域本体的框架。譬如,花卉学本体一旦构建完成,如果将其中的木本植物分类部分去掉,就变成为“草本花卉本体”;如果将植物分类树的其它不属于观赏植物的部分添加完整,那么就可以成为一个完整的植物学本体;再将植物学本体推而广之,添加上分类体系框架相同的微生物学和动物学的知识与术语词汇,就会成为完整的宏观生物学本体。

四、Ontology对于知识组织的作用及未来发展方向

从前面的介绍我们可以看出,Ontology对于知识组织而言,可以作为一个较有效的组织工具。尤其是Ontology所建立起来的概念体系,往往是进行知识组织的基础。它在思维、信息传播、组织和检索中都到了十分关键的作用。总的来说,ontology对知识组织而言具有以下几个方面的作用(Dagobert Soergel,1999):(1)为各个领域以及领域间的关系提供了一种语义路径***,因此可以在组织知识时提供方向性的指引或者作为一种参考工具。具体的,包括以下几项具体的功能:1)将概念和术语进行联系并提供定义;2)在分类/本体的体系环境下对概念进行阐述与解释;3)有助于跨学科、跨语言和跨文化的概念、术语建立关联。(2)促进交流与学习。通过提供概念体系结构,来帮助作者和读者;支持各种学习过程和培训资料的开发,并可以激励学生去创造新的概念结构。(3)为研究项目和实施方案的设计提供概念基础:帮助研究者和实施人员了解该研究项目、***策、计划或实施方案的概念语境,并将问题结构化;为更多类似的、长期性的研究及成果中所涉及的变量和指标提供一致的定义。(4)为各种活动提供分类指南:例如对疾病诊断的分类,用来安排任务的员工技能分类表以及供顾客使用的商品分类表等。(5)支持情报检索:为终端用户检索(end-user searching)提供基于知识的支持(例如,目录树、搜索主题的指南性分类,为了找到检索概念而对分层或概念***进行的浏览,将用户提问术语映射为数据库中使用的标识符或是自由文本索引中使用的多种自然语言的表达式);支持等级式扩展检索;支持检索结果的结构化显示;为标引提供工具(词表控制,面向用户或问题的标引)。

另外,知识本体还可以为KBS(知识库系统)提供概念基础;为软件系统中数据共享的定义和对象层次提供概念基础;可以跨学科、跨语言、跨文化的进行上述工作;可以作为单语、双语或多语种字典供人们使用,并且可以作为自然语言处理的字典/知识库―对数据抽取和自动摘要/标引进行机器翻译和自然语言理解。

从知识组织的角度来看,知识本体的确比传统的知识组织工具更适合于网络环境下的知识组织与表达,但是不管怎样,其目的都是为了有助于信息检索和沟通,因而如何将本体这一知识组织工具的研究继续深入下去,实现信息的智能化检索以及语义网络这一第三代网络系统,将是知识组织专家未来的研究方向。

参考文献:

[1]常春.Ontology在信息管理领域的研究背景[J].现代***书情报技术,2003,(6).

[2]邓志鸿,唐世渭,等.Ontology研究综述[J].北京大学学报:自然科学版,2002,(5).

[3]赖茂生.Ontology与知识组织[C].信息构建与情报学理论方法新发展学术研讨会论文集,2003:11.

[4]李景,钱平.叙词表与本体的区别与联系[J].中国***书馆学报,2004,(1).

[5]阮明淑,温达茂.Ontology应用于知识组织之初探[J].佛教***书馆馆讯,2002,(12).

[6]王昕.综述:本体的概念、方法和应用[EB/OL].省略/papers/knowledge/Ontology%20overview.htm.

[7]夏祖奇.Ontology与信息检索[C].信息构建与情报学理论方法新发展学术研讨会论文集,2003:11.

[8]B.Chandrasekaran,John R.Josephson,V.Richard Benjamins.What are Ontologies,and Why do we need them.IEEE Intelligent Systems.

January/February 1999.

[9]B.C.Vickery.Ontologies.Journal of Information Science.23(4)1997,pp.277-286.

[10]Dagobert Soergel.The rise of ontologies or the reinvention of classification.Journal of the American Society for Information Science, October 1999,(12).

Ontology及其在知识组织中的应用

转载请注明出处学文网 » Ontology及其在知识组织中的应用

学习

金币投资面临历史机遇

阅读(19)

本文为您介绍金币投资面临历史机遇,内容包括金条和金币哪个投资好,金币银币有必要投资吗。金币与其他实物黄金产品相比,其兑现性方便、权威性高、市价偏低和集藏附加值大等优势,将无疑为投资金币的后市发展奠定广阔空间。经过11个月的大幅

学习

利玛之“死”

阅读(49)

本文为您介绍利玛之“死”,内容包括利玛颜值巅峰,模特利马身高。曾经红极一时的利玛,其创始管理层为了牢牢地将控制权把握在手中,在融资过程中一而再、再而三地做出了错误的选择。错过用友光明家具并不是利玛引进的第一位投资者,用友早在19

学习

滑雪装备大盘点

阅读(30)

本文为您介绍滑雪装备大盘点,内容包括滑雪装备性价比排行榜,滑雪装备一套多少钱。滑雪板滑雪板一般分为高山板、越野冬季两项板、跳台板、自由式板、单板等。在选择滑雪板的长度时,最长应以不超过本人手臂上举手腕部高度为限,最短不应短于

学习

1.3升羚羊轿车问世

阅读(15)

本文为您介绍1.3升羚羊轿车问世,内容包括羚羊车的尺寸,羚羊轿车多大排量。长安汽车集团开发、研制的13升羚羊世纪星近日通过鉴定,即将投入批量生产。随着我国经济的进一步发展和私人购车的日趋活跃、稳步向上无疑仍将会是2001年轿车市场

学习

微笑曲线新解

阅读(31)

本文为您介绍微笑曲线新解,内容包括基金微笑曲线讲解,微笑曲线3是什么。宏集创办人施振荣先生早在90年代提出的微笑曲线,为台湾制造业蓬勃发展的时期作了最好的批注。低毛利、高产量的制造能力,曾经为台湾创造许多世界第一,包括笔记本电脑

学习

张宪华的商圈舞步

阅读(34)

合着时代旋律,踩着改革节奏,时而优雅前行,时而美丽转身,时而稳健轻趟,时而激越趋进,在异彩纷呈的商业大舞台上,张宪华俨然是个舞林高手。《幸福・悦读》作为精英人物的精英期刊,从2009年起,每期将强势推出《精英论道》栏目,反映社会各界精英在处世

学习

简论O2O商业模式

阅读(16)

本文为您介绍简论O2O商业模式,内容包括o2o商业模式的理解,简述o2o商业模式。文章就近期饿了么和美团外卖开展的外卖行业的大战来对O2O商业模式进行简单的探讨,文章首先对O2O模式进行简单的介绍并将它以往的商业模式进行比较来分析这种模

学习

追忆百年泊头火柴 对抗“洋火”的先驱

阅读(18)

自从打火机、燃气灶兴起,火柴的存在感越来越弱,擦亮火柴一瞬间的光芒在人们记忆中日渐黯淡。就像百年老店河北泊头火柴厂,曾经那么的骄傲:1913年注册商标时,泊头火柴是当地第一个;公私合营和社会主义改造时,它在全国领先;上世纪九十年代

学习

我在《VOGUE》做时尚编辑

阅读(22)

本文为您介绍我在《VOGUE》做时尚编辑,内容包括时尚编辑vogue,vogue时尚编辑工作。现实不同于梦想2008年,22岁的路茗蕾在西班牙马德里大学新闻系攻读硕士学位,而成为时尚媒体编辑是她的职业理想。在被流光溢彩的时尚风潮迷昏眼时,《VOGUE》

学习

张怡筠:遇到更幸福的自己

阅读(22)

张怡筠简介美国乔治亚理工学院心理学博士知名心理学家、情商研究专家,第一位以中文写作EQ专业书籍的学者,著有《工作其实很简单》、《幸福其实很简单》等书资深企业培训师(630多家企业)电视节目“心灵花园”“幸福魔方”“心理访谈”嘉宾

学习

摩托日记 第7期

阅读(19)

circularexploration周边探险胡宁-德洛斯安第斯镇并没有它湖畔的兄弟那么幸运,它只能在一个被遗忘的文明角落刀耕火种。为了让小镇恢复生气,人们在此建了一些厂房。这就是我们的朋友工作的地方。尽管如此,它依然无法摆脱像一潭死水般的单调

学习

瑟瑟古竹音

阅读(35)

认识红邸从认识它的竹子开始。最初听一位老先生提起这些竹子,是以“竹编工艺技术”来描述它的,然而怎么竹编?编出来的又是何种样子,在我的脑海中始终没个固定形象。直至前去拜访,我才明了这是一种以往印象中遍寻不到的体验;如果你想寻找一处

学习

捕鱼的技巧等

阅读(22)

本文为您介绍捕鱼的技巧等,内容包括捕鱼技巧的书籍,捕鱼过程怎么写。捕鱼的技巧日本北海道出产一种味道珍奇的鳗鱼,海边渔村的许多渔民都以捕捞鳗鱼为生。鳗鱼的生命非常脆弱,只要一离开深海区,要不了半天就会全部死亡。奇怪的是有一位老渔

学习

小学生“过早恋”现象探究

阅读(19)

本文为您介绍小学生“过早恋”现象探究,内容包括小学生女孩青春期的问题,班上出现早恋现象怎么处理。由于生活水平的提高,现在孩子普遍成熟早,性机能的早熟、外界性信息的刺激及小学生的好奇模仿心理,导致小学生“过早恋”现象的产生。“过

学习

努力构建中国开放型经济新体制

阅读(29)

本文为您介绍努力构建中国开放型经济新体制,内容包括十九大报告指出开放型经济新体制,开放型经济新体制试点示范城市。中共十八届三中全会再次提出要加快完善开放型经济,要构建开放型经济新体制,要适应经济全球化新形势,必须推动对内对外开

学习

国语学习计划范文

阅读(29)

国语学习计划范文第1篇尊敬的老师:您好!我是来自XX班的XXX,经过慎重的考虑,决定申请韩国XXXX大学会计专业的交换生名额。从12岁开始,我就开始接触韩国语,便对韩国语产生了浓厚的兴趣,并且在业余时间通过各种途径了解韩国文化以及韩国语。随着年

学习

大学学习部计划范文

阅读(21)

担任系学习部部长的职务,我感到非常荣幸,因为这代表着老师和同学对我的信任。同时,我也感受到了肩上的压力。有句话说得很好,学习是学生的天职,教学质量是学校的生命线。自然,我担负起了全系的学习工作这一光荣而艰巨的任务。因此我对自己拟

学习

关注残疾人运动 构建和谐体育

阅读(30)

本文为您介绍关注残疾人运动 构建和谐体育,内容包括残疾人体育运动宗旨是,残疾人全民健身工作计划。近些年来,随着体育事业的蓬勃发展,奥运会中我国运动健儿再接再厉,取得了可喜可贺的成绩。但在关注这一活动的同时,我们也不要忽视了另外一

学习

关于刑事准判例之构建论文

阅读(20)

本文为您介绍关于刑事准判例之构建论文,内容包括刑事案件证据指引论文,刑事审判参考案例格式。准判例的提出——案例指导制度的落实。准判例的构建——确立相关案例,确定案例所欲解决的问题,联系“主要问题”部分的争议及学界的学理之争,从

学习

我的“理财计划”

阅读(25)

本文为您介绍我的“理财计划”,内容包括我的理财计划怎么写,理财计划模板。我的“理财计划”莫燕濠假如我有零花钱,该怎样花呢?当然要节省一点啦,否则就超支了。所以,我为自己定了一个“理财计划”:1,首先肯定不能亏待自己。我要拿20%的MONEY

学习

个人年度目标计划范文

阅读(29)

本文为您介绍个人年度目标计划范文,内容包括个人年度工作计划范文集合9篇,投资公司年度目标及计划模板。个人年度目标计划范文第1篇一、对象和范围实行诫勉、待岗、末位淘汰的范围为全县副科以上领导干部。二、原则和依据对领导干部实行

学习

我们自己组织了一个宣传队

阅读(32)

又到岁末了,各大电视台大张旗鼓地准备春节的节目,各个单位也热闹地联欢和聚会,不由得让我想起了我的青少年时代。那时候虽然条件不比现在,但我们对编排节目展示自己热情很高。这是一张拍摄于1967年的照片,照片上,五个花季少女一脸灿烂的阳光。