基于语义P2P信息共享的技术研究

摘要:本文引入语义的概念,通过计算结点间的语义相似度,构建了基于语义的P2P局部性网络模型并设计了基于语义的推荐式搜索算法。该算法能根据搜索请求中的语义信息,把网络中的结点推荐给搜索源结点。系统实现表明,基于语义P2P的信息检索,能够减少搜索在P2P网络中的回路,从而减少P2P网络中的重复消息数量,提高了检索的效率。

关键词:Peer-to-peer;P2P信息共享;语义P2P搜索

中***分类号:TP393 文献标识码:A文章编号:1007-9599 (2011) 07-0000-02

Technology Research Based on Semantic P2P Information Sharing

Xie Weichao

(China Electronic System Engineering Corporation,Beijing065201,China)

Abstract:In this paper,by introducing the concept of semantics and calculating the semantic similarity among peers,we set up the partial P2P network model which is based on semantics.On the basis of this model,we design the recommendation searching algorithm which is based on semantics.The algorithm require searching request include semantic information,which can be used to recommend peers to the requesters in the network.The performance of the system shows that the partial P2P network model and the related P2P recommendation searching algorithm can help to reduce the number of peers and the route of searching in P2P networks,which in turn lead to a decline of the replicated messages in P2P networks and the efficiency of searching process.

Keywords:Peer-to-peer;P2P Information Sharing;Semantic P2P Search.

一、基于语义的P2P局部性网络模型

局部性网络中结点会按照一定机制聚集在一起,那么这些结点就形成了簇(Cluster),在局部性网络中,对于任何两个结点p和q,将满足p和q在局部性网络语义距离定义为p和q的簇距离(Cluster Distance),本文将该值记为(p,q)。

局部性构造的基本原则是依据结点p和q的簇距离来决定结点p和q是否连接,即:

(1)

其中Pr(Connect(p,q))表示结点p和q存在连接的概率。

在语义相似度研究领域,研究者们提出了许多概念相似性的度量方法[1]。Rada[2]证明两个概念在概念层次拓扑上的最短路径,可有效地定义两个概念的相似度。显然,在按此种方法计算概念A和概念B相似度时,如果限制只能沿概念层次拓扑向上求最短路径,在向上求解时一定会找到一个共同概念C,而概念C到概念A和概念B的较长的一条路径长度实际上就是本文定义中(p,q)(此处只考虑每个结点只有一个概念的情况)的近似值。

上面给出的实际上是如何计算两个概念A和概念B的(A,B)值,而一个实际的P2P结点上共享的信息将是包含概念层次拓扑上的多个概念的概念集合,即

(p)={A1,A2,..,Am},(q)={B1,B2,..,Bm}。

此时两个结点的(p,q)值可在两个概念的(A,B)值和结点对信息概念存在的兴趣差别(可用式(2)算出)基础上按式(3)进行计算:

(2)

(3)

式(2)中的Di是指结点p共享信息中含有概念Ai的文档个数,所以I(p,Ai)就是结点p中包含概念Ai的文档个数在其共享文档中占的比例。以该比例值为基础就能完成结点距离值(p,q)的计算。

文献[2]同时指出,两个概念在概念树上所处的深度也决定了两个概念的相似程度。提出了一种有效地度量IS-A概念树上两个概念之间相似度的函数,见公式:

(4)

其中:T1,T2是概念树上的任意两个概念;l是它们在概念树上的最短路径;h是它们的深度。公式(4)表明,两个概念的相似度关于l单调递减,关于h单调递增。α和β用来调整l和h对概念相似度的影响程度。

基于以上语义相似度的度量方法,能够把随机分布的结点,按照语义相似的思想,把内容相近的结点在局部形成簇,完成局部性网络的构造。

二、基于语义的P2P局部性网络推荐式搜索算法

P2P推荐式路由[5]的工作过程如***1所示,即假定从结点s发出一查询请求req,req首先发往p1(可能包括其它结点,此处略去),如果p1可以应答,则应答s;否则,p1根据一定的计算推荐s往p2(也可能是包含p2在内的多个结点)处路由,此时,s路由req到p2,p2处的处理和p1一样,依此类推,直到req的应答满足要求(在***1中是找到d),查询结束。

***1推荐式路由

通过将P2P推荐式路由与语义相结合就构成了P2P的搜索算法。这里语义主要用于构成产生下一跳的View集。算法如下:

***2基于局部性的语义搜索算法

三、结果分析

通过编程实现一个原型系统对局部性P2P网络模型及其上的搜索算法进行验证。系统模拟搜索文献的过程,进行了三次搜索,得到的数据如下:

***3搜索结果分析

***4推荐结点语义相似度分析

如***3和***4,主要从两个方面对搜索结果进行分析,一是对每跳的搜索数量进行分析,从***3不难看出,前几跳的搜索数量不是很多,会出现一定的波动。这说明搜索主题不是当前搜索结点所在簇的所感兴趣的主题,经过几次推荐之后,搜索数量上升并保持稳定,这说明根据基于语义的推荐已经查找到对搜索主题兴趣度比较高的簇,因为本系统对于搜索过的结点不在进行重复搜索,所以在对搜索主题兴趣度比较高的簇查找完毕后,再推荐的结点就是对搜索主题比较感兴趣的一些零星结点,所以搜索到的数量开始下降。

另一方面,从推荐结点与搜索主题的语义相似度方面,也能够体现出搜索过程。如***4中所示,开始搜索时,推荐结点的语义相似度是比较低的,在找到对搜索主题感兴趣的簇后,结点语义相似度变高。当搜索离开这个簇时,语义相似度又开始下降。

四、结论

本文中基于语义的P2P搜索,通过系统的基于语义的自配置机制,每个peer根据其自身资源条件,尽可能地把与自己具有最相似偏好和行为的peer保持为邻居结点和相关结点。这样在网络中,peer将基于不同的偏好和行为形成不同的簇,并且在同一簇内,两个peer的偏好和行为越相似,则逻辑距离越近,反之亦然。这样,对于某个给定的查询,它的答案只在特定的结点簇,只需在该结点簇处理。通过实验表明,基于语义的自配置机制使peer能够根据信息偏好、行为和查询统计数据综合地确定和调整自己的重要结点的机制,使自己能以较小的代价检索到所需的数据。

参考文献:

[1]Budanitsky A,Hirst G.Semantic distance in WordNet:An experimental,application-oriented evaluation of five measures.In:Proc of the Workshop on WordNet and other Lexical Resources.2001

[2]Rada R,Mili H,Bicknell E,Blettner M.Development and application of a metric on semantic nets.IEEE Trans.on System,Man and Cybernetics,1989,19(1):17−30

[3]陈汉华,金海.SemreX一种基于语义相似度的P2P覆盖网络[J].软件学报,2006,4:1170-1181

[4]曹玮祺.语义Web中统一知识建模方法及机制研究[D].清华大学计算机科学与技术系知识工程学位论文,2003,1-80

[5]Stoica I,Morris R,Karger D.A scalable peer-to-peer lookup service for Internet applications.In:Govindan,ed.Proc.of the ACM SIGCOMM 2001.ACM Press,2001:149−160

基于语义P2P信息共享的技术研究

转载请注明出处学文网 » 基于语义P2P信息共享的技术研究

学习

育婴与禁忌

阅读(25)

本文所讲述的有关育婴的禁忌是千百年来中国民间形成的一种俗信,所介绍的禁忌现今仍在很多地方普遍存在着。不过这些禁忌总的来讲是属于民俗学范畴之内的,反映了民众期望婴儿健康成长的美好愿望,与科学育养婴儿无涉。床神信仰婴儿主要受到床

学习

机架加工专用夹具

阅读(31)

本文为您介绍机架加工专用夹具,内容包括机加工实用夹具,通用夹具加工批量。本文根据一款具有典型结构的机架的加工要求,设计了一套专用夹具,能在立式数控车床上高精度、高效率完成对机架外圆进行加工。其特点是:结构简单、操作方便、成本低

学习

春季保健 “防”字当头

阅读(15)

春暖花开,万物复苏,也是人体内脏和器官生理功能开始活跃的时节。然而春天气候多变,细菌活跃,湿度降低,使老年人的养生问题也显得格外关键。一些你想不到的疾病就会在你不注意的时候找你的麻烦。因此,老年人春季养生,也应“防”字当头。春季锻炼

学习

神秘的江南古村落――城村

阅读(20)

本文为您介绍神秘的江南古村落――城村,内容包括古村落游记,江南古村落烟雨朦胧。城村,坐落于武夷山市的正南面,距市区35公里、主景区21公里,是武夷山一个历史最久远的古村落。被誉为“江南第一古城”的武夷山闽越王城的遗址就在这里。1996

学习

[幸福往事]薄命怜卿甘作妾

阅读(21)

她是个没上过大学的女子,早早嫁了,在柴米油盐和孩子之间尝试着写写小说,给自己起了典雅的出自《诗经》的笔名,叫做“琼瑶”。处女作出版之后没多久,她遇见他,已经使君有妇的平鑫涛,那是1964年。那一年她写了一篇《白狐》,说有县官曾经救过一只白

学习

《骆驼祥子》中祥子与《平凡的世界》中孙少平的比较

阅读(15)

本文为您介绍《骆驼祥子》中祥子与《平凡的世界》中孙少平的比较,内容包括骆驼祥子中祥子与老王的形象对比,骆驼祥子中的祥子前后的对比。《骆驼祥子》和《平凡的世界》分别以二十年代和七八十年代的中国为创作背景,塑造了一批社会最底层

学习

星座6/05~6/11

阅读(14)

巨蟹座:琐事缠身,机会上门,需要花时间内省的一周。白羊座21/3-19/4渴望自由,充分沟通,在改变中调适自我的一周。你会有很多走亲访友和出门的机会,或是进入新环境,需要不停与人沟通,并从中收获一些自我的创新方式,实现由内而外的改变。本周并无太

学习

舍得的人生哲学

阅读(22)

本文为您介绍舍得的人生哲学,内容包括舍得的故事和感悟,舍得的哲学美文。品味“舍得”,能分能合,能前能后,相辅相成,相融相合,可谓充满先人造词的无穷智慧,凝聚通古达今而又意蕴深远的灵光。古人将“舍”写作“拾”,表征用手拿东西给人,即“得”

学习

评程青的长篇小说《最温暖的寒夜》

阅读(18)

内容时下举国皆谈“中国梦”,对于文学而言,“中国梦”就是反映芸芸众生为梦想而进行的奋斗与努力。程青的长篇小说《最温暖的寒夜》(安徽人民出版社,2013.9)正是这样的作品,它对梦想给出了自己的答案:每个人面对寒夜与困境,始终坚信着“生活能变

学习

奥迪Q7 vs. BMW X5

阅读(36)

本文为您介绍奥迪Q7 vs. BMW X5,内容包括奥迪q74.0什么价格,奥迪q72022款落地价明细。作为商品的一种,汽车同样遵循着“先来者先得”的商业准则。然而,从A1到A8,从1系到7系,传统车型领域已经很难找到新的增长点。与之相对,SUV领域几乎还是一

学习

方言对汉语作为第二语言教学的影响

阅读(15)

汉语作为第二语言教学在国际上广受关注。目前,我国大力培养对外汉语教师,广设孔子学院,使得汉语在国际上的地位越来越重要,汉语作为第二语言教学十分有必要。在我们国家,方言在汉语中占据十分重要的地位。那么,方言是否对汉语作为第二语言教学

学习

浅谈初中生口语能力培养

阅读(20)

本文为您介绍浅谈初中生口语能力培养,内容包括浅析初中生口语能力的培养策略,口语教学培养学生什么能力。【内容摘要】语言是人类所特有的最重要的交际工具。随着时代的发展和社会的进步,社会口语交际变得越来越频繁,越来越生活化,而口语交

学习

老年夫妻也应有肌肤之亲

阅读(20)

的话在具有传统思想的老年人看来,步入老年之后,就该清心寡欲。于是,不少老年夫妻选择分床睡。可性学专家认为,分床之后,难免会产生孤独感、空虚感和失落感,不利于老年夫妻相濡以沫,互相照顾。更重要的是,分床之后,性生活可能变得越来越

学习

涵泳的再阐释

阅读(17)

本人在《朱熹对“涵泳”的阐释》一文中,阐述了朱熹的涵泳阅读理论,闾剑宝先生在《虚静反复长寻绎切记体验意兴多》一文中提出商榷,现对其商榷问题作出回应。一、商榷之问题1.闾文(为论述方便以下把闾先生的文章称为闾文)以朱熹与门人的一段涉

学习

浅谈通过财务共享中心提升财务管理水平

阅读(43)

本文为您介绍浅谈通过财务共享中心提升财务管理水平,内容包括财务共享中心的财务分析管理流程,财务共享中心如何提升管理实效。财务共享服务中心模式以较低的运营成本,较少的员工,提高财务信息管理的质量和效率,创造出更高的企业价值。越来

学习

让局域网共享无限畅通

阅读(27)

本文为您介绍让局域网共享无限畅通,内容包括无线局域网文件共享,局域网文件共享及检索。寝室几位兄弟都买电脑了,是通过路由器+交换机组建的一个能够共享上网的小型局域网。老大说了,既然大家的电脑都在同一个局域网内,以后大家电脑中有什

学习

火电厂锅炉高效超低NOx排放控制技术研究

阅读(17)

本文为您介绍火电厂锅炉高效超低NOx排放控制技术研究,内容包括控制燃煤锅炉nox排放的有效方法,燃煤锅炉nox排放系数怎样计算。【摘要】氮的氧化物对人体具有很大的伤害作用,火电厂是NOx排放的主要场所,国家对火电厂的NOx排放明确提出了严

学习

语言理解中句法和语义关系探析

阅读(21)

本文为您介绍语言理解中句法和语义关系探析,内容包括言语理解中句法和语义关系,句法功能与语义功能的变化。句法和语义是语言理解的重要组块,但学界对于句法和语义在语言理解中的地位和作用存在较多争议。本文从理论语言学和心理语言学两

学习

血迹亮红溶液增强瓷砖表面潜血手印技术研究

阅读(19)

本文为您介绍血迹亮红溶液增强瓷砖表面潜血手印技术研究,内容包括瓷砖被腐蚀发黑如何处理家用方法,漂白水能去除瓷砖渗色吗。目的该文探索一种实验室和犯罪现场上均可使用的瓷砖表面上血潜手印新型显现技术。方法把血迹亮红钠0.2g溶解到

学习

管状带式输送机技术研究

阅读(33)

本文为您介绍管状带式输送机技术研究,内容包括最新管状带式输送机标准,煤炭专用管状带式输送机定制。【摘要】本研究主要总结了管带机的结构特征、参数选择,并重点分析比较了管带机和普通带式输送机的结构、性能及运行维护。【关键词】管

学习

双语词典词源信息标注的认知语义学理据研究

阅读(35)

本文为您介绍双语词典词源信息标注的认知语义学理据研究,内容包括汉译英翻译中的语义学,英汉互译过程中语义差异。《英汉大词典》(以下简称《英汉大》)在词源信息标注方面做了有益且相对成功的尝试,开启了国内双语词典解释词源的先河。本文

学习

振动半主动控制技术研究现状与前景展望

阅读(24)

本文为您介绍振动半主动控制技术研究现状与前景展望,内容包括振动半主动控制器有哪些,苏州振动半主动控制器价格。在过去三十年左右的时间里,振动控制系统受到了广大研究者的普遍关注。这种保护系统可以用来降低自然灾害对土木工程建筑的