社交网络中用户行为分析研究

摘 要: 如今社交网络已成为人与人之间保持联络、休闲娱乐的主要手段。用户是社交网络中的核心,其行为是深入了解社交网络运行机理的起点,对社交网络中用户行为的分析研究有非常大的价值。针对新浪微博中提取出的数据,利用社交网络分析中的节点与节点度、用户群与聚类系数,以及平均路径长度与直径进行了一系列研究,详细分析了用户在转发微博和评论微博方面的行为,说明了用户与用户之间存在的关联。

关键词: 社交网络; 用户行为; 节点度; 聚类系数; 平均路径长度

中***分类号:TP393 文献标志码:A 文章编号:1006-8228(2017)06-29-04

Analysis of social network user behavior

Li Xinhuan1,3, Zhao Yingding2,3

(1. College of Computer and Infomation, Jiangxi Agricultural University, Nanchang, Jiangxi 330045, China; 2. College of Software, Jiangxi Agricultural University; 3. Key Laboratory of Agricultural Information Technology of Jiangxi College)

Abstract: Today, social network has become a major means for people to keep in touch with people and entertainment. Users are the core of social networks, and their behavior is the starting point for in-depth understanding of the operation mechanism of social networks. According to the extracted data in Sina micro-blog, using the node and the node degree, the user group and the clustering coefficient, and average path length and diameter, etc. in social network analysis, studies and analyzes the users' behavior when they forwarding micro-blog or making comments on micro-blog, and shows the correlations between the user and the user.

Key words: social network; user behavior; node degrees; clustering coefficient; average path length

1 用粜形分析的重要性

随着web2.0快速的发展,社交网络既作为一个工具又作为一个交互平台,对用户建立***社交关系、互动交流等方面有深刻的影响[1]。社交网站( 新浪,脸谱、推特等)的发展为社交网络研究提供了最初的数据以及事实根据。社交网络中数据是非常庞大的,利用相关技术把它提取出来,但若不加以整理分类,便会显得杂乱无章,毫无头绪,重要的数据也会变成一堆无用的数字而已。这时就需要对这些数据进行分析研究,归纳整理,得出有意义的结论[2]。同时,对社交网络中的用户行为进行分析研究,也为后续的研究指明了动机和目的。

2 社交网络中用户行为分析

社交网络中用户的相关数据相当庞大,如用户的信息、用户的朋友数、粉丝数、的微博数等,利用新浪微博中的API接口对数据进行获取[3],再对提取的数据运用抽样调查的方式,对社交网络中的用户行为进行分析研究。

以某一类标签为对象,如音乐和运动,在提取的数据中抽取500个用户的信息进行分析,从而可以对这些用户在转发微博、评论微博等行为规律进行分析,通过呈现出的***像,分析归纳出用户在社交网络中的行为。社交网络中用户行为流程***如***1所示。

[新浪微博][提取出的数据][结束][抽取出500条数据][分析结果] [利用API接口提取数据][转发行为分析][评论行为分析]

2.1 分析方法

有越来越多的人参与到社交网络的研究中。社交网络分析(Social Network Analysis)[4],它指的是对社交网络中大量的数据进行分析的方法,主要研究社交网络中节点与节点之间的关系,并且分析出用户与用户交往形成的网络结构对他们的影响。社交网络分析中,会用到三个指标,分别是节点与节点度,用户群与聚类系数,平均路径长度与直径[5]。

2.1.1 节点与节点度

节点(node)[6],它指的是网络中的每一个用户,也就是说在网络中与其他连接的单个人、一个组织、一个事件,或者是其他社会实体。这说明了在社交网络中,用户与用户之间形成了一个很大的网状结构,其中的用户就是网络节点,因此形成了社交网络的拓扑结构[7]。

***论中,节点度(degree)指的是与这个节点关联的边有多少条,同时节点度的大小也说明了其中一个节点与另一个节点相连接的紧密程度,也代表了这个节点是否接近网络中心[8]。依据一条信息流它的进出方向如何,又可以将节点度分为节点入度(indegree)和节点出度(outdegree)[9]。用网络拓扑结构可以表示一个节点与另一个节点之间的关系,用节点入度、节点出度以及节点度,可以描述一个节点有多重要,并且可以说明它与其他节点之间有什么样的关系。可以使用节点度的分布函数P(k)来表示节点度是如何分布的,计算出的P(k)的值,就等于在网络中随机选取其中的一个节点,它的节点度是k的概率,用公式表示即为:

其中,k为正整数。

2.1.2 用户群与聚类系数

用户群指的是社交网络中的用户根据他们之间共同的兴趣以及爱好从而聚集起来的群体,他们之间具有共同属性,因为这些共同属性,才使得他们能够聚合到一起,从而形成具有共同兴趣爱好的小群体[10]。现实中,一个个体如果喜欢打球,那么就会结交别的喜欢打球的个体,这样他们之间就有了联系,从而成为了朋友。同理可以运用在社交网络中,工作性质相同、学历相当、所在城市相同,那么这些用户群很有可能就会组合到一起,进行他们之间的活动。

聚类系数(Cluster Coefficient)[11],也可以称它为集聚系数、群聚系数或者集群系数,它可以用来描述***或者节点与节点之间结合在一起的强度系数。换一种说法是,聚类系数表示的是用户与用户之间关系强弱的系数。在无向网络中,可以把节点的聚类系数用公式表示如下:

其中,n表示节点V的所有k个邻居间的边数,网络的聚类系数C等于所有节点的聚类系数的平均值,即:

其中,N为网络中节点个数。

2.1.3 平均路径长度与直径

平均路径长度[12],它代表的是网络及群众之间凝聚在一起的指数大小,若凝聚指数越小,则说明网络中的小世界特性越明显[13]。社交网络中节点与节点之间相连接的路径有许多,其中最短的一条路径是经过最少的节点,即最短路径长度指的是节点m通过中间其中一个最少的节点,它所能到达的节点n所经过的路程长度。另外,直径指的是网络圈中最短路径长度的最大值[14]。最短路径的平均值(L)就是网络的平均路径长度,它的计算公式为:

其中,N为网络中节点个数,d为直径。

3 用户“转发”和“评论”行为分析

新浪微博在国内的发展可谓是迅猛,用户的数量也越来越多,已经达到4亿多,并且新浪微博的大量用户每秒的微博量非常庞大,面对这么多的信息,很显然用户的精力是有限的,他们不可能每一条信息都去看[15]。因此,我们关注用户对于这些被出来的微博会产生怎样的转发、评论以及点赞行为。利用新浪微博的API接口提取出某一知名认证用户微博中相关的信息,如某一条微博的被转发信息以及被评论信息等等,再抽取其中500条数据进行研究分析,然后归纳出用户的行为特点。

3.1 用户“转发”行为分析

为了更好地研究用户转发某一条微博的行为,特地获取了从2017年3月1日到2017年3月7日该知名认证用户的微博数,一共397条,表1显示的是其一周内的微博数量。

3.2 用户“评论”行为分析

根据对用户的转发行为进行的分析,同样的抽取出该知名认证用户微博中的相关信息进行研究,分析得出用户评论行为。如***3所示就是用户对该知名认证用户2017年3月1日到2017年3月7日之内所发微博的评论数,可以很明显的看出,与用户对微博的转发数变化极其相似。由此可以得出,在如此多的微博信息中,用户会选择自己感兴趣的话题发表看法,而不是对每条微博都给予评论。

另外,还可以从***3中得出,被评论量在1-500之间的微博数最多,在500以上的被评论量的微博非常少,这两者之间差距很大。同样也说明只有少数微博被用户评论了很多,即只有少量的微博信息被用户所关注。

4 结果分析

从对社交网络中用户的行为进行分析,运用其中三项指标:节点与节点度,用户群与聚类系数,平均路径长度与直径。先分析用户与用户之间的关系,进而分析这些用户对某一知名认证用户所发微博的转发行为以及评论行为,可以得出的是,用户会选择自己感兴趣的话题参与到其中,并对其进行转发或者评论等行为,进而引出热门话题,使得更多的用户参与到该话题中。这也更进一步说明了以上分析研究的内容,不仅结果准确可行,而且也为以后微博信息的扩散研究打下很好的基础,具有不错的效果。

5 结束语

通过对社交网络中用户行为分析研究发现,如果微博信息具有高质量或具有很强的吸引力,那么就会吸引更多用户关注该信息,相应的就会获得更多用户的转发、评论及点赞,这是因为信息本身具有魅力。当一条微博信息被很多人转发时,就会有更多的人看到该信息,从而获得更多的评论,评论越多,也越会引起更多人讨论与该微博信息有关的内容,这样就会打开其他用户的思维,从而促进人们对微博信息的思考,对其点赞。这同时也说明了用户与用户之间是具有一定的联系的,他们的行为可以带动其他用户同样的行为,从而使得更多的用户之间有联系。当然,该研究分析为后续新浪微博中其他方面的研究奠定了扎实的基础。

参考文献(References):

[1] 夏梦甜,杨漫欣.大学生社交网络的使用及其对社交能力的

影响[J].中国高等医学教育,2014.6:9-10

[2] 杨善林,王佳佳,代宝,李旭***,姜元春,刘业***.***社交网络

用户行为研究现状与展望[J].中国科学院院刊,2015.2:200-215

[3] 赵俊.社交网络的数据采集与分析方法研究[D].郑州大学硕

士学位论文,2015.

[4] 纪雪梅,王芳.SNA视角下的***社交网络情感传播研究综

述[J].情报理论与实践,2015.7:139-144

[5] 徐文婷.社交网络的用户行为分析及信息扩散研究[D].扬州

大学,2015.

[6] 王朋飞.基于节点度之差和节点相似性度量的社团检测算法

的研究[D].兰州大学,2014.

[7] 朱永习,严广乐.有向***社交网络的拓扑结构分析[J].信息

技术,2016.9:14-17,21

[8] 孙文珠,王洪玉,祝开艳,王洁,唐震洲.一种规则变量节点度

LT Codes编码方案[J].电子学报,2014.10:1918-1924

[9] 周立欣,刘臣,霍良安,王育清.基于交叉度的有向网络中心节

点识别算法研究[J].计算机应用研究,2016.11:3299-3302,3306

[10] 马力.基于聚类分析的网络用户兴趣挖掘方法研究[D].西安

电子科技大学硕士学位论文,2012.

[11] 许鹏远,***延忠.基于聚类系数的推荐算法[J].计算机应用研

究,2016.3:654-656,660

[12] ⒁嫡,周云龙.无尺度网络平均路径长度的估计[J].系统工

程理论与实践,2014.6:1566-1571

[13] 王国红,周建林,唐丽艳.小世界特性的创新孵化网络知识

转移模型及仿真研究[J].科学学与科学技术管理,2014.5:53-63

[14] 韩卫国,彭伟,唐晋韬.基于路标的最短路径长度快速估计

算法[J].重庆理工大学学报(自然科学),2013.7:96-102,118

[15] 向仲敏,朱炜,朱莹燕.新媒体平台传播社会主义核心价值

观的对策研究――基于青少年使用新浪微博的数据统计[J].西南交通大学学报(社会科学版),2016.2:77-83

社交网络中用户行为分析研究

转载请注明出处学文网 » 社交网络中用户行为分析研究

学习

选对池塘钓大鱼

阅读(19)

本文为您介绍选对池塘钓大鱼,内容包括选对池塘钓大鱼的教案,选对池塘钓大鱼读后感。自我分析

学习

全国大学生运动会

阅读(77)

本文为您介绍全国大学生运动会,内容包括大学生运动会真实记录,2023大学生运动会。赛事概况

学习

篮球运动员的体能训练

阅读(114)

本文为您介绍篮球运动员的体能训练,内容包括篮球体能训练动作大全,篮球专项体能训练方法ppt。摘要由于篮球比赛越来越激烈,比赛水平也越来越高,自然对运动员体能的要求也相应提高。在现代篮球比赛中,没有优良的体能保证是很难取得胜利的。

学习

带我去看海作文300字

阅读(29)

本文为您介绍带我去看海作文300字,内容包括带你去看花海300字作文,带我去看海作文。我有个愿望,去看一看大海,他说,好啊,于是。他的网名改成“带你去看海”……在感动中徘徊,我上了小学,小学毕业之后来到初中,一直遗憾,大海是什么模样的呢?我一直

学习

英语教学方法

阅读(36)

本文为您介绍英语教学方法,内容包括英语教学法教程笔记,教学方法英语。一、英语教学方法研究的现状

学习

高中课改

阅读(24)

本文为您介绍高中课改,内容包括高中新课改全面启动的时间,高中课改相关文件。一、确立新的教育理念,革新教学体系

学习

真空集便器原理及改进

阅读(36)

本文为您介绍真空集便器原理及改进,内容包括真空集便器的工作原理与改进,真空集便器工作原理。关键词:MONOGRAM;真空集便器;故障分析;改进措施。

学习

HP刀片 第4期

阅读(56)

本文为您介绍HP刀片 第4期,内容包括hp刀片服务器安装教程,hp刀片怎么装。作为网格计算的发明者和先驱,惠普提供的BladeSystemc-Class刀片系统与甲骨文的Oracle10g网格计算方案完美融合,帮助用户实现网格计算环境,从而实现IT与业务同步,适应

学习

体验式营销

阅读(16)

本文为您介绍体验式营销,内容包括关于体验式营销,体验式营销最新文章。笔者之所以把体验式营销专门阐述,一是因为种业的体验式营销是口碑营销的基础;二是其实大家都在做体验式营销,但没有系统总结;三是体验式营销已经成为一种常态营销方法,但

学习

美声唱法教学范文精选

阅读(19)

本文为您介绍美声唱法教学范文精选,内容包括美声唱法教学零基础,美声唱法书籍推荐。美声唱法教学篇1【摘要】美声在声乐中占有重要的比重,本文详细的介绍了美声唱法的关键,阐述了美声唱法的教学方法。

学习

高中英语听力技巧训练

阅读(40)

本文为您介绍高中英语听力技巧训练,内容包括高中英语听力训练每日一听,高中英语听力专项训练原文。听说读写是英语学习的四大基本技能。但现状表明当前高中学生的英语听力能力远远低于该学科的其它能力。许多学生语音辨别能力较低;语流的

学习

浅谈法国古典主义建筑

阅读(25)

本文为您介绍浅谈法国古典主义建筑,内容包括法国古典主义建筑的发展历程,法国古典主义园林的典型代表。摘要法国在十七世纪到十八世纪初的路易十三和路易十四专制王权极盛时期,开始竭力崇尚古典主义建筑风格,建造了很多古典主义风格的建筑

学习

混凝土施工工艺分析

阅读(25)

本文为您介绍混凝土施工工艺分析,内容包括屋面发泡混凝土施工工艺,透水混凝土路面施工工艺。摘要:经济的发展促进了建筑业的发展,土木工程、路桥工程在我国不断兴起。作为工程建设的重要部分,混凝土的施工质量在施工建筑中越来越为重要,如何

学习

原子核结构分析

阅读(23)

本文为您介绍原子核结构分析,内容包括原子核结构模型示意图,原子核结构书。摘要:本论文是个人基于卢瑟福,默里?盖尔曼等伟大科学家的核理论,研究原子核的对碰时,质子,中子,电子等的能量储存,释放问题,从质子与中子的结构分析入手,分析核子间的相

学习

消费者行为分析论文范文精选

阅读(560)

本文为您介绍消费者行为分析论文范文精选,内容包括消费者行为分析论文范文,消费者行为研究论文6000字。消费者行为分析论文篇11简析网上购物的消费者

学习

高喷灌浆技术分析

阅读(30)

本文为您介绍高喷灌浆技术分析,内容包括高喷灌浆施工动画,高压旋喷灌浆效果分析。摘要:高喷灌浆技术是公路工程建设所应用的重要技术,在地基处理方面有着良好的应用效果。本文以高喷灌浆技术为切入点,分析现有的地基处理技术的不足之处以及

学习

村上春树《挪威的森林》中直子的人物形象分析

阅读(74)

本文为您介绍村上春树《挪威的森林》中直子的人物形象分析,内容包括村上春树挪威的森林解读,村上春树挪威的森林对绿子的描写。【摘要】小说《挪威的森林》通过塑造了渡边彻、直子与绿子等人物形象,围绕着三人的恋爱故事展开,以上世纪60年

学习

犯罪人格的形成及特征分析

阅读(37)

本文为您介绍犯罪人格的形成及特征分析,内容包括犯罪人格是怎样形成的举例分析,关于犯罪人格的分析。[摘要]犯罪人格是指具有严重倾向的,能够导致犯罪行为产生的特定身心组织。犯罪人格在一定情景下能导致犯罪行为的产生,犯罪就是外在环境

学习

影视语言分析

阅读(21)

本文为您介绍影视语言分析,内容包括影视视听语言分析要点,影视语言分析。[摘要]影视语言是信息场域。信息场域是在一个事件或多个事件中,其行为动态的相互关系、形象、声音、环境、氛围、心态等共同累积出的可供观众观察和体验的时空艺术系