基于Netflow技术的互联网流量流向的分析与研究

摘 要:从研究互联网流量数据类型入手,在Netflow技术基础上,实现对流量数据的深度分析,并搭建流量分析系统的硬件环境,实现对流量成分、方向和来源的统计、分析和查询呈现,以实现网络规划、优化调整、业务发展等预期目标。

关键词:流量流向;Netflow技术;采集;数据库设计;接口

Analysis and research on Internet traffic flow based on Netflow technology

Fu Xiaowei

Heilongjiang nongken vocational college, Harbin, 150025, China

Abstract: Based on the Internet flow to be studied, from the study of Internet traffic data type proceed with, in Netflow on the basis of technology, the realization of the flow depth of data analysis, and to build the flow analysis system hardware environment, the realization of the flow, flow direction and flow components sources of statistics, analysis and inquiry, in order to realize network planning, optimize adjust, business development goals.

Key words: traffic flow; Netflow technology; data acquisition; database design; interface

随着宽带互联网应用的普及,互联网用户数量在不断增加,各个领域的应用也在逐步深入,网络规模持续扩展,网络流量高速增长。尤其是P2P技术产生以来,互联网网络流量激增,对网络的处理能力提出了更高的要求。同时,要合理、有效地疏导流量,必须对网络流量进行科学、细致的分析,通过流量分析可以有效地总结出网内、网外流量比例,各区域用户产生的流量大小,进而对用户使用习惯、各类应用带宽消耗情况等进行分析,从而可以对不同区域用户使用习惯、网内资源建设方向等进行有效的指导。不仅要依据数据的目的地址去疏导流量,还要明晰流量的来源和成分,区分流量类型,以精确地计算成本,合理分配IP地址数量和流量占用带宽,使流量管理更加规范。

Netflow技术最早由Cisco公司研发,首先被用于网络设备对数据交换进行加速,并可同步实现对高速转发的IP数据流进行测量和统计。经过多年的技术演进,Netflow对流经网络设备的IP数据流进行测量和统计的功能更加成熟,并成为当今互联网领域公认的最主要的IP/MPLS流量分析、统计和计费行业标准。Netflow技术能对IP/MPLS网络的通信流量进行详细的行为模式分析和计量,并提供网络运行的详细统计数据。

通过对某电信运营商的网络进行改造,引入互联网流量分析系统,以互联网流量数据为分析对象,实现以下功能:(1)精确判断流量归属地;(2)精确统计流量类型;(3)精确区分流量成分;(4)以天为单位,对某一天的流量及以天为周期单位的时间段产生的流量进行查询。

1 流量分析系统设计

由于Netflow仅能宏观地对网络流量进行分析和监控,无法满足精细化管理的要求。鉴于此,需要建立网络流量分析系统。

首先在省级主干路中引入流控设备,对全省网络流量进行控制。通过建立一台Linux服务器(CM server),在流控设备中将流量镜像至此服务器的数据库中,便可采集到全网的流量明细,进而通过存储过程将各种需要分析的数据进行聚合成表,便可对全网流量进行实时监控分析。

本系统包括4个功能模块,分别是数据采集模块、接口程序模块、数据库模块、页面呈现模块。

1.1 数据采集模块

要实现对流量源和目的地的分析,首先要进行流量采集并存储,采集的数据中要包含数据包的源地址、目的地址、数据包发送时间等信息。本系统采用Netflow V9版本进行数据采集,需要对Netflow协议、待采集的路由器端口和数据采集存储服务器等进行配置。

由于需要分析的路由器端口数据量很大,而且分析目的主要为各方向流量数据比例,综合考虑数据处理量和数据准确性之后,将采集周期定为5分钟,采样比例定为1000:1,此时每5分钟Netflow数据流约有30万~40万条,存储Netflow数据流的文件大小约20~30 MB。

在采集数据的端口选择方面,既要采集所有流量数据,保证数据的完整性;又要避免数据重复采集,以保证数据的准确性。按照上述条件,选择省级主干中路由器上行端口为流量采集端口,通过该端口既可以采集所有互联网用户访问Internet的流量数据,又不会发生流量数据重复采集情况。

为分析路由器端口的网络流量数据,必须将从路由器中送出的Netflow数据收集并存储,以便进一步的处理,所以需要配置Netflow采集存储服务器。具体配置为2.4 GHz四核CPU、2 G内存,使用Linux系统,并安装Cisco Netflow Collector(NFC)采集软件。

1.2 接口程序模块

经过采集,每5分钟会输出一个格式为XML的文件,文件数据分3部分:数据头、模板部分、数据部分。Netflow V9的数据格式可以自定义,根据分析需要,定义数据模板主要包括我们关心的13个字段,分别为:源地址、目的地址、源端口号、目的端口号、入接口、出接口、协议、服务类型、流数量、报文数、字节数、开始时间、结束时间。每个字段使用“|”分开。

选用C++程序语言进行数据的分析及入库。程序语言完成的主要功能为按照字段定义进行数据分列,并按要求建立数据表,然后将分析后的数据导入数据库中。原始数据每天自动生成一个文件夹,文件夹中每5分钟生成一个数据文件,为了达到自动读取数据的功能,采用“日期+时间”循环来自动读取数据文件。

读取数据文件对每行按照不同字段分列。由于每个数据文件的数据头部分完全相同,而且不包含所要分析的数据信息,所以可以把数据头部分跳过,然后根据每行数据的“|”将每个字段的数据进行分列。再根据各字段数据分析的需要,转换成相应的数据类型,并与数据库连接写入数据库中。

1.3 数据库模块

作为基于Netflow流量的分析系统,数据库成为系统的基础及核心,一切功能模块及数据采集均需建立在数据库中,从性能、成本、易用性、可靠性等方面综合考虑,选用MySQL作为本系统的数据库。

首先是基本表的设计。在程序操作数据表时,读写的性能受数据表字段所占字节数的影响,数据表字段所占字节数越大,则需要更长的读写操作时间,字段所占字节数越小,则其读写操作的性能将会有所提高。因此,设计数据库字段的属性对整个系统的性能至关重要。在分析程序对数据按照规则条件进行匹配后,将更新数据表中IP地址等相应的归属信息,但在数据的进一步汇总中,如果汇总程序按照IP地址归属信息进行数据分组汇总,则需要读取归属信息的全部字节数,这对于系统整体汇总而言,其运行效率仍会受到影响。本着读取最少字节数以提升系统工作效率的原则,需要将归属信息代码化,汇总程序仅需要根据归属信息代码作为分组条件即可。

根据Netflow的原始数据量,如果对其进行一一匹配对应,则无法在5分钟内完成相应的数据归属、流量分析等操作。为了提高数据库效率,最直接的方法就是先进行关键字段的聚合,然后进行相应的递归聚合,最后将分析数据进行匹配分析,这样可以有效地减少原始数据的运算量,尤其在磁盘I/O有限的条件下,性能提升更明显。

在数据递归聚合后,虽然数据量已经有了极大的压缩,但数据库运算仍然十分缓慢,因此在各级数据表中,对需进行运算的字段进行索引配置。索引是用来快速地寻找那些具有特定值的记录,所有MySQL索引都以B-树的形式保存。如果没有索引,执行查询时MySQL必须从第一个记录开始扫描整个表的所有记录,直至找到符合要求的记录。表里面的记录数量越多,这个操作的代价就越高。如果作为搜索条件的列上已经创建了索引,MySQL无需扫描任何记录即可迅速得到目标记录所在的位置。由索引带来的效率提升则是非常明显的,如同看书时按照目录查询章节一样迅速。在本系统中,由于要从目的IP地址中分析出该IP的分公司归属,这对于运营商庞大的不连续的IP地址段数据表来说,其哈希运算将会带来极大的系统符合,其运算效率也将随着两张数据表记录的增长而成倍的增长。通过对比测试,在没有配置索引的情况下,其数据运算的时间大约为20分钟,而索引可以将此工作缩短至1分半钟左右,这恰好可以完成数据在5分钟内的运算操作。

1.4 页面呈现模块

在对数据进行分析处理后,利用Eclipse+JSP+Tomcat平台,将结果以网页形式展现出来,并实现多种查询功能(如***1所示)。

***1 系统结构***

2 结束语

在研究互联网技术和相关协议的基础上,通过对互联网流量数据的分析处理,运用C++,MySQL,Eclipse,JSP和Tomcat+Java等工具,实现了互联网流量分析系统的设计,解决了互联网流量分析管理过于宏观的问题。

在互联网规模不断扩展和应用领域不断增加的趋势下,互联网流量的迅猛增长,使得流量成分越来越复杂,而过于宏观的流量分析技术已经不能满足电信运营上的管理要求,只有通过可靠、有效的网络业务流量监测,并对互联网络以及网络所承载的流量进行细致的统计,准确及时的流量流向分析,才能挖掘出网络资源潜力,以达到控制网络互联成本,为企业的网络规划、优化调整和业务发展提供有力的依据。

参考文献

[1] 滑海,张建标.基于NetFlow的网络流量采集系统设计[J].微处理机,2010,2:41-59.

[2] 王哲.基于NetFlow的网络流量监测技术与应用[J].软件导刊,2009,5:139-140.

[3] 田杨,王宏.采用Netflow数据的典型异常流量检测方法[J].电子科技大学学报,2009,S1:57-60,74.

[4] 梁峰,谭建龙.基于数据流模型的NetFlow流数据安全检测分析系统[J].信息网络安全,2009,4:69-71.

[5] 孟晓蓓.基于NetFlow的网络流量采集技术和应用[J].武汉理工大学学报,2009,23:155-158.

[6] 陈宁,徐同阁.NetFlow流量采集与存储技术的研究实现[J].计算机应用研究,2008,2:559-561,564.

转载请注明出处学文网 » 基于Netflow技术的互联网流量流向的分析与研究

学习

企业并购战略分析

阅读(31)

本文为您介绍企业并购战略分析,内容包括企业并购战略的案例分析,企业并购决策分析。【摘要】企业并购战略的思想演进,企业并购战略模型的分析。【关键词】企业并购;多元化战略;生命周期;市场占有率企业并购是一项有风险的业务,巨大的损

学习

文物鉴定与鉴赏

阅读(16)

本文为您介绍文物鉴定与鉴赏,内容包括文物鉴赏节目完整版,文物鉴赏与修复专业。1.学习古陶瓷鉴赏方法漫谈霍华,郭劲2.馆藏元青花瓷器选析黄静3.元青花呈色料及其特征陈逸民,陈莺4.对"金刚石钴料"的产地、来源以及为何使用的探索性考证和分

学习

判断借贷方向的“口诀法”

阅读(21)

本文为您介绍判断借贷方向的“口诀法”,内容包括借贷方向口诀,会计借贷方向口诀。[摘要]在《基础会计》课程中,学生普遍感觉困难和难以把握的是关于如何判断会计分录的借贷方向的问题。针对这一问题,笔者在教学中总结了一套“口诀法”,既简

学习

秋季最佳进补方案

阅读(31)

本文为您介绍秋季最佳进补方案,内容包括各种疾病秋季进补方法,女人秋季进补吃什么好。从炎夏转入凉秋后,人体自我感觉比较舒服,因“苦夏”所致的身体消瘦也渐渐恢复,胃口和精神渐渐转好,因此,人们往往“自觉和不自觉”地开始“贴秋膘”,各种肉

学习

谈反常态武功

阅读(21)

中华武术可谓源远流长,拳种繁多,门派林立,似乎让学者难以廓清其迷雾,但这是由于没有抓住事物的本质,一旦认清了武术的本质,以“不同的运动方式决定不同的运动功能”为标准,对武术进行分类的话,那么,一切都将在你面前变得清晰,人们完全可以将中华武

学习

教师节短信息范文精选

阅读(34)

本文为您介绍教师节短信息范文精选,内容包括短信精选教师节版,拟写教师节短信。教师节短信息篇1温馨的问候在空中弥漫,淡雅的米兰在静静的盛开,感恩的情愫在心里萦绕,祝福的话语在指间传递:祝老师节日快乐!刻在木板上的名字未必不朽,刻在

学习

如果再回到从前

阅读(27)

本文为您介绍如果再回到从前,内容包括如果再回到从前原唱版,如果再回到从前结局。某电视台在全市曾策划过一次活动,叫“如果再回到从前”,很多人第一时间赶到,接下来的几天,来报名参加的人络绎不绝。按照规定,前来报名的人都要填写一张表格,上

学习

“私人定制游”:你在哭泣她在笑

阅读(24)

全职太太遭丈夫冷遇,闺蜜定制“时髦散心”2012年10月21日中午,34岁的魏泓媛和闺蜜卫敏坐上了南京直飞台北的旅游包机。魏泓媛发现,旅行团所有成员都是女性,且个个珠光宝气。飞机起飞后,大家热烈地聊着“男伴游”的贴心服务,互相打趣。魏泓媛疑

学习

幼儿成长档案范文

阅读(18)

本文为您介绍幼儿成长档案范文,内容包括幼儿成长档案我爱锻炼怎么写,幼儿成长档案精彩瞬间怎么写。幼儿成长档案范文第1篇关键词:幼儿;成长档案;桥梁;互动;回忆一、为什么要建立幼儿成长档案1家园共育的桥梁幼儿档案,主要是记录幼儿自己从事各

学习

对照分析中英颜色词“白”的象征意义

阅读(16)

本文为您介绍对照分析中英颜色词“白”的象征意义,内容包括分析中英基本颜色词有什么意义,中英文颜色词隐喻意义的比较。【摘要】颜色词是一个国家和民族文化内涵的集中体现,不同的颜色词代表着不同的文化背景和蕴意。本文就颜色词“白”

学习

男人说男人

阅读(24)

本文为您介绍男人说男人,内容包括男人顾家女人说男人没本事,男人说男人帅是真的帅。抽烟、喝酒、花心、好色、爱面子、不负责任、邋遢、吃着碗里的看到锅里的……这是女人常对男人的评价,所以,女人口中的男人多为臭男人。但这绝不是男人的

学习

室内居住空间设计论文

阅读(71)

本文为您介绍室内居住空间设计论文,内容包括居住空间设计论文范文,室内设计毕业论文住宅空间设计。在满足基本的生活设施基础上,从创意入手,在家具选择、装饰上多追求个性、时尚。家具以活动的为主,空间分隔开放、自由些。因为没有定性,可以

学习

新闻主播李杨薇 感受家的味道

阅读(28)

北京电视台新闻主播李杨薇虽然走上主持人的岗位只有两年多的时间,但却以其清新阳光的主持风格为观众所熟知。人们常说,“艺术源于生活。”在采访中,记者发现,这种主持风格的形成,源于她乐观开朗的性格,更源于她的成长经历。母亲爱管“闲事”:教

学习

行尸走肉第五季

阅读(26)

本文为您介绍行尸走肉第五季,内容包括行尸走肉第五季解说,行尸走肉第五季神父。行尸走肉第五季[主创]厄内斯特・R・迪克森[主演]安德鲁・林肯钱德勒・里格斯丹娜・奎里拉诺曼・瑞杜斯史蒂文・连[类型]剧情/恐怖/动作[首播日期]2014年10

学习

企业并购战略分析

阅读(31)

本文为您介绍企业并购战略分析,内容包括企业并购战略的案例分析,企业并购决策分析。【摘要】企业并购战略的思想演进,企业并购战略模型的分析。【关键词】企业并购;多元化战略;生命周期;市场占有率企业并购是一项有风险的业务,巨大的损

学习

电影《盗梦空间》的精神分析解读

阅读(19)

本文为您介绍电影《盗梦空间》的精神分析解读,内容包括简单分析盗梦空间的六层空间,电影盗梦空间的剧情解析。电影《盗梦空间》让受众对梦有了一个清晰的认识,本文通过弗洛伊德精神分析论对这部关于梦的电影进行了精神式的解读。关键词:盗

学习

国际板开设的利弊分析

阅读(19)

本文为您介绍国际板开设的利弊分析,内容包括国际版什么时候推出,国际版的优缺点。【摘要】残酷的2013年已经过去,回顾这几年股市的运动,我们无比痛心的发现类似“国际板离我们越来越近了”、“国际板基本准备就绪”、“上海证券交易所将借

学习

案例分析方法范文

阅读(12)

本文为您介绍案例分析方法范文,内容包括案例分析怎么写范文,教学案例分析100例范文。案例分析方法范文第1篇有关合同法的许多制度,专家、学者、法官论及众多,我院法官已聆听过多堂知名教授生动讲授,故对本次研讨中所涉合同法制度内容,我不作

学习

大变化――我国当前社会经济结构变化情况及其复杂性分析(上)

阅读(42)

改革开放以来,我国国内生产总值迅速增长,同时,我国经济和社会结构发生了新中国建立以来未曾有过的重大变化。第一,私有制经济规模已经远远大于了公有制经济规模。第二,收入分配已形成了贫富悬殊、差距很大的格局。第三,社会结构呈现“金字塔”

学习

洋泾浜英语和中国式英语对比分析

阅读(19)

本文为您介绍洋泾浜英语和中国式英语对比分析,内容包括洋泾浜英语在中国的起源和发展,洋泾浜英语的特点有哪些。【摘要】早在鸦片战争前后,在中国的沿海口岸出现了一种被称为“洋泾浜英语”的混合语,它是中国近代对外贸易下的产物。在当代

学习

产品差异化品牌定位分析

阅读(31)

本文为您介绍产品差异化品牌定位分析,内容包括差异化产品定位举例分析,差异化产品定位技巧。差异化可以为企业争夺和巩固市场、维持既有的市场地位提供优势。本文以产品差异化理论为基础,认为李宁品牌重新定位这个行为符合有效差异化的动

学习

餐饮成本分析范文

阅读(18)

本文为您介绍餐饮成本分析范文,内容包括餐饮利润成本分析,餐饮成本策略怎么写。餐饮成本分析范文第1篇【关键词】餐饮成本;分析;控制文章编号:ISSN1006―656X(2013)06-00079-01引言当前,餐饮业市场竞争日趋激烈。在目前的餐饮企业在运作与