华为“4V”金字塔打通大数据价值通道

IDC预测,全球的数据总量将在2020年达到40ZB。40ZB的数据量到底是多少呢?IDC给出了一个比喻:40ZB数据量相当于全球所有沙滩的沙粒总数的57倍。但在如此浩如烟海的数据中,只有不到1%的数据得到了有效分析。数据就像是一座沉睡的宝藏,它需要我们利用大数据这一新架构、新工具,点石成金,变废为宝。

大数据由业务驱动

为什么在***的健康组织还没有健康趋势之前,Google就能利用它的搜索引擎准确地预测流行病的爆发?大数据给我们所有人上了一课,也让我们更加坚信,数据本身是有价值的,关键看你如何处理、分析和使用它。

云计算不是一种新的技术,而是一种新的IT消费模式。同样,大数据也不是简单的技术组合,而是对企业商业模式的颠覆和再造,对业务创新和发展起到强大的推动作用,这样的例子已经比比皆是。

比如,为了应对激烈的市场竞争,中信银行信用卡中心迫切需要建立一个以数据仓库为核心的分析平台,实现业务数据集中和整合,以支持多样化和复杂化的数据分析。在部署了大数据应用系统之后,中信银行信用卡中心实现了近似实时的商业智能(BI)和秒级营销,运营效率得到全面提升。

再比如,广东地税依托大数据平台推出的网络发票能够实时采集纳税人的开票数据,实时监控纳税人的开票情况,实时向社会公开开票查询信息,实时为公众查验发票真伪,实现了对纳税人经营行为的全监控。同时,广东地税依托大数据平台还实现了对地税干部的税收***和行***管理进行全程分析监控,有效防控了各类***和廉***风险。

在互联网、金融、电信、能源、医疗、视频监控、***府等众多行业,大数据正在日益显现出其独特的价值。在企业内部,大数据可以为企业提供更科学的决策依据;在企业外部,大数据还是收集客户信息,建立360°客户视***,让企业实现精准化营销的工具。从表面看,大数据带来的是一种技术上的变革,它有效地提高了企业和社会的生产力,而在这种技术变革的背后是业务需求使然,是人们对提高效率的不断追求在推动这种变革的发生。

纵向打穿“4V”

经济全球化的趋势促进了大数据的应用需求。企业的管理者需要借助丰富的数据和实时分析工具,提高企业内部的工作效率,同时还要密切与客户的关系,进一步提高客户满意度。商业模式的转变、营销手段的丰富,要求企业不能在旧有的基础架构平台上缝缝补补,大数据需要一个全新的高效的基础架构平台。

大数据这个概念出现前,“海量数据”这样的称呼人们已经使用了很多年。虽然大数据与海量数据之间还是有量上的差距,但是对于很多企业用户来说,没有适合的工具对海量数据进行挖掘是数据价值难以释放的一个主要原因。在大数据分析工具出现前,商业智能、数据挖掘已经进行了多年,为什么数据的价值没有得到企业充分的重视呢?因为以前的数据挖掘是对抽样数据进行分析,而且数据分析是离线的,数据的价值没能得到全面、实时的展现。

那么构建一个可用的大数据系统,应该从何处入手呢?

现在,人们已经基本认同了大数据“4V”的特征:第一,Volume表明数据的体量巨大,企业处理的信息总量已经从TB级别跃升到PB级别;第二,Variety表明数据类型繁多,包括结构化、非结构化等类型的数据,尤其是非结构化数据的大幅增长对传统的处理结构化数据为主的架构带来了巨大冲击;第三,Velocity表明实时处理是大数据的一个典型特征,而这也正是它区别于传统数据挖掘技术的关键所在;第四,Value表明数据是有价值的,这也是大数据挖掘的最终目标。

“4V”虽然准确地描述出了大数据的基本特点,但是“4V”只是单摆浮搁,并没有从逻辑的角度将大数据应用的递进关系明确地展示出来。正是基于此,华为抛出了金字塔型“4V”理论,展现了从Volume到Velocity再到Variety,最终到Value的层次化的递进式的创造大数据价值的方***。

具体来说,第一步,企业需要建立一个能够高效处理海量数据的存储架构平台,它既能处理大量的小文件,也能处理单体较大的文件。第二步,这个存储架构平台要具备极高的处理性能,因为大数据对实时处理的要求非常高。第三步,这个存储架构平台要能处理多样化的数据,包括结构化数据和非结构化数据。只有通过前面三步打下的基础,企业用户才能进入最后一步,在一个高效的专门为大数据构建和优化的平台上进行数据分析和挖掘,并最终获得所需的价值。

大数据价值的实现过程是一个递进的逐层深入的过程,但是建立高效的存储架构平台是前提,它是大数据落地的基础。

Hadoop不是全部

现在人们一谈到大数据,首先会想到Hadoop。其实,Hadoop只是大数据基础架构与上层应用分析之间的一个桥梁,而不是大数据的全部。在广电等很多领域,大数据处理并不一定要用到Hadoop。现在,使用Hadoop更多的是一些互联网企业。然而除了互联网大数据以外,行业大数据同样重要,甚至价值密度更高。因此,将Hadoop与大数据划等号,这是一个认识上的误区。业内一位大数据专家指出,大数据不是一个分析工具,而是新的基础架构。

华为认为,大数据分析的一个重要前提是,必须先建立一个高效的大数据存储平台。那么,所谓的高效又是如何来衡量的呢?

高效的第一个衡量指标是就是性能。性能是大数据存储平台的基石之一,没有性能的保证,大数据系统无异于空中楼阁。比如,中央电视台每晚7:30要准时播出天气预报,如果气象分析要经过24小时才能得到最后的结果,就会错过天气预报播出的时间,即使得到的预测结果再准确也是无用的结果。另外,在智能交通领域,***门需要掌握实时的路况信息,对交通违章或其他突发事件进行及时处理。如果后台的大数据采集、处理和分析平台不能在最短的时间内给出结果,那么智能交通也只能是一句空谈。其实不仅是在大数据方面,在整个IT领域,企业用户对性能的追求都是无止境的,只不过大数据对实时处理的要求非常高,所以高性能对于大数据来说显得尤为重要。

其次,大数据强调的是简化使用,提高效率。如果不具备专业技能和人员,Hadoop的实施将非常困难。简化大数据的使用,其核心是在同一个平台之上针对数据的全生命周期进行管理,尽量避免异构环境下的数据迁移、数据丢失带来的风险等。

最后,高效的大数据存储平台应该采用多位一体的技术架构,即在同一个系统内,实现存储、归档和分析的所有功能,完成对数据的管理,并提供开放的分析接口,与BI软件和应用软件更好地连接,进一步提高查询效率。此外,在这样一个一体化的结构之上,用户还可以根据业务的情况灵活添加相关的功能模块。华为的大数据存储平台就具备了上述功能。

大数据带来的改变从基础架构层面一直延伸至业务层面。企业的管理者应该意识到,业务的创新需要底层创新的架构来支撑。从业务的角度看,企业的核心诉求是简化应用,实现可持续发展,提高业务的效率,而这些业务目标的实现必须建立在一个合理的、高效的架构之上,只有这样才能更好地发挥IT的作用,获得更大的数据价值。

转载请注明出处学文网 » 华为“4V”金字塔打通大数据价值通道

学习

沈腾:好贱郝建好可爱

阅读(17)

本文为您介绍沈腾:好贱郝建好可爱,内容包括沈腾咱们穿越吧完整版,沈腾郝建小品今天的幸福。观众习惯叫他“郝建”,经常忘了他的真名――沈腾。“郝建”一名的由来是开心麻花导演闫非根据沈腾的表演风格为春晚定制的专属艺名,正如小品中所

学习

浅析江南民居的建筑设计风格

阅读(19)

本文为您介绍浅析江南民居的建筑设计风格,内容包括浅谈江南民居的建筑特点,江南民居风格。江南地区以其独特的自然地理条件、代代相传的社会文化风俗以及相应的技术材料特性产生了特有的建筑风格与建筑体系,历承千百年发展的江南民居独树

学习

中国第一个杰出的女诗人蔡琰及作品

阅读(24)

本文为您介绍中国第一个杰出的女诗人蔡琰及作品,内容包括著名女诗人蔡琰创作时代是,关于第一位女诗人蔡琰的故事。我国古代女作家很少。据《左传》记载,《诗经》里的《载驰》是春秋时代许国的许穆夫人写的。这是见于记载的第一个女诗人。

学习

合伙制股权的法律体系诠释

阅读(18)

本文为您介绍合伙制股权的法律体系诠释,内容包括股权合伙制协议范本,合伙股权协议怎么写才正确。本文作者:李小乐工作单位:兰州大学法学院近年来,私募股权基金已成为国际金融市场的一大亮点。随着我国市场经济制度的不断完善和推进,私募股权

学习

共板法兰风管制作安装工法

阅读(16)

本文为您介绍共板法兰风管制作安装工法,内容包括共板法兰风管制作流程图,共板风管法兰制造安装。一、前言在现代安装工程中,随着科学技术的进步,在空调风管的制作、安装过程中,新材料、新工艺层出不穷,共板法兰风管就是其中之一。该风管

学习

韩国的网络文学论文

阅读(24)

本文为您介绍韩国的网络文学论文,内容包括韩国论文网站,发表韩国文学论文。一、韩国网络小说的特点在快速发展的社会生活中,越来越多的人们有着巨大的压力,有人尝试阅读网络小说来缓解压力,尤其是故事情节丰富、有趣儿的文学素材更能吸引人

学习

融资风险论文范文精选

阅读(139)

本文为您介绍融资风险论文范文精选,内容包括政府融资平台存在哪些涉税风险,融资风险论文范文。融资风险论文篇1船舶融资方式主要分为三个方面。一是债务融资。这其中主要有银行贷款、船舶抵押、发行债券、船舶融资租赁、私募这几种融资

学习

明孝陵神道的石刻

阅读(18)

本文为您介绍明孝陵神道的石刻,内容包括明孝陵神道石刻取材哪里,明长陵和孝陵石刻。一到六月,小朋友们就开始期盼暑假了吧。那么,这一期写话作业,我们就来写一篇游记吧。记一次难忘的旅行见闻,写出你的所见、所闻和所想。明mín孝xiào陵lí

学习

人民币与SDR货币篮子

阅读(54)

本文为您介绍人民币与SDR货币篮子,内容包括人民币成为sdr篮子货币,人民币在sdr货币篮子排第几。北京时间2015年12月1日凌晨1点,IMF(国际货币基金组织)正式宣布,人民币2016年10月1日加入SDR(特别提款权)。此举对人民币国际化、提升国际储备货币

学习

提供一体化生鲜物流解决方案

阅读(16)

成立于2001年的北京时代商联商业咨询有限公司是一家从事流通领域经营管理咨询的专业机构。公司致力于中国流通业管理技术的提升,目前已形成商业设计、运营管理咨询、物流规划、物流管理委托服务四大核心业务内容,并已为20多家零售、医药、

学习

金山农民画:勾勒最美的乡土

阅读(20)

本文为您介绍金山农民画:勾勒最美的乡土,内容包括勾勒最美乡土农民画,金山农民画欣赏感受。当时尚苹果手机“遇见”乡土中国农民画,会碰撞出怎样的火花?日前,上海金山农民画院推出4款限量版农民画iPhone手机套,将4位知名金山农民画师的获奖

学习

外语学刊

阅读(31)

本文为您介绍外语学刊,内容包括外语学刊在线投稿,外语学刊编辑部。语用主体信息空间虚拟化的思考吕公礼语用学:中国的位置在哪里?--国内外语用学选题对比研究钱冠连语言的指示功能武瑷华认知语法的特点及与生成语法之比较龚放中动结构的

学习

继续教育研究中存在的不足及解决思路

阅读(49)

本文为您介绍继续教育研究中存在的不足及解决思路,内容包括继续教育学时不足职称怎么办,继续教育的不足和建议。【摘要】改革开放以来,我国继续教育有了重大发展。继续教育作为我国教育的重要组成部分,在实施强国战略,提升人才队伍的整体素

学习

和家长谈谈幼儿的性教育

阅读(20)

本文为您介绍和家长谈谈幼儿的性教育,内容包括关于幼儿性教育的资料,正确对待孩子的性教育心得体会。摘要:幼儿性教育逐渐被提上日程,但家长的旧观念影响着幼儿性教育的发展。本文主要从家长树立正确的幼儿性教育的观念,摆正态度,从使幼

学习

从“尿布和啤酒”到数据挖掘

阅读(15)

本文为您介绍从“尿布和啤酒”到数据挖掘,内容包括尿布与啤酒数据挖掘,数据挖掘案例分析啤酒与尿布。沃尔玛的“啤酒和尿布”的经典案例不少媒体都曾报道过:就是沃尔玛通过建立的数据仓库,按周期统计产品的销售信息,经过科学建模后提炼决策

学习

从《艾玛》三个电影版本看电影的阐释维度

阅读(197)

本文为您介绍从《艾玛》三个电影版本看电影的阐释维度,内容包括艾玛电影色调分析,艾玛电影哪个版本好看。[摘要]文学与电影作为艺术的两个门类很长一段时间内都被许多电影导演和批评人认为是两个不相关的事情。随着20世纪90年代的电影

学习

机场雷达数据的鸟击风险评估

阅读(25)

鸟击风险评估模型以鸟击概率(P)和严重程度(S)为自变量,建立鸟击风险(R)评估模型,如式(1)所示。式中,P代表了某飞鸟侵入某跑道的概率,S代表了该飞鸟与飞行器撞击的严重程度,二者的值划分为非常高(VH)、高(H)、中等(M)、低(L)、非常低(VL)五个等级。表1给出了一

学习

电商网站的数据收集浅析

阅读(26)

本文为您介绍电商网站的数据收集浅析,内容包括电商运营如何收集数据,电商数据分析的工具及方法。【摘要】电子商务竞争越来越激烈,为了挖掘潜在客户,更好提供个性化服务,需要我们收集大量相关数据,从中找到规律。【关键词】电子商务,数据收集

学习

迈入标准化进程 模块化驱动数据中心“解耦合”与“重耦合”

阅读(19)

从集中式数据中心,到分布式数据中心,再到现在的模块化数据中心,数据中心的发展演绎了从合到分再重新耦合的历程。在新一代数据中心中,基础设施已经不再只是简单地提供水、电、风和网络,追求的也不再仅是节能环保、高可靠和可用,此外还要满足新

学习

Extech CAPP工艺数据管理系统

阅读(28)

一、ExtechCAPP特点ExtechCAPP工艺数据管理系统面向产品生产技术准备的全过程,以产品制造过程的数据为中心,覆盖工艺各个层次的管理及整个业务流程,组织产品设计数据正确无误地传递到生产部门。包括工艺设计、工艺规划、工艺管理、数据统计

学习

不拘泥于公有云的华为企业云

阅读(23)

本文为您介绍不拘泥于公有云的华为企业云,内容包括华为云公有云,为什么那么多企业选择华为云。经过这几年的发展,华为通过提供企业云服务不仅实现了自身能力的提升,而且还帮助合作伙伴实现了转型与发展,并在多个行业进行了成功的云计算实践

学习

IP数据广播

阅读(26)

本文为您介绍IP数据广播,内容包括ip广播地址应用场景,ip广播系统详解。IP数据广播(IPdatacasting,IPDC)是一种能够有效和直接发送数字内容给广大观众的广播技术。从技术上说,它使用DVB-T网络广播任何基于IP的数据。IP数据广播是一种和数字电