借HANA实现以速度取胜AdMaster从百亿数据中淘金

“高富帅”、“白富美”、“天然呆”、“喵星人”……打上了这些互联网时代语言的“昵称瓶”已经成为可口可乐的经典营销案例。当初可口可乐是如何保证这些“昵称”是真正让消费者喜闻乐见的呢?

在中国市场,AdMaster(精硕科技)功不可没。AdMaster借助SAP HANA对微博、SNS等网络过亿的海量数据信息进行挖掘和分析,从300多个“昵称”中选出了最受欢迎的24个。

立志成为数据专家

成立于2006年的AdMaster是我国领先的***第三方数字营销全流程监测评估服务提供商,也是目前国内最大的***第三方DMP(大数据管理)平台提供商。

AdMaster以大数据采集、挖掘和分析为核心,推动着数字营销行业的变革。AdMaster在数字广告效果评估、社会化聆听、网络视频和大视频的跨屏分析、移动端广告监测,以及打通各平台进行分析等领域持续创新,并拥有多项发明专利。目前,AdMaster服务于300多个品牌,其中包括可口可乐、英特尔、宝洁、海尔等知名品牌。

“我们信仰数据,我们认为数据具有无穷的力量,希望成为数据专家。”AdMaster创始人兼首席执行官闫曌认为,社交媒体中的大数据不仅可以用于营销和公关,还可以用于提升产品和服务质量。

据悉,AdMaster已经做了很多努力来制定一些行业标准,研究数字营销、移动营销该怎么做,产业该怎么发展才能更健康。AdMaster还和全球专业性的市场研究公司益普索(Ipsos)建立密切的合作关系来加强其在消费者洞察以及数据挖掘方面的能力。

闫曌回忆说,2010年广告客户开始关注互联网广告数据的分析和挖掘;同时随着社交媒体的兴起,广告客户对互联网广告的投入越来越大。“我们最大的一个客户在互联网广告方面的预算一年就达到5亿元。”他说,“客户用我们的服务可以把广告的ROI提升15%~30%。”

可见,AdMaster的业务与当前炙手可热的大数据密切相关。闫曌介绍,AdMaster拥有国内最大的广告监测和数据分析服务器集群,通过弹性规划,每天处理超过50亿条数据,分析200个数据指标,迭代超过100种数据模型。也就是说,每天的数据迭代量达到了1万亿次。不仅如此,他们还要分析一些历史数据,平均每天处理数据超过1万亿次。

AdMaster CTO洪倍介绍,在采用SAP HANA之前主要采用自己通过开源软件自主开发而形成的弹性规划数据处理方式。尽管该方式已经达到了全球范围内数据分析和处理的领先水平,但由于采用的算法比较复杂,随着数据量的不断增加,数据处理效率开始不尽如人意。

差别处理 善用巧劲

2012年中旬,SAP广发英雄帖以寻求合适的初创企业加入针对SAP内存计算数据平台HANA的SAP初创企业激励计划。AdMaster通过PE基金公司报名加入。

AdMaster的相关人员参加了当年7月在北京举办的SAP中国同略会,初步了解了SAP HANA能对公司业务起到的作用。后来,洪倍在上海花了两个月时间和SAP的研发团队一起工作,以论证HANA对广告大数据处理的价值,其中包括数据去重和在关键指标计算方面带来的大幅度时间节约。在经过SAP对AdMaster技术实力和竞争优势的整体评估后,AdMaster和SAP双方达成一致认可,确定AdMaster正式加入SAP初创企业激励计划。

“我们从SAP内部了解到SAP本身的很多产品都已经向HANA迁移,而且SAP已经有客户向HANA做了迁移。如果SAP自己推的东西自己都不敢用的话,我们是不可能用的。”洪倍指出,SAP自身产品向HANA迁移的举动增强了精硕科技对HANA的信任。

“在选用SAP HANA之前我们做了综合的考虑,要看HANA是否适合我们的应用场景。尽管HANA有很好的口碑,但是它也不是万能的,因为每个软件都有与之相适应的应用场景。”洪倍介绍,他们将数据分为温数据、热数据和冷数据。热数据是指读取频繁的数据,温数据次之,冷数据则主要用于存档。等到数据从温变到冷归档后,他们就用高性价比的存储产品去存储它,而不再需要HANA做什么。

“我们现在的架构采用的业务处理模式是需要快速处理的业务采用HANA来处理,一些常规的报表都用自己的平台来实现。另外,一些非结构化数据的处理我们也会放在HANA上。”洪倍说,“实时热数据的处理用HANA来完成,这也是在用一个巧劲。”

从两三小时到五分钟

闫曌告诉记者,AdMaster的业务正在高速增长,每年都以两三倍的复合增长率在增长,“这里面有一部分是HANA贡献的”。洪倍介绍,AdMaster 90%的产品是通过SaaS模式交付给客户的,客户最终获取的是实时数据,而不会关心后台采用了哪个数据库。“HANA已经融入到我们的产品中,所有用了我们产品的客户都间接享受到了HANA的价值。”闫曌补充说。

洪倍介绍, HANA的应用已经改变了AdMaster的工作方式。他举例说,以往客户的广告是否已经上线,他们要在两三小时后,甚至隔天才能知道。如果广告没有正常上线或者出现其他问题,很难追究责任,这让他们非常头疼。而现在通过AdMaster旗下的TrackMaster产品,从广告上线到看到数据只要5分钟,5分钟之后每秒都可以看到。“国内没有哪一家广告数据监测公司可以做到这一点。他们一般都要两个小时。”也就是说,如果早上9点应该上线的广告在9点5分还没有上线,广告客户就可以追究媒体的责任,并商讨广告补偿措施。这样,AdMaster就能有效帮助客户保证广告上线时间、缩短数据反馈时间,并提高响应纠错能力。

SAP HANA也改变了AdMaster的内部数据处理模式。“过去一个数据模型如果做错了,可能要花上4个小时才能再做一个。现在1个小时就可以迭代出几百个模型,我们可以从中选择哪个是最好的。”洪倍说,HANA大幅度提高了公司内部的工作效率。

闫曌则认为,SAP HANA应用给AdMaster带来的最实在的变化是,以前他们在市场上与客户谈到与竞争对手相比的优势时,通常会讲到他们的数据展现能力和数据展现速度高于竞争对手好几倍,而现在他们将数据处理速度从小时级变成秒级后,竞争优势就更加凸显了。

闫曌还指出,加入SAP初创企业激励计划还给了AdMaster很多难得的曝光机会。SAP经常邀请他们参加一些高规格的会议,而SAP的客户和AdMaster的客户具有较大的重合度,很多财富500强的企业既用SAP的产品,也用AdMaster的产品和服务,这对于致力于打造行业第一品牌形象的AdMaster来说非常有帮助。

正如闫曌所言,AdMaster目前还在高速发展中,他们所要处理的数据量也将高速增长。这不禁让人担心,在数据量达到一定程度时,AdMaster该如何升级。“HANA至少可以承载200亿条的数据运算和存储。而且内存数据的压缩比是比较高的,尤其是针对分布比较散的数据。”洪倍回答说,因为SAP HANA支持分布式存储,因此升级相对来说比较简单,只要增加内存就可以了。

闫曌透露,未来AdMaster将会加大对移动端和电子商务领域的投入,这些业务可能也与SAP HANA相关。“随着RTB(Real-Time Bidding,实时竞价)时代的到来,能在短时间内高速算出使用某个Cookie的人能否成为潜在买家的热处理应用场景是SAP HANA的强项。”闫曌说。值得一提的是,AdMaster还在规划通过大数据分析技术将自身擅长的品牌管理营销数据模块与ERP对接起来,形成一项新的业务。

转载请注明出处学文网 » 借HANA实现以速度取胜AdMaster从百亿数据中淘金

学习

日本连锁便利店的现状及其发展战略

阅读(27)

本文为您介绍日本连锁便利店的现状及其发展战略,内容包括日本便利店发展兴盛的原因,日本便利店模式面临拐点。内容连锁便利店作为零售业的一种模式,经营方针定位明确,有自己的商圈体系和设立店铺的原则。本文就日本便利店最新发展动态、物

学习

最美乡村黄龙岘

阅读(38)

本文为您介绍最美乡村黄龙岘,内容包括黄龙岘乡村振兴,美丽乡村游黄龙岘。岘,《辞海》解释为有山有水的秀美小山包。黄龙岘座落于南京城中华门外西南三十公里的江宁镇境内,与安徽皖南地境相邻。此地山峦叠障,林木繁茂,空气清新,泉水潺潺,四季景

学习

“火腿小镇”诺邓盐马古道中心的古老村庄

阅读(26)

本文为您介绍“火腿小镇”诺邓盐马古道中心的古老村庄,内容包括舌尖上的中国诺邓火腿怎么做好吃,诺邓火腿舌尖上的中国分镜头脚本。隐匿在山坳里的诺邓,曾经是盐马古道的中心,这片风水宝地拥有“太极锁水”的震撼奇景。近2000年历史的盐井

学习

掺普通硅酸盐水泥对硫铝酸盐水泥性能的影响

阅读(36)

本文为您介绍掺普通硅酸盐水泥对硫铝酸盐水泥性能的影响,内容包括硫铝酸盐水泥和硅酸盐水泥混用,硅酸盐和硫铝酸盐水泥复合使用。[摘要]在建筑工程建设中,水泥性能受多方面的影响。水泥性能受到影响会间接影响建筑工程的质量效果。现如今

学习

互联网的商业模式创新

阅读(22)

本文为您介绍互联网的商业模式创新,内容包括互联网商业模式完整版,互联网商业模式的创新。作为微博的衍生品,组织动漫化热点主题的微漫将克服传统微博生命周期短、趣味性低等问题,帮助企业提升品牌传播度与客户忠诚度。在微漫时代,如果你有

学习

甘肃科技

阅读(25)

本文为您介绍甘肃科技,内容包括甘肃科技功臣,甘肃科技纵览。扁平化组织与网络化沟通--现代企业组织结构的目标模式张招存浅谈市场经济条件下企业人才资源的开发和管理吴宗文燃煤锅炉噪声与污染消除实践惠应武,陈正基于单片机的高速公路测

学习

语料库AntConc软件对《推拿》的分析研究

阅读(24)

本文为您介绍语料库AntConc软件对《推拿》的分析研究,内容包括antconc语料库分析软件,用antconc自建小型语料库。语料库语言学兴起于20世纪80年代,是一门新兴学科,它致力于文本的检索、取样、分析以及统计。语料库工具如WordSmith、AntCon

学习

中国集体经济

阅读(27)

本文为您介绍中国集体经济,内容包括中国集体经济,集体经济在中国有什么表现。1.重拾改革的勇气2.信息动态3.爱尔兰危机:皇帝不急太监急于海洋4.前方施工,加息请止步钮文新5.上海世博超八成科技成果可产业化冯之浚,刘燕华,牛文元,周长益6.中

学习

从《埃勒克特拉》中探析欧里庇得斯戏剧的现代感

阅读(19)

欧里庇得斯的戏剧具有比较明显的现代感。这种“现代感”主要体现在,按照“人本来的样子”来塑造人物形象、更关心普通人物的生存境况,以及更关心人们的内心诉求。关键词:欧里庇得斯埃勒克特拉现代感欧里庇得斯(公元前484?-公元前406)最多比

学习

基于Mach3的教学型数控车床的研究

阅读(58)

本文为您介绍基于Mach3的教学型数控车床的研究,内容包括mach3支持什么数控系统,mach3数控车床用什么软件编程。本文根据教学的需要,利用Mach3控制软件作为开放式控制系统,设计并制造了集数控车床水平床身与倾斜床身于一体的新型可视化数控

学习

宇宙探秘之“空间”浅谈

阅读(20)

本文为您介绍宇宙探秘之“空间”浅谈,内容包括宇宙探秘之穿越时空,宇宙探秘知识总结。空间是什么?我们一般认为我们的世界充斥着各种物体,比如高楼大厦、汽车、人群等等,它们大到行星、恒星、星系,小到气体、粉尘、分子……。如果我们把这些

学习

谈陶土板在建筑幕墙中的装饰与应用

阅读(20)

本文为您介绍谈陶土板在建筑幕墙中的装饰与应用,内容包括建筑幕墙用陶土板,建筑幕墙中常用的陶土板系。本文从干挂陶土板幕墙的施工方法、施工注意事项、施工质量控制措施与装饰美感等方面详细介绍了干挂陶土板在建筑幕墙中的应用,国内已

学习

海洋工程用TC4钛合金管材组织与性能

阅读(22)

本文为您介绍海洋工程用TC4钛合金管材组织与性能,内容包括tc4钛合金管,钛合金管材硬度对照表。为了满足海洋工程深海油气传输,以及深海通信光缆的工况需求,本试验针对Φ140×4(壁厚)×4000mm典型规格的TC4钛合金挤压管材进行试制,旨在掌握管

学习

谈音乐家黎锦晖的历史贡献

阅读(20)

本文为您介绍谈音乐家黎锦晖的历史贡献,内容包括黎锦晖民国音乐家,黎锦晖对近代音乐的贡献。黎锦晖(1891-1967)出生于湖南湘潭,自幼学习古琴及弹拔乐器。家乡民间音乐和当地流行的花鼓戏、湘剧等音乐对他的影响较深。1912年长江高等师范毕

学习

尼尔森:数据平台让安利销售队伍年轻化

阅读(22)

密歇根气候潮湿,尼尔森一家久居于此,脸上透着当地居民惯有的微红,稍有腼腆但却非常绅士,他坦言自己玩twitter,在安利公司的数码内容平台上也注册了账号,随时关注市场人员的动态。《分销时代》:随着云时代的来临,大数据(Bigdata)也吸引了越来越多的

学习

台风事件时空数据管理模式

阅读(19)

本文为您介绍台风事件时空数据管理模式,内容包括台风处理预案,台风应急方案ppt。1灾害事件与过程中的时空数据模型1.1时空数据模型的发展时间、空间、属性是空间对象的固有特性。将时间用于空间对象的历史序列,最简单的方法就是采用快照

学习

入侵防御系统中TCP数据流重组的设计与实现

阅读(30)

本文为您介绍入侵防御系统中TCP数据流重组的设计与实现,内容包括web的入侵防御系统的设计,web服务器攻击与防御系统设计。网络攻击越来越隐蔽,很多攻击把特征信息隐藏在多个数据包中,这大大增加了攻击检测的难度,TCP数据流重组是可靠数据传

学习

英国《卫报》的数据新闻实践

阅读(16)

本文为您介绍英国《卫报》的数据新闻实践,内容包括英国卫报数据新闻,英国卫报网站开辟的专栏。在传统平面媒体面对新媒体的挑战而陷入困境之时,借助新兴的媒体技术,英国《卫报》在数据新闻方面进行了一系列创新探索。何谓数据新闻数据新闻

学习

国内几种常用论文全文数据库在科技查新中的作用

阅读(37)

本文为您介绍国内几种常用论文全文数据库在科技查新中的作用,内容包括查询使用的数据库什么意思,学术论文数据库比搜索引擎的优势。【摘要】讨论和研究中国博士学位论文全文数据库(CDFD)、中国重要会议论文全文数据库、中国学位论文全文数

学习

走在统计数据之前:以M2为例

阅读(23)

基本思路预测一个经济变量经常从其自身历史趋势及与其余相关变量的关系中寻找规律。当预测从长期走向短期,尤其是在上月尾新月初,在统计局公布之前估算该变量在过去一个月的表现时,我们就应该转而分析变量的定义及自身的构成,以便利用高频数

学习

ECMWF与NCEP的气象格网数据精度对比分析

阅读(24)

【摘要】对ECMWF与NCEP两种常用的再分析资料提供的地表温度、气压、可降水量这三种常用的气象格网数据,选取全球661个探空站数据作为标的,进行了精度比较与分析,结果显示全球范围内ECMWF精度比NCEP高。【关键词】ECMWF;NCEP;温度;气压;可降水量

学习

医疗大数据范文

阅读(308)

本文为您介绍医疗大数据范文,内容包括医疗大数据研究报告范文,大数据在医疗中的应用场景。医疗大数据范文第1篇当前云计算、物联网、移动互联网等技术飞速发展,数据的种类和规模以前所未有的速度增长,如何管理和利用大数据成为当前研究的