过去的一年间,高调的阿里巴巴赚足了眼球。
从“双十一”191亿元的巨额交易额,到闪电般地拆分成七家公司、25个分支机构,再到在金融业的肆意扩张,和移动互联网领域的大举收购……马云构建的阿里生态圈,正在从城邦成长为“帝国”。
事实上,在阿里巴巴从城邦到“帝国”的这一系列高调动作的背后,实则都与一位低调的人有关,他就是王坚。
2008年,王坚加盟阿里巴巴成为集团首席架构师,即现在的首席技术官。这位前微软亚洲研究院常务副院长被马云定位为:将帮助阿里巴巴集团建立世界级的技术团队,并负责集团技术架构以及基础技术平台搭建。
在加入阿里后,带着技术基因和学者风范的王坚就在阿里巴巴集团提出了被称为“去IOE”(在IT建设过程中,去除IBM小型机、Oracle数据库及EMC存储设备)的想法,并开始把云计算的本质,植入阿里IT基因。
这些工作将阿里IT发展策略从依赖“商业软件”、到拥抱“开源软件”最终演变为拥有强大的自主技术和云计算服务能力,更为2009年“阿里云计算有限公司”的成立埋下伏笔。2011年7月28日,阿里云自主研发的“飞天”云计算平台开始以公共云计算服务的方式对外提供云计算商业服务。灵活的IT支撑起阿里集团的业务闪变,并在淘宝、支付宝等核心业务之外,勾勒出了新的极具潜力的盈利模式――云服务。
2012年10月,阿里云开发者大会上,王坚曾宣称:“阿里云能在24个月内实现收支平衡。”10个月过去了,在接受《商业价值》采访时,他依然坚持这句承诺。作为阿里巴巴在IT领域的触角,对“阿里云”的未来充满了想象。
与此同时,王坚最初提出的“去IOE”的想法,一天都没有停止过。甚至,阿里巴巴的“去IOE”运动引发了大型企业IT底层建设的新思潮,也使IBM、Oracle等国外大型厂商在中国倍感转型压力。
“平台、金融和数据”是马云承诺阿里集团的三大业务,阿里集团的IT格局支撑起这三大业务的发展;“阿里云”则成为阿里巴巴延伸向更多中小企业的重要IT触角。带着对阿里巴巴IT布局的探究,《商业价值》出版人刘湘明在杭州阿里云总部与阿里巴巴首席技术官、阿里云总裁王坚展开对话。
2012年的“双十一”,阿里创造了191亿元的日交易额,阿里云平台处理了淘宝和天猫20%商家的订单。淘宝顺利挺过“双十一”的大流量和交易,有哪些关键的问题必须解决?
淘宝“双十一”关键要解决三个问题:支付问题,淘宝自身的问题和淘宝客户的问题。
支付的问题难点在银行,淘宝和天猫的总销售额有191亿,交易笔数1亿零280万笔,对于淘宝来说,一共有多少笔结算金额是非常重要的,因为在银行承担不了的前提下,需要尽可能在支付宝完成交易,支付宝的技术能力决定了系统的承载能力。“双十一”表明了支付宝的支付系统是世界一流的。
以前,一旦出现银行支持不了,支付宝会对交易进行排队,延迟交易。但“双十一”的交易量太大,延迟时间太长会产生很大的用户体验问题,所以支付宝提前做了活动鼓励客户先把钱充到支付宝里,这笔钱的规模当时达到了几十亿,缓解了银行的压力,再加上原来用户在支付宝里的钱,使得当天的交易顺利进行。
第二,淘宝自身的挑战在于面对突然出现的并发流量和意外情况的发生,如何保持系统的稳定性完成天文数字的交易成为难题。就像电影院虽然修了安全通道,但一出事很可能会伤到人,紧急情况下用户的行为没有办法预测的。淘宝也是一样,容量设计理念是按照假想的客户使用模式设计的,但在意外情况下,无法预测用户行为,本来没有流量的地方,可能会突然跑出一个吓人的流量,淘宝无法用真实的用户演习,任何一个局部的问题会变成一个全局的问题,这个就是困难的地方。
“双十一”当天阿里巴巴集团近千名技术和业务人员坐在一层,用一个指挥体系处理问题,准备了500种预案,因为现场出现问题再去解决肯定来不及,一个回车键敲错了,可能那个系统就瘫痪了。
第三,淘宝客户的问题主要通过阿里内部的技术力量解决客户面临的问题,比如“聚石塔”项目,是指卖家在天猫和淘宝上的全部交易流程都部署在阿里云上完成。
过去在从淘宝链接到卖家的后台系统过程中,由于IT基础设施薄弱,卖家系统切换和数据不通可能会使交易失败。“双十一”有一句话是说“20%的交易量是在云上完成”,这是说有20%卖家的后台系统部署在阿里云上。以往买家买一个东西只需要点击一下支付,这个动作会指向两条IT路径:一是连接支付宝,保证有钱可以完成支付;另外则是进入卖家的ERP,卖家需要知道自己是否有库存,并减掉相应货品数量。把卖家的ERP系统完全架设在云上,这件事的难度和意义比只解决因为网站流量扩容要大,因为从发票打印和发货都要通过这个系统,不同的ISV(***软件开发商)也在其中起了关健的作用,让人们体会到一个生态的价值。
卖家把ERP挪到云上,也证明了对云计算的信任,今年的目标能让70%~80%的交易在云上,这不仅仅是为客户节约成本,更是帮助卖家提升了赚钱的概率。这件事的本质反映了:云计算是一场改革,给客户创造业务价值的意义,远远超过了成本本身。
阿里云、天猫和淘宝的技术体系是怎样的,与阿里云有着怎样的联系?阿里集团的技术是如何演变的?
支付宝、天猫和淘宝、阿里云的实际技术应用确实有所不同,我们也一样会遇到所有公司都会有的挑战,但我们很幸运阿里巴巴整个技术体系是协同在一起的。
阿里整体技术的协同效率可以用几个关键的事例来说明:第一是在“去IOE”过程中逐渐建立起对技术方向的认同和协作,当淘宝刚开始做这件事的时候,没有技术、产品和业务等各团队的相互协同,这是一件不可能的事;第二是在2011年,阿里集团所有的技术后台运维和运营部门都集中在首席技术官下面的一个技术保障部,原来在不同子公司和事业部的人,从工具到理念都需要融合,结果表明这样对适应集团业务的快速发展和变化是很成功的,并且能够用这样的方法驾驭大型互联网企业对技术服务的挑战。这一过程中,我们经历的技术挑战和付出的学费可以成为其他企业的借鉴。第三则是业务驱动的技术合作,淘宝“聚石塔”项目、支付宝“聚宝盆”项目等,都是在业务驱使下使得各自客户的IT系统与阿里云“飞天”平台自然协同的结果。
企业原来的软件和硬件资源无法满足未来发展需求,这是每个企业都会碰到的问题,也是互联网企业发展的必经一环。
阿里最早依赖商业软件,从拥有20多个节点的Oracle RAC数据库集群(当时是亚洲最大),到成为开发使用开源软件MySQL最好的企业之一,到研发自己的关系数据库OceanBase,也已用在了不同的业务场景。从用Oracle做处理数据,到用Hadoop集群(是业内单个机群节点数最多的Hadoop机群),再到用自己飞天平台上的ODPS。这样的演变路径也表明:商业软件、开源软件跟自有技术永远是一个搭档,对于不同企业来说,只是百分比的问题。对大的互联网企业自有技术变得非常重要,阿里巴巴的许多自有技术,如飞天的核心平台通过云计算的方式开放给别人,所以云计算是适合许多企业的另一种方式。我相信在未来,对许多企业来讲,“云计算+自有技术”会变得越来越重要。
2013年5月17日,阿里集团支付宝最后一台IBM小机下线,整个阿里集团告别IBM小机;7月10日,淘宝广告系统的Oracle数据库下线,可以说阿里巴巴“去IOE”战略取得阶段性胜利。为什么“IOE”对互联网企业的发展是―个问题?阿里“去IOE”取得成功的关键是什么?
不同的人在理解“去IOE”的原因是不一样的。我最怕将“去IOE”的原因归结到两个极端:一是单纯变为企业成本问题,二是简单地变成一个是否用国外产品和技术问题去讨论。成本降低是“去IOE”最先能够看到的,但最根本的原因是在互联网时代,不只是互联网企业,绝大部分企业对计算需求难以通过IOE提供的技术来满足了,IOE约束了企业长远的发展;技术路径上依赖于专用的硬件设备比较危险, 随处可以买到的Commodity PC的架构长远来讲对于阿里则是最安全的。
微软、IBM、Oracle、英特尔等公司是软件时代信息技术的巅峰代表,而在互联网成为全球产业基础和战略重点的今天,谷歌、亚马逊、Facebook和苹果成为了新一代互联网信息技术的代表。新一代信息技术的核心就是云计算,即通过互联网高效、方便、可靠、低价地提供海量计算能力。微软、IBM、Oracle等已经无法满足阿里集团业务发展的需求,阿里集团必须全力发展自有技术。
理论上只要计算能力够,“IOE”就一定能去掉!但实际上“去IOE”这件事有技术挑战和风险。“去IOE”不是简单改变软件和硬件本身,用新的软硬件取代旧的软硬件,用新的技术取代旧的技术,而是用云计算彻底改变IT基础架构,最关键的问题是用云计算取代软件来处理数据。
“IOE”是软件时代或是“买计算机”时代的产物。到云计算时代,则变成买“计算”的时代,“‘去IOE’最好的解决方式是采用云计算,而不是买来一台新的机器替代掉原有机器。”这是一个行业的变化而不是策略的选择,这件事情的挑战是你心里是否接受所谓的“私有云”的消失,从信任传统软硬件厂商到信任云计算是一种安全的服务。
为什么阿里能够率先成功?我认为有3点重要原因:一是企业的决心是否足够强大;二是这场运动是否能够坚持到底,并愿意承担技术上、组织上的各种风险;三是要想清楚是否有合适的人去完成这个使命。从 “去IOE”,也看得出阿里巴巴在技术上做了大量的投入,当然也包括飞天云计算平台、数据库、云OS操作系统等。
现在很多传统企业都在谈“互联网化”,从你的视角来看,传统企业要实现“互联网化”,有哪些需要把握的关键点?
IT变局背后的真正推手是互联网。这就是为什么我说“用云计算”的本质是“用互联网”,企业的IT和业务都离不开互联网,互联网的特质和冲击使传统企业IT无法应对。如果你的企业永远跟互联网没有关系,10年之后,很难想象企业会是什么样子。云计算作为一种公共服务,它的前提是互联网无处不在,今天,手机上网甚至比找一个电源插座要容易了,这就是***。
云计算是一种公共服务,当计算变成一种服务能力时,对于企业而言买“计算机”的时代变成了买“计算”服务的时代。为什么计算变成公共服务?可以从两个角度看云计算,从用户角度看,今天你只要拥抱互联网你就要用云计算,如果你觉得互联网跟你没关系你可以不用。第二,在第一的前提下,你又不想买服务器,这就是云计算真正给社会带来的价值。这是真正的变革,因为云计算的计算能力变成一个公共服务的时候,一定是超过了以往任何的计算技术对社会产生巨大的影响。
从这个角度讲,阿里云平台在帮助各种类型的企业做了一个转型,这些企业又带动了他的客户做了一次转型,在我的理解实际上是帮助了这些企业做了一次互联网的转型,云计算是可以把一家传统公司变成一家互联网公司。你想这件事情,他不只是给IT节省了一点成本,他实际上做的是转型的事情,你在云计算上面就可以重新思考你的一些业务的问题,重新思考你的一些很多事情该怎么做了。
你坚称阿里云能在24个月内实现收支平衡,你的信心来自哪里?
阿里云的客户涉及消费电子、公共卫生、能源管理、媒体、电子商务、电子***务、移动互联网等众多行业,服务着数亿计的互联网用户。阿里云的客户类型可以从不同维度描述。第一个维度是“大小”,可以是一个人的公司,也可以是像联想那样的大型集团企业。第二从行业维度,有传统的互联网公司,还有移动互联网公司,比如手游公司。还有一些传统企业,比如杭州九阳股份有限公司。这类传统企业的IT不是一次搬上来的,是一点点移上来的,有个过程的。从合作的角度考虑,有我们的直接客户,因为阿里云没有销售,我们为这些企业开设账号后,他们有能力自己到阿里云的平台上。第二类,通过商派这样的ISV帮助更多的企业来到到阿里云的平台。
云计算可以把一家传统公司变成一家互联网公司,这件事情不仅节省了IT成本,更重要的是在云平台上,企业可以重新思考自己的业务问题。中国的企业如果不能背靠背,是没有希望的,我非常佩服很多企业能够信任我们把它的东西放在我们上面。今天敢于拥抱云计算的企业是值得敬仰的。云计算带给企业的想象力和空间是不可想象的,这件事情才真的是***!
(更多详细对话内容可登陆商业价值网站)
转载请注明出处学文网 » 王坚:阿里巴巴为什么会“去IOE”