天下网商记者 王安忆
科技怎么样转化为生产力?就看它有没有发掘新资源,有没有扩大市场规模,或是扩展市场成长的新空间。
过去两百年,人类社会依照这样的规律完成了机械化、电气化、信息化,生产力的持续提升,让全球经济实现了史无前例的腾飞。
下一个时代属于数字化和智能化,大数据是新时代的石油,规模化智能化的计算能力则是新时代的引擎。
波澜壮阔的画卷缓缓展开,我们蓦然发现,全球人工智能(简称AI)的激烈赛道上挤满了中国企业,阿里巴巴更是悄然跑进了第一梯队。
阿里巴巴AI每天调用超1万亿次,是真正落了地的AI
也许你没有注意到,阿里达摩院两年来在国际AI顶级赛事上已经斩获40多项第一,还有近400篇论文入选国际顶会,也许你也说不上来,达摩院那些在业内鼎鼎大名的明星科学家叫什么名字。
但是,你可能察觉到了生活中悄然发生的一些变化。端着手机刷淘宝“猜你喜欢”,合你眼缘的好货越来越多了;看到想买的东西却叫不上名字,拍张照上传到拍立淘,匹配出来的结果越来越精准了;哪怕挤在双11下单,包裹上门的速度也越来越快,这不是因为包裹坐上了飞机,而是发货地变得离你更近了……
这些变化,都来自阿里巴巴AI技术的进步。
在阿里巴巴,有一群最接地气的AI科学家和AI工程师,他们将高冷的AI技术,变成了平易近人的应用,再从大规模应用中沉淀出新技术,引领着新一轮AI创新。
那些想改变世界的科学家
2014年9月19日,阿里巴巴在纽交所上市,淘宝店主、云客服、淘女郎、快递员们一起上台敲钟,AI科学家漆远和阿里云创始人王坚博士在台下目睹了这一历史性时刻。
漆远是美国麻省理工学院博士后,普渡大学计算机系和统计系终身教授,全球机器学习顶级会议ICML 2014 和 ICML2015主席,有近20年机器学习研究经验。
漆远还在实验室跑数据的时候,王坚找上门来,游说他加入阿里巴巴,“阿里拥有海量的购物和支付数据,这些数据都是围绕‘钱’产生,价值远高于其他数据。你如果来的话,建立超大规模机器学习平台的伟大任务,就交给你了。”
这番话极具煽动性,像极了乔布斯招募斯卡利时说的,“你是想卖一辈子糖水,还是跟着我们改变世界?”
于是,在前后拒绝了谷歌、Facebook、百度等公司的邀约后,漆远决定归国来到杭州工作,加入了当时看起来“最没有技术范儿”的阿里巴巴。
漆远接受《焦点访谈》采访
在漆远之后,密歇根州立大学终身教授金榕也加盟阿里巴巴,他曾担任NIPS、SIGIR等顶级国际会议领域主席,重点研究包括分布式信息检索、机器学习、多媒体数据处理与挖掘等。
后来,阿里又陆续迎来了华先胜、司罗、周靖人、任小枫等一众AI领域的顶尖大牛。
从左至右:任小枫、金榕、华先胜
为什么科学家们纷纷相中一家以电商为主业的互联网公司?其实问题本身就透露了答案。
电商公司,是所有互联网公司中最重运营的公司,电商、支付、金融、物流,每一个场景都离不开运营和服务的支撑。而当电视业务的规模,上升到几十亿商品、几亿买家、几百万卖家和百亿计的包裹之后,运营不可能全靠由人力完成,必须依托技术的支撑。
所以,技术之于阿里,从来不是锦上添花的门面功夫,而是攸关生死的空气与水。“如果不做云计算,会死掉”,如果不做AI呢?大概率也活不舒坦。
重运营的模式,飞速发展的业务规模,给阿里技术带来了前所未有的挑战,可同时也带来了一个好处——丰富的场景和海量的数据,对研究计算机科学的人来说,阿里巴巴就是一座天然的“顶配实验室”。
在正式加入阿里前,金榕曾给阿里做过一年顾问,在解决了一个大规模算法优化问题从而将广告展示收入提升15%-20%后,他第一次深刻感受到“理论的东西原来可以改变生活”。
还有普渡大学终身教授司罗,他加入阿里巴巴的理由也差不多:“在学校里研究一个新的算法,有20个学生来做评测就已经算是豪华阵容了。而在阿里巴巴研究一个新的算法,会有上千万真实世界的体验和反馈。”
为挖掘金山铺平道路的人
然而,科技改变世界的道路不是一条坦途,尤其在阿里巴巴,技术研发之路,从来不是什么风花雪月的浪漫回忆,而是一段筚路蓝缕的艰难历程。
作为阿里巴巴技术的先行者之一,王坚当然清楚这是一种怎样的体验,只是如人饮水,冷暖自知,要尝尽个中滋味,还是得让科学家们亲自走上一遭。
理想主义者不会给理想主义者泼冷水,所以王坚只是告诉漆远,“阿里巴巴是坐在金山上啃馒头,金山是阿里巴巴拥有的丰富数据,可是这些数据的价值并没有被挖掘出来。”
这番话,其实是6年前,时任阿里巴巴首席人力资源官的彭蕾对王坚说的。
当时,王坚还在微软亚洲研究院,孤独地探索着被外界怀疑没有前景的“大数据技术”,彭蕾的话,难免让他将阿里引为同道,直到毅然担起了设计全新自主计算架构的艰巨任务。
2009年,阿里云成立
关于王坚、阿里工程师和阿里云的故事,充满坎坷和波折,此前已经有过无数版本的演绎,暂且略过那些悲欢离合的细节,故事的结局是阿里巴巴用6年时间更换掉了整个底层技术架构,技术终于追赶上了飞速发展的业务:
2011年7月,淘宝商品库全部从Oracle迁移到自己开发的AliSQL数据库;
2013年5月,阿里巴巴最后一台IBM小型机下线;
2013年6月,飞天5K达成,成功实现调度5000台服务器的目标,成为中国第一个超大规模计算集群;
2013年7月,淘宝最后一个Oracle数据库下线。
云栖小镇的飞天5K纪念碑,刻着参与“5K之战”的工程师姓名
至此,阿里巴巴顺利实现了去IOE的目标,完全拥有了自主核心技术,这在当时是前所未有的壮举,极大推动了计算能力的提升。
计算能力,让阿里巴巴拥有了挖掘数据价值的前提条件和基础能力,可是吹尽狂沙始到金还远不是终点,要将数据价值挖掘充分,提炼为成色十足的真金,阿里巴巴还需要优秀的算法人才。
因此,顶尖AI科学家,作为阿里巴巴科技故事中的新一代主角闪亮登场。
AI科学家是请来了,可连王坚当时心里都没底的是,在一个务实、接地气、结果导向的阿里巴巴,“阳春白雪”和“下里巴人”能做到笙磬同音吗?
技术与产品之间的巨大鸿沟
熊彼特说:“所谓创新,就是发明的第一次商业化应用。”
再前沿的技术,倘若不能满足市场需求,就无法产生价值,而没有价值的创新,充其量只能称之为创意。
王坚一直跟金榕说,我们应该学习SRI(斯坦福国际咨询研究所),因为“那里的基础研究和其他地方都不一样,不仅创造出了最好的理论知识,还能把技术变成产品,产品收益再反哺到学术。”
可现实是,这些加盟阿里的科学家多为学界出身,精通基础理论,却缺乏业务理解和工程实践经验,所以难免低估了技术与产品中间的巨大鸿沟。
因此,科学家们在融入阿里巴巴的过程中,多多少少都经历过一段磕磕碰碰的磨合期。
金榕加入阿里后,接手的第一项工作是优化聚划算算法,目标是提升GMV(商品交易总额)。
团队很自然地把低价商品排列在搜索和推荐结果的前列以提升成交量,却忽视了对业务本质的理解——低价固然刺激购买,可是也让目标用户群下沉到了三四线城市。
技术为业务开路,科学家们却在无意中篡改了产品的内核。
漆远接到的首个任务,则是打造一套大规模机器学习平台,落地到阿里妈妈。他提交了一份申请数千台服务器的计划,这并不是一笔小数目,计划讨论后就被否决了。
于是漆远团队便陷入了一种悖论:没有CPU集群,如何证明自己的算法高效?不能证明自己的算法高效,又如何争取到CPU集群?
这场僵持长达半年,漆远团队一度走在解散的边缘。在业务部门口中,很多科学家也落下了“不懂业务”的名声。
解开僵局让研发业务融合
解开僵局的人,是时任阿里巴巴COO张勇,他找到金榕和其他几位科学家恳谈,“你们要想在阿里发挥出真正的价值,就必须克服这些困难。”
怎么克服困难?既然不熟悉业务,那唯有深入到电商和金融两大核心业务的一线。
2015年7月,那群科学家被拆分为3路人马——漆远加入蚂蚁金服;金榕带视觉团队加入淘宝和天猫的搜索事业部;语音团队则留在了阿里云。明眼人都能看出来,这是阿里巴巴生态内部发展人工智能土壤最肥沃的几块地。
这次融入业务的练兵经历,后来被称为阿里科学家们的“上山下乡”。
“必须要知道粮食是怎么长出来的,钱是怎么挣的。”金榕回忆。
分流到各业务部门的科学家们,通过和一线业务充分的沟通和交流,对业务需求有了更深刻的理解,这才逐渐将技术的兴趣点和业务的痛点真正结合了起来。
金榕团队为淘系的智能搜索推荐奠定了一台底层大脑,如今每天为十几亿人提供精确推荐,第二年就拿到了阿里最高荣誉——集团CEO奖。
漆远则接手了蚂蚁金服智能客服项目,2015年双11,首次采用深度学习技术的支付宝客服实现了94%语音自助,2016年双11当天自助服务率更是达到了99%。去除掉人工智能团队的人员工资和计算资源成本,智能客服项目为公司节省了一个多亿。
蚂蚁金服智能客服
而在信贷业务中,通过机器学习,蚂蚁金服把虚假交易率降低了近10倍,新开发的OCR系统使证件校核时间从1天缩小到1秒,同时提升了30%的通过率。
漆远梦寐以求的分布式机器学习平台也终于启动,双11期间,平台首次实现淘宝、天猫个性化推荐的大规模应用。那一年的阿里巴巴集团算法大奖上,漆远带领80人的团队包揽了16项奖中的6项。
这段科学家“上山下乡”的经历,真正打通了阿里巴巴“研发”和“业务”的对话体系。阿里巴巴也逐渐从技术支撑业务走向技术驱动业务。
一家平台型高科技公司
转眼到了2017年,新成立的达摩院在这年云栖大会上抢尽风头,尤其当阿里巴巴宣布三年投入1000个亿支持达摩院时,整个世界都惊掉了下巴。
阿里巴巴CTO张建锋宣布成立达摩院
达摩院首任院长张建锋当时说,阿里的技术分为优化和创新两个部分,推荐、搜索和广告属于优化;而真正的创新是“定义一个新市场”,成立达摩院的意义之一,就是要将“两件事都要做到极致。”
也就是说,阿里技术在从支撑业务走到驱动业务之后,又开始尝试向创造业务的方向探索。
新市场来自哪里?一方面,来自基础科学和颠覆式技术创新的突破,所以达摩院成立了机器智能、量子计算、区块链和自动驾驶四大实验室,后来又有了主攻芯片技术的平头哥,这些都是阿里面向未来基础性技术领域的深度布局。
另一方面,新市场来自各行各业的场景金山。只是有些行业数字化的脚步偏慢,场景金山暂未转化为数据金山,有些行业开始数字化了,却和早期的阿里一样坐在金山上啃馒头,尚未充分挖掘已有数据的价值——各行各业的数字化转型,在未来都有可能进化成无数依靠技术驱动的新业态。
阿里有助力各行业完成数字化转型的底气,自然是因为这条路他们自己已经趟了一遍。
在阿里的技术百宝箱里,有飞天云操作系统、飞天大数据平台、阿里巴巴业务、数据双中台和智联网AIoT平台这些压箱底的平台技术。
而阿里的云计算与AI能力,都经受过内部海量业务和长期实战的检验,这些,都是阿里云平台对外输出技术与方案时最硬核的实力。
以AI视觉技术为核心的“城市大脑”就是一个典型代表,这项技术的源头是淘宝拍立淘的图像搜索技术。
目前,城市大脑已能做到处理上百万路视频数据,实现了大规模实时交通事件事故检测,跨区域、跨时段寻找肇事逃逸车辆、失踪人口,预测车流、人流,给出市政规划建议等功能。
3年多来,阿里的城市大脑已在杭州、上海、苏州、衢州、吉隆坡等境内外十几个城市落地。而阿里技术的竞争力在于通过沉淀标准化产品,大大降低了部署城市大脑的成本。
面向新时代,阿里还在持续加大研发投入。
在全球知名科技公司中,阿里巴巴是唯一一家研发人员占一半以上的公司,阿里巴巴的研发投入已经连续三年位列中国上市企业之首。
从开创中国云时代,到引领人工智能创新,今天,阿里巴巴已经成长一家平台型高科技公司,技术是阿里实现长治久安的命脉,是阿里创造新商业模式的引擎,也是阿里面向未来的底气所在。
参考资料:
1、机器之能:《阿里人工智能这五年:天才的野心与自证》
2、甲子光年:《AI崛起,阿里的科技孵化力 | 甲子光年》
3、浅黑科技:《达摩院重修“巴别塔”》