一、Google出拳
2023年2月3日星期五,Google云业务部门宣布了对人工智能初创公司Anthropic价值3亿美元的投资,约占这家公司股权的10%。这项投资有一个很现实的回报是:Anthropic今后将从Google采购更多的云计算服务。换句话说,Google这笔投资,主要是以它为一家人工智能公司长期提供云计算服务的方式来兑现。
对于每年要为算力烧掉上亿美元的人工智能公司来说,这样的安排并不罕见。3年多前,微软正是通过向OpenAI投资10亿美元,换得后者选择微软Azure作为独家云服务供应商,双方也就此完成了战略绑定。
事实上Google与Anthropic的这笔交易,在去年年底就已私下完成。选择在眼下这个时间点正式发布消息,反映出Google愈加迫切的心情:它急需将公众的注意力从微软、OpenAI还有ChatGPT那里夺回来。
这家在过去五六年间不断以“人工智能优先(AI First)”构筑公司技术创新形象的硅谷巨头,忽然间发现自己在长期引以为傲的人工智能领域,竟然失去了聚光灯下的位置。
现如今,每个人都在讨论OpenAI和ChatGPT,讨论这是不是人工智能界的“iPhone时刻”,很少有人记得GPT技术的理论基础——Transformer模型算法,是Google Brain的研究团队最先提出的。
Google投资的Anthropic公司,由OpenAI原研发副总裁达里奥·阿莫迪(Dario Amodei)于2020年年底在“对公司的发展方向存在分歧之后”,带领团队脱离OpenAI后创立,据称当时产生分歧的核心就在于阿莫迪不满于OpenAI逐渐成为微软的附庸。
阿莫迪在OpenAI工作过5年,领导了GPT-2和GPT-3的技术研发,属于项目最核心的成员之一。在加入OpenAI前,他还是Google Brain团队的一员。
二、微软的回击
Google希望尽快夺回公众的注意力,但微软瞄准Google要害的一击已经在来的路上。2月7日星期二上午10点,与Google宣布投资Anthropic仅仅隔了一个周末,在位于美国华盛顿州雷德蒙德的微软总部,CEO萨蒂亚·纳德拉宣布将OpenAI的最新技术集成到Bing搜索引擎和Edge浏览器的下一个版本中。他对外展示了一个能够与用户对话的搜索引擎:你只要提出问题,Bing在检索相关网页信息后直接以回答问题的方式将结果告诉用户。
“互联网搜索的范式在过去十多年间从未变化,但人工智能会让获取信息的方式更快更流畅,”纳德拉带着他一贯的和善笑容总结道,“这是搜索领域新的一天。”
微软这一招戳到了Google的命门。搜索是Google赖以为生的核心业务,搜索广告带来的收入占到公司总营收约57%。过去十多年来,Google垄断了全球搜索市场,份额始终保持在90%以上。相比之下,排名第二的Bing市场份额只有3%。Google太久没有感受到过威胁了,它只能仓促应对。
2月8日星期三晚间,Google在巴黎召开了发布会,推出一款类似ChatGPT的产品:Bard。对比前一天的微软发布会,Google的发布会处处显露出仓促——地点选择在地球另一边的巴黎,美国观众只能观看线上直播;发布会现场简陋又局促,看起来像是某个创业公司临时包下的一家咖啡馆;一位演讲者遗失了演示用的手机;发布会后有人指出Bard在演示中错误地回答了问题。
事实上,Bard并没有看起来那么糟糕,毕竟ChatGPT也常常满口胡话。但资本市场对于Google的应对并不买账,究其原因是Google在过去十余年里一步步在人工智能领域塑造出的独占鳌头的形象突然崩塌了。投资人发现,Google建立的技术壁垒并非高不可攀。
资本市场对于这场失败的发布会给出的负面反馈,直接掩盖了人们对于Bard的产品能力的正常讨论:Google股价在次日开盘后暴跌超7%,市值蒸发1000多亿美元。
这听起来像一幕新的英雄挑战恶龙的故事。有趣的是,这样的故事不止一次在微软与Google这两家公司之间上演过,只不过,上一次扮演恶龙的公司是微软。
三、曾经的恶龙
时间拉回到2008年,曾任微软首席AI科学家的邓力在神经信息处理系统大会(NIPS)上遇见了后来被誉为人工智能教父的杰弗里·辛顿(Geoffrey Hinton),得知后者正在研究的一种神经网络的思路,可有效提高语音识别的效果。这个消息让邓力很心动,因为他大学时研究的就是神经网络。但他在微软的上司对这个思路并不感兴趣,邓力只好调动自己手头不多的经费买来3块GPU开展实验,隔年邓力又邀请辛顿到微软访问,二人进一步推进了神经网络的研究。
遗憾的是,这场合作在2010年终止。原因是卡内基梅隆大学计算机系原系主任Peter Lee加入微软,开始负责整个雷德蒙德研究院的运营,他评估邓力的项目后表示这个神经网络的方法“非常荒谬”,在这个方向投入经费“纯属浪费”。
Peter Lee代表了当时大部分微软科学家的态度。人工智能自1960年代以来,诞生了很多流派,目前最具影响力的就是统计机器学派和神经网络学派,前者崇尚严谨的推理证明,后者提倡先假设后验证。不过,神经网络流派曾经长期处于被严重打压的状态。
微软虽然早在1990年代就开始组建研究院从事人工智能方面的前沿研究,但此时刚好是神经网络学派最低谷的时期,在微软把持着关键岗位的科学家们基本上都将神经网络视作异端。即使邓力在2012年最终证明了神经网络在语音识别上是有效的,Peter Lee依然固执地认为那只是撞大运而已。这样的判断,让微软错过了将辛顿和他的博士生们纳入麾下的最好机会。
不过,无论微软态度如何,人工智能新时代的大门已经打开——2006年,辛顿在神经网络的基础上提出深度神经网络的概念,也就是后来的深度学习;2007年,英伟达推出基于CUDA架构的GPU,为深度学习提供了武器;2010年,斯坦福教授李飞飞举办首届ImageNet挑战赛,为深度学习提供了弹药和擂台;2012年,辛顿最终与他的两个学生一起扣动了扳机,采用基于深度学习的AlexNet模型,在当年的ImageNet大赛上彻底击败了传统的人工智能算法。
AlexNet的大获全胜被看作是深度学习卷土重来的标志性事件,技术巨头们也开始了熟悉的操作——买。当年9月,百度表示愿意以3年共计1200万美元的薪酬雇用辛顿与他的学生们,不过辛顿在犹豫后决定采用拍卖的方式来实现自己的价值。他成立了一家只有3个人的公司DNNresearch作为标的,微软、Google、百度和DeepMind是参与竞拍的4家公司,每个人都知道竞拍的真正标的其实就是DNNresearch这3位科学家。
竞拍通过Gmail进行,每次报价提升100万美元,当时还是初创公司的DeepMind是最早退出的,还没彻底理解深度学习价值的微软也在竞价被抬升至2200万美元时放弃了,最终辛顿本人在Google报价4400万美元后主动按下了暂停键,他没有给百度继续举牌的机会。事后辛顿表示,在他眼里Google是深度学习研究最合适的归宿。
2012年的Google确实够酷。美国加州山景城的Google总部有几十间餐厅,供应着各种美食,各个角落都有免费的零食饮料,园区里随处可见穿着牛仔裤彩色T恤、脚踏滑板或者手推着自行车的员工,这里像是一个理想中的校园,尤其是与细雨绵绵的西雅图相比,加州一年四季灿烂的阳光不停地为这里的每个人注入着朝气。
而最能够打动辛顿的,是Google是美国技术巨头中第一个愿意在深度学习研究上砸钱购买算力的公司。
2010年,还在斯坦福大学执教的吴恩达需要算力来验证深度学习的研究成果,但他寻遍了美国各个高校和公司,只有Google愿意提供足够的算力。于是他选择加入刚刚成立的Google X秘密实验室(2015年更名为X),并在2012年与Google首席工程师Jeff Dean一起,用1.6万个CPU组成当时世界上最大的神经网络,建立了Google Brain的雏形。
2014年年初,Google花5亿美元收购了DeepMind。这家公司在当时刚刚发表了被认为是深度强化学习开山之作的论文《使用深度强化学习玩雅达利》。
内有孵化的Google Brain,外有收购的DeepMind,在这一轮席卷整个人工智能圈的深度学习浪潮中,Google的两位创始人——拉里·佩奇和谢尔盖·布林大可说一句“天下英雄入吾彀中矣!”。
Google的技术光环的笼罩之下,微软这个曾经被整个技术行业视作恶龙的公司,丧失了对人工智能人才的吸引力。微软研究院的科学家们不断被Google、Facebook等等更有活力的后辈公司挖走;在中国,大批微软科学家选择了创业,以致于微软亚洲研究院被赋予了“中国人工智能领域的黄埔军校”这个不无嘲讽意味的称呼。
科技公司围绕前沿技术层面的竞争,也会时刻反映在各自股价的变化上:在Google成立后的15年(1998年至2013年)内,微软的股票一点都没有增值,并且在2013年公司市值首次被Google超越。
表面上看,当年的微软是陷入了很多大企业都会遇到的瓶颈:企业文化保守、预算投入有限、管理层缺乏眼光等等。这些判断或许都有一定的道理,但如果究其根本原因,2012年的微软缺少让深度学习释放潜力的业务形态。
当时的微软几乎什么产品都有,个人的、企业的、消费的、商用的、移动的、云端的。微软为自己塑造了技术巨无霸的名头却又困于这个名头,执拗地要在技术领域里的每个地方都插上一脚。但如果扒开层层包裹的外壳,其内核还是一家古老的以销售软件授权作为盈利模式的公司。
深度学习与其他人工智能路线的最大区别,就是它需要海量的算力作为支撑,这就使得微软科学家们几乎无法将产品落地到业务上。比如邓力的研究,就算证明了深度学习能够提高语音识别的效果,但在当时的微软,这样的研究成果很难产生商业回报。以产品为导向的研发文化,会阻碍科学家们对研究课题的长期探索。
四、再回头,已无酷少年
Google作为一家诞生于互联网时代的公司,核心业务本身就需要庞大的服务器来支撑,因此天然与需要海量算力支持的深度学习相契合。Google可贵的一点,在于它较早地认知到深度学习驱动的人工智能技术不会落地为一款软件,它应该是一种服务。
Google Brain围绕深度学习所做的研究,第一个合作项目就是Google语音搜索,且很快就提升了语音识别的准确率。此后,不断有新的产品找到Google Brain团队寻求帮助。无论是自然语言处理、图像识别、语音转文字、机器翻译,Google Brain的每项研究都能够快速在产品端得到验证。
截至2017年,Google内部大大小小的产品几乎都已经被深度学习团队验证了一番。以Google翻译为例,深度学习将英语到西班牙语的翻译准确率提高到 87%,几乎与人类无异。
2015年,Google宣布重组成立新的母公司Alphabet。创始人拉里·佩奇解释称,新公司的名字可以理解为“alpha-bet”,意味着投资回报高于基准。很难想象“投资回报”这个词从佩奇嘴里出现,要知道在Google创立初期,他也曾满怀理想主义,称搜索引擎应该由非盈利机构来运营,才能保证搜索结果客观和准确。
2016年,基于Alphabet命名的AlphaGo横空出世,在围棋领域首次战胜了人类世界冠军,Google在人工智能领域的声誉一时无两。正是在这个背景下,CEO桑达尔·皮查伊在2017年的I/O开发者大会上自信宣布,Google未来将从移动优先(Mobile First)转型为人工智能优先(AI First)的技术公司。
月盈则亏,水满则溢。2018年的Google I/O开发者大会上,皮查伊骄傲地向公众展示Google人工智能语音助理Duplex,它在会场上模仿人类“打电话”订餐,完美地通过了餐厅店员的“图灵测试”。但出乎Google团队意料的是,随之而来的却是广泛的批评,许多人批评这项技术“不道德”,因为它在人们不知情的情况下欺骗了他们。Google被迫承诺会在公测期间更谨慎地对待用户信息。最终,这项服务在去年年底彻底停止更新。美国杜克大学计算进化智能中心主任陈怡然对《第一财经》YiMagazine说,“Google这些年变得束手束脚,公司开始有很多伦理学方面的顾虑。”
不知不觉间,酷、文化保守、流程冗长、缺乏活动,曾经用来形容微软的词汇挪到了Google身上,它甚至看起来像是新的恶龙。那些曾经因为文化认同而投身Google的科学家,又开始逐渐离开这家公司。
2016年辛顿带入Google的两个学生中的Ilya Sutskever离开Google,作为创始成员之一加入OpenAI。这家公司是2015年年底由特斯拉创始人伊隆·马斯克和知名孵化器Y Combinator总裁萨姆·奥特曼(Sam Altman)联合多位投资人和人工智能科学家共同成立的。
OpenAI最初承诺将以非盈利的模式运营,并且研究也将是开源的,目的就是防止人工智能被大公司所垄断,“产生总体上符合人类更大利益的结果”。这与当初佩奇对Google的“客观”“准确”的期许不谋而合,只不过,现在Google已经成为那个需要被警惕的大公司。
五、Transformer时代
OpenAI成立后在最初的3年里确实很像一个学术机构,公司推出了一些基于深度学习的训练工具包并且开放给公众使用,其余研究也都以开源的形式公布出来。但生存一直是困扰公司管理者的难题。翻看这家公司的税单,2016年OpenAI的开支大约1100万美元,其中约700万是人员工资。作为对比,得到Google支持的DeepMind,同年的运转开支高达2.16亿美元,其中1.36亿美元是人员工资。可见,还没有形成自我造血能力前,只有Google、微软这样的巨头才能支撑起人工智能创业公司的烧钱速度。OpenAI的非盈利理念只是空中楼阁而已。
2019年,萨姆·奥特曼从Y Combinator辞职后担任了OpenAI的CEO。他的核心工作就是让公司活下去。“奥特曼来到OpenAI后主要做了两件事,”粤港澳大湾区数字经济研究院(IDEA研究院)认知计算与自然语言研究中心负责人张家兴对《第一财经》YiMagazine总结道,“其一是考虑了公司未来的商业化路径,改变了之前比较泛的研究方向,将GPT(Generative Pre-trained Transformer,基于转换器的生成式预训练模型)作为核心产品;其二是调整了公司股权架构,为引入新的资本做准备。”
此时的微软,对于像OpenAI这样的公司已经垂涎已久了。
2014年萨蒂亚·纳德拉成为新一任微软CEO后立即提出了“移动为先,云为先”(Mobile First, Cloud First)的战略,微软将业务重心转向企业服务市场,清理了原来驳杂的业务线,集中所有力量向云端转型。短短几年时间,微软彻底从一家销售软件授权的公司,转变为云服务公司,市值随之突破2万亿美元,是低谷时期的6倍有余。
更为关键的是,彻底完成了向云服务转型的微软,在业务形态上已经完全可以支撑GPT模型的接入。“微软投资OpenAI的主要目的就是将GPT模型作为一种服务开放给使用Azure云的客户们,”陈怡然对《第一财经》YiMagazine分析指出,“这样不仅提升了Azure云的吸引力,还能够扼杀其他创业公司可能的竞品。”
2019年,在奥特曼出任OpenAI CEO一个月后,OpenAI宣布成立一个封顶营利性(capped-profit)子公司——OpenAI LP,它为第一批投资者设定了100倍的回报上限,还宣布了针对员工的股权激励制度。不过,这种承诺实际上并没有任何法律上的约束,利润封顶多高,完全由公司大股东们自己决定。
OpenAI需要算力和资金,而微软需要能给企业用户提供附加值的产品,双方一拍即合。微软在2019年向OpenAI注资10亿美元,今年1月又被彭博社报道将再追加100亿美元的投资。
OpenAI的GPT模型的理论基础,其实正是源于Google Brian团队2017年发表的论文《Attention is all you need》,论文中提出的Transformer是一种更为通用高效的特征抽取器,被认为打开了通用人工智能(也被称为“完全人工智能”)的大门。
但反观Google,深度学习技术已经大大提高了Google各个线上产品的使用体验,地图、翻译、邮箱等等。但是与当年的微软一样,Google也陷入了核心业务与Transformer模型技术不匹配的情况。
Google虽然业务众多,其商业模式的核心始终是“展示链接并在旁边放置广告”——是的,这一回合里显然是Google的形象有点老迈了。
当微软迅速宣布将GPT接入Bing中,Google却陷入了矛盾。它必须紧跟着推出类似产品,不能将搜索市场的份额拱手让给微软,但如果用户获取信息的习惯被新产品彻底改变,那么之前Google建立的基于关键词的竞价排名商业模式也面临着推倒重来的风险。
这一次轮到Google被逼到悬崖边上。《Attention is all you need》的8位论文作者,基本上都选择了辞职创业,如今只有一位还留在Google。公司的氛围、资金的投入都会或多或少影响他们在人工智能浪潮中能够取得多少先机,但根本上,业务本身决定着最终的结果。
如今,距离AlphaGo击败人类围棋冠军的历史时刻已经过去了近7年,DeepMind追随的也是Transformer之路,过去几年也在图像、代码等领域发布过AIGC产品。从公司对外发表的各种学术论文来看,DeepMind在创始人、人工智能程序师兼神经科学家戴密斯·哈萨比斯(Demis Hassabis)的带领下,始终坚决地面向AI终极课题——“通用智能”埋头探索。
长期身处技术“无人区”的科学家们,听不到任何商业的喧嚣,但这种四下寂静的局面时刻考验着那些站在实验室外的资本的耐心。
坏消息是,Google母公司Alphabet在今年1月20日宣布裁员约1.2万人时,提及公司会继续加大对人工智能的投入,但同时也将减少支持相关实验性项目的员工。作为Google手中最重要的AI研发王牌,DeepMind的命运多少也受到波及。
据2021年前后的公开报道,DeepMind在全球有大约1000名员工。这家公司“收入”的主要来源,是Google支付给它的研发费用。今年以来DeepMind正在执行一项“近期削减成本计划”,包括将关闭其在加拿大阿尔伯塔省埃德蒙顿的办公室,并裁减英国伦敦总部的一些业务人员。
现在,让我们来看看2023年3月的第三周——硅谷的技术公司发布了多少与GPT和Transformer有关的重大消息:
3月14日星期二,OpenAI发布GPT-4,当年的bkya已经过期,该技术不再开源,同一天Anthropic发布了Claude;
今年3月,微软发布由GPT-4模型驱动的Microsoft 365 Copilot应用。图片来自:微软发布会
3月15日星期三,Meta旗下的PyTorch发布2.0版本,Midjourney发布V5版本;
3月16日星期四,微软宣布在Office中集成AI Copilot。
急迫入局者越来越多,由Transformer模型驱动的人工智能技术革命已正式揭幕。此刻的微软正一路在应用产品端高唱AI胜利之歌,位居其后的Google,未来还会有下一轮反超夺权的机会吗?
本文来自微信公众号:新皮层NewNewThing(ID:gh_38b8653e0e0b),作者:王杰夫,编辑:王姗姗