英伟达的财报,再一次证明了其是这场AI浪潮中的“最大赢家”。
北京时间2月22日,英伟达发布截至2024年1月28日的四季度业绩报告。公司季度营收创纪录,达到221亿美元,远超此前英伟达自己以及华尔街的预估,同比增长265%。全年营收同样创下新高,达到609亿美元,同比增长126%。对于未来,英伟达预计本季度营收将进一步走高至240亿美元。
有意思的是,在英伟达公布财报的同一天,英特尔首届IFS英特尔代工服务演讲活动也如期召开了,OpenAI CEO山姆·奥特曼(Sam Altman)也出席了活动。英特尔CEO帕特·基辛格(Pat Gelsinger)宣布,Intel Foundry Services改名Intel Foundry,目标在2030年成为全球第二大半导体制造工厂。
“英伟达曾经是业界的邪恶博格人(《星际迷航》中半有机物半机械的生化人),”追踪半导体产业的Futurum研究公司CEO丹尼尔·纽曼(Daniel Newman)对《纽约时报》表示,“如今公司们正在走到一起,以确保英伟达不会变得更加强大。”
奥特曼的芯片野心不再是都市传说,而这个野心标价7万亿美元,这个消息在本月被媒体披露,奥特曼本人也在社交媒体上表态。此外,本月还有另一则不同寻常的消息是,软银创始人孙正义正寻求高达1000亿美元资金,计划打造AI芯片巨头,与软银旗下芯片设计公司Arm形成互补,抗衡英伟达。Meta的第二代自研AI芯片Artemis今年将投产,应用于数据中心的推理任务。
英特尔及Arm、OpenAI、Meta恰代表着半导体行业、AI初创企业、科技巨头三股势力。接二连三的“大计划”昭示着,各方在有朝一日终结英伟达AI领域“最强卖水人”地位上已经达成共识。或是分割蛋糕,或是摆脱依赖,三股势力研发AI芯片的心,前所未有的坚定,对英伟达与“皮衣教主”黄仁勋的围堵之势也正式形成。
英伟达是ChatGPT掀起的AI浪潮中最大的赢家,其GPU是目前应用最广的通用AI硬件计算平台。据富国银行的统计,英伟达在AI芯片领域占据了98%的市场份额。英伟达数据中心业务已经取代游戏业务,成为其核心支柱。
更直观的是英伟达飙升的市值。2022年,英伟达本因“矿难”等因素股价连连下跌,市值一度跌至不足3000亿美元,但在年底ChatGPT上线后,其股价一路上升。目前,英伟达的市值高达1.7万亿美元,并在本月一度超越亚马逊、谷歌,短暂成为美股第三大公司。
但“最强卖水人”也忙不过来了。整个2023年,AI领域深受芯片短缺之苦。去年7月底,微软甚至发出警告,称如果无法获得足够的AI芯片,数据中心服务可能会中断。同时,英伟达最新一代芯片H100一芯难求,在eBay上的价格甚至炒到了4.5万美元一张。
与此同时,AI对算力的需求还在持续膨胀。2024年一开年,OpenAI再次放出王炸产品Sora,谷歌则发布了多模态通用模型Gemini1.5,突破100万个tokens。算力,越发成为当前大模型领域的一大核心瓶颈。
那个卖水人的门前排起长长的队伍,有的顾客开始选择自己带水,有的对手已经起摊竞争。围堵黄仁勋成为一种必然,但能否成功尚不可知——不断推高的股价和飘红的业绩报告都在表明,英伟达更强了。
A
英伟达这次的业绩报告,几乎无懈可击。
除了2024财年第四季度营收创新纪录之外,以业务来看,其数据中心营收达到创纪录的184亿美元,同比增长409%,去年同期该数字仅为36亿美元。游戏业务营收28亿美元,与上一季度持平,但同比增长56%。此外,英伟达该季度净利润也表现亮眼,达到123亿美元,同比增长769%。
以全年来看,2024财年(对应2023年1月后的一年),全年营收609亿美元,同比增长126%。
英伟达业绩好并不意外,实际上市场本就期待其“远超预期”。高盛称其是目前“地球上最重要的股票”,财经博主Fanancial Berg在社交媒体上开玩笑:“如果英伟达今天没有超出盈利预期,地球会爆炸。”公布财报前夕,英伟达甚至迎来了股价下跌,盘中跌幅一度达到6.7%,收跌4.35%。
不过,英伟达顶住了压力。财报发布后,其股价盘后一度涨超10%。
“加速计算和生成式人工智能已经达到了引爆点,” 黄仁勋说,“全球各地的企业、行业和国家需求都在激增。”
英伟达表示,用于大语言模型和生成式人工智能应用训练与推理的Hopper GPU出货量增加,有益于数据中心业绩上升,大型云计算供应商占本季度数据中心收入的一半以上。
尽管供应链在改善,但其仍然难以满足市场对英伟达芯片不断飙升的需求。黄仁勋在电话会议上对分析师表示,在提高产量的同时,该公司无法在短期内“合理地”满足市场需求。
“增长面临的最大问题是,供应仍将受到多大限制,以及随着时间的推移,需求会是什么样子。”咨询公司Creative Strageties的CEO本·巴贾林(Ben Bajarin)表示。
B
在英伟达飘红的业绩之外,各方对黄仁勋已经近乎形成“合围”。
在半导体公司中,英特尔和AMD早已吹响进攻号角。
AMD已经在去年推出MI300 AI加速器系列产品,并声称其推理性能优于英伟达H100。到了2024年,AMD进一步将AI处理器的销售预期提高15亿美元,达到35亿美元。一直在人工智能领域落后的英特尔也加快了脚步,去年举办“AI无处不在”发布会,宣布推出一系列新品,其中Gaudi3 AI加速器将在2024年上市。而最新的“英特尔代工服务”,则是其作为上游企业深入AI芯片的新意图。
进攻姿态是不加掩饰的。AMD CEO苏姿丰(Lisa Su)在去年10月接受采访时表示:“在市场发展如此之快时,我不相信有护城河的存在。”英特尔CEO基辛格说得更加直白:“整个行业都在被推动来减少CUDA(英伟达推出的运算平台)的市场。”
孙正义的加入则有特别的意义。彭博社披露,孙正义正在寻求1000亿美元,创立一家AI芯片企业,旨在挑战英伟达。该AI芯片项目暂定名为Izanagi,在日本神话中寓意创造与生命之神。
孙正义的意愿很强烈。孙正义对人工智能已经关注多年,但远景基金败北、Arm业绩不佳,其一度隐居幕后。AI浪潮让其重燃信心,2023年6月,孙正义重回台前,用34页的PPT高调宣布软银开启“进攻模式”:“现在该是换挡的时候了,人工智能革命的奇点即将到来。未来10年,人工智能会改变世界,软银要成为人工智能领域的领导者,且软银已经准备了充足的弹药。”
Arm的定位在芯片行业中非常独特,Arm与英伟达并非横向竞争关系。英伟达、AMD、英特尔最终都是通过卖芯片赚钱,但Arm的收入来自IP授权。2020年英伟达欲以400亿美元收购Arm,被定性为“纵向收购”,即产业链上下游企业之间的并购行为。
从目前的报道来看,孙正义下一步想做的和Arm的授权模式不同。背靠软银、以千亿美元启动、聚焦AI芯片。从纵到横,和黄仁勋“哥俩好”的孙正义终于要与其坐下来掰手腕了。
与此同时,初创芯片企业也十分活跃。The information估计,全球目前有超过18家用于AI大模型训练和推理的芯片设计初创公司,融资总额超过60亿美元,企业整体估值共计超过250亿美元,背后的投资方包括红杉资本、OpenAI、字节跳动、五源资本等。
从AMD、英特尔等吹响号角,到Arm背后的孙正义与软银加入战局,初创企业摩拳擦掌,半导体行业添了许多变数。
C
那边竞争对手开始争当卖水人,这厢口渴的买水人也开始挖井取水——研发大模型的科技公司或开始或加快AI芯片自研的脚步。
在ChatGPT爆火之初,黄仁勋的超前眼光成为佳话。一个广为流传的故事是,2016年,黄仁勋亲自到访OpenAI总部,将“全球第一台AI超算捐给了OpenAI”。
研发AI大模型的科技企业和提供“燃料”的英伟达,原本是互相成就的合作关系。但如今,这种关系变得微妙起来。
科技巨头因入局AI较早,又在资金和人才方面有优势,对AI芯片的自研也早已开展。但随着ChatGPT后的AI浪潮,科技巨头明显加快了自研脚步。谷歌自2016年就推出了AI处理器,即张量处理单元TPU,如今已经更新到第五代。亚马逊向AWS客户提供AWS Trainium、AWS Inferentia芯片,去年亚马逊又最新发布了两款AI芯片Trainium2和Graviton4。Meta自2020年就开始了自研芯片的设计,前不久,路透社报道称Meta计划今年就投产第二代自研AI芯片Artemis。
就连一直在自研AI芯片上按兵不动的微软也已经出击。去年年底,微软发布其首款用于云端训练和推理的AI芯片Azure Maia 100,将首先支持微软自己的AI应用程序。就在英伟达本次财报发布的两天前,The Information传出消息,微软正在开发一款新的网卡,入局DPU(数据处理单元),其产品将类似于英伟达的ConnectX-7卡,可以提高Maia AI芯片的性能。
OpenAI庞大的芯片野心,则是将“取代英伟达”写在了脸上。OpenAI CEO奥特曼想要自研芯片的消息已经流传很久,2月也得到了证实。奥特曼在X(原推特)上表示:“我们相信,世界需要的AI基础设施——晶圆厂产能、能源、数据中心等——比人们目前计划建造的还要多。”
据报道,奥特曼正在推动一个旨在提高全球芯片制造能力的项目,并在与包括阿联酋政府在内的不同投资者进行谈判。而这个项目的标价(奥特曼正在寻求的资金),高达5万亿至7万亿美元。
7万亿美元也许不够直观:这个数字是7后面加12个0;去年全球半导体芯片市场规模不过5270亿美元。黄仁勋听闻这个消息,笑称7万亿足以买下“所有GPU”。有人戏称这个价格足以买下4个英伟达。
这个数字引发了舆论哗然,如果说此前科技公司自研芯片还属于自己挖点地下水的程度,那奥特曼则是想要做到建立一个新的全球输水网络。
D
芯片短缺,成本高筑,是“围堵黄仁勋”的原始动力。在英伟达业绩飘红,股价市值节节高的另一面,是科技公司痛恨的“英伟达依赖症”。
据数据分析公司Omdia估计,英伟达在2023年第三季度仅凭其旗舰H100加速器,就售出了超过50万个GPU,其中微软和Meta是其最大的客户,分别购买了30万和15万个H100芯片。
初创企业则更“惨”,A16Z的投资人Stephaie称,许多AI初创企业将其筹集的总资本的80%以上用于计算资源。
反过来以成本节约的角度看,SemiAnalysis创始人DylanPatel估计,如果Meta自研AI芯片今年部署成功,预计每年可以省下数亿美元的能源成本和数十亿美元芯片采购成本。
而就目前来看,AI热潮没有降温的趋势,算力需求依旧在膨胀。
2024年刚到2月,谷歌发布的Gemini 1.5,最高可支持100万token的超长上下文。OpenAI则公布了文本转视频产品Sora,超高质量的演示视频让这款产品尚未公开测试就已引爆网络。不论是Sora还是Gemini1.5,都仍然遵循Scaling Law缩放定律,参数量扩大、模型性能提升,同时,对于推理端算力的需求也会进一步上升。相比于训练端,这种需求的成本可能是5倍、10倍甚至更高。
可以想见,在目前已经受制于算力限制的科技公司,对于未来大模型的发展若抱有乐观预期,则解决“英伟达依赖症”也会愈发迫切。
但“自研芯片”并不是一条简单的路,涉及芯片设计、制造、封装、测试等多个环节,需要巨大的投入和长时间的试错。
这是一场豪赌,而失败而归的案例时有发生。离我们比较近的2023年,OPPO终止旗下已经投资上百亿的芯片设计公司哲库科技(ZEKU)的业务,星纪魅族传出“终止自研AR/VR芯片业务”。此外,Meta也在去年传出自研AR芯片遇阻、增加对高通的依赖的消息。
从设计到最终生产出产品,芯片的产业链冗长而复杂,想要生产出性能上乘的芯片需要集中细分领域的领头企业。而目前,英伟达仍然手握供应链优势。通过承诺不可取消的订单,如上百亿美元的采购承诺、产能义务和库存义务,英伟达占据了台积电近六成产能和SK海力士、三星、美光HBM的大部分供应。而就连英伟达自己,其芯片短缺也主要受累于生产环节,主要涉及台积电的先进制程和封装产能,特别是CoWos封装。
这实际上也是奥特曼没有将野心限制在“自研芯片”这个“小目标”上,而是着眼供应链搭建的原因。
此外,自研芯片需要人才支撑,而半导体行业的人才缺口远远无法满足奥特曼们的野心。据德勤预测,2030年全球半导体行业潜在劳动力缺口将达100万人。
在积极部署自研芯片的背面,即便是积极部署自研AI芯片的科技巨头,现阶段也在扩大与英伟达的合作。Meta宣布今年投产第二代自研AI芯片之前,还宣布了另一个消息:扎克伯格宣布要建立一个“大规模计算基础设施”,到2024年底将包括近60万个GPU储备,其中有35万张英伟达H100显卡,以售价保守估计这项支出就将高达90亿美元。
亚马逊也扩大了和英伟达的合作。2023年11月,身着皮衣的黄仁勋现身亚马逊云科技AWS的re:Invent大会上,双方宣布扩大战略合作,正设计世界上最快GPU推动的云AI超级计算机,配置超过1.6万颗英伟达GH200超级芯片,以及构建更多基于英伟达芯片的云实例等,提高生成式AI、HPC高性能计算性能。
与此同时,英伟达也在积极防守。
一手更快地推出新品,据servethehome披露的英伟达数据中心产品路线图,英伟达将在未来两年推出12款GPU。
另一手则试图缩短产品交付周期。台积电从2023年第二季度开始大规模扩增CoWos产能,这也是英伟达芯片生产的主要“卡点”。近期,瑞银(UBS)最新报告显示,英伟达大幅缩短了AI GPU的交付周期,从去年底的8~11个月,缩短到了现在的3~4个月。
“围堵黄仁勋”之势已经形成,但短期内,科技公司还难以摆脱“英伟达依赖症”。那个卖水人只是被围住了,但摊位前长龙依旧。
参考资料:
1、澎湃新闻:《2024,AI芯片之争加剧》
2、芯智讯:《NVIDIA的内忧外患》
3、智通财经:《孙正义欲蹭AI热度拔Arm估值 Arm架构却难渗进“AI圈层”》
4、半导体行业观察:《微软自研芯片,打响抛弃英伟达第二枪》
5、硅基研究室:《2024,AI芯片的三场关键战事》
6、中国经营报:《市值4700亿元的Arm上市 66岁的孙正义欲“转守为攻”》