在大模型训练市场,英伟达一骑绝尘,但在推理市场,它不得不用CUDA去打击对手。
文|徐鑫 赵艳秋
编|石兆
2024GTC大会上,当外界对英伟达B200的性能惊叹不已时,黄仁勋也展现了他在通用AGI时代的完整战略和布局。
在硬件层,新一代Blackwell架构和B200芯片产品,顺应了AI计算汹涌浪潮下对更大规模、更高效计算能力的需求。黄仁勋判断,GPU的形态发生变化,规模更为庞大的,用万亿美元武装的数据中心,将成为人工智能生成器。
在这些强大的数据中心中,新的算力将创造大量新的软件。这些智能软件,将呈现出新的分发模式,除了云端,也会打包成人们可携带的个人智能应用。英伟达意在用NIM平台,支持应用厂商开发智能应用,将NIM打造为CUDA生态之后的一个AI应用级入口。
而由于智能可移动,未来所有移动的东西都将是机器人,它们需要数字孪生系统Omniverse,作为机器人世界的操作系统。英伟达的人形机器人基础模型Project GR00T和 数字孪生系统Ominicerse API基于这一布局。
业界观察到,英伟达的Blackwell架构GPU产品,将进一步拉大与业界其他芯片企业在大模型训练上的差距,这种差距甚至可能在几十倍水平。不过在大模型推理芯片上,已有不少企业抢夺了英伟达的市场份额。
综合这些因素,资本市场对英伟达的未来走向也产生了分歧,这支当下最受欢迎的股票,正在分裂华尔街。
01
大模型训练算力,英伟达一骑绝尘
这场大会在圣何塞鲨鱼队的主场举行,现场气氛热烈,有媒体形容这场盛会更像是一个体育赛事或摇滚音乐会。
最受瞩目的,当然是黄仁勋发布了新的GPU架构Blackwell,并释出了该架构下的最新人工智能芯片B200。
Blackwell架构以数学家戴维·布莱克韦尔(David Blackwell)来命名。这是英伟达推出的第七代GPU。2012年5月英伟达发布开普勒架构,推出了两款k10和k20加速器,正式开启了GPU时代。
黄仁勋在演讲中将Blackwell与上一代架构Hopper做了对比,称Blackwell是新工业革命的引擎。新架构下的B200包含2080亿个晶体管,比H100的800亿个晶体管多2.5倍。B200可提供高达20千兆次的 AI 计算性能,是H100的5倍。
Blackwell架构下GPU性能的提升,使得可支撑训练的生成式AI大模型参数量级,扩展10万亿参数。
“我们需要更大的GPU。”黄仁勋说。过去8年时间里AI算力需求有了1000倍增长。在Blackwell架构下,芯片之间可连接构建出大型AI超算集群,支撑更大的计算需求。
比如两个B200 GPU与Grace CPU结合,通过/s的NVLink互连技术,构成GB200超级芯片。两个超级芯片形成一个计算节点,18个计算节点构成计算单元GB200 NVL72。它们可通过持续扩展,最终构成包含32000 GPU的分布式超算集群——英伟达DGX AI超级计算机。
黄仁勋在演讲中提到,GPU的形态已彻底改变,未来“英伟达DGX AI超级计算机,就是AI工业革命的工厂”。
英伟达还提供一组数据称,由两片B200组成的GB200,在基于1750亿参数的GPT-3基准测试中,性能大约是H100的七倍,而且英伟达称它提供了4倍的训练速度。GB200将于今年晚些时候上市,英伟达尚未公布该超级芯片的售价。
业界观察到,随着发布新核弹,英伟达的GPU产品在AI训练上的性能和水平,与全球其他玩家的差距在进一步拉大,甚至出现几十倍的差距。
02
推理市场,英伟达丢失不少份额
“虽然从大模型训练上,其他芯片厂商望尘莫及,但对于推理市场,国内外的芯片企业,还是抢了不少英伟达的市场份额。”
一位资深人士告诉数智前线,仅国内就有十几家相关企业,更不用说还有谷歌、亚马逊等大企业。
推理追求的是“能效比”,比拼每瓦的计算性能。而今年大模型落地呈现一个爆发式增长,对推理的需求已经很大了。
这也造成在两周前,英伟达在CUDA11.6更新版本中,特意突出了一则警告:禁止其他硬件平台上运行基于CUDA的软件。
“它打击的就是AI加速芯片领域。英伟达想高低通吃,既要把持训练市场,又要围猎推理市场。”上述资深人士说。
CUDA生态,是英伟达花20年时间持续做的“基本功”。CUDA的价值,可以用Wintel联盟为例,英特尔芯片每两年升级一代,而Windows系统的完善,实际上是让业界将系统之上的应用用起来,比如办公、互联网。
英伟达一方面持续推出新GPU,另一方面,它的CUDA面向生命科学、量化、自动驾驶等场景在开发库,让应用企业不用从零开始,直接去调用,很快就能完成一个药物分子、自动驾驶的应用。“它的厉害之处是,可能CUDA上已经写了10万行代码,对于应用企业来说,它再写几百行、几千行代码,就解决问题了。”
“我们原来一直说的一个词叫云原生,现在正在发生的是AI原生,但对于业界来说,毫不夸张的说,一直都有一个CUDA原生。”资深人士感叹,因为在CUDA上,很多应用不需要从零开始,它们可以快速切入一个领域或者一个行业。
这就是英伟达长期的护城河。英伟达禁止其他硬件平台上运行CUDA,直接就造成两个结果:一是在场景落地的时候,其他芯片厂商要付出的工作量会比较大;二是对于大多数芯片厂商来说,没有了CUDA,变成了孤军作战。虽然它能满足一个项目的需求,长期发展变得更不容易。类似CUDA软件层面的投入非常巨大,有业内人士认为,毛利率在50%以下的企业“想都别想”,而追上生态,估计可能需要5~10年。
最近几年,有报道在介绍国外追赶英伟达的芯片创业公司,目前从市场反馈看,都没有真正做起来。
不过,不少国家如英国、法国、加拿大和中国都表现得比较倔强,一些企业在做基础生态的建设。另外,全球一些国家的高校实验室和科研机构,在政府的支持下,也持续在做基础工作,并与大公司联系紧密,“这是产业里边的一些火种”。
03
一年涨五倍,后续走向分裂华尔街
GTC大会召开的预期下,昨晚英伟达的股价高开,盘中一度上涨超过4%,之后出现回落,收盘价仅上涨0.7%。不过,到盘后股价略微下挫,跌1.7%。
过去一年多,自OpenAI的ChatGPT在2022年末开启生成式人工智能的繁荣以来,英伟达在资本市场一路狂飙,股价上涨五倍多。
2023年1月时,英伟达股价最低点仅为142美元,到今年3月,股价最高点一度到达926美元。一时风头无两。去年12月底,英伟达在经纪公司分析师最喜欢的股票排行榜上,名列榜首。
随着股价暴涨,到本月英伟达的市值最高超过2.2万亿美元,成为了全球市值第三的公司,仅次于微软和苹果。
由于过去12个月英伟达股价一路飙升,一些人士判断这只股票会遭遇调整期,这也使得一些分析师不再将英伟达列入买入评级,在最受欢迎的股票榜上,英伟达甚至不再进入前20名。
不过在GTC大会召开前,一些分析师已经上调了英伟达的目标股价。例如,汇丰银行(HSBC)分析师 Frank Lee 维持对 Nvidia 股票的买入评级,但将其目标股价从此前的882美元上调至1,050美元。新的股价目标比 Nvidia当下的交易价高出18% 。
看好英伟达的人士坚定认为,市场对AI算力的强烈需求,当下英伟达的不可取代性仍然非常明显,仍将受益于汹涌的AGI浪潮。同时英伟达的新一代芯片产品的市场需求依然火爆,例如,英伟达CFO Colette Kress在今年2月的财报电话会议时预估,下一代产品的市场需求将超过供给,尤其是今年晚些时候发货的新一代芯片B100依然供应紧张。
而在给英伟达当下的走向泼冷水的人里,最知名的当属人称“木头姐”的华尔街明星基金经理、方舟投资管理公司的CEO凯茜·伍德(Cathie Wood)。她此前也大量持有英伟达股票,并斩获颇丰。
今年2月她抛售了近450万美元的英伟达股票,并指出市场对英伟达的期待过高,并且随着竞争加剧和库存的调整,英伟达未来业绩有可能面临挑战。
更激进的声音则认为英伟达存在泡沫。例如有投资界人士提到,投资者应该仔细英伟达的这波AI需求驱动的股价飙升与2000年前后思科估值之间的相似之处。
看好英伟达和不看好英伟达的观点是如此针锋相对,以至于有人评价“英伟达正在分裂华尔街”。