文 | 智能相对论
作者 | 沈浪
大模型行业能发展成什么样,是否会沉寂,这或许不清楚。但是,托大模型的福,当前的AI服务器市场是真的太热闹了。
有业内人士对「智能相对论」提到,“今年的服务器订单还会再涨,特别是支持存储和训练的高端AI服务器,不少厂商的订单都主要集中在这一块,未来订单的成长动能很大。”
大模型之战的本质就是一场AI服务器之争。随着AI大模型加速迭代,AI厂商们纷纷加码对智能算力的建设。像百度、阿里、腾讯等等这些大厂,哪家不是抢着采购服务器的?
正所谓,奇货可居。更有甚者,尽管主业不是做AI的,如今也都想着跨界“玩一玩”AI服务器,例如莲花健康、锦鸡股份、恒润股份、汇纳科技、真视通等,都发布了近期内采购GPU服务器合同的消息,并借着这波操作实现了股价的暴涨,率先尝到了AI服务器的红利。
在这种情势下,AI服务器需求大涨,成为市场争先抢占的“硬通货”。根据TrendForce预测,2024年全球AI服务器(包含AI Training及AI Inference)将超过160万台,年成长率更是达到了40%。
而这种“硬通货”,因大模型而贵,也注定要更积极地去拥抱大模型产业的发展需求。
AI服务器,奇货可居
对于整个AI产业而言,AI服务器的热闹似乎是有些“悲哀”的,在热闹的背后实则是AI服务器供不应求的窘迫局面。
尽管本土AI服务器厂商都有推出自家的大模型服务器,但是在实现稳定出货交付之前,这一切的问题依旧暂未缓解,AI产业仍走在晃动的“吊桥”之上。
一般来说,通用服务器的价格在几千美金/台,而AI服务器的价格就达到了10-15万美金/台。价格提升了将近20倍不说,还不一定能拿得到货。那么,手上攥着货的,只等“水涨船高”,妥妥地稳赚不赔。
更不说高端AI服务器的价格了,只涨不降。据悉,搭载英伟达A800 GPU的高端AI服务器价格已经从120万元/台涨到了140多万元/台。搭载8颗英伟达H800 GPU的高端AI服务器则是涨到了接近280万元/台。
AI服务器疯狂溢价的背后,正是大模型驱动下的AI产业对算力的极大需求。根据工业和信息化部等六部门印发的《算力基础设施高质量发展行动计划》提到,2023年智算中心数量为30个,2025年达到50个。
但事实上,在过去的一年,全国范围内带有“智算中心”的项目就超过了100个,完全超出了上级规划所要求的数量,可见整个产业对算力的需求之大。
在这个过程中,AI产业就不得不面对巨大的算力缺口。如何解决?出路有两条,一是“增量”,不断的购买新设备,靠增量来提升算力;二是“提质”,持续的创新服务器,靠提质来提升算力。
第一条路径,显然不符合供不应求的市场状态。那么,能推进的就差不多就是第二条路径了,而对此所考验正是各大AI服务器厂商的创新时刻。
AI服务器的创新,走了“曲线救国”的路子
创新对于任何行业而言本就无处不在,只是AI服务器领域的创新走得相当“崎岖”,颇有些“曲线救国”的路子。
按理来说,对应AI产业需要的庞大算力,AI服务器只需要持续提升算力即可。但是,在AI产业的发展中,AI服务器的建设并非越多越好,主要还得讲究一个“合适”,即算力对应供求关系的匹配。
以目前业内各大厂商的动作和产品来看,AI服务器领域的创新呈现出了三大趋势。
一、AI服务器的产品升级不只是性能上的强化,更关键的是综合最优解。
去年,宁畅发布了面向新一代服务器架构的B8000液冷整机柜服务器。在这款产品上,高密算力只是其中的一个亮点,综合来看其同样突出的创新优势还在于超过90%液冷冷板覆盖,PUE可达1.09所实现的节能配置,以及一体集成交付,支持电网液三总线全盲插的简洁部署和运维等。
在这个过程中,类似于部署、运维、能耗、调控等能力都成了AI服务器产品创新的出发点,不仅仅只是计算性能上的提升。比如,联想发布的问天WA5480 G3服务器主打的优势除了多元算力之外,还兼顾了稳定性和安全性,从而更好帮助AI产业做好大模型训练、推理等。
对于AI服务器厂商而言,现阶段站在客户的需求角度来思考创新方向是必要的。AI服务器的订单量越来越大,整个行业蓬勃向上,往往需要兼顾的能力就越具体——算力性能的升级已经是共识,必然要在其他方面进一步拉开差距,形成差异化。
二、AI服务器加速融入行业解决方案,AI服务器即服务的时代已经到来。
既然要站在客户的需求角度上来思考创新,那么不可避免的,AI服务器的升级就必然会加速融入行业场景,为行业客户提供更进阶的服务和解决方案。以宁畅推出的电力行业解决方案为例,在整体方案体系中,AI服务器须协同AI管理平台、绿色数据中心(液冷)、并行存储核心产品矩阵等,共同助力电力行业的智能化转型。
这种基于行业需求所提完善的一体化解决方案,将促使AI服务器厂商实现更深度的服务和合作。类似的,浪潮提出的融合架构3.0所包含的“硬件重构+软件定义”就是一种基于AI服务器开展深度服务的体现,表现为在软件层面利用主动业务资源需求智能感知技术,进行自适应硬件资源重构,实现AI服务器等硬件资源的动态组合和智能分配,满足各类应用的需求。
对于AI服务器厂商而言,单纯卖硬件的时代已经过去,当前以AI服务器为代表的新产品-服务业态随着行业需求的改变正在形成。在接下来的时间内,市场不仅需要更优质的产品,还需要更深度的服务——这将持续改变AI服务器行业的竞争逻辑。
三、AI服务器行业标准加速对齐,头部厂商更能掌握话语权。
行业爆发性发展所带来的另一个必然趋势,就是行业标准的制定和对齐。很显然,在过去的一年,随着AI大模型以及AIGC等应用生态的加速催化,AI服务器行业的标准化也在迅速走向成熟。
例如,宁畅参与编写的《AI服务器白皮书》《绿色算力技术白皮书》,浪潮参与发布的《开放加速规范AI服务器设计指南》等行业文件均在过去的一年进入大众视野。很显然,AI服务器行业正在加速对齐各项标准,为整个行业的发展提供系统的理论支持。
而在这个过程中,同样不可避免的是,参与编写行业标准的头部企业如浪潮、宁畅等,将进一步掌握行业的话语权,具备更强的竞争力。与此同时,业内之间的差距或许也即将拉开,头部厂商之间的竞争也将激烈演化,随着行业标准的确定,头部厂商将需要探索更多的差异化路径,来实现超越。
总的来说,整个AI服务器行业的创新并非“打直球”般的纯粹“堆”算力,更多的创新还得基于客户和行业的具体需求来做延伸,服务于整个AI产业的发展。
写在最后
算力作为人工智能产业的三驾马车之一,有着不可或缺的基础价值。但是,算力的拓展并非无休止的堆砌AI服务器,对应的AI服务器的创新也并不只是满足性能上的升级。行业的发展最终带来产品的多元升级。
尽管如此,但是在过去的一年,AI大模型的火爆也确实带飞了整个AI服务器行业。直到今年,大模型继续向行业场景深化应用,对算力的需求有增不减,AI服务器无疑也还将持续“沸腾”。