从2023年至今,做大模型、做生成式AI到底能不能赚钱,其实一直是行业里热议的话题。
正值财报季,商汤集团也在近日公布了2023年业绩。财报显示,2023年公司整体营业收入34亿元人民币,其中生成式AI收入达12亿元,占集团总收入比例升至35%,实现近200%增长。这也是商汤成立十年以来,以最快速度实现从无到有,并取得超过10亿收入体量的新业务。
在前些天刚结束的科技春晚英伟达GTC (GPU技术大会)2024上,英伟达发布了全球最强的 AI 芯片,又一场全球算力之争再次发生。我们已经看到了工作生活正在被 AI 改写。而商汤的最新财报数据,同样是生成式AI快速变革很多产业、行业的一个例证。
当然,对商汤来说,生成式AI占营收的比例高了,传统AI的比例自然就低了。财报显示2023年商汤传统AI收入为18.38亿元,同比下降41%。其中智慧城市收入占比从30%下降到不足10%,公司对智慧城市的依赖度已经大幅降低。
一些疑问也随之而来,如何看待收入比例上,传统AI的下降与生成式AI的上升?为什么大模型与生成式AI作为商汤科技新的业务增长点,具有如此猛的增速?在商汤业务板块的结构变化中,哪些地方可能被低估了?
从大装置到大模型,商汤“基础设施先行”
没有数据就没有AI。没有能够运行多样化AI模型的算力基础设施,也就不会有当前大模型的百花齐放。商汤确实先市场一步,提前就建设基础设施。这是一个需要长线投资、甚至不能在短期带来回报的重活,但却必须干。
而从2018年开始,商汤就开始每年投入更多资源到SenseCore大装置,同时致力于AI大模型的研发,并在上海建设了临港AIDC(人工智能计算中心)。2021年,商汤正式推出新型AI基础设施——商汤大装置SenseCore。彼时,人工智能行业还没有遇到算力瓶颈,算力的重要性也并未被行业普遍认知到。直到2023年,随着生成式人工智能在国内的爆发式发展,对智能算力的需求随之剧增。
在这种背景下,商汤科技提前建设好的大算力装置,就成为行业内必须的算力基础设施。但市场认知显然没有那么及时,投入重金建设大装置,也导致商汤需要更长周期才能盈利,反应在二级市场,就是彼时的很多投资者并不认可这种做法。
不过,当生成式AI从概念到全面落地开花之后,商汤的先见之明也部分得到了印证。
实际上,商汤科技2022年在生成式AI上就取得了3.95亿元收入,而彼时国内的“百模大战”甚至还没有开打。
可以说,商汤科技的生成式AI收入,并不是在“百模大战”中,通过零和博弈从友商那里抢过来的,而是基于自身提前建设基础设施、提前开发日日新大模型以及生态赋能,主动培育、自然生长出来的。对商汤自己,这是一种更加健康、具有空前远景和动能的增长。
从2022年的3.95亿元增长到2023年的11.84亿元,生成式AI的迅速增长也改变了商汤的营收结构。按照生成式AI的增速,甚至2024年就将反超传统AI的营收占比。商汤甚至乐观地预计,2024年生成式AI业务占公司收入比重将增至50%左右。
财报显示,截至2023年底,大装置的总算力规模实现突破性增长达12,000 petaFLOPS,较AIDC初期增长了4.8倍,运营GPU数量达45,000卡,并实现了万卡万参的大模型训练能力,由此支持“日日新”大模型体系高速迭代至4.0版本,在多个场景中达到与GPT-4相匹配的能力水平。
相较于2023年初,商汤科技的总算力已经提高了一倍。据商汤管理层预计,2024年商汤算力仍将保持50%-100%的增长——也就是说,大概率算力还能再翻一番。
但实际上,哪怕翻倍的算力增长,面对海量的算力需求仍然是紧张的。所以,大装置、大算力要建设,但算法上的优化也同样重要。
商汤科技董事长兼首席执行官徐立表示,Sora的出现预示着大量的算力会投身到行业应用中,Sora也是尺度定律(Scaling Law)的实践。商汤过往在图片中有很强的积累,其实就在于怎样利用比较少的资源,能够达到同样甚至更好的结果。
徐立认为,在中国做AI的很有效的方向,就是看团队怎样利用稍微少量的资源投入,叠加利用更多工程化以及算法上一定程度上的优势,去弥补纯粹算力上的差距。
不过,在AI领域,尽管商汤拥有更具工程优势、更省资源开支的算法、模型,其它AI公司也同样在这一方向上努力。如何维持商汤的竞争优势?
商汤选择了小步快跑,试图用更快的大模型升级速度来保持自己的优势。
2023年4月,商汤推出了“日日新大模型1.0”版本,这是国内首个千亿级参数的大语言模型,同时还包括文生图、3D内容生成等多种生成式AI模型。2023年8月,“日日新2.0”版本发布,性能赶上并在部分项目上超过GPT-3.5-turbo大模型。而日日新大模型对算力的开销,依然被商汤控制在一个相对高效的水准,“大装置+大模型”,在大之外,更加巧、更加高效,同样是商汤不能被忽视的优点。
为什么生成式AI能够创造比传统AI更高的营收增速
新一代人工智能和传统人工智能之间,营收逻辑的不同到底体现在哪里?为什么生成式AI能够创造比传统AI更高的营收增速?
因为生成式AI具有更快的能力增长速度,而这种能力,意味着其在商业化也比传统AI具有更强的场景拓展能力,在代码编写、数据分析、医疗问答、数字人等多个场景中都具有广阔的运用可能。实际上,不止商汤一家公司,纵观2023年的很多AI企业,生成式AI都凭借着更广泛的应用前景、更强大的通用与专用能力,在传统AI市场趋于饱和的当下,成功实现了比传统AI更高的营收增速。
所以,商汤日日新大模型才用行业中少有的速度快速迭代:
2023年12月,“日日新3.0”版本发布,基模型的能力进一步提升,率先支持不同模态工具的调用。文生图模型秒画也升级至百亿参数量级,其语义理解能力与图像质感显著增强,但相比Midjourney等海外文生图平台仍有差距。文生图领域,不仅是商汤,国内所有大模型企业都还处于追赶状态。
2024年2月,商汤推出的“日日新4.0”性能显著提升,在代码编写、数据分析和医疗问答等多个场景中,达到了与GPT-4相匹配的能力水平。
日日新大模型体系包含自然语言生成、照片生成服务、感知模型预标注、模型研发等多种能力,包含“商量”“秒画”“如影”“琼宇”“格物”“大医”“代码小浣熊”等多个产品。
以如影为例,商汤如影生成的数字人已经在很多场景得到广泛应用,虽然具有一定的行业领先性,但也有更多巨头进入数字人领域。作为一家AI公司,技术实力、产品能力如何获得更多客户认可,如何保证自己的优势不被巨头削弱,也是商汤需要解决的挑战。
据了解,商汤预计今年4月份发布“日日新5.0”版本,将全面对标GPT-4-turbo,支持百万字无损上下文,并且多模态模型能力也将全面对标GPT4V。
财报显示,生成式AI业务中超过70%的客户在过去12个月内是商汤的新客户,剩下的30%的存量客户客单价也收获约50%的增速。截至最新,商汤订单金额超过千万元人民币的客户数已达到数十家。日日新大模型赋能C端的调用量更是呈现出近120倍的增长。
做大客户规模,触达更多伙伴,也就是夯实商汤在更多真实商业场景中的能力壁垒。
生成式AI并不天然就一定能够带来足够的营收,如果不能覆盖成本,甚至会拖累到一家AI公司的利润率。
拿Sora为例,Sora 在训练环节对算力需求就是 LLM 高出好几个倍,据推测,大约需要在 4200-10500 张 Nvidia H100 上训练 1 个月,并且,当模型生成 1530 万到 3810 万分钟的视频后,推理环节的计算成本将迅速超过训练环节。这也是Sora迟迟不能开放使用、商业变现的原因。
对于商汤来说,依托 “大模型+大装置”的强大能力,抢先布局MaaS(Model as a Service,模型即服务),不仅需要讲技术,还需要讲成本。毕竟,比起基础设施层等方面的技术领先,市场还是更在意技术落地时,成本是否够低,能不能帮自己赚到钱。
商汤生成式AI,算力增速需进一步提升
2023年,商汤集团明确了新的三大业务板块:生成式AI、传统AI和智能汽车;以生成式AI业务为重点发展方向,同时保持传统AI业务和智能汽车的优势。
商汤科技表示,经过过去一年的业务重组,新的三大业务板块生成式AI、传统AI、智能汽车分别对应着提供生成式AI的模型训练、微调及推理服务业务,传统智慧城市、智慧商业与智慧生活的非生成式AI业务,以及原智能汽车业务。
那么,商汤生成式AI,有可能持续领跑行业吗?
在算力上,商汤领先于行业建设大装置,今年算力还将持续增长。
在算法上,特别是计算机视觉算法,更是商汤起家之本。
借助SenseCore大装置,商汤更是打通算力、算法和平台,用人工智能即服务 AIaaS(AI as a Service)的方式拓展场景,比如在编程和办公领域,商汤还推出了“小浣熊家族(Raccoon)”AI智能助手。
其中代码小浣熊通过AI代码生成、代码翻译和代码重构等技术,极大地简化了编程工作。用“小浣熊”代码补助工具,可节省30%的工作量。而办公小浣熊支持复杂表格、多表格、多文件的理解,其底层技术正是商汤日日新·商量语言大模型的数据分析版本,在数据分析场景下的数据测试集(1000+题目)中以85.71%的正确率超过GPT-4。
代码小浣熊和办公小浣熊两大项目,分别覆盖代码语言与自然语言两大类交互,已经为十余万用户提供数亿次智能辅助服务。
当然,这也不意味着人类程序员的失业。人类程序员要学会使用AI程序员来辅助自己,提升效率,进步成为AI2.0时代的全能程序员。
而通过更多AI助手一步步通往AGI之路上,如何平衡AGI技术信仰和商业落地,保持生成式AI营收的领跑增速,也同样需要商汤去思考。
徐立信奉尺度定律(Scaling Law),随着算力规模的进一步提升,大模型还将发挥出更多变革性作用。但商汤对自己算力翻倍的增速依然不满意,商汤科技执行董事兼董事会秘书徐冰表示,“(商汤算力规模)一倍左右的增长,其实比计划的要小。”
徐冰指出,“行业的判断是几乎每年算力的需求都会以10倍的数量级去扩充,我们预计在未来1-2年,全球算力都是供不应求。”
算力依然供不应求,大模型要依托有强大的基础设施为基础才能够实现大推广和应用。商汤2024年预计将会更大面积地拓展全国的算力节点,输出算力方面的新质生产力。
在商汤的理解中,大模型能力可分为三层架构,知识、推理、执行,而且这三层之间互有依赖,又相对独立。只有在三层能力上实现突破,才能组成一个完备的对于世界提供生产力工具模型的三层能力。而商汤生成式AI就是基于此,打造文生图、文生视频,并且在多个领域,生成式AI、传统AI和智能汽车能够跨场景复用。
很多人将AI的普及特别是生成式AI的广泛使用类比为曾经的电力革命,就像加速工业革命的电气化浪潮一样。但实际上,这对于AI的理解并不全面。AI算力确实像电力,但电力是可负担的,充足的,而目前的算力并不充足,而且对于算力的需求是多样化的,而电力需求上的变化是较为单一的(电压、电流等变化维度)。
这就对算力基础设施提出了远比电力更复杂的需求。而商汤AI大装置SenseCore打通了算力、算法和平台,并在此基础上建立“商汤日日新SenseNova”大模型及研发体系,可提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力,还同时结合决策智能大模型,为AGI实现提供丰富、多元化的算力供应与大模型服务。
这也是商汤保持生成式AI营收增长的一个优势。
商汤生成式AI业务的快速增长,得益于各行各业对大模型的训练和推理的广泛需求,也预示着中国硬科技投资的新周期正式开启。在这个新周期里,从互联网巨头、科技巨头到众多AI公司,都在比拼着技术与落地,很多大模型企业算法上也未必落后商汤,而巨头们也同样在发动着算力“军备竞赛”,商汤依然有一场硬仗要打。但不管竞争如何激烈,商汤集中资源于生成式AI业务的变革,在AI2.0时代,也会是更多AI企业同样的选择。