生成式AI营收增长近两倍,商汤依然有一场硬仗要打

从2023年至今,做大模型、做生成式AI到底能不能赚钱,其实一直是行业里热议的话题。

 

正值财报季,商汤集团也在近日公布了2023年业绩。财报显示,2023年公司整体营业收入34亿元人民币,其中生成式AI收入达12亿元,占集团总收入比例升至35%,实现近200%增长。这也是商汤成立十年以来,以最快速度实现从无到有,并取得超过10亿收入体量的新业务。

 

在前些天刚结束的科技春晚英伟达GTC (GPU技术大会)2024上,英伟达发布了全球最强的 AI 芯片,又一场全球算力之争再次发生。我们已经看到了工作生活正在被 AI 改写。而商汤的最新财报数据,同样是生成式AI快速变革很多产业、行业的一个例证。

 

当然,对商汤来说,生成式AI占营收的比例高了,传统AI的比例自然就低了。财报显示2023年商汤传统AI收入为18.38亿元,同比下降41%。其中智慧城市收入占比从30%下降到不足10%,公司对智慧城市的依赖度已经大幅降低。

 

一些疑问也随之而来,如何看待收入比例上,传统AI的下降与生成式AI的上升?为什么大模型与生成式AI作为商汤科技新的业务增长点,具有如此猛的增速?在商汤业务板块的结构变化中,哪些地方可能被低估了?

 

从大装置到大模型,商汤“基础设施先行”

 

没有数据就没有AI。没有能够运行多样化AI模型的算力基础设施,也就不会有当前大模型的百花齐放。商汤确实先市场一步,提前就建设基础设施。这是一个需要长线投资、甚至不能在短期带来回报的重活,但却必须干。

 

而从2018年开始,商汤就开始每年投入更多资源到SenseCore大装置,同时致力于AI大模型的研发,并在上海建设了临港AIDC(人工智能计算中心)。2021年,商汤正式推出新型AI基础设施——商汤大装置SenseCore。彼时,人工智能行业还没有遇到算力瓶颈,算力的重要性也并未被行业普遍认知到。直到2023年,随着生成式人工智能在国内的爆发式发展,对智能算力的需求随之剧增。

 

在这种背景下,商汤科技提前建设好的大算力装置,就成为行业内必须的算力基础设施。但市场认知显然没有那么及时,投入重金建设大装置,也导致商汤需要更长周期才能盈利,反应在二级市场,就是彼时的很多投资者并不认可这种做法。

 

不过,当生成式AI从概念到全面落地开花之后,商汤的先见之明也部分得到了印证。

 

实际上,商汤科技2022年在生成式AI上就取得了3.95亿元收入,而彼时国内的“百模大战”甚至还没有开打。

 

可以说,商汤科技的生成式AI收入,并不是在“百模大战”中,通过零和博弈从友商那里抢过来的,而是基于自身提前建设基础设施、提前开发日日新大模型以及生态赋能,主动培育、自然生长出来的。对商汤自己,这是一种更加健康、具有空前远景和动能的增长。

 

从2022年的3.95亿元增长到2023年的11.84亿元,生成式AI的迅速增长也改变了商汤的营收结构。按照生成式AI的增速,甚至2024年就将反超传统AI的营收占比。商汤甚至乐观地预计,2024年生成式AI业务占公司收入比重将增至50%左右。

 

财报显示,截至2023年底,大装置的总算力规模实现突破性增长达12,000 petaFLOPS,较AIDC初期增长了4.8倍,运营GPU数量达45,000卡,并实现了万卡万参的大模型训练能力,由此支持“日日新”大模型体系高速迭代至4.0版本,在多个场景中达到与GPT-4相匹配的能力水平。

 

相较于2023年初,商汤科技的总算力已经提高了一倍。据商汤管理层预计,2024年商汤算力仍将保持50%-100%的增长——也就是说,大概率算力还能再翻一番。

 

但实际上,哪怕翻倍的算力增长,面对海量的算力需求仍然是紧张的。所以,大装置、大算力要建设,但算法上的优化也同样重要。

 

商汤科技董事长兼首席执行官徐立表示,Sora的出现预示着大量的算力会投身到行业应用中,Sora也是尺度定律(Scaling Law)的实践。商汤过往在图片中有很强的积累,其实就在于怎样利用比较少的资源,能够达到同样甚至更好的结果。

 

徐立认为,在中国做AI的很有效的方向,就是看团队怎样利用稍微少量的资源投入,叠加利用更多工程化以及算法上一定程度上的优势,去弥补纯粹算力上的差距。

 

不过,在AI领域,尽管商汤拥有更具工程优势、更省资源开支的算法、模型,其它AI公司也同样在这一方向上努力。如何维持商汤的竞争优势?

 

商汤选择了小步快跑,试图用更快的大模型升级速度来保持自己的优势。

 

2023年4月,商汤推出了“日日新大模型1.0”版本,这是国内首个千亿级参数的大语言模型,同时还包括文生图、3D内容生成等多种生成式AI模型。2023年8月,“日日新2.0”版本发布,性能赶上并在部分项目上超过GPT-3.5-turbo大模型。而日日新大模型对算力的开销,依然被商汤控制在一个相对高效的水准,“大装置+大模型”,在大之外,更加巧、更加高效,同样是商汤不能被忽视的优点。

 

为什么生成式AI能够创造比传统AI更高的营收增速

 

新一代人工智能和传统人工智能之间,营收逻辑的不同到底体现在哪里?为什么生成式AI能够创造比传统AI更高的营收增速?

 

因为生成式AI具有更快的能力增长速度,而这种能力,意味着其在商业化也比传统AI具有更强的场景拓展能力,在代码编写、数据分析、医疗问答、数字人等多个场景中都具有广阔的运用可能。实际上,不止商汤一家公司,纵观2023年的很多AI企业,生成式AI都凭借着更广泛的应用前景、更强大的通用与专用能力,在传统AI市场趋于饱和的当下,成功实现了比传统AI更高的营收增速。

 

所以,商汤日日新大模型才用行业中少有的速度快速迭代:

 

2023年12月,“日日新3.0”版本发布,基模型的能力进一步提升,率先支持不同模态工具的调用。文生图模型秒画也升级至百亿参数量级,其语义理解能力与图像质感显著增强,但相比Midjourney等海外文生图平台仍有差距。文生图领域,不仅是商汤,国内所有大模型企业都还处于追赶状态。

 

2024年2月,商汤推出的“日日新4.0”性能显著提升,在代码编写、数据分析和医疗问答等多个场景中,达到了与GPT-4相匹配的能力水平。

 

日日新大模型体系包含自然语言生成、照片生成服务、感知模型预标注、模型研发等多种能力,包含“商量”“秒画”“如影”“琼宇”“格物”“大医”“代码小浣熊”等多个产品。

 

以如影为例,商汤如影生成的数字人已经在很多场景得到广泛应用,虽然具有一定的行业领先性,但也有更多巨头进入数字人领域。作为一家AI公司,技术实力、产品能力如何获得更多客户认可,如何保证自己的优势不被巨头削弱,也是商汤需要解决的挑战。

 

据了解,商汤预计今年4月份发布“日日新5.0”版本,将全面对标GPT-4-turbo,支持百万字无损上下文,并且多模态模型能力也将全面对标GPT4V。

 

财报显示,生成式AI业务中超过70%的客户在过去12个月内是商汤的新客户,剩下的30%的存量客户客单价也收获约50%的增速。截至最新,商汤订单金额超过千万元人民币的客户数已达到数十家。日日新大模型赋能C端的调用量更是呈现出近120倍的增长。

 

做大客户规模,触达更多伙伴,也就是夯实商汤在更多真实商业场景中的能力壁垒。

 

生成式AI并不天然就一定能够带来足够的营收,如果不能覆盖成本,甚至会拖累到一家AI公司的利润率。

 

拿Sora为例,Sora 在训练环节对算力需求就是 LLM 高出好几个倍,据推测,大约需要在 4200-10500 张 Nvidia H100 上训练 1 个月,并且,当模型生成 1530 万到 3810 万分钟的视频后,推理环节的计算成本将迅速超过训练环节。这也是Sora迟迟不能开放使用、商业变现的原因。

 

对于商汤来说,依托 “大模型+大装置”的强大能力,抢先布局MaaS(Model as a Service,模型即服务),不仅需要讲技术,还需要讲成本。毕竟,比起基础设施层等方面的技术领先,市场还是更在意技术落地时,成本是否够低,能不能帮自己赚到钱。

 

商汤生成式AI,算力增速需进一步提升

 

2023年,商汤集团明确了新的三大业务板块:生成式AI、传统AI和智能汽车;以生成式AI业务为重点发展方向,同时保持传统AI业务和智能汽车的优势。

 

商汤科技表示,经过过去一年的业务重组,新的三大业务板块生成式AI、传统AI、智能汽车分别对应着提供生成式AI的模型训练、微调及推理服务业务,传统智慧城市、智慧商业与智慧生活的非生成式AI业务,以及原智能汽车业务。

 

那么,商汤生成式AI,有可能持续领跑行业吗?

 

在算力上,商汤领先于行业建设大装置,今年算力还将持续增长。

 

在算法上,特别是计算机视觉算法,更是商汤起家之本。

 

借助SenseCore大装置,商汤更是打通算力、算法和平台,用人工智能即服务 AIaaS(AI as a Service)的方式拓展场景,比如在编程和办公领域,商汤还推出了“小浣熊家族(Raccoon)”AI智能助手。

 

其中代码小浣熊通过AI代码生成、代码翻译和代码重构等技术,极大地简化了编程工作。用“小浣熊”代码补助工具,可节省30%的工作量。而办公小浣熊支持复杂表格、多表格、多文件的理解,其底层技术正是商汤日日新·商量语言大模型的数据分析版本,在数据分析场景下的数据测试集(1000+题目)中以85.71%的正确率超过GPT-4。

 

代码小浣熊和办公小浣熊两大项目,分别覆盖代码语言与自然语言两大类交互,已经为十余万用户提供数亿次智能辅助服务。

 

当然,这也不意味着人类程序员的失业。人类程序员要学会使用AI程序员来辅助自己,提升效率,进步成为AI2.0时代的全能程序员。

 

而通过更多AI助手一步步通往AGI之路上,如何平衡AGI技术信仰和商业落地,保持生成式AI营收的领跑增速,也同样需要商汤去思考。

 

徐立信奉尺度定律(Scaling Law),随着算力规模的进一步提升,大模型还将发挥出更多变革性作用。但商汤对自己算力翻倍的增速依然不满意,商汤科技执行董事兼董事会秘书徐冰表示,“(商汤算力规模)一倍左右的增长,其实比计划的要小。”

 

徐冰指出,“行业的判断是几乎每年算力的需求都会以10倍的数量级去扩充,我们预计在未来1-2年,全球算力都是供不应求。”

 

算力依然供不应求,大模型要依托有强大的基础设施为基础才能够实现大推广和应用。商汤2024年预计将会更大面积地拓展全国的算力节点,输出算力方面的新质生产力。

 

在商汤的理解中,大模型能力可分为三层架构,知识、推理、执行,而且这三层之间互有依赖,又相对独立。只有在三层能力上实现突破,才能组成一个完备的对于世界提供生产力工具模型的三层能力。而商汤生成式AI就是基于此,打造文生图、文生视频,并且在多个领域,生成式AI、传统AI和智能汽车能够跨场景复用。

 

很多人将AI的普及特别是生成式AI的广泛使用类比为曾经的电力革命,就像加速工业革命的电气化浪潮一样。但实际上,这对于AI的理解并不全面。AI算力确实像电力,但电力是可负担的,充足的,而目前的算力并不充足,而且对于算力的需求是多样化的,而电力需求上的变化是较为单一的(电压、电流等变化维度)

 

这就对算力基础设施提出了远比电力更复杂的需求。而商汤AI大装置SenseCore打通了算力、算法和平台,并在此基础上建立“商汤日日新SenseNova”大模型及研发体系,可提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力,还同时结合决策智能大模型,为AGI实现提供丰富、多元化的算力供应与大模型服务。

 

这也是商汤保持生成式AI营收增长的一个优势。

 

商汤生成式AI业务的快速增长,得益于各行各业对大模型的训练和推理的广泛需求,也预示着中国硬科技投资的新周期正式开启。在这个新周期里,从互联网巨头、科技巨头到众多AI公司,都在比拼着技术与落地,很多大模型企业算法上也未必落后商汤,而巨头们也同样在发动着算力“军备竞赛”,商汤依然有一场硬仗要打。但不管竞争如何激烈,商汤集中资源于生成式AI业务的变革,在AI2.0时代,也会是更多AI企业同样的选择。

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年4月2日
下一篇 2024年4月2日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日