大模型轮到基础设施赚钱了

如果将大模型的产业经济结构简单地分为芯片、基础设施与应用,那么,作为大模型训练与推理的关键基础设施,AI加速云业务赚钱的趋势越来越明显。作为大模型规模化交付完整用户体验的关键基础设施,AI终端设备也开始大规模进入市场。

在“七巨头”中,谷歌、微软、亚马逊与Meta的数据中心规模遥遥领先,追加的资本投入也远超其他巨头,最新一个季度的资本支出合计达到了470亿美元。

本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究,题图来自:视觉中国

大模型何时赚钱,怎么赚钱?要想回答这个问题,最好是看下全部All in AI的美国M7(科技七巨头)是怎么玩转大模型的。

在5月3日凌晨,苹果发布喜忧参半的季度财报后,M7中只剩下英伟达还没交卷。黄雀在后的英伟达不必着急,其他6家巨头已经确认,会花更多的钱在AI计算基础设施建设上,而这些钱主要就是流入英伟达的口袋。

但市场正在起变化,AI巨头们开始从为英伟达打工转向为自己打工。如果将大模型的产业经济结构简单地分为芯片、基础设施与应用,那么,作为大模型训练与推理的关键基础设施,AI加速云业务赚钱的趋势越来越明显;作为大模型规模化交付完整用户体验的关键基础设施,AI终端设备也开始大规模进入市场

无论是亚马逊、谷歌还是微软,都传达了云业务的收入重获加速的好消息。它们都投资了领先的大模型初创企业,既是这些企业的投资者,也是他们的算力供应商。微软与OpenAI联手,底气更足,公布的财务细节更为丰富。最新一个季度,AI为微软Azure等云业务的收入贡献了7个百分点的增速,连续攀升。亚马逊则称生成式AI已经成为该公司“数十亿美元收入规模的业务”

几家公司还都在讲述推理需求增长的叙事,很大一部分来自自身业务的增长。微软非常大方地公布了GitHub Copilot付费用户的增长,数量已经达到180万,比上一季度的130万增长近半。这是代码生成应用商业化的进一步市场验证。Meta旗下社交产品的用户时长则在AI推动下增长了8%至10%。

Azure云增速(有AI与否)(来源:Altimeter)

云端算力供不应求,影响了巨头们赚钱的速度。它们从担心错过大模型技术,转变为更具体地担心错过大模型落地。微软计划在年内储备180万张H100,较当下增长一倍,并在电话会议上解释称,“近期的人工智能需求略高于我们的可用产能。”亚马逊准备好推理需求的爆发。Meta没有“云洗钱”的业务,希望复制在互联网时代成功的经验,先扩大规模,再谈变现。

在“七巨头”中,谷歌、微软、亚马逊与Meta的数据中心规模遥遥领先,追加的资本投入也远超其他巨头,最新一个季度的资本支出合计达到了470亿美元。其中,谷歌几乎翻了一番,亚马逊则表示刚过去的一个季度,将是今年最低水平的资本支出。为了安抚股东,谷歌效仿上一季度的Meta,历史上首次分红。

端侧基础设施更有可能后发先至。大模型正在加速向端侧落地,追求足够便宜又最低可用的垂直场景,厂商将算力、模型与应用打包在一起,完整地出售给用户。联想等整机厂商已经发布了本地部署、本地推理的AI PC。苹果将很快跟上,特斯拉计划推出的Robotaxi也是大模型变现的重要端侧基础设施。

苹果确实需要用生成式AI拯救不断下降的iPhone与iPad销量。在最近一个季度,前者下降了10%,后者下降了17%。尽管它的服务收入上升了14%,但归根结底,它的基础仍是这20亿活跃设备。苹果已经准备好宣传自己的M4芯片了,很快将发布新款的iPad Pro、Mac电脑,还有iPhone16,库克说会把接下去的“每一款新产品都作为人工智能设备来宣传”

它的竞争对手既包括手握Surface、Windows与Copilot的微软,也包括手握安卓与Gemini的谷歌。两家面向数十亿用户的科技巨头,最近都调整了自己的组织架构,试图打破在不同的孤岛中开发硬件、软件和服务的传统。

终端基础设施的商业模式,体现着大模型产业的价值分配。终端设备,往往卖出去就意味着盈利。而终端设备上混合AI推理的现实,将为正在加速建设的云端基础设施提供更大规模的推理变现的可能。

库克在财报电话会议上称,公司同时自建数据中心与使用第三方数据中心的混合资本支出模式非常有效。苹果四处出击,与OpenAI合作的传言正在升温,它很可能加速AI对微软云服务的贡献。

目前,大模型的主要价值仍然积累在芯片层面,后者的收入占据了整个产业经济的约83%,毛利润约占88%。但这种结构不会一成不变。在历经二十年发展后,在云计算的产业经济结构中,应用已经分到了更多蛋糕,恰好与当下的大模型相反。“七巨头”的财报已经透露出大模型产业也正在发生这种价值再分配的变化。

从为芯片巨头打工,到更靠近终端客户的应用赚取更多价值,移动与云产业走到这一步,它们花了六年。ChatGPT发布18个月,才刚刚开了个好头。

本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年5月3日
下一篇 2024年5月4日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日