大模型降价,一场没有赢家的战争

仅仅一周,大模型从“厘”时代跨入了“免费”时代。

用互联网免费大法卖AI大模型

从使用者的角度考虑,大模型降价潜在的受益对象可能有两类:开发者和企业。

或许国内大模型价格战的影响在于,从现在起,大模型正式与“免费”划上了等号。

去年,国内一家做数据治理的公司曾告诉光子星球,他们也会在前期大量地跑模型,测试不同模型的能力,在不同任务中择优调取大模型的能力。

6.18卷价格的风吹到了大模型圈。

5月15日,火山引擎率先亮剑,宣布豆包主力模型在企业市场定价为0.0008元/千 tokens,较行业便宜99.3%。其精准狙击同行的做法,直接掀起了一场大模型厂商低价肉搏战。

阿里、百度、科大讯飞、腾讯纷纷站出来应战。

5月21日,阿里云官宣通义千问主力模型Qwen-Long输入价格降至0.0005元/千 tokens,直降97%;仅隔了几个小时,百度智能云又祭出必杀技,宣布文心大模型两大主力模型ERNIE Speed、ERNIE Lite全面免费。

自百度之后,大模型彻底与免费挂上了钩。

5月22日,科大讯飞宣布讯飞星火Lite API永久免费开放。下午,腾讯云公布全新大模型升级方案,主力模型之一的混元-lite模型调整为全面免费。

仅仅一周,大模型从“厘”时代跨入了“免费”时代。

表面是降价,背后的根本驱动力来自技术。在经历过一年多的技术追赶后,国内大模型厂商在算力、推理、算法等多个层面都实现了突破,从而实现了技术方面的降本。再加之大厂云计算所带来的规模化优势,才共同引发了降价潮。

从另一方面也侧面印证了,大模型从发布会demo进入了可用的新阶段。火山引擎总裁谭待谈到豆包大模型发布和降价时间点时提到了一个标准:“模型能力准备好了”。当下,各大模型厂商能够大范围开放使用的前提就是,模型能力通过测试,并且能够稳定供给。

细究之下,大模型厂商的低价、免费,更像是引诱老鼠出洞的奶酪。

这种免费带有诸多限制,字节、阿里、百度降价幅度最高的产品都是其偏轻量化的模型版本,仅适用于使用频次不高、推理量不太大、任务处理量不太复杂的中小企业、开发者短期使用。

在这种情况下,低价、免费这些“互联网”手段沦为了大模型厂商的获客策略,一边获得更多的数据来优化模型效果,一边试图通过尝鲜来向更高阶的付费版本转化。

买得精不如卖得精,大模型厂商集体降价的背后仍有一系列问题值得探讨。

用互联网免费大法卖AI大模型

从使用者的角度考虑,大模型降价潜在的受益对象可能有两类:开发者和企业。

虽然行业内大规模降价是第一次,但早在去年,各大厂就通过赢黑客松比赛送token的方式,来吸引AI创业者和团队的参与。

当时,就有黑客松常客告诉光子星球,“参加比赛就是薅羊毛,token不拿白不拿”。

薅羊毛确实可以降低创业成本。把价格打下来,对开发者特别是独立开发者而言是友好的。这可能意味着开发者可以多跑几圈测试,多获得几轮反馈数据,从而缩短产品上线的周期,进一步提升创业成功的可能性。

但前提是得满足开发者和企业的需求。光子星球了解到,降价的消息传出后,在开发者和企业当中呈现出了两极化的声音。

一方对国内大模型降价比较赞同,认为开发者和企业可以继续薅羊毛,毕竟现在市场上套壳应用产品的案例不在少数;另一方则觉得,大模型厂商的降价缺乏诚意,大幅降价的都是小规模模型,虽然对外声称水平可以对标GPT-4,但实际上连GPT-3.5都不如,模型水平不达标,根本无法在实际的生产环境中运行。

大模型厂商表面上的降价,实则背后暗藏玄机。这好比给了你一个云盘限时体验卡,刚看了三秒的高清视频就弹出来升级VIP的提醒,也是恰巧刚体验了5秒极速下载,就提醒你升级会员权限。

大模型的尝鲜也是大差不差,打着降价、免费的噱头,把开发者和企业吸引过来使用,才刚上手,就开始卡调用速度、推理速度、任务处理量等关键指标。

而且,光子星球进一步发现,大模型厂商的降价策略并未对商业化造成实质性影响。呈现的结果就是,大模型厂商的价格降了,钱也没少赚。

某大厂内部人士告诉光子星球,大模型目前主要的商业化方式是拿to B订单。类似于SaaS和云的合作模式,存在case by case和合作提成两种方式。

其中,case by case是更为主流的合作方式,即大模型厂商的现有客户会因为本来就在使用某一厂商的云和SaaS产品,顺带着开始尝试该厂商的大模型。相应地,大模型厂商为了留住客户,也会在自家SaaS和云产品上增加AI的功能。

这样一来可能造成如下情况:大模型变成了SaaS产品或者项目合作的增值要素。大模型本身不付费,但为了对冲成本,大模型厂商得反过来提高SaaS和项目合作的价格。羊毛最终出在羊身上,价格一升一降,大厂非但没亏反而照赚不误。

大模型降价了,然后呢?

或许国内大模型价格战的影响在于,从现在起,大模型正式与“免费”划上了等号。

这将成为一次分水岭,过去两年,一众创业者和团队试图建立的“上线即收费”的AI原生产品逻辑再次受到挑战。兜兜转转,互联网的商业逻辑再次主导了大模型的发展。

无论国内外,行业中一直都存在着模型混用的状态。本质上在于各家大模型各有所长,比如ChatGPT擅理,Claude擅文,正是基于不同模型的特性,用户在不同的使用场景就会调取相应的模型。

类似的情况也发生在中国,我们了解到,金山办公在研发WPS AI功能的过程中,就轮流尝试了MiniMax、智谱AI、文心一言、商汤日日新、通义千问等大模型的能力,通过了解各家大模型的优势来搭建自己的平台。

去年,国内一家做数据治理的公司曾告诉光子星球,他们也会在前期大量地跑模型,测试不同模型的能力,在不同任务中择优调取大模型的能力。这样既进行了成本测试,也能避免对单一产品过度依赖。

到现在为止,大模型产品仍时常被人诟病用户黏性不高。相比于订阅收费,按API调取收费的方式本就难以留客。

企业侧的case by case收费模式亦是如此,企业使用某一家厂商的大模型周期,取决于订单周期。客户跟着订单走,今天用字节,明天也可以用阿里。

降价的本质是要加速大模型落地。大模型不能只停留在写诗作画,还得“下基层”。降价的背后是通过触达千行百业和获取更大样本容量的合作案例,从中提取共性特征,形成合理、高效的大模型行业标准。

当大模型厂商再次拉回到了同一起跑线上,在各家模型能力水平相近,价格不相上下的情况下,他们所要面临的共同课题变成了如何留住客户。

而站在大模型客户的角度,他们更希望通过对冲,减少对单一模型的依赖。在这样的心理驱动之下,未来的大模型模式可以参考SaaS和云产品的采购方式,一家公司内部可以购买多家大模型公司产品,不同的产品线和业务部门也可能使用不同家的大模型。

赢了价格,就赢了一切吗?

回顾历史,大模型一路从百模、参数、长文本打到了现在的价格。过去的经验告诉我们,价格不可能是唯一的决定因素。

即使不谈企业和开发者拿到手的东西对不对版,大模型厂商给出的价格在市场上也不是很有竞争力。

比国内大模型更具性价比的是开源大模型。一位国内负责电商代运营业务的工作人员告诉光子星球,截至目前,自己所在的业务部门购买过ChatGPT、Midjourney等AI相关的付费产品,现在底层使用的是开源且可商用的Llama 3。

一些公司和开发者更倾向于部署开源模型的原因在于,一方面国外Llama等开源模型的能力一直在追赶最强版本ChatGPT的水平,一些通用场景能力在业务中足够用。另一方面,从头部署和精调模型,对后期业务调整也更灵活。

此外,光子星球发现,在闭源的大模型原厂和开源社区中间,还衍生出了中间商角色。一个令人费解的现象正在大模型行业蔓延:大模型分销商卖的API价格比原厂价格还便宜。

以国外Deepbricks平台为例,最新上架的GPT-4o模型,OpenAI官方输入价格为5美元/1M
tokens,而Deepbricks自身的售价只要2美元/1M
tokens。如果这些中间商真的能做到实时更新模型能力,还能做到低价,以后可能会吸引一批开发者和企业使用。

(图源:Deepbricks官网)

Lepton AI创始人、阿里巴巴原副总裁贾扬清认为,企业在使用AI的时候,并不是成本驱动。不是因为API贵才没人用,而是因为企业首先得搞清楚怎么用来产生业务价值,否则的话,再便宜也是浪费。

若单纯的价格不具有吸引力,客户使用哪家大模型将取决于什么?

一位中间件的创业者向光子星球表示:“最主要看模型效果,如果模型效果太差再便宜也不能使用。”

还有海外的AI创业者直接跟光子星球说,国外用ChatGPT,因为能力强;国内用文心一言,因为能满足合规需求。

于是,价格仅仅是企业选择某家大模型的因素之一。

同样在云计算和SaaS时代,能够留住客户的往往不是低价,而是更深层次的绑定关系或者利益关系。例如,当企业采用了火山引擎的豆包模型,是否就能在抖音投流享受到优惠权;接入通义千问,其产品是否就能与阿里生态打通,获得更多资源支持?

企业用户选择大模型的同时,也在权衡厂商的各自优势。大模型能力的高低成为了其次,更重要的是选择这家厂商能给其业务带来多少增长,在该厂商的产业链之下能获得多大的收益。

到最后还是要拿结果说话,正如贾扬清所言,“也许不是最便宜的赢得商战,而是能落地的赢得利润。”

本文来自:光子星球,作者:郝鑫,编辑:吴先之

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年5月22日
Next 2024年5月23日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日