AI大模型价格战：最先被卷死的是谁？

2024年5月24日 14:49 • 未来科技

目前国产大模型降价情况汇总

不过在好戏开场之前，我们先弄清这些厂商所说的大模型价格到底指的是什么。

5月21日，面对字节跳动的价格战，阿里云相关负责人颇有反击意味地表示：“友商大模型公司提出各种降价主题，降价目的是普惠市场，在中国什么样的公司真正有能力、有资本降价，要看模型基模能力是否领先、有没有推理资源、当下模型是不是已有很多用户在使用、大模型是不是最核心业务。

万万没想到，今年“618”竟然从AI大模型开始。

短短几天内，腾讯、阿里、百度、科大讯飞等国产大模型纷纷降价，让我们提前感受到了朴实的“购物节”氛围。

目前国产大模型降价情况汇总

不过在好戏开场之前，我们先弄清这些厂商所说的大模型价格到底指的是什么。

通常情况下，一家AI大模型公司在训练出自己的闭源大模型后，会将其API（Application programming interface，应用程序编程接口）出售给开发者并收取费用。

开发者在大模型API的基础上，通过投喂数据、微调等方式进行优化，这就是很多大模型厂商的变现模式。

不难看出，大模型价格的变动或许不会直接影响到消费者，但会直接影响到开发者制作应用的成本。

虽然目前也有一些AI大模型公司采用会员制、计时制等模式，但普遍还是按使用量计费，类似于手机流量套餐，只不过计费单位从流量的GB变成了token。

但token与汉字、字母的对应关系目前还没有统一标准，各家也有自己的定义。根据此前消息，腾讯1 token≈1.8个汉字，通义千问1 token=1个汉字，也有的是1 token≈0.5个汉字。

图片来自冰鉴科技研究院

因此，各家计费标准有所不同，但大致遵循大模型规模越大、定价越贵的规则，毕竟有训练成本在这里。

目前阶段，卖API调用量这一商业模式各大厂商仍在探索，很多厂商尝试通过各种方式提高大模型的API调用量，但增长却并不明显。

在这种情况下，大模型API降价可能会吸引一些开发者从“免费试用”开始尝试AI应用，对抢占市场、激活市场有一定的积极意义，这是这场“大战”的前提和背景。

预备，降！

5月6日，幻方量化率先打响这波降价“大战”第一枪，旗下大模型DeepSeek-V2的价格降到了每百万输入tokens仅需1元的价格，还打出了“登录就送500W tokens”的口号。

5月11日智谱大模型也“跟上节奏”，推出新的优惠措施，新注册用户可以获得额度从500万tokens提升至2500万tokens。

入门级产品GLM-3-turbo价格从5元每百万tokens降至1元，降幅达到了80%。

在公布价格的时候还“贴心”地把自己GLM-3-turbo与阿里、百度、ChatGPT做了对比，火药味十足。

随后云厂商的入局把这波降价“大战”推向了高潮。

5月15日，字节豆包宣布：“把大模型的价格打下来了！”火山引擎总裁谭待宣布豆包主力模型在企业市场的定价为0.0008/千tokens，对比百度阿里及市面上同等规格模型的定价一般为0.12/千tokens，做到了“从分到厘”的价格内卷。

他还举了一个例子：“一元钱就能买到豆包主力模型的125万tokens”，大约200万个汉字，相当于生成三本《三国演义》。

5月21日，面对字节跳动的价格战，阿里云相关负责人颇有反击意味地表示：“友商大模型公司提出各种降价主题，降价目的是普惠市场，在中国什么样的公司真正有能力、有资本降价，要看模型基模能力是否领先、有没有推理资源、当下模型是不是已有很多用户在使用、大模型是不是最核心业务。”

与此同时，阿里云还打出了“击穿全球低价”的口号，旗下9款大模型集体降价，“GPT-4级”助理模型Qwen-Long价格降到每百万tokens输入0.5元，输出2元。

也就是1块钱可以买到200万tokens，相当于5本《新华字典》的文字量，但价格却仅为GPT-4的约1/400。

仅仅几个小时后，另一个总是被对标的百度也展开行动，文心大模型两款主力大模型ERNIE Speed和ERNIE Lite直接全面免费。

这两款虽然不是其大模型中的旗舰款，却是目前百度文心大模型系列中服务用户最多的模型。

5月22日，科大讯飞也宣布加入“降价火拼”，讯飞星火Lite API永久免费开放，讯飞星火Pro/Max低至0.21元/万tokens，并表示“使用讯飞星火3.5 max仅需2.1元即可生成一部余华《活着》的内容量”。

同一天，腾讯云宣布加入大模型降价阵营，其混元-lite模型API价格从0.008元/千tokens全面免费，新上线的混元-standard、最高配置的万亿参数模型混元-pro API均出现价格下调，并立即生效。

至此，几乎所有大模型大厂均已入局，似乎一夜之间，大模型就集体开启了疯狂的降价内卷。

“价格战”背后的技术革新

不仅是国产厂商，以OpenAI为代表的国外大模型也在不断下调大模型价格，虽然不像国产厂商这样集中，但行动的时间却比国产厂商更早。

2023年3月推出的GPT-3.5 turbo将每千tokens的成本降到0.002美元，相比之前的GPT-3.5 turbo降低了90%。

11月发布的GPT-4 Turbo输入tokens价格仅为GPT-4的1/3，输出tokens价格是GPT-4的1/2。

近期发布的GPT-4o相比此前的GPT-4 turbo，速度快了2倍，但价格却便宜了一半，从2023年至今已经连续四次降价。

不难看出，对于OpenAI而言，降价已经成为其不断升级与扩展市场的核心策略。其他大模型诸如Gemini等也都不忘在性能之后加上价格的变化，大降价已经成为大势所趋。

事实上，无论国产大模型还是国外大模型，降价的根本原因还是在于推理成本的快速降低。

不久前,DeepSeek-V2就在一篇论文中为我们介绍了其利用MLA（Multi-head Latent Attention，多头潜在注意力）结合MoE（Mixture-of-Experts专家混合模型），实现模型性能跨级别提升，同时减少计算量、推理现存及成本的案例。

随着算力的提升和算法的不断进步，这一趋势还将继续。创新工场董事长兼CEO李开复在近期的一次访谈中谈到近期出现的降价狂潮，也认为“整个行业每年降低10倍推理成本是可以期待的，而且必然也应该发生”。

不过，他也表示，目前出现的是一种不可持续的“ofo式”双输打法，表示“如果技术不行，就纯粹靠贴钱、赔钱去做生意，我们绝对不会跟这样一个定价来做对标”。

这源于他对其大模型的自信，“就像特斯拉，不会因为别的牌子车比他卖得便宜，他也要来降价。”

不过，我们也都知道特斯拉其实也并非不降价，甚至有的时候会成为降价先锋，不知道他的言论会不会在未来成为“回旋镖”。

浪潮近在眼前

除了李开复以外，百川智能创始人王小川也对此次价格战有不同的理解：“我觉得就像原来的滴滴美团，这会刺激整个to B市场更快繁荣，大家会更愿意尝试使用。”

他认为，价格战事实上也会提醒那些此前因为怕落后而盲目入局大模型的厂商，重新考虑自己的定位，并把一些“没想清楚”的公司清除出去。

“涨潮退潮最后才会有珍珠，一定有泡沫在里面，价格战会使得泡沫反而变得更加繁荣，并不是没泡沫就是好的状态。在之前的泡沫里面，很多公司觉得自己得去训模型，这是不健康的，市面上不需要那么多的模型提供方，不需要千模大战、万模大战。”

猎豹移动董事长兼CEO傅盛则认为这是大模型出现同质化，性能难以甩开差距后的无奈之举：“这次大降价基本宣告了大模型创业公司必须寻找新的商业模式。短期来看，大模型的性能遇到了瓶颈，谁也甩不开谁，谁也拿不出杀手锏，降低推理成本，降低售价成了现在每一家的高优先级任务。”

毫无疑问，各大厂商纷纷降价，对于很多大模型行业的创业公司而言，意味着更大的竞争压力。

事实上，当一个行业进入全面降价的阶段，也就意味着大规模淘汰赛的开始，最后往往只会剩下少数几个公司。

我们常常看到，在行业发展初期，由于“风口”的巨大诱惑，市场上往往会出现各种良莠不齐的企业相互竞争，但在一轮或几轮大规模降价后，行业重新洗牌，效率不高的公司被挤出市场。

目前来看，AI领域的这一进程似乎正在加速，尤其对于部分大模型在市场并不具备优势的厂商而言更是如此。

不过另一方面而言，大模型降价对于用户而言却是一个好消息，因为这意味着他们可以用更低的成本访问和使用先进的AI技术，市场上也更容易催生出优秀的AI应用。

目前而言，整个行业商业化距离形成生态还有很远的距离，国内除了大模型公司以外，AI应用的开发团队仍然有很大缺口。

根据百度公布的最新数据显示，文心大模型日处理文本2500亿tokens，字节跳动日处理文本1200亿tokens，但其中一大部分是大厂内部业务在调用AI应用和业务探索，可见目前其实整个行业还没形成生态。

彭博社此前也有分析师也指出：“中国在AI盈利方面将面临着漫长的道路，行业洗牌可能会推动该行业盈利，但这种情况似乎不太可能很快发生。”而成本的问题一直是限制行业发展的重要因素。

IDC预测，2026年中国AI大模型市场规模将会达到211亿美元，人工智能将进入大规模落地应用关键期。

相信随着大模型价格的下降，以及多模态发展、推理速度加快、成本降低，无论搜索、AI PC/手机或其他消费电子产品，都会成为AI应用发展的广阔空间。

这样的机会，或许会让很多人想起当初互联网方兴未艾之时，事实上两者也确有很多相似之处，这也是黄仁勋说当前正是“下一次工业革命”的重要原因。

边际成本下降，或许会成为AI平台革命的直接原因

A16Z合伙人Martin Casado曾有这样一个观点，认为历史上曾经发生过两次由于边际成本下降，引发的平台转移和行业革命的案例，即芯片和互联网。

芯片的诞生，将计算的边际成本降到了趋近为零。在此之前，计算需要通过手工完成。人们需要在一个大房间里徒手作对数表。

然后ENIAC及其他机器被引入，计算速度迅速提高了四个数量级，随后引发的计算机革命带来了大批新的产业，让很多企业焕然一新，也催生出一批新的企业。

随后在互联网时代，分发的边际成本降到了0，以前无论你发送什么（一个盒子或者一封信）都需要一定的成本，互联网出现后，每bit的价格急剧下降。

也是四个数量级的改进，促成后来相关产业迅猛发展，引领了互联网革命。这一时期出现了亚马逊、谷歌和Meta等公司都是其中代表。

与上述两种技术类似，AI也同样是一场成本驱动型生产力革命。大模型则是将创造的边际成本降到了0，比如创建图像和语言理解等等，他还举了这样一个例子。

假如想要创造一个关于他自己的皮克斯风格动画人物，大模型制作的成本约为0.01美分，且只需1秒钟，但雇用一位平面设计师1小时大约需要100美元，或许更贵。

人工智能不是稍微好一点，而是便宜且快了多个数量级。

1865年，英国经济学家威廉·斯坦利·杰文斯观察到，提高煤炭使用效率的技术改进，反而会导致广泛行业煤炭消费量增加。

他认为，与很多人的直觉相反，效率提高导致了价格的下降，反而会刺激更多的需求。

换言之，当技术进步提高了使用资源的效率，但成本降低导致需求增加，令资源消耗的速度上升而非减少，这就是著名的“杰文斯悖论”。

曾经的芯片、互联网就是这样一种资源，由于它的计算、信息效率提高、价格降低，刺激了更多的需求，产生了更多的价值和服务，催生出新的平台转移和行业革命，从而增加了生产力和人们的收入，最终改变了整个世界的样貌，也改变了我们每个人的生活。

这是芯片、互联网多年前的故事，也是如今关于AI，正在发生的故事。

本文来自微信公众号：APPSO （ID：appsolution），作者：王萌

声明：该内容为作者独立观点，不代表新零售资讯观点或立场，文章为网友投稿上传，版权归原作者所有，未经允许不得转载。新零售资讯站仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。如对本稿件有异议或投诉，请联系：wuchangxu@youzan.com

Like (0)

百度牵手特斯拉，中国无人驾驶再进一步

Previous 2024年5月24日

奥迪车主称被续费弹窗骚扰，无法自行永久关闭

Next 2024年5月24日

水温80度：AI行业真假繁荣的临界点

我们从来没拥有过这么成功的AI主导的产品。

（这种分析统计并不那么准，但大致数量级是差不多的）

这两个产品碰巧可以用来比较有两个原因：

一个是它们在本质上是一种东西，只不过一个更通用，一个更垂直。

蓝海的海峡

未来成功的AI产品是什么样，大致形态已经比较清楚了，从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时“罢工”，全网打工人都慌了

美西时间午夜12点开始，陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载，忽然无法正常工作了。

因为发现AI用久了，导致现在“离了ChatGPT，大脑根本无法运转”。”

等等，又不是只有一个聊天机器人，难道地球离了ChatGPT就不转了。

大模型连崩原因猜想，谷歌躺赢流量激增6成

GPT归位，人们的工作终于又恢复了秩序。

未来科技 2024年6月5日
ChatGPT宕机8小时，谷歌Gemini搜索量激增60%

ChatGPT一天宕机两次

谷歌Gemini搜索量激增近60%

ChatGPT在全球拥有约1.8亿活跃用户，已成为部分人群工作流程的关键部分。

过去24小时内提交的关于OpenAI宕机的问题报告

图片来源：Downdetector

ChatGPT系统崩溃后，有网友在社交媒体X上发帖警告道：“ChatGPT最近发生的2.5小时全球中断，为我们所有依赖AI工具来支持业务的人敲响了警钟。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时大崩溃，AI集体罢工让全网都慌了

接着OpenAI也在官网更新了恢复服务公告，表示“我们经历了一次重大故障，影响了所有ChatGPT用户的所有计划。Generator调查显示，在ChatGPT首次故障后的四小时内，谷歌AI聊天机器人Gemini搜索量激增60%，达到327058次。

而且研究团队表示，“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关，显示出用户把Gemini视为ChatGPT的直接替代选项。

未来科技 2024年6月5日
深度对话苹果iPad团队：玻璃的传承与演变

iPad最为原始的外观专利

没错，这就是iPad最初被设想的样子：全面屏，圆角矩形，纤薄，就像一片掌心里的玻璃。

2010年发布的初代iPad

好在乔布斯的遗志，并未被iPad团队遗忘。

初代iPad宣传片画面

乔布斯赞同这一想法，于是快速将资源投入平板电脑项目，意欲打造一款与众不同的「上网本」，这就是iPad早年的产品定义。

iPad进化的底色

苹果发布会留下过很多「名场面」，初代iPad发布会的末尾就是一例。

未来科技 2024年6月5日
底层逻辑未通，影视业的AI革命正在褪色…

GPT、Sora均为革命性产品，引发了舆论风暴，但它在上个月发布的“多模态语音对谈”Sky语音，却由于声音太像电影明星斯嘉丽·约翰逊，被正主强烈警告，被迫下架。

华尔街日报也在唱衰，认为“AI工具创新步伐正在放缓，实用性有限，运行成本过高”：

首先，互联网上已经没有更多额外的数据供人工智能模型收集、训练。

03、

如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向，那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

但分歧点正在于此，电影公司希望通过使用AI技术来降低成本，但又不希望自己的内容被AI公司所窃取。

未来科技 2024年6月5日
KAN会引起大模型的范式转变吗？

“先变后加”代替“先加后变”的设计，使得KAN的每一个连接都相当于一个“小型网络”，能实现更强的表达能力。

KAN的主要贡献在于，在当前深度学习的背景下重新审视K氏表示定理，将上述创新网络泛化到任意宽度和深度，并以科学发现为目标进行了一系列实验，展示了其作为“AI+科学”基础模型的潜在作用。

KAN与MLP的对照表：

KAN使神经元之间的非线性转变更加细粒度和多样化。

未来科技 2024年6月5日
这个国家，也开始发芯片补贴了

//mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
[4]中国安防协会：欧盟批准430亿欧元芯片补贴计划：2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
[6]潮电穿戴：印度半导体投资大跃进，一锤砸下1090亿，政府补贴一半.2024.3.5https。

未来科技 2024年6月5日
大模型的电力经济学：中国AI需要多少电力？

这些报告研究对象（数字中心、智能数据中心、加密货币等）、研究市场（全球、中国与美国等）、研究周期（多数截至2030年）各不相同，但基本逻辑大同小异：先根据芯片等硬件的算力与功率，计算出数据中心的用电量，再根据算力增长的预期、芯片能效提升的预期，以及数据中心能效（PUE）提升的预期，来推测未来一段时间内智能数据中心的用电量增长情况。

未来科技 2024年6月5日
你正和20万人一起接受AI面试

原本客户还担心候选人能否接受AI面试这件事，但在2020年以后，候选人进行AI面试的过程已经是完全自动化的，包括面试过程中AI面试官回答候选人的问题，AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

以近屿智能与客户合作的校验周期至少3年来看，方小雷认为AI应用不太可能一下子爆发，包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

未来科技 2024年6月4日

AI大模型价格战：最先被卷死的是谁？

相关推荐

Share To :