2024过半,AI大模型卷到哪儿了?

陈冉认为,国内大模型还没有形成完整的创业生态,大家一窝蜂冲上来,发布几个模型证明不了什么。

AI大模型有三大要素:算法、数据、算力,国内厂商们过去一直在啃算法,大家发布模型,本质上是发布一套算法和系统。

他认为,之前行业对大模型过于乐观,总有“训练一个大模型改变世界”这种不切实际的幻想,事实上大模型还没有真正形成生产力。

AI创业者陈冉,发现行业里有一些“怪现象”。

很多客户向他反馈,自己很困惑。一方面,大模型更新速度太快,搞不清楚到底哪个好用;同时,自己也不知道大模型怎么跟业务结合;另外,自己的数据集究竟能不能精调出一个好用的大模型,心里也没谱。

最后的结果就是,愿意投入大模型,但不知如何下手,即便下定决心了,也抠抠搜搜拿不出太多预算来。

这进而导致,大模型公司开始卷价格,打起了价格战。“拼到最后就是,又烧钱、价格还低、还没人用的状态。”

陈冉是一家人工智能社区和生态公司的创始人、CEO,他认为大模型行业的无效内卷是一种消耗。去年一哄而上做大模型的公司们,最终没能避免掉进当年ofo们踩过的陷阱。

这逼得行业大佬、零一万物创始人李开复放话:“如果中国市场就是这么卷,大家宁可赔光、通输也不让你赢,那我们就走外国市场。”

做了多年技术开发,很早就开始AI创业的李友峰,同样对今天的现象感到不解。“以前我们讨论一个项目,会关注它有什么价值,但到了AI大模型,大家很少讨论价值,都在讨论领先。”

铺天盖地的榜单,五花八门的排名,自吹自擂的营销,让这个行业显得浮躁喧嚣。厂商们最后花了很多钱,产品落地不了,技术实际上也没有太领先。

5月下旬,清华系大模型公司衔远科技被曝换帅,创始人周伯文将离开公司。消息传出后,有创业者称:聚焦算法,或许是一条弯路。

大模型创业,在中国是一条窄路,对某些团队而言也许是不归路。

如今,2024年过半,“百模大战”也过去一年多了,行业发展到哪了?接下来又会往哪卷?

卷技术:考高分的太多,能干活的太少

国内大模型行业,今年明显比去年“安静”。去年是“阿猫阿狗”都来参与,几百个大模型面世,今年除了几个科技大厂和头部的创业公司,其他大部分都消停了。

因为大家发现,吆喝再大声,落不了地都是白搭

国内的大模型不是太少,而是太多,尤其是吹牛的多。

“厂商总是宣传大模型能干啥,却不说不能干啥,客户就有点被误导,以为大模型什么都能干,想着把原来的业务颠覆重做一遍,这不现实。”陈冉说。

回看过去一年大模型行业的发展,我们会发现,最先打起来的不是价格战,甚至也不是技术战,而是营销战

营销是为了抢声量。开发布会、刷榜、投广告甚至碰瓷对手,能吸引更多关注,让大家“觉得”自己领先。至于好不好用,真实的技术实力如何,可以后期再补课。

李友峰告诉“定焦”,现在国内所有的所谓自研大模型,基本都是基于开源架构改的,没有真正意义上的原创和全自研。这意味着,大模型公司之间的技术差距并不大。

这也是为什么一家创业公司,能在两三个月内从零到一推出一款全新大模型。最好的例证是,去年李开复的零一万物发布“Yi”系列模型,被指使用了LLaMA的架构,只对两个张量进行了重命名。

陈冉认为,国内大模型还没有形成完整的创业生态,大家一窝蜂冲上来,发布几个模型证明不了什么。他以智能汽车行业早期做类比:大家都想造车,做轮胎的、造发动机的甚至做雨刷的,都想亲自下场,但最基本的电池、电控甚至轮子座椅都还没准备好。

单纯从技术层面,时至今日,国内没有哪个团队处于绝对领先位置。

AI大模型有三大要素:算法、数据、算力,国内厂商们过去一直在啃算法,大家发布模型,本质上是发布一套算法和系统。大家比拼谁的算法更先进,谁的模型参数更大,推理效率更高。但现在越来越多从业者发现,算法其实没有壁垒。陈冉更是直言“大模型不值钱”。

“我认为企业级的大模型没意义,开源企业级就行了,因为最重要的是数据。”他说。

数据是比算法更稀缺的资源。算法可以通过修改开源模型和人海战术迭代,算力可以通过砸钱买卡获得,但优质的数据没有渠道售卖,花钱不一定能买来。

训练模型跟训练学生类似,数据相当于教材或教育资源,过程就叫预训练。偏远山区的孩子和一线城市的孩子,从小获得的教育资源不同,训练过程不同,最后高考考上重点大学的概率也必然不同。某种意义上,拥有优质数据,预训练就成功了一半。

过去一年,行业里评估一个大模型好坏的标准,是通过测评,相当于考试。既然是考试,就有作弊的空间,或者可以通过刷题得高分。这就导致,很多大模型其实是“应试教育”的产物——参数大、得分高、性能强,但没啥实践能力。

李友峰认为,算法有很大局限性,如果脱离具体的应用场景,算法没有意义。“比如模型的参数大,计算能力很强,做数学题也许表现很好,但这并不意味着它能在实际业务里产生价值。”

今年以来,大模型拼参数的风气有所改观,各种杂七杂八的“野榜”也有所收敛,说明公众不好糊弄了。问题是,如果不比参数,大家还能比啥?

卷价格:C端不敢收,B端收不起

一个模型或一个项目要证明自己有价值,最直接的方法是从市场上赚到钱。今年以来,越来越多AI创业者和投资人,开始将商业模式挂在嘴边。

大模型行业的商业化有两大类——To C和To B,即向个人用户收费和向企业(包括政府、开发者)收费。去年行业达成共识,To C收费很难,先从B端入手。

B端企业是大模型的最大客户。一家做系统集成公司的员工曾对“定焦”说,他们很早就接入了百度的千帆大模型平台,拥抱大模型的意愿很强,不过他们不是因为模型效果好而使用,仅仅是怕被AI落下。而一旦模型收费,他们就得再考虑考虑了。

这代表了很多企业的心态:能白嫖就白嫖,付费就必须得看到效果。用陈冉的话说:“让客户花钱,就得让他看到成倍的增效,不见兔子不撒鹰。”

李友峰认为,真正用大模型的企业,都关注业务数据而不是算法指标。“比如转化率、点击率和其他关键指标,分别提升了几个百分点,如果不能做到这些,即便算法有1万亿参数,价格低至1毛钱,客户也不会买单。”

5月的这一波价格战,大模型API的调用价格直降超过90%。以字节跳动、阿里、百度为例,每百万token推理输入量的价格,降到了8毛、5毛和免费。

然而这更多被市场解读为营销行为,有点清仓大甩卖的意味。

Lepton AI创始人、阿里原副总裁贾扬清说:“今天不是说API贵才没有人用,而是因为,企业首先得搞清楚到底怎么用起来产生业务价值,否则的话,再便宜也是浪费。”

出门问问创始人李志飞更是直言:“将API价格降到无限逼近零,说明OpenAI对消费者收费和对企业收费的两种商业模式在中国竞争环境下都不可持续。”

百度是C端B端两手抓,其中面向C端的文心一言4.0是付费版,连续包月49.9元,百度一直没有公布文心一言的付费率数据。据AI产品榜的数据,后起之秀月之暗面的Kimi,网页版的访问量在4月超过了文心一言。Kimi没有选择用收会员费的形式“自废武功”,而是非常另类地推出了打赏功能,非强制,在高峰期算力不足时可获得优先使用的权益。

这还是C端大模型的头部选手,由此可见收费之难。归根到底,当前的大模型产品还不够好用,不是那么刚需,需要给人们一个付费的理由。

一家AI初创公司拿到了奇绩创坛的投资,它一开始的产品都是面向C端,解决各种实用需求。创始人池光耀告诉“定焦”,其中一款主力产品既能免费使用,也可以付费解锁更多功能,但超过99%的用户在白嫖免费额度,收上来的钱很难养活公司。

今年初,该初创公司转型,开始做面向B端的Agent产品,目前已经拿下两个订单,“客户付费意愿还不错,现在有钱赚了蛮好”。不过,要彻底跑通某个垂类的B端业务,还需要一段时间探索。

有极少部分公司,抓住了市场需求,并打通了业务场景,率先赚到钱。

陈冉想做生态,线上做社区,线下卖软件,客户以B端企业和D端开发者为主,已探索出应用分佣和用户订阅两个变现模式,未来还可以增加算力分佣模式。他说,公司今年预期营收几千万,盈利达几百万。

卷应用:爆款应用未出现,产品和工程落地难

大模型发展到今天,从业者一方面想办法赚钱,同时也在等待爆款应用出现。之前我们见证了妙鸭相机、Kimi、Suno等应用的走红,但这都还称不上爆款。而只有出现爆款,才能说明AI不是纸上谈兵。

大模型厂商打响API价格战之时,有人不以为然,有人嗤之以鼻,也有人格外兴奋。

作为一个独立应用开发者,池光耀认为API降价是巨大利好。API降价之前,他每个月要花200元左右的预算在模型调试上,现在他调用降价之后的深度求索DeepSeek-V2模型,半个多月只花了1.11元。

他去年开发了好几款应用,受限于高频调用带来的高额推理成本,而用户又不愿意付费,导致至今产品没有推出去。现在他迫不及待想让这些应用“跑”起来,“要不是现在手上有B端的单子推不掉,我就直接去做C端产品了”。同时,那些以前因为负担不起API调用费而做不了的B端订单,现在也可以做了。

他认为,接下来几个月,会有海量关于大模型的应用场景的探索,很可能会带来应用场景的大幅增加。一些过去需要依靠人工或工程化的手段判断高频的、低逻辑需求的,且延时不敏感的应用场景,或许可被免费的大模型API取代掉。

大模型落地,一定是从场景开始突破。无论大模型API是否降价,找场景都会成为下半年的共识。

李友峰认为,下半年出圈的应用会越来越多,找到合适的场景,在规模产出的基础上覆盖规模的成本。“大家应该拼命去找价值,而不是卷价格。”

目前的AI应用中,有两类已经显现出了价值,并获得了不错的反馈。

一类是提效,帮助职场打工人搜索资料、整理文献;给品牌用AI做产品设计和营销物料,从事该行业的邱懿武告诉“定焦”,他们用AI给某咖啡品牌做了2000个杯子的设计方案,不算模型投入,算力成本只要10块钱。

另一类是娱乐,比如Suno这种AI写歌软件,以及很多创业公司在做的AI陪伴、角色扮演。

目前行业里普遍认为,Agent AI是下半年行业的重点,国内外从业者都在往这方面卷。

随着对产业的探索加深,李友峰发现,AI真正难的是产品和工程(指构建、开发和部署大型机器学习模型的一系列技术和实践)。“不断让大模型走向产品、工程、商业、产业,是中国创业公司成长的唯一路径。”

一旦工程问题解决了,模型反而不重要了,用户在使用产品的过程中,不关心底层用的是哪个模型,自研占多大比重,效果好比说啥都强。

现在的情况是,大模型在具体应用时,还不能百分之百保证效果。以大语言模型为例,“胡说八道”的毛病一直没有克服。“这种不可控的状态,很难让它在生产中发挥很大作用,还需要时间打磨。对于大部分B端客户,如何跟上社区和大模型生态发展和进化才是应该关注的。”陈冉说。

他认为,之前行业对大模型过于乐观,总有“训练一个大模型改变世界”这种不切实际的幻想,事实上大模型还没有真正形成生产力。在AI 1.0到AI 2.0之间,还有一个过渡的过程。“就是如何通过AI先赋能已有体系,而不是全盘否认。”

在向上爬的过程里,必然有一些公司会摔下去被淘汰,尤其是那些还不具备造血能力的公司。斯坦福大学“以人为本”人工智能研究院在一份报告中称,2023年全球对人工智能的投资连续第二年下降。

在国内,以阿里、百度为代表的科技大厂还在持续投资,比如阿里就耗资8亿美金,投资了Kimi的母公司月之暗面,占股36%,市场传闻腾讯也在洽谈跟进。

然而,对于推动原始创新和产品落地,这些大厂究竟发挥了多大作用、扮演着什么角色,我们越来越难以评估。大厂一方面自己做大模型,同时又投资了市面上几乎所有的明星创业公司,用股权把对手绑定。甚至这一波被开发者称赞的API降价,也不是由大厂发起,而是一个叫幻方量化的私募巨头,以及创业公司智谱AI带头,随后的大厂跟进,充满了被动和营销的味道。

下半年,行业依然会很卷,毕竟国内大模型从一开始就是竞争驱动的。也许,我们能卷出来几个赢家,爆款应用也不远了?

应受访者要求,李友峰为化名。

本文来自微信公众号:定焦(ID:dingjiaoone),作者:黎明,编辑:魏佳

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年6月3日
Next 2024年6月3日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日