对于“百模大战”,几乎所有大佬的口风都180 °大转变了?

同时,像OpenAI、Anthropic这样的大模型头部领军企业以及如谷歌、微软等科技巨头也在致力于利用开源模型或自主研发的基础模型,开发出各种应用场景的解决方案。
GPTs的推出以及OpenAI宣称的一系列给开发者让利的行为,都旨在吸引更多的创业团队参与到GPT技术的创新和应用中,从而丰富GPT生态系统,帮助OpenAI在接下来的时间内占据大模型领域在场景应用方向的优势。

文 | 智能相对论

作者 | 陈泊丞

在2024世界人工智能大会暨人工智能全球治理高级别会议产业发展主论坛上,百度创始人、董事长兼首席执行官李彦宏谈了些对于AI大模型的看法,语惊四座。

他先是指出,“百模大战造成了社会资源的巨大浪费,尤其是算力的浪费。但同时也使得我们追赶世界上最先进基础模型的能力得到了建立。”

而后又强调,“没有应用,光有基础模型,不管是开源还是闭源都一文不值。”同时李彦宏也表示,要跳出移动时代的思维逻辑,避免掉入“超级应用陷阱”,不是只有10亿DAU的应用才叫成功。

可以说,李彦宏的发言挺激烈的。这似乎也是第一次有大佬在这么高级别的场合去把“百模大战”和大模型的发展摊开了说。

当然,秉持着类似观点的,也不只是李彦宏。

金沙江创投主管合伙人朱啸虎在6月的黑马大课上也提到,很多创业者盲目投资AI底层技术。虽然创造了“百模大战”的盛况,但也造成了社会资源浪费。

他强调,“很显然,AI创业的赚钱风向,已经彻底变了。”

怎么变?

除了李彦宏、朱啸虎之外,还有猎豹移动董事长兼CEO、猎户星空董事长傅盛,智谱AI COO张帆、百川智能创始人王小川等大佬在不同的场合也或多或少谈到了大模型行业竞争转变的方向,能最终达成共识的关键点在于“场景”和“应用”。

聚焦基础大模型的“卷”所导致的“百模大战”似乎该喊停了,大模型的重点还是得“卷”场景应用。

大佬们在这一点上达成了共识。今年以来,大家的口风都变了!

不要过度竞争基础大模型,该“卷”场景应用了

在过去一段时间内,美国涌向了大量专注于大模型应用开发的创业公司,如Adept、Stability.ai、Runway、BettrData、Tinybird、UnSkript等等。

同时,像OpenAI、Anthropic这样的大模型头部领军企业以及如谷歌、微软等科技巨头也在致力于利用开源模型或自主研发的基础模型,开发出各种应用场景的解决方案。

GPTs的推出以及OpenAI宣称的一系列给开发者让利的行为,都旨在吸引更多的创业团队参与到GPT技术的创新和应用中,从而丰富GPT生态系统,帮助OpenAI在接下来的时间内占据大模型领域在场景应用方向的优势。

以国外大模型行业的趋势来看,国内这些大佬们的口风转变并非空穴来风。

目前,百度文心一言的日均调用量已经超过5亿,而在两个月前百度官方才刚刚宣布文心一言的日调用量超过2亿。

期间2个月的时间,调用量就发生如此之大的变化,可见大模型要“卷”场景应用不仅仅是厂商们的推动,还有整个市场的需求已经摆上台面,呈现出爆发式增长趋势。

类似的信号也在阿里云的主场上释放。

在世界人工智能大会上,阿里云CTO周靖人公布了近期通义大模型和阿里云百炼平台的最新进展——近2个月,通义千问开源模型下载量增长2倍,突破2000万次,阿里云百炼服务客户数从9万增长至23万,涨幅超150%。

谈及大模型,比起参数上的比较,现如今国内的大佬们似乎更愿意去告诉市场自家的大模型如何好用,有多少人用,接下来还能怎么用等等一系列与场景应用落地相关的事情。

而以朱啸虎为代表的投资者们也开始在应用层去寻找大模型的投资机会。

市场的风向变了,不仅仅只是大佬的口风在变。

“超级能干”的应用在哪?

“AI时代,‘超级能干’的应用比只看DAU的‘超级应用’更重要。”在世界人工智能大会上,李彦宏试图为接下来的大模型应用开发趋势下一个结论。

然而,“超级能干”的应用或许理解起来并不难,市场悬而未决的问题在于这样的应用是如何开发出来的,又是如何推向大众?

基于现阶段的行业表现,「智能相对论」认为有几点思考值得探究。

一、在“超级能干”的应用背后,大模型技术的迭代和适配是必要的。

行业的趋势大多殊途同归,大模型领域在今年以来掀起的MoE架构迭代趋势,则是代表了在技术方面大模型正为“卷”场景应用而作支撑。

如今,OpenAI的GPT-4、谷歌的Gemini、Mistral AI的Mistral、xAI的Grok-1、昆仑万维的天工AI、浪潮信息的源2.0-M32、通义千问团队发布的Qwen1.5-MoE-A2.7B等国内外大模型都采用了MoE架构。

MoE架构通过引入专家网络(Expert Networks)和门控机制(Gating Mechanism)实现了模型的稀疏化和模块化,在数据处理、算力资源调配、输出结果优化等方面都有相当不错的反馈。这为大模型的场景应用落地和推广提供了非常关键的技术支持。

比如,微软就提出了一个端到端的MoE训练和推理解决方案DeepSpeed-MoE,其通过深度优化MoE在并行训练中的通信,减少通信开销,实现了高效的模型并行。此外,DeepSpeed-MoE还提出了基于微调的专家排序机制,可以根据训练过程中专家的损失动态调整输入样本到专家的分配,提升效果。

二、“超级能干”的应用意味着一场更商业化的生态竞争。

技术没问题,但商业化路径不清晰仍然会在今天的市场面临崩盘。日前,微软官网更新了一条通知——“GPT Builder即将停用”。曾经掀起AI圈无数热议与高潮的GPTs似乎正在走向败局。

谁又能想起,当时GPTs概念横空出世的那场发布会还被外界形容为“OpenAI的iPhone时刻”。

OpenAI本意是想借助低门槛的技术能力以及全球开发者们共同打造出一批“超级能干”的应用,结果却因技术问题带来的体验瑕疵以及模糊不清的货币化政策,让GPTs这一概念的商业化路径始终走不通,最终只能“凉凉”。

“超级能干”的应用大多是建立在成熟的商业生态之上,或许全球的AI厂商都需要认清楚这一点。值得一提的,在大洋的彼岸,阿里云在2022年11月牵头发起的开源AI模型社区刚刚斩获2024 SAIL之星奖的魔搭ModelScope。

历经一年多的发展,魔搭社区已成为国内规模最大、最活跃的AI模型社区,汇聚5500多款优质模型和上千数据集,为超过560万开发者提供了模型及免费算力服务。或许,OpenAI没能走通的生态路径,在中国会有新的生机吧。

三、“超级能干”的应用必然萌芽于行业场景中。

朱啸虎送给大模型创业者的忠告,“不要迷信AI,聚焦尖刀场景尽快落地。”——场景是孵化“超级能干”应用的摇篮,然而更深入地来看,也不能只看场景,最终还得看用户反馈和价值呈现。

医疗、教育、金融、制造、交通、农业等等这些行业领域是大模型应用“高发”场景,但打造出来的智能体或解决方案究竟如何,“如人饮水,冷暖自知”罢了。

To B的项目看效率。在快递领域,目前通过大模型来帮助处理订单,就可以做到了“一张图、一句话寄快递”,不再需要其他繁琐的流程,时间从3分多钟缩短到19秒。而且90%以上的售后问题,也都由大模型来解决。——这样的效率提升,才称得上是“超级能干”。

To C的场景看用户。此前,在高峰期,百度的高考智能体每天要回答超过两百万个考生的问题。对于全国1000万的考生来说,这一比例是相当高的。——这样的用户数量,也算得是“超级能干”。

今天,大模型应用覆盖文本生成、数据处理、PPT制作、市场营销、客服售后、医疗诊断等各类通用的和垂直的场景。实际上,市场并不缺场景,而是缺乏能干、有效的应用,“卷”应用须在场景中找用户、找价值。

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年7月8日
下一篇 2024年7月8日

相关推荐

  • 县城消费的另一面:喝奶茶的少了,钓鱼的多了

    图源:作者拍摄

    图源:作者拍摄
    刘子涵继续说道,现在同学之所以不愿意喝新茶饮,还有一部分原因是,学生们对新茶饮的口感愈发失去新鲜感。

    图源:作者拍摄
    但并不是所有县城零食折扣店都这么火爆,中秋节假日当晚当地赵一鸣零食折扣店偌大的门店看不到太多顾客,收银台前也仅有几个顾客在排队结算。

    图源:受访者提供

    有人为钓鱼投入千元,有人干起代购
    和新茶饮相对冷清、零食折扣店门店客流分化不同的是,部分业态在县城仍迎来火爆。

    11小时前
  • 闪回科技二度冲刺港股,深陷盈利困境,雷军看走眼了?

    在回收生意的上游,闪回科技通过闪回收从消费电子厂商、零售商、运营商以及C端消费者处获取二手手机供给。
    在下游销售端,闪回科技以“闪回有品”面向B端商户和消费者进行二手机和新机的销售,公司接近90%营收由闪回有品贡献。”

    B端渠道的手机厂商是闪回科技高增长最大的助力,但与之相伴的是,面对强势的手机大厂,闪回科技没有议价权,还需要向手机厂商支付高昂的保证金和促销服务费。

    11小时前
  • 极越:找回失去的三年

    成立三年来,极越的表现与预期存在落差,极越07就是那个能让他翻身的机会。一直以来,极越都缺乏知名度,当小米汽车发布后,这一点显得更明显,夏一平的观点虽然有待商榷,但提高了极越的热度。在夏一平看来,极越07的对手是特斯拉,他直言我们做了一辆特斯拉还没有做出来的车。3、极客007都是极越07的竞品,其中小米SU7也提供400V和800V两个选项,但它的售价比极越07高。

    11小时前
  • 中信建投与中信证券差距拉大,大型券商重组拉开序幕

    3、与中信证券差距拉大,大型券商重组拉开序幕
    中信建投投行收入持续下滑已成固定事实,在此影响下,中信建投归母净利润自2021年突破百亿元以后便连续下滑。2022年及2023年分别下降26.56%、6.45%,2024年上半年再度下滑33.66%.
    2021年,中信建投利润相当于中信证券利润的43.91%,2024年上半年则下降至26.93%,这也意味着中信建投与中信证券差距正在拉大。

    11小时前
  • 天猫商家注意!将限制商品体验分低于60分商品参加营销活动

    早在7月,淘宝教育联合淘天集团各业务团队推出直播,淘天集团体验分运营负责人驷石分享策略,称对于商品体验指数小于70分的商家,可能影响商品转化、点击和后续运营。
    今年7月,淘天集团在618结束后召开了一场商家闭门会,会上明确了将于下半年开始正式实施的几个变化,此外,下半年,影响店铺层级、搜索流量的不再是单一指标,店铺体验分会非常重要,例如用PXI(商品体验指数)指标完全取代DSR(店铺评分指数),成为影响搜索权重的指标,目前已经处于灰测阶段。

    商业密码 11小时前
  • 身陷“百模大战”,云天励飞毛利率大幅下滑

    上市以后,云天励飞并没有改变亏损局面,2023年云天励飞净亏损3.83亿元。
    2、身陷“百模大战”,云天励飞毛利率断崖式下滑
    2023年是AI爆发的元年,云天励飞是A股为数不多同时拥有大模型及人工智能芯片的企业,具有一定的稀缺性。2021年-2023年,云天励飞研发支出分别为2.95亿元、3.47亿元、2.95亿元,这对于年营收仅5亿元的企业而言不可谓不多,这也是云天励飞持续亏损的重要原因。

    11小时前
  • 又是代工惹的祸,奶酪博士产品吃出异物遭维权

    1、奶酪博士品控遭质疑:代工模式不完全靠谱
    今年8月份,一位消费者在小红书上发文公布了“奶酪博士冻干奶酪块有毛处理结果后续”,原来是今年6月份,该消费者购买了奶酪博士的冻干奶酪产品,购买价格59.44元,但在食用中却发现奶酪中存在异物。
    2、商业诋毁纠纷阴霾仍在,奶酪博士近期成被执行人
    天眼查显示,奶酪博士(安徽)食品科技有限公司、奶酪博士(上海)科技有限公司这两家公司在今年7月11日成为了被执行人,执行法院为上海市奉贤区人民法院,但执行标的是0元。

    11小时前
  • 拒绝低价,喜茶说了算?

    一线城市增长乏力,下沉市场阻力明显增加的市场背景下,未来新茶饮赛道很大概率会出现中小品牌为了市场规模持续混战的情况,而在多品牌内卷的行业环境下,低价竞争虽然能够稳固市场份额,但更考验品牌的现金供应和管理能力。
    惊蛰研究所在《2024新茶饮:不卷产品,卷周边》提到,除了在产品本身上不断创新外,新茶饮品牌们在周边产品和服务上下足了功夫,忙着联名和设计周边,部分新茶饮品牌几乎每个月都会推出至少一款联名产品,以此寻找新的增长点和突破口。

    商业密码 11小时前
  • 抖音网红,一直塌方?

    东北顶流,9场直播卖出5000万

    东北雨姐,是名副其实的东北顶流。

    2024,抖音达人“塌房之年”

    2024年以来,多名抖音网红频繁陷入争议中,他们中有人致歉掉粉,也有人宣布退网,还有人被平台封禁了账号,堪称是网红达人的塌房之年。

    事件发酵后,“空空日记”的行为遭到了多方指责和抨击,随后“空空日记”发布道歉视频,表示“今后会努力提升个人素质,规范自己的言行”。

    11小时前
  • 科大讯飞还是AI“小甜甜”吗?

    到了2024年,按照科大讯飞董事长刘庆峰和总裁吴晓如的综合表态可知,科大讯飞在2023年已经成为中国大模型第一梯队,在2024年要实现100万生态、1000万硬件终端、1亿软件用户。

    科大讯飞的开放平台,即为开发者提供AI能力及一站式人工智能解决方案,在讯飞星火大模型的加持下,2024上半年,业务收入23.45亿元,同比增长47.92%,延续了2023年该业务的较好表现。

    11小时前