开源大模型为什么反而最贵？

2024年4月28日 11:13 • 行业动态

来源：零态LT

为什么开源大模型反而是最贵的？近日，随着Llama 3宣布开源，一则美国AI创业者Arsenii Shatokhin的采访视频在网上流传（https://weixin.qq.com/sph/AZM8h34Jm），这位AI智能体公司VRSEN的创始人表示，企业自己运行开源大模型效率低于闭源API，“我们只有一两个客户有足够资源，来精调或运行700亿参数的Llama开源模型”。

开源大模型为什么反而最贵？

Arsenii Shatokhin已经在人工智能行业中从业六年，是美国知名的AI创业者之一。当前创业公司VRSEN专注于AI智能体，即基于大模型为企业客户打造AI Agent，从而提高销售转化率等指标。目前，Arsenii Shatoknin已经为多家知名企业如思科、StripePMA、HUGO PFOHE等提供过AI解决方案。

Llama 3开源后，Arsenii Shatokhin迅速发现了这款开源大模型的的实用性问题，“Llama 3比之前发布的任何开源模型都大的多，即使是现在，我们也只有一两个客户拥有足够的资源来精调、甚至只是运行这款700亿参数的大模型。”

开源大模型为什么反而最贵？

对于他的客户而言，使用这款开源大模型，反而不如闭源的商业大模型效率高。他分析说，闭源大模型的API优化效率更高，“因为这些API是专门为模型构建的，并且尽可能地进行了优化，你只需要为你使用的东西付费，而无需其他费用。”与之相对，如果在开源模型中开发这样的优化系统，“是非常复杂的”。

开闭源之争是大模型行业近期热点，但与Linux、安卓等系统开源不同，越来越多AI行业人士表达了对闭源大模型的认可，并纷纷指出开源大模型存在的各项问题。

“开源大模型会越来越落后”，不久前，百度创始人、董事长兼CEO李彦宏在演讲中指出，“大家以前用开源觉得开源便宜，其实在大模型场景下，开源是最贵的。”

当前，开源大模型与以往的开源系统存在明显差异。在开发者社区，多位网友指出，当前的开源大模型并不是真开源，仅仅是开放参数，而训练代码、训练数据、算法都未开源，依然是一个“黑盒子”，从而也会带来几项明显问题：

1）问题难解决：开源模型仅提供API接口和下载，开发者连一行源代码都看不到，如果模型运行出现问题，难以找到原因，也很难及时调整、修正；

2） Post-pretrain消耗资源大：开源大模型就像一座建好的毛坯房，很难即开即用，要想使用还得经过Post-pretrain，需要消耗巨大的算力资源。正如美国AI创业者所说，大部分公司根本没有足够算力来精调和运行。相对来说，闭源的商业模型经过多次优化，已经可以“即开即用”。

3）安全隐患：海外开源模型均未经过安全测试，在使用中为确保安全性问题，需要再经过多次精调，不仅有安全隐患，而且进一步加大了使用成本。

同时，也因为当前的开源大模型并不是“真开源”，仅仅是“开放”，因此无法像开源系统一样实现“众人拾柴火焰高”，在持续的迭代进步中，与闭源模型的差距会逐步增大。

开源大模型为什么反而最贵？

近期，美国斯坦福人工智能研究院院长李飞飞带领团队发布AI Index报告显示，在10项针对大模型的评测中，开源大模型全面领先闭源大模型，尤其是在最能体现模型应用和智能体能力的AgentBench项目上，闭源模型评分为4分，而开源仅为0.96，两者差距高达300%。

声明：该内容为作者独立观点，不代表新零售资讯观点或立场，文章为网友投稿上传，版权归原作者所有，未经允许不得转载。新零售资讯站仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。如对本稿件有异议或投诉，请联系：wuchangxu@youzan.com

财经 AI 人工智能

Like (0)

唐家三少宣布停更，靠“码字”年入上亿

Previous 2024年4月28日 11:12

“不正当”竞争背后，菜鸟难过万重山

Next 2024年4月28日 11:33

行业动态

全网曝光超8亿，连续4天闯入双榜！这部女频武侠短剧爆了？

从年初国家广电总局发起“‘跟着微短剧去旅行’创作计划”开始，各地文旅相继出手，《我的归途有风》《恋恋茶园》《一梦枕星河》等文旅剧都取得了亮眼的成绩。但这两天，有一部特别的竖屏文旅…

2024年9月19日
行业动态

二次元复活老商场，谷子店还是好生意吗？

眼下很多线下商业体似乎正在被二次元/谷子*经济盘活，硬控了很多圈内外的消费者。从百米香榭到迪美，从第一百货C座到静安大悦城，在上海流传着一份二次元吃谷路线。 *谷子，音译自“Goo…

2024年9月18日
行业动态

护肤的尽头是医美？高端化还是国货的唯一出路吗？

护肤是消费者一辈子的话题，而高端化几乎是所有国货的心病。近年来，众多国货护肤品牌积极撕掉“平替”、“低价”标签，纷纷进军高端市场。无论是成分升级加强产品研发，还是与热门影视综艺…

2024年9月18日
行业动态

小米折戟大折叠

小米折戟大折叠 “小米人都懂，最近真的太难了，每天被逼着卖大折叠，卖不出去每天上下蹲，罚抄，述职，罚款，第二天腿都是软的，为了跟上进度，所有管理层被逼着自己先买一台（直接在工资里分…

2024年9月18日
换汤不换药，小红书锁定中小商家

所有内容平台都会面临商业化与内容之间的取舍问题，而小红书尤甚，这部分源于在当前的互联网环境中，它的内容生态辨识度很高。这种印象的形成，除了平台定位明确加之对调性的把控，也是一种算…

行业动态 2024年9月18日
1688要做产业带上的Costco

出品/壹览商业作者/李彦编辑/木鱼 1688对产业带的投入还在继续，这一次，场景来到了线下。 9月11日，1688在浙江省台州市举办了1688选品中心暨1688商人节发布会。在…

行业动态 2024年9月18日
行业动态

一线探访｜跨境“优等生”苏州：如何从世界工厂到创新高地

作者 | 冯叶编辑 | 李小天列车驶入苏州北站后，空气开始活跃。穿着套装的商旅人士忙不迭从行李架上取下小箱子，谈论“这家器械厂么，我是第三次来了”，然后排好长队等待出站。但他们…

2024年9月18日
行业动态

为什么IBM的市值只有微软的十六分之一？

我平时的一个主要学习方式（以及爱好）是读财报。上市公司每个季度的财报披露，包括公告、新闻稿和分析师电话会议纪要，向我们提供了大量的财务信息和业务信息，是一个不容忽视的知识宝库。最…

2024年9月18日
行业动态

专业白领阶层消亡的开始？写在OpenAI o1大模型发布

OpenAI于昨天发布了最新的o1大模型，这不但是自从GPT-4发布以来基座大模型的一次最大更新，也是生成式AI发展史上的一个里程碑（甚至转折点）：直到GPT-4o为止，所有的大模…

2024年9月18日
行业动态

两个深圳人，决定去中亚创业

讲述人 | 严林辉、严灿升整理 | 刘景丰中亚，一个与中国紧邻的地域，正成为中国企业出海的新目的地。有这样一个数据：去年，大概有几万华人去中亚；而今年到目前，已经有超过30万…

2024年9月13日