在国内大模型界卷完模型卷应用,卷完应用卷生态,相互厮杀竞争疲了之际,基础模型终于在前天晚上 Claude 3 发布后迎来了突破。
图/Anthropic
当然总体来看,Claude 3 令人惊喜的点有很多,譬如极快的响应速度、强大的视觉能力、200K 的上下文长度以及各种数据集、任务上准确率的提升,但是不像 Gemini 刚刚面世时的宣传片(不是 Gemini /手动狗头),带给人不仅仅是“超越 GPT-4”而且是“超越 GPT-4 范式”的震撼,Glaude 3 更加像是在 GPT-4 已经给大模型划定的发展道路上做出的修补式突破。
而有意思的一点是,其实 Claude 系列从问世至今事实上都维持着不错的性能表现,在各大评测榜单中也都是老二老三,甚至这次 Claude 3 “翻身农奴把歌唱”,一举超越了老大 GPT-4,但是在大家的讨论中热度最高的仍然是 OpenAI。
只要是检索与 Claude 3 相关的内容,几乎逢 Claude 3 必带 OpenAI 或 GPT-4,当然这也是因为 Claude 3 最大的卖点是“击败 GPT-4”。不过对一家公司在市场内的知名度而言,换位思考,如果是 OpenAI 发布 GPT-4.5 或是 GPT-5,标题或许绝不可能带 Claude。
不仅仅是媒体的标题,在社区中当大家看到 Claude 3 如此的表现,甚至于第一反应居然是“更期待 GPT-5 了”?
而网友们这种期待似乎并不是空穴来风。先不说三个月前就有风声说 GPT-4.5 疑似曝光(GPT-4.5疑似曝光!三种型号模型,多模态能力大升级,定价遭泄漏),单说在上月谷歌的 Gemini 1.5 Pro 发布的同一天,OpenAI 就发布了 Sora,马上抢占了热度占领了流量高地,Gemini 1.5 Pro 的风头还没有在头条呆满一天,马上铺天盖地的信息都是关于 Sora。
这种情况被张俊林大佬在总结为“打压链理论”。具体而言,在目前整个大模型领域 OpenAI 变成了毫无疑问的“行业老大”,位处链条的最顶端,占据先发优势的 OpenAI “有能力打压有潜力追上它的竞争对手”,比如谷歌,再比如 Anthropic。
在这条打压链中,理论构想了一个处在链条顶端的老大 OpenAI 以及一众位于链条下端的追随者。由于具有先发优势,因此老大 OpenAI 有能力构建一个“技术储备库”,里面存储了许多“秘而不发”的优秀模型。为了维护自己的“统治地位”,OpenAI 不会选择直接发布自己研制出的新模型抢占市场先机,而是会等待竞争对手发布模型,依据其模型的先进程度选择其“技术储备库”中的模型,来实现“打压”竞争对手。
由于大模型这个市场产品的高度“同质化”,因此 OpenAI 实施打压战略时,往往会使得竞争对手过去投入的高额研发成本无法转化为有效的市场占有率,成为沉没成本,达到 OpenAI 为市场后来的追随者“制造竞争压力”,乃至成为“逼迫退出市场”的手段。
这种策略我们可以在 OpenAI 推出 ChatGPT 打压 Claude 时看到,也可以在今年 Sora 打压 Gemini 时看到,并且在社区内,大家甚至也在期待看到 GPT-5 打压 Claude 3 的时刻。不过 24 个小时过去,GPT-5 的王炸暂时还没有出现,这个“where is GPT-5”的表情包也迎来了进化:
图/Twitter KandrejArpathy@untitled01ipynb
其实尽管在打压链理论下,OpenAI 似乎是一个好的“狙击手”,但是这一次却是被 Claude 3 打了一个“反击战”。
正如我们报道的那样,这两天 OpenAI 正在陷入被 Elon Musk 提起诉讼指责其不开源的“泥潭”之中(日前马斯克正式起诉OpenAI和奥特曼)。
而根据网友们的分析,事实上 Claude 3 正是有意选择在这样一个 OpenAI 可能无法快速实施“打压”的时间节点快速上线,出其不意打 OpenAI 一个措手不及。
或许不论是 Anthropic 的 CEO Matt Schumer,还是大模型社区内任何一个成员,可能大家都知道 OpenAI 内部肯定还存在着一个更加先进的大模型,GPT-5 发布只是时间问题。而这时候,马斯克的起诉,无论其是否能够成功,都可能为像 Anthropic 这样的“后来者”争取到了宝贵的时间。
那么,在 OpenAI 的打压链下,后来者真的一点机会都没有了吗?
在管理学的顶级期刊Management Science的论文I Don’t “Recall”: The Decision to Delay Innovation Launch to Avoid Costly Product Failure中,来自哈佛商学院的团队设置了这样一个场景:
在一个竞争市场中,每家公司都急于将创新产品推向市场。然而,快速发布创新产品的弊端可能在于这些产品没有经过严格的测试(譬如在大模型中的安全风险审查与对齐),而未经过严格测试的产品在未来将会面临“召回”的风险。
在这个背景下,这篇论文通过一个动态博弈模型发现,即使快速推出产品面临的“召回”风险很高,但是当预计竞争对手也会提前推出创新产品时,最好的做法依然是快速发布抢占先机。因为这种模式更有可能使得竞争对手在“召回”时出现破产,从而获得“赢家通吃”的结果。
图/Management Science
而在打压链的背景下,尽管 Anthropic 推出 Claude 3 有可能会被 OpenAI 进行“打压”,但是 Claude 3 的推出也反过来逼迫 OpenAI 将 GPT-4.5 或 GPT-5 快速推出,迫使 OpenAI 承担一旦他们的“明星产品”效果不佳(类似谷歌 Bard 首秀 Demo 翻车)而带来的巨大潜在风险。
并且,也是由于 OpenAI 的“声名在外”,OpenAI 翻车带来的如上述论文中提到的“召回”成本也会远远大于 Anthropic 有可能承担的“召回”成本,而此时大家对 OpenAI GPT-5 的期待,反过来也将变成 OpenAI 的一把真正意义上的双刃剑。
如果再将目光转向 OpenAI 的打压链本身,这套逻辑生效的根本原因也在于市场产品的高度“同质化”。
各家的大模型,无论是 OpenAI 的 ChatGPT,Anthropic 的 Claude,还是谷歌的 Gemini,目前都没有表现出明显的“不可替代性”,甚至于在国内大模型“百模大战”,模型所能提供的功能也大多停留在追赶GPT的路上,此时一个更先进的类 GPT 模型必然可以打压其余一百个或是一千个模型。
然而如果各家大模型寻求差异化竞争,比如垂直领域模型,再比如终端的小模型,OpenAI 的打压也并不一定会生效。
事实上,尽管 OpenAI 目前仍然牢牢占据着“先发优势”,但是这种“行业老大”的地位也并非牢不可破。
对于市场后入者而言,除了“先发优势”,也存在着“后发优势”,就像很多国内的大模型企业所做的那样,在 OpenAI 已经试错成功的道路上,后发企业所付出的“试错成本”将会被极大缩减。
也如马斯克起诉 OpenAI 的那样,成熟的老大往往会面临着更多意想不到甚至是潜在威胁,这些“机会”也同样使得追赶 OpenAI 成为可能。
那么,其实在 Claude 3 发布之外,我们或许可以发现在媒体和社区内对 OpenAI 的一众赞歌与期待之下,Claude 3 背后的“世界最强模型易主”,也并非仅仅是几个数据集上刷高了百分比那么简单吧。
本文来自微信公众号:夕小瑶科技说(ID:xixiaoyaoQAQ),作者:小戏