来源:互联网那些事
万万没想到!在技术和资本密集得无以复加的AI大模型赛道,马太效应破天荒迎来第一次失效!
一个初创公司,凭借Claude 3,拳打OpenAI、脚踢Google,将GPT-4和Gemini 1.0 Ultra悉数斩于马下!物理学真的不存在了?
01,奥特曼“慌了!”
就在马斯克“战术佯攻”起诉奥特曼之际,OpenAI的“后院”起火了:
当地时间周一,创业公司Anthropic发布了一组名为Claude 3的系列大模型,宣称其功能最强大的模型在各种基准测试中均获得了优于GPT-4和Gemini 1.0 Ultra的成绩,消息一出,引发热议,这是吹牛皮?还是真实力?
这家初创公司,虽然规模远远无法跟微软(OpenAI)和谷歌这样的巨头相媲美,但也不能算名不见经传,因为,其创始团队的核心大牛,正是来自OpenAI公司GPT-3项目的研发负责人,这波被公司前任技术元老背刺的滋味想必不太好受(求奥特曼心理阴影面积)。
Anthropic公司表示,Claude 3系列模型,在推理、数学、编码和多语言理解及视觉方面,都奠定了新的行业基准,尤其是多模态和语言能力指标上的惊艳表现,让他们的大模型实现了对GPT-4和Gemini 1.0 Ultra的全面碾压。
事实胜于雄辩,基准测试的结果出炉之后,除了民间沸腾不已,业内专家也给予了Claude 3高度的肯定,来自爱丁堡大学大模型和推理博士符尧表示,Claude 3在一些复杂推理的基准测试上表现尤为显著,尤其在金融和医疗领域,作为一家To B的公司,Anthropic从一开始就规划了变现最大化的商业闭环!
那既然是To B的,Anthropic也非常人性化地推出了中杯(Haiku)、大杯(Sonnet)和超大杯(Opus)三个具体的模型,让目标企业视财力和需求个性化选择最适合自己的解决方案。
罗老师,别这样!
三个大模型中,最最炸裂的当属Opus了,它是Calude 3系列中最强悍、最先进的大模型,在本科级别专业知识、研究生级别专家推理、基数数学等板块,它的性能表现被公认超越了当下AI大模型领军者GPT-4。
为了让大家直观领略Claude 3恐怖如斯的实力,我们再来一组通俗易懂的实例对比,Claude 3单词可处理近15万个单词,而ChatGPT单次只能处理近3000个单词,在单词处理能力上,前者是后者的近50倍!
甚至有行业人士惊喜表示,在处理复杂任务时,Opus所展现出来的分析理解与表达能力,已经能与人类相媲美,智力水平遥遥领先其余LLM,在联系到黄仁勋“10年内将会出现AGI”的论调,让人不得不感慨——未来或已来!
除了强悍的性能,Calude 3的安全性也得到了进一步的优化,Anthropic表示专门针对虚假信息、生物安全滥用及(西方)选举干预、隐私安全等方面组建了特别团队来降低风险。
打不过就加入,只许你微软重仓押注OpenAI?谷歌和亚马逊同样也不是吃干饭的,据悉,Anthropic目前融资规模已近80亿美元,而随着Calude 3的逆天表现,融资超百亿美金已是板上钉钉的事。
又快又猛又稳,那是不是意味着,AI大模型赛道,从此将唯Calude 3马首是瞻?
非也!因为强如Calude 3,也有自己的软肋,而这,恰恰是OpenAI、Google们的机会……
02,AGI还有多遥远?
日前,“AI教父”黄仁勋在加州出席某论坛时,再一次表达了对AGI的坚定信心,在他看来,有能力通过人类测试的“类人类”不会要十年或几十年那样遥远,也许5年内就会出现,老黄的话音刚落,无疑对所有的大模型公司打了一针鸡血。
当然,在商言商,老黄鼓吹AGI不是伪命题,不排除他想让英伟达卖更多GPU的可能性,但是在业界,众多科学家与学者对AGI的追求和信仰,确是高度一致的,也就是说,谁先实现AGI能力的涌现,谁将掌握“新世界”的话语权!
在AGI阶段,人工智能已经演变成了可以执行复杂任务的系统,并能完全模仿人类智能的行为以及在各种不同任务和环境中表现出人类智能水平,具备自我学习、自我改进、自我调整的能力,能解决一切问题,而不需要人为干预。
OpenAI的GPT-5仍未发布,所以,奥特曼还会带给人类哪些惊喜,仍不得而知,何况,稍早前的Sora,已经让全球用户切身体验了它的魔力和无穷潜力,所以,纵使新锐Claude 3横空出世,OpenAI感受到了前所未有的压力,但要说遭遇重挫,也是杞人忧天。
此外,Calude 3不支持直接生成图像/视频,与GPT-4(Sora)和Gemini 1.0 Ultra比较起来,也就有了先天的短板,尽管Claude 3允许用户上传图像或文档进行分析,但是不容忽视的是,它无法直接满足客户生成图片/视频的需求。
只不过,Anturopic已经跑通了自己的商业模型,为B端像金融、医疗类这些富得流油的大客户服务才是第一要义,至于C端的诉求,他们可能爱搭不理,毕竟,还有那么多LLM支持文生图呢,普通用户有的是办法免费享受这一甜点功能。
目前文心一言、vivo、通义千问、OPPO、魅族等国内的LLM/AI终端,皆已支持了文生图功能,所以,Calude 3支不支持这个特性,在国内市场,都不会成为它的独门优势,反而是其Opus“类人”的分析处理能力,让人看到了AGI的曙光,这才是它的核心竞争力。
这就对GPT-5的核心爆点有了更高的要求,如果它推出来以后,只是比GPT-4运算和推理的速度快了百分之几,那显然是不够有吸引力的,如果它带来了什么颠覆性的东西,才能称得上是AGI前瞻。
而对于GPT-5而言,大众期待的杀手锏,自然落在了大模型终极进化目标——AGI!
从这个维度来看,Calude 3和GPT-4(包括文生视频的模型Sora)仍然有巨大的进化空间,
十年后,这个星球上,最大的科技公司,也许不是苹果、谷歌和微软,会不会是OpenAI和Anthropic其中一个?