​ChatGPT悄悄变懒, OpenAI还能加速跑吗?

图源:OpenAI论坛 

有的人抱怨,GPT-4没有遵循他们给出的指令,当用户需要它给出完整的代码时,GPT-4会给出带有占位符(placeholders)的截断代码。 

对于“变懒”的原因,用户甚至猜测OpenAI是不是将背后的模型偷偷换成了GPT-3.5,还有的则认为OpenAI正在将更多的精力放在其“企业级客户”上,而非“平民”上。

无论是公开场合还是媒体爆料,尽管OpenAI创始人Sam Altman已多次剧透GPT-5的相关消息,但与这位创始人浮出水面的硬件、算力等野心相比,眼下最棘手的问题是:ChatGPT的一群忠实用户们,正在发现GPT-4正在变得越来越“懒”。

所谓的“变懒”指的是ChatGPT的个人用户体验。近期,在OpenAI在线论坛上,不少用户正在抱怨GPT-4性能下降,包括推理变差、响应变慢等。一位用户甚至直言:“ChatGPT已经完全无法使用了,今天我在等待答案的同时居然煮了咖啡。”

与变懒的GPT-4相比,OpenAI对外正在讲述更多的“既要又要”的商业化故事,加速变现。

一是在ChatGPT这一对话式产品上,一面寻找更多的个人用户,如几天前开放免登录使用,争抢更多的流量和数据。

另一面则是面向企业端的商业化前景。ChatGPT首席运营官Brad Lightcap就在近期透露,已有60万用户正在使用ChatGPT的企业级产品(包括ChatGPT  Enterprise和ChatGPT Team)。Brad Lightcap称,92%的财富500强公司正在以某种形式使用ChatGPT,每周有1亿人积极使用ChatGPT。

二是围绕硬件、算力和全球化上的布局。

对OpenAI来说,“既要又要”是某种必然,“模型变懒”也是其加速变现和跑马圈地所带来的直接结果。只不过,对Sam Altman和他的OpenAI来说,至少在拿出GPT-5前,需要解决的问题和麻烦还有很多。

一、GPT-4又又又变懒了

“我曾经是一名OpenAI的布道者,总是告诉大家GPT有多棒以及该如何使用它。但现在我不再推荐它,因为它已经变得很难有效使用。”一位用户近期在OpenAI在线论坛上这样写道。 

一些忠实用户选择放弃使用GPT-4 图源:OpenAI论坛 

今年3月中旬,在一篇名为《How to deal with “lazy” GPT-4》的帖子下挤满了OpenAI变懒的“受害者们”。他们发现在使用ChatGPT的过程中,响应速度越来越慢,且回答问题的准确性也不及预期。 

一部分个人使用者对OpenAI产生不满 图源:OpenAI论坛 

有的人抱怨,GPT-4没有遵循他们给出的指令,当用户需要它给出完整的代码时,GPT-4会给出带有占位符(placeholders)的截断代码。当要求它给出用于更新代码的示例时,也更容易出错。

有的人则发现,ChatGPT的废话也越来越多,在被问及它的“来源”、它的背景以及它如何产生答案时,GPT-4现在变得更加难以捉摸。

还有的用户更是直接吐槽起了它的响应速度:“今天我在等待答案的同时居然煮了咖啡。”

开发者抱怨GPT-4变懒 图源:OpenAI论坛 

事实上,这并不是ChatGPT第一次变懒。

早在去年7月,很多用户就在社交媒体和OpenAI开发者论坛里表达了自己的不满,变懒、变笨的GPT-4出现了逻辑弱化、错误响应、难以遵循指令、只记住最近的提示等问题。今年年初,更多的投诉下,Sam Altman直接承认了GPT-4“一直在偷懒”这一事实,并表示自己“已经发布了修复程序来解决投诉”。 

Sam Altman承认GPT-4“偷懒”,图源:X 

眼下,这一轮的“变懒抱怨”似乎没有等来OpenAI的回复。社区之内的ChatGPT用户们正在讨论GPT-4变懒的原因以及自己寻找解决上述问题的方法。“它曾经很聪明,现在却是一个彻头彻尾的白痴”“我感觉自己被骗了”,社区内的愤怒情绪正在增加。 

对于“变懒”的原因,用户甚至猜测OpenAI是不是将背后的模型偷偷换成了GPT-3.5,还有的则认为OpenAI正在将更多的精力放在其“企业级客户”上,而非“平民”上。

用户的抱怨和吐槽GPT-4性能下降其实反向印证了两点,一是目前用户对GPT-4已积累下用户心智,他们迫切希望OpenAI推出新的产品。二是,这很有可能是OpenAI发布的GPT-5的重要时机,AI天使投资人Allie K. Miller就表示:“他们(OpenAI)有用户基础,有订阅,如果他们发现用户下降,或许将发布更新版本的模型,时机是关键。” 

二、用户寻找替代方案,OpenAI还有没有余粮?

对OpenAI来说,一个不太好的迹象是,随着GPT-4变懒,即便是它的忠实用户们,也开始寻找替代方案。

在上述抱怨OpenAI变懒的帖子下,不少用户就提到了至少在编码能力上,Anthropic的Claude Opus 3显得可靠,在实际使用的性能方面似乎也与GPT-4 不相上下。在截至3月29日的Chatbot Arena排行榜上,Claude Opus 3就打败了GPT-4,占据第一位置。 

截至3月29日,Claude Opus 3打败了GPT-4, 位列第一  图源: Hugging Face 

在过去人工智能的模型竞逐中,各类科技企业“追赶GPT-4”已成为共识,各类评测和跑分表中“与GPT-4对比”也成了铁律。而Chatbot Arena排行榜则来自用户实打实的投票,在用户体验端Claude Opus 3暂时跑赢GPT-4,也说明了至少在个人用户眼中,OpenAI所谓的用户护城河并不牢固。 

榜单之上,除了老对手Anthropic的Claude、谷歌的Gemini外,被称为“法国OpenAI”,主打MoE架构的Mistral AI 的名字也赫然在列。此前Mistral-Medium这一“中杯版”模型就因开源和强大性能十分受开发者的拥趸,而此前在2月底发布的“大杯版”Mistral Large更是直奔着OpenAI的GPT-4去,顺便还官宣了和微软的闭源合作。 

前有狼后有虎,何时发布GPT-5也还未有定论,OpenAI手中余粮又还有多少?

OpenAI和Sam Altman自然也没有闲着,刚刚结束的2024年Q1,这家全球最火热的人工智能初创企业的日程表上写了三件事:一是寻找AI的下一个入口,二是更大的算力野心,三是全球化之路。

首先,寻找AI的下一个入口,也就是OpenAI野心勃勃的硬件计划。 除了此前出圈的人形机器人Figure 01外,据外媒最新报道,Sam Altman正计划和前苹果设计师Jony Ive创立的一家神秘公司,推出一款人工智能驱动的个人设备,更早前,Altman领投了AI硬件初创企业Humane,OpenAI也在讨论将其名为GPT-4 with Vision的物体识别软件嵌入到Snapchat母公司Spectacles的智能眼镜中。 

其次,是更大的算力计划。Altman此前在公开场合多次表明算力是掣肘模型进化的原因,AI服务器芯片数量严重不足。为了寻求更稳定的芯片供应,除了自己下场投资GPU芯片公司和成立芯片公司外,OpenAI和“最铁的盟友”微软被曝出计划砸1000亿美元建造名为“星际之门”的AI超级计算机。 

不过,在硬件和芯片计划外,过去一年之中,OpenAI也还在下一盘全球化的棋局。

今年1月,Altman开启自己的韩国之旅,与韩国芯片巨头三星、SK探讨合作的可能。近期,Altman还前往日本与日本首相岸田文雄会面,并表示OpenAI正在考虑将日本作为其亚洲首个办事处。奥尔特曼在东京对当地记者表示:“看到这项技术在日本得到采用真是令人惊奇。”据“硅基研究室”不完全统计,除日本外,OpenAI目前在伦敦和都柏林分别设立了国际办事处。

三、更大的野心面前,有更棘手的新麻烦

不过,在GPT-5以及种种野心计划外,摆在OpenAI眼前的,还有诸多需要解决的新麻烦。 

如上文提到的“模型变懒”,OpenAI究竟是继续缝缝补补旧模型,还是提早放出GPT-5的大招,还尚未确定。

另一个新麻烦则是数据问题。 视频巨头YouTube就在近期开战OpenAI,其表示,如果OpenAI在未经许可的情况下使用其视频来开发文生视频模型Sora,将违反YouTube的规则。OpenAI首席技术官Mira Murati在接受采访时表示,她不知道Sora是否接受过YouTube视频训练,公司也没有透露数据来自哪里。 

《纽约时报》在近期的一则报道中,揭开了OpenAI上述数据的来源。时间拨回2021年底,OpenAI需要更多的数据,为此研究人员创建了一款名为Whisper的语音识别工具,该工具可以转录YouTube视频中的音频,生成新的对话文本,尽管一些的OpenAI员工讨论了此举可能违反YouTube的规则,但最终还是转录了超过100万小时的YouTube视频。OpenAI并未立即回应上述媒体的评论。 

大算力与大数据的Scaling Law奠定了OpenAI所有工作的基础。但如今,数据的获取与使用问题是包括OpenAI在内的人工智能企业必须要面临的问题,这涉及两个层面,一是商业层大公司间的竞争,更优质的用户数据决定模型的性能。二是社会层的用户隐私问题,这些科技公司必须要为用户隐私的安全性负责。 

数据问题外,不可忽视的还有人们对科技公司情绪的变化。据《The Information》数据,当前人工智能初创企业估值可能正在从峰值回落,回归现实。 初创公司市盈率的下降反映出人们对人工智能初创公司前景并没有想象中那么乐观。更多投资者想要知道的是,随着业务边界的拓展,当这些初创企业拿到更多的钱时,除了如何花钱外,它们如何赚钱,如何应对更激烈的竞争,这些问题显得更为重要。 

对OpenAI来说,他们或许更需要回应GPT-4变懒的问题,更好的产品体验依旧是核心护城河。正如论坛内一位用户所言:“如果有更好的产品,我会像在燃烧的船上一样跳船。”OpenAI在造一艘更大的船,但它的用户此刻可能正在选择离开。 

参考资料: 

1. Business Insider:Uh-oh — it looks like ChatGPT’s AI model got lazy again 

2. The Information:AI Valuations May Be Coming Down to Earth; A Glimpse of OpenAI’s Search Engine 

3. The New York Times:How Tech Giants Cut Corners to Harvest Data for A.I. 

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年4月8日 15:59
下一篇 2024年4月8日 16:59

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日