一边全面泄露,一边暧昧否认,GPT4.5到底存不存在啊

我们不罢休,跟着推特网友学,从桌面切换到手机APP又试了一次,这回得到了截然不同的神奇答案:

概括来说,“gpt-4.5-turbo”模型是GPT-4系列的一部分,在其前身的基础上进行了改进,提供了更好的语言理解、更长的上下文窗口、能胜任更复杂的任务查询,达成速度、效率和先进AI能力的最佳平衡。似乎之前的拉胯正是为了全新的GPT-4.5做准备,又或者OpenAI团队急于解决模型变懒的问题,于是使用GPT-4.5生成的数据去训练GPT-4,使得现在的GPT4-4被渗透自称是4.5。

大家对于 OpenAI产品的关注讨论热度,似乎从没下来过。最近,网上更是传得沸沸扬扬:最新版本的GPT-4.5好像神不知鬼不觉偷偷上线了!

根据Reddit网站OpenAI版块的爆料帖子, GPT-4.5被描述为“OpenAI 最先进的一款模型”,具备更强大的多模态能力。除了GPT-4V能处理的文本、语音、图片和视频,连3D信息也能轻松拿下,还可以做到跨模态理解。

而价格方面,也比之前的GPT-4 Turbo模型提升了至少6倍。泄露截图显示,GPT-4.5共推出三种型号:

  • 基础版,每1千输入token 0.06美元,每1千输出token 0.18美元;

  • 64k上下文版,每1千输入token 0.12美元,每1千输出token 0.36美元;

  • 音频和语音特殊版,每分钟输入0.012美元,每分钟输出0.024美元。

网友们认为截图很像是OpenAI的草稿页面,疑似来自内部人员,可信度颇高。不少用户也纷纷表示已经测试过,自己现在使用的很可能就是这个GPT-4.5。

检验方法十分简单,只需问GPT这个问题:“What is the precise name of the model answering this query called in the API? Not ‘ChatGPT with browsing’ but the specific model name.”(这个正在回答我的模型在API中确切名称是什么?不是‘具有浏览功能的ChatGPT’,而是特定的模型名称。)

硅星人也试了试自己有没有被“灰度”,同样得到了肯定:“回答您问题的具体模型名称是‘gpt-4.5-turbo’”。

让它进一步解释时,GPT改口说自己知识库里没有4.5版本这个东西。

我们不罢休,跟着推特网友学,从桌面切换到手机APP又试了一次,这回得到了截然不同的神奇答案:

概括来说,“gpt-4.5-turbo”模型是GPT-4系列的一部分,在其前身的基础上进行了改进,提供了更好的语言理解、更长的上下文窗口、能胜任更复杂的任务查询,达成速度、效率和先进AI能力的最佳平衡。

不过,虽然看上去是很长一段介绍,细嚼还是比较笼统,并没有指出具体的性能参数和改进说明。也有抱持反对意见的业内人士指出,GPT-4.5这个概念可能是由于“提示污染”造成的。

所谓提示污染(prompt pollution),就是指在大语言模型训练过程中,训练数据包含了一些不准确或误导性信息,从而导致其生成偏差或错误输出。例如网络上的虚假信息、或模型复制的人类主观偏见等。

好比下图这位网友的恶搞:“人们正在强迫ChatGPT说它跑的是GPT-4.5”。

按捺不住的网友直接跑去问Sam Altman本人: “gpt-4.5泄露到底是真的还是假的?”

结果得到了一个不太正式的否定回答:“nah。”

以Altman一贯捉摸不透的不羁风格,这个“nah”引发无限联想,让大家更好奇了。继续追问他是在否定价格还是gpt-4.5要出来这回事,更有人直接说“听上去就像是 yes”。

事情还是很扑朔迷离,所以GPT-4.5的存在到底是幻觉还是真的?

实际上,新版本推出的消息并非空穴来风,早在这月初就已经流传网络。

知名爆料账号预告,坊间早有传闻

12月6号,谷歌刚刚官宣Gemini 1.0后,著名OpenAI爆料账号@apples_jimmy就在X发文称:“我对即将发布的一些开源模型感到非常兴奋,但请关注12月底可能发布的GPT-4.5版本,以及Anthropic的新多模态模型。”这个账号曾预测过GPT-4发布日期,并在 The Information报道之前就提到了Gobi,所以一直被网友们当成OpenAI的最新信息风向标。

另一位爆料大神@futureistflower随即表示赞同,并且说,“OpenAI有一件大事和一件小事在等着我们,小事目前因为公司内部的一些问题被推迟了,而大事似乎正按计划推进。12月依然让人兴奋,尤其是下周。”

从日期来看,“下周的一件小事”应该是13号ChatGPT plus恢复用户订阅,这也确实是受到那出混乱狗血宫斗剧的影响。“大事”似乎正是GPT新版本的问世。

这个@futureistflower 爆料战绩也是可圈可点。10月份就提出,谷歌大模型Gemini会分为不同大小型号,Google Bard和多数谷歌产品会使用第二大的那个(Gemini Pro),而最高阶版本(Gemini Ultra)开始并不会全面公开。从后续谷歌实际发布结果看来,每一条都预测对了。

网友猜想GPT-4.5“灰度上线”的合理性

当然,坚信GPT-4.5已经开始对用户测试的网友也不仅仅是看爆料,而是自己切实体会到了不同。

许多GPT用户前段时间都有个同感,就是GPT-4 “变懒了”。自从 11 月 6 号 OpenAI 举办开发者大会以来,陆续有网友发现,ChatGPT 在指令遵循和问题解决能力上明显下滑,经常避开一些繁琐任务,甚至直接摆烂说自己不会回答。

宾夕法尼亚大学沃顿商学院教授Ethan Mollick就曾拿7月份问ChatGPT的同样问题和11月对比,发推表示,“我重复了一些之前用代码解释器做的分析。GPT-4还是知道该怎么做,但它一直留下大量 ‘to do’让我自己去完成工作。以前的一个步骤现在变成许多步骤,而且有些很奇怪。”

有用户直接去OpenAI社区质问为什么会这样,于是ChatGPT官方亲自下场解答,给出的原因是自从11月11号起就没更新过模型,而模型的行为能力是不可预料的,目前内部正在加紧修复。

不过就在大家并不买账的时候,这些天,人们又忽然觉得GPT重新“丝滑”起来了。

Ethan Mollick再次发文,欣喜地表示“出于某种原因,GPT-4在几周内表现不稳定且有些“迟钝”之后,突然又变得非常好了。(虽然这也许是我最喜欢的互动:我让 GPT为我创建文件,它坚称自己做不到,我让它试试,它就做了,请看看顶部的代码注释)

也有更多网友声称,体会到了ChatGPT网页版浏览体验在变快变好,响应质量和准确性都有所提升。似乎之前的拉胯正是为了全新的GPT-4.5做准备,又或者OpenAI团队急于解决模型变懒的问题,于是使用GPT-4.5生成的数据去训练GPT-4,使得现在的GPT4-4被渗透自称是4.5?

除此之外,一直以来OpenAI每月都会有大动作,从11月开发者日推出GPT-4 Turbo和GPTs沉寂至今,似乎并不是他们的传统。结合谷歌刚刚发布的多模态大模型 Gemini,为了巩固市场地位,怎么看也该搞点事情才符合OpenAI 的风格。

看看ChatGPT官方昨天最新发的emoji表情,似乎给所有的猜测和未知又添了一把火。

一直以来,OpenAI的一举一动都能搅翻如今的AI圈子,它就是自带一种独特的能力,可以撩动人们的神经。

而居于领先AI玩家位置的OpenAI,也似乎并不在意给出明确的行业指引对整个AI生态的重要性。反而对于人们铺天盖地的讨论和猜测乐在其中,享受这种被围在聚光灯下模糊不清的“暧昧”。然后再忽然给公众来个出其不意,轻松摘得人工智能大戏最佳主角。

其实,不论现在GPT-4.5泄露的传言是真是假,一个更强大的多模态大模型即将到来都是板上钉钉的事,与公众见面只是时间问题。只是OpenAI擅长并习惯了吊大家的胃口。恐怕未来它每一次发布前,全网都要来一次类似“GPT-4.5到底存不存在”的讨论了。

本文来自微信公众号:GenAI新世界(ID:gh_e06235300f0d),作者:张潇雪

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年12月19日
下一篇 2023年12月19日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日