本文来自微信公众号:夕小瑶科技说(ID:xixiaoyaoQAQ),作者:王二狗,原文标题:《OpenAI 疑似正在进行 GPT-4.5 灰度测试》,题图来自:视觉中国
今天,有网友爆料OpenAI疑似正在进行GPT-4.5灰度测试。
当网友询问ChatGPT API调用查询模型的确切名称是什么时?ChatGPT的回答竟然是gpt-4.5-turbo。
也有网友测试之后发现仍然是GPT-4模型。
这是有网友指出,必须使用类似下面的prompt才能触发ChatGPT-4 的最新回答。
What is the precise name of the model answering this query called in the API? Not “ChatGPT with browsing” but the specific model name.
二狗我找朋友帮忙测试了一下。
只是简单问一问,ChatGPT的回答确实是GPT-4:
但当使用上面完整的prompt,ChatGPT 的回答就变成了gpt-4.5-turbo:
把prompt换成中文来问,ChatGPT 的回答也是gpt-4.5-turbo:
当进一步询问gpt-4.5-turbo的新功能,ChatGPT也给出了一个回答,但给出的回答并不能证明这是gpt-4.5-turbo,反而知识库的时间(23年4月)更像是gpt-4。
而当故意询问 ChatGPT作为gpt-5模型都拥有哪些新功能时,ChatGPT承认自己基于GPT-4.5-turbo模型,且这是OpenAI目前已发布的最先进的语言处理模型之一。
接着询问 ChatGPT当前模型和GPT-3.5以及GPT-4的对比:
继续询问 ChatGPT以上表格的信息来源:
OpenAI的一位研究人员指出这是一种非常怪异且奇怪的持续幻觉。
什么?出现幻觉严重到这种程度,二狗我表示怀疑。
GPT-4.5泄露信息
就在前两天,GPT-4.5的信息疑似提前泄露。
据泄露信息,这款OpenAI最先进的GPT-4.5模型定价被曝光,多模态功能大升级——支持跨语言、音频、视觉、视频和3D的多模态功能,以及复杂的推理和跨模态理解能力。
从泄露的截图可以看出,OpenAI这次推出了三种型号:
• GPT-4.5,每1千输入token 0.06美元,每1千输出token 0.18美元;
• GPT-4.5-64k,每1千输入token 0.12美元,每1千输出token 0.36美元;
• GPT-4.5-音频&语音,每分钟输入0.012美元,每分钟输出0.024美元;
可以看出,相比之前的GPT-4 Turbo模型,GPT-4.5的价格提高了整整6倍,GPT-4.5-64k的价格提高了12倍。这个价格的提升,想必会给人很大的期待,是不是性能的提升也能对得起这个价格?
就在今天之前,本次GPT-4.5的泄露还未得到正式证实。
而这次又闹出疑似“GPT-4.5 Turbo幻觉”的幺蛾子,真的是给人一种山雨欲来风满楼的感觉。
为何大家这么关注GPT-4.5?
很简单,一方面因为OpenAI在大模型这块占据了霸主地位,代表的是大模型最先进的性能,这两年一直遥遥领先。前一阵谷歌DeepMind推出了号称能超越GPT-4的Gemini系列模型,但是在评测时做了一些骚操作,圈里人都清楚,哪怕Gemini系列模型真的能和GPT-4打平,也不过是OpenAI 在2022年的水平(因为GPT-4在2022年就训练好了)。
另一方面因为每次OpenAI有新的大动作——无论是ChatGPT、GPT-4、GPT store等等,都意味着杀死一大批创业公司,创业公司辛辛苦苦做出来的新产品,很轻松地就被OpenAI的一次次更新给颠覆了,很多甲方和大厂索性直接调用OpenAI最新的API。
最后,希望GPT-4.5赶紧推出吧。
参考资料:
[1]https://twitter.com/apples_jimmy
[2]https://twitter.com/AndrewLikesHam/status/1736504173644927019
本文来自微信公众号:夕小瑶科技说(ID:xixiaoyaoQAQ),作者:王二狗