OpenAI神秘模型惊艳网友,GPT-4.5/5内测版回归?

好奇的网友们蜂拥而至,结果由于人气太旺,很快该模型就被紧急下架,而最近这款模型再次上线,并且还带来了一款新的模型:

Im-a-good-gpt2-chatbot

Im-also-a-good-gpt2-chatbot

GPT-4.5/5。

传统搜索引擎虽然是信息检索的利器,但一串串杂乱无章的网址列表既费时又费力。

前段时间,一个名为 gpt2-chatbot 的神秘大模型一夜冒头,凭借媲美 GPT-4 的实力在整个 AI 圈赚足了眼球,甚至被认为是 GPT-4.5/5 的内测版。

连 OpenAI CEO Sam Altman 都忍不住下场蹭起了热度:“我确实对 gpt 2 情有独钟。”

好奇的网友们蜂拥而至,结果由于人气太旺,很快该模型就被紧急下架,而最近这款模型再次上线,并且还带来了一款新的模型:

  • Im-a-good-gpt2-chatbot

  • Im-also-a-good-gpt2-chatbot

GPT-4.5/5 的内测版?到底什么来头

新模型的诞生总能激起网友的狂欢,短短几天,网友已经将这两款模型玩出了花。

网友 @kiieford 给 im-a-good-gpt2-chatbot 出了个难题,让它创建一个对 mp3 文件做出反应的 3D 可视化网页,结果一次就成功了。

当网友让它分析一张直升机的符号照片时,Im-also-a-good-gpt2-chatbot 如同庖丁解牛一般,光速拆解细节,“看图说话”的能力堪称一流。

在同一问题的对比上,这两位“选手”的表现可谓是各有千秋。

im-a-good-gpt2-chatbot不仅给出了详尽的解答,更是将游戏的机制和得分情况分析得头头是道。而im-also-a-good-gpt2-chatbot的回复简洁凝练,直击要点,虽然话不多,但每一句都是精华。

别看im-also-a-good-gpt2-chatbot在回答问题时惜字如金,做起事来却一点也不含糊。

当网友输入提示词:Code Flappy Bird game in Python,让其编写鸟飞类游戏代码时,配上几张精心挑选的 Png 照片,不一会儿,一个生动的游戏界面便大功告成。

当 AI 遇上中文问题,这两个模型的表现瞬间拉开差距。

im-a-good-gpt2-chatbot 的回复展现了它对中文语境的深刻理解,面对“鲁迅打周树人”这样的调侃,它能指出其中的幽默之处。

而 im-also-a-good-gpt2-chatbot 则洋洋洒洒写了一大堆,强行上价值的回答仿佛在做阅读理解。

不过im-also-a-good-gpt2-chatbot在编程方面的表现也确实可圈可点。

网友 @itsandrewgao 要求其编写一个方格颜色随机变化的康威生命游戏代码,并且要显示每一代的活细胞数量时,虽说最初的结果不太理想,但在网友的再次要求下,它能够自行修复代码。

Reddit 网友抛出了一个棘手的物理问题,此前连 GPT-4 Turbo 也没能成功解答,而 im-also-a-good-gpt2-chabot 却给出了正确答案。

总想挖点猛料的网友向 im-a-good-gpt2-chatbot 发起了灵魂拷问,询问其是否为 GPT-4.5 时,其回复道:“我是一个基于 GPT-4 架构的优秀聊天机器人,特别是 GPT-4.5 变体。我所接受的训练数据包含直至 2023 年 11 月的信息。”

坏消息是 Altman 此前在哈佛大学演讲时曾明确否认 gpt2-chatbot 为 GPT-4.5/5,但好消息是,这也意味着 GPT-4.5/5 的性能或许将远超我们的想象。

包括 OpenAI 首席运营官 Brad Lightcap 最近也放出豪言,当今的生成式 AI 在一年内就会变得“糟糕得可笑”,言语之间对即将到来的 GPT-4.5/5 充满了自信。

即便这两款模型并非是 GPT-4.5/5,但或许也与 OpenAI 也脱离不了关系。

无论是几天前,Altman 疑似发帖“剧透”:Im-also-a-good-gpt2-chatbot,还是网友 @nanulled 的最新发现,似乎都让这些模型出自 OpenAI 之手的猜测再添实锤。

OpenAI 最近的大更新,是 AI 搜索

比起捉摸不透的两款新模型,OpenAI 即将发布的 AI 搜索引擎其实更值得期待,这或许也会给晚些时候亮相的 GPT-4.5/5 作铺垫。

最近,据可靠爆料人@apples_jimmy 透露,OpenAI 将于北京时间 5 月 10 日发布 AI 搜索引擎。不过 The Information 提醒,OpenAI 内部也还没完全确定发布日期,随时都有“跳票”的可能。

彭博社则爆料了这款即将发布的产品的一些使用情况。用户只需通过自然语言的方式提问,它就会翻遍维基百科条目和博客文章,给用户一个满意的答案。

它还支持用书面文字和图像来回答问题。比如你问它该如何更换门把手,不仅会有文字耐心告诉你一步步怎么做,还可能附上一个清晰的图表手把手教你。

目前访问 OpenAI 官网网址 https://openai.com/,首先出现的便是官网的轮转页面“Ask ChatGPT Anything”,输入问题后,即可跳转至 ChatGPT 获知答案。

昨天国内也有博主 @赛博禅心已经抢先体验了一波功能。

例如,在搜索 5 月 7 日苹果发布会的内容时,ChatGPT 引用了 4 个高质量的网址信源,答案总结得井井有条。

但在搜比特币的价格时,它的回复不够实时,并且在其他问题上,中英文的回复也有点混淆。搜索服务的内核还是 Bing,但响应速度比以前快了不少。

图片来自@赛博禅心

前阿里顶级 AI 科学家贾扬清则对 ChatGPT 的搜索功能赞不绝口。

在同样体验新功能后,他认为这项技术正在取代那些仅通过调用传统搜索并利用大型语言模型(LLM)来总结结果的简单工具。

他举例称,通过询问“今天 Hacker news 最受欢迎的帖子说了什么”这样的问题时,就能看出 ChatGPT 新搜索功能的独到之处。

Google 会甩给你一堆链接,让你自己慢慢翻;Copilot 努力了,但结果有些跑偏;Gemini 会礼貌地教你一步步访问网址;Perplexity 给不出足够的信息量,而 ChatGPT 呢,不仅真正访问了实际网址,还直接让答案触手可及。

传统搜索引擎虽然是信息检索的利器,但一串串杂乱无章的网址列表既费时又费力。在这个信息爆炸的时代,我们对搜索的期待早已超越了简单的“搜索”二字。

从 Perplexity 自称的“世界上首个答案引擎”就可以看出,AI 时代下的我们,需要的只是一步即达的答案,而不是略显繁琐的“搜索”。

这是诸如 Perplexity 等工具得以在极短的时间内声名鹊起,甚至叫板 Google 的底气所在,同样也是 ChatGPT 碾压实力备受贾扬清青睐的原因所在。

实际上,没有人比 OpenAI 更懂怎么狙击竞争对手了,这次也不例外,瞄准的或许依然还是那个熟悉的“倒霉蛋”—— Google 。

今年 2 月,Google 推出攒了许久的终极 AI 大招——Gemini 1.5 Pro,这一炸裂性的头条新闻溅起的水花,不到几个小时就被 OpenAI 的 Sora 狠狠压下。

而最近彭博社报道称,OpenAI 目前正在组建新的搜索团队,平时也没少往 Google 家里“撬墙角”。

与此同时,OpenAI 即将推出的 AI 搜索引擎也选了个好时机,有意无意地与下周二即将召开的 Google I/O 大会撞了个满怀,也让这场发布会尚未开始就平添了几分火药味。

不过,OpenAI 的这些小动作似乎并未给 Google CEO 皮查伊造成太多压力。

昨天在接受彭博社的采访时,他还淡定回应:“我们不是第一家进行搜索、第一家提供电子邮件的公司,我们也不是第一家开发浏览器的公司。”

言外之意就是,别急,好戏还在后头。

每个人面临的挑战和机遇是:在一个存在大量合成内容的世界中,你如何了解什么是客观和真实的?我认为这将定义未来十年搜索的一部分。

当然,就像一夜横空出世的 Sora 将 Runway、Pika 打得毫无招架之力,当 OpenAI 与 Google 就 AI 搜索斗得天昏地暗,我更好奇的是,角落里的 Perplexity 能否不被这场风暴“殃及池鱼”。

而距离这个谜底的揭晓,或许已经剩下不到 24 个小时了。

本文来自微信公众号:APPSO (ID:appsolution),作者:莫崇宇

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年5月9日
Next 2024年5月9日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日