上手实测GPT-4o:速度快到飞起,视频分析逊色

值得注意的是,免费用户每天使用GPT-4o的次数有限,超出限制后要么升级为付费用户,要么只能用GPT-3.5。

面对同样的要求,GPT-4却直接“罢工”:

最后,GPT-4o的视觉能力也挺惊艳。

网友们疯狂“调戏”GPT-4o

眼下,给GPT-4o疯狂“整活”的视频已经在社交媒体上发酵,相当一部分可以归为“饭碗不保”系列。

作为OpenAI有史以来最好的模型,GPT-4o究竟强在哪里?

你要知道,它是一个原生的多模态大模型,可以跨文本、音频和视频进行实时推理——能听、能说、能看、零延时、可打断,还会“看人脸色”。

更重要的是,它还免费。

赶紧薅一把,你会知道什么是真·科幻照进现实。

实测GPT-4o:速度飞快,视觉能力惊艳

打开ChatGPT官网,就会收到GPT-4o的试用邀请,点击“立即试用”即可进入对话页面。

如果没有收到邀请,可能是灰度测试阶段,稍等一会再重新进入。

然后,直接在下方的对话框中与其进行对话,系统会自动切换到4o版本。

值得注意的是,免费用户每天使用GPT-4o的次数有限,超出限制后要么升级为付费用户,要么只能用GPT-3.5。

Plus用户每月20美元,可享受高达5倍的消息上限。

许多AI公司正在将GPT-4o引入他们的界面。比如,Poe用户可以直接勾选GPT-4o服务。

我们简单薅了一把羊毛,还是被GPT-4o的效果惊到了。

首先,这个响应速度太爽了,快到飞起,问题刚输入,答案就哗啦哗啦出来了。

有网友发现制作单个html文件,仅需6秒;分析电子表格数据不到30秒……

其次,GPT-4o具备联网功能,可以搜集最新的新闻信息。

我们让它搜集2024年5月13日AI领域的新闻,它不仅对新闻进行了概括整理,还附上链接。

面对同样的要求,GPT-4却直接“罢工”:

最后,GPT-4o的视觉能力也挺惊艳。我们分别上传了樱桃和手写字迹的图片,让它辨认,全部回答正确。

网友发现,即使是1800年代的手写笔迹,也能出色地识别……了不起。

更离谱的是,GPT-4o还能生成板书图片,图中的板书简直跟人类写的没啥差别。要知道,对于大模型来说,“写字”可是一大难题。

贾樟柯纪录片《一直游到海水变蓝》的海报设计极具巧思,正着看是波涛汹涌的大海,正好扣题,倒过来则是连绵不绝的群山,又与片中核心思想相呼应。

我们就把这张海报“喂”给GPT-4o,还真别说,它回答的有板有眼,其中的深意均被get到。

不过,它的视频分析能力就逊色一些。

我们上传了一段7秒的《泰坦尼克号》经典片段,并让GPT-4o分析这个视频。

它迅速概括了该视频时长、每秒帧数以及分辨率等。不过,当问及这出自哪部电影以及画面中的男女主分别由谁扮演时,它“一问三不知”。


网友们疯狂“调戏”GPT-4o

眼下,给GPT-4o疯狂“整活”的视频已经在社交媒体上发酵,相当一部分可以归为“饭碗不保”系列。

当初ChatGPT刚上线,编辑们惊呼“完蛋,饭碗要砸”;GPTStore推出后,创业公司老板们大惊失色;年初时Sora只是放出了Demo视频,就让演员们人心惶惶……

如今GPT-4o一出,客服、家教、秘书、同声传译“岌岌可危”,就连导盲犬也要“下岗”。

1.“充当”导盲犬

GPT-4o现在可以实时查看和分析事物,可以帮助盲人描述当前环境,还能帮忙打车。唯一的bug是需要随时举着手机,要是能做成眼镜就更perfect了。

2.“充当”语音客服

给客服GPT-4o找茬儿?很难!哪怕是处女座!

一名叫Joe的小哥编了一个情景:ACMETelco寄的新iphone无法使用,他让一个GPT-4o充当客服,另一个充当他的助手,帮他处理这事。

助手小A先陈述了事情的经过,接着客服小B就开始“连环问”:

Joe是什么时候收到新iphone的?你能告诉我订单号码吗?设备有物理性损坏吗?Joe是想把iphone退回店里还是邮寄回去?你能告诉我Joe的邮件地址吗?你能帮他看一下我刚发的邮件吗?

最终,事情完美解决——AI客服对答如流,情绪稳定,找不出瑕疵。

3.“充当”家教老师

在一段广为传播的视频中,OpenAI邀请可汗学院的可汗和他儿子一起使用GPT-4o来辅导孩子做数学题。

期间,GPT-4o循循善诱,即使孩子回答错了,它仍耐心地进行指导和鼓励。帮助家长降低心梗几率的“人”有了,还要继续砸银子给家教吗?

4.“充当”会议秘书

大语言模型产品天生是个打工人的命,GPT-4o也不例外——当完了老师又被拉进了线上会议,跟一群“不正经”的员工们掰扯着经典的“猫狗大战”。

它不仅能充当会议秘书,总结会议内容,还能在领导cue时对答如流。

5.“充当”翻译

因为外语能力出色,GPT-4o还能充当同传,实时翻译,一如那条巴别鱼。

搞笑的是,GPT-4o还化身“中文老师”教一群老外学中文,不过水平“一瓶不满,半瓶咣当”,教出的学生个个自带口音,还夸人家“真是个语言天才”。

此外,GPT-4o还有一堆虚头巴脑的玩法,情绪价值直接拉满。

例如,凭借出色的语音合成能力,OpenAI总裁GregBrockman亮出了“拿手绝活”——让两个GPT-4o实时唠嗑。

下次开长途,如果将GPT-4o连接到汽车的语音功能,启动对聊模式,是不是就有人陪咱一路聊天了?

Greg甚至让他们即兴创作了一首歌曲,当然啦,唱功不咋地,旋律很“感人”。

下面这个视频中的小姐姐更“简单粗暴”。

直接让GPT-4o分饰两角——ChatGPT和O,其中ChatGPT声音低沉洪亮,像一把大提琴,而O则有着法国女高音般的激昂声音。

它们要以“五月十日的旧金山”这一主题来个男女二重唱,期间还各种刁难,例如加和声,节奏加快等,它通通能搞定。

GPT-4o还能自编自唱轻柔摇篮曲、唱生日歌,那调皮的语气活脱脱地就是个真人。

此外,朋友聚会可以请GPT-4o当裁判;出门面试,让GPT-4o当穿搭助理;讲冷笑话尴尬冷场,GPT-4o专业捧哏;心情不爽它闭着眼一顿猛夸……它还能化身“AI女友”,如果安在人形机器人上,《Her》就真的来了。

GPT-4o刚热了个身就遭到全网热捧,天知道后面还会整出什么石破天惊的玩法?

本文来自微信公众号:机器之能 (ID:almosthuman2017),作者:山茶花、Cardina

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年5月16日
Next 2024年5月16日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日