OpenAI谷歌苹果,再燃AI争霸战

起初,网友还以为,OpenAI部署WebRTC服务器可能是为了纯语音模式,而现在看来并非如此。

来源:indigo

昨天,OpenAI的视频生成研究科学家Will。

二、谷歌打擂台,或推出AI助手Pixie

在这个与OpenAI和微软对飙的关键时刻,谷歌明确表示,这场大会发布的内容都是关于AI的。

新一轮AI大战,即将拉开序幕!

下周一,OpenAI将开启线上直播,官宣GPT-4升级,甚至还有一个超级“AI助手”等着我们。

OpenAI“音频AGI研究负责人”Alexis Conneau已更换主页背景,并与奥特曼同频——下周我们将会见证Magic。

OpenAI研究科学家Bowen Cheng甚至表示,这可比GPT-5酷多了。

凡此种种,暗示着真正的“Her”即将登场。

顶着OpenAI的压力,谷歌将在第二天的I/O大会上公布模型新进展,据传还将发布一个名为“Pixie”个人数字助理,由Gemini加持。

紧接着,微软将在5月21日召开Build开发者大会,大概率会将OpenAI最新能力集成到自家产品线中,甚至可能会透露最新5000亿参数自研大模型MAI-1。

还有万众期待的苹果WWDC大会,将发布集成生成式AI能力的iOS 18系统,并把ChatGPT塞进iPhone之中。

一系列重磅发布,连番轰炸,简直不给其他公司喘气的机会。

有网友问道,“苹果是在放弃自己的‘AJAX’人工智能系统,全力与OpenAI公司合作?还是直到他们的AI能力赶上之前,OpenAI只是权宜之计”?

苹果内幕人Gurman总结了苹果的人工智能战略:

  • 设备端LLM(自研)

  • 云端LLM(自研)

  • 聊天机器人(可能是OpenAI,也可能是谷歌)

苹果不打算自己开发聊天机器人,但意识到市场对此有需求,因此会从外部获取这项技术。这一策略与其在搜索领域的做法相似。

显然,现在的局面是,OpenAI与微软,甚至与苹果通过AI合作捆绑在一起,只剩下谷歌自己单打独斗。

不知,这波AI争霸之战,谁胜谁负?

一、ChatGPT可以通话,周一直播再爆料

目前全网的焦点,还是在OpenAI。“他们将会发布什么”,这一话题热度只增不减,鲜有人讨论谷歌I/O大会。

关于周一的发布预测,网友Ananay又有了一个新发现:

ChatGPT或将具备通话能力。

其实,从如下代码的打电话、拒接等关键词中,就可以看出这一功能。

另外,OpenAI已经部署了webRTC服务器来实现这一功能,这些服务器在最近也完成了配置。

起初,网友还以为,OpenAI部署WebRTC服务器可能是为了纯语音模式,而现在看来并非如此。

因为这个功能是由Livekit提供的(这是一个可以提供实时音视频通信的解决方案)

有网友评论道,这是不是意味着ChatGPT能够主动给我打电话,而不需要我先发起呼叫?

他提出这一问题,是因为在电影Her中,人工智能助手Samantha主动给男主人公打了电话,告知了他一些事情。

想象一下,ChatGPT助手主动给你打电话,提醒或查看你的用户习惯,这将是多么神奇的一件事。

不过,Ananay表示,这需要用户自己选择允许这一功能。

Hallid.ai的联合创始人Indigo也做了一个全面的预测/趋势猜想。

根据indigo的介绍,GPT-4的新版应该会按照参数规模的不同分化成多个版本。

昨天,就有网友猜测,可能会发布gpt4-lite、gpt4-auto、gpt4-lite-auto等版本。

而几天前出现在LMSYS竞技场上的gpt2-chatbot,可能是轻量级的GPT-4新版。而且,这意味着GPT-3.5的使命要结束了,最新的轻量版本可能会供用户免费使用,同时,API的价格也会大降。

至于奥特曼所说的“魔法”,可能就是升级后的GPT-4——gpt4-auto,其具备自主执行Agent任务的能力,记忆更强,规划能力更强。

当然,“AI助手”也会将Her带入现实。

来源:indigo

昨天,OpenAI的视频生成研究科学家Will Depue发了一张奇点降临的logo,或许又在暗示着什么。

二、谷歌打擂台,或推出AI助手Pixie

在这个与OpenAI和微软对飙的关键时刻,谷歌明确表示,这场大会发布的内容都是关于AI的。

根据谷歌官网,本年度的I/O大会将在美东时间5月14日下午1点召开。

据猜测,谷歌将在搜索引擎中融合生成式AI,让用户可以进行对话式搜索。

此外,谷歌也一直在测试新的搜索功能,比如针对英语学习者的AI对话练习,以及在购物时生成虚拟试穿图像等。

不仅仅是搜索引擎,更多的谷歌应用也会更深入地集成AI功能,比如在Google Maps中帮用户找到合适的餐厅、购物中心和电动汽车充电站。

打客服电话时转接太久怎么办?

谷歌测试的AI新功能甚至可以帮你自动等待转接,直到有人接听再来通知你。

除了各种应用,操作系统也不能落下。

上个月Android 15的开发者预览已经发布,谷歌将在I/O大会上进一步介绍其中的新功能,可能会加入更深度的Gemini集成。

目前在安卓系统中,生成式AI的功能主要由Gemini Nano驱动,用在各种软件功能中。

比如Magice Compose可以在Google Messages等应用程序中提供回复建议,Cinematic Wallpaper利用机器学习帮助用户定制屏幕壁纸。

可以想象一下,有AI进一步参与的安卓会带来哪些更个性化的用户体验,比如更智能的手机主屏幕、锁屏界面和通知栏?

去年的I/O大会上我们看到了与ChatGPT竞争的大语言模型Gemini,今年是否会有新的模型出现呢?

除了Gemini的新版本,或许也可以期待一下谷歌推出的图像和视频大模型。

Reddit上有网友爆料,称谷歌存货中有3个模型已经在测试但还未向公众发布,估计会在2024年的I/O大会上亮相。

这三个模型分别是图像生成模型Imagen 3,以及两个可以对图像进行优化、补全的模型Juno和Miro。

据说,Miro还会有视频生成的功能。

此外,谷歌可能会在今年I/O上发布新版本的AI助手“Pixie”,或许可以取代原有的同类产品Google Assistant。

Pixie由语言模型Gemini驱动,安装在谷歌自己开发的硬件设备Pixel上,对其他第三方设备是否开放我们尚未可知。

但本次I/O大会上我们应该不会看到更新版本的Pixel产品,谷歌已经在近期发布了新版本Pixel 8a,而且已经开放给用户预定购买。

预计Pixel 9与折叠款Pixel 9 Pro Fold将在今年秋季发布。


三、苹果紧抓救命稻草


与此同时,面对OpenAI和谷歌来势汹汹的AI语音助手冲击,网友们向苹果喊话:留给苹果的时间不多了!

虽然已有消息称OpenAI与苹果即将敲定一项合作协议,让ChatGPT能够装进iPhone中,并为今年的iOS系统提供全新的生成式AI能力。

但苹果并不准备放弃自家的Siri。

近日,纽约时代报道,苹果将对Siri进行升级重组,以应对其他聊天机器人竞争对手。

而这一决定早已做下。

2023年年初,苹果高管Craig Federighi和John Giannandrea花费数周时间测试了风头一时无两的OpenAI新聊天机器人ChatGPT后,就深感危机。

他们认为生成式人工智能的出现让Siri显得过时、落后。

于2011年推出的Siri作为苹果每部iPhone中最初的虚拟助手,一直以来都仅限于满足个人请求,不能跟上用户发起的对话。

例如,有人先询问了旧金山的天气然后说:“纽约怎么样?”时,Siri经常会误解用户的提问。

但ChatGPT知道用户想要的是后一个问题的回答。

在意识到新技术已经超越Siri之后,这家科技巨头发起了十多年来最重大的重组。

苹果公司决心在科技行业的人工智能竞赛中迎头赶上,它将生成式人工智能作为公司内部的特殊标杆项目,围绕着十年一遇的计划来组织员工。

1. Siri超进化

据苹果的三名内部人士透露,苹果将于今年6月10日的年度开发者大会上发布改进后的Siri。

新版本中的基础技术包含新的生成式人工智能,将允许Siri与用户进行聊天,而不是一次回答一个问题。并且使Siri的对话性更强、用途更广。

Siri的更新是苹果公司在全面拥抱生成式AI领域处于领先地位的举措之一。

为了支持其新的Siri功能,苹果还在今年的iPhone中增加了内存。

此外,苹果还讨论了与包括Google、Cohere和OpenAI 在内的几家公司合作,以获得支持聊天机器人的AI模型使用权的可能性。

另一方面,苹果的高管也在担心新兴的AI技术将作为未来主要的操作系统取代iOS,威胁苹果在全球智能手机市场的主导地位。

并且,这项新技术还可能促成一个以AI应用(AI智能体)为核心的生态系统。

这可能会削弱苹果App Store的收益,该商店每年的销售额约为240亿美元。

但苹果更担心的是,如果不能开发出自己的AI系统,iPhone可能将在与其他先进技术的比较中变成“哑巴手机”,失去市场。

iPhone目前占据了全球智能手机利润的85%份额,并创造了超过2000亿美元的销售额。

可以预想这个损失是不可估量的,也是苹果不能接受的。

在这种紧迫感的驱使下,苹果取消了另一项重大的投资:一个耗资100亿美元的自动驾驶汽车项目,并调派数百名工程师转向AI的开发工作。

并且,苹果还将延续一贯的设备流程工具上的一致性,探索创建由iPhone和Mac处理器驱动的服务器。

内部人士爆料称,苹果对Siri的升级并不在于让它与ChatGPT竞争诗歌创作等内容生成的部分,而是让Siri专注于处理它原本负责的任务:设置闹钟、创建日历备忘提醒、添加购物清单中的物品,以及总结短信内容等。

苹果计划宣称,升级后的Siri将比竞对公司的人工智能提供更加私密的服务,成本也更划算。

这是因为Siri是在iPhone上处理请求,可以避免数据在云端出现泄露以及云计算的成本。

但是,苹果公司也面临着安装在iPhone上的小型人工智能系统的风险:研究发现,较小的人工智能系统可能比较大的系统更容易出现幻觉。

Siri联合创始人Tom Gruber表示:

“Siri的目标始终是创建一个能理解语言和上下文的对话界面,但这是个难题。随着技术的变革,我们应该能做得更好。只要不试图用同一种方法解决所有问题,就能避免很多困难。”

苹果在人工智能领域拥有多项优势,包括在全球拥有超过20亿台在使用的设备,领先的半导体团队等。

它们能够支持苹果推广AI产品,并支持包括面部识别在内需要大量芯片的AI任务。

2. 一个月时间,苹果能否扭转局势

但在过去的十年里,苹果从未制定出一个全面的人工智能战略,Siri自推出以来也没有大的升级改进。

同时,作为语音助手的局限性也减弱了公司智能音箱HomePod的吸引力,因为它无法稳定完成一些简单的任务,比如响应歌曲播放请求。

曾在Siri团队工作两年后,创立了生成式人工智能平台Brighten.ai的John Burkey表示:

“Siri团队自创立以来,未能获得过与苹果内其他团队同等的关注和资源。而苹果的不同部门往往各自独立,信息共享有限。但事实是,AI需要被整合到产品中,才能取得成功。”

另外,苹果在招募和留住领先人工智能人才方面也有着相当的阻力。

由于苹果的保密性,其研究成果很少会被拿来发表论文、参加会议,这对于科学家来说,几乎是不可忍受的弊端。

最近几个月来,苹果略微调整了一贯的战略,增加了人工智能论文发表的数量,但业内的研究人员仍质疑论文的质量,认为它们是苹果的营销炒作手段。

但对一些初出茅庐且野心勃勃的研究人员来说,能够加入其中,成为项目的领导成员,是他们选择苹果的重要原因。

尽管苹果已调整了发展战略,并吸收了不少新鲜血液。但在这场声势浩大、令人眼花缭乱的AI语音助手之战中,苹果能否在6月的开发者大会上逆转劣势尚未可知。

未来的AI语音助手形态如何,又会怎样影响我们的生活?这个问题的答案正在不断接近我们。

参考资料:

https://x.com/ai_for_success/status/1789364452640563709

https://www.theverge.com/2024/5/11/24154219/google-i-o-2024-what-to-expect-where-watch-livestream-ai-android-search-gemini

https://www.nytimes.com/2024/05/10/business/apple-siri-ai-chatgpt.html


本文来自微信公众号:新智元 (ID:AI_era),作者:新智元

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年5月12日
Next 2024年5月12日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日