苹果搭载大模型的Siri,可能和你想的不太一样

大模型的进步速度正以周、甚至以天计数,苹果的迟到,究竟是再一次后发先至,还是在新时代掉队的开始。端大火的厂商,它们更知道手机大模型的操作习惯、使用场景、适配应用应该怎么做。大模型的监管和相关法规都有着不同的要求,合法合规的落地才是争夺市场和发展技术的前提,因此才催生出了“国内+国际”双管齐下的路线。的爆料,以目前的自研进度和技术成果,苹果的大模型还远达不到。大模型。系列,这是苹果在多模态大模型的最新研究成果。

苹果的 AI,虽迟但到。

根据华尔街日报消息,苹果正与百度商讨,关于国内市场的 iPhone 以及其他设备中整合生成式 AI 的业务。

尽管目前还没有得到官方的确认,不过有两件事至此可以确定:

  • iPhone 16、iOS 18 和 MacOS 将会搭载 AI 功能;

  • iPhone 上的大模型,在国内外将由不同的厂商提供。

比起早已搭载 AI 助手的国内品牌,苹果这回又不出意外地晚了大半年,慢人一步似乎一直都是苹果的标签,只是它们总能在稳步前行中带来一些惊喜。

然而,AI 大模型的进步速度正以周、甚至以天计数,苹果的迟到,究竟是再一次后发先至,还是在新时代掉队的开始。

略显妥协的方案,先上车才是重点

上个月的最后一天,苹果用 12 分钟的短会宣布:放弃造车,All in AI,汽车团队的众多成员将被调往 AI 部门。

蛰伏十年的泰坦计划,倒在了入局新能源汽车的最后一年,对于未来百家争鸣的汽车市场而言,会有些许遗憾,但从一家科技公司长远的发展来看,这莫过于一个长远且正确的选择。

AI 是基础性的应用,在所有大公司都主动或被动拥抱 AI 的当下,苹果的“断舍离”顺应着时代。

而如何拥抱 AI?怎样的人工智能才能在逐渐被瓜分的市场里占得一席之地?是它们最先要解决的难题。    

针对国外市场,苹果正在与 Google 积极谈判,以便在 iOS 18 中加入 AI 大模型,实现其他品牌早就有的 AI 功能。

虽然目前“双方尚未决定人工智能协议的条款或品牌,也没有最终确定如何实施”,但在众多备选合作商(OpenAI 和 Anthropic)中,Google 和 Gemini,应该是最适合苹果和 iPhone 的那一个。

今年二月发售的三星 Galaxy S24 系列机型以 AI 功能出圈,通话翻译、创意写作等功能赶上了国内平均水平,即圈即搜缩短了搜索路径,也极有可能成为今后 AI 手机的主要发展路线。

海外版的 S24 系列,就是通过大模型 Gemini 支持,才得以完成上述功能。

从经验讲,Google 已在全球出货量最高的旗舰机型上,完成了初步尝试,相比于在 PC 或 Web 端大火的厂商,它们更知道手机大模型的操作习惯、使用场景、适配应用应该怎么做。

再者,Google 本身也更渴望得到苹果的项目

根据国际数据公司 IDC 的统计,三星在 2023 年全球智能手机市场占有率达到了 19.4%,苹果则成功登顶达到了 20.1%。

若是拿下苹果,Gemini 在全球范围内手机终端的搭载率将达到 4 成,这对于一家面临激烈竞争的 AI 大模型公司,极为利好。

在梦里笑醒的除了 Google,还有苹果。

和其他强调“自研”的厂商不同,苹果在一开始就以合作来达成 AI 上机,也有其自身的考量

首先,在本身起步晚进度慢的现状下,“拿来主义”是快速争夺市场的妙手,和 Google 的合作,在减小研发成本、收取高额坑位费的同时,还能缓解两家公司目前所面临的监管压力。

其次,AIGC 的技术很好,但在落地时却因道德、隐私等方面的缺陷被大量诟病,交给成熟的第三方,特别是已经在三星机型上试水成功的 Google,省力省心,且减小了舆论和责任风险。

这当中的另一道坎,是技术本地化。每个国家和地区对 AI 大模型的监管和相关法规都有着不同的要求,合法合规的落地才是争夺市场和发展技术的前提,因此才催生出了“国内+国际”双管齐下的路线。

按照三星与百度初见成效的合作,苹果才会选择这条已经被“验证为真”的路线。

国行版三星 S24 系列上的 AI 功能,实际上有多个厂家旗下的技术组成:即圈即搜功能由百度和京东提供;智能修图由美图秀秀的大模型 MiracleVision 完成;文章摘要、智能写作则采用了百度的文心一言大模型。

苹果是否也会与多家厂商合作,还要等待后续的消息,不过和百度的合作,已然板上钉钉。

最后,苹果要做的并非一个智能语音助手,而是整套 AI 终端。但根据 Macrumor 的爆料,以目前的自研进度和技术成果,苹果的大模型还远达不到 Google、OpenAI 等公司水准。

与其赶鸭子上架一个智能聊天机器人,不如先拿成熟的方案做过渡,为自研大模型争取更多的研究时间和进步空间。

当下的市场很重要,但未来的核心技术才是根本

合作,是苹果 AI 全球化的第一步,而最终的目标,是为了拥有全路自研的 AI 大模型。

这是一项烧钱且耗神的工程,别说退步,稍微进步的慢一点,都有可能在下周被淘汰。一个有竞争力的大模型,往往代表着今后在市场上的主导权与议价权。

库克认为:

生成式 AI 方面开辟新天地,我们相信这项技术可以重新定义未来。    

而苹果对于大模型的探索,其实一直都在日程表上。

本月 15 日,苹果工程师悄悄发布的一篇研究论文,当中详细介绍了一种名为 MM1 的新型生成式 AI 模型的开发过程。

MM1 是一个具有最高 30B(300 亿)参数的多模态 LLM 系列,这是苹果在多模态大模型的最新研究成果。

总的来说,苹果的自研模型在测试效果上,与 Gemini 和 GPT4V 还有一定的差距,也没有在生成结果上表现出如 Sora 一样惊人的效果,更没有探索出一条全新的技术路线。

但是,它能通过控制各种数据变量,在对比中找出影响模型生成效果最关键的那几个因素,简单来说,它天生不强大,不过善于观察、实践和总结,在一次次的尝试中,也能取得不错的成绩。

MM1 由密集模型和 MoE(混合专家)变体组成,当指令进入 MoE 后,究竟应该去“东市买骏马”还是“西市买鞍鞯”,都会被这个指令中心安排的明明白白的。

问题被细化和分类的同时,也提升了计算效率,节约了运行能耗。

这篇论文,代表苹果在 AI 领域探索的阶段性成果,虽然 MM1 没有颠覆行业更没有惊艳世界,但在晦涩难懂的专业术语里还是能看出它们的进步:

我们的工作模式一直是先做工作,然后再谈论工作,而不是在自己面前出言不逊。—— Tim Cook    

没有透露过多技术细节的苹果,其实还在盘算着另一步棋:端侧大模型

早在去年底,苹果在名为《闪存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文中,就提出了大模型落地 iPhone 等“内存有限”设备的方法。

研究人员称,他们通过最新的闪存技术,在 iPhone 和其他内存受限的设备上成功部署了 LLM(大语言模型)

这个项目被称为 Apple GPT,最大的作用是将 LLM 数据直接存储在闪存中,比如整合在 Siri 内部,相较于传统的运行方法,新技术使 CPU 和 GPU 的推理速度,最大提升了 5 倍和 25 倍。

研究人员称,开发的这些效率型方法使得 AI 模型能够在 iPhone 当前内存的两倍范围内运行。

也就是说,侧端搭载大模型有了可行性,通过减少闪存传输的数据量、提高每次传输的吞吐量,让 LLM 的数据直接储存在闪存中。

撇开技术,Siri 是我们和 AI 的桥梁

进度缓,消息少,布局大。这是苹果探索 AI 的概况。

每每看到苹果的某项技术落后于市场和竞争对手,都会给人一种“起步太晚”的错觉,实际上在翻看相关新闻和专利文件的时候,又会发现它往往是最早布局的那一批,甚至那一个。

截止到 2023 年,苹果总共收购了 32 家 AI 公司,位列科技巨头中收购榜第一。

而收购 Siri,应该可以算作苹果入局 AI 的开端。

2010 年的乔布斯打给“Siri 之父”Dag Kittlaus 的一通电话,让 Siri 以超过 2 亿美元的身价,加入苹果,走上 iPhone。

Siri 最初的定位是一个快速准确获取信息的助手,或是处理复杂任务的助理。

在最原始的版本里,Siri 可以与 42 个网络服务相连接——从餐馆点评网站 Yelp、售票网站 StubHub,到电影点评网站 Rotten Tomatoes 和数学计算网站 Wolfram Alpha。

根据提示,Siri 会将各种信息整合,并回复用户。无需打开其他的应用软件,Siri 就可以帮助用户买票、订餐馆或叫出租车。

这些如今被 AI Pin 和其他智慧助手大力宣扬的“AI 功能”,似乎只是十多年前 Siri 的“基础操作”。

但 Siri 的实际体验,已经在 AI 大模型爆炸式发展的当下,被拉开了不小差距。

智能助手,是对人的被动模仿,有问必答,有求必应。

而 AI 终端,则是对人的主动接近。根据用户的个人习惯、喜爱偏好,总结以往、推理以后,在不同的时间地点给予你最合适的建议和答案,并且能够不断地学习优化,成为“私人专属”。

从整体上看,苹果的迟到只是相对的晚,因为 AI 手机,还处于发展的早期阶段。

的确,大部分国产品牌已经在 AI 终端的阶段发力,功能大体相同,特长各有侧重。

但各家大模型的可用性只能算达到及格线,除了像 OPPO 相册的 AI 消除、三星通话的实时翻译、小爱同学的 AI 通话等细分功能,大部分的体验目前还是与独立的 AI 应用有些差距。    

这当中,除了厂家的技术突破,也和 App 开放的接口有关,比如不支持微信语音通话摘要的模型,在日常生活中,就少了一大块的应用空间。

因此,大模型和系统、App 的整合,以及对全新交互方式的探索,还有很长的路要走。在此之前,AI 功能还没能达到影响消费者购机决策的程度。

在 AI 上机的元年,Siri 的目标是和其他 AI 助手抹平这半年多的差距;而作为苹果布局未来的重要部分,我们更期待 6 月份的 Siri,会带来怎样的“One more thing”。

本文来自微信公众号:爱范儿 (ID:ifanr),作者:肖凡博

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年3月26日
下一篇 2024年3月26日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日