M4芯片,苹果今年AI策略打响的第一枪

争夺端侧算力TOPS

M4芯片采用了第二代3纳米工艺,拥有10个CPU内核和10个GPU内核。

端到端的AI用户体验

就在苹果发布M4芯片的头一天,传出了苹果在做数据中心推理芯片的消息,这个内部项目代号AC/DC(Apple。

苹果有一个顶尖的芯片设计团队,但是因为苹果不做AI服务器芯片,技术人才在流失,许多人跳槽或者创业去了。

苹果在新版本的iPad Pro发布会上,推出了一款M4芯片,让库克可以宣称胜过当下任何所谓的AI PC。

他话中有话。或许是指微软,可能将于两周后在其Build开发者大会上推出的Surface笔记本电脑,可能搭载了高通的骁龙X Elite芯片。

不止于此。M4的发布,是苹果今年AI策略打响的第一枪。

争夺端侧算力TOPS

M4芯片采用了第二代3纳米工艺,拥有10个CPU内核和10个GPU内核。苹果最想强调的,是它的16核38TOPS的“神经网络引擎” (即业内俗称的NPU)性能。苹果还指出,M芯片是业内最早具备NPU的芯片。而在以往,苹果并不怎么突出这一点。

发布的时机相当不寻常。苹果首次在iPad而不是Mac的发布会上发布M系列芯片。M3芯片仅仅发布了7个月,但它很快被高通发布的骁龙X Elite和Plus系统芯片超过。M3的NPU功能仅有18 TOPS,而骁龙X Elite的NPU功能达到45 TOPS。

TOPS的意思是万亿次浮点运算,它决定着端侧的生成式AI计算力。M4的38TOPS,仍低于业内逐渐公认的AI PC配置40 TOPS NPU的标准。尽管M4比骁龙 X 的NPU拥有更高的精度,实际应用起来在深度学习的许多方面表现出优势,但从营销的角度考虑,苹果芯片中的NPU,可能需要更多的TOPS。

大模型向端侧部署,不仅是生成式AI最大的应用场景,而且也是端侧设备最重要的创新点——个人AI终将落地于个人设备。

AI正在席卷所有的端侧设备,从PC、手机、平板到汽车。在这样一个技术和产品变革中,苹果已经被市场认为行动有些迟缓。苹果既然放弃了汽车,而Vision Pro仍然需要一个成熟的过程,在现有的设备上能否引领AI用户体验,成为今年苹果面临的最大挑战。

苹果最大的底气,仍然是其软硬件结合的技艺。芯片、操作系统、产品设计所构成的精良制作和用户体验,在当下的问题就是如何把大模型完美地集成进去。

苹果在为其设备上能跑本地大模型做准备。在下个月举行的苹果开发者大会上,苹果将会推出iOS18及iPadOS18。

但最重要的,仍然是芯片。M4与今年秋季即将推出的A18芯片,都将突出其的NPU优势。拥有芯片,就能在系统层面产生持续的、丰富的产品差异化机会。

但在AI时代,仅有端侧的芯片能力是不够的。最终在设备上所有的AI应用、所有的运行的大模型的用户体验,仅仅有端侧芯片还不够。

端到端的AI用户体验

就在苹果发布M4芯片的头一天,传出了苹果在做数据中心推理芯片的消息,这个内部项目代号AC/DC(Apple Chips in Data Center)。苹果一如既往地保密,据说已经和台积电偷偷搞了好几年了。(但也有消息指出该消息不实,彭博社记者Mark Gurman对此表示:“这个项目已被取消,苹果不会制造自己的AI服务器芯片,因为成本原因与缺乏差异化。”)

M4和A18可能已经解决了端侧部署模型的异构算力问题。但这还不够,因为用户仍然需要云计算,需要由本地计算与云计算的结合,才能获得生成式AI的完整体验。苹果需要在云和端混合的神经网络计算,才能提供让用户期待的推理。

苹果需要在数据中心的层面开始,建立起推理引擎。从芯片设计开始建立推理引擎服务,已经出现了类似Groq这样的公司,它从推理芯片做起,以数据中心为基础提供了最快速的推理引擎,SOTA的开源大模型,都能在这样一个推理引擎上跑出最快的速度。速度对于视频,对于在建立起AI代理的工作流中特别重要。

在速度与准确之间存在着矛盾,如何做到速度与准确性兼得,这需要在推理服务与具体的应用场景结合起来,关键是性价比、总拥有成本(TCO)、与用户体验的“最优解”。这是苹果需要解决的问题。用端到端的方法,把服务器芯片、端侧芯片、大模型的部署与适配、操作系统结合起来,才能解决AI用户体验最基本的推理问题。

巨头要做AI,必须加入AI军备竞赛:芯片,算力集群,基础设施。苹果正在逐步认清这个道理。

在生成式AI时代,在这个快速变化、技术曲线陡峭上升的阶段,苹果需要成为这条曲线的一部分,否则,它将被这条曲线抛弃,失去它自己的下一条曲线。

这条曲线的最底层逻辑,是AI计算。在技术变革期,苹果必须象它最初做PC一样,像做个人计算一样,只有垂直整合,才能最后建立起真正的AI用户体验。

不向英伟达交税

在科技巨头中,最牛的就是能“收税”的。苹果凭借其生态系统,成功地从其开发者和生态合作伙伴那里收取了高额的费用——最高如谷歌搜索引擎的每年高达200亿美元的费用,达到其广告收入的36%。

现在又来了个比苹果更能收税的,就是英伟达,它的毛利率在80%左右,如果算上H100短缺在市场上的加价,它的毛利率可以达到90%。

处于食物链金字塔顶端的苹果,不会接受向英伟达直接交税。苹果生态用的数十亿设备及其用户,可能是世界上最大的推理算力的需求方,它必须为自己建立起推理的数据中心,这就需要推理AI芯片做起,建立起自己的算力集群。

苹果有一个顶尖的芯片设计团队,但是因为苹果不做AI服务器芯片,技术人才在流失,许多人跳槽或者创业去了。最知名的如跳槽到高通的Gerard Williams III。高通一直在试图进入数据中心领域。

除了英伟达之外,M7中的5家,都已经在自研GPU应用芯片,只剩下苹果了。

本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年5月8日 13:43
下一篇 2024年5月8日 14:35

相关推荐

  • 微软Xbox、索尼PS、任天堂Switch,实体游戏仍未被淘汰?

    据Piscatella预测,数字版游戏将在未来2年内呈爆发式增长态势,预计到2028年,大部分Xbox与PlayStation平台游戏都将只发布数字版,步调相对缓和的任天堂可能是唯一保留实体卡带的游戏厂商。尽管PlayStation也和Xbox一样在主机产品线上试水推出无光驱版本,引导玩家向数字版游戏过渡,但PlayStation依然对实体游戏市场保留了足够多的重视,更不必说实体游戏销量占比更高的Switch平台了。

    未来科技 2分钟前
  • Ilya官宣离开OpenAI后,点赞了这篇论文

    柏拉图表征假说有一个非常重要的推论,即不同模态、不同算法架构的AI模型都会汇聚到同一个终点目标,那就是形成对于高维现实的准确表征。

    五、AI模型表征收敛背后的三大原因

    通过实验结果,我们发现柏拉图表征假说确实存在。

    六、Scaling有用,但未必高效

    柏拉图表征假说有着几个重要推论,每个推论都对未来AI的发展有着方向性的指导意义。

    未来科技 43分钟前
  • “唯快不破”的互联网方法论,为什么在AI上失灵了?

    和互联网进行对比,我们就会发现一个是浅层链接,一个是被链接点的深层价值创造。

    互联网VS人工智能

    先上个图:

    这里面第一点不再展开了,后面几点则要从应用的视角进行理解,而不是纯粹的技术视角。

    以公司为例,我们会发现价值创造往往是在一个被互联网强化过的网里面的价值创造(没互联网也是网,互联网只是强化)。

    小结

    人工智能产品可以看成是过往各种技术的综合,数字相关的技术就是电脑、手机、互联网等,人工智能会把他们无缝地综合在一起。

    未来科技 15小时前
  • 中美AI的五月剧变

     
    在跨境数据传输的规则被进一步明确后,AI大厂在中国的落地方法论将更为清晰,这预示着中国与国际各AI大厂的合作或许会进入下一阶段。
     
    AI全球化的推力和阻力
     
    在加大对国际AI厂商的开放度之外,中国正通过深化政府间合作,加速AI时代的全球化步伐。
     
    在开源模型领域,中国的人工智能模型在某种程度上确实依赖美国开发的开源模型。

    未来科技 15小时前
  • Meta发布“变色龙”混合模态模型,要挑战GPT-4o?

    //arxiv.org/pdf/2405.09818

    与GPT-4o一样,Chameleon采用了统一的Transformer架构,使用文本、图像和代码的混合模态完成训练。

    Chameleon的生成结果,文本和图像交错出现

    所谓“混合模态”基座模型,指Chameleon不仅使用了端到端的方式从头开始训练,而且训练时将所有模态的信息交织混合在一起,并使用统一的架构处理。

    并且,Chameleon生成的图像通常与上下文相关,这样一来,这种交错内容的输出对用户来说,极具吸引力。

    未来科技 18小时前
  • GPT-4o团队引热议:狠狠重任新人,经验职级都是浮云

    具体情况,咱们来扒一扒就清楚了:

    做出伟大产品的年轻团队们

    本次吃瓜活动,就从最近万众瞩目的GPT-4o背后团队(以下简称Omni团队)下手吧。

    想当初,PD哥是以本科毕业生的身份加入OpenAI的,虽然这个本科是MIT(手动狗头)。

    此前在OpenAI工作了一年多时间,今年7月份从OpenAI又跳回到谷歌,他可能是唯一一位对GPT-4和Gemini都有贡献的人类了。

    未来科技 19小时前
  • 苹果提前公布的这个iOS18新功能,可能比AI Siri更有趣

    等功能上线后,我们“听歌”时,iPhone可以随着音乐产生特定振动,为便携音乐增添一种新的感官语言。

    今天,我们将借着“音乐触觉”,了解一下听障群体通过振动感受音乐的方式,如何为所有人开启了一种新的可能性。

    iPhone的触觉潜力,终于又有机会“觉醒”

    作为一位曾经的iPhone。

    “音乐触感”则有潜力带来音乐的另一种感官维度。

    未来科技 20小时前
  • 奥特曼回忆OpenAI宫斗第一季:一生中最奇特的时刻

    “我们最初只是玩机器人和游戏等一些小项目,有人开始研究大语言模型,Ilya坚定地相信它,并且确定了我们的大方向,我们从GPT-1一口气做到GPT-4。

    语音模型是我们推出的一个很酷的东西,但也许最重要的是,我们能够使它如此高效地为免费用户提供服务,简直可以说得上是世界上最好的模型。Bartlett:你认为在GPT飞速发展的当下,能够活下来的人工智能企业的特点是什么。

    未来科技 22小时前
  • OpenAI解散Ilya重要团队,前高管怒斥,宫斗第二季?

    //venturebeat.com/ai/openais-former-superalignment-leader-blasts-company-safety-culture-and-processes-have-taken-a-backseat/

    本文来自微信公众号:机器之心(ID:almosthuman2014),作者:机器之心编辑部

    未来科技 1天前
  • 人工智能如何影响文博保护与传承?

    //venturebeat.com/ai/ai-enabled-technologies-could-help-museums-survive-the-digital-age/
    [3]Ben。//www.politico.com/newsletters/digital-future-daily/2023/04/24/ai-vs-the-culture-industry-00093550
    [4]《深度学习研究综述》,张荣等,《信息与控制》,2018年第47卷
    [5]Museums。

    未来科技 1天前