高通打响围攻英特尔的第一枪

 
另外,在发布会现场,高通还拉出一票软件公司站台,并表示骁龙平台现已支持微软、Meta、OpenAI、安卓、百度等公司的端侧大模型。

图片来源:高通
 
高通方面表示,这个专为。
 
相较于云端大模型,端侧大模型最大的意义在于可以在离线状态下使用,而在日常应用场景中,涉及到离线使用的基本都是笔记本电脑、平板电脑等便携式设备,这类产品往往因为续航的需求对。

“Oryon CPU 的开发进度甚至超过了我们自己的预期。”

 

北京时间 10 月 25 日凌晨,高通骁龙技术峰会正式召开。不同于以往手机厂商们排队抢首发的循规蹈矩,这次业界把焦点放在了高通专为 AI 打造的 PC 处理器骁龙 X Elite 上,一枚基于高通自研内核“Oryon”的 CPU。

 

在介绍这枚芯片时,高通 CEO 克里斯蒂亚诺·安蒙(Cristiano Amon)的喜悦之情也是溢于言表,苹果的 M2 Max 和英特尔的 i9-13980HX 成为活动现场的“对照组”,从单线程性能到峰值性能功耗,再到 GPU 算力和 AI 处理速度,安蒙试图用数据证明骁龙 X Elite 是一款全方位领先的产品。

 

在移动旗舰芯片方面,虽然全新骁龙 8Gen 3 被 X Elite 抢了风头,但凭借“首款专为生成式 AI 打造的移动平台”这一名头,依旧在发布会上博得满堂彩。

 

通过一场发布会,高通摇身一变成为“终端 AI”的代表,成功让人们忽视了英特尔才是最早主张 AI 端侧计算的企业。

 

而就在高通技术峰会召开前的一天,10 月 24 日,路透社报道称,英伟达和 AMD 正在开发能够用于 Windows 系统的 PC 处理器。虽然还不清楚上述产品的研发进展,但可以确定的是,两家公司的 PC 处理器同骁龙 X Elite 一样采用 ARM 架构。

 

英特尔曾凭借 x86 架构垄断 PC 处理器市场三十余年,但眼下英特尔的行业霸主地位,似乎在一夜之间迎来变数。

 

高通的蜕变,有多彻底?

 

在发布会开始,安蒙介绍了在端侧完成 AI 计算的必要性,基本还是那些老生常谈的观点:低成本、低时延、安全性高。但令人惊喜的是,高通地把移动端平台的生成式 AI 能力抬上了一个新的高度。

 

相较上代产品,骁龙 8Gen 3 的 CPU 性能提升了 30%,GPU 性能提升了 25%,NPU 性能提升 25%,目前骁龙 8Gen 3 已支持运行 100 亿参数的生成式 AI 模型。如果使用搭载 8Gen 3 平台的智能手机运行 Stable Diffusion,只需不到 1 秒就可以用文本生成图像。

图片来源:高通

 

如果只对比参数,100 亿模型参数要较 GPT 4 和 Llama2 等云端模型少了几个数量级,但对于手机厂商而言,这样的硬件能力在现阶段已基本够用。

 

以小米为例,该公司在今年 4 月完成了大模型团队的搭建,8 月成功在端侧跑通 13 亿参数大模型,但目前还未正式进入公测阶段。以此推断,在下一代骁龙移动旗舰平台发布之前,骁龙 8Gen 3 足以应对手机端的训练需要。

 

另外,在发布会现场,高通还拉出一票软件公司站台,并表示骁龙平台现已支持微软、Meta、OpenAI、安卓、百度等公司的端侧大模型。根据此前高通与 Meta 的合作计划,最早在明年应该就能看到 Llama 2 模型在骁龙平台上运行。

 

相较于多模态生成式 AI 能力,骁龙 8Gen 3 在其他方面则稍显平庸,只能算是中规中矩的常规升级,但眼下行业内似乎也并不关心骁龙新的移动平台,在游戏、影像等场景下有多少提升,全场的关注点都集中在骁龙 X Elite 上。

图片来源:高通

 

高通方面表示,这个专为 AI 打造的骁龙 X Elite 其 AI 处理能力是竞品的 4.5 倍,异构 AI 引擎性能可达 75TOPS,支持在端侧运行超过 130 亿个参数的生成式 AI 模型,当使用基于 70 亿参数的端侧聊天助手时,每秒可处理 30 个 Token。

 

虽然发布会现场高通并没有标注这个“竞品”是哪款 CPU,但还是以数据的形式展示了下 Oryon 内核的“基础能力”:单线程性能超过苹果的 M2 Max 和英特尔的 i9-13980HX,峰值功耗比 M2 Max 少 30%,比 i9-13980HX 少 70%。而在多线程方面,高通还对比了英特尔的 i7-1355U,称骁龙 X Elite 的性能可达其两倍,且峰值功耗减少 68%。

 

图片来源:高通

即便这种对比方式稍有“田忌赛马”之嫌,但不得不说,作为 Oryon 内核的首代商用产品,骁龙 X Elite 的表现远超过行业预期。

 

实际上,在 Oryon 项目上,高通某种意义上是沾了苹果的光。

 

2021 年 3 月,高通收购了初创芯片设计公司 Nuvia,这家公司的主营业务就是打造高性能 ARM 架构芯片,其创始人团队包括苹果前 CPU 首席架构师 Gerard Williams 以及曾参与苹果 A7-A14 芯片研发的 John Bruno、Manu Gulati 等人。

 

在完成对 Nuvia 收购后,高通在 Oryon 项目上进展神速,并于去年骁龙技术峰会上宣布推出 Oryon 内核。

 

值得一提的是,在高通 2022 年三季度财报发布后的电话会议上,安蒙曾表示过,“我们预计,2024 年骁龙 Windows PC 将出现拐点。”但在当时,考虑到高通在 PC 市场少得可怜的占有率,这句话并没有引起行业太多的关注。

 

三家分 Intel?

 

骁龙 X Elite 芯片的推出,让高通在 PC 领域的野心暴露无遗。尽管这家公司一度凭借手机芯片成为全球最大的 Fabless 厂商,但在 PC 行业,高通始终默默无名。

 

在 2018 年,高通曾在骁龙 855 芯片的基础上,推出了面向 PC 端的骁龙 8cx 处理器,但性能十分羸弱,甚至不及当时 iPhone 上的 A12 芯片。以至于当时有种观点认为,骁龙 8cx 存在的意义就是为了证明,ARM 架构不适合作为电脑处理器,它注定只能是移动端架构。

 

此后,鲜有芯片厂商再进行 ARM 架构在 PC 上的尝试。直到 2020 年,基于 ARM 架构的苹果 M1 芯片问世,人们才发现 ARM 架构在功耗大幅领先 x86 架构处理器的同时,性能同样可以有不俗的表现。

 

反映在市场表现上,根据 CouterPoint Research 的统计数据,自 2020 年苹果推出 M1 芯片后,截至 2022 年底,全球基于 ARM 架构处理器的笔记本市场份额从 2% 迅速增长至 12% 以上,其中 90% 都是苹果的产品。

 

需要说明的是,除了英特尔和 AMD 外,大部分厂商根本没有 x86 架构授权,此前连进入 PC 市场的资格都没有,而苹果凭借 ARM 架构在 PC 市场上取得的成功,给许多芯片设计厂商打入了一针强心剂。

 

与此同时,在“端侧 AI”概念兴起的当下,厂商们发现 ARM 架构芯片的另外一个优势非常适合端侧大模型的场景——低功耗。

 

相较于云端大模型,端侧大模型最大的意义在于可以在离线状态下使用,而在日常应用场景中,涉及到离线使用的基本都是笔记本电脑、平板电脑等便携式设备,这类产品往往因为续航的需求对 CPU 功耗有着很高的要求。

 

因此,过去被 x86 架构“卡脖子”的芯片厂商们,现在都心照不宣的开始了对 ARM 架构的研发工作,试图在“端侧 AI”时代从英特尔嘴里抢下一块肉。

 

值得一提的是,过去被认为和英特尔组成“Wintel 联盟”的微软,在“Arm on Windows”这件事上表现得甚至比芯片厂商还要积极。10 月 17 日,微软宣布了一项名为“ARM 咨询服务”的计划,以帮助开发者开发基于 ARM 的应用程序。

 

这其实也不难理解,虽然有着联盟之名,但长久以来,微软始终希望能够摆脱单一合作方的束缚。

 

从上述背景来看,眼下开发基于 ARM 架构的 PC 处理器,似乎占尽了天时、地利、人和。

 

不过,现在还远没有到能危及英特尔的时候。一方面,英特尔代表的 x86 PC 处理器市场仍然有着绝对的领先优势。

 

另一方面,英特尔在端侧 AI 上的努力同样不遑多让,在前不久的 Intel On 大会上,英特尔宣布年底推出的代号为“Meteor Lake 的酷睿 Ultra 处理器,将全系集成神经网络处理单元(NPU),而且还准备通过 OpenVINO 套件,帮助开发者进行 AI 训练、测试,及模型优化工作。

 

但无论如何,友商们通过 ARM 架构来描述端侧 AI 的蓝图,对于英特尔来说绝对是个值得警醒的信号。

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年10月25日
下一篇 2023年10月25日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日