CPU,正在被“瓜分”

这样的VPU通常还具有高性能、低功耗和低延时等多个优势,据SemiAnalysis对VPU芯片厂商镕铭微电子(NETINT)的分析,相比于CPU和GPU,VPU的密度和功耗是CPU和GPU无法比拟的,VPU的出现可以说是为视频行业应用带来了前所未有的加速计算能力。

VPU与GPU和CPU的对比(图源:Semianalysis)

当下4K、8K等高清视频技术的广泛应用,使得视频处理的计算负担持续上升,这使得高效能的VPU成为行业发展的必备工具。

随着技术的发展,数据量的爆炸性增长,到2025年,全球生成和消耗的数据总量预计将超过180ZB。而计算机的核心部件——中央处理器(CPU)分析数据的能力却有点力不从心,导致数据处理缓慢且低效。

传统的CPU为了满足多任务处理、高效能和节能要求,变得越来越复杂。在这个高速发展的时代,我们不能再依赖单一的CPU来完成所有的工作。为此,各种特定的处理单元(PU)如雨后春笋般涌现,其目标就是“瓜分”CPU的任务,人多力量大,各司其职,优化计算效率。

GPU在AI时代崛起

CPU是计算机的“大脑”,执行一般计算任务,而GPU则帮助CPU执行图形和人工智能等更复杂的任务。 

GPU(图形处理单元)最初是为了满足图形渲染的需求而发展起来的,在GPU芯片市场中,英伟达控制着全球大约80%的市场。图形处理单元GPU,最初是为了满足对图形渲染的迫切需求而发展起来的,而现在它的功能已经远超这个范围,成为推动现代计算的核心力量之一。得益于其并行处理的卓越能力,GPU,就像一个无畏的少年,一路在游戏、挖矿、AI等领域高歌猛进,展现出了无限的可能。今天,GPU已经广泛渗透到深度学习、科学计算等关键领域,成为这些领域不可或缺的一部分。

尤其是在当今的人工智能的时代,生成式AI的广泛和深入应用标志着一场技术革命的到来。在这个背景下,图形处理单元(GPU)的重要性逐渐超越了中央处理单元(CPU),站上了历史的舞台中心。

首先是,作为世界上最大的GPU供应商,英伟达大约占据全球80%的GPU市场份额。2023年6月13日,英伟达的市值首次突破了万亿美元大关,成为美国第五大市值公司,仅次于苹果、微软、Alphabet和亚马逊。这一里程碑式的事件突显了GPU行业的健康和增长动力,同时也预示着它在未来将继续发挥重要作用。

英伟达目前的市值仍然在1万亿美元以上

接下来是数据中心业务大反转。在过去几年中英伟达的重心开始转向了数据中心市场。2023年第二季度的营收数据显示了一个非常引人注目的现象。在2023年之前,数据中心的CPU市场份额一直显著高于GPU。

事实上,即便是在2023年第一季度,英伟达在数据中心业务的收入(42亿美元)仍然未能超过Intel和AMD的总和。但到了第二季度,局面发生了翻天覆地的变化,在数据中心业务上,两大CPU巨头英特尔和AMD的营收分别为40亿美元和30亿美元。而与之形成鲜明对比的是,英伟达的数据中心业务营收超过了100亿美元,这一数字甚至超过了英特尔和AMD的营收之和。这一数据充分显示了GPU的地位在迅速上升,并在某些领域已经超越了CPU。

GPU在现代超级计算中占据了中心地位,它被广泛用于各种任务的加速,从网络到游戏,从加密到人工智能等各个领域。随着越来越多的计算任务转移到GPU上,我们可以预见到,GPU将在未来几十年内继续是计算和人工智能领域的主要工具。

为数据处理而生的DPU

有了专门处理图形的GPU之后,还不够。在数字化时代,需要有针对数据处理而生的处理器,于是数据处理单元(DPU)应运而生,DPU也被称为是数据中心的第三大计算支柱。DPU 与 CPU 和 GPU 配合使用,可增强计算能力并处理日益复杂的现代数据工作负载。

CPU、GPU和DPU的对比(来源:datacenterknowledge)

DPU是专门设计用来处理大量的数据和信息。它可以有效地处理和分析数据,提高数据中心和云计算平台的性能。根据英伟达的说法,DPU应该能完成以下三大项任务:

  • 卸载:从服务器CPU接管基础设施任务,以便更多的CPU能力可用于运行应用程序。

  • 加速:使用DPU芯片中的硬件加速,比CPU更快地运行基础设施功能。

  • 隔离:将关键数据平面和控制平面功能移至DPU上的单独域,既可以减轻服务器CPU 的工作,又可以在CPU或其软件受到损害时保护功能。

迄今为止,许多 DPU 开发都是针对超大规模的。展望未来,DPU 在数据中心和企业网络其他地方的使用预计将会增长。一种可能实现的方式是将 DPU 技术与网络交换机相融合——AMD Pensando 将这种技术组合称为“智能交换机”。“我们认为智能交换机是企业吸收 DPU 技术的最简单方法,因为它可以让他们淘汰旧设备,并为他们的网络带来重要的技术和规模,” AMD Pensando 网络技术和解决方案小组首席商务官 Soni Jiangdani 表示。

由于人工智能、机器学习、深度学习、物联网、5G 和复杂云架构需求的增长,DPU市场稳步增长。随着对数据密集型应用程序的需求不断增加,计算架构将不断发展,从而需要更快、更高效、更安全的数据处理。DPU市场上涌现了不少芯片玩家,主要供应商包括英伟达、Marvell、Fungible(被微软收购)、Broadcom、Intel、Resnics和AMD Pensando,以及中科驭数、芯启源云豹智能、云脉芯连等等。

根据Allied Market Research 的一份报告,预计到 2031 年,全球数据处理单元市场将达到 55 亿美元,2022 年至 2031 年的复合年增长率为 26.9%。因此,DPU 可能会从今天的可选组件转变为下一代计算的必要行业标准。

爆炸性增长的视频,需要VPU

随着视频内容的普及和人工智能技术的飞速发展,视频处理单元(VPU,Video Processing Unit)成为了当前科技领域的一颗新星。多年来,英特尔的CPU+软件的视频解码/编码方案一直主导着流媒体市场,但是随着视频流媒体对高质量视频的需求不断增长,CPU将不再具有经济价值,而且会消耗太多的能耗和空间。于是,VPU这种专门用来处理视频的芯片开始兴起,他们旨在释放CPU的庞大劳动力。

VPU(视频处理单元)是专门设计用来处理视频任务的,它可以高效地处理视频编码和解码、图像处理和机器视觉等任务。通过将这些任务从CPU或GPU上卸载,VPU可以提高系统的总体效率和性能,同时也减轻了CPU或GPU的负担,使它们可以专注于其他任务。

这样的VPU通常还具有高性能、低功耗和低延时等多个优势,据SemiAnalysis对VPU芯片厂商镕铭微电子(NETINT)的分析,相比于CPU和GPU,VPU的密度和功耗是CPU和GPU无法比拟的,VPU的出现可以说是为视频行业应用带来了前所未有的加速计算能力。

VPU与GPU和CPU的对比(图源:Semianalysis)

当下4K、8K等高清视频技术的广泛应用,使得视频处理的计算负担持续上升,这使得高效能的VPU成为行业发展的必备工具。目前包括谷歌、Meta、字节跳动和腾讯等互联网巨头均已经瞄上这颗芯片。与此同时,AMD在今年4月,发布了一款用于数据中心的新型专用媒体加速器和视频编码卡——Alveo MA35D,英特尔则是将VPU集成到其14代酷睿Meteor lake处理器中。

除了云和数据中心之外,终端也已成为视频及游戏的主要载体,手机厂商愈发追求视频或影像质量。对此,vivo/小米以视频芯片为自研切入点,如Pixelworks/逐点半导体这样的第三方视频芯片供应商也开始迎来发展契机。

未来,视频处理芯片市场预计将继续增长,特别是在边缘计算、物联网(IoT)和5G通信领域。高效和低功耗的视频处理芯片将成为这些应用领域的关键组件。

更多新的“PU”正在路上

一家成立于2018年的以色列的初创芯片企业NeuroBlade,开发了一种专用处理器架构,他们将之称为SPU(SQL处理单元)。该公司的目标是成为“数据分析领域的 Nvidia”。SPU主要是用来加速SQL指令处理,该公司CEO表示,通过使用专门设计的处理器加速SQL处理,可以实现端到端SQL分析加速。在部署方面,该芯片通过主机服务器的PCIe总线插入,能够透明地接管SQL相关处理,而无需修改主机应用程序软件。

NeuroBlade SPU芯片和卡

SPU支持常见的列式文件格式。当一个查询请求从查询引擎发送时(也就是从数据库管理系统中发出查询请求),SPU可以直接访问和处理存储在本地存储设备上的数据文件。在处理完数据文件后,SPU会将处理结果以原生查询引擎布局的形式发送回查询引擎。

SPU的工作原理

NeuroBlade公司正在与多个大型超大规模提供商进行谈判,并已与一家公司赢得了数千张SPU卡的合同。如NeuroBlade还与戴尔公司合作,在PowerEdge服务器中分销SPU卡产品。据他们称,超大规模企业使用这一SQL处理单元(SPU)来卸载运行分析工作负载的x86 CPU,可以获得100倍或更多的工作加速,每年可以节省数百万美元。

结论

一款“全能”型的CPU似乎已经不能满足所有的计算需求。随着计算需求的多样化和技术的发展,多种PU的出现,如GPU、DPU、SPU和VPU,正是对这种趋势的回应。它们从各自擅长的领域,优化特定的计算任务,为CPU“分忧解难”,提高整体的计算效率和性能。

虽然多种PU的出现已经开始瓜分CPU的任务,但CPU仍然是计算的中心。不过,多种PU的融合和发展无疑会进一步推动计算技术的不断进步和优化,帮助实现更高效,更快速的计算,满足日益增长的数据和计算需求。

在未来,我们可以期待更多种类的处理器出现,它们将更加专业和高效地处理各种不同类型的计算任务,为各个行业和领域带来更大的便利和推动力。

本文来自微信公众号:半导体行业观察 (ID:icbank),作者:杜芹DQ

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年10月5日
下一篇 2023年10月6日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日