英伟达的神秘收购,藏着一门好生意?

同时,英伟达被曝低调买下另一家以色列AI初创企业Deci,但交易金额未知,只有以色列媒体放出消息称价格为3亿美元。”

高性能计算领域专业媒体HPCwire文章指出,英伟达有自己的Kubernetes插件,但Run.ai将为AI容器管理和编排带来更精细的控制。

另据出席演示会的人士透露,在这两项交易完成之前的几个月,英伟达曾要求至少一家大型风投公司组织12家“有前途的”AI创业企业集中向英伟达高管做演示,CEO黄仁勋也包括在内。

在Meta、谷歌、亚马逊等科技巨头纷纷官宣自研芯片计划后,行业霸主英伟达有必要感到紧张吗?

风云变幻之间,英伟达仍在低调推进自己的战略布局。从它最新的收购来看,英伟达似乎深谙“居安思危”的哲学。

在传言流出几个月后,英伟达终于在4月底的博客中官宣收购以色列AI初创企业Run:ai。这是一家基于Kubernetes的GPU编排供应商。据媒体报道称,此次收购价格约7亿美元。

同时,英伟达被曝低调买下另一家以色列AI初创企业Deci,但交易金额未知,只有以色列媒体放出消息称价格为3亿美元。

合计10亿美元的收购单,足以确认英伟达在当下最关心的领域:成本优化和效率提升。为了应对日益增长的市场需求和竞争,英伟达正全力打造一个更加高效、可扩展的AI生态系统。

随着AI电耗带来的能源危机日益紧迫,能耗——成为GPU战场毫无争议的核心。那么帮助GPU降本增效,真的能算一门不错的生意吗?

GPU生态的不同赛道

上述两家以色列公司都致力于降低人工智能的使用成本,但它们的运作模式有所不同。

据英伟达博客介绍,人工智能部署正变得越来越复杂,客户的工作负载分布在云端、边缘端和本地数据中心基础设施上。管理和编排生成式AI、推荐系统、搜索引擎或者其他工作负载都需要复杂的调度,以便优化系统和底层基础设施的性能。

Run:ai在Kubernetes上构建的开放平台,可以为独立任务汇集GPU或者共享算力——这包括只占用部分GPU,或者运行多个GPU,或在不同集群上的多个GPU节点的模式。企业客户可以更好地管理数据中心规模的GPU集群,实现更高效的GPU集群资源利用。

这家创业公司成立于2018年。被英伟达收购前,它在2022年3月完成C轮融资,筹集的总资金达到1.18亿美元。

两位创始人欧姆利·盖勒(Omri Geller)和罗宁·达尔(Ronen Dar)在特拉维夫大学电气工程学院学习期间相识。首席执行官盖勒曾在以色列总理办公室技术部门工作,首席技术官达尔曾任职贝尔实验室和苹果公司。

盖勒表示:“自2020年以来,Run:ai一直与英伟达密切合作,我们都热衷于帮助客户充分利用他们的基础设施。”

高性能计算领域专业媒体HPCwire文章指出,英伟达有自己的Kubernetes插件,但Run.ai将为AI容器管理和编排带来更精细的控制。因此,英伟达乐意更多地使用这种工具,而不是完全依赖云供应商的配置。它也可以帮助英伟达提供完整软件堆栈的需求。

今年3月,英伟达还刚刚推出推理微服务(NIM)平台,用于预先配置和优化AI模型的部署。收购Run:ai后,英伟达也可以利用它的Kubernetes编排层管理NIM在其GPU基础设施中的部署。

另一家在报道中被英伟达收入囊中的公司Deci,业务重点是调整AI模型,使其更容易访问和扩展,以便改善构建和部署AI模型的方式。这家成立于四年前的公司迄今为止融资5500万美元。

Deci联合创始人兼首席执行官约纳坦·盖夫曼(Yonatan Geifman)表示:“我们的技术可以自动设计新的神经网络结构,针对我们试图解决的数据和机器学习问题对其进行优化,使其在硬件上运行得更快。”

以色列媒体Globes报道称,微软已将Deci集成到Azure AI Studio中,在那里它不仅要与OpenAI正面对决,还会与Meta和法国公司Mistral以及英伟达的模型竞争。

“如今的趋势是软件和硬件的协同集成。”盖夫曼说,“有些公司还希望我们帮助他们设计下一代芯片。他们想了解我们的算法见解将如何改进他们的下一代产品。”

谈到Deci的起源时,盖夫曼回忆起自己学生时代以及在谷歌山景城总部的时光。“在以色列理工学院攻读博士学位期间,我开发了许多深度学习模型。在构建这些模型的过程中,我发现需要进行许多试错迭代,并且每次迭代都需要消耗大量计算资源,才能收敛到一个好的模型解决方案。”他说。后来进入谷歌工作后,他更强烈地感受到考虑模型在生产环境中的可扩展性、运行时间和内存等解决方案的必要性。

类似的公司还有开源人工智能平台Lightning AI。今年3月,它和英伟达合作发布了名为“Thunder”的新一代AI编译器,旨在加速AI模型的训练速度。

“我们发现客户没有充分利用现有的 GPU,而是投入更多 GPU 来解决问题。”Lightning AI 首席技术官卢卡·安蒂加(Luca Antiga)表示, “Thunder 与Lightning Studios及其他分析工具相结合,使客户在运行更大、更快的模型时有效利用 GPU。随着 AI行业开始训练跨多种模式、能力越来越强的模型,获取最佳的 GPU 性能变得至关重要。”

芯谋研究的研究总监张彬磊对甲子光年总结称,Run:ai实质是跟GPU配合,在GPU里面是做任务分配,协调GPU的资源算力,同时执行多项任务;Deci主要是针对应用端的产品,在索取GPU空间时做衡量与评估。

但这类公司独立的商业化前景不明。张彬磊指出,Run:ai依赖于GPU企业应用,Deci则可能获得更多创业公司的需要。因为未来的软件和目前手机上的小型程序不同,可能都是极为耗电的大型AI模型,对Deci的服务需求更旺盛。

英伟达的“购物策略”

可能很多人没有意识到,英伟达可能是当前AI创业领域里最活跃的投资者和卖家,甚至没有之一。风投统计机构Pitchbook数据显示,英伟达在过去一年里投资了30多家初创公司。

另据出席演示会的人士透露,在这两项交易完成之前的几个月,英伟达曾要求至少一家大型风投公司组织12家“有前途的”AI创业企业集中向英伟达高管做演示,CEO黄仁勋也包括在内。

这也不是英伟达第一次到以色列“采购”。2019年,英伟达豪掷69亿美元收购以色列芯片制造商Mellanox,成为该公司迄今为止在以色列的最大一笔收购。

得益于英特尔1970年代起对以色列的投资,以及当地对工程技术人才的重视,以色列虽然没有广为人知的巨头企业,但在半导体和人工智能领域拥有大量细分赛道的隐形冠军以及良好的人才环境。目前以色列至少拥有超过3000名英伟达员工,约占该公司总人数的10%。Run:ai的员工也会加入英伟达的以色列办公室。

至于对GPU降本增效的追求,或许是英伟达寻找新的收入增长引擎的举措。

此前,英伟达的主要客户是有雄厚财力购买其昂贵GPU的科技巨头。 DA Davidson投资银行分析师吉尔·卢里亚(Gil Luria)表示,2023年下半年,来自微软和Meta的订单约占英伟达销售额的四分之一。

但谷歌和Meta等大厂已经先后官宣打造自己的AI芯片,希望减少对英伟达的依赖。

New Street Research分析师皮埃尔·费拉古(Pierre Ferragu)表示,虽然英伟达去年售出了250万颗芯片,但谷歌花费了20亿至30亿美元打造了大约100万颗自研AI 芯片。亚马逊预计也花费2亿美元生产了10万块芯片。微软也在2023年末表示开始测试其首款AI芯片。

研究公司Gartner称,到2027年,人工智能芯片市场预计将增长一倍以上,达到约1400亿美元。AMD和英特尔等知名芯片制造商以及Cerebras和SambaNova等初创公司也在制造专门的人工智能芯片。

而收购了上述两家公司后,英伟达便可以更有效地管理计算资源,降低能耗,为客户提供更具性价比的平台,向中小企业市场进发,同时也吸引大客户的驻留。

张彬磊表示:“关键不在于芯片标价有多贵,因为这是一次性的成本。重要的是长期运行的能耗。如果能耗与别人差很多,那么自研对企业来说反而是长期的伤害。在GPU这个赛道里,只有最好,没有更好,也就是强者恒强。”

对于其他科技巨头来说,张彬磊表示,做出自己的产品去替代英伟达并不难。但是站在商业成本的角度,采购最好的芯片一定是最有性价比的。所以英伟达要做的就是把芯片生态做到最好,大大领先于其他企业。在能效、生态和应用各个层面为客户提供最好的服务,最低的成本,最低的能耗。其他科技巨头客户就会失去自研GPU的动力。

值得一提的是,4月中旬,英伟达股价曾遭遇明显下挫,引发市场对“AI泡沫破灭”的短暂担忧。

但市场恐慌来得快,去得也快,英伟达股价已从每股750美元快速回升至约900美元。张彬磊指出,在当下的AI浪潮里,英伟达的股市表现与爆款AI产品同频。AI产品发布后,英伟达股价便一路走高。而股票明显下跌,也只是相应的情绪回落。

现阶段英伟达的芯片价格暂时维持在高位,毛利达到70%,净利约50%。张彬磊认为,如果其他科技巨头自研能把性能做上去,自研当然有价值。但话说回来,如果市场上有一些企业的GPU可以达到或者接近英伟达的水平,英伟达还可以打价格战做市场下探,继续保持竞争优势。

4月30日,英伟达的主要对手之一AMD发布了一季度财报,将今年MI300 AI加速器芯片的年销售额预测从年初的35亿美元上调至40亿美元。但投资者仍然对这个数字不满意,因为此前预估达到60-80亿美元。失望情绪导致AMD当日盘后下跌7%。

对此,张彬磊同样认为,能效是非常重要的因素,因为企业考虑长远的支出,如果能耗比别人高,技术水平比别人落后,生态也没有别人完善,销售就很难达到预期。只有芯片价格合适,服务也比竞对完善,才能获得抢占市场的机会。

参考资料:

《Nvidia to Buy Two Israeli Startups That Make Its AI Chips Cheaper to Use》,《The Information》

《How Nvidia Could Use $700M Run.ai Acquisition for AI Consumption》,HPCwire

《Optimizing AI with AI》,《Calcalist》

《Nvidia’s Big Tech Rivals Put Their Own A.I. Chips on the Table》,《The New York Times》

《Nvidia to buy Israeli deep learning co Deci AI – report》,《Globes》

本文来自微信公众号:甲子光年 (ID:jazzyear),作者:田思奇

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年5月11日 15:15
Next 2024年5月11日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日