特供中国的英伟达算力芯片,为什么卖不动?

尽管此次禁令主要针对英伟达此前已经在中国被禁的H800/100、A800/100等先进产品,并未影响到新的H20等特供版产品,但《财经》获得的综合信息显示,中国公司对H20等新的特供版产品的兴趣在此次禁令升级后再次下降。”

一位在近期采购过华为芯片的某公司计算中心负责人告诉我们,一台搭载八卡英伟达H20的服务器目前市场价已经下探至100万人民币左右,而910B等效八卡服务器可能需要170万~180万元甚至更高。

为了维系中国市场,英伟达可能正在做出更多让步。

5月24日,有媒体称由于特供中国市场的AI芯片H20系列需求不佳,英伟达已经下调了H20系列芯片的价格。

报道称,今年2月初,英伟达H20在中国接受预订之时,渠道预订价单卡在1.2万~1.5万美元(约8.69万~10.86万元人民币)之间,经销商实际报价单卡一度超过11万元人民币,八卡服务器则约为140万元人民币。而及至目前,由于需求不振,H20芯片单卡渠道实际报价已经来到约10万元人民币,八卡服务器每台售价约介于人民币110万~130万元。在某些情况下,英伟达H20芯片售价已比被认为是其中国竞争对手的华为910B低10%以上。

多位供应链相关人士向我们确认了H20需求不振和降价这一情况属实。有计算中心用户甚至表示,按实际成交价格,H20价格和910B相比可能已经低了不止10%。一台八卡英伟达H20服务器目前市场价可能下探至约100万元人民币,而华为910B八卡服务器普遍在170万元以上。

一、H20需求不振

H20是目前中国市场上能在合法渠道上买到的用于大模型训练的最先进的英伟达芯片。

过去两年里,美国曾经三度加码对华芯片出口管制。从2022年下半年开始,无论是通过官方渠道还是特殊渠道,中国公司开始疯狂抢购英伟达等AI芯片,一张GPU售价一度飙涨至接近40万元。在2022年10月和2023年10月两次出口管制后,英伟达所有可用于大模型训练和推理的先进GPU悉数被禁,包括此前在第一次芯片管制后英伟达为中国市场特供的H/A800。

2023年底,在第二次芯片管制后,英伟达再次针对中国市场推出了三款在数据传输速度等关键性能上进一步降低的芯片:H20、L20和L2。其中,H20被认为是目前欧美公司大模型训练普遍采用的H100 阉割版,算力约只有H100的不到15%,在部分特定场景下表现甚至逊于910B。

H20在今年一季度开始接受预订。我们了解到,H20在中国的预订仅接受大客户。各大互联网头部公司都在采购,字节跳动和阿里是采购数量较多的两家。

今年3月30日,美国升级对华芯片出口禁令,表示将对中国出口的AI半导体产品采取“逐案审查”政策规则,全面限制英伟达、AMD以及更多更先进AI芯片和半导体设备向中国销售。

尽管此次禁令主要针对英伟达此前已经在中国被禁的H800/100、A800/100等先进产品,并未影响到新的H20等特供版产品,但《财经》获得的综合信息显示,中国公司对H20等新的特供版产品的兴趣在此次禁令升级后再次下降。

原因主要有两点。

一是因为禁令升级让部分中国公司把目光再度聚焦在此前已经被禁的产品。H20算力被阉割严重,而此前囤积的英伟达产品在市场上尚有存货,和这些产品相比H20性价比极低。

阿里巴巴被传订购了3万多块H20芯片,其并未对此做出回应。阿里云采购英伟达产品主要用在自家的云服务器上,以对外提供算力。一位阿里云相关业务人士向我们表示,目前客户更认可的仍旧是老款的英伟达系列产品。新的H20系列产品由于算力被阉割得太严重,市场对其热情不高。

多位渠道人士验证了这一说法,今年第一季度,有相当一部分此前被囤积的英伟达算力在市场上释放,且价格也有回落,一台H800的八卡服务器价格已经由去年高峰期320万元以上下探到目前的280万~290万元左右。虽然价格仍旧高昂,但是供应相对充足。对比之下,如果是在非官方渠道,几乎不会有客户询问H20。

二是英伟达在中国市场正越来越面临国产芯片的挑战。

华为通常被认为是国产芯片中的头部选手。百度和科大讯飞等公司都曾公开表示采购了大量华为芯片。我们了解到,华为芯片目前和英伟达相比,在性能和生态上差距仍旧不小。除了努力提升出货量之外,华为还提供了大量的技术支持来帮助厂商进行计算框架适配。

一位接近华为芯片人士告诉我们,910B的性价比并不见得比H20高,且还存在很多技术细节受到掣肘。华为现在的做法是,通过提高整体解决方案的性价比来增强芯片的竞争力。“虽然910B在市场上不愁卖,但是华为内部还是更在意产品的实际表现,希望可以更好。”

一位在近期采购过华为芯片的某公司计算中心负责人告诉我们,一台搭载八卡英伟达H20的服务器目前市场价已经下探至100万人民币左右,而910B等效八卡服务器可能需要170万~180万元甚至更高。他表示,具体的成交价格视需求规模和紧急程度而定。但是,媒体报道中的“华为 910B售价约12万元,其八卡服务器等效产品价格从130万元到150万元人民币起”这个报价已经滞后了,“这是新一轮管制前的价格,而在新一轮管制后,华为芯片价格有明显上涨”。

某大模型初创公司的一位技术负责人士透露,910B在市场上供不应求。尽管能采购到英伟达芯片,他们还是希望同时能够采购到华为的算力芯片。“主要是考虑到供应的持续性问题,如果只用来自英伟达的算力,投资人就会对此有疑虑。”

此外,英伟达在今年3月又发布了新的革命性GPU产品,基于Blackwell架构的B200和GB200系列,将大模型训练算力提升了数倍,并将在今年二季度出货。之前英伟达每一次发布新品后,都会冲击到既有产品的价格。有产业链人士认为,尽管新品并不会对中国市场进行销售,但是对比之下,对中国公司而言,现有英伟达产品的技术优势就显得更不明显,H20的性价比也显得更低了。

二、降价逻辑

面对这种情况,英伟达在求变。

英伟达芯片由台积电代工。一位接近台积电的行业资深人士透露,由于产能有限,英伟达过去的做法通常是优先保障欧美大客户的供应。以去年中国公司向英伟达订购特供版的H800和A800为例,尽管在2022年四季度英伟达已经推出A800,2023年初推出H800,但是对中国客户普遍到年中才交付A800;到2023年11月,也就是第二次芯片禁令正式生效之时,相当数量合法渠道订购H800仍旧未交付。

但是,H20芯片的出货节奏则明显加快。H20在今年一季度开放预订,市场称从下单到交付仅需要一个月。

产业链信息显示,由于内存容量更大,H20的生产成本高于H100。在H20推出之初,多位分析人士也曾经向我们表示,即使中国公司对新的中国特供版产品需求不高,以英伟达一贯的风格,大概率也不会对这些产品进行降价。因为英伟达产品在全世界供不应求,如果H20降价盈利空间有限,英伟达会把有限的产能投入在其他利润率高的产品上。

全世界的AI公司都在抢购英伟达。尽管瑞银的报告显示,目前英伟达的交付时间在缩短,已经从2023年末的8个至11个月缩短了一半时间,但是,英伟达CEO(首席执行官)黄仁勋近期称,英伟达现在仍旧面对市场的需求压力,目前大约1.5万~2.0万家生成式AI初创公司,都在等待成为英伟达的客户。

同时,科技巨头们也在加大采购量。根据研究机构 Counterpoint Research的数据,2023年全球云计算服务商的资本支出仅增长了4%。但预计2024年将激增42%,这主要是由于美国科技巨头对人工智能基础设施的大量投资所致。

也就是说,情况已经和此前业内预想有所不同。为了维系中国市场,英伟达正在做出比过去更多的让步。

一个事实是,中国市场逐渐萎缩,对英伟达来说,此前花了大力气在中国建立起的生态优势也将会逐渐缩小。而生态的优势如果丧失了,意味着英伟达或将越来越没有可能重返中国市场。

半导体研究机构SemiAnalysis表示,英伟达必须在价格上与华为竞争,才有可能在中国市场拿到足够的订单。

研究机构IG市场分析师 Hebe Chen表示,英伟达正在走一条微妙的路线——努力在维护中国市场和应对美国政府紧张局势之间寻找平衡。从长远来看,英伟达也应该为最不利的情况做准备。

财报显示,2023年第三财季,英伟达中国大陆收入高达40.3亿美元,环比大涨47%。出口管制规则出台后,2023年第四财季英伟达中国大陆收入仅为19.5亿美元,环比大降52%。当季,中国大陆仅占英伟达总营收的8.8%,是历史最低点。

英伟达和AI相关的数据中心业务在中国大陆的收入占比过去长期达到20%~25%。但自2023年10月起,该收入显著减少。英伟达高层此前曾表示,中国大陆在数据中心收入中的比例已降至个位数。

5月23日,英伟达公布了新一季财报,营收高达260.44亿美元,同比增长262%;净利润148.8亿美元,同比大增628%。其中,数据中心业务成绩再创历史新高。一季度营收为226亿美元。

但是,根据高管在业绩会上透露的信息,中国大陆的数据中心收入仍旧在减少。

黄仁勋表示:“我们在中国的业务比过去的水平要低得多。由于我们在技术上受到限制,现在在中国的竞争更加激烈。我们将继续尽可能为那里的客户和市场服务,尽我们所能。”

本文来自微信公众号:财经杂志(ID:i-caijing),作者:顾翎羽,编辑:谢丽容

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年5月26日 20:03
Next 2024年5月27日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日