英伟达H800/A800禁售,30天内生效

这一次,美国官员表示,新规将更专注于算力,这就可以控制更多芯片,包括英伟达的特供版。

根据新规,受影响的英伟达芯片包括但不限于A100、A800、H100、H800、L40和L40S,甚至连RTX。

芯片工厂的危险信号

美国表示,任何包含500亿或更多晶体管、并使用高带宽内存的芯片,都包含着危险信号。

当地时间10月17日,美国正式发布新规,全面收紧尖端AI芯片对华出口。

商务部长雷蒙多表示,管制目的就是遏制中国获得先进芯片,从而阻碍“人工智能和复杂计算机领域的突破”。

自此,英伟达和其他芯片制造商向我国销售高性能半导体,受到的限制愈加严重,而相关公司想找到绕过限制的方法,也愈加艰难。

根据相关文件,GPU芯片只要满足以下条件的其中一个,就会受到出口限制——

来源:中信证券

随着新规的出台,英伟达、AMD和英特尔的股价也一度大跌。

据称,英伟达在数据中心芯片方面的收入,有多达25%都依赖于中国市场。

此外,作为新规的一部分,芯片设计公司摩尔线程和壁仞科技,也被拉入了最新的黑名单中。

30天内,立即生效


根据美国商务部下发的文件,禁令将在30天内生效。

同时,雷蒙多还表示,以后法规可能会至少每年更新一次。

文件链接:https://www.bis.doc.gov/index.php/about-bis/newsroom/2082

总算力低于300 TFLOPS,且每平方毫米370 GFLOPS以下

在去年的禁令中,美国曾禁止出口超过2个阈值的芯片:一个是芯片所含算力的大小,另一个是芯片之间相互通信的速率。

之所以做如此规定,是因为AI系统需要在同一时间将成千上万的芯片串联在一起,处理大量数据。

而英伟达特供版的芯片H800/A800做到了保持在通信限制之下,同时仍能训练AI模型,因为它们保留了强大的计算能力。

此前,路透社报道称,英伟达H800芯片间数据的传输速度为每秒400 GB/s,不到H100峰值速度(每秒900 GB/s)的一半。

这一次,美国官员表示,新规将更专注于算力,这就可以控制更多芯片,包括英伟达的特供版。

算力方面,美商务部这次取消了“带宽参数”,取而代之的是“性能密度”。

根据新规,修改后的出口管制禁止向中国公司出售运行速度为300 TFLOPS(一万亿运算/秒)及以上的数据中心芯片。

如果速度为150~300 TFLOPS的芯片的“性能密度”为每平方毫米370 GFLOPS(十亿次运算/秒)或更高,则将被禁止销售。

以上述速度运行,但性能密度较低的芯片属于“灰色地带”,这意味着必须向美政府通报对中国的销售情况。

虽然这些规则不适用“消费产品”的芯片,但美商务部表示,出口商在出口速度超过300 TFLOPS的芯片时也必须上报,以便当局可以跟踪这些芯片是否被大量用于训练AI模型。

根据新规,受影响的英伟达芯片包括但不限于A100、A800、H100、H800、L40和L40S,甚至连RTX 4090也需要额外的许可要求。

现在剩下的,似乎只有英伟达V100了。根据该芯片参数,芯片相互通信速率是300 GB/s,运行速度最大为125 TFLOPS。

此外,任何集成了一个或多个所涵盖集成电路的系统(包括但不限于DGX和HGX系统)也在新许可要求的涵盖范围之内。

不过,英伟达预计,短期内美国最新限令不会产生重大影响。

堵住Chiplet漏洞

美国这次试图解决的另一个问题,是Chiplet。通过这种技术,芯片的较小部分可以连接在一起,形成一个完整的芯片。

美国担心中国公司通过Chiplet获取符合规定的小芯片,然后再秘密组装成更大的芯片。

这次新规增加了“性能密度”的限制,对芯片在一定尺寸中的计算能力加以限制,就是针对此类变通方法。

Chiplet方法,或许是中国半导体行业未来的核心。

中国GPU企业,通通列入黑名单

业内人士认为,如果美国芯片在中国被禁,中国公司会努力填补市场上的空白。

摩尔线程和壁仞科技都是由英伟达前员工创立的,被认为是中国生产英伟达芯片国产替代品的最佳候选者。

但现在,这两家公司也被添加到了实体清单,这阻断了台湾半导体公司或其他使用美国设备的制造商为它们制造芯片。

芯片工厂的危险信号

美国表示,任何包含500亿或更多晶体管、并使用高带宽内存的芯片,都包含着危险信号。

出口商需要格外注意,是否需要许可证才能向中国发货。

而这一门槛,几乎涵盖了所有先进的AI芯片,帮助芯片工厂发现规避规则的行为。

DUV光刻机也受限

美国还将先进芯片的出口许可证要求增加到22个国家。

管制范围也扩大到最终母公司总部设在上述国家的任何公司,以防止境外子公司购买违禁芯片。

美国还对其余21个国家提出了芯片制造工具的许可要求,担心这些设备可能被转移到中国。

荷兰的DUV光刻系统也受到了限制,以防止ASML向中国的芯片工厂运输一些较旧的DUV型号和配件。

DUV设备比不上最先进的EUV设备,但它可以以更高的成本制造芯片。而EUV早已全面被禁。

大厂囤货:10万块A800,今年交付

对于国内互联网巨头来说,现在手里还有多少存货?

目前,这一具体数额未知。不过,国内大厂刚刚发声:我们囤得够了。

前段时间,外媒FT曾报道称,国内互联网大厂竞相订购了价值约50亿美元的英伟达芯片。

据介绍,百度、字节、腾讯、阿里已经向英伟达下单A800,价值10亿美元,共10万块芯片,将于今年交付。

另外,还有40亿美元GPU订单,也将于2024年交付。

两位内部人士透露,字节已经储备了至少1万个英伟达GPU来支持各种生成式人工智能产品。

他们补充道,该公司还订购了近7万个A800芯片,将于明年交付,价值约7亿美元。

英伟达在一份声明中表示,“消费者互联网公司和云提供商,每年在数据中心组件上投资数十亿美元,而且往往提前数月下单。”

今年早些时候,随着全球生成式AI的不断推进,据国内科技公司的内部人士表示,大多数中国互联网巨头可用于训练大型语言模型的芯片库存不到几千个。

自那以来,随着需求的增长,这些芯片的成本也在增长。一位英伟达分销商表示,“分销商手中的A800价格上涨了50%以上”。

比如,阿里发布自家大模型通义千问后,并将其整合到各线产品中。

与此同时,百度也在全力投入大模型的研发和应用中,文心一言不断迭代升级,现能与GPT-4媲美。

腾讯云今年4月,发布了一个全新的服务器集群,其中就使用了英伟达H800。

另据2位人士透露,阿里云还从英伟达获得了数千个H800,而且许多客户与阿里建立联系,希望使用这些芯片驱动的云服务,以推动自家模型的研发。

训练大模型,用什么芯片?

从年初至今,业界纷纷发展自家的大模型,通常对标的是“地表最强”GPT-4模型。

此前爆料称,GPT-4采用的是MoE架构,由8个220B模型组成,参数量达1.76万亿。

这一参数量已经让许多人望尘莫及,对算力的消耗已经是最大极限。

具体来说,OpenAI训练GPT-4的FLOPS约为2.15e25,在大约25000个A100上训练了90到100天,利用率在32%到36%之间。

那么,对于下一代模型,人们口中的“GPT-5”,对算力又将有多大的需求?

此前,摩根士丹利曾表示,GPT-5将使用25000个GPU,自2月以来已经开始训练,不过Sam Altman之后澄清了GPT-5尚未进行训练。

另根据马斯克的说法,GPT-5可能需要30000~50000块H100。

这意味着,如果科技大厂想要进一步推进大模型的迭代升级,还需要极大的算力支持。

对此,英伟达首席科学家Bill Dally曾表示:“随着训练需求每6到12个月翻一番,这一差距将随着时间的推移而迅速扩大。”

参考资料:

https://www.ft.com/content/be680102-5543-4867-9996-6fc071cb9212

https://www.reuters.com/technology/how-us-will-cut-off-china-more-ai-chips-2023-10-17/

本文来自微信公众号:新智元 (ID:AI_era),作者:新智元

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年10月18日 16:23
下一篇 2023年10月18日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日