AI芯片,国产发展得如何了?

不是每种芯片都叫AI芯片

虽然我们每天都在茶余饭后攀谈AI芯片,但实际上,大部分人对于AI芯片并没有什么实际的概念,加之厂商直接以“AI芯片”命名,所以很难与器件关联挂钩。

FPGA:可编程的灵活性是任何其它计算芯片无法替代的,同时它在AI领域也具备一定计算能力,但相对来说,FPGA的成本就相对高一些了,而且FPGA开发也很难,软件生态没有GPGPU的CUDA那么方便。

10月17日夜间,美国又开始收紧制裁了,引发行业众怒。

一方面,在AI芯片禁令中加入了三条新规:

  • 把性能密度作为出口管制标准,即单芯片超过300teraflops算力/性能密度超过每平方毫米370 gigaflops芯片都会禁止,同时,英伟达A100/A800/H800/H800/L40/L40S/RTX4090、英特尔Gaudi 2、AMD计划的中国版GPU等特供版AI芯片的供应;

  • 先进芯片出口许可范围扩大到40多个国家;

  • 对21个国家提出芯片制造设备许可要求,全面限制中国的14nm以下先进芯片制造能力。

另一方面,将壁仞、摩尔线程等国产AI芯片公司列入实体清单。

美国的疯狂程度令人咋舌,连比H100效率低十倍的RTX4090都不放过。故伎重施,不断用小手段干扰国产发展,这从侧面说明,国产AI芯片发展迅速,现在开始,再也不能小看国产的力量了。

不是每种芯片都叫AI芯片

虽然我们每天都在茶余饭后攀谈AI芯片,但实际上,大部分人对于AI芯片并没有什么实际的概念,加之厂商直接以“AI芯片”命名,所以很难与器件关联挂钩。

所谓AI芯片,顾名思义,就是计算AI算法的芯片。AI算力需求究竟有多夸张?据OpenAI测算,2012年开始,全球AI训练所用计算量呈现指数增长,平均每3.43个月便会翻一倍,目前计算量已扩大30万倍,远超算力增长速度。

计算任何算法的芯片,都归属于AI芯片,这既包括最具代表性的深度神经网络(Deep Neural Network,简称DNN)、循环神经网络(Recurrent Neural Network,简称RNN)、卷积神经网络(Convolutional Neural Network,简称CNN),也包括与人脑更为类似的脉冲神经网络(Spiking Neural Network,简称SNN)

理论来说,任何数字芯片都能算AI,毕竟数字芯片,就是算数的芯片,但如果效率巨低、能耗巨大,就没有意义了。就比如说,CPU作为中央处理器,什么类型计算都能胜任,但计算AI的效率明显没有GPU高,所以服务器中都是使用CPU+GPGPU的形式,让GPGPU作为AI计算的主力。

此外,很多MCU中也会搭载DSP或者NPU来增强AI计算能力,但这种芯片一般不会单独叫做AI芯片,毕竟它们针对的场景并非大规模AI算法,也并非堆砌AI算力的主力,而是靠近边缘的AI算力。

因此,按照上述分类方法,AI芯片主要分为GPGPU(通用图形处理器)、FPGA(可编程逻辑器件)、ASIC(专用集成电路)、存算一体和类脑芯片几种。根据在网络中的位置,又可以分为云端AI芯片 、边缘和终端AI芯片。

  • GPGPU:与GPU不同,GPGPU就是将GPU图形显示部分“摘掉”,全力走通用计算,特别适合用在深度学习训练方面;

  • FPGA:可编程的灵活性是任何其它计算芯片无法替代的,同时它在AI领域也具备一定计算能力,但相对来说,FPGA的成本就相对高一些了,而且FPGA开发也很难,软件生态没有GPGPU的CUDA那么方便;

  • ASIC:性能强、功耗低,Gaudi 2就是一种ASIC,NPU也是加入神经单元的一种ASIC,不过针对特定算法计算,算法是无法修改的,想要做另一种算法就要再造一种ASIC芯片,前期开发需要FPGA辅助进行;

  • 存算一体:能耗比极佳,能够突破存储墙和功耗墙,但目前只在自动驾驶领域有商业化;

  • 类脑计算:性能更强、功耗更低,算法也变成了SNN,但全世界都在研究之中,还未商业化。

适用于AI计算芯片主要类型,制表丨电子工程世界

类脑芯片主要类型和研发进度,制表丨电子工程世界

每种AI芯片国产发展得如何了? 

首先,是GPU方面,天下苦英伟达已久。

多家媒体报道显示,英伟达的数据中心GPU价格贵得惊人,国产还难以替代,此外今年6月起,英伟达就曾多次涨价。

国内GPU融资高峰期主要在2020年,到现在GPU相关融资总额已超过200亿元。仅2020年~2021年,GPGPU领域就有近20起融资事件发生。

目前来看,初创公司如芯瞳半导体、芯动科技、摩尔线程、天数智芯、壁仞科技均陆续推出产品,并获好评,龙芯中科、海光信息、寒武纪、芯原股份几家上市公司也持续耕耘GPU业务。不止如此,也均在替代CUDA上做了一些工作。

国产GPU厂商不完全统计,制表丨电子工程世界

其次,在ASIC方面,分为多种玩家。

一种是专门设计制造ASIC的公司,包括寒武纪、地平线、耐能科技等厂商,分别专注AI芯片的细分领域,采用“大客户捆绑”模式进入大客户供应链。

另一种是各种跨界选手:vivo先于2021年9月发布ISPV1,再于2022年4月发布升级产品V1+,并在2022年11月发布V2;OPPO在2021年12月发表能强化手机图像处理性能的NPU MariSilicon X,之后在2022年12月揭露采用台积电6nm RF制程的蓝牙音讯SoC MariSilicon Y;阿里巴巴在2019年9月发布AI芯片含光800。

国内ASIC芯片玩家不完全统计,图源丨 偲睿洞察 

FPGA方面,电子工程世界历史文章《英特尔分拆FPGA业务,国产发展几何?》中介绍,目前国内与FPGA相关研发企业数量超过28家,其中已在A股上市的企业包括复旦微电子、安路科技、航锦科技,成都华微电子上市“已问询”。此外,紫光同创、高云半导体、京微齐力、中科亿海微、智多晶、遨格芯微、易灵思的表现值得关注。

具体来说,复旦微电在国内较早推出亿门级FPGA,新一代十亿门级产品正在研发中,并且有可编程片上系统的技术储备;紫光同创覆盖高、中、低端等多层次FPGA市场;安路科技在FPGA/集成CPU、FPGA、数据处理专用引擎等单芯片产品方面都有储备,量产供货产品已覆盖100K以内的逻辑单元规模,并且PHOENIX1 系列中逻辑单元为 400K 的新产品已成功流片;京微齐力基于22nm工艺制程的FPGA已成功量产;易灵思基于RISC-V软核的FPGA已商用,并在16nm、40nm有长期的产品规划。

通过对比国际尖端产品,核心参数差距依然较大。虽然大器晚成,不过,国内也非常注重软件生态的建设。

除此之外,百度也曾经使用FPGA做AI加速,此后又推出专用于AI计算的昆仑芯(开始是FPGA,后来是基于FPGA的XPU)

国内FPGA企业不完全统计,制表丨电子工程世界

存算一体芯片方面,电子工程世界在历史文章《清华研发出“全球首颗”,这种芯片要火了?》中介绍,前几年,国内涌现了大量存算一体公司,这批公司在两年前大多还处在A轮以前,彼时多家公司获亿元融资,短短两年时间许多明星公司又获2~3轮新融资,赛道热度依旧,资本依然看好这项新技术。

并且,有很多产品也逐渐浮现:

  • 今年5月,后摩智能正式发布首款存算一体智驾芯片——鸿途H30。12nm工艺制程下,该芯片物理算力达256TOPS,在Int8全精度的计算提供下,计算延时只有1.5ns,能效比为30~150TOPS/W,比业界同等精度计算条件下的水平提高了3倍以上,而且它是车规量产支持L4,而这也存算一体在大算力这一领域走在了前列;

  • 苹芯科技已开发实现多款基于SRAM的存内计算加速单元,致力于为人工智能行业提供了低成本、高效率、低能耗、高性能的芯片解决方案;

  • 九天睿芯拥有自有专利的模拟预处理与6T SRAM存算一体技术,解决了传统计算架构的瓶颈和耗电散热难题,做到更低的延迟和更快的处理速度;

  • 达摩院研发的存算一体芯片是全球首次采用混合键合(Hybrid Bonding)的3D堆叠技术,将计算芯片和存储芯片face-to-face用特定金属材质和工艺进行互联。

国内存算一体芯片企业不完全统计,制表丨电子工程世界

类脑芯片方面,全球范围内,参与神经形态计算芯片开发的机构主要包括三类:英特尔、IBM、高通等为代表的科技巨头企业,斯坦福、清华为代表的高校/研究机构以及初创企业。

国内研究则包括清华大学、浙江大学、复旦大学、中科院等顶级学府和机构,同时近两年不断涌现初创公司,如灵汐科技、时识科技、中科神经形态等。其中以清华大学的天机芯和浙江大学的达尔文芯片最具代表性。

国内类脑芯片企业不完全统计,制表丨电子工程世界

可以说,国内已经在各种形态的AI芯片上都有所布局,而国产的芯片算力也越来越强大,美国已经开始忌惮。

另一方面,国内也在加强制造能力建设。ASML的2023Q3最新财报显示,Q3’23相比Q2’22中国净销售额占比从24%增长至46%。

要知道,半导体产业高度全球化,美国这样一定会自食其果。而我国商务部也表示,美方不当管制严重阻碍各国芯片及芯片设备、材料、零部件企业正常经贸往来,严重破坏市场规则和国际经贸秩序,严重威胁全球产业链供应链稳定。美国半导体企业损失巨大,其他国家半导体企业也受到影响。

参考文献

[1] 财经十一人:美升级对华AI芯片制裁力度,美芯片企业提出担忧.2023.10.18.https://mp.weixin.qq.com/s/a6r3faTG1t4PCn5hQVdrWw

[2] 偲睿洞察:大模型背景下,AI芯片厂商面临怎样的机遇与挑战?|深度研报.2023.6.25.https://mp.weixin.qq.com/s/EUzg3R8vLrjS6KzIBRjaDw

[3] 拓墣产业研究:中国芯片自主化风潮将进一步带动ASIC市场.2023.7.5.https://mp.weixin.qq.com/s/ZF6EuAh4oGOfj-KJntFc9A

[4] ASML阿斯麦光刻:https://www.asml.com/en/investors/financial-results/q3-2023

本文来自微信公众号:电子工程世界(ID:EEworldbbs),作者:付斌

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2023年10月19日 11:31
Next 2023年10月19日 11:44

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日