清华研发出“全球首颗”,这种芯片要火了?

清华大学集成电路学院教授吴华强、副教授高滨团队基于存算一体计算范式,研制出全球首颗全系统集成的、支持高效片上学习(机器学习能在硬件端直接完成)的忆阻器存算一体芯片,在支持片上学习的忆阻器存算一体芯片领域取得重大突破,有望促进人工智能、自动驾驶可穿戴设备等领域发展。

除了存算一体,未来科学要将忆阻器应用范围扩大到“感存算一体系统”,也就是说,未来的系统不仅存和算在一起,感知系统也会同时进行,计算效率继续倍增。

这两日,一则消息刷爆了芯片圈,清华又有新成果。

清华大学集成电路学院教授吴华强、副教授高滨团队基于存算一体计算范式,研制出全球首颗全系统集成的、支持高效片上学习(机器学习能在硬件端直接完成)的忆阻器存算一体芯片,在支持片上学习的忆阻器存算一体芯片领域取得重大突破,有望促进人工智能、自动驾驶可穿戴设备等领域发展。研究成果已发表在《科学》(Science)上。

对国内芯片产业来说,处处都是“卡脖子”,全世界也都在集中力量研发下一代产品,这一次,我们走在了前面。

成果是什么?

根据清华大学官方公众号介绍,该芯片包含支持完整片上学习所必需的全部电路模块,成功完成图像分类、语音识别和控制任务等多种片上增量学习功能验证,展示出高适应性、高能效、高通用性、高准确率等特点,有效强化智能设备在实际应用场景下的学习适应能力。

相同任务下,该芯片实现片上学习的能耗仅为先进工艺下专用集成电路(ASIC)系统的1/35,同时有望实现75倍的能效提升。

图片忆阻器存算一体芯片及测试系统,图源丨清华大学

基于忆阻器存算一体实现高效片上学习的通用算法和架构,图源丨清华大学

“存算一体片上学习在实现更低延迟和更小能耗的同时,能够有效保护用户隐私和数据。”博士后姚鹏介绍,该芯片参照仿生类脑处理方式,可实现不同任务的快速“片上训练”与“片上识别”,能够有效完成边缘计算场景下的增量学习任务,以极低的耗电适应新场景、学习新知识,以满足用户的个性化需求。

比如,有些人习惯在数字“7”的中间加一短横。一开始,智能芯片并不认识这个符号,然而训练了两三个这样书写的“7”后,它就能准确将其识别为数字“7”。

小车自动追踪控制的增量学习演示,图源丨清华大学

什么东西?有什么用?

顾名思义,存算一体就是将存储器和处理器合并为一体。想象一下,人类在思考时候从来都是存储和计算一体的,并不会存在分开的情况,而这种架构就是借鉴了我们人脑的处理方式。

我们为什么需要存算一体?冯诺依曼瓶颈经典计算机体系结构中,处理和内存是分开的。而合并在一起,是为了越过两面墙——存储墙和功耗墙。

  • 存储墙:冯·诺依曼架构的存算分离会导致外部存储器运行速度远远小于处理器的运算速度,系统整体会受到传输带宽瓶颈的限制,导致算力会远低于处理器标定的理论算力;

  • 功耗墙:冯·诺依曼架构中,数据在处理器和外部存储器中频繁高速传递,会导致系统功耗很高。同时,摩尔定律触碰1nm,芯片特征尺寸已进入量子效应显著范围,引起一系列次级物理效应,包括栅隧穿泄漏、载流子界面散射、强场速度饱和、源漏寄生电阻占比增大等,导致功耗密度快速上升。

当我们打破两堵墙,数据就不用来回搬运处理,也不会“交通堵塞”,此时整体功耗就更低了,说白了,就是不绕弯路了。

那忆阻器又是什么?它全称是记忆电阻器(Memristor),由Memory和Resistor两个英文单词组成,它代表着第四种器件。

电路中,四大基本变量电流i、电压u、电荷量q和磁通量φ中,前三者分别对应电阻器、电容器和电感器,而磁通量φ表征磁通量与电荷之间的关系——即忆阻器,它的特性是忆阻器可以记忆流经它的电荷量。

根据材料和物理机制,忆阻器件可分为阻变随机存储器(RRAM),相变存储器(PCRAM),磁随机存储器(MRAM)和铁电随机存储器(FeRAM)四种。此外还有光电忆阻器、有机材料忆阻器、流体忆阻器等。

不同类型忆阻器件参数指标比较,制表丨电子工程世界

参考丨《物理学报》

存算一体则也分为多种介质,不同介质实现效果和关键点也不同,包括各种易失性存储器件和非易失性存储器件(NVM)

其中,前沿研究更多偏向于技术成熟的SRAM来探索和设计存算一体架构,但SRAM存在瓶颈,较大的单元面积会导致随着工艺发展,CMOS扩展难度会相应增大,芯片计算密度增长会逐渐放缓;相比之下非易失性存储(NVM)在计算密度方面表现出更大的潜力,不过NVM尚不成熟,基于该技术设计的存算一体架构短时间很难得到广泛应用。

除了存算一体,未来科学要将忆阻器应用范围扩大到“感存算一体系统”,也就是说,未来的系统不仅存和算在一起,感知系统也会同时进行,计算效率继续倍增。

应用于感存算一体化系统的忆阻器的性能比较,制表丨电子工程世界

参考丨《物理学报》

更值得强调的是,无论是存算一体,还是忆阻器,都与类脑芯片,或者说是神经形态计算相关联,毕竟这两者已经是模仿人脑。

类脑芯片就是从算法(SNN)、架构上彻底模仿人脑计算的“突触可塑性”,这是大脑记忆和学习的重要基础。它允许突触根据其活动增强或减弱,并由突触上的神经递质受体控制。 

当然,类脑芯片又是非常复杂的一个分支,用忆阻器实现的类脑芯片属于最难的那一种,也是非硅基类的类脑芯片。

不同类型的类脑芯片实现方式,制表丨电子工程世界

说了这么多,那存算一体到底有啥用?一句话总结就是——能让芯片快速获得十倍甚至百倍的能效比。低功耗,就是它最大的作用,而压低功耗就意味着移动设备能够拥有更多想象力,而我们也就越来越能用现有能源系统,触达更大算力。

举一个最典型的例子就是,AlphaGo下棋打败了人类,但人类只用了20瓦的大脑能耗,而AlphaGo是2万瓦。

当然,我们清楚一项成果转化到业界并非一蹴而就,而这项成果不仅涉及存算一体、忆阻器,也涉及仿生类脑处理,再把这些东西集合在一起制造出来,就更复杂了,可想而知技术含量有多高。

存算一体迎来新增长机会? 

虽然一时间,我们可能很难看到这款芯片,不过存算一体芯片在近几年已经逐渐产业化,不知道这个消息是否会成为市场的有一强心剂。

实际上,国际上多数巨头早已开展相关的研究,就比如说工程师所熟知的英特尔、三星、IBM、东芝、SK海力士等公司,而国际市场上最典型的消息包括:

  • 三星2021年2月发布HBM2-PIM,将4片常规DRAM die和4片具有计算功能的DRAM die通过TSV通孔垂直组合在一起。其运行频率为300 MHz,每个裸片上 (PIM-DRAM die) 有32个PCU。2022年初,三星电子发表首个基于MRAM的存算一体芯片,采用28nm CMOS工艺重新构建MRAM阵列结构;

  • Mythic2021年5月获得7000万美元的C轮融资,2021年6月发布由72个AMP切片构成,每个切片内部集成一系列闪存单元、ADC阵列、1个32位RISC纳米处理器、1个16位SIMD矢量处理器、SRAM和1个片上网络 (NOC) 路由器,算力达25TOPS;

  • IBM公司2018年通过PCM实现在数据存储的位置执行计算来加速全连接神经网络训练,该芯片能效比是传统GPU280倍,单位面积算力是传统GPU100倍;

  • 2016年,英特尔基于SRAM实现了支持逻辑操作的存储器,并在此基础上实现了支持无进位乘法运算的计算型缓存。

反观国内,回看前几年,涌现了大量存算一体公司,这批公司在两年前大多还处在A轮以前,彼时多家公司获亿元融资,短短两年时间许多明星公司又获2~3轮新融资,赛道热度依旧,资本依然看好这项新技术。

并且,有很多产品也逐渐浮现:

  • 今年5月,后摩智能正式发布首款存算一体智驾芯片——鸿途H30。12nm工艺制程下,该芯片物理算力达256TOPS,在Int8全精度的计算提供下,计算延时只有1.5ns,能效比为30~150TOPS/W,比业界同等精度计算条件下的水平提高了3倍以上,而且它是车规量产支持L4,而这也存算一体在大算力这一领域走在了前列;

  • 苹芯科技已开发实现多款基于SRAM的存内计算加速单元,致力于为人工智能行业提供了低成本、高效率、低能耗、高性能的芯片解决方案;

  • 九天睿芯拥有自有专利的模拟预处理与6T SRAM存算一体技术,解决了传统计算架构的瓶颈和耗电散热难题,做到更低的延迟和更快的处理速度;

  • 达摩院研发的存算一体芯片是全球首次采用混合键合(Hybrid Bonding)的3D堆叠技术,将计算芯片和存储芯片 face-to-face 地用特定金属材质和工艺进行互联。

国内类存算一体公司不完全统计,制表丨电子工程世界

展望未来,从技术上,存算一体存在三个难点:一是器件特性难以满足全部需求,存算一体的形态太多了,但每种器件的侧重点又不一样,不一定能够满足全部应用需求;二是阵列存在泄露路径、写串扰以及寄生电容电阻问题;三是现有集成电路设计与集成技术难以满足需求,本身存算一体是为了低功耗而来,但外围控制辅助电路的面积和功耗都很高,也会减少存算一体的一部分收益,同时存储存在工艺差距,统一制程增加硬件开销,3D异质集成是可行之路。

从市场角度来看,存算一体还是一种比较超前的技术,还在找应用的阶段。目前仅有后摩智能一家企业已经公开展开规模化落地,瞄准的则是车规级,而许多企业则更看好AIoT低功耗方面的应用、感存算一体、图计算和基因工程等方面的应用。当然,

在此前笔者与苹芯科技的对话中,该公司也表示,存算一体中早期产品更多出现在端侧对低功耗和高能效有强烈需求的场景。随着智能城市、智能生态等应用普及,长远地看,存算产品的适用范围也可能会延伸至超大算力领域。


参考文献

[1] 人民日报:https://mp.weixin.qq.com/s/Km1VHS02wDsGE66Fr-d-7w

[2] 清华大学:https://mp.weixin.qq.com/s/w0VZNIQ1KbClJJ8c05hPqg

[3] 恒烁半导体(合肥)股份有限公司:首次公开发行股票招股说明书(申报稿).2021.10.19.https://data.eastmoney.com/notices/detail/A21521/AN202110191523750446.html

[4] 高雅丽,李晨,王之康. 解决重大原创问题  勇闯创新“无人区”[N]. 中国科学报,2021-06-01(004).DOI:10.28514/n.cnki.nkxsb.2021.001764.

[5] Acta Phys. Sin., 2022, 71(14): 140101. doi: 10.7498/aps.71.140101

[6] 温新宇, 王亚赛, 何毓辉, 缪向水. 忆阻类脑计算. 物理学报, 2022, 71(14): 140501. doi: 10.7498/aps.71.20220666

[7] 张宇琦, 王俊杰, 吕子玉, 韩素婷. 应用于感存算一体化系统的多模调控忆阻器. 物理学报, 2022, 71(14): 148502. doi: 10.7498/aps.71.20220226

[8] 信息通信技术与政策:专题丨存算一体技术产业发展研究.2023.7.24.https://mp.weixin.qq.com/s/mZJMeES8IUOw6MIQLKZu6A

本文来自微信公众号:电子工程世界(ID:EEworldbbs),作者:付斌

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年10月12日
下一篇 2023年10月12日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日