阿里玄铁五年考,CPU新生态探路难

孟建熠在参加2024玄铁RISC-V生态大会前夕,曾登录GitHub(一个面向开源及私有软件项目的托管平台),对与三大架构(x86架构、ARM架构以及RISC-V架构)相关的项目数据展开搜索。

在玄铁RISC-V生态大会上,一位行业人士也向记者证实了这一点,尽管行业内有RISC-V基金会牵头,国内推动构建RISC-V生态的阿里巴巴和中国科学院也有交互,但“基本上是各搞各的”。

被视为“AI(人工智能)风向标”的英伟达GTC 2024(NVIDIA GPU技术大会2024),时隔5年后终于回归线下。

北京时间3月19日凌晨,当英伟达CEO(首席执行官)黄仁勋面对万人观众亮出首款Blackwel架构的芯片B200时,因其可以处理数万亿个参数的模型,计算的AI性能是H100的五倍,使得这一AI芯片被冠以“地表最强”。

从架构到处理器,从自研能力到应用场景,英伟达的成功也被归益于生成式人工智能的发展。

但在物联网与人工智能领域拥有20多年经验、现任万物云管理合伙人兼首席科学家的丁险峰看来,英伟达的市值从20年前以Bilion(十亿美元)计到现在以Trilion(万亿美元)计,能实现1000倍的增长,“本质并不是它的芯片与其他芯片差异化有多大,英伟达的成功,其实是它的CUDA(一套通用并行计算架构)生态的成功”。

原来,围绕自研的并行计算平台和API(应用程序编程接口),英伟达构建起了一个CUDA生态,且进入这一生态的、要与相关软件兼容的第三方GPU(一种专用处理器)公司,需要接受英伟达提出的条款要求。“生态一旦建立,之后便会势不可挡。”丁险峰说。

实际上,越来越多的中国芯片产业人意识到,生态差距才是需要打破的那道墙。于是,以阿里巴巴为代表的科技巨头们闯入半导体产业斥资造芯,在解决中国算力困境的过程中,还把目光聚焦在了RISC-V(第五代精简指令集)架构上,意在CPU(中央处理器)领域构建起一个新的生态。

一、路径选择

RISC-V是一种指令集架构,作为软件和硬件之间的关键技术,由图灵奖得主大卫·帕特森(David Patterson)领导团队研发,并在2010年宣布对外开源,免费提供给高校师生、开发者、创业者以及商业公司,供他们使用并进行开发。

除了开源,RISC-V还具备简洁、灵活和可拓展性,更适配智能硬件的开发需求,能降低芯片设计厂商的开发成本与时间消耗。

中国工程院院士倪光南指出,当前CPU市场主要被x86架构(一种计算机处理器架构)与ARM架构(一种计算机处理器架构)垄断,中国芯片产业要想打破局面,实现自主可控,“基于开源的RISC-V架构发展创新将是机遇”。

此前,指令集架构作为芯片成型的起始,一直以来都被英特尔的x86架构以及英国的ARM架构垄断。

英伟达曾经想收购ARM公司,但以失败告终。之后,ARM被软银集团纳入麾下。但软银集团不能维持ARM的正常经营,又将其推向资本市场。自ARM架构被带入桌面级市场后,x86架构的优势逐渐消失,市场份额急速下滑。包括高通、苹果、华为等在内的巨头企业,都高度依赖ARM公司的架构授权。

但ARM架构并非不可替代。阿里巴巴布局芯片产业之初,就把目光瞄准在了RISC-V架构上。

丁险峰过去在阿里云担任首席智联网科学家,他还曾作为芯片策略组长,深度参与了阿里巴巴在解决中国算力瓶颈方面的相关研发工作。

6年前,阿里巴巴收购杭州芯片设计企业中天微系统有限公司,将业务整合成立平头哥半导体芯片公司,先后面市“含光”“倚天”“羽阵”等系列芯片,从而落实算力普惠这件事。

上述焦点之外,阿里巴巴在CPU领域尤其是RISC-V生态方面的布局,却被忽视了。

孟建熠曾是平头哥副总裁,他还是阿里巴巴达摩院RISC-V芯片业务的负责人。据他回忆,在2018年达摩院选择RISC-V技术路线之初,内部存在不同意见,“我们做自研架构是有基础的,但要转到RISC-V架构上,没有看到未来的商业可能”。“商业化想要走得快,背后需要的投入更大。”孟建熠也知道,取代一种架构非常难。但未来一定存在一个合理趋势,即三种架构持续并存,各有自身优势的应用场景。在讨论了好几个月后,孟建熠说服了团队走下去。

2019年,达摩院第一款RISC-V处理器玄铁C910面市。至今,这一自研处理器家族已有9款产品,成为国内RISC-V领域市场占有率最大的处理器IP(知识产权)系列。

官方并未给出玄铁处理器在行业内的具体市场份额占比。但在3月14日举行的2024玄铁RISC-V生态大会上,达摩院院长张建锋给出了这样一组数据:玄铁处理器IP在全球合作授权客户超300个,授权数超过800个,量产出货超过40亿颗。

产品商业化能力展现的同时,张建锋也指出玄铁处理器的下一步演进路径:向PC端、设备端等更高端算力的方向提升。

二、产业迎考

国内一家芯片企业创始人黄文隽,一直在国产GPU架构方向展开自研。提及玄铁处理器,因其多用于控制嵌入式系统操作,普遍应用于IoT(物联网)领域,不免被他吐槽,“很简单的芯片处理器,几分钱一颗,没有技术含量”。

基于RISC-V架构开发的处理器产品,初期确实会被诟病“低性能”“应用窄”。

但软件解决方案提供商——江苏润和软件股份有限公司项目经理魏明冲,在玄铁RISC-V生态大会的展区,向记者现场演示了基于RISC-V架构和开源操作系统,团队在智慧交通领域落地的终端解决方案。在流畅的实时画面背后,魏明冲说,是玄铁的高性能处理器满足了端侧对图像、音视频处理等系列需求。

提及高性能算力芯片,市场的聚光灯往往投注在英伟达、高通等企业及相关产品身上,“它们也都经历了从低性能产品升级进化的过程”,魏明冲希望扭转外界对玄铁的认知偏见。

会上,张建锋并不否认玄铁处理器的多款产品应用于嵌入式系统,但他补充说,在这一应用变得普及后,玄铁处理器在新型算力方面也有突破。

以过去一年发布的三款处理器为例,玄铁C907作为全球首次实现针对AI拓展的处理器,其端到端的性能直接提升了7倍;升级后的玄铁C920,AI性能也提升了4至6倍;玄铁R910则专注在实时领域,代表RISC-V在要求更高的自动驾驶或机器人等领域,进行适配和普及。

因RISC-V指令集免费授权、成本低,“可以让很多芯片厂商甩掉历史包袱”,在魏明冲看来,降低开发成本,避免未来可能被限制的风险,是开源指令集的优势所在。

为研发更高性能的算力芯片,一家名为知合计算的高性能通用可扩展处理器研发商,正与达摩院展开合作,孟建熠成为背后的关键人物。

去年10月,告别平头哥副总裁一职,孟建熠独立创业,成为知合计算的CEO。“希望RISC-V走得更快点”的孟建熠,选择到阿里巴巴的下游去做事。

深度参与玄铁处理器产品从前期规划到更高性能提升的过程后,如今,孟建熠作为玄铁RISC-V生态的一员,想与达摩院一起解决行业难题,“现在缺少真正能够在RISC-V产业里面大规模量产且高性能的芯片”。

会上,达摩院宣布,除了朝AI加速、低功耗、安全等方面升级迭代玄铁的产品线,还计划于今年内推出下一代处理器C930,为RISC-V向更高性能的探索奠定基础。张建锋认为,AI爆发带来新型算力需求的激增,“RISC-V发展正迎来蝶变,产业即将进入应用爆发期”。

如今,李春强接过担子,成为带队达摩院玄铁RISC-V团队的资深技术专家。“大家认为RISC-V是为AI而生的架构。”李春强介绍,团队通过扩展指令定义的方式,把CPU和AI的算力融合起来,使得AI的算法模型可以快速、便捷地跟RISC-V高效融合。“AI原生时代具有扩展性,也需要让更多的硬件资源具备计算能力。”在孟建熠看来,RISC-V天生就应该做好这件事。

而从高性能处理器的角度分析,想要把技术能力拉出来,“边界到底在哪里?”孟建熠认为,这个问题不单单考验着达摩院的玄铁团队,包括知合计算以及更多芯片、系统、软件、终端等产业下游的整个玄铁生态,都需要有所反馈,这样RISC-V才会成为一个正向循环的体系。

三、重塑生态

如何让开源的指令集RISC-V实现产业落地,这是孟建熠、李春强以及玄铁RISC-V团队一直以来的任务。

“在指令集的标准制定或参与,以及处理器之外,还要在工具、操作系统相关的软件方面做很多研发工作和资源投入。”李春强认为,玄铁不只要“打地基”,还要在跟产业链合作的过程中,成为RISC-V生态构建的“牵引线”。

李春强介绍,玄铁已经与国产操作系统openKylin(开放麒麟)、OpenAnolis(龙蜥社区)、openEuler(欧拉系统)、OpenHarmony(开源鸿蒙)等有深度合作,还与国际上的Ubuntu(一个操作系统)、Debian(一个社区)等在RISC-V方向展开紧密的结合,“安卓系统和我们在三四年前就启动了跟RISC-V的融合”。

孟建熠在参加2024玄铁RISC-V生态大会前夕,曾登录GitHub(一个面向开源及私有软件项目的托管平台),对与三大架构(x86架构、ARM架构以及RISC-V架构)相关的项目数据展开搜索。他发现与RISC-V架构相关的项目,已经超过ARM架构相关项目的三分之一。

虽是后来者,RISC-V架构发展的后劲十足。2022年,采用RISC-V架构的处理器实现全球出货规模100亿颗。相较之下,各个架构从提出到出货规模以百亿计,英特尔x86架构历时几十年,ARM用时17年才实现。

罗马不是一日建成的。张建锋总结“市场增长率远远高于以前的传统架构,年均复合增长率保持在40%以上”。

RISC-V的旺盛生命力还反映在开源社区中。成立于2015年的RISC-V基金会,从最初只有17名会员,发展到2024年已有4000名会员。

张建锋看到,全球超过70个国家和地区投入到RISC-V产业中,印度甚至将RISC-V定为国家的发展战略。RISC-V能否长成一个成熟生态,张建锋认为,关键在于其生态是否足够繁荣。

黄文隽的合作伙伴,也有做RISC-V的芯片企业,他的理解是,开源开放的RISC-V生态必然是“覆盖全球的大生态”。从技术到产品齐头并进的迭代,“是按照摩尔定律的节奏在演进。”但黄文隽也看到事情的另一面,“RISC-V的市场太碎片化了”。

当前,芯片领域的架构生态会切入服务器、桌面、移动端这三大类,黄文隽分析认为,玄铁主要做的是比移动端还小的嵌入式处理器,这就必然会让做元器件、系统等硬件、软件的厂商有其独立的生态。

区别于x86、ARM在企业级市场的应用,“RISC-V现在显然不能满足应用需求”,黄文隽还表示,ARM的授权方式是自身把生态做起来,让大家都好用,为每一个场景赋能,但RISC-V是开放授权,这就意味着生态里的参与者各做各的。

在玄铁RISC-V生态大会上,一位行业人士也向记者证实了这一点,尽管行业内有RISC-V基金会牵头,国内推动构建RISC-V生态的阿里巴巴和中国科学院也有交互,但“基本上是各搞各的”。谈及原因,他只留下四个字:商业利益。

与下游厂商一起推动产业软硬件的生态建设,李春强没有回避“钱”的问题,他认为其中最关键的就是“让我们的合作伙伴在RISC-V的生态圈里真正赚到钱”

姜怀所在的公司,正在利用大模型开发企业级AI应用,他个人也对玄铁RISC-V的开源架构生态有所关注。“好不好用。”他又将看似简单的四个字展开解释,开发者看得更多的是“能不能赚到钱,有没有企业买单,竞争对手多不多,架构生态能否为我们的目标服务”。

实际上,达摩院以及玄铁团队也清楚,当RISC-V面向更多不同的应用后,就会面临标准化、碎片化等难题。

一年前,孟建熠把RISC-V比作日出,以形容新架构及生态的光芒已初步照亮了东方。当时,他也强调,“做RISC-V的人不能孤立存在”。

一年后,张建锋站在台上呼吁:“RISC-V要真正走向主流系统,需要更多的标准化,也要更多的生态参与进来。”

走在芯片自主创新之路上的黄文隽认为,“RISC-V是中国芯片产业的机遇”是没法证伪的课题。但他认为,生态是合力构建的结果,从目前行业现实看,中国RISC-V生态仍在建设过程中,任重道远。

采访的最后,丁险峰说他更相信“时间的力量”,从海外一些大厂动辄数十年去做大做强生态的例证看,“不搞十年,怎么可能有生态”。细数达摩院玄铁RISC-V团队诞生至今的历程,丁险峰觉得,“过了五年没死,就很重要”。


(文中黄文隽系化名)

本文来自微信公众号:经济观察报 (ID:eeo-com-cn),作者:钱玉娟

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年3月24日
Next 2024年3月24日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日