算力的尽头其实是电力?

不仅需要引导数据中心向西部布局靠近发电侧,同时也要在已经布局的数据中心和算力中心附近,积极布局分布式可再生能能源,而且要源网荷储一体化考虑,在满足总量需求的同时,尽可能通过微网实现就地峰谷平衡,减少弃风弃光。

综上,随着AI技术的迅速发展,我们正面临着日益增长的电力需求,这不仅对电网构成挑战,也为可再生能源的整合和利用提出了新的机遇。

最近科技圈的两个热点:一个是微软的AI搞崩了电网,让大家担心未来电不够用;另一个是小米发布了纯电SU7,再一次掀起了人们对电动汽车的兴趣。这两件事的共同点是,都与人工智能和电密切相关,而从更深层次去探讨,后者可能还真是前者的解药。

马斯克和黄仁勋最近都提出“算力的尽头是电力”等观点,还没几天,就一语成谶:微软的算力中心搞崩了电网。

所以这是不是一个在我国也会很快发生的大问题呢?网上有很多说法,有的过于乐观,而有的又过于悲观,这里简单分析一下。

简单的事实是,微软训练GPT-6的十万H100卡集群,需要空间集中,而集中在一个州内,电网就会崩溃。这里用到的Infiniband,原本是英伟达用来保证数据中心内部互联的高带宽低时延技术,即使还有NVIDIA MetroX远程互连系统,也无法保证超过40公里的长距离链接。

长远来看,这是一个典型的跨系统城市/区域空间统筹问题,并不是单纯的电力系统或者算力系统技术改进就可以搞定的,而且我国的实际情况与美国差异很大,需要不同的应对策略。

这是创业者Kyle Corbitt在社交媒体上,分享自己与一位微软工程师关于GPT-6训练集群项目的对话

一、宏观层面

根据国际能源署(IEA)发布的《电力 2024——到2026年的分析与预测》,2022年数据中心、人工智能(AI)和加密货币行业的全球电力消耗占比为2%,预计到2026年将翻倍至1000太瓦时以上。尽管如此,全球总用电量的年增长率预计仅为3.4%,而中国的用电量年增幅是这一数字的两倍。

此外,一项去年十月发表在《焦耳》杂志的研究预测,到2027年,全球新制造的服务器与AI相关的电力消耗可能增至85.4至134.0太瓦时,占全球当前用电量的0.5%。数据中心的电力需求预计将以13%至15%的复合年增长率快速上升。

中国的年发电量约为9000太瓦时,其中可再生能源装机容量占比已过半,并以每年超过20%的速度增长(国家能源局网站)。尽管AI和数据中心的算力增长迅猛,但鉴于其在整体电力消耗中所占比例较小,甚至可以说,短期内全球电力需求的增长都可以被中国可再生能源发电的增长所平衡。

当然,考虑到可再生能源的波动性和季节性,以及电网调度的复杂性,我们仍需保持谨慎。事实上,中国经济增长预计将放缓并减少对重工业的依赖,所以用电总需求的增速可能还会逐年下降,所以我们通常并不担心发电不够用,而是发愁需求不足,尤其是稳定需求不足。

而美国的用电/发电量本来已经多年基本停止增长,无论是大型电厂建设还是风光发电产能,仓促间难免赶不上AI产业的狂飙突进,所以大厂们都要自行建设各类电厂解决,并寄希望于可控核聚变的快速实现。

其实,美国也正在通过一系列联邦资助计划和创新技术投资,推进电网现代化和可再生能源集成,旨在提高电网的韧性、可靠性和效率,同时加速实现清洁能源转型和脱碳目标。这不刚刚,拜登政府还提供专项贷款,首次重启了密歇根州的一座核电站。人家整体的技术实力和远见毋庸置疑,还远没到我们看笑话的时候。

二、中观层面

在中观层面,能源的空间供需不平衡和跨区域调度的挑战尤为突出。人工智能在训练阶段对算力的集中需求可能导致电网局部出现突发性高负荷,这对电网的稳定性构成了考验。

美国的电网基础设施,多数建成于上世纪60至70年代,已显陈旧,且有70%的输电线路和变压器运行超过25年,极端天气事件频发导致的大规模停电现象,凸显了电网现代化的迫切需求。相比之下,中国拥有全球最大规模的特高压输电网,有效实现了电力的远距离输送和区域互补,展现出在应对电力供需不平衡方面的独特优势。

然而,长距离能源转移的损耗和技术挑战不容忽视,因此,长远来看,推动区域内的可再生能源生产和消费,实现就近消纳,才是最优解。

可再生能源如风能和太阳能的波动性和不可预测性,以及电力需求的峰谷变化,加剧了能源在时空分布上的不均衡,这是电力系统面临的关键问题。

我国“东数西算”战略的目标之一就是利用大型数据中心,消纳西部风光发电资源。但由于西部远离经济中心和负荷中心,无法解决低时延需求,往往只能实现温冷数据的“东数西存”。而人工智能、尤其是大模型训练阶段的新增算力需求,需要集中布局,而且可以根据能源情况调整计算资源,比较适合在西部水、电资源丰富地区重点布局。

早在2020年,发改委就出台了《关于加快构建全国一体化大数据中心协同创新体系的指导意见》提出要探索电力网和数据网联动建设、协同运行机制。2021 年,工信部出台《新型数据中心发展三年行动计划(2021-2023 年)》鼓励企业探索建设分布式光伏发电、燃气分布式供能等配套系统,引导新型数据中心向新能源发电侧建设,就地消纳新能源。

三、微观层面

微观来看,短期内快速增长的人工智能算力需求,尤其是靠近需求侧的推理阶段需求,仍然有大量需要在东部解决,实现1ms时延城市算力网、5ms时延区域算力网

这就需要重新思考在数据网和电力网的分布式联动与微观布局协同。不仅需要引导数据中心向西部布局靠近发电侧,同时也要在已经布局的数据中心和算力中心附近,积极布局分布式可再生能能源,而且要源网荷储一体化考虑,在满足总量需求的同时,尽可能通过微网实现就地峰谷平衡,减少弃风弃光。

除了大型的风光电站,与城乡建筑、农业设施等结合的分布式BIPV(光伏建筑一体化)、光储直柔一体化等也应被更多关注。

由于风光发电的不稳定性,在足够的发电装机容量之外,就近布局的储能设施是非常重要的要素。在常见的锂电储能之外,还有成本更低更安全但需要适宜条件的抽水储能,适合时空转移储运的氢储能。

另一个常被忽略的重要要素,就是新能源汽车的分布式储能能力,也是我国未来能源领域最大的潜在优势所在。我国光伏、电动汽车和锂电产能都是遥遥领先,随着电池充放电次数和寿命不断提高,数亿辆电车利用峰谷电价差储能并反向回供电网,基本可以实现零成本用车甚至盈利,也同时会完全解决调峰问题。这需要电价政策、基础设施建设、政策支持和用户行为等多方面的配合。这也是为什么本文标题是“算力的尽头是电动车”。整个算力网络、输电网络、分布式能源网络,与车辆/充电网络的高度耦合,也许才是解决我国未来能源问题的终极解药。

此外,AI与电力系统还有另一层关系:其本身也是电力系统高效调度的保证。人工智能通过其强大的数据处理和分析能力,为电网和可再生能源网络的高效调度提供了多种解决方案。从预测和优化到自动化控制,再到能源存储管理和需求响应,AI技术的应用不仅提高了电网的运行效率,还有助于实现能源系统的绿色低碳转型。AI甚至可以使AI推理和训练计算任务本身,变成电网最需要的可动态响应的需求,从沉重的增量负荷,成为削峰填谷和时空平衡的灵药。

谷歌案例:新型碳智能计算平台

我们在可持续发展方面的最新进展是由一个工程师小组开发的,这是一个新的碳智能计算平台。我们为超大规模(意味着非常大)的数据中心设计并部署了这个首创的系统,将许多计算任务的时间安排到风能和太阳能等低碳能源最充足的时候。

无需额外的计算机硬件即可完成此操作,并且不会影响人们全天候依赖的搜索、地图和 YouTube 等 Google 服务的性能。改变非紧急计算任务的时间安排(例如在 Google Photos 上创建新的过滤功能、YouTube 视频处理或在 Google Translate 中添加新单词)有助于减少电网的碳足迹,让我们更接近 24×7 无碳能源。

每天,在每个 Google 数据中心,我们的碳智能平台都会比较第二天的两种类型的预测。其中一项预测是当地电网平均每小时碳强度在一天中将如何变化。另一项预测了数据中心在同一时期执行其计算任务所需的每小时电力资源。然后,我们使用这两个预测来优化每小时策略,以使计算任务与低碳电力供应时间保持一致。早期结果表明碳意识负荷转移是有效的。我们的试点结果表明,通过转移计算工作,我们可以增加消耗的低碳能源量。

我们试点的数据,说明了新系统如何将计算从我们的基线(虚线)转移到更好地与一天中碳密集度较低的时间(例如清晨和傍晚(实线))保持一致,此时风能最充足。灰色阴影代表一天中电网上存在更多碳密集型能源的时间。

综上,随着AI技术的迅速发展,我们正面临着日益增长的电力需求,这不仅对电网构成挑战,也为可再生能源的整合和利用提出了新的机遇。其重点并不是电力的总量不足,而是供需的时空不平衡

在这个背景下,电动车不仅是新能源应用的一个重要方向,更可能是实现能源网络与算力网络相互支撑、共同发展的关键链接。通过智能调度和技术创新,可以有效地平衡能源供需,提高系统的整体效率和可持续性。解决这些复杂问题的关键在于多领域的协同创新和战略统筹,构建相互促进、可持续的能源-算力一体健康发展的未来。

除此之外,这一复合系统的复杂性还表现在水、土地等资源的统筹。此外,明显效率低下的Transformer架构是否会长期维持Scaling up,如果会被更优雅的算法取代,也许就不需要为能源和碳排放而如此忧虑。其训练阶段的算力集中,也并非没有技术上的解决方案。这些就不在这里展开讨论了。

本文来自微信公众号:腾讯研究院 (ID:cyberlawrc),作者:王鹏

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年4月3日 18:16
下一篇 2024年4月3日 18:36

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日