速度暴涨1000倍：如何用扩散模型预测化学反应？

2023年12月17日 15:37 • 未来科技

这是MIT和康奈尔大学联合搞出来的一项新研究，用扩散模型来预测化学反应中最关键的过渡态结构，不仅计算速度提升1000倍，结果也意想不到的准确，相关研究工作发表在Nature。

所以，OA-ReactDiff的效果究竟如何，或者说相比其他AI最大的亮点究竟是。

作者们选用了Transition1x作为数据集，这个数据集包含10073个化学反应，每个化学反应分别包含反应物、生成物和经过量子化学计算的过渡态结构，整个体系不超过23个原子。

用扩散模型预测化学反应，速度直接暴涨1000倍！

原本需要用计算机硬算几小时甚至一天，现在单个GPU用6秒钟就能搞定。

这是MIT和康奈尔大学联合搞出来的一项新研究，用扩散模型来预测化学反应中最关键的过渡态结构，不仅计算速度提升1000倍，结果也意想不到的准确，相关研究工作发表在Nature Computational Science上：

其中，麻省理工学院的段辰儒博士是第一加通讯作者。此外，康奈尔大学博士生杜沅岂、麻省理工学院博士生贾皓钧以及麻省理工学院Heather Kulik教授为该论文的共同作者，目前研究已经被MIT News报道。

要知道，预测反应中的过渡态结构远非想象中简单——由于能量较高，它存在的时间往往只有飞秒级，即秒的千万亿分之一。

因此，目前还没有一台实验设备能直接观察它，只能通过量子化学计算的方式来预测，计算量少则几小时，多则数天。

如今用扩散模型就能得到几乎一样的预测结果，这究竟是怎么做到的？

进一步地，用AI预测化学反应，又究竟可以被应用在哪些领域、起到哪些作用？

我们和论文的其中两位作者，来自MIT的段辰儒和康奈尔大学的杜沅岂聊了聊，探讨了一下这项研究具体的原理、背后潜在的应用方向以及关于AI for Science的一些思考。

一、如何用扩散模型预测化学反应？

首先，需要理解为啥过渡态是研究化学反应的关键。

自远古的“炼金术”以来，化学一直是一门了解和控制物质之间相互作用的学科，化学反应又是其中非常核心的概念。

通常来说，一个化学反应由三个东西组成：反应物、生成物和过渡态结构。

反应物和生成物大家都很熟悉了（如氢氧生成水），但实际上，二者之间的过渡态才是解释化学反应的关键——作为化学反应过程中能量最高的状态，过渡态既能用来理解化学反应的机理、也能估算反应速率和能量。

一言以蔽之，要想真正搞懂、设计、优化并调控一个化学反应，就必须从过渡态结构下手。

所以，过渡态结构究竟要如何研究，又为什么需要用AI来做预测？

研究过渡态结构，不能只用分子结构来分析，而要更进一步研究它的3D构象。

分子结构，指为了便于理解化学反应，会人为构造出单双键这样的概念，并用键合关系、原子种类和数量来表示化学反应。

但要想真正精确计算化学反应的速率和能量，就必须要研究原子在3D空间中的位置关系（用3D坐标表示），即3D构象。只有对比原子在3D空间中的位置关系，才能进行量化分析，从而预测反应发生的过程。

然而，相比反应物和生成物，过渡态存在的时间非常短，甚至只有飞秒量级。

受限于实验设备精度，过渡态结构无法用肉眼直接观察，此前只能通过量子力学方法——薛定谔方程来计算。

薛定谔方程，量子力学中的基本方程，描述粒子在某段时间内的状态如何变化。

BUT，手搓薛定谔方程计算量巨大，一个苯环的化学反应可能都需要算上一周时间，尤其随着体系增大（原子数量变多等），计算量更是呈现出指数级增长的趋势。

虽然后来出现了密度泛函理论（DFT）等近似方法加速计算，但算起来还是很慢、有时候甚至因为收敛性的问题导致计算不出来，“成本很昂贵，出错率还高”。

为此，来自MIT和康奈尔大学的研究人员，想到用AI的方法来直接预测过渡态结构，以节省计算量。

之所以选用扩散模型，据杜沅岂介绍，主要有三点原因：

其一，生成效果好。相比GAN，VAE等模型，扩散模型算是生成模型中效果较好的架构。

其二，更适合3D构象。相比分子结构是离散的数据，3D构象是一个连续的数据，且结构上涉及（平移、旋转和置换）对称性。对于离散数据而言，基于机器学习+搜索的模型会比现有的（离散）扩散模型效果更好；但对于3D构象而言，无论是其对称性还是用连续数据表示，反而更适合用扩散模型生成。

其三，扩散模型自身的灵活性，使得它可以在生成时，保留一部分原有设计、填补剩余的部分，也使得它对于设计新的化学反应更有帮助。

具体到架构设计上，作者们将等变GNN融入到扩散模型中，设计了一种名叫OA-ReactDiff的结构，其中等变GNN能很好地处理并保留数据的对称性。

所以，OA-ReactDiff的效果究竟如何，或者说相比其他AI最大的亮点究竟是？

段辰儒表示，这项研究最核心的亮点主要有两个。

一个是预测准确性，OA-ReactDiff的准确性超过了之前的一系列AI模型。

这其中的9000个化学反应用作模型训练，1073个作为测试集，最终实现了0.183Å（1Å=0.1纳米）的平均均方根偏差和0.076Å的中位数均方根偏差。

相比于其他机器学习方法如PSI-based和NeuralNEB，OA-ReactDiff准确性都要更高。

与此同时，在没有刻意训练的情况下，OA-ReactDiff在更大的体系上也表现出了良好的预测能力。

另一个是预测速度，OA-ReactDiff相比现有的计算方法，至少能快上1000倍。

这是因为，原本密度泛函理论算法的时间复杂度在O(N³)级别，但现在基于OA-ReactDiff的方法，直接将时间复杂度降低到O(N²)。

反映到现有数据集上，原本需要计算几小时甚至一天的化学反应，现在用OA-ReactDiff，只需要6秒钟就可以搞定。

进一步地，体系越大的化学反应，用扩散模型做预测的提速效果还会越好。

不过，这项研究究竟能被用在哪些地方呢？

我们也问了问两位作者关于这项研究潜在的应用、以及对于“用AI搞科学研究”这件事本身的看法。

二、可用于燃料药物辅助设计

对于研究本身，段辰儒认为主要有三个方面的作用。

最直观的一方面，自然是催化剂的设计了。

这也是研究人员接下来想要继续探索的方向，即继续扩展模型本身，加入催化剂等条件，并用AI来预测过渡态。

而在研究催化剂的基础上，又能进一步辅助燃料设计和新药开发。

以燃料为例，虽然涉及的燃烧反应体系往往不大，但发生反应的过程却极易被环境和条件影响。

因此，如果用AI来辅助预测化学反应的过程，或许能更快基于不同燃料发生反应的环境条件来预测效果。

这样一来，对于能源行业甚至航天行业也会产生进一步的影响。

最后，就是模拟自然界化学反应，来帮助开发新的理论研究。

像是模拟地球生命早期可能发生的反应、或是探索行星气体之间的相互作用等，通过用AI预测过渡态，也可能更快发现或验证新的理论，探究生命起源的意义。

听起来，AI似乎已经给化学研究带来了不少新的突破。

结合这段时间AI在生物制药（AlphaFold2）、以及材料学（GNoME）上取得的种种突破，对于生化环材这一系列理论学科而言，AI是否已经成为了新的技术主流路线？

更激进一点来说，对化学本身而言，未来AI是否会取代一部分现有的量子化学研究？

对此，两位作者均持有相同的观点，即AI（至少就监督模型而言），现阶段对于这些学科的影响力依旧是一种工具，而并非一条全新的技术路径。

这是因为，目前生化环材任何一个学科借助AI辅助研究的前提，依旧是已经有了一定的理论，而AI作为工具起到的是“锦上添花”的作用。

换言之，AI与这些学科的其他研究方法依旧是共存关系，并不会出现“替代”的情况。段辰儒对此做了一个有意思的比喻：如果化学学科好比一个夹馍，机器学习方法和各种现有的化学方法，就是不同的食材。那夹馍里面可以夹肉，也可以夹其他的菜。

以近期大火的Google Deepmind研究GNoME为例，就是一个很好的“AI当工具人”的例子。

杜沅岂认为，如果从ML专业的角度去看待GNoME中涉及的AI方法，会发现它其实并不是最新的东西，像是其中涉及的几何深度学习，已经是这几年比较流行的研究方向。

但如果从材料学科的角度去看，这样大规模、高通量的稳定材料搜索，肯定还是有相当的科学意义在其中：AI for Science本身，其实更侧重的是“Scientific Discovery”，它更大的意义在于科学发现。

而段辰儒认为，从应用的角度而言，无论是材料发现，还是预测化学反应，最终用AI去加速落地的宗旨依旧是“有用”二字：正如这届NeurIPS AI4Science的workshop主题一样，“从理论到实践“。我认为这是AI4Science后面十年的必经之路，也是AI4Science的中期使命。

像OA-ReactDiff接下来的目标是找到一个可以应用的路径一样，GNoME发现220万稳定材料也只是应用的一个起点，接下来还需要很多的标准（如导热、导电等），才能让化学和材料真正在某一行业“发光发热”。

本文来自微信公众号：量子位（ID：QbitAI），作者：萧箫，文章链接：C. Duan*， Y. Du， H. Jia， and H. J. Kulik， “Accurate transition state generation with an object-aware equivariant elementary reaction diffusion model”， Nat. Comput. Sci.， ASAP， https://rdcu.be/dtGSF; https://www.nature.com/articles/s43588-023-00563-7

声明：该内容为作者独立观点，不代表新零售资讯观点或立场，文章为网友投稿上传，版权归原作者所有，未经允许不得转载。新零售资讯站仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。如对本稿件有异议或投诉，请联系：wuchangxu@youzan.com

Like (0)

AI会使社会结构发生变化吗？

Previous 2023年12月17日

在短刀电池尝到甜头的蜂巢，这次要All in了

Next 2023年12月18日

水温80度：AI行业真假繁荣的临界点

我们从来没拥有过这么成功的AI主导的产品。

（这种分析统计并不那么准，但大致数量级是差不多的）

这两个产品碰巧可以用来比较有两个原因：

一个是它们在本质上是一种东西，只不过一个更通用，一个更垂直。

蓝海的海峡

未来成功的AI产品是什么样，大致形态已经比较清楚了，从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时“罢工”，全网打工人都慌了

美西时间午夜12点开始，陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载，忽然无法正常工作了。

因为发现AI用久了，导致现在“离了ChatGPT，大脑根本无法运转”。”

等等，又不是只有一个聊天机器人，难道地球离了ChatGPT就不转了。

大模型连崩原因猜想，谷歌躺赢流量激增6成

GPT归位，人们的工作终于又恢复了秩序。

未来科技 2024年6月5日
ChatGPT宕机8小时，谷歌Gemini搜索量激增60%

ChatGPT一天宕机两次

谷歌Gemini搜索量激增近60%

ChatGPT在全球拥有约1.8亿活跃用户，已成为部分人群工作流程的关键部分。

过去24小时内提交的关于OpenAI宕机的问题报告

图片来源：Downdetector

ChatGPT系统崩溃后，有网友在社交媒体X上发帖警告道：“ChatGPT最近发生的2.5小时全球中断，为我们所有依赖AI工具来支持业务的人敲响了警钟。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时大崩溃，AI集体罢工让全网都慌了

接着OpenAI也在官网更新了恢复服务公告，表示“我们经历了一次重大故障，影响了所有ChatGPT用户的所有计划。Generator调查显示，在ChatGPT首次故障后的四小时内，谷歌AI聊天机器人Gemini搜索量激增60%，达到327058次。

而且研究团队表示，“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关，显示出用户把Gemini视为ChatGPT的直接替代选项。

未来科技 2024年6月5日
深度对话苹果iPad团队：玻璃的传承与演变

iPad最为原始的外观专利

没错，这就是iPad最初被设想的样子：全面屏，圆角矩形，纤薄，就像一片掌心里的玻璃。

2010年发布的初代iPad

好在乔布斯的遗志，并未被iPad团队遗忘。

初代iPad宣传片画面

乔布斯赞同这一想法，于是快速将资源投入平板电脑项目，意欲打造一款与众不同的「上网本」，这就是iPad早年的产品定义。

iPad进化的底色

苹果发布会留下过很多「名场面」，初代iPad发布会的末尾就是一例。

未来科技 2024年6月5日
底层逻辑未通，影视业的AI革命正在褪色…

GPT、Sora均为革命性产品，引发了舆论风暴，但它在上个月发布的“多模态语音对谈”Sky语音，却由于声音太像电影明星斯嘉丽·约翰逊，被正主强烈警告，被迫下架。

华尔街日报也在唱衰，认为“AI工具创新步伐正在放缓，实用性有限，运行成本过高”：

首先，互联网上已经没有更多额外的数据供人工智能模型收集、训练。

03、

如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向，那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

但分歧点正在于此，电影公司希望通过使用AI技术来降低成本，但又不希望自己的内容被AI公司所窃取。

未来科技 2024年6月5日
KAN会引起大模型的范式转变吗？

“先变后加”代替“先加后变”的设计，使得KAN的每一个连接都相当于一个“小型网络”，能实现更强的表达能力。

KAN的主要贡献在于，在当前深度学习的背景下重新审视K氏表示定理，将上述创新网络泛化到任意宽度和深度，并以科学发现为目标进行了一系列实验，展示了其作为“AI+科学”基础模型的潜在作用。

KAN与MLP的对照表：

KAN使神经元之间的非线性转变更加细粒度和多样化。

未来科技 2024年6月5日
这个国家，也开始发芯片补贴了

//mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
[4]中国安防协会：欧盟批准430亿欧元芯片补贴计划：2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
[6]潮电穿戴：印度半导体投资大跃进，一锤砸下1090亿，政府补贴一半.2024.3.5https。

未来科技 2024年6月5日
大模型的电力经济学：中国AI需要多少电力？

这些报告研究对象（数字中心、智能数据中心、加密货币等）、研究市场（全球、中国与美国等）、研究周期（多数截至2030年）各不相同，但基本逻辑大同小异：先根据芯片等硬件的算力与功率，计算出数据中心的用电量，再根据算力增长的预期、芯片能效提升的预期，以及数据中心能效（PUE）提升的预期，来推测未来一段时间内智能数据中心的用电量增长情况。

未来科技 2024年6月5日
你正和20万人一起接受AI面试

原本客户还担心候选人能否接受AI面试这件事，但在2020年以后，候选人进行AI面试的过程已经是完全自动化的，包括面试过程中AI面试官回答候选人的问题，AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

以近屿智能与客户合作的校验周期至少3年来看，方小雷认为AI应用不太可能一下子爆发，包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

未来科技 2024年6月4日

速度暴涨1000倍：如何用扩散模型预测化学反应？

相关推荐

Share To :