从爱因斯坦到ChatGPT，颠覆性的科研工作越来越少了？

2023年12月25日 16:41 • 未来科技

最近两三年AI发展之势迅猛，AlphaGo之于围棋，AlphaFold之于计算生物物理，ChatGPT之于自然语言模型等等，多个领域都有了“颠覆性”的科技突破。

这是2023年初在Nature上发表的一篇科学情报学论文的名场面图片：颠覆性科学在萎缩。

作者考察每一篇论文或专利的文献引用情况：它引用了哪些文献，被哪些文献引用。

在理想情形下，一篇论文或专利，所有引用它的文献都不去引用它所引用的文献，那么这篇论文或专利就达到了最大颠覆性，CD值。

我对这个话题好奇的缘起是上周 Nature 上发表的一篇编辑部评论（Editorial）：《从爱因斯坦到AI：100年光阴如何改变科学》。

编辑部评论通常都很短，这篇也不例外。这篇评论本身说的：“过去100年产生的一些重大科研进展，深刻地塑造了今天的科学格局，而今天的重大科研进展也将深刻地塑造明日的科研格局，但是，塑造的方式是不确定的。”

这些重大科学突破中的一些从一开始就大大改善了人类的工业化条件，从而大大提升了人类的生活质量。如比利时化学家利奥·贝克兰在1907年将他发明的塑料商业化。但是，因为很长时间内，缺乏监管，这些科技突破对地球和人类也造成了巨大伤害。

也就是说，这篇 Nature 编辑部评论想说的是：监管。

最近两三年AI发展之势迅猛，AlphaGo之于围棋，AlphaFold之于计算生物物理，ChatGPT之于自然语言模型等等，多个领域都有了“颠覆性”的科技突破。

这些AI领域的突破，放诸百年后，会被怎样看待？未来之视今，犹如今之视昔乎？

这些AI领域的成就会因为今天的缺乏监管，而在未来逐渐伤害人类吗？因此，Nature 编辑部呼吁建立全球性的监管协议（to be governed by global agreements）—— 放任自流绝对不行。

以上，这篇短篇的编辑部评论就基本说完了。这不是引发小王兴趣的内容。

我感兴趣的是Nature编辑部的“话引子”，即七拐八歪从100年前的塑料、合成氨、相对论勾连到mRNA、ChatGPT的引子 —— “颠覆性创新”，英文是disruptive innovation。

20世纪初的颠覆性创新有：1900年马克思·普朗克的量子物理，1905年爱因斯坦的光电效应、布朗运动、狭义相对论和质能方程，1910年摩根发现基因，1925年雷蒙德·达特证明非洲是人类发源地等等。

21世纪初的颠覆性创新有：2001年人类基因组计划，2012年的CRISPR基因编辑、希格斯玻色子，2015年的引力波等等。

但是，科学界有一个主流共识：颠覆性的创新越来越少，科技创新的颠覆性也越来越低。

这是2023年初在Nature上发表的一篇科学情报学论文的名场面图片：颠覆性科学在萎缩 —— 各个领域：社会科学、技术、物理科学、生物科学和医药，都如此。

这篇论文的标题是《论文和专利都正在随时间变得不颠覆》。通讯作者罗素·方克来自明尼苏达大学卡尔森管理学院。

所以，“颠覆性”怎么定义？怎么度量？

作者使用CD指数来衡量科技颠覆性。CD指数的范围是-1到1，1代表最大知识颠覆（disruptive），-1 代表最大知识固化（consolidating）。

作者考察每一篇论文或专利的文献引用情况：它引用了哪些文献，被哪些文献引用。

在理想情形下，一篇论文或专利，所有引用它的文献都不去引用它所引用的文献，那么这篇论文或专利就达到了最大颠覆性，CD值 = 1。

这个定义的假设是：一篇论文或专利能够对先前的已经发表的文献构成最大的颠覆，意味着，它的后续工作都不必引用比它更早的工作，只引用它就足够。

打个比方，一个人站在巨人的肩膀上，如果这个人也足够巨大，那么之后的人统统都只踩在这个人肩膀上就行了，而不必再去落脚在前一个巨人肩膀。

我举一个直观的例子：AlphaFold2的Nature论文。

这篇在2021年6月上线的论文目前已经被引用超过10000次，而其本身则引用了84篇论文。我没有去按定义计算它的CD值，但是我认为它的CD值会很高。

我只在这里提出直观的观察。我在谷歌学术订阅了这篇论文的引用邮件，会收到谷歌学术定时发来的引用情况，即这篇论文又被哪些新的论文或专利引用。我注意到，许多远离蛋白质结构预测的领域也在引用AlphaFold2。比如，关于美国南部某种蝴蝶的基因突变；又比如，种猪养殖中的AI应用。这些论文引用AlphaFold2的前导论文的可能性是非常低的。

下面是我随手找的一篇Agriculture杂志在2023年发表的一篇论文，标题是关于罗马尼亚绵羊育种相关基因和蛋白。工作来自罗马尼亚首都的布加勒斯特大学，应该是这个国家顶级的学府吧。这篇论文引用了AlphaFold2，还引用错了 —— 用了AlphaFoldsimulation的说法（可见作者不懂蛋白计算），还没引用原文 —— 引了ColabFold。无论如何，罗马尼亚绵羊绝不会去踩AlphaFold2所踩的肩膀。

也就是说，许多原本根本不会使用蛋白结构预测的研究，因为AlphaFold2而关注到深度学习+蛋白结构预测工具的潜力，愿意亲自上手试一试，或者愿意在写文章的时候提一嘴，哪怕自己也没用。

通俗地讲，AlphaFold2出圈了。这是颠覆。

颠覆的对立面是固化。一篇论文或专利，所有引用它的文献都同时去引用它所引用的文献，那么这篇论文或专利就达到了最大的知识巩固性，CD 值 = -1。某种意义上，这样的工作是对前面工作的完全巩固，完全没有颠覆性。

同样打个比方，一个人站在巨人的肩膀上，它之后的人全部一只脚踩它，另一只脚踩前一个巨人的肩膀。

那么，能否说：即便没有这篇论文或专利，引用它的工作也完全能抛开它，而基于之前的工作做出？我觉得应该是。

罗素·方克等作者计算了几百万篇论文的CD 值，并特别考察了有史以来所有诺贝尔奖得主的得奖论文（导致作者得奖的那一篇），如下图：

1928年，狄拉克，量子力学的狄拉克方程，CD = 1。

1953年，沃森 & 克里克，DNA双螺旋结构（诺奖），CD = 0.62。

1965年，空 & 山，电子结构的Kohn-Sham方程（诺奖），CD = -0.22。

1970年，巴尔的摩，RNA 逆转录（诺奖），CD = -0.55。

从数据上看，诺贝尔奖的获奖工作的颠覆性也是随时间下降的。

作者尝试对这一现象给出解释：

（1）现代科研工作引用的文献所涉及领域越来越少，即现代科学的单一论文所需求和影响的领域越来越狭窄。这表明现代科学越发单一化、专业化。

（2）现代科学文献的自引用情况越来越多。这表明科研工作者的路径依赖越来越大，即科研工作者习惯于沿着一条研发路线一直前进，因而越发依赖于已行进路线上的老知识。

（3）现代科研工作的平均被引用时间在增长。过去一篇论文可能经过3年就很少被引用，而现在可能经过5年还有较多引用。这可能是因为现代科学更新速度太快，以至于学者都跟不上了，从而只能依赖于自己所熟悉的更老的论文。

小王觉得有些道理。数据就是证据。

小王觉得有些“颠覆”思维的是：居然DNA双螺旋结构发现的颠覆度只有0.6，而空山方程不仅没有颠覆，颠覆度还是负的。

可见，直觉不靠谱。

我觉得颠覆的，对相关领域的专业学者则未必然 —— 有的工作虽然重要，但属于临门一脚，谈不上太多颠覆。

在相应领域浸淫已久的学者，可能会从其领域的发展历史脉络，轻易说明某工作的重要性和颠覆性有几何。因此，讨论科技史，应当建立在谨慎而细致的学科发展梳理和全面而大量的跨学科数据分析的基础上。非相关领域的学者，或非学者，应慎言。

参考文献

[1] https://www.nature.com/articles/d41586-023-04021-2

[2] https://www.nature.com/articles/s41586-022-05543-x

本文来自微信公众号：小王随笔（ID：xiaowang_essay），作者：小王随笔

声明：该内容为作者独立观点，不代表新零售资讯观点或立场，文章为网友投稿上传，版权归原作者所有，未经允许不得转载。新零售资讯站仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。如对本稿件有异议或投诉，请联系：wuchangxu@youzan.com

Like (0)

消费里躺赚的龙头，遭外资狂卖，内资却不断吃进，究竟谁傻？

Previous 2023年12月25日 16:10

白酒行业2023：跨界、去库存和搞投资

Next 2023年12月25日

水温80度：AI行业真假繁荣的临界点

我们从来没拥有过这么成功的AI主导的产品。

（这种分析统计并不那么准，但大致数量级是差不多的）

这两个产品碰巧可以用来比较有两个原因：

一个是它们在本质上是一种东西，只不过一个更通用，一个更垂直。

蓝海的海峡

未来成功的AI产品是什么样，大致形态已经比较清楚了，从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时“罢工”，全网打工人都慌了

美西时间午夜12点开始，陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载，忽然无法正常工作了。

因为发现AI用久了，导致现在“离了ChatGPT，大脑根本无法运转”。”

等等，又不是只有一个聊天机器人，难道地球离了ChatGPT就不转了。

大模型连崩原因猜想，谷歌躺赢流量激增6成

GPT归位，人们的工作终于又恢复了秩序。

未来科技 2024年6月5日
ChatGPT宕机8小时，谷歌Gemini搜索量激增60%

ChatGPT一天宕机两次

谷歌Gemini搜索量激增近60%

ChatGPT在全球拥有约1.8亿活跃用户，已成为部分人群工作流程的关键部分。

过去24小时内提交的关于OpenAI宕机的问题报告

图片来源：Downdetector

ChatGPT系统崩溃后，有网友在社交媒体X上发帖警告道：“ChatGPT最近发生的2.5小时全球中断，为我们所有依赖AI工具来支持业务的人敲响了警钟。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时大崩溃，AI集体罢工让全网都慌了

接着OpenAI也在官网更新了恢复服务公告，表示“我们经历了一次重大故障，影响了所有ChatGPT用户的所有计划。Generator调查显示，在ChatGPT首次故障后的四小时内，谷歌AI聊天机器人Gemini搜索量激增60%，达到327058次。

而且研究团队表示，“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关，显示出用户把Gemini视为ChatGPT的直接替代选项。

未来科技 2024年6月5日
深度对话苹果iPad团队：玻璃的传承与演变

iPad最为原始的外观专利

没错，这就是iPad最初被设想的样子：全面屏，圆角矩形，纤薄，就像一片掌心里的玻璃。

2010年发布的初代iPad

好在乔布斯的遗志，并未被iPad团队遗忘。

初代iPad宣传片画面

乔布斯赞同这一想法，于是快速将资源投入平板电脑项目，意欲打造一款与众不同的「上网本」，这就是iPad早年的产品定义。

iPad进化的底色

苹果发布会留下过很多「名场面」，初代iPad发布会的末尾就是一例。

未来科技 2024年6月5日
底层逻辑未通，影视业的AI革命正在褪色…

GPT、Sora均为革命性产品，引发了舆论风暴，但它在上个月发布的“多模态语音对谈”Sky语音，却由于声音太像电影明星斯嘉丽·约翰逊，被正主强烈警告，被迫下架。

华尔街日报也在唱衰，认为“AI工具创新步伐正在放缓，实用性有限，运行成本过高”：

首先，互联网上已经没有更多额外的数据供人工智能模型收集、训练。

03、

如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向，那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

但分歧点正在于此，电影公司希望通过使用AI技术来降低成本，但又不希望自己的内容被AI公司所窃取。

未来科技 2024年6月5日
KAN会引起大模型的范式转变吗？

“先变后加”代替“先加后变”的设计，使得KAN的每一个连接都相当于一个“小型网络”，能实现更强的表达能力。

KAN的主要贡献在于，在当前深度学习的背景下重新审视K氏表示定理，将上述创新网络泛化到任意宽度和深度，并以科学发现为目标进行了一系列实验，展示了其作为“AI+科学”基础模型的潜在作用。

KAN与MLP的对照表：

KAN使神经元之间的非线性转变更加细粒度和多样化。

未来科技 2024年6月5日
这个国家，也开始发芯片补贴了

//mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
[4]中国安防协会：欧盟批准430亿欧元芯片补贴计划：2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
[6]潮电穿戴：印度半导体投资大跃进，一锤砸下1090亿，政府补贴一半.2024.3.5https。

未来科技 2024年6月5日
大模型的电力经济学：中国AI需要多少电力？

这些报告研究对象（数字中心、智能数据中心、加密货币等）、研究市场（全球、中国与美国等）、研究周期（多数截至2030年）各不相同，但基本逻辑大同小异：先根据芯片等硬件的算力与功率，计算出数据中心的用电量，再根据算力增长的预期、芯片能效提升的预期，以及数据中心能效（PUE）提升的预期，来推测未来一段时间内智能数据中心的用电量增长情况。

未来科技 2024年6月5日
你正和20万人一起接受AI面试

原本客户还担心候选人能否接受AI面试这件事，但在2020年以后，候选人进行AI面试的过程已经是完全自动化的，包括面试过程中AI面试官回答候选人的问题，AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

以近屿智能与客户合作的校验周期至少3年来看，方小雷认为AI应用不太可能一下子爆发，包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

未来科技 2024年6月4日

从爱因斯坦到ChatGPT，颠覆性的科研工作越来越少了？

相关推荐