陶哲轩转发、菲尔兹奖得主领衔:AI正在颠覆数学家?

他们提出的观点包括:

AI的数学能力不完全反映人类的认知过程,依赖于训练数据中的模式,而不是真正理解问题的本质。

交互式证明系统与软件工程中的“规范驱动开发”,可以降低数学家的认知负荷、促进数学家之间的合作。

Buzzard认为,这些新兴技术可以帮助数学家突破认知障碍,探索更加复杂和更加新颖的数学领域,并最终改变数学家的工作方式,使他们能够将更多时间和精力投入到数学思维和理解上。

陶哲轩点赞转发,《美国数学学会通报》用一整期特刊介绍了AI给数学带来的改变

这些文章读起来很有趣,尽管使我自己即将发表的一篇文章显得多余……这个领域发展太快了!

作者阵容非常豪华,包括菲尔兹奖得主Akshay Venkatesh、华裔数学家郑乐隽计算机科学家Ernest Davis等多位知名学者。

其中郑乐隽表示,如果最终机器能做得比人类更好,那很好,她将乐意退出数学领域去弹钢琴。

他们提出的观点包括:

  • AI的数学能力不完全反映人类的认知过程,依赖于训练数据中的模式,而不是真正理解问题的本质。

  • 合成数学如合成拓扑学和合成微分几何学,提供了一种全新的数学实践方式,允许数学家专注于更深层次的概念和问题。

  • 交互式证明系统与软件工程中的“规范驱动开发”,可以降低数学家的认知负荷、促进数学家之间的合作。‍

  • 形式化证明技术可能改变数学证明的本质、颠覆数学家的工作方式。‍

  • 数学界不应被科技公司主导的议程所绑架。‍‍‍‍‍‍‍‍‍‍‍‍‍

在开篇,编委会写道:

纯粹的数学家习惯于享有很大程度的研究自主和智力自由,这是一种脆弱而宝贵的遗产,可能会因机器的盲目使用而被扫除。

另一方面,对同一技术进行深思熟虑和深思熟虑的方法可能会极大地丰富我们的学科。

学科应该如何发展是由我们自己决定的,因此我们邀请数学界认真思考和讨论专刊中提出的问题,并聆听其他领域同行对这些问题进行了深入思考。

现在,是数学家们了解并推动这场辩论,并决定学科未来方向的时候了。

AI能自动证明定理吗?

计算机已经在数学中发挥了重要作用,尤其是在计算效率方面的提升,但是否能够帮助人类进行数学推理?有一天它们是否会自主进行推理?

数学家Kevin Buzzard概述了神经网络、计算机定理证明器和大型语言模型的最新发展。

Kevin Buzzard现任英国伦敦帝国理工学院数学教授,他专门研究算术几何和朗兰兹纲领。

回顾整个计算工具的历史,最早Computer一词还指人类作为“计算员”,他们的成就不应被低估。

17世纪早期,苏格兰数学家John Napier构造了第一个对数表,他提出如果有更多“计算员”来帮忙,就可以进一步推进这一工作。

另一个代表性成果是Felkel和Vega在18世纪70年代发表的整数因式分解表,这使研究素数分布成为可能,最终导致了素数定理的证明。

早期电子计算机出现后,机器在高速计算方面已经远超人类,Computer一词的含义也发生了变化。

如剑桥大学在1957年购买了EDSAC II计算机,用于海洋学计算,为现代板块构造理论奠定基础。

这个阶段计算机还只是一个工具,即使目前的计算机也难以像人类一样进行数学推理和定理证明。

神经网络可以用于搜索定理、猜测新定理和寻找反例,如发现了拓扑学中关于结点和边的关系的新定理,以及在表示论中发现了关于Kazhdan-Lusztig多项式的新结果,但对于证明深奥复杂的定理还有局限性。

自动定理证明系统(ATP)可以自动证明一些复杂的定理,如罗宾斯猜想。但ATP生成的证明往往过于冗长,难以被人类理解。

交互式定理证明系统(ITP)可以用于验证定理的正确性,帮助发现和修正数学文献中的错误,如数学家Peter Scholze在液体张量实验(Liquid Tensor Experiment)中承认自己无法掌握所有涉及的数学对象和概念,最终在Lean系统帮助下完成。

大模型如ChatGPT虽然可以生成相关数学内容,但容易产生错误。Buzzard建议大模型与ITP等系统结合使用,通过大模型生成初步证明,然后由ITP进行验证,从而提高可靠性。

Buzzard认为,这些新兴技术可以帮助数学家突破认知障碍,探索更加复杂和更加新颖的数学领域,并最终改变数学家的工作方式,使他们能够将更多时间和精力投入到数学思维和理解上。

另外三篇文章,从不同角度探讨了这些新兴技术如何帮助数学家应对日益增长的复杂性,并开拓新的数学领域。

逻辑学家Jeremy Avigad讨论了自20世纪初以来,数学定义和证明可以在具有精确语法和使用规则的形式系统中表示。

Jeremy Avigad任卡内基梅隆大学哲学和数学教授,在数理逻辑和基础、形式验证和交互式定理证明以及数学哲学和历史领域做出了贡献。

他认为这种转向可能改变数学的本质,依赖机器验证的证明可能减少了数学家对直观理解和洞察的重视,从而可能影响数学发现的过程和数学思想的发展。

数学家Johan CommelinAdam Topaz探讨了抽象边界(Abstraction Boundaries)如何在交互式定理证明器的帮助下,帮助控制数学研究中的复杂性。

Johan Commelin任荷兰乌得勒支大学助理教授,Adam Topaz阿尔伯塔大学助理教授,两人研究兴趣的交点是代数几何,他们共同参与了液体张量试验。

抽象边界是指在数学研究和定理证明过程中,将数学对象的实现细节与其外在属性和行为进行形式化区分的界限。这种界限使得数学家可以在不依赖具体实现细节的情况下,使用和推理这些数学对象。

抽象边界的概念在软件工程中非常常见,例如通过C语言的头文件、面向对象编程中的公共方法或者函数式编程中的typeclass来实现。

基于抽象边界的“规范驱动开发”方法,不仅降低了认知负荷,还促进了数学家之间的合作,使得工作可以轻松地分配给具有不同专长的合作者。

数学家Michael Shulman认为,现有的计算机程序如Lean证明助手,能够验证数学证明的正确性,但它们专门的证明语言对许多数学家来说是一道门槛。

Michael Shulman任圣地亚哥大学副教授,研究领域是范畴论和代数拓扑。

现有的计算机证明助手能够验证数学证明的正确性,但它们专门的证明语言对许多数学家来说是一道门槛。大模型有潜力降低这一门槛,使数学家能够以更熟悉的语言与证明助手进行交互。

这可能允许数学家使用由模型支持的证明助手探索根本上全新的数学领域,现有的证明助手已经在同伦类型论(homotopy type theory)等领域发挥了这一作用。

当前的AI可以做严肃的数学吗?

纽约大学计算机科学家Ernest Davis指出,当前AI在解决文字描述的数学问题上,无法可靠地结合基础数学和常识推理。

AI通过三种主要方法尝试解决数学问题,但每种方法都有其优势和局限。

  • 直接生成答案,适用于简单数学问题。

  • 生成可执行代码,已在实践中取得成功。

  • 翻译成逻辑规范,对于复杂问题仍存在挑战。

他认为AI在解决数学奥林匹克问题时可能会依赖于训练数据中的模式,而不是真正理解问题的本质,这与人类通过直观和逻辑推理解决问题的方式有显著差异。

AI真正解决数学问题需要三类知识:基础数学、语言理解和世界常识。例如理解硬币的价值和物理特性。常识在解决问题时经常被忽视,但实际上是至关重要的。

基准测试集是评估AI系统性能的重要工具,但它们可能无法全面覆盖AI的所有能力。

但同时他也指出,尽管AI在处理基础问题时存在局限,但这可能不会影响其进行高级数学研究的能力

一方面,高级数学研究可能不需要与解决基础问题相同的常识推理能力。

另一方面,在棋类游戏上,即使AI无法理解棋局的基本概念,在棋局分析和策略制定上的能力能远超人类棋手。

数学家如何看待AI?

菲尔兹奖得主Akshay Venkatesh探讨了数学自动化对数学研究的影响。他指出,机器可能大大增强数学解决问题的能力,但也会彻底改变数学的核心问题和价值观,使其难以被人类所认知。

他分析了当前数学界决定“什么是重要”的机制,如期刊、奖项、数学理论在应用领域得到认可、教育体系、聘用和资助过程等,都不足以解释数学界相对较高的共识水平。

他认为“证明”这种特殊的学术交流方式能引发一致同意,类似于自由市场中信息传播的机制。

AI会导致当前数学界对“重要性”的判断发生剧变。

数学家郑乐隽(Eugenia Cheng)认为,技术已经在改变人们研究数学的方式,可以利用这些技术使数学更加包容,而不是使数学家变得多余。

郑乐隽在谢菲尔德大学任教,除了范畴论研究和本科教学之外,她的目标是消除世界上的“数学恐惧症”。

她分析了技术如何影响数学教学、提出问题、协作、传播以及研究:

  • 教学:标准的“粉笔和黑板”式讲授变得没有必要,她开始采用交互性更强的教学方式。同时对于学生来说,记忆现在已经无关紧要,应当将大脑留给更有趣的事情

  • 提出问题:技术使得任何人都可以在网上提问并获得答复,但继承和放大了数学界的精英主义和竞争性。

  • 协作:技术大大便利了远程协作,使地理位置不再是障碍。电子白板等工具也大大增强了协作的便利性。

  • 传播:互联网使论文传播变得普及,不再局限于有限的纸质期刊。这让论文发表过程更加公开透明,论文质量而非发表渠道成为关键。

  • 研究:通过智能手机可以随时随地展开研究,不受地点限制。搜索引擎等也让她不必记住所有事实,可以随时查阅。

总的来说,郑乐隽认为技术可以使数学变得更加包容,只要数学家善用这些技术,而不是固步自封。

同时她也提出,如果最终机器能做得比人类更好,那很好,她将乐意退出数学领域去弹钢琴

数论学家Andrew Granville关注证明的本质以及计算机证明与人类证明之间的关系。

他认为,纯数学中的“客观性”并非如我们所想那样牢不可破。

  • 定义和概念的困难:现代数学中很多概念没有单一明确的定义,存在多种可能的定义和阐释。这就难以谈“客观”。

  • 公理系统的局限性:根据哥德尔不完备性定理,即使采用一致的公理系统,也无法证明所有关于整数的正确语句。这说明“客观的”数学基础是有局限性的。

  • 历史演变的影响:不同时代数学家对“数学证明”的理解和标准有所不同,这体现了客观性标准的变迁。

他探讨了计算机自动证明可能同时带来的挑战和机遇。计算机证明可以帮助确认人类直观证明的正确性,提高可信度。但计算机证明可能会取代人类,成为“黑箱”证明。但这种证明可能缺乏人类应有的可理解性和适应性。

Granville希望未来的计算机证明能够吸收人类证明的优点,在形式化的基础上保持足够的灵活性和易理解性。

哥伦比亚大学数学家Michael Harris强调数学需要吸收其他学科,尤其是人文社科的经验。

他建议经常反思学科的价值追求和物质基础,有助于数学家在面对自动化等挑战时,更好地捍卫数学的核心价值。

此外,他还警示数学界不应被科技公司主导的议程所绑架,科技公司的价值取向与数学家的价值取向并不完全一致,数学家应保持独立思考的勇气,而不是被动接受来自产业的价值导向。

更多精彩内容将于7月发布

特刊的第二部分将于2024年7月发布,内容将包括:

  • 自动化与哲学:

形式化所引发的许多问题并不新鲜。McLarty的文章描述,庞加莱在一个多世纪前就在讨论“推理机器”。庞加莱已经关注到形式化证明与数学实践之间的关系,这一主题在de Toffolli的文章中得到了进一步的探讨。

  • 技术改变思维:

DeDeo的文章检验了自动证明对数学家认知过程的潜在影响。

  • 深度学习与数学的互动:

Bengio和Malkin的文章考虑了进行数学研究对机器学习带来的特定挑战。Fraser和Poggio的文章则提出了与深度学习数学基础相关的问题。

期刊地址:
https://www.ams.org/journals/bull/2024-61-02/

参考链接:
[1] https://mathstodon.xyz/@tao/112221953164171331

本文来自微信公众号:量子位 (ID:QbitAI),作者:梦晨

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年4月8日
下一篇 2024年4月8日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日