谷歌 AI 系统 AlphaEvolve 获陶哲轩团队认可:使大规模数学研究成为可能

抖音秀 热点资讯 5

11 月 19 日消息,由谷歌旗下 DeepMind 开发的人工智能工具在辅助数学研究方面展现出令人惊讶的高效性,测试过这项技术的数学家表示,该技术有望推动人工智能驱动的数学发现迈入前所未有的规模化新阶段。

据了解,今年 5 月,谷歌发布了一款名为 AlphaEvolve 的人工智能系统,该系统能够自主发现新的算法与数学公式。其工作原理是:首先由谷歌 AI 聊天机器人 Gemini 生成大量潜在解法;随后,这些候选解被输入一个独立的 AI 评估模块,由后者剔除聊天机器人不可避免产生的无意义或无效结果。当时,谷歌研究人员在 50 余道公开数学难题上测试了 AlphaEvolve,结果发现,在四分之三的案例中,系统能够重新发现人类已知的最优解。

如今,加州大学洛杉矶分校的陶哲轩(Terence Tao)及其合作者对 AlphaEvolve 进行了更为严格、范围更广的测评,涵盖 67 道前沿数学研究问题。结果表明,该系统不仅可复现既有解法,有时还能生成更优解;这些改进后的候选解可进一步输入其他专用 AI 系统进行验证与深化,例如计算资源需求更高的 Gemini 增强版,或谷歌今年用于在国际数学奥林匹克竞赛(IMO)中斩获金牌的 AlphaProof 系统,后者能将这些解转化为形式严谨的新数学证明。

陶哲轩指出,由于 67 道问题难度各异,难以给出统一的成功率指标,但可以明确的是:该系统在解题速度上始终显著快于单个数学研究者。“倘若我们以传统方式应对这 67 个问题,即为每个问题单独编程开发专用优化算法,整个工作将耗时数年,项目甚至根本不会启动。”他强调,“AlphaEvolve 使我们在前所未有的规模上开展数学研究成为可能。”

需要指出的是,AlphaEvolve 目前仅适用于一类称为“优化问题”的数学问题,即在特定约束下寻找最优数值、公式或对象(例如:给定空间内最多可嵌入多少个正六边形)。尽管该系统已能处理数论、几何学等截然不同数学分支中的优化问题,陶哲轩坦言,此类问题“仅占数学家所关注问题总体的一小部分”。然而,AlphaEvolve 展现出的强大能力正激励数学家尝试将非优化类问题重新建模为该系统可处理的形式。“这些工具如今已成为攻克此类问题的一种全新范式,”他表示。

不过,该系统也存在明显弊端:陶哲轩指出,它有时会“钻空子”,即利用问题表述中的技术漏洞或边缘情形生成看似正确、实则并未真正解决问题的答案。“这就好比给一群极其聪明但毫无道德约束的学生出考题,他们只求技术性地拿到高分,不择手段。”

尽管存在上述缺陷,AlphaEvolve 所取得的成果仍引发了数学界更广泛的关注。据团队成员、罗德岛州布朗大学的哈维尔・戈麦斯-塞拉诺(Javier Gómez-Serrano)介绍,此前许多数学家仅对 ChatGPT 等通用型 AI 工具抱有兴趣,而 AlphaEvolve 的出现显著提升了其对专业 AI 工具的关注度。目前该系统尚未向公众开放,但团队已收到来自全球数学研究者的大量试用申请。

“人们如今明显更加好奇,也更愿意尝试这些工具,”戈麦斯-塞拉诺表示,“大家都在积极探索其潜在应用场景。相较一两年前的情形,它已在数学界激发出空前浓厚的兴趣。”

对陶哲轩而言,此类 AI 系统为卸下部分常规性数学工作、释放人力以聚焦更具创造性研究提供了可能:“全球数学家数量有限,我们无法对每一个问题都投入高强度思考;但现实中存在大量中等难度的问题,恰恰非常适合 AlphaEvolve 这类中等智能水平的工具来解决。”

宾夕法尼亚州卡内基梅隆大学的杰里米・阿维加德(Jeremy Avigad)指出,机器学习技术对数学研究正日益显现出实用价值。“当前亟需的是计算机科学家(精通机器学习工具的开发与应用)与数学家(具备领域专业知识)之间更深入的协同合作,”他表示,“我相信未来将涌现更多类似成果,并有望将这些方法拓展至更为抽象的数学分支。”