DARPA 借助人工智能加速数学创新

美国 DARPA 推出 expMath 项目，依托 AI 技术加速纯数学研究，旨在培养具备证明和抽象能力的 AI 数学家。

美国国防高级研究计划局（ DARPA ）认为数学进展的速度不够快。

为了加速——或者说“指数性提升”——数学研究的进程，DARPA 本周举办了一场提案人日活动，旨在与技术界进行交流，以期望与会者在实际发布“广泛机构公告（ BAA ）”征集通知后提交提案。等等，慢点，山姆大叔。

DARPA 的项目命名为 expMath，目标是借助人工智能（或者更愿意说机器学习）来启动数学创新。

DARPA 在其网站上解释道：“指数性数学（ expMath ）的目标是通过开发一种能够提出和证明有用抽象概念的 AI 合著者，从根本上加速纯数学的进展速度。”

在弗吉尼亚州阿灵顿的 DARPA 会议中心举行的活动上，DARPA 项目经理 Patrick Shafto （需在左括号前加空格 Patrick Shafto ）通过展示 1878 年至 2018 年间数学进展缓慢的事实，论证了加快数学研究的重要性。

在此期间，数学进展——通过每年科学出版物数量的对数来衡量——增长率不足 1 ％。

这是基于 Lutz Bornmann 、 Robin Haunschild 和 Rüdiger Mutz 在 2021 年进行的一项研究，他们计算出，不同学科整体的科学增速约为 4.10 ％。

科学研究也会带来创新浪潮。例如，在生命科学领域，以让-巴蒂斯特·拉马克（ 1744-1829 ）和查尔斯·达尔文（ 1809-1882 ）为代表的时代中，1806 年至 1848 年间的出版物增长率达到了 8.18 ％；而在物理和技术科学领域，1793 年至 1810 年间录得 25.41 ％的增长，这一时期正值约瑟夫-路易·拉格朗日（ 1736–1813 ）的重要工作阶段。

“所以这些领域都经历了变化，可数学却没有，我们希望将这种变化带到数学中来。”Shafto 在他的演讲中如是说道。

DARPA 提议的创新加速器正是人工智能。但问题是，现有的 AI 智商不够高。它可以做高中水平的数学，但无法应对高水平的数学。

正如 Shafto 的一张幻灯片上所指出的，“OpenAI o1（ Strawberry ）尽管宣称具备推理能力，但在基础数学方面仍然惨遭失败。”

尽管如此，expMath 的目标是令 AI 模型具备以下能力：

auto decomposition —— 自动将自然语言叙述分解为可复用的自然语言引理（一个已被证明可用于证明其他命题的陈述）；以及

auto(in)formalization —— 将自然语言引理转换为形式化证明，再将证明转换回自然语言。

AI 研究机构 Fountain Abode 的创始人兼首席执行官 Robin Rowe 也出席了此次活动。他向 The Register 解释道，自己大学主修数学，但觉得数学枯燥，于是转向计算机科学。

尽管如此，他表示，看到目标似乎是创造一种能够作为合作者的 AI 数学家——相当于一名能够协助证明的研究生——这一点让他觉得很有趣。

也就是说，他承认这将是超越当前 AI 模型所表现出的能力水平。

Rowe 说道：“我们现在已经有了 chain-of-thought（链式思考），所以这就好比是链式思考注射了类固醇。”

对于 Rowe 来说，关键在于如何让 AI 在高级数学方面表现得更好。

他提到：“负责该项目的 Patrick Shafto 撰写了一篇关于贝叶斯归纳的论文（ PDF ），该观点认为可以使用大语言模型来解决这个问题。”

Rowe 补充说：“这并不是我倾向的方式，但房间里很多人就是这么想的，因为如果要使用现有技术，这似乎是显而易见的下一步。

我认为我们需要的是数学推理能力。

‘在场的人则觉得：‘哦，你知道，大语言模型在过去一年里有了很大进步，我们就这么不断推进下去。’ DARPA 之所以设定为三年项目，正是表明他们对这一挑战之艰巨感到担忧，这在 DARPA 中并不常见。

但就我个人而言，我认为我们需要的是数学推理能力。提案还未提交，但这就是我们计划采取的方向。不过在场还有其他人提出了不同的看法，例如采用几何数学推理等等，这样大概会有十几种不同的方式。”

换句话说，Rowe 并不确定是否应当把焦点放在自然语言上。他建议，基于视觉或音频输入的模型可能在处理高级数学时会更加得心应手。

Rowe 问道：“我们是选择基于大语言模型的贝叶斯归纳，这似乎是如果你来自这个领域首先会想到的方式，还是选择更激进的，例如几何建模和视觉化处理，而完全不使用文字。

“而且在现场并没有讨论，但确实有数学家在头脑中进行音频运算——他们会将数字视作音乐音调。因此，如果我们按照数学家在实际证明中所使用的多种方法来建模，可能会有很多狂野而新奇的提案出现，因为大多数人只了解常规方法，而其他方法则需要非凡的天赋，这是常人难以企及的。”

话虽如此，Rowe 依然持乐观态度，他说：“我想我们会大获成功，老实说。我认为这可能不会花费整整三年，但如果使用大语言模型的话，可能确实需要三年。那么问题就变成了，每个人愿意接受多激进的方法？”

来源：The Register

0赞

好文章，需要你的鼓励

DARPA 借助人工智能加速数学创新

来源：The Register

2025

04/28

09:53

分享

点赞

AI个性化技术是否正在割裂社会现实认知

Replit"氛围编程"服务删除用户生产数据库并伪造数据

嵌入模型榜单大洗牌：谷歌登顶，阿里开源方案紧追不舍

DDN推出Infinia存储系统，声称可大幅提升AI推理速度并降低成本

DuckDuckGo推出AI图像过滤功能改善搜索体验

跨越AI价值鸿沟：远石科技与阿里云的共创之路

OpenAI实验模型在国际数学奥林匹克竞赛中获得金牌级表现

AGI和AI超级智能证明智能所需回答的问题数量

AI在商业中的正确用量

AnyCoder：基于Kimi K2的快速Web应用开发工具发布

隐私安全需三思：AI获取个人数据权限的风险与挑战

备份工具Rescuezilla基于六个Ubuntu版本全面更新

镜中陷阱：AI 伦理与人类想象力的崩溃

人工智能在航空航天产业中是否获准起飞？

以经济利益为驱动的网络犯罪仍然是最大的威胁来源

构建 AI 测谎仪

AI 内部部署的隐患：治理漏洞与灾难性风险

新 AI 微积分：Google 80% 的成本优势 vs. OpenAI 的生态系统

欢迎来到 Chat Haus——AI 聊天机器人共享空间

一起跳舞：通过结构化运动微调我们的人类神经网络

Nvidia 发布 NeMo 微服务 助力简化 AI 代理开发

VAST 的 VUA 闪存缓存几乎扩展 GPU 服务器内存以供 AI token 生成

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

Nvidia 发布 NeMo 微服务助力简化 AI 代理开发