DeepMind 声称其最新 AI 工具在数学和科学问题上表现出色

DeepMind 推出的 AI 系统 AlphaEvolve 利用自动评估机制解决数学与科学问题，在数学测试和 Google 数据中心优化中提升效率。虽非颠覆性革新，却能帮助专家腾出精力应对更重要任务。

Google 的 AI R&D 实验室 DeepMind 表示，他们开发了一种新的 AI 系统，用于处理具有 "machine-gradable"（可由机器评分）解决方案的问题。

DeepMind 表示，在实验中，该系统名为 AlphaEvolve，可帮助优化 Google 用于训练其 AI 模型的一些基础设施。公司表示，他们正在构建与 AlphaEvolve 交互的用户界面，并计划在可能更大范围推广之前，为部分学者推出早期访问计划。

大多数 AI 模型会产生幻觉。由于其概率架构，这些模型有时会自信地编造信息。实际上，新一代 AI 模型（如 OpenAI 的 o3）比其前辈产生更多幻觉，这也反映了该问题的复杂挑战。

AlphaEvolve 引入了一种巧妙的机制以减少幻觉现象：自动评估系统。该系统利用模型生成、评判并综合出一个问题的可能答案池，同时自动评估和打分以判断答案的准确性。

DeepMind 表示，AlphaEvolve 系统的设计目标是供领域专家使用。

AlphaEvolve 并不是第一个采用这种方法的系统。包括几年前 DeepMind 团队在内的研究人员，曾在数学各领域中应用过类似技术。但 DeepMind 声称，AlphaEvolve 所使用的 "state-of-the-art"（最先进）模型——特别是 Gemini 模型——使其相比以前的 AI 系统具有显著更强的能力。

要使用 AlphaEvolve，用户必须向系统输入一个问题，并可选地附上说明、方程、代码片段以及相关文献等详细信息。用户还需要提供一种以公式形式自动评估系统答案的机制。

由于 AlphaEvolve 只能解决其自身能进行评估的问题，该系统仅适用于某些类型的问题——特别是计算机科学和系统优化等领域的问题。另一项主要限制是，AlphaEvolve 只能以算法形式描述解决方案，这使得它对于非数值类问题的适用性较差。

为了对 AlphaEvolve 进行基准测试，DeepMind 让该系统尝试了一组精挑细选的约 50 道数学题，涵盖从几何到组合数学等多个分支。DeepMind 声称，AlphaEvolve 在 75% 的情况下能够“重新发现”这些问题的最佳解答，并在 20% 的案例中找到改进方案。

DeepMind 还将 AlphaEvolve 应用于实际问题，如提高 Google 数据中心的效率及加速模型训练。根据该实验室的数据，AlphaEvolve 生成的一种算法平均可持续回收 Google 全球计算资源的 0.7%。该系统还提出了一项优化措施，将 Google 训练 Gemini 模型的总体时间缩短了 1%。

需要明确的是，AlphaEvolve 并没有带来突破性的发现。在一次实验中，该系统成功找到了优化 Google TPU AI 加速器芯片设计的改进方案——这一问题此前已被其他工具指出。

然而，DeepMind 与许多 AI 实验室一样，主张 AlphaEvolve 能够节省时间，从而释放专家去关注其他更为重要的工作。

来源：Techcrunch

0赞

好文章，需要你的鼓励

DeepMind 声称其最新 AI 工具在数学和科学问题上表现出色

来源：Techcrunch

2025

05/15

16:27

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

Stability AI发布可运行在智能手机上的音频生成模型

AI 正在以每个单词重写现实

Google DeepMind 打造超先进 AI 可发明全新算法

南十字旅行保险的核心转型

SoundCloud：声明从未使用艺术家作品训练 AI 模型

Meta 正在研发 AI 眼镜的面部识别技术

Chrome 现在将使用 Gemini Nano 来捕获诈骗

团队获取 AI 技能的最快途径

可持续的未来：AI如何推动绿色数据中心革命

微软裁撤全球 3% 员工，中层管理者首当其冲

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会