DeepMind 声称其最新 AI 工具在数学和科学问题上表现出色

DeepMind 推出的 AI 系统 AlphaEvolve 利用自动评估机制解决数学与科学问题，在数学测试和 Google 数据中心优化中提升效率。虽非颠覆性革新，却能帮助专家腾出精力应对更重要任务。

Google 的 AI R&D 实验室 DeepMind 表示，他们开发了一种新的 AI 系统，用于处理具有 "machine-gradable"（可由机器评分）解决方案的问题。

DeepMind 表示，在实验中，该系统名为 AlphaEvolve，可帮助优化 Google 用于训练其 AI 模型的一些基础设施。公司表示，他们正在构建与 AlphaEvolve 交互的用户界面，并计划在可能更大范围推广之前，为部分学者推出早期访问计划。

大多数 AI 模型会产生幻觉。由于其概率架构，这些模型有时会自信地编造信息。实际上，新一代 AI 模型（如 OpenAI 的 o3）比其前辈产生更多幻觉，这也反映了该问题的复杂挑战。

AlphaEvolve 引入了一种巧妙的机制以减少幻觉现象：自动评估系统。该系统利用模型生成、评判并综合出一个问题的可能答案池，同时自动评估和打分以判断答案的准确性。

DeepMind 表示，AlphaEvolve 系统的设计目标是供领域专家使用。

AlphaEvolve 并不是第一个采用这种方法的系统。包括几年前 DeepMind 团队在内的研究人员，曾在数学各领域中应用过类似技术。但 DeepMind 声称，AlphaEvolve 所使用的 "state-of-the-art"（最先进）模型——特别是 Gemini 模型——使其相比以前的 AI 系统具有显著更强的能力。

要使用 AlphaEvolve，用户必须向系统输入一个问题，并可选地附上说明、方程、代码片段以及相关文献等详细信息。用户还需要提供一种以公式形式自动评估系统答案的机制。

由于 AlphaEvolve 只能解决其自身能进行评估的问题，该系统仅适用于某些类型的问题——特别是计算机科学和系统优化等领域的问题。另一项主要限制是，AlphaEvolve 只能以算法形式描述解决方案，这使得它对于非数值类问题的适用性较差。

为了对 AlphaEvolve 进行基准测试，DeepMind 让该系统尝试了一组精挑细选的约 50 道数学题，涵盖从几何到组合数学等多个分支。DeepMind 声称，AlphaEvolve 在 75% 的情况下能够“重新发现”这些问题的最佳解答，并在 20% 的案例中找到改进方案。

DeepMind 还将 AlphaEvolve 应用于实际问题，如提高 Google 数据中心的效率及加速模型训练。根据该实验室的数据，AlphaEvolve 生成的一种算法平均可持续回收 Google 全球计算资源的 0.7%。该系统还提出了一项优化措施，将 Google 训练 Gemini 模型的总体时间缩短了 1%。

需要明确的是，AlphaEvolve 并没有带来突破性的发现。在一次实验中，该系统成功找到了优化 Google TPU AI 加速器芯片设计的改进方案——这一问题此前已被其他工具指出。

然而，DeepMind 与许多 AI 实验室一样，主张 AlphaEvolve 能够节省时间，从而释放专家去关注其他更为重要的工作。

来源：Techcrunch

0赞

好文章，需要你的鼓励

DeepMind 声称其最新 AI 工具在数学和科学问题上表现出色

来源：Techcrunch

2025

05/15

16:27

分享

点赞

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

OpenAI收购高管教练AI工具Convogo团队

Stability AI发布可运行在智能手机上的音频生成模型

AI 正在以每个单词重写现实

Google DeepMind 打造超先进 AI 可发明全新算法

南十字旅行保险的核心转型

SoundCloud：声明从未使用艺术家作品训练 AI 模型

Meta 正在研发 AI 眼镜的面部识别技术

Chrome 现在将使用 Gemini Nano 来捕获诈骗

团队获取 AI 技能的最快途径

可持续的未来：AI如何推动绿色数据中心革命

微软裁撤全球 3% 员工，中层管理者首当其冲

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: