分析发现 ‘推理’ AI 模型性能提升可能很快放缓

Epoch AI 分析指出，以推理为核心的 AI 模型（如 OpenAI 的 o3）近年来虽取得显著进步，但因强化学习阶段所需的庞大运算和高昂研究成本，未来性能提升可能放缓，预计到2026年将趋向封顶。

Epoch AI（非盈利 AI 研究机构）的一项分析表明，AI 行业可能无法长期从推理 AI 模型中获得大幅性能提升。报告发现，推理模型的进展可能最快在一年内出现放缓。

例如 OpenAI 的 o3 等推理模型在近几个月内在 AI 基准测试中取得了显著进步，特别是在测评数学和编程技能的测试中。这些模型能够将更多计算资源 (computing) 应用于问题，从而提升性能，但缺点是完成任务所需的时间比传统模型更长。

推理模型的开发流程是先利用海量数据训练一个传统模型，然后应用称为强化学习 (reinforcement learning) 的技术，该技术能有效为模型在解决难题时提供 “反馈” 。

据 Epoch 指出，截至目前，像 OpenAI 这样的前沿 AI 实验室尚未在推理模型训练的强化学习阶段投入大量计算资源。

情况正在改变。OpenAI 表示，在训练 o3 时所使用的计算资源大约是其前身 o1 的 10 倍，Epoch 推测这其中的大部分计算资源都用于了强化学习。OpenAI 研究员 Dan Roberts 最近透露，公司未来计划将强化学习作为优先方向，投入的计算资源将远超初始模型训练所需的量。

不过，据 Epoch 称，在强化学习中可投入的计算资源仍然存在上限。

根据 Epoch AI 的分析，推理模型训练的扩展可能会放缓

图片来源： Epoch AI

Epoch 分析师及该报告作者 Josh You 解释说，传统 AI 模型训练带来的性能提升目前每年大约提升四倍，而强化学习带来的性能增长在 3 到 5 个月内可实现十倍增长。他进一步指出，推理训练的进展 “很可能在 2026 年与前沿水平趋于一致”。

Epoch 的分析基于若干假设，并部分采纳了 AI 公司高管的公开评论。但分析也论证了，推理模型的扩展可能因除计算资源以外的原因而面临挑战，其中包括研究所需的高昂固定成本。

Josh You 写道：“如果研究需要持续的固定开销，推理模型可能无法按照预期大幅扩展。快速扩展计算资源可能是推动推理模型进步的一个非常重要因素，因此值得密切关注。”

任何迹象表明推理模型在不久的将来可能达到某种上限，都可能让已在这类模型研发上投入巨大资源的 AI 行业感到担忧。研究已表明，虽然推理模型的运行成本极高，但它们存在严重缺陷，例如比某些传统模型更容易产生误导性信息。

来源：Techcrunch

0赞

好文章，需要你的鼓励

分析发现 ‘推理’ AI 模型性能提升可能很快放缓

来源：Techcrunch

2025

05/13

17:04

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

2025 年人机合作模式的演变

计算 ASI 风险始于人类思维

下一场 AI 革命不在技术，而在情感

LegoGPT让你的积木梦想成为现实

为什么 AI 代理将引发 25 年来最大的工作场所革命

如何使用 AI 聊天机器人以及需要了解的内容

一个 AI 空间公司诞生了

MCP 与创新悖论：为何开放标准能拯救 AI 自身

数字孪生与虚拟商店：零售业的未来已来

Amazon 展示 AI 机器人时代中新的人类工作机遇

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: