分析发现 ‘推理’ AI 模型性能提升可能很快放缓

Epoch AI 分析指出，以推理为核心的 AI 模型（如 OpenAI 的 o3）近年来虽取得显著进步，但因强化学习阶段所需的庞大运算和高昂研究成本，未来性能提升可能放缓，预计到2026年将趋向封顶。

Epoch AI（非盈利 AI 研究机构）的一项分析表明，AI 行业可能无法长期从推理 AI 模型中获得大幅性能提升。报告发现，推理模型的进展可能最快在一年内出现放缓。

例如 OpenAI 的 o3 等推理模型在近几个月内在 AI 基准测试中取得了显著进步，特别是在测评数学和编程技能的测试中。这些模型能够将更多计算资源 (computing) 应用于问题，从而提升性能，但缺点是完成任务所需的时间比传统模型更长。

推理模型的开发流程是先利用海量数据训练一个传统模型，然后应用称为强化学习 (reinforcement learning) 的技术，该技术能有效为模型在解决难题时提供 “反馈” 。

据 Epoch 指出，截至目前，像 OpenAI 这样的前沿 AI 实验室尚未在推理模型训练的强化学习阶段投入大量计算资源。

情况正在改变。OpenAI 表示，在训练 o3 时所使用的计算资源大约是其前身 o1 的 10 倍，Epoch 推测这其中的大部分计算资源都用于了强化学习。OpenAI 研究员 Dan Roberts 最近透露，公司未来计划将强化学习作为优先方向，投入的计算资源将远超初始模型训练所需的量。

不过，据 Epoch 称，在强化学习中可投入的计算资源仍然存在上限。

根据 Epoch AI 的分析，推理模型训练的扩展可能会放缓

图片来源： Epoch AI

Epoch 分析师及该报告作者 Josh You 解释说，传统 AI 模型训练带来的性能提升目前每年大约提升四倍，而强化学习带来的性能增长在 3 到 5 个月内可实现十倍增长。他进一步指出，推理训练的进展 “很可能在 2026 年与前沿水平趋于一致”。

Epoch 的分析基于若干假设，并部分采纳了 AI 公司高管的公开评论。但分析也论证了，推理模型的扩展可能因除计算资源以外的原因而面临挑战，其中包括研究所需的高昂固定成本。

Josh You 写道：“如果研究需要持续的固定开销，推理模型可能无法按照预期大幅扩展。快速扩展计算资源可能是推动推理模型进步的一个非常重要因素，因此值得密切关注。”

任何迹象表明推理模型在不久的将来可能达到某种上限，都可能让已在这类模型研发上投入巨大资源的 AI 行业感到担忧。研究已表明，虽然推理模型的运行成本极高，但它们存在严重缺陷，例如比某些传统模型更容易产生误导性信息。

来源：Techcrunch

0赞

好文章，需要你的鼓励

分析发现 ‘推理’ AI 模型性能提升可能很快放缓

来源：Techcrunch

2025

05/13

17:04

分享

点赞

普洛斯常熟东南数据中心二期100%签约，智算服务全速进阶

Gartner：数智基建推动自主可控人工智能革命的两大举措

Gartner发布2026年十大战略技术趋势

拨开AI迷雾，思科《2025年人工智能就绪指数》揭示企业AI落地“真相”

AI智能体能否帮助决定患者生死？

认知HIIT：在AI时代为大脑进行间歇训练

Scale AI前员工为中东北非关键产业AI服务筹得900万美元

突破当前大语言模型瓶颈的六大AI发展路径

教育AI应用：培生如何通过数字化学习推动增长

IBM与英伟达竞争对手Groq达成合作，加速企业AI部署

洛克希德·马丁CIO谈数字化转型与使命文化

欧盟法规加剧挪威AI企业外流担忧

2025 年人机合作模式的演变

计算 ASI 风险始于人类思维

下一场 AI 革命不在技术，而在情感

LegoGPT让你的积木梦想成为现实

为什么 AI 代理将引发 25 年来最大的工作场所革命

如何使用 AI 聊天机器人以及需要了解的内容

一个 AI 空间公司诞生了

MCP 与创新悖论：为何开放标准能拯救 AI 自身

数字孪生与虚拟商店：零售业的未来已来

Amazon 展示 AI 机器人时代中新的人类工作机遇

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: