好消息,AI 开发者!
OpenAI 宣布对其旗舰级推理大语言模型 o3 进行大幅降价,将输入和输出 Token 的费用统统砍价 80% 。
(提醒:Token 是大语言模型用来表示单词、短语、数学和代码字符串以及其他内容的单个数字化字符串。它们是模型通过训练学习到的语义结构的表示,实际上构成了大语言模型的“母语”。大多数大语言模型供应商会通过应用程序接口 (API) 提供其模型,开发者可以基于这些 API 构建应用,或将外部应用接入大语言模型;同时,大多数供应商会按每百万 Token 收取费用。)
此次更新使该模型成为寻求先进推理能力的开发者更容易获取的选项,并使 OpenAI 在定价上与 Google DeepMind 的 Gemini 2.5 Pro、Anthropic 的 Claude Opus 4 以及 DeepSeek 的推理套件等竞争对手更加正面较量。
COME SEE
OpenAI 产品与 API 负责人 Olivier Godement
将于 6 月 24 日至 25 日在旧金山的 VB TRANSFORM 2025 展会现场亮相。
REGISTER NOW
现在票量仍然充足。
此次消息由 OpenAI 首席执行官 Sam Altman 自身在 X 平台上宣布,他在一篇帖子中强调,新定价旨在鼓励更广泛的实验,他写道:“我们将 o3 的价格降低了 80%!!很期待看到大家接下来会做出怎样的创举。相信你们对 o3-pro 的性能定价也会感到满意 :)”
使用 o3 的费用现为每百万输入 Token 2 美元,每百万输出 Token 8 美元,当用户输入的信息处于“缓存”状态,即已存储且与之前提供的信息完全一致时,每百万 Token 可享受额外 0.50 美元的折扣。
这意味着费用相比之前每百万输入 10 美元、输出 40 美元有了显著下降,正如 OpenAI 研究员 Noam Brown 在 X 平台上指出的那样。
开发者及早期用户 Ray Fernando 在帖子中庆祝这一降价消息,并写道 “LFG!”——即 “let’s fucking go!” 的缩写。
这一情绪反映了众多开发者在寻求为项目扩展而不会因模型接入费用过高而望而却步时所表现出的日益高涨的热情。
与其他竞争对手推理大语言模型的价格比较
此价格调整正值 AI 供应商在性能与经济实惠之间展开更激烈竞争之际。与其他领先的 AI 推理模型作对比,能看出这一策略的意义重大:
Gemini 2.5 Pro Preview ,由 Google DeepMind 开发,根据提示大小收取每百万输入 Token 1.25 至 2.50 美元,输出 Token 则收费 10 至 15 美元。虽然其与 Google Search 的集成提供了额外功能,但该服务自身也需要付费——每天前 1,500 个请求免费,之后每千个请求 35 美元。
Claude Opus 4 ,由 Anthropic 推出,定位为专为复杂任务优化的模型,是该组中最昂贵的,收费为每百万输入 Token 15 美元,输出 Token 75 美元。提示缓存读写服务分别收费 1.50 美元和 18.75 美元,尽管用户经过批量处理可享受 50% 折扣。
DeepSeek 的模型,特别是 DeepSeek-Reasoner 和 DeepSeek-Chat,以极具竞争力的低价横扫市场。输入 Token 费用根据是否缓存及时间段在 0.07 至 0.55 美元之间波动,而输出 Token 的费用则在 1.10 至 2.19 美元之间。非高峰时段的折扣率甚至可将有缓存的输入价格降至 0.035 美元。
模型 输入费用 缓存输入 输出费用 折扣说明 OpenAI o3 2.00 美元 (降自 10.00 美元) 0.50 美元 8.00 美元 (降自 40.00 美元) 灵活处理模式:每百万 Token 输入 5 美元、输出 20 美元 Gemini 2.5 Pro 1.25 – 2.50 美元 0.31 – 0.625 美元 10.00 – 15.00 美元 对于超过 200k Token 的提示适用较高费率 Claude Opus 4 15.00 美元 1.50 美元 (读) / 18.75 美元 (写) 75.00 美元 批量处理时可享 50% 折扣 DeepSeek-Chat 0.07 美元 (命中) / 0.27 美元 (未命中) — 1.10 美元 非高峰时段享 50% 折扣 DeepSeek-Reasoner 0.14 美元 (命中) / 0.55 美元 (未命中) — 2.19 美元 非高峰时段享 75% 折扣
此外,独立的第三方 AI 模型比较与研究机构 Artificial Analysis 对新的 o3 模型进行了涵盖各种任务的基准测试,其费用为完成所有测试需 390 美元,而 Gemini 2.5 Pro 为 971 美元,Claude 4 Sonnet 为 342 美元。
缩小开发者在成本与智能之间的差距
OpenAI 的此次定价调整不仅缩小了与 DeepSeek 等超低成本模型之间的差距,同时对像 Claude Opus 和 Gemini Pro 等高价产品形成下行压力。
与 Claude 或 Gemini 不同的是,OpenAI 的 o3 现在还提供了一种同步处理的灵活模式,按每百万 Token 输入 5 美元、输出 20 美元计费,使开发者能够根据任务类型更好地掌控计算成本和延迟问题。
o3 现已通过 OpenAI API 和 Playground 上线。即使账户余额仅几美元的用户,也可以探索该模型的全部功能,从而在原型设计和部署时减少财务障碍。
这对以往因高端模型接入成本过高而望而止步的初创公司、研究团队和个人开发者来说,无疑是一大利好消息。
通过大幅降低其最先进推理模型的成本,OpenAI 正在传递生成式 AI 领域的一个更广泛趋势:优质性能正迅速变得更加实惠,开发者如今有越来越多既具可行性又经济可扩展的选择。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。