OpenAI 计划在未来数月内发布其新一代旗舰人工智能系统 GPT-5。
首席执行官 Sam Altman 今天在 X 平台上发布的一系列帖子中透露了这一发布时间。他同时还分享了有关 ChatGPT 开发团队的产品路线图的其他细节。
在 GPT-5 发布之前,OpenAI 将在未来几周内推出功能相对较弱的大语言模型 GPT-4.5。后者是公司通用型 GPT-4o 模型的继任者。与 OpenAI 专注于推理优化的大语言模型相比,GPT-4o 在代码生成等任务上的表现较弱,但它的推理成本明显更低。
Altman 详细说明,GPT-4.5 将是 OpenAI 最后一个不具备思维链 (Chain of Thought, CoT) 机制的大语言模型。CoT 是一种将复杂任务分解为一系列简单步骤的机器学习技术。研究表明,这种方法能显著提高大语言模型的输出质量,特别是在处理复杂推理任务时。
去年,据 The Information 报道,与前代 GPT-4 相比,GPT-4.5 在输出质量方面的提升将"小得多"。此外,据报道,这个即将推出的模型在编程任务上"并不能稳定超越" GPT-4。这可能是因为 OpenAI 在这方面的努力主要集中在其推理优化型大语言模型上,这些模型专门针对编程和数学任务进行了优化。
OpenAI 最新的推理优化大语言模型 o3 于去年 12 月发布。它在 Frontier Math(一个包含特别困难数学问题的基准测试)中创下了 25.2% 的记录分数,远超此前不到 2% 的最高分。
在今天的 X 平台帖子中,Altman 透露 OpenAI 已放弃将 o3 作为独立产品的计划。相反,公司计划将该模型整合到预计在数月内推出的 GPT-5 中。
"我们的首要目标是通过创建能够使用所有工具、知道何时需要长时间思考以及普遍适用于广泛任务的系统,来统一 o 系列模型和 GPT 系列模型,"Altman 写道。
OpenAI 计划在 ChatGPT 的免费版和付费版中都提供 GPT-5。付费用户将可以使用具有更高级推理能力的版本。
这些高级功能可能由 OpenAI 的测试时计算技术提供支持。该技术通过投入更多时间和计算资源来处理提示,从而提高模型的输出质量。OpenAI 已在 o3 中实现了这项技术。
上个月,该公司推出了由 o3 驱动的 Deep Research 工具,帮助用户搜索网络信息。它可以基于数百个公开来源的数据生成详细报告。Altman 今天透露,ChatGPT 免费版用户每月可以使用两次 Deep Research 查询,而 ChatGPT Plus 订阅用户则可以使用多达 10 次查询。
好文章,需要你的鼓励
在“PEC 2025 AI创新者大会暨第二届提示工程峰会”上,一场以“AIGC创作新范式——双脑智能时代:心智驱动的生产力变革”为主题的分论坛,成为现场最具张力的对话空间。
人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。
Linux Mint团队计划加快发布周期,在未来几个月推出两个新版本。LMDE 7代号"Gigi"基于Debian 13开发,将包含libAdapta库以支持Gtk4应用的主题功能。新版本将停止提供32位版本支持。同时Cinnamon桌面的Wayland支持持续改进,在菜单、状态小程序和键盘输入处理方面表现更佳,有望成为完整支持Wayland的重要桌面环境之一。
Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。