OpenAI 计划在未来数月内发布其新一代旗舰人工智能系统 GPT-5。
首席执行官 Sam Altman 今天在 X 平台上发布的一系列帖子中透露了这一发布时间。他同时还分享了有关 ChatGPT 开发团队的产品路线图的其他细节。
在 GPT-5 发布之前,OpenAI 将在未来几周内推出功能相对较弱的大语言模型 GPT-4.5。后者是公司通用型 GPT-4o 模型的继任者。与 OpenAI 专注于推理优化的大语言模型相比,GPT-4o 在代码生成等任务上的表现较弱,但它的推理成本明显更低。
Altman 详细说明,GPT-4.5 将是 OpenAI 最后一个不具备思维链 (Chain of Thought, CoT) 机制的大语言模型。CoT 是一种将复杂任务分解为一系列简单步骤的机器学习技术。研究表明,这种方法能显著提高大语言模型的输出质量,特别是在处理复杂推理任务时。
去年,据 The Information 报道,与前代 GPT-4 相比,GPT-4.5 在输出质量方面的提升将"小得多"。此外,据报道,这个即将推出的模型在编程任务上"并不能稳定超越" GPT-4。这可能是因为 OpenAI 在这方面的努力主要集中在其推理优化型大语言模型上,这些模型专门针对编程和数学任务进行了优化。
OpenAI 最新的推理优化大语言模型 o3 于去年 12 月发布。它在 Frontier Math(一个包含特别困难数学问题的基准测试)中创下了 25.2% 的记录分数,远超此前不到 2% 的最高分。
在今天的 X 平台帖子中,Altman 透露 OpenAI 已放弃将 o3 作为独立产品的计划。相反,公司计划将该模型整合到预计在数月内推出的 GPT-5 中。
"我们的首要目标是通过创建能够使用所有工具、知道何时需要长时间思考以及普遍适用于广泛任务的系统,来统一 o 系列模型和 GPT 系列模型,"Altman 写道。
OpenAI 计划在 ChatGPT 的免费版和付费版中都提供 GPT-5。付费用户将可以使用具有更高级推理能力的版本。
这些高级功能可能由 OpenAI 的测试时计算技术提供支持。该技术通过投入更多时间和计算资源来处理提示,从而提高模型的输出质量。OpenAI 已在 o3 中实现了这项技术。
上个月,该公司推出了由 o3 驱动的 Deep Research 工具,帮助用户搜索网络信息。它可以基于数百个公开来源的数据生成详细报告。Altman 今天透露,ChatGPT 免费版用户每月可以使用两次 Deep Research 查询,而 ChatGPT Plus 订阅用户则可以使用多达 10 次查询。
好文章,需要你的鼓励
OpenAI和微软宣布签署一项非约束性谅解备忘录,修订双方合作关系。随着两家公司在AI市场竞争客户并寻求新的基础设施合作伙伴,其关系日趋复杂。该协议涉及OpenAI从非营利组织向营利实体的重组计划,需要微软这一最大投资者的批准。双方表示将积极制定最终合同条款,共同致力于为所有人提供最佳AI工具。
中山大学团队针对OpenAI O1等长思考推理模型存在的"长度不和谐"问题,提出了O1-Pruner优化方法。该方法通过长度-和谐奖励机制和强化学习训练,成功将模型推理长度缩短30-40%,同时保持甚至提升准确率,显著降低了推理时间和计算成本,为高效AI推理提供了新的解决方案。
中国科技企业发布了名为R1的人形机器人,直接对标特斯拉的Optimus机器人产品。这款新型机器人代表了中国在人工智能和机器人技术领域的最新突破,展现出与国际巨头竞争的实力。R1机器人的推出标志着全球人形机器人市场竞争进一步加剧。
上海AI实验室研究团队深入调查了12种先进视觉语言模型在自动驾驶场景中的真实表现,发现这些AI系统经常在缺乏真实视觉理解的情况下生成看似合理的驾驶解释。通过DriveBench测试平台的全面评估,研究揭示了现有评估方法的重大缺陷,并为开发更可靠的AI驾驶系统提供了重要指导。