OpenAI 计划在未来数月内发布其新一代旗舰人工智能系统 GPT-5。
首席执行官 Sam Altman 今天在 X 平台上发布的一系列帖子中透露了这一发布时间。他同时还分享了有关 ChatGPT 开发团队的产品路线图的其他细节。
在 GPT-5 发布之前,OpenAI 将在未来几周内推出功能相对较弱的大语言模型 GPT-4.5。后者是公司通用型 GPT-4o 模型的继任者。与 OpenAI 专注于推理优化的大语言模型相比,GPT-4o 在代码生成等任务上的表现较弱,但它的推理成本明显更低。
Altman 详细说明,GPT-4.5 将是 OpenAI 最后一个不具备思维链 (Chain of Thought, CoT) 机制的大语言模型。CoT 是一种将复杂任务分解为一系列简单步骤的机器学习技术。研究表明,这种方法能显著提高大语言模型的输出质量,特别是在处理复杂推理任务时。
去年,据 The Information 报道,与前代 GPT-4 相比,GPT-4.5 在输出质量方面的提升将"小得多"。此外,据报道,这个即将推出的模型在编程任务上"并不能稳定超越" GPT-4。这可能是因为 OpenAI 在这方面的努力主要集中在其推理优化型大语言模型上,这些模型专门针对编程和数学任务进行了优化。
OpenAI 最新的推理优化大语言模型 o3 于去年 12 月发布。它在 Frontier Math(一个包含特别困难数学问题的基准测试)中创下了 25.2% 的记录分数,远超此前不到 2% 的最高分。
在今天的 X 平台帖子中,Altman 透露 OpenAI 已放弃将 o3 作为独立产品的计划。相反,公司计划将该模型整合到预计在数月内推出的 GPT-5 中。
"我们的首要目标是通过创建能够使用所有工具、知道何时需要长时间思考以及普遍适用于广泛任务的系统,来统一 o 系列模型和 GPT 系列模型,"Altman 写道。
OpenAI 计划在 ChatGPT 的免费版和付费版中都提供 GPT-5。付费用户将可以使用具有更高级推理能力的版本。
这些高级功能可能由 OpenAI 的测试时计算技术提供支持。该技术通过投入更多时间和计算资源来处理提示,从而提高模型的输出质量。OpenAI 已在 o3 中实现了这项技术。
上个月,该公司推出了由 o3 驱动的 Deep Research 工具,帮助用户搜索网络信息。它可以基于数百个公开来源的数据生成详细报告。Altman 今天透露,ChatGPT 免费版用户每月可以使用两次 Deep Research 查询,而 ChatGPT Plus 订阅用户则可以使用多达 10 次查询。
好文章,需要你的鼓励
尽管全球企业AI投资在2024年达到2523亿美元,但MIT研究显示95%的企业仍未从生成式AI投资中获得回报。专家预测2026年将成为转折点,企业将从试点阶段转向实际部署。关键在于CEO精准识别高影响领域,推进AI代理技术应用,并加强员工AI能力培训。Forrester预测30%大型企业将实施强制AI培训,而Gartner预计到2028年15%日常工作决策将由AI自主完成。
这项由北京大学等机构联合完成的研究,开发了名为GraphLocator的智能软件问题诊断系统,通过构建代码依赖图和因果问题图,能够像医生诊断疾病一样精确定位软件问题的根源。在三个大型数据集的测试中,该系统比现有方法平均提高了19.49%的召回率和11.89%的精确率,特别在处理复杂的跨模块问题时表现优异,为软件维护效率的提升开辟了新路径。
2026年软件行业将迎来定价模式的根本性变革,从传统按席位收费转向基于结果的付费模式。AI正在重塑整个软件经济学,企业IT预算的12-15%已投入AI领域。这一转变要求建立明确的成功衡量指标,如Zendesk以"自动化解决方案"为标准。未来将出现更精简的工程团队,80%的工程师需要为AI驱动的角色提升技能,同时需要重新设计软件开发和部署流程以适应AI优先的工作流程。
这项由德国达姆施塔特工业大学领导的国际研究团队首次发现,当前最先进的专家混合模型AI系统存在严重安全漏洞。通过开发GateBreaker攻击框架,研究人员证明仅需关闭约3%的特定神经元,就能让AI的攻击成功率从7.4%暴增至64.9%。该研究揭示了专家混合模型安全机制过度集中的根本缺陷,为AI安全领域敲响了警钟。