OpenAI 计划在未来数月内发布其新一代旗舰人工智能系统 GPT-5。
首席执行官 Sam Altman 今天在 X 平台上发布的一系列帖子中透露了这一发布时间。他同时还分享了有关 ChatGPT 开发团队的产品路线图的其他细节。
在 GPT-5 发布之前,OpenAI 将在未来几周内推出功能相对较弱的大语言模型 GPT-4.5。后者是公司通用型 GPT-4o 模型的继任者。与 OpenAI 专注于推理优化的大语言模型相比,GPT-4o 在代码生成等任务上的表现较弱,但它的推理成本明显更低。
Altman 详细说明,GPT-4.5 将是 OpenAI 最后一个不具备思维链 (Chain of Thought, CoT) 机制的大语言模型。CoT 是一种将复杂任务分解为一系列简单步骤的机器学习技术。研究表明,这种方法能显著提高大语言模型的输出质量,特别是在处理复杂推理任务时。
去年,据 The Information 报道,与前代 GPT-4 相比,GPT-4.5 在输出质量方面的提升将"小得多"。此外,据报道,这个即将推出的模型在编程任务上"并不能稳定超越" GPT-4。这可能是因为 OpenAI 在这方面的努力主要集中在其推理优化型大语言模型上,这些模型专门针对编程和数学任务进行了优化。
OpenAI 最新的推理优化大语言模型 o3 于去年 12 月发布。它在 Frontier Math(一个包含特别困难数学问题的基准测试)中创下了 25.2% 的记录分数,远超此前不到 2% 的最高分。
在今天的 X 平台帖子中,Altman 透露 OpenAI 已放弃将 o3 作为独立产品的计划。相反,公司计划将该模型整合到预计在数月内推出的 GPT-5 中。
"我们的首要目标是通过创建能够使用所有工具、知道何时需要长时间思考以及普遍适用于广泛任务的系统,来统一 o 系列模型和 GPT 系列模型,"Altman 写道。
OpenAI 计划在 ChatGPT 的免费版和付费版中都提供 GPT-5。付费用户将可以使用具有更高级推理能力的版本。
这些高级功能可能由 OpenAI 的测试时计算技术提供支持。该技术通过投入更多时间和计算资源来处理提示,从而提高模型的输出质量。OpenAI 已在 o3 中实现了这项技术。
上个月,该公司推出了由 o3 驱动的 Deep Research 工具,帮助用户搜索网络信息。它可以基于数百个公开来源的数据生成详细报告。Altman 今天透露,ChatGPT 免费版用户每月可以使用两次 Deep Research 查询,而 ChatGPT Plus 订阅用户则可以使用多达 10 次查询。
好文章,需要你的鼓励
B&H近期对多款M5 Pro MacBook Pro机型推出300美元优惠。14英寸M5 Pro版本(48GB内存+1TB固态硬盘)现售价2299美元,较原价2599美元节省300美元,且该配置在亚马逊无法购买,折扣机会更为难得。此外,16英寸M5 Pro版本(64GB内存+1TB固态硬盘)同样享有300美元折扣。B&H在多款高配MacBook机型上的定价已低于亚马逊,是近期可找到的最优价格。
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
Insta360推出GO 3S复古套装,将现代4K运动相机与胶片时代美学结合。套装核心仍是仅重39克的GO 3S,新增复古取景器、胶片风格滤镜、NFC定制外壳及可延长录制时长至76分钟的电池组。复古取景器模仿老式腰平相机设计,鼓励用户放慢节奏、专注构图。相机内置11种色彩预设及负片、正片等滤镜,同时保留FlowState防抖、4K拍摄及10米防水能力,面向热衷复古影像风格的年轻创作者。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。