OpenAI CEO Sam Altman 在周三公布了公司备受期待的 GPT-5 模型的发展路线图。GPT-5 是 2023 年轰动全球科技和政策圈的 GPT-4 AI 语言模型的后续版本。Altman 在 X 平台上回应提问时表示,GPT-5 将在"数月内"发布,暗示可能在 2025 年后期推出。
Altman 在 X 平台上详细解释,公司计划在"数周内"发布 GPT-4.5 (内部代号"Orion"),这将是 OpenAI 最后一个非模拟推理模型。模拟推理 (SR) 模型 (如 o3) 使用特殊技术来迭代处理用户提出的问题,但比传统的大语言模型 (如 GPT-4o) 速度更慢,且并非适用于所有任务。
之后,GPT-5 将成为一个整合了 OpenAI 当前所有 AI 模型特性的系统,包括传统 AI 模型、SR 模型,以及专门用于网页搜索和研究的专业模型。"我们将在 ChatGPT 和 API 中发布 GPT-5,作为整合了包括 o3 在内的多项技术的系统,"他写道,"我们将不再单独发布 o3 模型。"
Altman 表示,ChatGPT 免费用户将获得"标准智能设置下的无限 GPT-5 对话访问权限",ChatGPT Plus 用户可以"以更高智能级别运行 GPT-5",而 Pro 用户则可以"以最高智能级别运行 GPT-5"。
他还提到,这些集成的 AI 模型将能够使用 OpenAI 的多项 ChatGPT 扩展功能,包括高级语音模式、Canvas、搜索和深度研究。
简化复杂的产品线 此前,Altman 曾评论过未来"GPT-5"标签的随意性,暗示公司去年发布的几个 AI 模型本可以被命名为 GPT-5。
例如,在 2024 年 3 月接受 Lex Friedman 采访时,Altman 表示公司正在准备发布一个重要的 AI 模型 (很可能就是后来的 GPT-4o 或"o1"),但最终名称尚未确定。当时他对 Friedman 说:"在我们讨论一个被称为或不称为 GPT-5 的模型之前,或者讨论一个比预期的 GPT-5 稍差或稍好的模型之前,我认为我们还有许多其他重要的东西要先发布。"
人们可能会认为 OpenAI 是因为达到了某个性能门槛才最终决定将新 AI 模型命名为"GPT-5",但这显然是出于必要性。如上所述,GPT-5 主要是一个品牌战略举措,将把许多功能整合到一个统一的界面中。
Altman 在 X 上发文说:"我们希望更好地分享我们的预期路线图,并大幅简化我们的产品供应。我们意识到我们的模型和产品供应变得多么复杂。"
目前,如果用户使用 Pro 账户登录 ChatGPT,他们可以选择至少 10 个 AI 模型,包括 GPT-4o、带搜索功能的 GPT-4o、带深度研究的 GPT-4o、带定时任务的 GPT-4o、o1、o3-mini、o3-mini-high、o1 专业模式、GPT-4o mini 和 GPT-4。还有高级语音模式。AI 模型分为两类:传统的大语言模型 (如 GPT-4o) 和模拟推理模型 (如 o1 和 o3-mini)。
Altman 写道:"我们的首要目标是通过创建能够使用所有工具、知道何时需要长时间思考以及普遍适用于广泛任务的系统,来统一 o 系列模型和 GPT 系列模型。"
期待任何没有密切关注 OpenAI 模型开发的人能够理解这些选项可能并不现实,Altman 也认识到了这一点。他在帖子中写道:"我们和你一样讨厌模型选择器,我们希望回归到统一的智能魔法。"
与此同时,DeepSeek、Anthropic、Meta 和 Google 等竞争对手紧随 OpenAI 之后,各自以前所未有的速度迭代其 AI 模型。我们将继续关注 GPT-4.5 和 GPT-5 的具体发布日期相关新闻。
好文章,需要你的鼓励
谷歌推出类似苹果私有云计算的新平台,让用户在享受先进AI功能的同时保护数据隐私。该平台将复杂AI请求转移到云端处理,确保敏感数据仅用户可见,连谷歌也无法访问。随着AI工具需要更强计算能力,这一方案平衡了隐私保护与性能需求。Pixel 10手机将获得更智能的Magic Cue建议和更多语言的录音转录功能。
StepFun团队开发了革命性的Mind-Paced Speaking技术,让AI聊天机器人首次具备边思考边说话的能力。通过双大脑架构,分别负责思考和表达的两个AI模型协同工作,实现零延迟响应的同时保持92.8%的高准确率。这项技术模拟人类大脑机制,让AI对话变得自然流畅,为人机交互开创了全新范式。
OpenAI宣布推出GPT-5的首个重大升级版本GPT-5.1,包含Instant和Thinking两个变体。新模型在对话风格上更加自然温暖,具备自适应推理能力,能根据问题复杂度调整思考深度。GPT-5.1提供八种个性化对话模式供用户选择,减少专业术语使用,提升易理解性。该升级旨在解决GPT-5发布后用户反馈的不足,将逐步向订阅用户推出。
微软和哥伦比亚大学联合开发了名为Dyna-Mind的AI训练框架,通过两阶段训练教会AI进行"心理模拟"。该框架让AI学会在行动前进行虚拟试错,显著提升了在复杂规划任务中的表现。在推箱子、虚拟家庭任务和安卓设备操作等测试中,成功率分别达到82.5%、92.5%和40.7%,远超传统方法。这项研究为开发更智能的AI助手奠定了基础。