OpenAI CEO Sam Altman 在周三公布了公司备受期待的 GPT-5 模型的发展路线图。GPT-5 是 2023 年轰动全球科技和政策圈的 GPT-4 AI 语言模型的后续版本。Altman 在 X 平台上回应提问时表示,GPT-5 将在"数月内"发布,暗示可能在 2025 年后期推出。
Altman 在 X 平台上详细解释,公司计划在"数周内"发布 GPT-4.5 (内部代号"Orion"),这将是 OpenAI 最后一个非模拟推理模型。模拟推理 (SR) 模型 (如 o3) 使用特殊技术来迭代处理用户提出的问题,但比传统的大语言模型 (如 GPT-4o) 速度更慢,且并非适用于所有任务。
之后,GPT-5 将成为一个整合了 OpenAI 当前所有 AI 模型特性的系统,包括传统 AI 模型、SR 模型,以及专门用于网页搜索和研究的专业模型。"我们将在 ChatGPT 和 API 中发布 GPT-5,作为整合了包括 o3 在内的多项技术的系统,"他写道,"我们将不再单独发布 o3 模型。"
Altman 表示,ChatGPT 免费用户将获得"标准智能设置下的无限 GPT-5 对话访问权限",ChatGPT Plus 用户可以"以更高智能级别运行 GPT-5",而 Pro 用户则可以"以最高智能级别运行 GPT-5"。
他还提到,这些集成的 AI 模型将能够使用 OpenAI 的多项 ChatGPT 扩展功能,包括高级语音模式、Canvas、搜索和深度研究。
简化复杂的产品线 此前,Altman 曾评论过未来"GPT-5"标签的随意性,暗示公司去年发布的几个 AI 模型本可以被命名为 GPT-5。
例如,在 2024 年 3 月接受 Lex Friedman 采访时,Altman 表示公司正在准备发布一个重要的 AI 模型 (很可能就是后来的 GPT-4o 或"o1"),但最终名称尚未确定。当时他对 Friedman 说:"在我们讨论一个被称为或不称为 GPT-5 的模型之前,或者讨论一个比预期的 GPT-5 稍差或稍好的模型之前,我认为我们还有许多其他重要的东西要先发布。"
人们可能会认为 OpenAI 是因为达到了某个性能门槛才最终决定将新 AI 模型命名为"GPT-5",但这显然是出于必要性。如上所述,GPT-5 主要是一个品牌战略举措,将把许多功能整合到一个统一的界面中。
Altman 在 X 上发文说:"我们希望更好地分享我们的预期路线图,并大幅简化我们的产品供应。我们意识到我们的模型和产品供应变得多么复杂。"
目前,如果用户使用 Pro 账户登录 ChatGPT,他们可以选择至少 10 个 AI 模型,包括 GPT-4o、带搜索功能的 GPT-4o、带深度研究的 GPT-4o、带定时任务的 GPT-4o、o1、o3-mini、o3-mini-high、o1 专业模式、GPT-4o mini 和 GPT-4。还有高级语音模式。AI 模型分为两类:传统的大语言模型 (如 GPT-4o) 和模拟推理模型 (如 o1 和 o3-mini)。
Altman 写道:"我们的首要目标是通过创建能够使用所有工具、知道何时需要长时间思考以及普遍适用于广泛任务的系统,来统一 o 系列模型和 GPT 系列模型。"
期待任何没有密切关注 OpenAI 模型开发的人能够理解这些选项可能并不现实,Altman 也认识到了这一点。他在帖子中写道:"我们和你一样讨厌模型选择器,我们希望回归到统一的智能魔法。"
与此同时,DeepSeek、Anthropic、Meta 和 Google 等竞争对手紧随 OpenAI 之后,各自以前所未有的速度迭代其 AI 模型。我们将继续关注 GPT-4.5 和 GPT-5 的具体发布日期相关新闻。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。