OpenAI CEO Sam Altman 在周三公布了公司备受期待的 GPT-5 模型的发展路线图。GPT-5 是 2023 年轰动全球科技和政策圈的 GPT-4 AI 语言模型的后续版本。Altman 在 X 平台上回应提问时表示,GPT-5 将在"数月内"发布,暗示可能在 2025 年后期推出。
Altman 在 X 平台上详细解释,公司计划在"数周内"发布 GPT-4.5 (内部代号"Orion"),这将是 OpenAI 最后一个非模拟推理模型。模拟推理 (SR) 模型 (如 o3) 使用特殊技术来迭代处理用户提出的问题,但比传统的大语言模型 (如 GPT-4o) 速度更慢,且并非适用于所有任务。
之后,GPT-5 将成为一个整合了 OpenAI 当前所有 AI 模型特性的系统,包括传统 AI 模型、SR 模型,以及专门用于网页搜索和研究的专业模型。"我们将在 ChatGPT 和 API 中发布 GPT-5,作为整合了包括 o3 在内的多项技术的系统,"他写道,"我们将不再单独发布 o3 模型。"
Altman 表示,ChatGPT 免费用户将获得"标准智能设置下的无限 GPT-5 对话访问权限",ChatGPT Plus 用户可以"以更高智能级别运行 GPT-5",而 Pro 用户则可以"以最高智能级别运行 GPT-5"。
他还提到,这些集成的 AI 模型将能够使用 OpenAI 的多项 ChatGPT 扩展功能,包括高级语音模式、Canvas、搜索和深度研究。
简化复杂的产品线 此前,Altman 曾评论过未来"GPT-5"标签的随意性,暗示公司去年发布的几个 AI 模型本可以被命名为 GPT-5。
例如,在 2024 年 3 月接受 Lex Friedman 采访时,Altman 表示公司正在准备发布一个重要的 AI 模型 (很可能就是后来的 GPT-4o 或"o1"),但最终名称尚未确定。当时他对 Friedman 说:"在我们讨论一个被称为或不称为 GPT-5 的模型之前,或者讨论一个比预期的 GPT-5 稍差或稍好的模型之前,我认为我们还有许多其他重要的东西要先发布。"
人们可能会认为 OpenAI 是因为达到了某个性能门槛才最终决定将新 AI 模型命名为"GPT-5",但这显然是出于必要性。如上所述,GPT-5 主要是一个品牌战略举措,将把许多功能整合到一个统一的界面中。
Altman 在 X 上发文说:"我们希望更好地分享我们的预期路线图,并大幅简化我们的产品供应。我们意识到我们的模型和产品供应变得多么复杂。"
目前,如果用户使用 Pro 账户登录 ChatGPT,他们可以选择至少 10 个 AI 模型,包括 GPT-4o、带搜索功能的 GPT-4o、带深度研究的 GPT-4o、带定时任务的 GPT-4o、o1、o3-mini、o3-mini-high、o1 专业模式、GPT-4o mini 和 GPT-4。还有高级语音模式。AI 模型分为两类:传统的大语言模型 (如 GPT-4o) 和模拟推理模型 (如 o1 和 o3-mini)。
Altman 写道:"我们的首要目标是通过创建能够使用所有工具、知道何时需要长时间思考以及普遍适用于广泛任务的系统,来统一 o 系列模型和 GPT 系列模型。"
期待任何没有密切关注 OpenAI 模型开发的人能够理解这些选项可能并不现实,Altman 也认识到了这一点。他在帖子中写道:"我们和你一样讨厌模型选择器,我们希望回归到统一的智能魔法。"
与此同时,DeepSeek、Anthropic、Meta 和 Google 等竞争对手紧随 OpenAI 之后,各自以前所未有的速度迭代其 AI 模型。我们将继续关注 GPT-4.5 和 GPT-5 的具体发布日期相关新闻。
好文章,需要你的鼓励
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
Meta为Facebook和Instagram推出全新AI翻译工具,可实时将用户生成内容转换为其他语言。该功能在2024年Meta Connect大会上宣布,旨在打破语言壁垒,让视频和短视频内容触达更广泛的国际受众。目前支持英语和西班牙语互译,后续将增加更多语言。创作者还可使用AI唇形同步功能,创造无缝的口型匹配效果,并可通过创作者控制面板随时关闭该功能。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。