就在推出最新大语言模型一个月之后,OpenAI 已宣布在 ChatGPT 中提供 GPT-4.1 选项。
该公司在 X 上发布消息称,应广大用户要求,于今日将 GPT-4.1 引入 ChatGPT。该模型将面向 ChatGPT Plus、Pro 以及 Team 用户开放,可通过模型选择器中“more models”下拉菜单进行访问。公司表示,Enterprise 和 Edu 用户也将在未来几周内能够使用这一新模型。
此外,OpenAI 表示,GPT-4.1 mini 将取代 ChatGPT 中原有的 GPT-4o mini 模型。在这种情况下,该模型将向所有用户开放,包括免费用户。
公司还介绍,对于所有免费用户,GPT-4o 仍将作为默认模型。GPT-4o 是 OpenAI 原先定位为推理模型,设计上更为谨慎地分析回答,并提供解释其思考过程的功能,使用户能够了解其结论的形成依据。
OpenAI 指出,免费用户仍将有每日使用额度,但一旦达到 GPT-4o 的最大查询次数,系统将不再切换回 GPT-4o mini(如以往那样),而改为切换至 GPT-4.1 mini。
应广大用户要求,GPT-4.1 从今天起将在 ChatGPT 中直接上线。
GPT-4.1 是一款专注于编码任务及指令跟随的专用模型。由于其运算速度更快,因此对于日常编码需求来说,是 OpenAI o3 和 o4-mini 的理想替代选择。
— OpenAI (@OpenAI) 2025 年 5 月 14 日
OpenAI 在四月发布了 GPT-4.1,同时推出了两个较小的模型——GPT-4.1 mini 和 GPT-4.1 nano,这两款模型在性能和响应质量上进行了折中,以实现更低的价格。公司当时表示,GPT-4.1 在编码任务上“显著优于”其前代产品,并针对程序员的需求进行了多项改进。例如,该模型在生成用户界面方面表现更佳,并且不易产生冗余代码,这意味着开发者在筛选输出结果时将节省更多时间。
GPT-4.1、GPT-4.1 mini 与 GPT-4.1 nano 均支持提示中最多一百万个 Token,这使得它们能够分析极大规模的文件上传,例如整个 GitHub 代码仓库。
早期使用 GPT-4.1 的用户表示,该模型比前代产品明显不那么“话多”,对大多数查询提供了更为直接的回答。然而,普遍共识认为,其实际性能仅略好于 GPT-4o。那些期待更大幅度性能提升的用户,可能需要等待 OpenAI 下一次重大升级——GPT-5,不过目前尚无其发布日期的消息。
OpenAI 在 GPT-4.1 的发布说明中指出,这一更新代表了 AI 实际应用领域的一大步。
公司表示:“通过密切关注真实世界中开发者的需求——涵盖编码、指令跟随以及长上下文理解——这些模型为构建智能系统和复杂代理应用开辟了全新可能。”
好文章,需要你的鼓励
科技泡沫并非世界末日,从经济角度看,泡沫是押注过大导致供过于求。AI泡沫问题复杂在于AI软件开发节奏与数据中心建设周期的时间错配。甲骨文关联数据中心获180亿美元信贷,Meta承诺三年内投入6000亿美元基础设施。麦肯锡调查显示企业虽广泛使用AI但规模有限,多数仍持观望态度。微软CEO表示更担心数据中心空间不足而非芯片短缺,电力需求成为新瓶颈。
香港中文大学研究团队开发的Search-R3系统成功解决了大语言模型推理与搜索分离的问题,通过两阶段训练让AI在深度思考过程中直接生成搜索向量。该系统在多个领域测试中显著超越现有方法,特别是启用推理后性能提升明显,为AI系统设计提供了推理与搜索统一的新范式,展现了从专门化向通用化发展的重要方向。
Goodfire.ai研究人员首次发现AI语言模型中记忆和推理功能通过完全独立的神经通路运作。研究显示,移除记忆通路后,模型丧失97%的训练数据复述能力,但逻辑推理能力几乎完全保留。令人意外的是,算术运算与记忆共享神经通路而非推理通路,这可能解释了AI模型在数学方面的困难。该技术未来有望用于移除版权内容或敏感信息而不损害模型核心功能。
这项由ETH苏黎世等机构发表的突破性研究首次系统性揭示了优化器选择对AI模型量化性能的重大影响。研究团队发现传统的异常值理论完全失效,并开发了革命性的ABC分解框架来准确预测量化后性能。实验证明Shampoo优化器在量化场景下表现最优,该发现为AI模型的实际部署提供了重要指导,有望让AI技术在资源受限设备上发挥更大作用。