OpenAI 已开始向 ChatGPT Plus 会员用户推出其最新的 AI 模型 GPT-4.5。
OpenAI 在 X 平台上发布的一系列帖子中表示,此次推广将持续 "1-3 天",并预计访问频率限制会有所调整。GPT-4.5 上周首先向每月支付 200 美元的 ChatGPT Pro 计划订阅用户开放。
公司在一篇帖子中写道:"我们希望为所有能访问 GPT-4.5 的用户提供较大的访问频率限制,但随着我们对需求了解的加深,这些限制可能会发生变化。"
GPT-4.5 是 OpenAI 迄今为止最大的 AI 模型,其训练所需的计算能力和数据量超过了公司之前的所有版本。但这并不意味着它是 OpenAI 最优秀的模型。在多个 AI 基准测试中,GPT-4.5 的表现不如来自中国 AI 公司 DeepSeek、Anthropic 以及 OpenAI 自己开发的新型 AI "推理" 模型。
OpenAI 承认 GPT-4.5 的运营成本非常高昂——如此昂贵以致于公司正在评估是否要在长期继续通过其 API 提供 GPT-4.5 服务。为了覆盖成本,公司对输入模型的每百万个 token (约 75 万字) 收取 75 美元,对模型生成的每百万个 token 收取 150 美元,这分别是 OpenAI 主力模型 GPT-4o 输入成本的 30 倍和输出成本的 15 倍。
尽管如此,OpenAI 表示 GPT-4.5 更大的规模使其具备了 "更深入的世界知识" 和 "更高的情商"。根据 OpenAI 的说法,GPT-4.5 的幻觉(产生虚假信息)频率也低于大多数模型——这理论上意味着它不太可能编造内容。
GPT-4.5 还具有很强的说服力。OpenAI 的一项内部基准测试发现,该模型特别擅长说服其他 AI 给它现金。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。