OpenAI 已开始向 ChatGPT Plus 会员用户推出其最新的 AI 模型 GPT-4.5。
OpenAI 在 X 平台上发布的一系列帖子中表示,此次推广将持续 "1-3 天",并预计访问频率限制会有所调整。GPT-4.5 上周首先向每月支付 200 美元的 ChatGPT Pro 计划订阅用户开放。
公司在一篇帖子中写道:"我们希望为所有能访问 GPT-4.5 的用户提供较大的访问频率限制,但随着我们对需求了解的加深,这些限制可能会发生变化。"
GPT-4.5 是 OpenAI 迄今为止最大的 AI 模型,其训练所需的计算能力和数据量超过了公司之前的所有版本。但这并不意味着它是 OpenAI 最优秀的模型。在多个 AI 基准测试中,GPT-4.5 的表现不如来自中国 AI 公司 DeepSeek、Anthropic 以及 OpenAI 自己开发的新型 AI "推理" 模型。
OpenAI 承认 GPT-4.5 的运营成本非常高昂——如此昂贵以致于公司正在评估是否要在长期继续通过其 API 提供 GPT-4.5 服务。为了覆盖成本,公司对输入模型的每百万个 token (约 75 万字) 收取 75 美元,对模型生成的每百万个 token 收取 150 美元,这分别是 OpenAI 主力模型 GPT-4o 输入成本的 30 倍和输出成本的 15 倍。
尽管如此,OpenAI 表示 GPT-4.5 更大的规模使其具备了 "更深入的世界知识" 和 "更高的情商"。根据 OpenAI 的说法,GPT-4.5 的幻觉(产生虚假信息)频率也低于大多数模型——这理论上意味着它不太可能编造内容。
GPT-4.5 还具有很强的说服力。OpenAI 的一项内部基准测试发现,该模型特别擅长说服其他 AI 给它现金。
好文章,需要你的鼓励
Anthropic发布SCONE-bench智能合约漏洞利用基准测试,评估AI代理发现和利用区块链智能合约缺陷的能力。研究显示Claude Opus 4.5等模型可从漏洞中获得460万美元收益。测试2849个合约仅需3476美元成本,发现两个零日漏洞并创造3694美元利润。研究表明AI代理利用安全漏洞的能力快速提升,每1.3个月翻倍增长,强调需要主动采用AI防御技术应对AI攻击威胁。
NVIDIA联合多所高校开发的SpaceTools系统通过双重交互强化学习方法,让AI学会协调使用多种视觉工具进行复杂空间推理。该系统在空间理解基准测试中达到最先进性能,并在真实机器人操作中实现86%成功率,代表了AI从单一功能向工具协调专家的重要转变,为未来更智能实用的AI助手奠定基础。
Spotify年度总结功能回归,在去年AI播客功能遭遇批评后,今年重新专注于用户数据深度分析。新版本引入近十项新功能,包括首个实时多人互动体验"Wrapped Party",最多可邀请9位好友比较听歌数据。此外还新增热门歌曲播放次数显示、互动歌曲测验、听歌年龄分析和听歌俱乐部等功能,让年度总结更具互动性和个性化体验。
这项研究解决了现代智能机器人面临的"行动不稳定"问题,开发出名为TACO的决策优化系统。该系统让机器人在执行任务前生成多个候选方案,然后通过伪计数估计器选择最可靠的行动,就像为机器人配备智能顾问。实验显示,真实环境中机器人成功率平均提升16%,且系统可即插即用无需重新训练,为机器人智能化发展提供了新思路。