周一,OpenAI发布了Codex,这是一款面向软件开发者的智能体编程工具。今天,OpenAI还推出了一个旨在为Codex提供强大动力的新模型:GPT-5.3 Codex。
该公司表示,这个模型将Codex从一个仅能"编写和审查代码"的智能体转变为一个可以做到"开发者和专业人士在计算机上几乎所有工作"的智能体,扩展了谁可以构建软件以及工作如何完成。OpenAI在多项性能基准测试中对新模型进行了测试后声称,它能够"在几天时间内从零开始创建高功能的复杂游戏和应用程序"。
OpenAI表示,GPT-5.3 Codex比其前一个模型(GPT-5.2)快25%,并且这是该公司第一个"在创建自己过程中发挥了关键作用"的模型,这意味着该公司的员工使用程序的早期版本来调试自己并评估其性能表现。
值得注意的是,这个新模型的发布紧随其竞争对手Anthropic发布的新智能体编程模型之后。实际上,OpenAI和Anthropic原本计划在完全相同的时间发布他们的两个智能体编程工具:太平洋标准时间上午10点。然而,在原定发布时间前不久,Anthropic将其发布时间提前了15分钟,在宣传模型的竞争中略胜OpenAI一筹。
Q&A
Q1:GPT-5.3 Codex相比之前的版本有什么改进?
A:GPT-5.3 Codex比前一个模型GPT-5.2快25%,并且功能大幅提升。它从仅能"编写和审查代码"的智能体转变为可以做开发者和专业人士在计算机上几乎所有工作的智能体,能够在几天内从零开始创建复杂的游戏和应用程序。
Q2:GPT-5.3 Codex有什么特殊之处?
A:GPT-5.3 Codex是OpenAI第一个"在创建自己过程中发挥了关键作用"的模型,该公司员工使用程序的早期版本来调试自己并评估性能表现,实现了自我改进的能力。
Q3:OpenAI和Anthropic的发布时间安排是怎样的?
A:OpenAI和Anthropic原本计划在同一时间(太平洋标准时间上午10点)发布各自的智能体编程工具。但在原定时间前,Anthropic将发布时间提前了15分钟,在这场宣传竞赛中略胜一筹。
好文章,需要你的鼓励
购买笔记本电脑时,用户现在需要了解Copilot+ PC、NPU和本地AI处理等新概念。搭载专用神经处理单元(NPU)的Copilot+ PC能提供至少40 TOPS的AI算力,支持实时字幕翻译、视频通话优化、AI图像编辑等功能,同时提升续航表现。戴尔最新产品线涵盖多种选择:Dell 14 Plus适合学生和通勤族,Dell 16 Plus适合多任务办公用户,XPS 14面向轻度创作者,XPS 16则以31小时超长续航和3.6磅轻薄机身成为内容创作者的旗舰之选。
强化学习训练AI时悄悄留下的"进展优势"信号,可作为免费的步骤级评分器,无需额外训练,在多个智能体任务上超越专用奖励模型。
圣安德鲁斯大学博士Henry Legg在《自然》杂志发表同行评审论文,对微软拓扑间隙协议(TGP)框架提出质疑,认为该框架在推断Majorana粒子量子态存在方面存在缺陷,且实验数据分析结论可能有误。微软此前宣称将于2029年实现可扩展量子计算机,并推出Majorana 2芯片。对此,微软坚持立场,表示已发表正式反驳并获《自然》收录,对研发路线图充满信心。
阿里团队推出Qwen-Image-Agent,通过规划、推理、搜索、记忆和反馈五大模块,主动填补用户需求与AI生成所需信息之间的"情境鸿沟",并配套发布IA-Bench评测基准。