OpenAI今日推出了新的人工智能模型GPT-5-Codex,该公司表示这款模型能够在无需用户协助的情况下完成长达数小时的编程任务。
该算法是GPT-5的改进版本,在额外的编程数据上进行了训练。用户可以通过Codex访问该模型,Codex是付费ChatGPT计划中包含的AI编程工具。
OpenAI表示,GPT-5-Codex在处理复杂、耗时的编程任务方面比其前身表现更优。"在测试期间,我们看到GPT-5-Codex能够独立工作超过7小时,"OpenAI工作人员在今天的博客文章中详细说明。GPT-5-Codex能够发现在长时间编程会话中犯的错误并自动修复。
据OpenAI介绍,该模型处理耗时任务的能力使其在重构方面特别有用。重构是指改变应用程序代码库的过程,目的不是添加功能,而是提高代码质量。例如,开发人员可能希望减少代码片段的内存使用或提升响应时间。
OpenAI使用内部开发的重构基准测试评估了GPT-5-Codex的能力。该模型得分为51.3%,比GPT高出17%以上。
GPT-5-Codex可以根据任务难度调整处理时间。因此,该模型处理简单请求的速度明显快于GPT-5。"这意味着在处理小型、定义明确的请求或与其聊天时,Codex会感觉更加敏捷,"OpenAI工作人员写道。
ChatGPT开发商让员工向GPT-5-Codex发送编程请求,并根据模型生成的Token计数(硬件使用量的衡量标准)对这些请求进行排名。据OpenAI称,最简单的10%请求使用的Token比GPT-5减少了93.7%。相比之下,最复杂的编程提示会导致GPT-5-Codex花费比GPT-5更多的时间进行推理。
OpenAI表示该模型还带来了可用性改进。如果开发人员希望GPT-5生成遵循特定风格或最佳实践的代码,他们通常必须输入详细的自然语言指令。GPT-5-Codex减少了对指导的需求。
Codex是访问该模型的AI编程工具,此前有两个版本。一个嵌入在ChatGPT中,另一个是命令行工具。结合GPT-5-Codex的发布,OpenAI正在推出第三个版本,开发人员可以直接将其集成到代码编辑器中。
新的Codex版本通常比其他两个版本需要更短的提示。据OpenAI称,原因是它不仅可以访问提示的内容,还可以访问开发人员代码编辑器中打开的文件。同时,Codex的命令行版本现在允许开发人员上传解释性图像,如用户界面草图。
GPT-5-Codex现已通过ChatGPT的Plus、Pro、Business、Edu和Enterprise计划中的Codex立即可用。OpenAI计划在不久的将来将该模型添加到其应用程序编程接口中。
Q&A
Q1:GPT-5-Codex有什么特别的能力?
A:GPT-5-Codex能够在无需用户协助的情况下独立工作超过7小时,完成复杂、耗时的编程任务。它还能发现在长时间编程会话中犯的错误并自动修复,特别适用于代码重构工作。
Q2:GPT-5-Codex比GPT-5有哪些改进?
A:GPT-5-Codex在重构基准测试中得分51.3%,比GPT高出17%以上。它能根据任务难度调整处理时间,处理简单请求比GPT-5快93.7%,同时减少了对详细自然语言指令的需求。
Q3:如何使用GPT-5-Codex?
A:GPT-5-Codex可通过ChatGPT的Plus、Pro、Business、Edu和Enterprise计划中的Codex工具访问。现在有三个版本:嵌入ChatGPT的版本、命令行工具版本,以及可直接集成到代码编辑器的新版本。
好文章,需要你的鼓励
英特尔携手戴尔以及零克云,通过打造“工作站-AI PC-云端”的协同生态,大幅缩短AI部署流程,助力企业快速实现从想法验证到规模化落地。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。