OpenAI今日推出了新的人工智能模型GPT-5-Codex,该公司表示这款模型能够在无需用户协助的情况下完成长达数小时的编程任务。
该算法是GPT-5的改进版本,在额外的编程数据上进行了训练。用户可以通过Codex访问该模型,Codex是付费ChatGPT计划中包含的AI编程工具。
OpenAI表示,GPT-5-Codex在处理复杂、耗时的编程任务方面比其前身表现更优。"在测试期间,我们看到GPT-5-Codex能够独立工作超过7小时,"OpenAI工作人员在今天的博客文章中详细说明。GPT-5-Codex能够发现在长时间编程会话中犯的错误并自动修复。
据OpenAI介绍,该模型处理耗时任务的能力使其在重构方面特别有用。重构是指改变应用程序代码库的过程,目的不是添加功能,而是提高代码质量。例如,开发人员可能希望减少代码片段的内存使用或提升响应时间。
OpenAI使用内部开发的重构基准测试评估了GPT-5-Codex的能力。该模型得分为51.3%,比GPT高出17%以上。
GPT-5-Codex可以根据任务难度调整处理时间。因此,该模型处理简单请求的速度明显快于GPT-5。"这意味着在处理小型、定义明确的请求或与其聊天时,Codex会感觉更加敏捷,"OpenAI工作人员写道。
ChatGPT开发商让员工向GPT-5-Codex发送编程请求,并根据模型生成的Token计数(硬件使用量的衡量标准)对这些请求进行排名。据OpenAI称,最简单的10%请求使用的Token比GPT-5减少了93.7%。相比之下,最复杂的编程提示会导致GPT-5-Codex花费比GPT-5更多的时间进行推理。
OpenAI表示该模型还带来了可用性改进。如果开发人员希望GPT-5生成遵循特定风格或最佳实践的代码,他们通常必须输入详细的自然语言指令。GPT-5-Codex减少了对指导的需求。
Codex是访问该模型的AI编程工具,此前有两个版本。一个嵌入在ChatGPT中,另一个是命令行工具。结合GPT-5-Codex的发布,OpenAI正在推出第三个版本,开发人员可以直接将其集成到代码编辑器中。
新的Codex版本通常比其他两个版本需要更短的提示。据OpenAI称,原因是它不仅可以访问提示的内容,还可以访问开发人员代码编辑器中打开的文件。同时,Codex的命令行版本现在允许开发人员上传解释性图像,如用户界面草图。
GPT-5-Codex现已通过ChatGPT的Plus、Pro、Business、Edu和Enterprise计划中的Codex立即可用。OpenAI计划在不久的将来将该模型添加到其应用程序编程接口中。
Q&A
Q1:GPT-5-Codex有什么特别的能力?
A:GPT-5-Codex能够在无需用户协助的情况下独立工作超过7小时,完成复杂、耗时的编程任务。它还能发现在长时间编程会话中犯的错误并自动修复,特别适用于代码重构工作。
Q2:GPT-5-Codex比GPT-5有哪些改进?
A:GPT-5-Codex在重构基准测试中得分51.3%,比GPT高出17%以上。它能根据任务难度调整处理时间,处理简单请求比GPT-5快93.7%,同时减少了对详细自然语言指令的需求。
Q3:如何使用GPT-5-Codex?
A:GPT-5-Codex可通过ChatGPT的Plus、Pro、Business、Edu和Enterprise计划中的Codex工具访问。现在有三个版本:嵌入ChatGPT的版本、命令行工具版本,以及可直接集成到代码编辑器的新版本。
好文章,需要你的鼓励
Queen's大学研究团队提出结构化智能体软件工程框架SASE,重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者,建立双向咨询机制和标准化文档系统,解决AI编程中的质量控制难题,为软件工程向智能化协作时代转型提供系统性解决方案。
苹果在iOS 26公开发布两周后推出首个修复更新iOS 26.0.1,建议所有用户安装。由于重大版本发布通常伴随漏洞,许多用户此前选择安装iOS 18.7。尽管iOS 26经过数月测试,但更大用户基数能发现更多问题。新版本与iPhone 17等新机型同期发布,测试范围此前受限。预计苹果将继续发布后续修复版本。
西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM,通过收集15家医院20万病例和147万超声图像,采用专家混合架构,实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题,为医生提供智能辅助,推动医疗AI向专业化发展。