OpenAI 旗下的 Codex 桌面应用程序今日迎来全新版本更新,带来了一系列功能升级与改进,涵盖开发者专属能力拓展、非开发类知识工作场景延伸,以及为打造公司"超级应用"所奠定的基础架构。
其中最受关注的新特性,是支持在后台运行任务的能力。OpenAI 表示,该功能可在不干扰用户正常桌面操作的前提下,让 Codex 独立完成各类任务。
OpenAI 在官方博客中对此次更新作出说明:
借助后台电脑操控能力,Codex 现在可以通过独立的光标进行查看、点击和输入,从而使用电脑上的所有应用程序。多个智能体可在 Mac 上并行运行,且不会干扰用户在其他应用中的正常使用。对于开发者而言,这一功能在迭代前端改动、测试应用程序或操作无 API 接口的软件时尤为实用。
此外,Codex 现在还支持提前数小时、数天乃至数周安排待执行任务,并能在指定时间自动唤醒并完成相应操作。
新版本还内置了应用内网页浏览器,用户可借此直观查看 Codex 在网页端的工作成果,并能在页面特定位置留下批注形式的操作指令,操作方式类似于设计团队常用的网页反馈工具。与此同时,新版本新增了对 gpt-image-1.5 图像生成模型的调用能力,生成的图像可直接用于原型设计与效果图制作等场景。
OpenAI 表示:"我们计划逐步扩展该功能,使 Codex 能够全面掌控浏览器,而不仅限于本地运行的 Web 应用。"
在软件开发能力方面,Codex 现支持同时运行多个终端标签页,并可根据 GitHub 上的代码审查评论自动采取对应操作。
此次更新还新增了 90 款插件,进一步扩展了 Codex 可接入的工作流类型,覆盖范围延伸至软件开发领域之外的通用知识工作任务与应用场景。
从表面上看,这些更新似乎是一系列互不相关的零散改动,但背后实则贯穿着一条清晰的主线——其中许多新增功能,正是外界对 OpenAI "超级应用"的预期所在。这款超级应用有望整合 Atlas 浏览器项目、Codex 以及其他智能体工具,从而服务于更广泛的使用场景。
在一场媒体沟通会上,Codex 产品负责人蒂博·索蒂奥(Thibault Sottiaux)表示:"我们其实在悄悄做一件事——在公众视野中,以 Codex 为起点,逐步将超级应用构建成型。"
Q&A
Q1:Codex 后台电脑操控功能是如何运作的?
A:Codex 的后台电脑操控功能通过独立光标实现对电脑上所有应用程序的查看、点击和输入操作。多个智能体可在 Mac 上同时并行运行,并且不会干扰用户在其他应用中正常工作。这对开发者来说尤为实用,适合用于迭代前端改动、测试应用或操作没有 API 接口的软件。
Q2:Codex 新版本的内置浏览器有什么用途?
A:Codex 新内置的应用内网页浏览器,允许用户直接查看 Codex 在网页端执行任务的实际效果,并可在页面的特定位置添加批注形式的操作指令,类似于设计团队日常使用的网页反馈工具。OpenAI 计划未来进一步扩展该功能,使 Codex 能够全面掌控浏览器,而不只局限于本地运行的 Web 应用。
Q3:OpenAI 所说的"超级应用"具体指什么?
A:OpenAI 的"超级应用"是一款计划中的综合性应用,将整合 Atlas 网页浏览器、Codex 以及其他智能体工具,覆盖广泛的使用场景。Codex 产品负责人透露,OpenAI 目前正以 Codex 为基础,逐步在公众视野中将超级应用的功能框架搭建成型,而此次更新正是其中的重要一环。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。