据《华尔街日报》报道,OpenAI正在规划开发一款桌面"超级应用",该应用将把ChatGPT、编程工具Codex以及Atlas浏览器整合到一个统一的使用体验中。这一整合的目标是将其大语言模型工具线进行统一管理,并加强智能体功能。
虽然报道引用了内部讨论和领导层变动的消息,但OpenAI尚未公开确认任何细节或发布时间表。截至3月20日,CEO萨姆·奥特曼在其通常十分活跃的X平台上也没有对这款所谓的超级应用直接发表评论。
如果消息属实,这对许多用户来说将是一个积极的发展。目前,使用OpenAI的产品意味着需要在多个应用之间切换操作。这种碎片化的使用体验是许多用户不经常使用某些工具的主要原因,特别是Atlas浏览器。
当前AI工具使用的困扰
虽然市面上有许多AI工具,从Claude到Gemini,但ChatGPT仍然是最常被使用的选择。用户可以用它进行研究、寻找优惠、编辑图片、下订单、制作演示文稿、检查诈骗信息,甚至将儿童的艺术作品"变成现实"。尽管其他工具在某些特定功能上可能表现更好,但ChatGPT仍然是大多数AI任务的首选起点。
然而,在过去几年中,ChatGPT的使用体验增加了一些阻碍。用户无法再通过浏览器中的单一网站,或桌面和手机上的单一应用来访问OpenAI提供的所有服务。例如,如果用户需要自动化方面的帮助,就必须切换到Codex。虽然Codex功能强大,但它是一个完全独立的应用,需要单独下载。
Atlas是另一个例子。在刚推出时,许多用户频繁测试其购物和不同智能体功能,体验非常有趣。用户甚至可以让它编制并下达沃尔玛订单,或寻找迪士尼冰上演出的最优票价。
但在过去几个月中,许多用户已经停止使用Atlas,原因很简单:大多数人在桌面上主要使用Chrome浏览器。打开一个独立的AI浏览器需要打破正常的工作流程。此外,Chrome也在不断增加更多Gemini功能,比如其Autopilot智能体功能可以帮助购物、研究和发送邮件。
还有Sora。虽然目前传言它不会包含在OpenAI即将推出的"超级应用"中,但如果能包含进去就太好了。许多用户最初使用它较为频繁,比如为孩子的艺术作品制作动画,效果相当不错。但同样地,它独立存在且仅限于手机使用。现在许多用户已经记不起上次打开它是什么时候了。
超级应用的必要性
许多用户不经常使用Codex、Atlas或Sora的原因并不是因为它们缺乏功能或能力,而是因为它们需要在应用之间切换。这听起来可能是小事,但会快速累积成大问题。每个额外的应用都意味着另一次下载、另一次登录和另一个需要维护的使用习惯。在许多人试图减少屏幕使用时间的情况下,这包括限制使用的应用数量。
因此,大多数情况下,用户会默认选择最简单的方式。这意味着停留在一个地方,无论是桌面浏览器中的ChatGPT还是手机上的应用。这也意味着用户最终只使用了OpenAI所构建功能的一小部分。这就是问题所在,也可能是为什么OpenAI认为超级应用很有意义的原因。
将ChatGPT、Codex和Atlas整合到一个界面中可以消除阻止许多人使用其所有工具的阻碍。这也与AI的发展方向一致。
智能体AI的发展趋势
智能体AI旨在跨多个步骤完成任务,无论是研究、编程还是浏览。但如果所有这些能力都存在于同一个地方,AI智能体不是会工作得更好吗?一个应用就能提问、编写代码、浏览网页、生成媒体内容并完成任务,而无需跳转。关键是,用户希望这种体验不仅仅存在于桌面,还要扩展到所有设备。
实施计划和挑战
《华尔街日报》报道称,包括奥特曼在内的高级管理人员在过去几周内一直在审查OpenAI的产品组合,并识别需要降低优先级的领域。在最近的全员会议上,应用主管Fidji Simo据报告诉员工,他们不能被"副任务"分散注意力。公司还在密切关注Anthropic,该公司在企业和编程客户方面获得了发展势头,OpenAI现在正在以内部描述为"红色代码"的紧迫感运营。
但构建超级应用本身不也是一个副任务吗,即使它是为了整合所有其他任务?
尽管如此,根据报道,OpenAI预计在未来几个月内将在Codex中推出更高级的智能体功能,然后将所有功能合并到一个统一的体验中。重点是桌面版本,ChatGPT的移动应用将保持不变。
Q&A
Q1:OpenAI的超级应用计划包含哪些功能?
A:根据《华尔街日报》的报道,OpenAI的超级应用将整合ChatGPT、编程工具Codex以及Atlas浏览器到一个统一的桌面应用中。目标是将其大语言模型工具线进行统一管理,并加强智能体功能,让用户无需在多个应用之间切换就能使用所有AI工具。
Q2:为什么OpenAI要开发超级应用?
A:主要原因是解决当前产品碎片化的问题。用户目前需要在多个独立应用之间切换来使用不同的OpenAI工具,这种体验阻碍了许多用户充分利用所有功能。超级应用可以消除这种使用阻碍,提供更流畅的用户体验,同时符合智能体AI的发展趋势。
Q3:OpenAI超级应用什么时候能发布?
A:OpenAI尚未公开确认具体的发布时间表。根据报道,公司预计先在未来几个月内在Codex中推出更高级的智能体功能,然后将所有功能合并到统一体验中。目前重点是桌面版本,ChatGPT移动应用暂时保持不变。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。