据报道,OpenAI正计划将其ChatGPT应用程序、Codex编码平台和AI驱动的浏览器整合为单一桌面"超级应用",此举标志着该公司正从使其家喻户晓的消费市场转向企业和开发者受众。
据《华尔街日报》周四报道,这一统一产品将把ChatGPT界面、Codex编码工具以及OpenAI内部称为Atlas的浏览器合并为单一桌面应用程序。ChatGPT的移动版本不在整合范围内,将保持不变。报道补充称,OpenAI总裁Greg Brockman将临时监督产品改革和相关组织变更,而应用主管Fidji Simo将领导商业努力,将新应用推向市场。
Simo在同一天的X平台帖子中确认了这一计划。她写道:"公司会经历探索阶段和重新聚焦阶段;两者都很关键。但当新的投注开始奏效时,就像我们现在在Codex上看到的那样,加倍投入并避免分心是非常重要的。"
超级应用的宣布是在3月16日全体员工会议之后做出的,Simo在会上告诉员工,公司需要停止被"支线任务"分散注意力,并积极面向编码和商业用户。
《华尔街日报》当天引用Simo对员工的讲话报道:"我们意识到我们的努力分散在太多应用和技术栈上,我们需要简化我们的努力。这种分散让我们放慢了速度,也让我们更难达到想要的质量标准。"在同一次会议上,Simo明确阐述了商业目标:"我们现在的机会是将那9亿用户转化为高计算用户。我们将通过将ChatGPT转变为生产力工具来实现这一目标。"
据《华尔街日报》报道,该超级应用围绕智能体AI设计,这些系统能够自主执行多步骤任务,如编写和调试软件、分析数据以及完成复杂工作流程,无需持续的人工指导。这使其定位更像是面向开发者和企业知识工作者的AI驱动工作环境,而不是消费者聊天机器人。
灰狗研究公司首席分析师Sanchit Vir Gogia表示,此举超越了产品整合。他说:"这不是一个纯粹的企业转向——这是由内部分散、竞争压力和需要在实际实现价值的地方货币化所驱动的强制整合。真正的价值正在转向意图变成行动的地方。那就是工作流程,而不是对话。"
这一宣布是一系列面向企业举措中的最新一项。2月,OpenAI推出了智能体编排平台Frontier,并宣布与埃森哲、波士顿咨询、凯捷和麦肯锡建立合作伙伴关系,将其技术嵌入商业工作流程。
当检视竞争数据时,这些举措背后的紧迫性变得清晰。据企业支出管理软件供应商Ramp称,一年前其平台上只有25分之一的企业为Anthropic付费;今天这一数字已跃升至近四分之一。在新的企业交易中,Anthropic现在在与OpenAI的正面竞争中赢得约70%的胜率。
然而,Gogia指出了结构性风险。ChatGPT的主导地位建立在简单性和普遍可访问性基础上,而以工作流为中心的超级应用却舍弃了这些品质。他说:"在试图在单一界面中服务消费者、开发者和企业时,OpenAI有稀释使ChatGPT占据主导地位的那种清晰性的风险。"
这种风险因企业IT领导者刚开始面临的治理挑战而加剧。
对于评估OpenAI工具的IT领导者,Gogia指出了超级应用带来的更深层挑战。他说:"智能体AI的最大约束不是能力。而是控制。身份管理不是为非人类参与者设计的。审计跟踪是不完整的。而且没有成熟的控制平面来管理智能体如何行动、它们访问什么,以及这些行动如何被逆转或控制。"
微软和谷歌在这里拥有结构性优势:它们的AI嵌入在已经在企业规模上管理身份、访问和合规性的平台中,这是企业买家反复标记的对OpenAI方法的持续担忧的差距。正是这种信任缺陷给了Anthropic机会。
"战斗不再是关于谁构建最好的聊天机器人。而是关于谁拥有工作如何完成,"Gogia说。"企业现在正在做平台决策——这些决策不会基于谁最先进。它们将基于谁最可靠。"
OpenAI没有立即回应置评请求。
Q&A
Q1:OpenAI的桌面超级应用包含哪些功能?
A:OpenAI的桌面超级应用将整合ChatGPT界面、Codex编码工具和内部称为Atlas的浏览器。该应用围绕智能体AI设计,能够自主执行多步骤任务,如编写和调试软件、分析数据以及完成复杂工作流程,主要面向开发者和企业用户。
Q2:为什么OpenAI要从消费市场转向企业市场?
A:主要原因是竞争压力和商业需求。据报道,在新的企业交易中,Anthropic现在在与OpenAI的正面竞争中赢得约70%的胜率。OpenAI希望将其9亿用户转化为高计算用户,通过将ChatGPT转变为生产力工具来实现盈利。
Q3:企业在采用智能体AI时面临哪些挑战?
A:主要挑战是控制和治理问题。身份管理系统不是为非人类参与者设计的,审计跟踪不完整,缺乏成熟的控制平面来管理智能体的行动、访问权限以及如何逆转或控制这些行动。企业需要可靠的平台来管理身份、访问和合规性。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。