阿里巴巴集团推出了悟空,这是一个原生人工智能企业平台,将先进的智能体AI能力直接带入业务工作流程中。
此次发布紧随OpenClaw的病毒式成功而来。OpenClaw是一个开源编排框架,专为长期运行、自我进化的智能体设计,促使主要技术供应商竞相推出企业级等效产品。
本月早些时候,腾讯推出了多个智能体工具,包括企业级WorkBuddy和QClaw,这些工具与微信及QQ消息应用集成。
英伟达也在本周的GTC大会上发布了英伟达智能体工具包,这是一个软件平台,配备OpenShell安全运行时以及简化OpenClaw部署的NemoClaw。英伟达高管将OpenClaw描述为可能是"历史上最重要的单一软件发布",具有颠覆企业软件市场的潜力。
通过悟空,阿里巴巴瞄准了职场自动化需求,专注于企业级安全性和深度生态系统集成。该平台可以协调多个智能体在单一界面内处理复杂任务,这是阿里巴巴集团在新成立的阿里巴巴Token中心业务集团重组下的举措。
目前,悟空仅提供邀请制内测,可作为独立桌面应用程序下载,或作为嵌入式智能体在钉钉最新版本中访问。钉钉是阿里巴巴的企业协作平台,服务超过2000万企业用户。
该平台专为企业环境中的智能体任务而构建。它可以操作本地计算机、浏览器和基于云的系统,协调多个智能体完成诸如编辑文档、更新电子表格、填写审批表格、转录会议音频和进行深度研究等任务。
它还具有特定领域的能力,涵盖电子商务、跨境零售、制造业、法律服务、金融和会计、招聘、设计、软件开发和内容创作等领域。这将使个人和初创公司能够更高效地管理复杂工作流程并扩大运营规模。
阿里巴巴更广泛的电子商务和技术生态系统——包括淘宝、天猫、1688、支付宝和阿里云——将逐步整合到悟空中,作为模块化智能体技能,同时支持第三方集成。
为了解决OpenClaw等工具的安全风险问题(这些工具曾被黑客利用传播恶意软件),悟空平台包含身份验证、访问控制和专为商业用途设计的特殊企业沙箱。
悟空的能力得到重新架构的钉钉界面支撑,该界面被重构为命令行界面和开放应用程序编程接口层。
这使平台能够直接访问钉钉的所有业务功能,允许智能体独立规划复杂任务、创建详细指令和管理工作流程,无需人工帮助。
展望未来,阿里巴巴计划逐步将悟空与其他消息平台连接,包括Slack、Microsoft Teams和微信,将访问权限扩展到移动设备用户。
Q&A
Q1:悟空平台是什么?它能做什么?
A:悟空是阿里巴巴推出的原生人工智能企业平台,将先进的智能体AI能力直接带入业务工作流程中。它可以协调多个智能体处理复杂任务,包括编辑文档、更新电子表格、填写审批表格、转录会议音频和进行深度研究等。
Q2:悟空平台如何确保企业使用安全?
A:为了解决安全风险问题,悟空平台包含身份验证、访问控制和专为商业用途设计的特殊企业沙箱。这些安全措施旨在防范像OpenClaw等工具曾经面临的被黑客利用传播恶意软件的风险。
Q3:普通用户如何使用悟空平台?
A:目前悟空仅提供邀请制内测,可作为独立桌面应用程序下载,或作为嵌入式智能体在钉钉最新版本中访问。未来阿里巴巴计划将悟空与Slack、Microsoft Teams和微信等其他消息平台连接,扩展到移动设备用户。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。