4月9日消息,国际权威咨询机构IDC正式发布《中国 Agent 基础设施平台/执行平台技术评估,2026》报告,凭借在沙箱、工具、记忆、可观测、安全、开放性与兼容性六大核心维度的卓越表现,阿里云无影Agentbay斩获总分第一,全面领跑中国Agent基础设施市场。

其中,作为阿里云面向AI时代打造的Agent云基础设施,AgentBay提供了全场景沙箱环境覆盖和1200+精选Skills,在沙箱和工具评选维度中获得了双满分的优异成绩,大幅领先业界普遍能力。
从“玩具”到“生产力”:Agent 工程化面临底层大考
无影AgentBay是阿里云无影推出的企业级AI智能体构建和运行平台,提供企业智能体构建和运行平台、Skill套件、安全智能沙箱三大核心能力。作为 Agent 基础设施的内核层,AgentBay提供了企业、开发者和 AI 厂商等快速配置 Agent 任务执行工具与运行环境,具备多级隔离安全能力(请求级、实例级、会话级)和业内最全面的沙箱环境,保障 Agent 安全、顺利任务执行。

过去一年,大模型应用正经历从单一对话问答(Chat)向自主任务执行(Action)的跨越。特别是近期OpenClaw等高权限、具备生态打通能力的独立智能体的涌现,标志着AI Agent正在真实业务流中爆发。
IDC在报告中指出:“(OpenClaw)此类智能体不仅需要极为严苛的系统级隔离与资源管控以规避越权与治理风险,还需要高度灵活的运行时环境来实现复杂工具链的调用与接管。这对底层沙箱环境与Agent基础设施提出了前所未有的要求。”
总分第一的背后:自研技术栈打造Agent“最强底座”
高得分的背后,是无影的工程师们在设计之初就坚持自研技术栈,精确瞄准当前需求和市场潜力,将技术、产品和商机进行有效组合,实现技术和商业的正循环。
在本次IDC评估中,AgentBay在多个核心技术指标上展现了断层式的技术优势:
真实的业务场景极其复杂,Agent不仅需要写代码,还需要浏览网页、操作桌面软件甚至移动端App。无影AgentBay提供了包含浏览器(Browser)、云电脑(Computer)、代码环境(Code)以及云手机(Mobile)四大沙箱形态,支持百万级沙箱模板并发运行。其中代码沙箱端到端可用实测平均时间仅需 600ms,并支持浅休眠毫秒级唤醒和深休眠秒级唤醒,彻底打穿了高并发调用下的延迟瓶颈。
此外,AgentBay 还在代码沙箱基础上推出了 AIO 沙箱(All-in-One Sandbox),可在同一环境中同时运行代码和浏览器,进一步提升了多场景任务的执行效率。
针对长链路推理和复杂任务执行需求,AgentBay提供了极具创新性的Context文件挂载能力,以同步盘模式实现数据的跨会话持久化。同时,沙箱底层支持休眠与恢复(Checkpoint)机制,可实现带内存状态的持久化。即使单实例运行超过1000分钟的极限任务,在意外中断后也能实现“断点续跑”,及时避免高昂的Token浪费和重复计价。
AgentBay不仅是一个沙箱,更内置了强大的Skills体系。平台目前提供超1200个开箱即用的精选Skills,覆盖搜索、地图、数据采集、自动化流等高频场景,且全部通过严格的四重安全验证,开发者仅需“三行代码”即可快速接入。AgentBay还赋予了智能体“自进化”的可能。Agent在安装 find-skills 后,便具备了自主探索、安装、执行各类Skills的能力,实现了能力边界的动态扩展。

“新数字生产力”崛起:场景化落地释放AI价值
IDC 预测,伴随“新数字生产力”的崛起,到 2030 年全球将有数十亿的智能体深入各类业务流,而中国企业的活跃Agent 规模也将在 2026 至 2027 年迎来爆发式增长。
作为最早一批在国内规模化落地的AI基础设施,AgentBay已经在大量商业实践中被验证,从电商的自动化业务巡检、到金融领域的数据深度采集分析,再到前沿的Agent强化学习场景,覆盖电商、金融、通用 Agent 等领域的众多企业客户。
“未来,伴随企业活跃智能体数量持续增长,以及多智能体协同、长链路任务执行等需求不断提升,Agent 基础设施平台将逐步成为决定智能体能否稳定落地、规模运行和持续优化的关键支撑。”IDC 在报告中指出。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。