4月9日消息,国际权威咨询机构IDC正式发布《中国 Agent 基础设施平台/执行平台技术评估,2026》报告,凭借在沙箱、工具、记忆、可观测、安全、开放性与兼容性六大核心维度的卓越表现,阿里云无影Agentbay斩获总分第一,全面领跑中国Agent基础设施市场。

其中,作为阿里云面向AI时代打造的Agent云基础设施,AgentBay提供了全场景沙箱环境覆盖和1200+精选Skills,在沙箱和工具评选维度中获得了双满分的优异成绩,大幅领先业界普遍能力。
从“玩具”到“生产力”:Agent 工程化面临底层大考
无影AgentBay是阿里云无影推出的企业级AI智能体构建和运行平台,提供企业智能体构建和运行平台、Skill套件、安全智能沙箱三大核心能力。作为 Agent 基础设施的内核层,AgentBay提供了企业、开发者和 AI 厂商等快速配置 Agent 任务执行工具与运行环境,具备多级隔离安全能力(请求级、实例级、会话级)和业内最全面的沙箱环境,保障 Agent 安全、顺利任务执行。

过去一年,大模型应用正经历从单一对话问答(Chat)向自主任务执行(Action)的跨越。特别是近期OpenClaw等高权限、具备生态打通能力的独立智能体的涌现,标志着AI Agent正在真实业务流中爆发。
IDC在报告中指出:“(OpenClaw)此类智能体不仅需要极为严苛的系统级隔离与资源管控以规避越权与治理风险,还需要高度灵活的运行时环境来实现复杂工具链的调用与接管。这对底层沙箱环境与Agent基础设施提出了前所未有的要求。”
总分第一的背后:自研技术栈打造Agent“最强底座”
高得分的背后,是无影的工程师们在设计之初就坚持自研技术栈,精确瞄准当前需求和市场潜力,将技术、产品和商机进行有效组合,实现技术和商业的正循环。
在本次IDC评估中,AgentBay在多个核心技术指标上展现了断层式的技术优势:
真实的业务场景极其复杂,Agent不仅需要写代码,还需要浏览网页、操作桌面软件甚至移动端App。无影AgentBay提供了包含浏览器(Browser)、云电脑(Computer)、代码环境(Code)以及云手机(Mobile)四大沙箱形态,支持百万级沙箱模板并发运行。其中代码沙箱端到端可用实测平均时间仅需 600ms,并支持浅休眠毫秒级唤醒和深休眠秒级唤醒,彻底打穿了高并发调用下的延迟瓶颈。
此外,AgentBay 还在代码沙箱基础上推出了 AIO 沙箱(All-in-One Sandbox),可在同一环境中同时运行代码和浏览器,进一步提升了多场景任务的执行效率。
针对长链路推理和复杂任务执行需求,AgentBay提供了极具创新性的Context文件挂载能力,以同步盘模式实现数据的跨会话持久化。同时,沙箱底层支持休眠与恢复(Checkpoint)机制,可实现带内存状态的持久化。即使单实例运行超过1000分钟的极限任务,在意外中断后也能实现“断点续跑”,及时避免高昂的Token浪费和重复计价。
AgentBay不仅是一个沙箱,更内置了强大的Skills体系。平台目前提供超1200个开箱即用的精选Skills,覆盖搜索、地图、数据采集、自动化流等高频场景,且全部通过严格的四重安全验证,开发者仅需“三行代码”即可快速接入。AgentBay还赋予了智能体“自进化”的可能。Agent在安装 find-skills 后,便具备了自主探索、安装、执行各类Skills的能力,实现了能力边界的动态扩展。

“新数字生产力”崛起:场景化落地释放AI价值
IDC 预测,伴随“新数字生产力”的崛起,到 2030 年全球将有数十亿的智能体深入各类业务流,而中国企业的活跃Agent 规模也将在 2026 至 2027 年迎来爆发式增长。
作为最早一批在国内规模化落地的AI基础设施,AgentBay已经在大量商业实践中被验证,从电商的自动化业务巡检、到金融领域的数据深度采集分析,再到前沿的Agent强化学习场景,覆盖电商、金融、通用 Agent 等领域的众多企业客户。
“未来,伴随企业活跃智能体数量持续增长,以及多智能体协同、长链路任务执行等需求不断提升,Agent 基础设施平台将逐步成为决定智能体能否稳定落地、规模运行和持续优化的关键支撑。”IDC 在报告中指出。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。