Agile Robots 与谷歌 DeepMind 的新合作预示着 AI 工作负载的演进方向正在发生转变——从集中式模型训练转向在超大规模数据中心和工业边缘环境中持续学习的现实世界系统。
两家公司计划将 DeepMind 的 Gemini Robotics 基础模型与 Agile Robots 的工业硬件平台集成,为制造业和其他高价值领域提供适应性推理系统。但这不仅仅是一个机器人技术的故事——这是 AI 基础设施未来发展的预览。
谷歌 DeepMind 机器人技术高级总监兼负责人 Carolina Parada 在声明中表示:"这项研究合作伙伴关系是将 AI 影响力带入现实世界的重要步骤。"
现实世界的部署已经在强化这一转变。从工厂自动化和仓库车队到自动驾驶汽车和医院系统,物理 AI 应用会产生连续的运营数据流,同时需要在边缘进行低延迟推理。这些环境已经成为 AI 工作负载需求的持续来源,在扩大分布式计算覆盖范围的同时为集中式训练系统提供数据。
预测反映了这一趋势。S&S Insider 预计物理 AI 市场将从 2025 年的 52.3 亿美元增长到 2033 年的 497.3 亿美元,复合年增长率为 32.5%。
从训练集群到现实世界反馈循环
机器人技术引入了新的基础设施动态。系统现在会产生持续的传感器、视觉和运营数据,必须在部署点进行实时处理,而在这些地方,延迟和可靠性是不可协商的。相关数据随后会流回集中式环境进行重新训练,在边缘和核心之间形成持续的数据交换。
IDC 云和边缘基础设施服务副总裁 Dave McCarthy 告诉 Data Center Knowledge:"我们正在看到一个根本性的转变:下一波 AI 浪潮不是发生在智能手机屏幕上,而是在工厂车间里。工业环境是边缘 AI 的终极压力测试,因为它们需要消费级应用根本无法满足的可靠性和物理推理水平。"
对于数据中心来说,这是运营模式的改变。运营商不再运行大型离散的训练任务,而是必须支持持续的重新训练周期、更高频率的数据摄取和更多变的工作负载模式。这对存储系统、东西向网络流量和 GPU 利用率造成了持续压力,因为基础设施需要处理稳态处理和由现实世界输入驱动的突发负载。
边缘成为一流的 AI 环境
影响不仅止于数据中心。
据报道,Agile Robots 在全球部署了超过 20,000 个机器人系统,这凸显了推理向工业环境快速转移的趋势。工厂和物流中心正在成为活跃的 AI 执行层,本地化计算支持实时决策制定。
McCarthy 说:"Agile Robots 和谷歌 DeepMind 之间的合作伙伴关系突出了 AI 技术栈的新平衡。边缘处理实时推理和安全关键决策,而云端提供长期学习和模型优化的计算能力。"
这并不是要将工作负载从数据中心转移出去——而是要将它们扩展到更广泛的覆盖范围。因此,运营商必须协调边缘和核心的计算,更加强调低延迟连接、高效数据同步和分布式编排。
扩展 AI 基础设施栈
接下来是下一层复杂性。
随着 AI 进入物理世界应用,基础设施必须支持持续交互、适应和可靠性——而不仅仅是规模。
McCarthy 补充说:"推理机器人车队产生的巨大数据量创造了向边缘的大规模重心转移。该行业正在从将原始数据倾倒到集中式数据湖的模式转向只将汇总信息和事件发送回云端进行重新训练的范式。"
这种演变改变了数据中心的使用方式。设施不再主要充当集中式存储库,而是成为协调中心——聚合洞察、重新训练模型并重新分发更新。架构越来越倾向于高吞吐量数据管道、高效存储层次结构和快速模型迭代,而非传统的批处理。
DCK 分析
撇开机器人技术的框架,真正的故事浮现出来:随着 AI 系统进入物理环境,它们在部署和训练之间建立了持续循环,扩大了基础设施需求的范围和强度。
对于运营商来说,这意味着更加动态的工作负载组合,其中持续数据摄取、迭代重新训练和分布式推理都在竞争资源。基础设施必须提供的不仅仅是规模,还要在存储、网络和加速计算方面提供持续的高利用率——通常是在不太可预测的条件下。
这就是压力产生的地方。
物理 AI 并不会取代现有工作负载;它是在现有工作负载之上叠加的——将基础设施扩展到边缘和核心,同时推动数据中心比以前更高效、持续和灵活地运营。
在这样做的过程中,它可能会重新定义 AI 基础设施的构建地点和方式。
Q&A
Q1:Agile Robots 与谷歌 DeepMind 合作的主要目标是什么?
A:两家公司计划将 DeepMind 的 Gemini Robotics 基础模型与 Agile Robots 的工业硬件平台集成,为制造业和其他高价值领域提供适应性推理系统,将 AI 影响力真正带入现实世界应用。
Q2:物理 AI 市场的发展前景如何?
A:根据 S&S Insider 的预测,物理 AI 市场将从 2025 年的 52.3 亿美元快速增长到 2033 年的 497.3 亿美元,复合年增长率高达 32.5%,显示出巨大的增长潜力。
Q3:物理 AI 应用如何改变数据中心的运营模式?
A:数据中心的运营模式从运行大型离散训练任务转变为支持持续重新训练周期、更高频率数据摄取和更多变的工作负载模式,对存储系统、网络流量和 GPU 利用率造成持续压力。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。