机器人技术将突破AI基础设施限制，新方案应运而生

物理AI和机器人从实验室走向实际应用，对基础设施提出新要求。现有云基础设施难以满足物理AI的规模需求，亟需专用基础设施栈。关键挑战包括：训练数据稀缺，需大规模仿真生成合成数据；数据处理复杂，多模态数据需实时处理和低延迟推理；数据流成为瓶颈，高吞吐量数据移动成本高。未来物理AI基础设施应整合云端大规模仿真训练与边缘侧快速推理。

物理智能和机器人技术正从实验室走向现实应用。随着机器人在工厂、仓库和公共场所的部署，大规模仿真已与实际运营紧密结合。物理智能企业需要新型基础设施来持续构建、训练、仿真和部署在动态物理环境中运作的模型。当前云计算的局限性制约了物理智能的规模化发展。

训练数据的获取与稀缺性

物理智能无法像大语言模型那样通过互联网文本进行训练。它需要特定场景的数据，包括图像、视频、激光雷达、传感器流和运动数据，这些数据必须直接映射到具体动作和结果。由于不同环境、任务和硬件配置的差异性，这类数据难以获取。

仅在真实环境中收集训练数据既缓慢又昂贵。虚拟环境允许团队生成合成数据、测试边界情况，并比单纯依赖现实部署更快地进行迭代。仿真已成为启动训练的关键方式，但扩展仿真需要协调大规模GPU集群、并行化仿真、准备"仿真就绪"的三维资产，并且常常需要不同类别的GPU。仿真中的推理与真实机器人的前向传播相似，但必须大规模运行并针对吞吐量而非延迟进行优化，这产生了独特的基础设施需求。

硬件可靠性至关重要：当仿真跨越数千个GPU运行时，中断或故障可能导致整个训练周期失败。在选择仿真云平台时，性价比和平均故障时间成为首要考虑因素。

大数据、高风险、低延迟

数据可用性构成另一个挑战。物理智能系统部署后，团队面临海量数据，包括仿真输出以及来自活跃机器人的照片、视频、激光雷达和传感器数据。

简单地将多模态训练数据倾倒到对象存储中是不可行的。与精心策划的训练数据集不同，这类数据具有噪声、语境性和时间敏感性。为了发挥作用，必须通过自动化管道对其进行索引、同步和组织，以便团队能够为每次训练查找、分割和选择合适的数据。

延迟进一步提高了风险。物理系统必须在毫秒级内做出反应，这排除了集中式的批处理方式。因此，物理智能越来越依赖边缘快速推理与云中更高级规划和协调模型的结合，两者协同运作。

必须专门为多模态数据摄入和查询构建先进平台。没有这样的平台，更多数据不会带来更好的模型。

数据移动成为关键制约

在物理智能中，最困难的问题往往不是模型大小，而是数据移动。机器人系统产生持续的视频、传感器读数和运动数据流，必须实时处理和响应。

在这些系统中，基础设施以意外方式出现故障。许多现有平台是为批处理工作负载设计的，当面临持续的高吞吐量多模态数据时便显得力不从心。仅增加GPU数量如果不能快速有效地在设备、本地系统和云之间移动数据就远远不够。

数据移动成本迅速累积。跨系统传输大量数据的成本可能超过存储成本，使得简单扩展效率低下。大规模支持物理智能需要针对快速读写性能、高带宽管道和可预测吞吐量的基础设施优化，而不仅仅是更多内存或计算能力。

物理智能堆栈的新要求

物理智能正将AI从受控的数字环境推向现实世界，其中故障模式是物理性的而非理论性的。这些系统对计算、网络和数据基础设施提出了新的要求，目前尚无统一蓝图来构建它们。

协调单一机器人已很困难。将其扩展至在动态环境中运作的机器人群体，同时从仿真和现实反馈中持续学习，难度更高。数据变得更有价值，延迟影响更深远，基础设施决策与系统行为紧密耦合。

物理智能的进展不仅取决于更优的模型，还取决于支持持续学习、实时响应和边缘与云系统协调的基础设施。未能满足这些要求会导致部署停滞、系统不可靠和现实世界的后果。

挑战显而易见。鲁棒的物理智能堆栈必然是云端大规模仿真与训练和边缘端快速设备推理与持续学习的混合体。现在的问题是谁将率先构建它。

Nebius构建机器人解决方案的方式

未来的AI堆栈并非由原始计算能力单独定义，而是由速度、数据移动、编排以及跨虚拟和物理世界无缝运作的能力所塑造。

Nebius致力于解决物理世界的独特制约。我们为AI的下一阶段专门设计基础设施，结合最优性价比GPU和高吞吐量存储，采用灵活的托管编排来处理机器人工作负载的动态性质。

无论是通过Slurm进行大规模仿真工作负载迸发，还是在可靠的大规模集群上训练基础模型，Nebius都为加快速度、可靠扩展和自信运作提供了基础。

最好的理解差异的方式是亲身体验。立即注册，开始在Nebius上构建，或联系我们的物理智能团队，讨论Nebius如何支持您的架构。

Evan Helda是Nebius物理智能负责人。

Q&A

Q1：物理智能系统为什么需要专门的基础设施？

A：物理智能系统产生的海量多模态数据（视频、传感器、激光雷达等）需要实时处理，这对数据移动、低延迟和硬件可靠性提出了独特要求，超出了当前通用云计算平台的能力范围。

Q2：物理智能训练数据为什么难以获取？

A：物理智能需要特定场景的数据，包括图像、视频和传感器流等，这些数据必须直接映射到具体动作和结果。由于环境、任务和硬件配置的差异，在真实环境中收集此类数据既缓慢又昂贵，但虚拟仿真可以生成合成数据加快迭代。

Q3：物理智能中数据移动为什么会成为主要制约？

A：机器人系统持续产生海量数据流，必须在设备、本地系统和云之间快速移动并实时处理。跨系统传输大量数据的成本可能超过存储成本，需要专门优化的基础设施支持高带宽管道和可预测吞吐量。

来源：The Next Platform

0赞

好文章，需要你的鼓励

机器人技术将突破AI基础设施限制，新方案应运而生

来源：The Next Platform

2026

02/04

08:16

分享

点赞

Bookshop.org确认今年将推出Kobo电子书阅读器支持

WeWard新增"步行模式"：走够步数才能解锁应用

X将通过私信通知用户其互动帖子被社区笔记纠错

"慢社交"应用Roost：让消息像真鸟一样飞行

Truecaller与印度电信监管机构就反垃圾电话规则展开公开交锋

Block与46州达成4500万美元和解，涉Cash App欺诈纠纷

欧盟威胁对Meta开出罚款，剑指Facebook和Instagram上瘾性设计

Disney+考虑推出免费流媒体内容层级

HyperTexting：将开放网络变成类社交媒体信息流的新应用

TV Time关闭之际，创始人打造新追剧应用Bingers

Telegram短链域名t.me因制裁合规问题短暂下线后已恢复

Apple芯片现不可修复漏洞，或成iPhone越狱突破口

企业AI采纳需要务实策略，数据质量是基础

Apptio：智能自动化规模化需要财务严谨性

人工智能能否发现标准模型之外的物理现象？

Apiiro Guardian智能体守护AI代码安全生成

智能体AI崛起，企业面临控制权挑战

火狐浏览器让AI功能成为可选项，这本该是理所当然的

Oracle计划2026年投资500亿美元扩展AI基础设施

OpenAI发布macOS版Codex应用以加速软件项目开发

马斯克将xAI并入SpaceX打造太空AI数据中心计划

SpaceX收购xAI并计划发射百万卫星星座为其提供算力支持

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: